1. Genel Bakış
Document AI Warehouse nedir?
Document AI Warehouse, belgeleri ve yapılandırılmış meta verilerini depolamak, aramak, düzenlemek ve analiz etmek için kullanılan bir platformdur. Belgeler, formlar ve faturalar gibi yapılandırılmış verilerin yanı sıra sözleşmeler ve araştırma makaleleri gibi yapılandırılmamış verileri de içerebilir. Dokümanların meta verileri, Document AI'daki işlemciler kullanılarak otomatik olarak çıkarılabilir veya alanlar ve etiketler kullanılarak manuel olarak girilebilir.
Bu codelab'de, Document AI Warehouse kullanıcı arayüzünü kullanarak belgeleri nasıl alacağınızı, işleyeceğinizi ve arayacağınızı öğreneceksiniz. Bu codelab için lisans sözleşmesi, kredi formu ve sipariş faturası gibi örnek PDF belgeleri sağlanır.
Ön koşullar
Bu codelab, diğer Document AI codelab'lerinde sunulan içeriklere dayanmaktadır. Devam etmeden önce aşağıdaki dokümanları ve codelab'leri okumanız önerilir:
- Hızlı başlangıç: Document AI API'sini ayarlama
- Google Cloud Console'u kullanarak belgeleri işleme
- Python ile Document AI işlemcilerini yönetme
Neler öğreneceksiniz?
- Document AI Warehouse API'yi etkinleştirme
- Document AI Deposu'nda doküman işlemcilerini yapılandırma
- Çeşitli PDF belgelerindeki metinleri yükleme ve ayrıştırma
- Document AI Warehouse'da dokümanlarda ve meta verilerinde arama yapma
İhtiyacınız olanlar
2. Örnek dokümanları indirme
Bu codelab için lisans sözleşmesi, kredi formu ve sipariş faturası gibi örnek PDF belgeleri sağlanır. Bu codelab'de kullanmak için aşağıdaki örnek belgeleri indirebilirsiniz.
Alternatif olarak, örnek dokümanları gsutil kullanarak herkese açık Google Cloud Storage paketimizden de indirebilirsiniz.
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/license-agreement.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/loan-form.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/order-invoice.pdf .
Daha sonraki bir adımda, bu örnek dokümanları yükleyecek, farklı doküman işlemcilerle ayrıştıracak ve sonuçta elde edilen dokümanları ve meta verileri Document AI Warehouse'da saklayacaksınız.
3. Document AI Warehouse API'yi etkinleştirme
Document AI Warehouse'u kullanmaya başlamadan önce API'yi etkinleştirmeniz gerekir.
Cloud Console'u kullanma
- Tarayıcınızda Google Cloud Console'u açın.
- Google Cloud Console'da, etkinleştirilebilecek API'lere ve hizmetlere göz atmak için API Kitaplığı'na gidin.
- API Kitaplığı sayfasının üst kısmındaki arama çubuğunu kullanarak
Document AI Warehousearaması yapın ve sonuçtaki hizmeti tıklayın. - Google Cloud projenizde Document AI Warehouse API'yi etkinleştirmek için Etkinleştir düğmesini tıklayın.

Alternatif: gcloud CLI'yı kullanma
Alternatif olarak, API aşağıdaki gcloud komutu kullanılarak etkinleştirilebilir:
gcloud services enable contentwarehouse.googleapis.com
API başarıyla etkinleştirildiyse aşağıdakine benzer bir mesaj görürsünüz:
Operation "operations/..." finished successfully.
Artık Document AI Warehouse'u kullanmaya hazırsınız.
4. Document AI Warehouse konsolunu görüntüleme
Tarayıcınızda https://documentwarehouse.cloud.google.com adresindeki Document AI Warehouse konsoluna (Google Cloud Console'un dışında) gidin. Bu codelab'deki kalan adımları uygulayarak dokümanları yüklemek, işlemek ve aramak için Google Cloud projenizle birlikte Document AI Warehouse konsolunu kullanacaksınız.

Document AI Warehouse'u ilk kez kullanıyorsanız projenizi ve ayarlarınızı ihtiyaçlarınıza göre yapılandırma hakkında daha fazla bilgi için Document AI Warehouse Dokümanları'na bakın.
5. Doküman şeması oluşturma
Doküman şemaları, Document AI Warehouse'da depoladığınız dokümanların türünü ve alanlarını tanımlar. Yeni belge yüklemeden önce şema oluşturmanız gerekir.
- Document AI Warehouse konsolunda, sayfanın sağ üst köşesindeki Yönetici düğmesini tıklayın.
- Sol gezinme çubuğunda Şema öğesini, ardından + Yeni ekle düğmesini tıklayın.
- Şemanız için bir ad girin (ör.
Documents and Forms) ve Şema Türü olarak Belge'nin seçildiğinden emin olun. Ardından, devam etmek için Sonraki düğmesini tıklayın. - Varsayılan JSON şema tanımını olduğu gibi bırakabilirsiniz. Bu tanım aşağıdaki gibi görünmelidir:
{ "display_name": "Documents and Forms", "property_definitions": [], "document_is_folder": false, "description": "" } - Ardından, belge şeması oluşturmayı tamamlamak için Bitti düğmesini tıklayın.
Bu adımları başarıyla tamamladığınızda, belge şemanızın oluşturulduğunu belirten bir mesaj görürsünüz. Şemayı onaylamak için Belge Şemasını Görüntüle düğmesini ve ardından JSON sekmesini tıklayabilirsiniz. Şema, aşağıdakine benzer şekilde görünmelidir:

6. Doküman işlemciler oluşturma
Bu adımda, Document AI Warehouse'daki farklı türlerdeki dokümanlarda tam metin araması yapmak için kullanabileceğiniz doküman işlemciler oluşturacaksınız.
- Google Cloud Console'da Document AI Platform'a genel bakış sayfasına gidin.
- İşlemcileri Keşfedin'i tıklayın, ardından oluşturulacak işlemci türü olarak Document OCR'yi seçin.
ocrgibi bir doküman işlemcisi adı ve tercih ettiğiniz bölgeyi belirtin, ardından işlemcinizi oluşturmak için Oluştur'u tıklayın.- İşlemci Ayrıntıları sayfasında, Document AI Warehouse'ta işlemci yapılandırmak için daha sonra kullanacağımız İşlemci Kimliği'ni kopyalayın.
Bu adımları tekrarlayın ve form işlemci adını oluşturup belirtmek için belge işlemci türü olarak Form Ayrıştırıcı'yı seçin.
Bu adımları tekrarlayın ve Fatura Ayrıştırıcı'yı doküman işlemcisi türü olarak seçip işlemci adı olarak invoice simgesini girin.
Bu adımlar başarıyla tamamlandığında, aşağıdakine benzer bir belge işlemcileri listesi görürsünüz:

7. Doküman işlemcileri yapılandırma
Bu adımda, önceki adımda oluşturduğunuz işlemcilere başvurarak Document AI Warehouse'ta belge işlemcilerini yapılandıracaksınız.
- Document AI Warehouse konsolunda, üst araç çubuğundaki Yönetici düğmesini tıklayın.
- Sol gezinme çubuğunda Doc AI İşlemcileri öğesini, ardından + Yeni ekle düğmesini tıklayın.
- + Yeni İşlemci Ekle düğmesini tıklayın, ardından bir ad ve önceki adımdaki işlemci kimliğini belirtin.
- Değişikliklerinizi kaydetmek için Kaydet düğmesini tıklayın.
Form ayrıştırıcı ve fatura ayrıştırıcı dahil olmak üzere diğer iki işlemciyi + Yeni İşlemci Ekle düğmesini kullanarak Document AI Warehouse yapılandırmasına eklemek için bu adımları tekrarlayın. + Yeni Ekle düğmesini kullanarak ek bir şema eklemek yerine, + Yeni İşlemci Ekle düğmesini kullanarak aynı Belge Şema Kimliği altında iki ek işlemci eklediğinizden emin olun.
Bu adımlar başarıyla tamamlandıktan sonra, aşağıdakine benzer bir yapılandırılmış belge işlemcileri listesi görürsünüz:

8. Örnek belgeleri yükleme ve işleme
Şemayı tanımlayıp dokümanlarınız için işlemcileri yapılandırdığınıza göre artık dokümanları Document AI Warehouse'a yükleyebilirsiniz.
- Document AI Warehouse konsoluna dönün ve sol gezinme çubuğunda +Yeni ekle düğmesini tıklayın, ardından Yeni belge yükle seçeneğini belirleyin.
- license-agreement.pdf belgesini makinenizden yükleme widget'ına sürükleyin veya indirdiğiniz örnek belgelerden birine göz atıp bu belgeyi seçin. Ardından, devam etmek için Sonraki düğmesini tıklayın.
- Doküman Şeması için daha önce oluşturduğunuz şemanın adını seçin (ör. Dokümanlar ve Formlar). Doc AI işlemci kimliği için önceki adımda yapılandırdığınız OCR belge işlemcisini seçin.
- Görünen Ad için varsayılan adı (ör. dosya adı) veya kendi özel belge adınızı kullanabilirsiniz.
- Dokümanınızı yükleyip işlemek için Oluştur düğmesini tıklayın.
Document AI Warehouse konsoluna dönün ve loan-form.pdf örnek belgesiyle bu adımları tekrarlayın. Daha önce yapılandırdığınız form belge işlemcisini seçin.
Document AI Warehouse konsoluna dönün ve invoice-sample.pdf örnek belgesiyle bu adımları tekrarlayın. Daha önce yapılandırdığınız invoice belge işlemcisini seçin.
Bu adımları başarıyla tamamladıktan sonra Document AI Warehouse konsoluna geri dönerseniz işlenmiş belgelerin aşağıdaki gibi bir listesini görürsünüz:

9. Dokümanlarda arama yapma ve dokümanları keşfetme
Document AI Warehouse'a bir doküman yükleyip işledikten sonra dokümanlarda tam metin araması yapabilirsiniz.
Document AI Warehouse konsolunda, örnek dokümanlarda görünen bir arama terimi (ör. agreement) girin ve Enter tuşuna basın. Yüklediğiniz farklı örnek dokümanların sonuçlarını görmek için mortgage ve monitor gibi diğer arama sorgularını deneyebilirsiniz.
Sonuçlarda, arama terimini içeren tüm dokümanların yanı sıra doküman metninin arama terimi vurgulanmış bir özetini görürsünüz:

Görüntülemek istediğiniz dokümanın adını tıklayın.
Belgeyi, algılanan alanlar ve ilişkili verileriyle birlikte görmek için Yapay Zeka Görünümü açma/kapatma düğmesini tıklayın:

10. Tebrikler
Document AI Warehouse ile ve Document AI'daki işlemcileri kullanarak dokümanları başarıyla yüklediniz, işlediniz ve dokümanlarda tam metin araması yaptınız. Diğer belgelerle denemeler yapmanızı ve platformda bulunan diğer işlemcileri keşfetmenizi öneririz.
Temizleme
Bu eğiticide kullanılan kaynaklar için Google Cloud hesabınızın ücretlendirilmesini önlemek amacıyla aşağıdaki temizleme işlemlerini yapabilirsiniz:
- Document Warehouse konsolu sayfasına gidin ve yüklediğiniz tüm örnek dokümanları silin.
- Google Cloud Console'da Document AI işlemcileri sayfasına gidin ve oluşturduğunuz örnek işlemcileri silin.
- Google Cloud Console'da API'ler ve Hizmetler sayfasına gidin ve Document AI Warehouse API'yi devre dışı bırakın.
Daha Fazla Bilgi
Diğer codelab uygulamalarıyla Document AI hakkında bilgi edinmeye devam edin.
- Document AI ile Optik Karakter Tanıma
- Document AI ile Form Ayrıştırma (Python)
- Document AI ile Özel İşlemciler (Python)
- Python ile Document AI işlemcilerini yönetme
Kaynaklar
- Document AI Warehouse Belgeleri
- The Future of Documents - YouTube Playlist
- Document AI Örnekleri Deposu
Lisans
Bu çalışma, Creative Commons Attribution 2.0 Genel Amaçlı Lisans ile lisans altına alınmıştır.