Dokümanları Alma, İşleme ve Arama için Document AI Ambarı'nı Kullanma

1. Genel Bakış

Document AI Warehouse nedir?

Document AI Warehouse, belgeleri ve yapılandırılmış meta verilerini depolamak, aramak, düzenlemek ve analiz etmek için kullanılan bir platformdur. Belgeler, formlar ve faturalar gibi yapılandırılmış verilerin yanı sıra sözleşmeler ve araştırma makaleleri gibi yapılandırılmamış verileri de içerebilir. Dokümanların meta verileri, Document AI'daki işlemciler kullanılarak otomatik olarak çıkarılabilir veya alanlar ve etiketler kullanılarak manuel olarak girilebilir.

Bu codelab'de, Document AI Warehouse kullanıcı arayüzünü kullanarak belgeleri nasıl alacağınızı, işleyeceğinizi ve arayacağınızı öğreneceksiniz. Bu codelab için lisans sözleşmesi, kredi formu ve sipariş faturası gibi örnek PDF belgeleri sağlanır.

Ön koşullar

Bu codelab, diğer Document AI codelab'lerinde sunulan içeriklere dayanmaktadır. Devam etmeden önce aşağıdaki dokümanları ve codelab'leri okumanız önerilir:

Neler öğreneceksiniz?

  • Document AI Warehouse API'yi etkinleştirme
  • Document AI Deposu'nda doküman işlemcilerini yapılandırma
  • Çeşitli PDF belgelerindeki metinleri yükleme ve ayrıştırma
  • Document AI Warehouse'da dokümanlarda ve meta verilerinde arama yapma

İhtiyacınız olanlar

2. Örnek dokümanları indirme

Bu codelab için lisans sözleşmesi, kredi formu ve sipariş faturası gibi örnek PDF belgeleri sağlanır. Bu codelab'de kullanmak için aşağıdaki örnek belgeleri indirebilirsiniz.

Alternatif olarak, örnek dokümanları gsutil kullanarak herkese açık Google Cloud Storage paketimizden de indirebilirsiniz.

gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/license-agreement.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/loan-form.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/order-invoice.pdf .

Daha sonraki bir adımda, bu örnek dokümanları yükleyecek, farklı doküman işlemcilerle ayrıştıracak ve sonuçta elde edilen dokümanları ve meta verileri Document AI Warehouse'da saklayacaksınız.

3. Document AI Warehouse API'yi etkinleştirme

Document AI Warehouse'u kullanmaya başlamadan önce API'yi etkinleştirmeniz gerekir.

Cloud Console'u kullanma

  1. Tarayıcınızda Google Cloud Console'u açın.
  2. Google Cloud Console'da, etkinleştirilebilecek API'lere ve hizmetlere göz atmak için API Kitaplığı'na gidin.
  3. API Kitaplığı sayfasının üst kısmındaki arama çubuğunu kullanarak Document AI Warehouse araması yapın ve sonuçtaki hizmeti tıklayın.
  4. Google Cloud projenizde Document AI Warehouse API'yi etkinleştirmek için Etkinleştir düğmesini tıklayın.Document AI Warehouse API'si

Alternatif: gcloud CLI'yı kullanma

Alternatif olarak, API aşağıdaki gcloud komutu kullanılarak etkinleştirilebilir:

gcloud services enable contentwarehouse.googleapis.com

API başarıyla etkinleştirildiyse aşağıdakine benzer bir mesaj görürsünüz:

Operation "operations/..." finished successfully.

Artık Document AI Warehouse'u kullanmaya hazırsınız.

4. Document AI Warehouse konsolunu görüntüleme

Tarayıcınızda https://documentwarehouse.cloud.google.com adresindeki Document AI Warehouse konsoluna (Google Cloud Console'un dışında) gidin. Bu codelab'deki kalan adımları uygulayarak dokümanları yüklemek, işlemek ve aramak için Google Cloud projenizle birlikte Document AI Warehouse konsolunu kullanacaksınız.

Document AI Warehouse Kontrol Paneli

Document AI Warehouse'u ilk kez kullanıyorsanız projenizi ve ayarlarınızı ihtiyaçlarınıza göre yapılandırma hakkında daha fazla bilgi için Document AI Warehouse Dokümanları'na bakın.

5. Doküman şeması oluşturma

Doküman şemaları, Document AI Warehouse'da depoladığınız dokümanların türünü ve alanlarını tanımlar. Yeni belge yüklemeden önce şema oluşturmanız gerekir.

  1. Document AI Warehouse konsolunda, sayfanın sağ üst köşesindeki Yönetici düğmesini tıklayın.
  2. Sol gezinme çubuğunda Şema öğesini, ardından + Yeni ekle düğmesini tıklayın.
  3. Şemanız için bir ad girin (ör. Documents and Forms) ve Şema Türü olarak Belge'nin seçildiğinden emin olun. Ardından, devam etmek için Sonraki düğmesini tıklayın.
  4. Varsayılan JSON şema tanımını olduğu gibi bırakabilirsiniz. Bu tanım aşağıdaki gibi görünmelidir:
    {
      "display_name": "Documents and Forms",
      "property_definitions": [],
      "document_is_folder": false,
      "description": ""
    }
    
  5. Ardından, belge şeması oluşturmayı tamamlamak için Bitti düğmesini tıklayın.

Bu adımları başarıyla tamamladığınızda, belge şemanızın oluşturulduğunu belirten bir mesaj görürsünüz. Şemayı onaylamak için Belge Şemasını Görüntüle düğmesini ve ardından JSON sekmesini tıklayabilirsiniz. Şema, aşağıdakine benzer şekilde görünmelidir:

Doküman Şeması

6. Doküman işlemciler oluşturma

Bu adımda, Document AI Warehouse'daki farklı türlerdeki dokümanlarda tam metin araması yapmak için kullanabileceğiniz doküman işlemciler oluşturacaksınız.

  1. Google Cloud Console'da Document AI Platform'a genel bakış sayfasına gidin.
  2. İşlemcileri Keşfedin'i tıklayın, ardından oluşturulacak işlemci türü olarak Document OCR'yi seçin.
  3. ocr gibi bir doküman işlemcisi adı ve tercih ettiğiniz bölgeyi belirtin, ardından işlemcinizi oluşturmak için Oluştur'u tıklayın.
  4. İşlemci Ayrıntıları sayfasında, Document AI Warehouse'ta işlemci yapılandırmak için daha sonra kullanacağımız İşlemci Kimliği'ni kopyalayın.

Bu adımları tekrarlayın ve form işlemci adını oluşturup belirtmek için belge işlemci türü olarak Form Ayrıştırıcı'yı seçin.

Bu adımları tekrarlayın ve Fatura Ayrıştırıcı'yı doküman işlemcisi türü olarak seçip işlemci adı olarak invoice simgesini girin.

Bu adımlar başarıyla tamamlandığında, aşağıdakine benzer bir belge işlemcileri listesi görürsünüz:

Belge İşlemcileri

7. Doküman işlemcileri yapılandırma

Bu adımda, önceki adımda oluşturduğunuz işlemcilere başvurarak Document AI Warehouse'ta belge işlemcilerini yapılandıracaksınız.

  1. Document AI Warehouse konsolunda, üst araç çubuğundaki Yönetici düğmesini tıklayın.
  2. Sol gezinme çubuğunda Doc AI İşlemcileri öğesini, ardından + Yeni ekle düğmesini tıklayın.
  3. + Yeni İşlemci Ekle düğmesini tıklayın, ardından bir ad ve önceki adımdaki işlemci kimliğini belirtin.
  4. Değişikliklerinizi kaydetmek için Kaydet düğmesini tıklayın.

Form ayrıştırıcı ve fatura ayrıştırıcı dahil olmak üzere diğer iki işlemciyi + Yeni İşlemci Ekle düğmesini kullanarak Document AI Warehouse yapılandırmasına eklemek için bu adımları tekrarlayın. + Yeni Ekle düğmesini kullanarak ek bir şema eklemek yerine, + Yeni İşlemci Ekle düğmesini kullanarak aynı Belge Şema Kimliği altında iki ek işlemci eklediğinizden emin olun.

Bu adımlar başarıyla tamamlandıktan sonra, aşağıdakine benzer bir yapılandırılmış belge işlemcileri listesi görürsünüz:

Document AI Deposu'ndaki belge işlemciler

8. Örnek belgeleri yükleme ve işleme

Şemayı tanımlayıp dokümanlarınız için işlemcileri yapılandırdığınıza göre artık dokümanları Document AI Warehouse'a yükleyebilirsiniz.

  1. Document AI Warehouse konsoluna dönün ve sol gezinme çubuğunda +Yeni ekle düğmesini tıklayın, ardından Yeni belge yükle seçeneğini belirleyin.
  2. license-agreement.pdf belgesini makinenizden yükleme widget'ına sürükleyin veya indirdiğiniz örnek belgelerden birine göz atıp bu belgeyi seçin. Ardından, devam etmek için Sonraki düğmesini tıklayın.
  3. Doküman Şeması için daha önce oluşturduğunuz şemanın adını seçin (ör. Dokümanlar ve Formlar). Doc AI işlemci kimliği için önceki adımda yapılandırdığınız OCR belge işlemcisini seçin.
  4. Görünen Ad için varsayılan adı (ör. dosya adı) veya kendi özel belge adınızı kullanabilirsiniz.
  5. Dokümanınızı yükleyip işlemek için Oluştur düğmesini tıklayın.

Document AI Warehouse konsoluna dönün ve loan-form.pdf örnek belgesiyle bu adımları tekrarlayın. Daha önce yapılandırdığınız form belge işlemcisini seçin.

Document AI Warehouse konsoluna dönün ve invoice-sample.pdf örnek belgesiyle bu adımları tekrarlayın. Daha önce yapılandırdığınız invoice belge işlemcisini seçin.

Bu adımları başarıyla tamamladıktan sonra Document AI Warehouse konsoluna geri dönerseniz işlenmiş belgelerin aşağıdaki gibi bir listesini görürsünüz:

Document AI Deposu'nda işlenen belgeler

9. Dokümanlarda arama yapma ve dokümanları keşfetme

Document AI Warehouse'a bir doküman yükleyip işledikten sonra dokümanlarda tam metin araması yapabilirsiniz.

Document AI Warehouse konsolunda, örnek dokümanlarda görünen bir arama terimi (ör. agreement) girin ve Enter tuşuna basın. Yüklediğiniz farklı örnek dokümanların sonuçlarını görmek için mortgage ve monitor gibi diğer arama sorgularını deneyebilirsiniz.

Sonuçlarda, arama terimini içeren tüm dokümanların yanı sıra doküman metninin arama terimi vurgulanmış bir özetini görürsünüz:

Document AI Deposu'ndaki Arama Sonuçları

Görüntülemek istediğiniz dokümanın adını tıklayın.

Belgeyi, algılanan alanlar ve ilişkili verileriyle birlikte görmek için Yapay Zeka Görünümü açma/kapatma düğmesini tıklayın:

Document AI Deposu'nda Ayrıntılı Görünüm

10. Tebrikler

Document AI Warehouse ile ve Document AI'daki işlemcileri kullanarak dokümanları başarıyla yüklediniz, işlediniz ve dokümanlarda tam metin araması yaptınız. Diğer belgelerle denemeler yapmanızı ve platformda bulunan diğer işlemcileri keşfetmenizi öneririz.

Temizleme

Bu eğiticide kullanılan kaynaklar için Google Cloud hesabınızın ücretlendirilmesini önlemek amacıyla aşağıdaki temizleme işlemlerini yapabilirsiniz:

Daha Fazla Bilgi

Diğer codelab uygulamalarıyla Document AI hakkında bilgi edinmeye devam edin.

Kaynaklar

Lisans

Bu çalışma, Creative Commons Attribution 2.0 Genel Amaçlı Lisans ile lisans altına alınmıştır.