1. Pengantar
Document AI API adalah solusi pemahaman dokumen yang mengambil data tidak terstruktur, seperti dokumen, email, dan sebagainya, lalu membuat datanya lebih mudah dipahami, dianalisis, dan digunakan.
Dengan peninjauan manual, Anda dapat mencapai akurasi pemrosesan dokumen yang lebih tinggi dengan jaminan peninjauan manual. Peninjauan manual dapat meningkatkan akurasi dan membantu bisnis mengevaluasi prediksi menggunakan alat yang dibuat khusus untuk mendukung peninjauan tersebut. Di lab ini, Anda akan mengonfigurasi dan menguji pemroses biaya menggunakan peninjauan manual untuk memvalidasi hasil dari pemroses menggunakan alat konfigurasi dan pengelolaan human-in-the-loop.
Prasyarat
Codelab ini dibangun berdasarkan konten yang disajikan dalam Codelab Document AI lainnya.
Sebaiknya Anda menyelesaikan Codelab berikut sebelum melanjutkan.
- Pengenalan Karakter Optik (OCR) dengan Document AI (Python)
- Penguraian Formulir dengan Document AI (Python)
- Prosesor Terspesialisasi dengan Document AI (Python)
Yang akan Anda pelajari
- Mengonfigurasi peninjauan manual untuk prosesor.
- Buat kumpulan resource pengguna peninjauan oleh manusia.
- Buat tugas peninjauan manual uji coba.
- Menetapkan tugas peninjauan manual kepada pengguna.
- Menyelesaikan peninjauan manual dokumen.
Yang Anda butuhkan
2. Mempersiapkan
Codelab ini akan menganggap Anda telah menyelesaikan langkah-langkah Penyiapan Document AI yang tercantum di Codelab Pengantar.
Harap selesaikan langkah-langkah berikut sebelum melanjutkan:
Anda juga perlu mengaktifkan Vertex AI API.
- Dengan menggunakan Kotak Penelusuran di bagian atas konsol, cari "Vertex AI API", lalu klik Enable untuk menggunakan API di project Google Cloud Anda
- Atau, API dapat diaktifkan menggunakan perintah
gcloudberikut.
gcloud services enable aiplatform.googleapis.com
3. Membuat Prosesor
Anda harus membuat instance Expense Processor terlebih dahulu untuk digunakan di lab ini.
- Di konsol, buka Document AI Platform Overview
- Klik Create Processor, scroll ke bawah ke Specialized, lalu pilih Expense Parser.
- Beri nama
codelab-expense-parser(Atau hal lain yang akan Anda ingat) dan pilih region terdekat di daftar. - Klik Create untuk membuat pemroses
- Salin ID prosesor. Anda harus menggunakan ini dalam kode nanti.
- Di Cloud Shell, buat bucket penyimpanan menggunakan
PROJECT_ID-hitl-resultssebagai nama:
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
- Ikat akun pengguna Anda ke peran Vertex AI Admin IAM di project lab Anda
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin
4. Mengonfigurasi Human-in-the-loop
Dalam tugas ini, Anda akan mengonfigurasi peninjauan manual untuk pemroses biaya yang Anda buat sebelumnya.
- Di konsol, buka Navigation menu, lalu pilih Document AI.
- Klik AI yang memerlukan interaksi manusia.

- Klik
codelab-expense-parseruntuk membuka halaman Peninjauan Manual untuk pemroses. - Klik Configure Human-in-the-Loop.

- Pilih Filter Tingkat Dokumen.
- Setel penggeser Nilai minimum keyakinan % ke 50%.
- Biarkan opsi Spesialis disetel ke Gunakan spesialis saya sendiri.

- Klik kotak drop-down Specialist pool, lalu klik NEW SPECIALIST POOL.
- Untuk Nama pool, masukkan
Codelab HITL Pooldalam dialog Pool pakar baru. - Masukkan alamat email pribadi Anda untuk Pengelola Kumpulan dan Spesialis
- Klik Create pool.

Prosesnya perlu waktu beberapa menit sampai selesai. Anda akan menerima email dari Vertex AI noreply-vertex@google.com.
- Biarkan Kotak Centang Penetapan otomatis tidak dicentang.
- Centang kotak di bagian Konfirmasi biaya.
- Klik Lokasi petunjuk dan salin lokasi penyimpanan ini: - JANGAN sertakan awalan
gs://dalam jalur
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
- Di Lokasi hasil, klik Telusuri, lalu pilih bucket Cloud Storage yang Anda buat sebelumnya.
- Klik Pilih.
- Klik Simpan Konfigurasi.
Sekarang Konsol akan menampilkan Mengonfigurasi human-in-the-loop dan akan memerlukan waktu beberapa menit untuk diselesaikan.

- Setelah konfigurasi selesai, konsol akan meminta Anda untuk Mengaktifkan Human-in-the-loop.
- Klik Tombol Ganti untuk mengaktifkan.
- Kemudian, klik AKTIFKAN di dialog pop-up.

Mengupload Formulir Biaya Contoh
- Kami memiliki formulir contoh yang dapat digunakan untuk disimpan di Google Cloud Storage. Anda dapat mendownloadnya dengan tombol atau perintah di bawah:
gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
- Setelah mengaktifkan Human-in-the-loop, klik tombol Upload Dokumen dan cari dokumen contoh yang baru saja Anda download.
- Klik Upload dan tunggu hingga prosesnya selesai.
5. Menugaskan item untuk peninjauan manual
- Di halaman ini, Anda akan melihat link untuk Konsol Pengelola Kumpulan dan Konsol Spesialis. Link ini juga akan muncul dalam email dari
Vertex AI noreply-vertex@google.com.- Tampilannya akan terlihat seperti
https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks - Klik link untuk konsol Pengelola.
- Tampilannya akan terlihat seperti

- Setelah berada di Konsol Pelabelan Data, klik judul tab Tasks untuk membuka halaman penugasan tugas.
- Klik kotak centang Tidak ditetapkan. Anda akan melihat bahwa entri baru tercantum dalam antrean tugas codelab-expense-parser-P1.

- Pilih codelab-expense-parser-P1.
- Klik Kelola Tugas.
- Masukkan email pribadi Anda di kotak teks Include specialists by email, lalu pilih email tersebut dari daftar dropdown.
- Klik Terapkan.
Layar kini menunjukkan bahwa tugas tersebut ditetapkan kepada Anda. Anda mungkin mendapati bahwa proses ini memerlukan waktu beberapa menit untuk diterapkan dan terlihat.

- Pilih pengguna baru, lalu klik ikon menu.
- Klik Tetapkan ke semua tugas dari menu pop-up yang muncul.

- Klik Commit changes.
- Klik Commit.

6. Melakukan Tugas Peninjauan Manual
- Kembali ke halaman konfigurasi Human-in-the-Loop di Konsol Cloud.
Klik link untuk membuka konsol Spesialis (Pekerja). Tampilannya akan seperti https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx.
Konsol pekerja akan terbuka dan mencantumkan tugas baru Anda.

- Arahkan kursor ke item baris yang berisi Meeting with 4m, lalu klik ikon edit (pensil).
- Edit nilai untuk mengubah teks menjadi Rapat dengan Adam. Anda mungkin harus men-scroll ke bawah di kotak teks untuk melihat teks.
- Klik Terapkan.
- Klik ikon Konfirmasi (centang hijau) untuk item di bawah.

- Klik ikon Konfirmasi untuk entitas lain yang ditandai.
- Klik Kirim. Tugas peninjauan kini telah dihapus dari antrean pelabel Anda.
7. Melihat Tugas yang Sudah Selesai
- Kembali ke konsol Pengelola.
- Klik Tugas, lalu pilih Sedang Berlangsung

- Klik Spesialis.
- Pilih alamat email Anda.
- Klik Kelola Tugas.
- Pilih expense-processor-P1 dari dropdown
Select specialists working on specific tasksdanSelect tasks. Klik Terapkan untuk setiap pilihan. Di menu konteks untuk expense-processor-P1 yang telah ditetapkan kepada Anda, pilih Lihat Pakar

Setelah tugas pemberian label dikirimkan oleh pemberi label, jumlah tugas yang dijawab dan total waktu yang diperlukan akan diperbarui, tetapi data dalam tampilan ini mungkin memerlukan waktu beberapa menit untuk muncul.
- Tutup pop-up spesialis dan lihat tab Spesialis.
- Klik menu konteks untuk nama pengguna Anda, lalu pilih Lihat tugas.
Tampilan ini menunjukkan daftar tugas untuk pengguna, jumlah penyelesaiannya, dan jumlah waktu yang diperlukan seperti yang ditunjukkan di bawah:

8. Selamat
Selamat, Anda telah berhasil menggunakan Human-in-the-Loop Document AI untuk mengonfigurasi peninjauan manual untuk dokumen yang diproses menggunakan pemroses biaya Document AI.
Pembersihan
Agar tidak menimbulkan tagihan ke akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini:
- Di Cloud Console, buka halaman Mengelola resource.
- Dalam daftar project, pilih project Anda lalu klik Hapus.
- Pada dialog, ketik project ID, lalu klik Matikan untuk menghapus project.
Pelajari Lebih Lanjut
Lanjutkan belajar tentang Document AI dengan Codelab berikut ini.
Referensi
- Masa Depan Dokumen - Playlist YouTube
- Dokumentasi Document AI
- Library Klien Python Document AI
- Sampel Document AI
Lisensi
Karya ini dilisensikan berdasarkan Lisensi Umum Creative Commons Attribution 2.0.