Menggunakan Document AI Pengadaan untuk Mengurai Invoice menggunakan AI Platform Notebooks
Tentang codelab ini
1. Ringkasan
Apa yang dimaksud dengan Document AI Pengadaan?
Perusahaan mengelola pipeline pengadaan yang besar, termasuk ribuan invoice, tanda terima, dan dokumen terkait lainnya setiap tahun. Gunakan Procurement DocAI untuk memproses "data gelap" Anda secara cerdas, seperti pdf, gambar, dan formulir tulis tangan untuk mengurangi overhead manual siklus proses pengadaan Anda. Otomatiskan pengambilan data pengadaan dalam skala besar dengan mengubah dokumen tidak terstruktur, seperti invoice dan tanda terima, menjadi data terstruktur untuk meningkatkan efisiensi operasional dan kualitas pengalaman pelanggan, serta mendasari pengambilan keputusan.
Dalam codelab ini, kita akan membahas cara menyiapkan Platform Document AI, memproses contoh invoice, mengekstrak, dan memvisualisasikan entitas di AI Platform Notebook.
Yang akan Anda pelajari
- Cara memulai Platform Document AI
- Mengekstrak entitas yang dipetakan menggunakan Solusi DocAI Pengadaan
- Membuat dan menyesuaikan instance AI Platform Notebooks
Yang Anda butuhkan
Survei
Bagaimana Anda akan menggunakan tutorial ini?
Bagaimana penilaian Anda terhadap pengalaman dengan Python?
Bagaimana penilaian Anda terhadap pengalaman menggunakan layanan Google Cloud?
2. Penyiapan dan Persyaratan
Penyiapan lingkungan mandiri
- Login ke Cloud Console dan buat project baru atau gunakan kembali project yang sudah ada. (Jika belum memiliki akun Gmail atau G Suite, Anda harus membuatnya.)
Ingat Project ID, nama unik di semua project Google Cloud. (Maaf, nama Anda di atas telah digunakan dan tidak akan berfungsi untuk Anda). Anda harus memberikan ID ini nanti sebagai PROJECT_ID
.
- Selanjutnya, Anda harus mengaktifkan penagihan di Cloud Console untuk menggunakan resource Google Cloud.
Pastikan untuk mengikuti petunjuk di bagian "Membersihkan". Bagian ini memberi tahu Anda cara mematikan resource agar tidak menimbulkan penagihan di luar tutorial ini. Pengguna baru Google Cloud memenuhi syarat untuk mengikuti program Uji Coba Gratis senilai $300 USD.
3. Mengaktifkan Cloud Document AI API
Sebelum dapat mulai menggunakan Document AI, Anda harus mengaktifkan API. Buka Cloud Console di browser Anda.
- Klik Menu navigasi ☰ > API & Layanan > Library.
- Telusuri "Document AI API", lalu klik Aktifkan untuk menggunakan API di project Google Cloud Anda
4. Membuat dan Menguji Prosesor
Pertama-tama, Anda harus membuat instance prosesor Form Parser untuk digunakan di Document AI Platform untuk tutorial ini.
- Di console, buka Ringkasan Document AI Platform
- Klik Create Processor dan pilih Invoice Parser
- Tentukan nama prosesor dan pilih region Anda dari daftar.
- Klik Buat untuk membuat prosesor
- Salin ID prosesor Anda. Anda harus menggunakan ini dalam kode nanti.
(Opsional) Anda dapat menguji prosesor di console dengan mengupload dokumen. Klik Upload Dokumen dan pilih formulir untuk diuraikan. Anda dapat mendownload dan menggunakan formulir contoh ini jika belum memiliki formulir untuk digunakan.
Output akan terlihat seperti ini:
5. Membuat AI Platform Notebook
Buka bagian AI Platform Notebooks di Cloud Console, lalu klik New Instance. Kemudian, pilih jenis instance Python terbaru:
Gunakan opsi default, lalu klik Create. Setelah instance dibuat, pilih Buka JupyterLab.
6. Mendapatkan Kode Contoh
Impor kode contoh secara langsung dari Repo GitHub Notebook Document AI. Di notebook, buka Git > Clone Repositori di menu atas atau klik ikon Git:
Tempelkan URL repositori berikut:
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
Setelah repositori di-clone, klik direktori documentai-notebooks/specialized/ dan buka notebook specialized_form_parser.ipynb
. Temukan sel tempat Project ID GCP dan ID Pemroses Document AI dideklarasikan.
Tempel Project ID GCP dan ID Prosesor Anda dari langkah 4. Simpan notebook Anda.
7. Mengekstrak dan Memvisualisasikan Entity
Sekarang Anda dapat mengekstrak entitas yang dipetakan dari invoice dan skor keyakinannya yang sesuai. Objek respons Dokumen berisi daftar entitas. Untuk membaca lebih lanjut entity yang dischematisasi, baca panduan memulai Parser Invoice.
Jalankan semua sel di notebook dan scroll ke bawah ke output tabel. Kode sebelumnya melakukan iterasi di setiap entity dan membuat Pandas DataFrame dengan hasilnya.
Sekarang scroll ke bawah ke komponen visualisasi. Respons objek Dokumen berisi informasi tata letak spasial untuk setiap halaman dalam dokumen. Di bawah ini, informasi tata letak di setiap kolom formulir digunakan untuk menggambar kotak pembatas pada gambar. Data ini dapat digunakan untuk integrasi Document AI ke dalam aplikasi frontend.
8. Selamat
Selamat, Anda telah berhasil menggunakan Solusi AI Dokumen Pengadaan untuk mengekstrak data dari invoice. Sebaiknya Anda bereksperimen dengan jenis formulir lainnya.
Pembersihan
Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, Anda dapat menonaktifkan notebook atau menghapus Project GCP.
Menonaktifkan instance AI Platform Notebooks
Ikuti petunjuk ini untuk menonaktifkan instance AI Platform Notebooks.
Menghapus project
Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat untuk tutorial.
Untuk menghapus project:
- Di GCP Console, buka halaman Project. Halaman Project
- Dalam daftar project, pilih project yang ingin dihapus, lalu klik Hapus.
- Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.