1. ภาพรวม
Document AI Warehouse คืออะไร
Document AI Warehouse เป็นแพลตฟอร์มสำหรับจัดเก็บ ค้นหา จัดระเบียบ และวิเคราะห์เอกสารและข้อมูลเมตาที่มีโครงสร้าง เอกสารอาจมีข้อมูลที่มีโครงสร้าง เช่น แบบฟอร์มและใบแจ้งหนี้ ตลอดจนข้อมูลที่ไม่มีโครงสร้าง เช่น สัญญาและเอกสารการวิจัย ข้อมูลเมตาสำหรับเอกสารสามารถแยกได้โดยอัตโนมัติด้วยตัวประมวลผลใน Document AI หรือป้อนข้อมูลด้วยตนเองโดยใช้ช่องและแท็ก
ใน Codelab นี้ คุณจะได้เรียนรู้วิธีนำเข้า ประมวลผล และค้นหาเอกสารโดยใช้อินเทอร์เฟซผู้ใช้ Document AI Warehouse Codelab นี้มีเอกสาร PDF ตัวอย่าง รวมถึงข้อตกลงใบอนุญาต แบบฟอร์มสินเชื่อ และใบแจ้งหนี้คำสั่งซื้อ
ข้อกำหนดเบื้องต้น
Codelab นี้สร้างขึ้นจากเนื้อหาที่แสดงใน Codelab อื่นๆ ของ Document AI เราขอแนะนำให้คุณอ่านเอกสารประกอบและ Codelab ต่อไปนี้ก่อนดำเนินการต่อ
- การเริ่มต้นอย่างรวดเร็ว: ตั้งค่า Document AI API
- ประมวลผลเอกสารโดยใช้ Google Cloud Console
- การจัดการตัวประมวลผล Document AI ด้วย Python
สิ่งที่คุณจะได้เรียนรู้
- วิธีเปิดใช้ Document AI Warehouse API
- วิธีกำหนดค่าตัวประมวลผลเอกสารใน Document AI Warehouse
- วิธีอัปโหลดและแยกวิเคราะห์ข้อความในเอกสาร PDF ประเภทต่างๆ
- วิธีค้นหาเอกสารและข้อมูลเมตาของเอกสารใน Document AI Warehouse
สิ่งที่ต้องมี
2. ดาวน์โหลดเอกสารตัวอย่าง
Codelab นี้มีเอกสาร PDF ตัวอย่าง รวมถึงข้อตกลงใบอนุญาต แบบฟอร์มสินเชื่อ และใบแจ้งหนี้คำสั่งซื้อ คุณดาวน์โหลดเอกสารตัวอย่างต่อไปนี้เพื่อใช้ใน Codelab นี้ได้
หรือดาวน์โหลดเอกสารตัวอย่างจากที่เก็บข้อมูล Google Cloud Storage สาธารณะของเราได้โดยใช้ gsutil
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/license-agreement.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/loan-form.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/order-invoice.pdf .
ในขั้นตอนต่อไป คุณจะอัปโหลดเอกสารตัวอย่างเหล่านี้ แยกวิเคราะห์ด้วยตัวประมวลผลเอกสารอื่น และเก็บเอกสารและข้อมูลเมตาที่ได้ใน Document AI Warehouse
3. เปิดใช้ Document AI Warehouse API
ก่อนที่คุณจะเริ่มใช้ Document AI Warehouse คุณต้องเปิดใช้ API
การใช้ Cloud Console
- เปิดคอนโซล Google Cloud ในเบราว์เซอร์
- ในคอนโซล Google Cloud ให้ไปที่ไลบรารี API เพื่อเรียกดู API และบริการที่เปิดใช้ได้
- ใช้แถบค้นหาที่ด้านบนของหน้าไลบรารี API เพื่อค้นหา
Document AI Warehouse
แล้วคลิกบริการที่ได้ - คลิกปุ่มเปิดใช้เพื่อเปิดใช้ Document AI Warehouse API ในโปรเจ็กต์ Google Cloud
ทางเลือก: การใช้ gcloud CLI
หรือเปิดใช้ API โดยใช้คำสั่ง gcloud
ต่อไปนี้ก็ได้
gcloud services enable contentwarehouse.googleapis.com
หากเปิดใช้ API เรียบร้อยแล้ว คุณควรเห็นข้อความที่คล้ายกับข้อความต่อไปนี้
Operation "operations/..." finished successfully.
ตอนนี้คุณพร้อมใช้ Document AI Warehouse แล้ว
4. ดูคอนโซล Document AI Warehouse
ในเบราว์เซอร์ ให้ไปที่คอนโซล Document AI Warehouse ที่ https://documentwarehouse.cloud.google.com (ซึ่งอยู่นอกคอนโซล Google Cloud) คุณจะใช้คอนโซล Document AI Warehouse ร่วมกับโปรเจ็กต์ Google Cloud ของคุณเพื่อดำเนินการขั้นตอนที่เหลือใน Codelab นี้เพื่ออัปโหลด ประมวลผล และค้นหาเอกสาร
ถ้าคุณใช้ Document AI Warehouse เป็นครั้งแรก โปรดดูเอกสารประกอบของ Document AI Warehouse สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการกำหนดค่าโปรเจ็กต์และการตั้งค่าของคุณตามความต้องการของคุณ
5. สร้างสคีมาของเอกสาร
สคีมาของเอกสารจะกำหนดประเภทและฟิลด์ของเอกสารสำหรับเอกสารที่คุณเก็บไว้ใน Document AI Warehouse คุณจะต้องสร้างสคีมาก่อนอัปโหลดเอกสารใหม่
- จากคอนโซล Document AI Warehouse ให้คลิกปุ่มผู้ดูแลระบบที่มุมขวาบนของหน้า
- คลิกรายการสคีมาบนแถบนำทางด้านซ้าย แล้วคลิกปุ่ม + เพิ่มใหม่
- ป้อนชื่อสคีมา เช่น
Documents and Forms
และตรวจสอบว่าเลือกเอกสารเป็นประเภทสคีมา จากนั้นคลิกปุ่มถัดไปเพื่อดําเนินการต่อ - คุณปล่อยคำจำกัดความของสคีมา JSON เริ่มต้นไว้ตามเดิมได้ ซึ่งควรปรากฏในรูปแบบต่อไปนี้
{ "display_name": "Documents and Forms", "property_definitions": [], "document_is_folder": false, "description": "" }
- จากนั้นคลิกปุ่มเสร็จสิ้นเพื่อสร้างสคีมาเอกสารให้เสร็จ
เมื่อทำตามขั้นตอนเหล่านี้เสร็จสมบูรณ์แล้ว คุณจะเห็นข้อความแจ้งว่าระบบสร้างสคีมาเอกสารแล้ว คุณสามารถคลิกปุ่มดูสคีมาของเอกสาร แล้วคลิกแท็บ JSON เพื่อยืนยันสคีมา ซึ่งควรปรากฏคล้ายกับเวอร์ชันต่อไปนี้
6. สร้างตัวประมวลผลเอกสาร
ในขั้นตอนนี้ คุณจะสร้างตัวประมวลผลเอกสารที่คุณสามารถใช้เพื่อค้นหาข้อความแบบเต็มสำหรับเอกสารประเภทต่างๆ ใน Document AI Warehouse
- ในคอนโซล Google Cloud ให้ไปที่หน้าภาพรวม Document AI Platform
- คลิกสำรวจผู้ประมวลผลข้อมูล แล้วเลือก OCR เอกสารเป็นประเภทโปรเซสเซอร์ที่ต้องการสร้าง
- ระบุชื่อผู้ประมวลผลเอกสาร เช่น
ocr
และภูมิภาคที่ต้องการ จากนั้นคลิกสร้างเพื่อสร้างโปรเซสเซอร์ - ในหน้ารายละเอียดผู้ประมวลผลข้อมูล ให้คัดลอกรหัสผู้ประมวลผลข้อมูล ซึ่งเราจะใช้ในภายหลังเพื่อกำหนดค่าตัวประมวลผลใน Document AI Warehouse
ทำขั้นตอนนี้ซ้ำและเลือกโปรแกรมแยกวิเคราะห์แบบฟอร์มเป็นประเภทโปรเซสเซอร์เอกสารที่จะสร้างและระบุ form
เป็นชื่อผู้ประมวลผลข้อมูล
ทำขั้นตอนเหล่านี้ซ้ำและเลือกโปรแกรมแยกวิเคราะห์ใบแจ้งหนี้เป็นประเภทของผู้ประมวลผลเอกสารที่จะสร้างและระบุ invoice
เป็นชื่อผู้ประมวลผลข้อมูล
เมื่อทำตามขั้นตอนเหล่านี้เรียบร้อยแล้ว คุณจะเห็นรายชื่อผู้ประมวลผลเอกสารที่มีลักษณะคล้ายกับรายการต่อไปนี้
7. กำหนดค่าตัวประมวลผลเอกสาร
ในขั้นตอนนี้ คุณจะต้องกำหนดค่าตัวประมวลผลเอกสารใน Document AI Warehouse โดยอ้างอิงโปรเซสเซอร์ที่คุณสร้างขึ้นในขั้นตอนก่อนหน้า
- จากคอนโซล Document AI Warehouse ให้คลิกปุ่มผู้ดูแลระบบในแถบเครื่องมือด้านบน
- คลิกรายการเครื่องมือประมวลผล AI ของเอกสารในแถบนำทางด้านซ้าย แล้วคลิกปุ่ม + เพิ่มใหม่
- คลิกปุ่ม + เพิ่มโปรเซสเซอร์ใหม่ แล้วระบุชื่อและรหัสโปรเซสเซอร์จากขั้นตอนก่อนหน้า
- คลิกปุ่มบันทึกเพื่อบันทึกการเปลี่ยนแปลง
ทำขั้นตอนนี้ซ้ำเพื่อเพิ่มตัวประมวลผลอีก 2 รายการไปยังการกำหนดค่า Document AI Warehouse โดยใช้ปุ่ม + เพิ่มผู้ประมวลผลข้อมูลใหม่ ซึ่งรวมถึงโปรแกรมแยกวิเคราะห์แบบฟอร์มและโปรแกรมแยกวิเคราะห์ใบแจ้งหนี้ ตรวจสอบว่าคุณเพิ่มผู้ประมวลผลข้อมูลอีก 2 รายการภายใต้รหัสสคีมาของเอกสารเดียวกันโดยใช้ปุ่ม + เพิ่มผู้ประมวลผลข้อมูลใหม่ แทนที่จะเพิ่มสคีมาเพิ่มเติมโดยใช้ปุ่ม + เพิ่มใหม่
เมื่อทำตามขั้นตอนเหล่านี้เรียบร้อยแล้ว คุณควรจะเห็นรายการโปรเซสเซอร์เอกสารที่กำหนดค่าไว้ซึ่งมีลักษณะคล้ายกับด้านล่างนี้
8. อัปโหลดและประมวลผลเอกสารตัวอย่าง
เมื่อคุณกำหนดสคีมาและตัวประมวลผลที่กำหนดค่าสำหรับเอกสารแล้ว คุณจะอัปโหลดเอกสารไปยัง Document AI Warehouse ได้
- กลับไปที่คอนโซล Document AI Warehouse และคลิกที่ปุ่ม +เพิ่มใหม่ ในแถบนำทางด้านซ้าย จากนั้นเลือกตัวเลือกเพื่ออัปโหลดเอกสารใหม่
- ลากเอกสาร license-agreement.pdf จากเครื่องไปยังวิดเจ็ตการอัปโหลด หรือเรียกดูและเลือกเอกสารตัวอย่างที่คุณดาวน์โหลดมา 1 รายการ จากนั้นคลิกปุ่มถัดไปเพื่อดําเนินการต่อ
- สำหรับสคีมาเอกสาร ให้เลือกชื่อของสคีมาที่คุณสร้างไว้ก่อนหน้านี้ เช่น เอกสารและฟอร์ม สำหรับรหัสผู้ประมวลผลข้อมูล AI ของเอกสาร ให้เลือกเครื่องมือประมวลผลเอกสาร OCR ที่คุณกำหนดค่าไว้ในขั้นตอนก่อนหน้า
- สำหรับชื่อที่แสดง คุณสามารถใช้ชื่อเริ่มต้น (ซึ่งก็คือชื่อไฟล์) หรือใช้ชื่อเอกสารที่คุณกำหนดเองก็ได้
- คลิกปุ่มสร้างเพื่ออัปโหลดและประมวลผลเอกสาร
กลับไปที่คอนโซล Document AI Warehouse และทำซ้ำขั้นตอนเหล่านี้กับเอกสารตัวอย่าง loan-form.pdf เลือกตัวประมวลผลเอกสาร form
ที่คุณกำหนดค่าไว้ก่อนหน้านี้
กลับไปที่คอนโซล Document AI Warehouse และทำซ้ำขั้นตอนเหล่านี้กับเอกสารตัวอย่าง invoice-sample.pdf เลือกตัวประมวลผลเอกสาร invoice
ที่คุณกำหนดค่าไว้ก่อนหน้านี้
เมื่อทำตามขั้นตอนเหล่านี้เรียบร้อยแล้ว หากคุณกลับไปที่คอนโซล Document AI Warehouse คุณจะเห็นรายการเอกสารที่ประมวลผลซึ่งมีลักษณะคล้ายกับรายการต่อไปนี้
9. ค้นหาและสำรวจเอกสาร
เมื่อคุณอัปโหลดและประมวลผลเอกสารไปยัง Document AI Warehouse แล้ว คุณจะสามารถค้นหาข้อความแบบเต็มในเอกสารได้
จากคอนโซล Document AI Warehouse ให้ป้อนข้อความค้นหาที่ปรากฏในเอกสารตัวอย่าง เช่น agreement
แล้วกดปุ่ม Enter คุณสามารถลองใช้ข้อความค้นหาอื่นๆ เช่น mortgage
และ monitor
เพื่อดูผลลัพธ์สำหรับเอกสารตัวอย่างอื่นๆ ที่คุณอัปโหลด
ในผลลัพธ์ คุณจะเห็นเอกสารทั้งหมดที่มีข้อความค้นหานั้น พร้อมกับสรุปข้อความในเอกสารโดยไฮไลต์ข้อความค้นหาไว้
คลิกชื่อเอกสารเพื่อดู
คลิกปุ่มสลับ AI View เพื่อดูเอกสารพร้อมกับช่องที่ตรวจพบและข้อมูลที่เกี่ยวข้อง
10. ขอแสดงความยินดี
คุณได้อัปโหลด ประมวลผล และค้นหาข้อความแบบเต็มในเอกสารด้วย Document AI Warehouse และโดยการใช้ตัวประมวลผลใน Document AI เรียบร้อยแล้ว เราขอแนะนำให้คุณทดสอบเอกสารอื่นๆ และสำรวจผู้ประมวลผลข้อมูลรายอื่นๆ ที่มีในแพลตฟอร์ม
ล้างข้อมูล
คุณสามารถดำเนินการทำความสะอาดต่อไปนี้เพื่อเลี่ยงไม่ให้เกิดการเรียกเก็บเงินกับบัญชี Google Cloud สำหรับทรัพยากรที่ใช้ในบทแนะนำนี้
- ไปที่หน้าคอนโซลคลังเอกสาร และลบเอกสารตัวอย่างทั้งหมดที่คุณอัปโหลด
- ในคอนโซล Google Cloud ให้ไปที่หน้าตัวประมวลผล Document AI แล้วลบตัวประมวลผลตัวอย่างที่คุณสร้างขึ้น
- ในคอนโซล Google Cloud ให้ไปที่หน้า API และบริการ แล้วปิดใช้ Document AI Warehouse API
ดูข้อมูลเพิ่มเติม
ศึกษาเพิ่มเติมเกี่ยวกับ Document AI ต่อไปด้วย Codelab อื่นๆ เหล่านี้
- การรู้จำอักขระด้วยภาพด้วย Document AI
- การแยกวิเคราะห์แบบฟอร์มด้วย Document AI (Python)
- โปรเซสเซอร์เฉพาะทางที่มี Document AI (Python)
- การจัดการตัวประมวลผล Document AI ด้วย Python
แหล่งข้อมูล
- เอกสารประกอบของ Document AI Warehouse
- อนาคตของเอกสาร - เพลย์ลิสต์ YouTube
- ที่เก็บตัวอย่าง Document AI
ใบอนุญาต
ผลงานนี้ได้รับอนุญาตภายใต้ใบอนุญาตทั่วไปครีเอทีฟคอมมอนส์แบบระบุแหล่งที่มา 2.0