1. บทนำ
Document AI API เป็นโซลูชันการทำความเข้าใจเอกสารที่ใช้ Unstructured Data เช่น เอกสาร อีเมล และอื่นๆ เพื่อให้ข้อมูลเข้าใจ วิเคราะห์ และนำไปใช้ได้ง่ายขึ้น
การตรวจสอบจากเจ้าหน้าที่ช่วยให้คุณประมวลผลเอกสารได้อย่างแม่นยำยิ่งขึ้นพร้อมการรับประกันการตรวจสอบจากเจ้าหน้าที่ การตรวจสอบจากเจ้าหน้าที่จะช่วยเพิ่มความแม่นยำและช่วยให้ธุรกิจประเมินการคาดการณ์ได้โดยใช้เครื่องมือที่สร้างขึ้นเพื่อวัตถุประสงค์นี้เพื่อเปิดใช้รีวิวเหล่านั้น ในแล็บนี้ คุณจะได้กำหนดค่าและทดสอบโปรแกรมประมวลผลค่าใช้จ่ายโดยใช้การตรวจสอบจากเจ้าหน้าที่เพื่อตรวจสอบผลลัพธ์จากโปรแกรมประมวลผลโดยใช้เครื่องมือการกำหนดค่าและการจัดการแบบ Human-in-the-Loop
ข้อกำหนดเบื้องต้น
Codelab นี้สร้างขึ้นจากเนื้อหาที่นำเสนอใน Codelab อื่นๆ ของ Document AI
ขอแนะนำให้คุณทำ Codelab ต่อไปนี้ให้เสร็จก่อนดำเนินการต่อ
- การรู้จำอักขระด้วยภาพ (OCR) ด้วย Document AI (Python)
- การแยกวิเคราะห์แบบฟอร์มด้วย Document AI (Python)
- โปรเซสเซอร์เฉพาะทางด้วย Document AI (Python)
สิ่งที่คุณจะได้เรียนรู้
- กำหนดค่าการตรวจสอบจากเจ้าหน้าที่สำหรับผู้ประมวลผล
- สร้างกลุ่มทรัพยากรผู้ใช้สำหรับการตรวจสอบโดยมนุษย์
- สร้างงานตรวจสอบโดยมนุษย์เพื่อทดสอบ
- มอบหมายงานตรวจสอบจากเจ้าหน้าที่ให้ผู้ใช้
- ดำเนินการตรวจสอบเอกสารโดยเจ้าหน้าที่ให้เสร็จสมบูรณ์
สิ่งที่คุณต้องมี
2. การเริ่มตั้งค่า
Codelab นี้ถือว่าคุณได้ทำตามขั้นตอนการตั้งค่า Document AI ที่ระบุไว้ใน Codelab เบื้องต้นแล้ว
โปรดทำตามขั้นตอนต่อไปนี้ก่อนดำเนินการต่อ
นอกจากนี้ คุณยังต้องเปิดใช้ Vertex AI API ด้วย
- ใช้แถบค้นหาที่ด้านบนของคอนโซลเพื่อค้นหา "Vertex AI API" จากนั้นคลิกเปิดใช้เพื่อใช้ API ในโปรเจ็กต์ Google Cloud
- หรือจะเปิดใช้ API โดยใช้
gcloudคำสั่งต่อไปนี้ก็ได้
gcloud services enable aiplatform.googleapis.com
3. สร้างโปรเซสเซอร์
คุณต้องสร้างอินสแตนซ์ของเครื่องมือประมวลผลค่าใช้จ่ายก่อนจึงจะใช้ในแล็บนี้ได้
- ในคอนโซล ให้ไปที่ภาพรวมแพลตฟอร์ม Document AI
- คลิกสร้างโปรเซสเซอร์ เลื่อนลงไปที่เฉพาะทาง แล้วเลือกเครื่องมือแยกวิเคราะห์ค่าใช้จ่าย
- ตั้งชื่อว่า
codelab-expense-parser(หรือชื่ออื่นที่คุณจำได้) แล้วเลือกภูมิภาคที่ใกล้ที่สุดในรายการ - คลิกสร้างเพื่อสร้างโปรเซสเซอร์
- คัดลอกรหัสโปรเซสเซอร์ คุณต้องใช้รหัสนี้ในโค้ดในภายหลัง
- ใน Cloud Shell ให้สร้างที่เก็บข้อมูลโดยใช้
PROJECT_ID-hitl-resultsเป็นชื่อ
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
- เชื่อมโยงบัญชีผู้ใช้กับบทบาท IAM ผู้ดูแลระบบ Vertex AI ในโปรเจ็กต์ Lab
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin
4. กำหนดค่าการตรวจสอบโดยมนุษย์
ในงานนี้ คุณจะได้กำหนดค่าการตรวจสอบโดยเจ้าหน้าที่สำหรับโปรแกรมประมวลผลค่าใช้จ่ายที่สร้างไว้ก่อนหน้านี้
- ในคอนโซล ให้เปิดเมนูการนำทาง แล้วเลือก Document AI
- คลิก AI ที่มีมนุษย์เป็นผู้ควบคุม

- คลิก
codelab-expense-parserเพื่อเปิดหน้าการตรวจสอบโดยเจ้าหน้าที่สำหรับโปรเซสเซอร์ - คลิกกำหนดค่าการตรวจสอบโดยเจ้าหน้าที่

- เลือกตัวกรองระดับเอกสาร
- ตั้งค่าแถบเลื่อนเกณฑ์ความเชื่อมั่น % เป็น 50%
- ตั้งค่าตัวเลือกผู้เชี่ยวชาญเป็นใช้ผู้เชี่ยวชาญของฉันเอง

- คลิกในช่องเมนูแบบเลื่อนลงพูลผู้เชี่ยวชาญ แล้วคลิกพูลผู้เชี่ยวชาญใหม่
- สำหรับชื่อพูล ให้ป้อน
Codelab HITL Poolในกล่องโต้ตอบพูลผู้เชี่ยวชาญใหม่ - ป้อนอีเมลส่วนตัวสำหรับผู้จัดการพูลและผู้เชี่ยวชาญ
- คลิกสร้างพูล

ซึ่งอาจใช้เวลาดำเนินการสักครู่ คุณควรได้รับอีเมลจาก Vertex AI noreply-vertex@google.com
- ปล่อยช่องทำเครื่องหมายการกำหนดอัตโนมัติไว้โดยไม่ต้องเลือก
- คลิกช่องทําเครื่องหมายในส่วนยืนยันค่าใช้จ่าย
- คลิกตำแหน่งของคำสั่ง แล้วคัดลอกตำแหน่งจัดเก็บนี้ - ห้ามใส่คำนำหน้า
gs://ในเส้นทาง
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
- ในตำแหน่งผลลัพธ์ ให้คลิกเรียกดู แล้วเลือก Bucket ของ Cloud Storage ที่คุณสร้างไว้ก่อนหน้านี้
- คลิกเลือก
- คลิก Save Configuration
ตอนนี้คอนโซลจะแสดงข้อความกำหนดค่าการตรวจสอบโดยมนุษย์ และจะใช้เวลาสักครู่จึงจะเสร็จสมบูรณ์

- เมื่อกำหนดค่าเสร็จแล้ว คอนโซลจะแจ้งให้คุณเปิดใช้การตรวจสอบโดยเจ้าหน้าที่
- คลิกปุ่มสวิตช์เพื่อเปิดใช้
- จากนั้นคลิกเปิดใช้ในกล่องโต้ตอบป๊อปอัป

อัปโหลดแบบฟอร์มค่าใช้จ่ายตัวอย่าง
- เรามีแบบฟอร์มตัวอย่างให้ใช้ซึ่งจัดเก็บไว้ใน Google Cloud Storage คุณดาวน์โหลดได้โดยใช้ปุ่มหรือคำสั่งด้านล่าง
gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
- หลังจากเปิดใช้การตรวจสอบโดยเจ้าหน้าที่แล้ว ให้คลิกปุ่มอัปโหลดเอกสาร แล้วค้นหาเอกสารตัวอย่างที่คุณเพิ่งดาวน์โหลด
- คลิกอัปโหลด แล้วรอให้เสร็จสมบูรณ์
5. มอบหมายรายการให้เจ้าหน้าที่ตรวจสอบ
- ในหน้านี้ คุณควรเห็นลิงก์สำหรับคอนโซลผู้จัดการพูลและคอนโซลผู้เชี่ยวชาญ ลิงก์เหล่านี้จะปรากฏในอีเมลจาก
Vertex AI noreply-vertex@google.comด้วย- โดยควรมีลักษณะดังนี้
https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks - คลิกลิงก์สำหรับคอนโซลผู้จัดการ
- โดยควรมีลักษณะดังนี้

- เมื่ออยู่ในคอนโซลการติดป้ายกำกับข้อมูลแล้ว ให้คลิกชื่อแท็บงานเพื่อเปิดหน้าการมอบหมายงาน
- คลิกช่องทำเครื่องหมายไม่ได้กำหนด คุณควรเห็นว่ามีการแสดงรายการใหม่ในคิวงาน codelab-expense-parser-P1

- เลือก codelab-expense-parser-P1
- คลิกจัดการการมอบหมาย
- ป้อนอีเมลส่วนตัวของคุณในกล่องข้อความรวมผู้เชี่ยวชาญทางอีเมล แล้วเลือกจากรายการแบบเลื่อนลง
- คลิกใช้
ตอนนี้จอแสดงผลจะแสดงว่ามีการมอบหมายงานให้คุณแล้ว คุณอาจพบว่าการดำเนินการนี้อาจใช้เวลา 2-3 นาทีจึงจะมีผลและปรากฏให้เห็น

- เลือกผู้ใช้ใหม่ แล้วคลิกไอคอนเมนู
- คลิกมอบหมายให้งานทั้งหมดจากเมนูป๊อปอัปที่ปรากฏขึ้น

- คลิกยืนยันการเปลี่ยนแปลง
- คลิกคอมมิต

6. ทำงานตรวจสอบจากเจ้าหน้าที่
- กลับไปที่หน้าการกำหนดค่า Human-in-the-Loop ใน Cloud Console
คลิกลิงก์เพื่อไปที่คอนโซลผู้เชี่ยวชาญ (ผู้ปฏิบัติงาน) ซึ่งจะมีลักษณะดังนี้ https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx
คอนโซลผู้ปฏิบัติงานควรเปิดขึ้นและแสดงรายการงานใหม่

- วางเมาส์เหนือรายการโฆษณาที่มี Meeting with 4m แล้วคลิกไอคอนแก้ไข (ดินสอ)
- แก้ไขค่าเพื่อเปลี่ยนข้อความเป็นการประชุมกับอดัม คุณอาจต้องเลื่อนลงในกล่องข้อความเพื่อดูข้อความ
- คลิกใช้
- คลิกไอคอนยืนยัน (เครื่องหมายถูกสีเขียว) สำหรับรายการด้านล่าง

- คลิกไอคอนยืนยันสำหรับเอนทิตีอื่นๆ ที่ไฮไลต์
- คลิกส่ง ตอนนี้เราได้นำงานตรวจสอบออกจากคิวของผู้ติดป้ายกำกับแล้ว
7. ดูงานที่เสร็จแล้ว
- กลับไปที่คอนโซลผู้ดูแลจัดการ
- คลิก Tasks แล้วเลือกกำลังดำเนินการ

- คลิกผู้เชี่ยวชาญ
- เลือกอีเมลของคุณ
- คลิกจัดการการมอบหมาย
- เลือก expense-processor-P1 จากเมนูแบบเลื่อนลง
Select specialists working on specific tasksและSelect tasksคลิกใช้สำหรับการเลือกแต่ละรายการ ในเมนูตามบริบทสำหรับ expense-processor-P1 ที่ได้รับมอบหมายให้คุณ ให้เลือกดูผู้เชี่ยวชาญ

เมื่อผู้ติดป้ายกำกับส่งงานติดป้ายกำกับแล้ว ระบบจะอัปเดตจำนวนงานที่ตอบและเวลาทั้งหมดที่ใช้ แต่ข้อมูลในมุมมองนี้อาจใช้เวลาสักครู่จึงจะปรากฏ
- ปิดป๊อปอัปผู้เชี่ยวชาญ แล้วดูแท็บผู้เชี่ยวชาญ
- คลิกเมนูตามบริบทสำหรับชื่อผู้ใช้ แล้วเลือกดูงาน
มุมมองนี้จะแสดงรายการงานของผู้ใช้ จำนวนงานที่ทำเสร็จ และระยะเวลาที่ใช้ ดังที่แสดงด้านล่าง

8. ขอแสดงความยินดี
ขอแสดงความยินดี คุณใช้การกำกับดูแลโดยมนุษย์ของ Document AI เพื่อกำหนดค่าการตรวจสอบจากเจ้าหน้าที่สำหรับเอกสารที่ประมวลผลโดยใช้โปรเซสเซอร์ค่าใช้จ่ายของ Document AI ได้สำเร็จ
การล้างข้อมูล
โปรดดำเนินการดังนี้เพื่อเลี่ยงไม่ให้เกิดการเรียกเก็บเงินกับบัญชี Google Cloud สำหรับทรัพยากรที่ใช้ในบทแนะนำนี้
- ใน Cloud Console ให้ไปที่หน้าจัดการทรัพยากร
- เลือกโปรเจ็กต์ในรายการโปรเจ็กต์ แล้วคลิกลบ
- ในกล่องโต้ตอบ ให้พิมพ์รหัสโปรเจ็กต์ แล้วคลิกปิดเพื่อลบโปรเจ็กต์
ดูข้อมูลเพิ่มเติม
เรียนรู้เพิ่มเติมเกี่ยวกับ Document AI ด้วย Codelab ที่เกี่ยวข้องต่อไปนี้
แหล่งข้อมูล
- อนาคตของเอกสาร - เพลย์ลิสต์ YouTube
- เอกสารประกอบเกี่ยวกับ Document AI
- ไลบรารีของไคลเอ็นต์ Python สำหรับ Document AI
- ตัวอย่าง Document AI
ใบอนุญาต
ผลงานนี้ได้รับอนุญาตภายใต้สัญญาอนุญาตครีเอทีฟคอมมอนส์สำหรับยอมรับสิทธิของผู้สร้าง (Creative Commons Attribution License) 2.0 แบบทั่วไป