AI ของเอกสาร: มนุษย์ในวงการ

1. บทนำ

Document AI API เป็นโซลูชันการทำความเข้าใจเอกสารที่ใช้ Unstructured Data เช่น เอกสาร อีเมล และอื่นๆ เพื่อให้ข้อมูลเข้าใจ วิเคราะห์ และนำไปใช้ได้ง่ายขึ้น

การตรวจสอบจากเจ้าหน้าที่ช่วยให้คุณประมวลผลเอกสารได้อย่างแม่นยำยิ่งขึ้นพร้อมการรับประกันการตรวจสอบจากเจ้าหน้าที่ การตรวจสอบจากเจ้าหน้าที่จะช่วยเพิ่มความแม่นยำและช่วยให้ธุรกิจประเมินการคาดการณ์ได้โดยใช้เครื่องมือที่สร้างขึ้นเพื่อวัตถุประสงค์นี้เพื่อเปิดใช้รีวิวเหล่านั้น ในแล็บนี้ คุณจะได้กำหนดค่าและทดสอบโปรแกรมประมวลผลค่าใช้จ่ายโดยใช้การตรวจสอบจากเจ้าหน้าที่เพื่อตรวจสอบผลลัพธ์จากโปรแกรมประมวลผลโดยใช้เครื่องมือการกำหนดค่าและการจัดการแบบ Human-in-the-Loop

ข้อกำหนดเบื้องต้น

Codelab นี้สร้างขึ้นจากเนื้อหาที่นำเสนอใน Codelab อื่นๆ ของ Document AI

ขอแนะนำให้คุณทำ Codelab ต่อไปนี้ให้เสร็จก่อนดำเนินการต่อ

สิ่งที่คุณจะได้เรียนรู้

  • กำหนดค่าการตรวจสอบจากเจ้าหน้าที่สำหรับผู้ประมวลผล
  • สร้างกลุ่มทรัพยากรผู้ใช้สำหรับการตรวจสอบโดยมนุษย์
  • สร้างงานตรวจสอบโดยมนุษย์เพื่อทดสอบ
  • มอบหมายงานตรวจสอบจากเจ้าหน้าที่ให้ผู้ใช้
  • ดำเนินการตรวจสอบเอกสารโดยเจ้าหน้าที่ให้เสร็จสมบูรณ์

สิ่งที่คุณต้องมี

  • โปรเจ็กต์ Google Cloud
  • เบราว์เซอร์ เช่น Chrome หรือ Firefox
  • ความรู้เกี่ยวกับ Python 3

2. การเริ่มตั้งค่า

Codelab นี้ถือว่าคุณได้ทำตามขั้นตอนการตั้งค่า Document AI ที่ระบุไว้ใน Codelab เบื้องต้นแล้ว

โปรดทำตามขั้นตอนต่อไปนี้ก่อนดำเนินการต่อ

นอกจากนี้ คุณยังต้องเปิดใช้ Vertex AI API ด้วย

  1. ใช้แถบค้นหาที่ด้านบนของคอนโซลเพื่อค้นหา "Vertex AI API" จากนั้นคลิกเปิดใช้เพื่อใช้ API ในโปรเจ็กต์ Google Cloud
  2. หรือจะเปิดใช้ API โดยใช้gcloudคำสั่งต่อไปนี้ก็ได้
gcloud services enable aiplatform.googleapis.com

3. สร้างโปรเซสเซอร์

คุณต้องสร้างอินสแตนซ์ของเครื่องมือประมวลผลค่าใช้จ่ายก่อนจึงจะใช้ในแล็บนี้ได้

  1. ในคอนโซล ให้ไปที่ภาพรวมแพลตฟอร์ม Document AI
  2. คลิกสร้างโปรเซสเซอร์ เลื่อนลงไปที่เฉพาะทาง แล้วเลือกเครื่องมือแยกวิเคราะห์ค่าใช้จ่าย
  3. ตั้งชื่อว่า codelab-expense-parser (หรือชื่ออื่นที่คุณจำได้) แล้วเลือกภูมิภาคที่ใกล้ที่สุดในรายการ
  4. คลิกสร้างเพื่อสร้างโปรเซสเซอร์
  5. คัดลอกรหัสโปรเซสเซอร์ คุณต้องใช้รหัสนี้ในโค้ดในภายหลัง
  6. ใน Cloud Shell ให้สร้างที่เก็บข้อมูลโดยใช้ PROJECT_ID-hitl-results เป็นชื่อ
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
  1. เชื่อมโยงบัญชีผู้ใช้กับบทบาท IAM ผู้ดูแลระบบ Vertex AI ในโปรเจ็กต์ Lab
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin

4. กำหนดค่าการตรวจสอบโดยมนุษย์

ในงานนี้ คุณจะได้กำหนดค่าการตรวจสอบโดยเจ้าหน้าที่สำหรับโปรแกรมประมวลผลค่าใช้จ่ายที่สร้างไว้ก่อนหน้านี้

  1. ในคอนโซล ให้เปิดเมนูการนำทาง แล้วเลือก Document AI
  2. คลิก AI ที่มีมนุษย์เป็นผู้ควบคุม HITLMenu
  3. คลิก codelab-expense-parser เพื่อเปิดหน้าการตรวจสอบโดยเจ้าหน้าที่สำหรับโปรเซสเซอร์
  4. คลิกกำหนดค่าการตรวจสอบโดยเจ้าหน้าที่

ConfigureHITL

  1. เลือกตัวกรองระดับเอกสาร
  2. ตั้งค่าแถบเลื่อนเกณฑ์ความเชื่อมั่น % เป็น 50%
  3. ตั้งค่าตัวเลือกผู้เชี่ยวชาญเป็นใช้ผู้เชี่ยวชาญของฉันเอง

HITLFilters

  1. คลิกในช่องเมนูแบบเลื่อนลงพูลผู้เชี่ยวชาญ แล้วคลิกพูลผู้เชี่ยวชาญใหม่
  2. สำหรับชื่อพูล ให้ป้อน Codelab HITL Pool ในกล่องโต้ตอบพูลผู้เชี่ยวชาญใหม่
  3. ป้อนอีเมลส่วนตัวสำหรับผู้จัดการพูลและผู้เชี่ยวชาญ
  4. คลิกสร้างพูล

HITLSpecialistPool

ซึ่งอาจใช้เวลาดำเนินการสักครู่ คุณควรได้รับอีเมลจาก Vertex AI noreply-vertex@google.com

  1. ปล่อยช่องทำเครื่องหมายการกำหนดอัตโนมัติไว้โดยไม่ต้องเลือก
  2. คลิกช่องทําเครื่องหมายในส่วนยืนยันค่าใช้จ่าย
  3. คลิกตำแหน่งของคำสั่ง แล้วคัดลอกตำแหน่งจัดเก็บนี้ - ห้ามใส่คำนำหน้า gs:// ในเส้นทาง
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
  1. ในตำแหน่งผลลัพธ์ ให้คลิกเรียกดู แล้วเลือก Bucket ของ Cloud Storage ที่คุณสร้างไว้ก่อนหน้านี้
  2. คลิกเลือก
  3. คลิก Save Configuration

ตอนนี้คอนโซลจะแสดงข้อความกำหนดค่าการตรวจสอบโดยมนุษย์ และจะใช้เวลาสักครู่จึงจะเสร็จสมบูรณ์

HITLLoading

  1. เมื่อกำหนดค่าเสร็จแล้ว คอนโซลจะแจ้งให้คุณเปิดใช้การตรวจสอบโดยเจ้าหน้าที่
  • คลิกปุ่มสวิตช์เพื่อเปิดใช้
  • จากนั้นคลิกเปิดใช้ในกล่องโต้ตอบป๊อปอัป

HITLEnable

อัปโหลดแบบฟอร์มค่าใช้จ่ายตัวอย่าง

  1. เรามีแบบฟอร์มตัวอย่างให้ใช้ซึ่งจัดเก็บไว้ใน Google Cloud Storage คุณดาวน์โหลดได้โดยใช้ปุ่มหรือคำสั่งด้านล่าง

gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
  1. หลังจากเปิดใช้การตรวจสอบโดยเจ้าหน้าที่แล้ว ให้คลิกปุ่มอัปโหลดเอกสาร แล้วค้นหาเอกสารตัวอย่างที่คุณเพิ่งดาวน์โหลด
  2. คลิกอัปโหลด แล้วรอให้เสร็จสมบูรณ์

5. มอบหมายรายการให้เจ้าหน้าที่ตรวจสอบ

  1. ในหน้านี้ คุณควรเห็นลิงก์สำหรับคอนโซลผู้จัดการพูลและคอนโซลผู้เชี่ยวชาญ ลิงก์เหล่านี้จะปรากฏในอีเมลจาก Vertex AI noreply-vertex@google.com ด้วย
    • โดยควรมีลักษณะดังนี้ https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks
    • คลิกลิงก์สำหรับคอนโซลผู้จัดการ

  1. เมื่ออยู่ในคอนโซลการติดป้ายกำกับข้อมูลแล้ว ให้คลิกชื่อแท็บงานเพื่อเปิดหน้าการมอบหมายงาน
  2. คลิกช่องทำเครื่องหมายไม่ได้กำหนด คุณควรเห็นว่ามีการแสดงรายการใหม่ในคิวงาน codelab-expense-parser-P1

รูปภาพ

  1. เลือก codelab-expense-parser-P1
  2. คลิกจัดการการมอบหมาย
  3. ป้อนอีเมลส่วนตัวของคุณในกล่องข้อความรวมผู้เชี่ยวชาญทางอีเมล แล้วเลือกจากรายการแบบเลื่อนลง
  4. คลิกใช้

ตอนนี้จอแสดงผลจะแสดงว่ามีการมอบหมายงานให้คุณแล้ว คุณอาจพบว่าการดำเนินการนี้อาจใช้เวลา 2-3 นาทีจึงจะมีผลและปรากฏให้เห็น

รูปภาพ

  1. เลือกผู้ใช้ใหม่ แล้วคลิกไอคอนเมนู
  2. คลิกมอบหมายให้งานทั้งหมดจากเมนูป๊อปอัปที่ปรากฏขึ้น

รูปภาพ

  1. คลิกยืนยันการเปลี่ยนแปลง
  2. คลิกคอมมิต

รูปภาพ

6. ทำงานตรวจสอบจากเจ้าหน้าที่

  1. กลับไปที่หน้าการกำหนดค่า Human-in-the-Loop ใน Cloud Console

คลิกลิงก์เพื่อไปที่คอนโซลผู้เชี่ยวชาญ (ผู้ปฏิบัติงาน) ซึ่งจะมีลักษณะดังนี้ https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx

คอนโซลผู้ปฏิบัติงานควรเปิดขึ้นและแสดงรายการงานใหม่

รูปภาพ

  1. วางเมาส์เหนือรายการโฆษณาที่มี Meeting with 4m แล้วคลิกไอคอนแก้ไข (ดินสอ)
  2. แก้ไขค่าเพื่อเปลี่ยนข้อความเป็นการประชุมกับอดัม คุณอาจต้องเลื่อนลงในกล่องข้อความเพื่อดูข้อความ
  3. คลิกใช้
  4. คลิกไอคอนยืนยัน (เครื่องหมายถูกสีเขียว) สำหรับรายการด้านล่าง รูปภาพ
  5. คลิกไอคอนยืนยันสำหรับเอนทิตีอื่นๆ ที่ไฮไลต์
  6. คลิกส่ง ตอนนี้เราได้นำงานตรวจสอบออกจากคิวของผู้ติดป้ายกำกับแล้ว

7. ดูงานที่เสร็จแล้ว

  1. กลับไปที่คอนโซลผู้ดูแลจัดการ
  2. คลิก Tasks แล้วเลือกกำลังดำเนินการรูปภาพ
  3. คลิกผู้เชี่ยวชาญ
  4. เลือกอีเมลของคุณ
  5. คลิกจัดการการมอบหมาย
  6. เลือก expense-processor-P1 จากเมนูแบบเลื่อนลง Select specialists working on specific tasks และ Select tasks คลิกใช้สำหรับการเลือกแต่ละรายการ ในเมนูตามบริบทสำหรับ expense-processor-P1 ที่ได้รับมอบหมายให้คุณ ให้เลือกดูผู้เชี่ยวชาญ

รูปภาพ

เมื่อผู้ติดป้ายกำกับส่งงานติดป้ายกำกับแล้ว ระบบจะอัปเดตจำนวนงานที่ตอบและเวลาทั้งหมดที่ใช้ แต่ข้อมูลในมุมมองนี้อาจใช้เวลาสักครู่จึงจะปรากฏ

  1. ปิดป๊อปอัปผู้เชี่ยวชาญ แล้วดูแท็บผู้เชี่ยวชาญ
  2. คลิกเมนูตามบริบทสำหรับชื่อผู้ใช้ แล้วเลือกดูงาน

มุมมองนี้จะแสดงรายการงานของผู้ใช้ จำนวนงานที่ทำเสร็จ และระยะเวลาที่ใช้ ดังที่แสดงด้านล่าง

รูปภาพ

8. ขอแสดงความยินดี

ขอแสดงความยินดี คุณใช้การกำกับดูแลโดยมนุษย์ของ Document AI เพื่อกำหนดค่าการตรวจสอบจากเจ้าหน้าที่สำหรับเอกสารที่ประมวลผลโดยใช้โปรเซสเซอร์ค่าใช้จ่ายของ Document AI ได้สำเร็จ

การล้างข้อมูล

โปรดดำเนินการดังนี้เพื่อเลี่ยงไม่ให้เกิดการเรียกเก็บเงินกับบัญชี Google Cloud สำหรับทรัพยากรที่ใช้ในบทแนะนำนี้

  • ใน Cloud Console ให้ไปที่หน้าจัดการทรัพยากร
  • เลือกโปรเจ็กต์ในรายการโปรเจ็กต์ แล้วคลิกลบ
  • ในกล่องโต้ตอบ ให้พิมพ์รหัสโปรเจ็กต์ แล้วคลิกปิดเพื่อลบโปรเจ็กต์

ดูข้อมูลเพิ่มเติม

เรียนรู้เพิ่มเติมเกี่ยวกับ Document AI ด้วย Codelab ที่เกี่ยวข้องต่อไปนี้

แหล่งข้อมูล

ใบอนุญาต

ผลงานนี้ได้รับอนุญาตภายใต้สัญญาอนุญาตครีเอทีฟคอมมอนส์สำหรับยอมรับสิทธิของผู้สร้าง (Creative Commons Attribution License) 2.0 แบบทั่วไป