ใช้ AI เอกสารการจัดซื้อเพื่อแยกวิเคราะห์ใบแจ้งหนี้โดยใช้สมุดบันทึก AI Platform

1. ภาพรวม

c65b9ae04aa1853.png

Document AI สำหรับการจัดซื้อคืออะไร

องค์กรต่างๆ จัดการไปป์ไลน์การจัดซื้อขนาดใหญ่ ซึ่งรวมถึงใบแจ้งหนี้ ใบเสร็จ และเอกสารอื่นๆ ที่เกี่ยวข้องหลายพันรายการในแต่ละปี ใช้ Procurement DocAI เพื่อประมวลผล "Dark Data" อย่างชาญฉลาด เช่น PDF, รูปภาพ และแบบฟอร์มที่เขียนด้วยลายมือ เพื่อลดภาระงานด้วยตนเองในวงจรการจัดซื้อ ทําให้การบันทึกข้อมูลการจัดซื้อจัดจ้างเป็นไปโดยอัตโนมัติในวงกว้างด้วยการเปลี่ยนเอกสารที่ไม่มีโครงสร้าง เช่น ใบแจ้งหนี้และใบเสร็จ ให้เป็น Structured Data เพื่อเพิ่มประสิทธิภาพในการดำเนินการ ปรับปรุงประสบการณ์ของลูกค้า และแจ้งให้ทราบถึงการตัดสินใจ

ใน Codelab นี้ เราจะอธิบายวิธีตั้งค่าแพลตฟอร์ม Document AI, ประมวลผลใบแจ้งหนี้ตัวอย่าง, แยก และแสดงภาพเอนทิตีใน AI Platform Notebook

สิ่งที่คุณจะได้เรียนรู้

  • วิธีเริ่มต้นใช้งานแพลตฟอร์ม Document AI
  • แยกเอนทิตีที่จัดรูปแบบสคีมาโดยใช้โซลูชัน Procurement DocAI
  • สร้างและปรับแต่งอินสแตนซ์ Notebook ของ AI Platform

สิ่งที่คุณต้องมี

  • โปรเจ็กต์ Google Cloud
  • เบราว์เซอร์ เช่น Chrome หรือ Firefox
  • ความรู้เกี่ยวกับ Python 3

แบบสำรวจ

คุณจะใช้บทแนะนำนี้อย่างไร

อ่านอย่างเดียว อ่านและทำแบบฝึกหัด

คุณจะให้คะแนนประสบการณ์การใช้งาน Python เท่าใด

ผู้ฝึกหัด ขั้นกลาง ผู้ชำนาญ

คุณจะให้คะแนนประสบการณ์การใช้บริการ Google Cloud เท่าใด

ผู้ฝึกหัด ขั้นกลาง ผู้ชำนาญ

2. การตั้งค่าและข้อกำหนด

การตั้งค่าสภาพแวดล้อมแบบเรียนรู้ด้วยตนเอง

  1. ลงชื่อเข้าใช้ Cloud Console แล้วสร้างโปรเจ็กต์ใหม่หรือใช้โปรเจ็กต์ที่มีอยู่ซ้ำ (หากยังไม่มีบัญชี Gmail หรือ G Suite คุณต้องสร้างบัญชี)

โปรดจดจำรหัสโปรเจ็กต์ ซึ่งเป็นชื่อที่ไม่ซ้ำกันในโปรเจ็กต์ Google Cloud ทั้งหมด (ชื่อของคุณด้านบนมีคนใช้ไปแล้วและคุณจะใช้ชื่อนี้ไม่ได้ ขออภัย) คุณต้องระบุรหัสนี้ในภายหลังเป็น PROJECT_ID

  1. จากนั้นคุณต้องเปิดใช้การเรียกเก็บเงินใน Cloud Console เพื่อใช้ทรัพยากร Google Cloud

โปรดทำตามวิธีการในส่วน "การล้างข้อมูล" ส่วนนี้จะแนะนำวิธีปิดแหล่งข้อมูลเพื่อไม่ให้มีการเรียกเก็บเงินนอกเหนือจากบทแนะนำนี้ ผู้ใช้ Google Cloud รายใหม่มีสิทธิ์เข้าร่วมโปรแกรมช่วงทดลองใช้ฟรีมูลค่า$300 USD

3. เปิดใช้ Cloud Document AI API

คุณต้องเปิดใช้ API ก่อนจึงจะเริ่มใช้ Document AI ได้ เปิด Cloud Console ในเบราว์เซอร์

  1. คลิกเมนูการนำทาง ☰ > API และบริการ > ไลบรารี Search API
  2. ค้นหา "Document AI API" แล้วคลิกเปิดใช้เพื่อใช้ API ในโปรเจ็กต์ที่อยู่ในระบบคลาวด์ของ Google

4. สร้างและทดสอบโปรเซสเซอร์

คุณต้องสร้างอินสแตนซ์ของโปรเซสเซอร์ Form Parser ก่อนเพื่อใช้ใน Document AI Platform สำหรับบทแนะนำนี้

  1. ในคอนโซล ให้ไปที่ภาพรวมแพลตฟอร์ม Document AI
  2. คลิกสร้างโปรเซสเซอร์ แล้วเลือกเครื่องมือแยกวิเคราะห์ใบแจ้งหนี้โปรเซสเซอร์
  3. ระบุชื่อโปรเซสเซอร์และเลือกภูมิภาคจากรายการ
  4. คลิกสร้างเพื่อสร้างโปรเซสเซอร์
  5. คัดลอกรหัสโปรเซสเซอร์ คุณต้องใช้รหัสนี้ในโค้ดในภายหลัง

(ไม่บังคับ) คุณทดสอบโปรเซสเซอร์ในคอนโซลได้โดยการอัปโหลดเอกสาร คลิกอัปโหลดเอกสาร แล้วเลือกแบบฟอร์มที่จะแยกวิเคราะห์ คุณสามารถดาวน์โหลดและใช้แบบฟอร์มตัวอย่างนี้ได้หากไม่มีแบบฟอร์มที่พร้อมใช้งาน

ใบแจ้งหนี้

เอาต์พุตควรมีลักษณะดังนี้ ใบแจ้งหนี้ที่แยกวิเคราะห์แล้ว

5. สร้าง AI Platform Notebook

ไปที่ส่วน AI Platform Notebooks ใน Cloud Console แล้วคลิกอินสแตนซ์ใหม่ จากนั้นเลือกประเภทอินสแตนซ์ Python ล่าสุด

a81c82876c6c16f9.png

ใช้ตัวเลือกเริ่มต้น แล้วคลิกสร้าง เมื่อสร้างอินสแตนซ์แล้ว ให้เลือกเปิด JupyterLab

6. รับโค้ดตัวอย่าง

นำเข้าโค้ดตัวอย่างจาก Notebook ของ Document AI ที่เก็บของ GitHub โดยตรง ใน Notebook ให้ไปที่ Git > โคลนที่เก็บในเมนูด้านบน หรือคลิกไอคอน Git Git

วาง URL ของที่เก็บต่อไปนี้

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

เมื่อโคลนที่เก็บแล้ว ให้คลิกผ่านไดเรกทอรี documentai-notebooks/specialized/ แล้วเปิด Notebook specialized_form_parser.ipynb ค้นหาเซลล์ที่มีการประกาศรหัสโปรเจ็กต์ GCP และรหัสโปรเซสเซอร์ Document AI

vars

วางรหัสโปรเจ็กต์ GCP และรหัสโปรเซสเซอร์จากขั้นตอนที่ 4 บันทึก Notebook

7. แยกและแสดงภาพเอนทิตี

ตอนนี้คุณสามารถดึงข้อมูลเอนทิตีที่จัดรูปแบบสคีมาจากใบแจ้งหนี้และคะแนนความเชื่อมั่นที่เกี่ยวข้องได้แล้ว ออบเจ็กต์การตอบกลับของเอกสารมีรายการเอนทิตี อ่านเพิ่มเติมเกี่ยวกับเอนทิตีที่จัดรูปแบบตามสคีมาได้ในคู่มือเริ่มใช้งานฉบับย่อของโปรแกรมแยกวิเคราะห์ใบแจ้งหนี้

เรียกใช้เซลล์ทั้งหมดในสมุดบันทึก แล้วเลื่อนลงไปที่เอาต์พุตแบบตาราง โค้ดก่อนหน้านี้จะวนซ้ำผ่านแต่ละเอนทิตีและสร้าง Pandas DataFrame ด้วยผลลัพธ์ โต๊ะ

ตอนนี้ให้เลื่อนลงไปที่คอมโพเนนต์การแสดงภาพ การตอบกลับออบเจ็กต์เอกสารมีข้อมูลเลย์เอาต์เชิงพื้นที่สำหรับแต่ละหน้าในเอกสาร ด้านล่างนี้ ระบบจะใช้ข้อมูลเลย์เอาต์ในช่องแบบฟอร์มแต่ละช่องเพื่อวาดกรอบล้อมรอบบนรูปภาพ ข้อมูลนี้สามารถใช้เพื่อผสานรวม Document AI เข้ากับแอปพลิเคชันส่วนหน้าได้

polys

8. ขอแสดงความยินดี

ขอแสดงความยินดี คุณใช้โซลูชัน Document AI สำหรับการจัดซื้อเพื่อดึงข้อมูลจากใบแจ้งหนี้เรียบร้อยแล้ว เราขอแนะนำให้คุณทดลองใช้แบบฟอร์มประเภทอื่นๆ

ล้างข้อมูล

หากต้องการหลีกเลี่ยงการเรียกเก็บเงินจากบัญชี Google Cloud สำหรับทรัพยากรที่ใช้ในบทแนะนำนี้ คุณอาจปิด Notebook หรือลบโปรเจ็กต์ GCP

การปิดอินสแตนซ์ AI Platform Notebooks

ทำตามวิธีการเหล่านี้เพื่อปิดอินสแตนซ์ Notebooks ของ AI Platform

การลบโปรเจ็กต์

วิธีที่ง่ายที่สุดในการยกเลิกการเรียกเก็บเงินคือการลบโปรเจ็กต์ที่คุณสร้างขึ้นสำหรับบทแนะนำ

วิธีลบโปรเจ็กต์

  1. ในคอนโซล GCP ให้ไปที่หน้าโปรเจ็กต์ หน้าโปรเจ็กต์
  2. ในรายการโปรเจ็กต์ ให้เลือกโปรเจ็กต์ที่ต้องการลบ แล้วคลิกลบ
  3. ในกล่องโต้ตอบ ให้พิมพ์รหัสโปรเจ็กต์ แล้วคลิกปิดเพื่อลบโปรเจ็กต์

ดูข้อมูลเพิ่มเติม

ใบอนุญาต

ผลงานนี้ได้รับอนุญาตภายใต้สัญญาอนุญาตครีเอทีฟคอมมอนส์สำหรับยอมรับสิทธิของผู้สร้าง (Creative Commons Attribution License) 2.0 แบบทั่วไป