ใช้ AI เอกสารการจัดซื้อเพื่อแยกวิเคราะห์ใบแจ้งหนี้โดยใช้สมุดบันทึก AI Platform

ใช้ AI เอกสารการจัดซื้อเพื่อแยกวิเคราะห์ใบแจ้งหนี้โดยใช้ AI Platform Notebooks

เกี่ยวกับ Codelab นี้

subjectอัปเดตล่าสุดเมื่อ ม.ค. 24, 2022
account_circleเขียนโดย Anu Srivastava

1 ภาพรวม

c65b9ae04aa1853.png

AI ของเอกสารการสั่งซื้อคืออะไร

องค์กรต่างๆ ต้องจัดการไปป์ไลน์การจัดซื้อขนาดใหญ่ ซึ่งรวมถึงใบแจ้งหนี้ ใบเสร็จ และเอกสารอื่นๆ ที่เกี่ยวข้องหลายพันรายการในแต่ละปี ใช้ Procurement DocAI เพื่อประมวลผล "ข้อมูลมืด" อย่างชาญฉลาด เช่น PDF, รูปภาพ และแบบฟอร์มที่เขียนด้วยมือ เพื่อลดค่าใช้จ่ายเพิ่มเติมที่ต้องดำเนินการด้วยตนเองในวงจรการจัดซื้อ บันทึกข้อมูลการจัดซื้อโดยอัตโนมัติในวงกว้างด้วยการเปลี่ยนเอกสารที่ไม่มีโครงสร้าง เช่น ใบแจ้งหนี้และใบเสร็จ เป็น Structured Data เพื่อเพิ่มประสิทธิภาพการดําเนินงาน ปรับปรุงประสบการณ์ของลูกค้า และใช้เป็นข้อมูลในการตัดสินใจ

ใน Codelab นี้ เราจะอธิบายวิธีตั้งค่าแพลตฟอร์ม Document AI, ประมวลผลใบแจ้งหนี้ตัวอย่าง, ดึงข้อมูลและแสดงเอนทิตีเป็นภาพใน AI Platform Notebook

สิ่งที่คุณจะได้เรียนรู้

  • วิธีเริ่มต้นใช้งาน Document AI Platform
  • ดึงข้อมูลเอนทิตีที่มีสคีมาโดยใช้โซลูชัน Procurement DocAI
  • สร้างและปรับแต่งอินสแตนซ์ AI Platform Notebooks

สิ่งที่ต้องมี

  • โปรเจ็กต์ Google Cloud
  • เบราว์เซอร์ เช่น Chrome หรือ Firefox
  • ความรู้เกี่ยวกับ Python 3

แบบสํารวจ

คุณจะใช้บทแนะนำนี้อย่างไร

คุณจะให้คะแนนประสบการณ์การใช้งาน Python เท่าไร

คุณจะให้คะแนนประสบการณ์การใช้งานบริการ Google Cloud เท่าใด

2 การตั้งค่าและข้อกําหนด

การตั้งค่าสภาพแวดล้อมด้วยตนเอง

  1. ลงชื่อเข้าใช้ Cloud Console แล้วสร้างโปรเจ็กต์ใหม่หรือใช้โปรเจ็กต์ที่มีอยู่ซ้ำ (หากยังไม่มีบัญชี Gmail หรือ G Suite คุณต้องสร้างบัญชี)

โปรดจดจำรหัสโปรเจ็กต์ ซึ่งเป็นชื่อที่ไม่ซ้ำกันสำหรับโปรเจ็กต์ Google Cloud ทั้งหมด (ขออภัย ชื่อของคุณข้างต้นมีผู้ใช้แล้ว) คุณต้องระบุรหัสนี้ในภายหลังเป็น PROJECT_ID

  1. ถัดไป คุณต้องเปิดใช้การเรียกเก็บเงินใน Cloud Console เพื่อใช้ทรัพยากร Google Cloud

โปรดทำตามวิธีการในส่วน "การล้างข้อมูล" ส่วนนี้จะแนะนำวิธีปิดทรัพยากรเพื่อไม่ให้เกิดการเรียกเก็บเงินหลังจากบทแนะนำนี้ ผู้ใช้ใหม่ของ Google Cloud มีสิทธิ์เข้าร่วมโปรแกรมช่วงทดลองใช้ฟรีมูลค่า$300 USD

3 เปิดใช้ Cloud Document AI API

คุณต้องเปิดใช้ API ก่อนจึงจะเริ่มใช้ Document AI ได้ เปิด Cloud Console ในเบราว์เซอร์

  1. คลิกเมนูการนำทาง ☰ > API และบริการ > คลัง Search API
  2. ค้นหา "Document AI API" แล้วคลิกเปิดใช้เพื่อใช้ API ในโปรเจ็กต์ Google Cloud

4 สร้างและทดสอบโปรแกรมประมวลผล

คุณต้องสร้างอินสแตนซ์ของตัวประมวลผลโปรแกรมแยกวิเคราะห์แบบฟอร์มก่อนเพื่อใช้ใน Document AI Platform สำหรับบทแนะนำนี้

  1. ในคอนโซล ให้ไปที่ภาพรวมแพลตฟอร์ม AI ของเอกสาร
  2. คลิกสร้างตัวประมวลผล แล้วเลือกโปรแกรมแยกวิเคราะห์ใบแจ้งหนี้โปรเซสเซอร์
  3. ระบุชื่อผู้ประมวลผลและเลือกภูมิภาคจากรายการ
  4. คลิกสร้างเพื่อสร้างโปรแกรมประมวลผล
  5. คัดลอกรหัสผู้ประมวลผล คุณต้องใช้ในโค้ดในภายหลัง

(ไม่บังคับ) คุณสามารถทดสอบเครื่องประมวลผลในคอนโซลได้โดยอัปโหลดเอกสาร คลิกอัปโหลดเอกสาร แล้วเลือกแบบฟอร์มที่จะแยกวิเคราะห์ คุณสามารถดาวน์โหลดและใช้แบบฟอร์มตัวอย่างนี้ได้หากไม่มีแบบฟอร์มที่ใช้

ใบแจ้งหนี้

เอาต์พุตควรมีลักษณะดังนี้ ใบแจ้งหนี้ที่แยกวิเคราะห์แล้ว

5 สร้าง AI Platform Notebook

ไปที่ส่วน AI Platform Notebooks ของ Cloud Console แล้วคลิกอินสแตนซ์ใหม่ จากนั้นเลือกประเภทอินสแตนซ์ Python เวอร์ชันล่าสุด ดังนี้

a81c82876c6c16f9.png

ใช้ตัวเลือกเริ่มต้น แล้วคลิกสร้าง เมื่อสร้างอินสแตนซ์แล้ว ให้เลือกเปิด JupyterLab

6 รับโค้ดตัวอย่าง

นําเข้าโค้ดตัวอย่างจาก Github Repo ของ Document AI Notebook โดยตรง ในโน้ตบุ๊ก ให้ไปที่ Git > โคลนที่เก็บข้อมูลในเมนูด้านบน หรือคลิกไอคอน Git: Git

วาง URL ของที่เก็บต่อไปนี้

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

เมื่อโคลนที่เก็บเรียบร้อยแล้ว ให้คลิกผ่านไดเรกทอรี documentai-notebooks/specialized/ แล้วเปิดโน้ตบุ๊ก specialized_form_parser.ipynb ค้นหาเซลล์ที่มีการประกาศรหัสโปรเจ็กต์ GCP และรหัสโปรแกรมประมวลผล AI ของเอกสาร

vars

วางรหัสโปรเจ็กต์ GCP และรหัสผู้ประมวลผลจากขั้นตอนที่ 4 บันทึกสมุดบันทึก

7 ดึงข้อมูลและแสดงเอนทิตีเป็นภาพ

ตอนนี้คุณสามารถดึงข้อมูลเอนทิตีสคีมาจากใบแจ้งหนี้และคะแนนความเชื่อมั่นที่เกี่ยวข้องได้แล้ว ออบเจ็กต์คำตอบเอกสารจะมีรายการเอนทิตี หากต้องการอ่านเพิ่มเติมเกี่ยวกับเอนทิตีสคีมา ให้อ่านคู่มือเริ่มต้นใช้งานของโปรแกรมแยกวิเคราะห์ใบแจ้งหนี้

เรียกใช้ทุกเซลล์ในสมุดบันทึก แล้วเลื่อนลงไปที่เอาต์พุตตาราง โค้ดก่อนหน้าจะวนผ่านเอนทิตีแต่ละรายการและสร้าง Pandas DataFrame ด้วยผลลัพธ์ โต๊ะ

จากนั้นเลื่อนลงไปที่คอมโพเนนต์การแสดงภาพ การตอบกลับออบเจ็กต์เอกสารจะมีข้อมูลเลย์เอาต์เชิงพื้นที่ของแต่ละหน้าในเอกสาร ด้านล่างนี้ ข้อมูลเลย์เอาต์ในช่องแบบฟอร์มแต่ละช่องใช้วาดกล่องขอบเขตในรูปภาพ ข้อมูลนี้สามารถใช้เพื่อผสานรวม Document AI เข้ากับแอปพลิเคชันส่วนหน้า

polys

8 ขอแสดงความยินดี

ยินดีด้วย คุณใช้โซลูชัน AI สำหรับเอกสารการสั่งซื้อเพื่อดึงข้อมูลจากใบแจ้งหนี้เรียบร้อยแล้ว เราขอแนะนำให้คุณลองใช้แบบฟอร์มประเภทอื่นๆ

ล้างข้อมูล

โปรดปิดเครื่องโน้ตบุ๊คหรือลบโปรเจ็กต์ GCP เพื่อเลี่ยงไม่ให้เกิดการเรียกเก็บเงินกับบัญชี Google Cloud สำหรับทรัพยากรที่ใช้ในบทแนะนำนี้

การปิดอินสแตนซ์ AI Platform Notebooks

ทําตามวิธีการเหล่านี้เพื่อปิดอินสแตนซ์ AI Platform Notebooks

การลบโปรเจ็กต์

วิธีที่ง่ายที่สุดในการหยุดการเรียกเก็บเงินคือการลบโปรเจ็กต์ที่คุณสร้างสำหรับบทแนะนำ

วิธีลบโปรเจ็กต์

  1. ในคอนโซล GCP ให้ไปที่หน้าโปรเจ็กต์ หน้าโปรเจ็กต์
  2. ในรายการโปรเจ็กต์ ให้เลือกโปรเจ็กต์ที่ต้องการลบ แล้วคลิกลบ
  3. ในกล่องโต้ตอบ ให้พิมพ์รหัสโปรเจ็กต์ แล้วคลิกปิดเพื่อลบโปรเจ็กต์

ดูข้อมูลเพิ่มเติม

ใบอนุญาต

ผลงานนี้ได้รับอนุญาตภายใต้สัญญาอนุญาตครีเอทีฟคอมมอนส์สำหรับยอมรับสิทธิของผู้สร้าง (Creative Commons Attribution License) 2.0 ทั่วไป