ใช้ AI เอกสารการจัดซื้อเพื่อแยกวิเคราะห์ใบแจ้งหนี้โดยใช้ AI Platform Notebooks
เกี่ยวกับ Codelab นี้
1 ภาพรวม
AI ของเอกสารการสั่งซื้อคืออะไร
องค์กรต่างๆ ต้องจัดการไปป์ไลน์การจัดซื้อขนาดใหญ่ ซึ่งรวมถึงใบแจ้งหนี้ ใบเสร็จ และเอกสารอื่นๆ ที่เกี่ยวข้องหลายพันรายการในแต่ละปี ใช้ Procurement DocAI เพื่อประมวลผล "ข้อมูลมืด" อย่างชาญฉลาด เช่น PDF, รูปภาพ และแบบฟอร์มที่เขียนด้วยมือ เพื่อลดค่าใช้จ่ายเพิ่มเติมที่ต้องดำเนินการด้วยตนเองในวงจรการจัดซื้อ บันทึกข้อมูลการจัดซื้อโดยอัตโนมัติในวงกว้างด้วยการเปลี่ยนเอกสารที่ไม่มีโครงสร้าง เช่น ใบแจ้งหนี้และใบเสร็จ เป็น Structured Data เพื่อเพิ่มประสิทธิภาพการดําเนินงาน ปรับปรุงประสบการณ์ของลูกค้า และใช้เป็นข้อมูลในการตัดสินใจ
ใน Codelab นี้ เราจะอธิบายวิธีตั้งค่าแพลตฟอร์ม Document AI, ประมวลผลใบแจ้งหนี้ตัวอย่าง, ดึงข้อมูลและแสดงเอนทิตีเป็นภาพใน AI Platform Notebook
สิ่งที่คุณจะได้เรียนรู้
- วิธีเริ่มต้นใช้งาน Document AI Platform
- ดึงข้อมูลเอนทิตีที่มีสคีมาโดยใช้โซลูชัน Procurement DocAI
- สร้างและปรับแต่งอินสแตนซ์ AI Platform Notebooks
สิ่งที่ต้องมี
แบบสํารวจ
คุณจะใช้บทแนะนำนี้อย่างไร
คุณจะให้คะแนนประสบการณ์การใช้งาน Python เท่าไร
คุณจะให้คะแนนประสบการณ์การใช้งานบริการ Google Cloud เท่าใด
2 การตั้งค่าและข้อกําหนด
การตั้งค่าสภาพแวดล้อมด้วยตนเอง
- ลงชื่อเข้าใช้ Cloud Console แล้วสร้างโปรเจ็กต์ใหม่หรือใช้โปรเจ็กต์ที่มีอยู่ซ้ำ (หากยังไม่มีบัญชี Gmail หรือ G Suite คุณต้องสร้างบัญชี)
โปรดจดจำรหัสโปรเจ็กต์ ซึ่งเป็นชื่อที่ไม่ซ้ำกันสำหรับโปรเจ็กต์ Google Cloud ทั้งหมด (ขออภัย ชื่อของคุณข้างต้นมีผู้ใช้แล้ว) คุณต้องระบุรหัสนี้ในภายหลังเป็น PROJECT_ID
- ถัดไป คุณต้องเปิดใช้การเรียกเก็บเงินใน Cloud Console เพื่อใช้ทรัพยากร Google Cloud
โปรดทำตามวิธีการในส่วน "การล้างข้อมูล" ส่วนนี้จะแนะนำวิธีปิดทรัพยากรเพื่อไม่ให้เกิดการเรียกเก็บเงินหลังจากบทแนะนำนี้ ผู้ใช้ใหม่ของ Google Cloud มีสิทธิ์เข้าร่วมโปรแกรมช่วงทดลองใช้ฟรีมูลค่า$300 USD
3 เปิดใช้ Cloud Document AI API
คุณต้องเปิดใช้ API ก่อนจึงจะเริ่มใช้ Document AI ได้ เปิด Cloud Console ในเบราว์เซอร์
- คลิกเมนูการนำทาง ☰ > API และบริการ > คลัง
- ค้นหา "Document AI API" แล้วคลิกเปิดใช้เพื่อใช้ API ในโปรเจ็กต์ Google Cloud
4 สร้างและทดสอบโปรแกรมประมวลผล
คุณต้องสร้างอินสแตนซ์ของตัวประมวลผลโปรแกรมแยกวิเคราะห์แบบฟอร์มก่อนเพื่อใช้ใน Document AI Platform สำหรับบทแนะนำนี้
- ในคอนโซล ให้ไปที่ภาพรวมแพลตฟอร์ม AI ของเอกสาร
- คลิกสร้างตัวประมวลผล แล้วเลือกโปรแกรมแยกวิเคราะห์ใบแจ้งหนี้
- ระบุชื่อผู้ประมวลผลและเลือกภูมิภาคจากรายการ
- คลิกสร้างเพื่อสร้างโปรแกรมประมวลผล
- คัดลอกรหัสผู้ประมวลผล คุณต้องใช้ในโค้ดในภายหลัง
(ไม่บังคับ) คุณสามารถทดสอบเครื่องประมวลผลในคอนโซลได้โดยอัปโหลดเอกสาร คลิกอัปโหลดเอกสาร แล้วเลือกแบบฟอร์มที่จะแยกวิเคราะห์ คุณสามารถดาวน์โหลดและใช้แบบฟอร์มตัวอย่างนี้ได้หากไม่มีแบบฟอร์มที่ใช้
เอาต์พุตควรมีลักษณะดังนี้
5 สร้าง AI Platform Notebook
ไปที่ส่วน AI Platform Notebooks ของ Cloud Console แล้วคลิกอินสแตนซ์ใหม่ จากนั้นเลือกประเภทอินสแตนซ์ Python เวอร์ชันล่าสุด ดังนี้
ใช้ตัวเลือกเริ่มต้น แล้วคลิกสร้าง เมื่อสร้างอินสแตนซ์แล้ว ให้เลือกเปิด JupyterLab
6 รับโค้ดตัวอย่าง
นําเข้าโค้ดตัวอย่างจาก Github Repo ของ Document AI Notebook โดยตรง ในโน้ตบุ๊ก ให้ไปที่ Git > โคลนที่เก็บข้อมูลในเมนูด้านบน หรือคลิกไอคอน Git:
วาง URL ของที่เก็บต่อไปนี้
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
เมื่อโคลนที่เก็บเรียบร้อยแล้ว ให้คลิกผ่านไดเรกทอรี documentai-notebooks/specialized/ แล้วเปิดโน้ตบุ๊ก specialized_form_parser.ipynb
ค้นหาเซลล์ที่มีการประกาศรหัสโปรเจ็กต์ GCP และรหัสโปรแกรมประมวลผล AI ของเอกสาร
วางรหัสโปรเจ็กต์ GCP และรหัสผู้ประมวลผลจากขั้นตอนที่ 4 บันทึกสมุดบันทึก
7 ดึงข้อมูลและแสดงเอนทิตีเป็นภาพ
ตอนนี้คุณสามารถดึงข้อมูลเอนทิตีสคีมาจากใบแจ้งหนี้และคะแนนความเชื่อมั่นที่เกี่ยวข้องได้แล้ว ออบเจ็กต์คำตอบเอกสารจะมีรายการเอนทิตี หากต้องการอ่านเพิ่มเติมเกี่ยวกับเอนทิตีสคีมา ให้อ่านคู่มือเริ่มต้นใช้งานของโปรแกรมแยกวิเคราะห์ใบแจ้งหนี้
เรียกใช้ทุกเซลล์ในสมุดบันทึก แล้วเลื่อนลงไปที่เอาต์พุตตาราง โค้ดก่อนหน้าจะวนผ่านเอนทิตีแต่ละรายการและสร้าง Pandas DataFrame ด้วยผลลัพธ์
จากนั้นเลื่อนลงไปที่คอมโพเนนต์การแสดงภาพ การตอบกลับออบเจ็กต์เอกสารจะมีข้อมูลเลย์เอาต์เชิงพื้นที่ของแต่ละหน้าในเอกสาร ด้านล่างนี้ ข้อมูลเลย์เอาต์ในช่องแบบฟอร์มแต่ละช่องใช้วาดกล่องขอบเขตในรูปภาพ ข้อมูลนี้สามารถใช้เพื่อผสานรวม Document AI เข้ากับแอปพลิเคชันส่วนหน้า
8 ขอแสดงความยินดี
ยินดีด้วย คุณใช้โซลูชัน AI สำหรับเอกสารการสั่งซื้อเพื่อดึงข้อมูลจากใบแจ้งหนี้เรียบร้อยแล้ว เราขอแนะนำให้คุณลองใช้แบบฟอร์มประเภทอื่นๆ
ล้างข้อมูล
โปรดปิดเครื่องโน้ตบุ๊คหรือลบโปรเจ็กต์ GCP เพื่อเลี่ยงไม่ให้เกิดการเรียกเก็บเงินกับบัญชี Google Cloud สำหรับทรัพยากรที่ใช้ในบทแนะนำนี้
การปิดอินสแตนซ์ AI Platform Notebooks
ทําตามวิธีการเหล่านี้เพื่อปิดอินสแตนซ์ AI Platform Notebooks
การลบโปรเจ็กต์
วิธีที่ง่ายที่สุดในการหยุดการเรียกเก็บเงินคือการลบโปรเจ็กต์ที่คุณสร้างสำหรับบทแนะนำ
วิธีลบโปรเจ็กต์
- ในคอนโซล GCP ให้ไปที่หน้าโปรเจ็กต์ หน้าโปรเจ็กต์
- ในรายการโปรเจ็กต์ ให้เลือกโปรเจ็กต์ที่ต้องการลบ แล้วคลิกลบ
- ในกล่องโต้ตอบ ให้พิมพ์รหัสโปรเจ็กต์ แล้วคลิกปิดเพื่อลบโปรเจ็กต์