איך משתמשים ב-AI של מסמכי רכש כדי לנתח את החשבוניות באמצעות notebooks של AI Platform

1. סקירה כללית

c65b9ae04aa1853.png

מה זה Procurement Document AI?

ארגונים מנהלים צינורות גדולים של רכש, כולל אלפי חשבוניות, קבלות ומסמכים קשורים אחרים מדי שנה. אתם יכולים להשתמש ב-Procurement DocAI כדי לעבד בצורה חכמה את הנתונים הלא מובנים שלכם, כמו קובצי PDF, תמונות וטפסים בכתב יד, וכך לצמצם את העבודה הידנית שנדרשת במהלך מחזור החיים של הרכש. אפשר להפוך מסמכים לא מובנים כמו חשבוניות וקבלות לנתונים מובנים כדי להגדיל את היעילות התפעולית, לשפר את חוויית הלקוח ולספק מידע לתהליך קבלת ההחלטות.

ב-Codelab הזה נסביר איך להגדיר את Document AI Platform, לעבד חשבונית לדוגמה, לחלץ ישויות ולהציג אותן באופן חזותי ב-AI Platform Notebook.

מה תלמדו

  • איך מתחילים להשתמש בפלטפורמת Document AI
  • חילוץ ישויות עם סכימה באמצעות פתרון Procurement DocAI
  • יצירה והתאמה אישית של מופע של 'שירות ניסוי ופיתוח של AI Platform'

מה תצטרכו

  • פרויקט ב-Google Cloud
  • דפדפן, כמו Chrome או Firefox
  • ידע ב-Python 3

סקר

איך תשתמשו במדריך הזה?

רק קוראים את המידע קוראים את המידע ומבצעים את התרגילים

איך היית מדרג את חוויית השימוש שלך ב-Python?

מתחילים ביניים מומחים

איזה דירוג מתאים לדעתך לחוויית השימוש שלך בשירותי Google Cloud?

מתחילים ביניים מומחים

2. הגדרה ודרישות

הגדרת סביבה בקצב אישי

  1. נכנסים אל Cloud Console ויוצרים פרויקט חדש או משתמשים בפרויקט קיים. (אם עדיין אין לכם חשבון Gmail או G Suite, אתם צריכים ליצור חשבון).

חשוב לזכור את מזהה הפרויקט, שהוא שם ייחודי בכל הפרויקטים ב-Google Cloud. (השם שלך למעלה כבר תפוס ולא יפעל בשבילך, מצטערים!). בהמשך תצטרכו לספק את המזהה הזה כ-PROJECT_ID.

  1. לאחר מכן, כדי להשתמש במשאבים של Google Cloud, צריך להפעיל את החיוב במסוף Cloud.

חשוב לפעול לפי ההוראות שבקטע 'ניקוי'. בקטע הזה מוסבר איך להשבית משאבים כדי שלא תחויבו אחרי שתסיימו את המדריך הזה. משתמשים חדשים ב-Google Cloud זכאים לתוכנית תקופת ניסיון בחינם בשווי 300$.

3. הפעלת Cloud Document AI API

כדי להתחיל להשתמש ב-Document AI, צריך להפעיל את ה-API. פותחים את מסוף Cloud בדפדפן.

  1. לוחצים על תפריט הניווט ☰ > APIs & Services (ממשקי API ושירותים) > Library (ספרייה). Search API
  2. חפשו את Document AI API, ואז לחצו על Enable כדי להשתמש ב-API בפרויקט Google Cloud.

4. יצירה ובדיקה של מעבד

כדי להשתמש במעבד Form Parser בפלטפורמת Document AI ב-AI Platform לצורך המדריך הזה, צריך קודם ליצור מופע שלו.

  1. במסוף, עוברים אל Document AI Platform Overview.
  2. לוחצים על Create Processor (יצירת מעבד) ובוחרים באפשרות Invoice Parser (כלי לניתוח חשבוניות)מעבדים.
  3. מציינים את שם המעבד ובוחרים את האזור מהרשימה.
  4. לוחצים על יצירה כדי ליצור את המעבד.
  5. מעתיקים את מזהה המעבד. תצטרכו להשתמש בערך הזה בקוד בהמשך.

(אופציונלי) אפשר להעלות מסמך כדי לבדוק את המעבד במסוף. לוחצים על העלאת מסמך ובוחרים טופס לניתוח. אם אין לכם טופס זמין, אתם יכולים להוריד את הטופס לדוגמה הזה ולהשתמש בו.

חשבונית

הפלט אמור להיראות כך: חשבונית מנותחת

5. יצירת Notebook ב-AI Platform

עוברים אל AI Platform Notebooks section ב-Cloud Console ולוחצים על New Instance. לאחר מכן בוחרים את סוג המכונה העדכני ביותר של Python:

a81c82876c6c16f9.png

משתמשים באפשרויות ברירת המחדל ולוחצים על יצירה. אחרי שהמופע נוצר, בוחרים באפשרות Open JupyterLab.

6. קבלת קוד לדוגמה

לייבא ישירות את הקוד לדוגמה מ-מאגר GitHub של Document AI Notebooks. במחברת, עוברים אל Git > Clone a Repository בתפריט העליון או לוחצים על סמל Git: Git

מדביקים את כתובת ה-URL הבאה של המאגר:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

אחרי שהמאגר משוכפל, לוחצים על התיקייה documentai-notebooks/specialized/‎ ופותחים את מחברת specialized_form_parser.ipynb. מחפשים את התא שבו מצהירים על מזהה הפרויקט ב-GCP ומזהה המעבד של Document AI.

vars

מדביקים את מזהה הפרויקט ב-GCP ואת מזהה המעבד משלב 4. שומרים את ה-notebook.

7. חילוץ הישויות והצגתן באופן חזותי

עכשיו אפשר לחלץ מהחשבוניות את הישויות המתוכננות ואת ציוני המהימנות התואמים שלהן. אובייקט התגובה Document מכיל רשימה של ישויות. מידע נוסף על ישויות עם סכימה זמין במדריך למתחילים עם הכלי לניתוח חשבוניות.

מריצים את כל התאים ב-notebook וגוללים למטה אל הפלט הטבלאי. הקוד הקודם מבצע איטרציה על כל ישות ויוצר Pandas DataFrame עם התוצאות. שולחן

עכשיו גוללים למטה לרכיב התצוגה החזותית. תגובת אובייקט המסמך מכילה מידע על הפריסה המרחבית של כל דף במסמך. בהמשך, פרטי הפריסה של כל שדה בטופס משמשים לשרטוט תיבות תוחמות בתמונה. אפשר להשתמש בנתונים האלה כדי לשלב את Document AI באפליקציית frontend.

polys

8. מזל טוב

ברכות, הצלחתם להשתמש בפתרון Procurment Document AI כדי לחלץ נתונים מחשבונית. מומלץ להתנסות בסוגים אחרים של טפסים.

ניקוי

כדי להימנע מחיובים בחשבון Google Cloud בגלל השימוש במשאבים שנעשה במסגרת המדריך הזה, אפשר להשבית את מחברת ה-Jupyter או למחוק את הפרויקט ב-GCP.

השבתת מכונה של 'שירות ניסוי ופיתוח של AI Platform'

כדי להשבית מופע של AI Platform Notebooks, פועלים לפי ההוראות הבאות.

מחיקת הפרויקט

הדרך הקלה ביותר לבטל את החיוב היא למחוק את הפרויקט שיצרתם בשביל המדריך.

כדי למחוק את הפרויקט:

  1. במסוף GCP, נכנסים לדף Projects. דף הפרויקטים
  2. ברשימת הפרויקטים, בוחרים את הפרויקט שרוצים למחוק ולוחצים על מחיקה.
  3. כדי למחוק את הפרויקט, כותבים את מזהה הפרויקט בתיבת הדו-שיח ולוחצים על Shut down.

מידע נוסף

רישיון

העבודה הזו בשימוש במסגרת רישיון Creative Commons שמותנה בייחוס כללי מגרסה 2.0.