1. סקירה כללית

מה זה Procurement Document AI?
ארגונים מנהלים צינורות גדולים של רכש, כולל אלפי חשבוניות, קבלות ומסמכים קשורים אחרים מדי שנה. אתם יכולים להשתמש ב-Procurement DocAI כדי לעבד בצורה חכמה את הנתונים הלא מובנים שלכם, כמו קובצי PDF, תמונות וטפסים בכתב יד, וכך לצמצם את העבודה הידנית שנדרשת במהלך מחזור החיים של הרכש. אפשר להפוך מסמכים לא מובנים כמו חשבוניות וקבלות לנתונים מובנים כדי להגדיל את היעילות התפעולית, לשפר את חוויית הלקוח ולספק מידע לתהליך קבלת ההחלטות.
ב-Codelab הזה נסביר איך להגדיר את Document AI Platform, לעבד חשבונית לדוגמה, לחלץ ישויות ולהציג אותן באופן חזותי ב-AI Platform Notebook.
מה תלמדו
- איך מתחילים להשתמש בפלטפורמת Document AI
- חילוץ ישויות עם סכימה באמצעות פתרון Procurement DocAI
- יצירה והתאמה אישית של מופע של 'שירות ניסוי ופיתוח של AI Platform'
מה תצטרכו
סקר
איך תשתמשו במדריך הזה?
איך היית מדרג את חוויית השימוש שלך ב-Python?
איזה דירוג מתאים לדעתך לחוויית השימוש שלך בשירותי Google Cloud?
2. הגדרה ודרישות
הגדרת סביבה בקצב אישי
- נכנסים אל Cloud Console ויוצרים פרויקט חדש או משתמשים בפרויקט קיים. (אם עדיין אין לכם חשבון Gmail או G Suite, אתם צריכים ליצור חשבון).



חשוב לזכור את מזהה הפרויקט, שהוא שם ייחודי בכל הפרויקטים ב-Google Cloud. (השם שלך למעלה כבר תפוס ולא יפעל בשבילך, מצטערים!). בהמשך תצטרכו לספק את המזהה הזה כ-PROJECT_ID.
- לאחר מכן, כדי להשתמש במשאבים של Google Cloud, צריך להפעיל את החיוב במסוף Cloud.
חשוב לפעול לפי ההוראות שבקטע 'ניקוי'. בקטע הזה מוסבר איך להשבית משאבים כדי שלא תחויבו אחרי שתסיימו את המדריך הזה. משתמשים חדשים ב-Google Cloud זכאים לתוכנית תקופת ניסיון בחינם בשווי 300$.
3. הפעלת Cloud Document AI API
כדי להתחיל להשתמש ב-Document AI, צריך להפעיל את ה-API. פותחים את מסוף Cloud בדפדפן.
- לוחצים על תפריט הניווט ☰ > APIs & Services (ממשקי API ושירותים) > Library (ספרייה).

- חפשו את Document AI API, ואז לחצו על Enable כדי להשתמש ב-API בפרויקט Google Cloud.
4. יצירה ובדיקה של מעבד
כדי להשתמש במעבד Form Parser בפלטפורמת Document AI ב-AI Platform לצורך המדריך הזה, צריך קודם ליצור מופע שלו.
- במסוף, עוברים אל Document AI Platform Overview.
- לוחצים על Create Processor (יצירת מעבד) ובוחרים באפשרות Invoice Parser (כלי לניתוח חשבוניות)
. - מציינים את שם המעבד ובוחרים את האזור מהרשימה.
- לוחצים על יצירה כדי ליצור את המעבד.
- מעתיקים את מזהה המעבד. תצטרכו להשתמש בערך הזה בקוד בהמשך.
(אופציונלי) אפשר להעלות מסמך כדי לבדוק את המעבד במסוף. לוחצים על העלאת מסמך ובוחרים טופס לניתוח. אם אין לכם טופס זמין, אתם יכולים להוריד את הטופס לדוגמה הזה ולהשתמש בו.

הפלט אמור להיראות כך: 
5. יצירת Notebook ב-AI Platform
עוברים אל AI Platform Notebooks section ב-Cloud Console ולוחצים על New Instance. לאחר מכן בוחרים את סוג המכונה העדכני ביותר של Python:

משתמשים באפשרויות ברירת המחדל ולוחצים על יצירה. אחרי שהמופע נוצר, בוחרים באפשרות Open JupyterLab.
6. קבלת קוד לדוגמה
לייבא ישירות את הקוד לדוגמה מ-מאגר GitHub של Document AI Notebooks. במחברת, עוברים אל Git > Clone a Repository בתפריט העליון או לוחצים על סמל Git: 
מדביקים את כתובת ה-URL הבאה של המאגר:
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
אחרי שהמאגר משוכפל, לוחצים על התיקייה documentai-notebooks/specialized/ ופותחים את מחברת specialized_form_parser.ipynb. מחפשים את התא שבו מצהירים על מזהה הפרויקט ב-GCP ומזהה המעבד של Document AI.

מדביקים את מזהה הפרויקט ב-GCP ואת מזהה המעבד משלב 4. שומרים את ה-notebook.
7. חילוץ הישויות והצגתן באופן חזותי
עכשיו אפשר לחלץ מהחשבוניות את הישויות המתוכננות ואת ציוני המהימנות התואמים שלהן. אובייקט התגובה Document מכיל רשימה של ישויות. מידע נוסף על ישויות עם סכימה זמין במדריך למתחילים עם הכלי לניתוח חשבוניות.
מריצים את כל התאים ב-notebook וגוללים למטה אל הפלט הטבלאי. הקוד הקודם מבצע איטרציה על כל ישות ויוצר Pandas DataFrame עם התוצאות. 
עכשיו גוללים למטה לרכיב התצוגה החזותית. תגובת אובייקט המסמך מכילה מידע על הפריסה המרחבית של כל דף במסמך. בהמשך, פרטי הפריסה של כל שדה בטופס משמשים לשרטוט תיבות תוחמות בתמונה. אפשר להשתמש בנתונים האלה כדי לשלב את Document AI באפליקציית frontend.

8. מזל טוב
ברכות, הצלחתם להשתמש בפתרון Procurment Document AI כדי לחלץ נתונים מחשבונית. מומלץ להתנסות בסוגים אחרים של טפסים.
ניקוי
כדי להימנע מחיובים בחשבון Google Cloud בגלל השימוש במשאבים שנעשה במסגרת המדריך הזה, אפשר להשבית את מחברת ה-Jupyter או למחוק את הפרויקט ב-GCP.
השבתת מכונה של 'שירות ניסוי ופיתוח של AI Platform'
כדי להשבית מופע של AI Platform Notebooks, פועלים לפי ההוראות הבאות.
מחיקת הפרויקט
הדרך הקלה ביותר לבטל את החיוב היא למחוק את הפרויקט שיצרתם בשביל המדריך.
כדי למחוק את הפרויקט:
- במסוף GCP, נכנסים לדף Projects. דף הפרויקטים
- ברשימת הפרויקטים, בוחרים את הפרויקט שרוצים למחוק ולוחצים על מחיקה.
- כדי למחוק את הפרויקט, כותבים את מזהה הפרויקט בתיבת הדו-שיח ולוחצים על Shut down.