1. מבוא
Document AI API הוא פתרון להבנת מסמכים שלוקח נתונים לא מובנים, כמו מסמכים, אימיילים ועוד, ומקל על הבנה, ניתוח וצריכה של הנתונים.
בדיקה אנושית יכולה לשפר את רמת הדיוק של עיבוד המסמכים, כמו גם בדיקה אנושית. בדיקה אנושית יכולה לשפר את הדיוק ולעזור לעסקים לבחון תחזיות באמצעות כלים ייעודיים שמאפשרים את הבדיקות האלה. בשיעור ה-Lab הזה תגדירו ותבדקו מעבד הוצאות באמצעות בדיקה אנושית, כדי לאמת את התוצאות מהמעבד באמצעות כלי ההגדרה והניהול האנושיים שבלולאה.
דרישות מוקדמות
ה-Codelab הזה מתבסס על תוכן שמוצג ב-Document AI Codelabs אחרים.
מומלץ לבצע את הפעולות הבאות ב-Codelabs לפני שממשיכים.
- זיהוי תווים אופטי (OCR) עם Document AI (Python)
- ניתוח טפסים באמצעות Document AI (Python)
- מעבדים מומחים עם Document AI (Python)
מה תלמדו
- הגדרת בדיקה אנושית למעבד מידע.
- יצירת מאגר משאבים של משתמשים לבדיקה אנושית.
- יוצרים משימת בדיקה של בודק אנושי.
- להקצות משימת בדיקה אנושית למשתמש.
- תבצעו בדיקה אנושית של מסמך.
מה צריך להכין
2. בתהליך ההגדרה
פלטפורמת ה-Codelab הזו מבוססת על ההנחה שהשלמת את השלבים להגדרת Document AI שמפורטים ב-Introductionory Codelab.
לפני שממשיכים, צריך לבצע את הפעולות הבאות:
תצטרכו גם להפעיל את Vertex AI API.
- בסרגל החיפוש שבחלק העליון של המסוף, מחפשים את Vertex AI API ואז לוחצים על Enable כדי להשתמש ב-API בפרויקט ב-Google Cloud.
- לחלופין, אפשר להפעיל את ה-API באמצעות הפקודה
gcloud
הבאה.
gcloud services enable aiplatform.googleapis.com
3. יצירת מעבד
קודם צריך ליצור מכונה של מעבד ההוצאות לשימוש בשיעור ה-Lab הזה.
- במסוף, עוברים אל Document AI Platform Overview
- לוחצים על יצירת מעבד מידע, גוללים למטה אל Specialized ובוחרים באפשרות מנתח הוצאות.
- נותנים לאזור את השם
codelab-expense-parser
(או משהו אחר שתזכרו) ובוחרים את האזור הקרוב ביותר מהרשימה. - לוחצים על יצירה כדי ליצור את המעבד.
- מעתיקים את מזהה המעבד. חובה להשתמש בה בקוד מאוחר יותר.
- ב-Cloud Shell, יוצרים קטגוריית אחסון עם השם
PROJECT_ID-hitl-results
:
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
- קישור של חשבון המשתמש לתפקיד Vertex AI Admin IAM בפרויקט שיעור ה-Lab
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin
4. הגדרת 'אדם שבלולאה'
במשימה הזו תגדירו בדיקה אנושית עבור מעבד ההוצאות שיצרתם קודם.
- במסוף, פותחים את תפריט הניווט ובוחרים באפשרות Document AI.
- לוחצים על AI-Human-in-the-loop.
- לוחצים על הסמל
codelab-expense-parser
כדי לפתוח את דף הבדיקה האנושית של מעבד המידע. - לוחצים על הגדרת אדם ב'לופ'.
- בוחרים מסנן ברמת המסמך.
- מגדירים את פס ההזזה ערך סף הסמך ל-50%.
- באפשרות מומחים, משאירים את האפשרות שימוש במומחים שלי.
- לוחצים על התיבה הנפתחת מאגר מומחים ואז על מאגר מומחים חדש.
- בשדה שם המאגר מזינים
Codelab HITL Pool
בתיבת הדו-שיח מאגר מומחים חדש. - מזינים את כתובת האימייל האישית שלכם עבור מנהלי המאגרים והמומחים.
- לוחצים על Create Pool.
הפעולה הזאת עשויה להימשך כמה דקות. אמור להישלח אליך אימייל מאת Vertex AI noreply-vertex@google.com
.
- משאירים את התיבה הקצאה אוטומטית לא מסומנת.
- לוחצים על תיבת הסימון בקטע אישור החיובים.
- לוחצים על מיקום ההוראות ומעתיקים במיקום האחסון: - לא כוללים את הקידומת
gs://
בנתיב
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
- ב-תוצאות מיקום, לוחצים על עיון ובוחרים את הקטגוריה של Cloud Storage שיצרתם קודם.
- לוחצים על בחירה.
- לוחצים על Save Configuration (שמירת ההגדרות האישיות).
במסוף תופיע עכשיו ההודעה הגדרת אדם בתוך הלולאה, והשלמת הפעולה תיקח כמה דקות.
- כשההגדרה תושלם, במסוף תוצג בקשה להפעיל את התכונה 'אדם שבלולאה'.
- יש ללחוץ על לחצן החלפת המצב כדי להפעיל.
- לאחר מכן לוחצים על הפעלה בתיבת הדו-שיח הקופצת.
העלאת טופס הוצאות לדוגמה
- יש לנו טופס לדוגמה שמאוחסן ב-Google Cloud Storage. ניתן להוריד את הקובץ באמצעות הלחצן או הפקודה הבאים:
gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
- לאחר הפעלת אדם בלולאה, לוחצים על הלחצן Upload Document (העלאת מסמך) ומעיינים במסמך לדוגמה שהורדתם.
- לוחצים על העלאה וממתינים להשלמת התהליך.
5. הקצאת פריט לבדיקה אנושית
- בדף הזה אמורים להופיע קישורים אל מסוף ניהול המאגר ואל מסוף מומחים. הקישורים האלה יופיעו גם באימייל שנשלח על ידי
Vertex AI noreply-vertex@google.com
.- הם צריכים להיראות כמו
https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks
- לוחצים על הקישור של המסוף Manager.
- הם צריכים להיראות כמו
- מתוך מסוף תוויות הנתונים, לוחצים על כותרת הכרטיסייה משימות כדי לפתוח את דף הקצאת המשימות.
- לוחצים על תיבת הסימון לא הוקצה. אתם אמורים לראות שרשומה חדשה מופיעה ליד תור המשימות codelab-expense-parser-P1.
- בוחרים באפשרות codelab-expense-parser-P1.
- לוחצים על ניהול מטלה.
- מזינים את כתובת האימייל האישית שלכם בתיבת הטקסט הכללת מומחים באימייל ובוחרים אותה מהרשימה הנפתחת.
- לוחצים על אישור.
במסך יופיע שהמשימה הוקצתה לכם. יכול להיות שיעברו כמה דקות עד שההפצה וההצגה יוצגו.
- בוחרים את המשתמש החדש ולוחצים על סמל התפריט.
- לוחצים על הקצאה לכל המשימות בתפריט הקופץ שמופיע.
- לוחצים על Commit changes (שמירת השינויים).
- לוחצים על Commit.
6. ביצוע משימת בדיקה אנושית
- חזרה לדף ההגדרות של Human-in-the-Loop במסוף Cloud.
יש ללחוץ על הקישור כדי לבקר במסוף המומחים (עובד). זה ייראה כך: https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx
.
המשימה החדשה אמורה להיפתח במסוף העובדים.
- מעבירים את העכבר מעל הפריט שמכיל את הפריט פגישה עם 4 מטרים ולוחצים על סמל העריכה (עיפרון).
- עורכים את הערך כדי לשנות את הטקסט כך שיופיע Meeting with Adam (פגישה עם אדם). יכול להיות שתצטרכו לגלול למטה בתיבת הטקסט כדי לראות את הטקסט.
- לוחצים על אישור.
- לוחצים על הסמל אישור (סימן ירוק) של הפריט שלמטה.
- לוחצים על הסמל אישור כדי לראות את שאר הישויות המודגשות.
- לוחצים על שליחה. משימת הבדיקה הוסרה מתור המתייגים.
7. הצגת המשימות שהושלמו
- חוזרים למסוף Manager.
- לוחצים על משימות ובוחרים באפשרות מתמשכת
- לוחצים על מומחים.
- בוחרים את כתובת האימייל שלכם.
- לוחצים על ניהול מטלה.
- בוחרים באפשרות expense-CPU-P1 בתפריט הנפתח
Select specialists working on specific tasks
ובתפריט הנפתחSelect tasks
. לוחצים על אישור בכל אחת מהאפשרויות. בתפריט ההקשר של השדה expense-processor-P1 שהוקצה לכם, בוחרים באפשרות הצגת המומחים
אחרי שהמתייג ישלח משימת תיוג, מספר המשימות שנענו והזמן הכולל של העבודה יעודכנו, אבל ייתכן שיחלפו כמה דקות עד שהנתונים בתצוגה הזו יופיעו.
- סוגרים את החלון הקופץ של המומחים ורואים את הכרטיסייה מומחים.
- לוחצים על תפריט ההקשר של שם המשתמש ובוחרים באפשרות הצגת משימות.
בתצוגה הזאת מוצגת רשימת המשימות שהמשתמש צריך לבצע, מספרי ההשלמה של המשימות ומשך הזמן שנדרש למשתמש:
8. מזל טוב
מזל טוב, השתמשת בהצלחה במכשיר אנושי ב-Document AI כדי להגדיר בדיקה אנושית למסמכים שעובדו באמצעות מעבד הוצאות של Document AI.
ניקוי
כדי להימנע מצבירת חיובים בחשבון Google Cloud על המשאבים שבהם השתמשתם במדריך הזה:
- במסוף Cloud, עוברים לדף Manage resources.
- ברשימת הפרויקטים, בוחרים את הפרויקט הרלוונטי ולוחצים על 'מחיקה'.
- כדי למחוק את הפרויקט, כותבים את מזהה הפרויקט בתיבת הדו-שיח ולוחצים על Shut down.
מידע נוסף
ב-Codelabs הבאים תוכלו להמשיך ללמוד על Document AI.
מקורות מידע
- עתיד המסמכים – פלייליסט ב-YouTube
- מסמכי תיעוד מבוססי-AI של מסמכים
- ספריית הלקוח של Document AI Python
- דוגמאות AI למסמכים
רישיון
היצירה הזו בשימוש ברישיון Creative Commons Attribution 2.0 גנרי.