1. परिचय
दस्तावेज़ एआई एपीआई, दस्तावेज़ों को समझने का एक तरीका है. इसमें दस्तावेज़, ईमेल वगैरह जैसे बिना स्ट्रक्चर वाले डेटा का इस्तेमाल किया जाता है. यह डेटा को समझने, उसका विश्लेषण करने, और उसका इस्तेमाल करने में आसान बनाता है.
मैन्युअल तरीके से की गई समीक्षा की मदद से, दस्तावेज़ को प्रोसेस करने के लिए ज़्यादा सटीक जानकारी मिलती है. यह ज़्यादा सटीक होने के लिए, किसी व्यक्ति के भरोसे का इस्तेमाल किया जा सकता है. मैन्युअल तरीके से की जाने वाली समीक्षा से, समीक्षाओं को ज़्यादा सटीक बनाने में मदद मिलती है. साथ ही, इसकी मदद से कारोबार को, खास तौर पर आपके लिए बनाए गए टूल का इस्तेमाल करके, अनुमानों का आकलन करने में मदद मिलती है. इस लैब में, मानवीय समीक्षा का इस्तेमाल करके खर्च के प्रोसेसर को कॉन्फ़िगर और टेस्ट किया जाएगा. ऐसा करके, ह्यूमन-इन-द-लूप कॉन्फ़िगरेशन और मैनेजमेंट टूल का इस्तेमाल करके, प्रोसेसर के नतीजों की पुष्टि की जाएगी.
ज़रूरी शर्तें
यह कोडलैब, अन्य दस्तावेज़ एआई कोडलैब में मौजूद कॉन्टेंट के आधार पर बनता है.
हमारा सुझाव है कि आगे बढ़ने से पहले, यहां दिए गए कोडलैब (कोड बनाना सीखना) पूरा करें.
- दस्तावेज़ एआई (Python) की मदद से ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) की सुविधा
- दस्तावेज़ एआई (Python) की मदद से फ़ॉर्म पार्स करना
- दस्तावेज़ एआई (Python) वाले खास प्रोसेसर
आपको इनके बारे में जानकारी मिलेगी
- प्रोसेसर के लिए मैन्युअल तरीके से की जाने वाली समीक्षा को कॉन्फ़िगर करें.
- मानवीय समीक्षा के लिए उपयोगकर्ता संसाधन पूल बनाएं.
- मैन्युअल तरीके से समीक्षा करने के लिए टास्क बनाएं.
- किसी उपयोगकर्ता को मैन्युअल तरीके से समीक्षा करने का टास्क असाइन करें.
- किसी दस्तावेज़ की मैन्युअल तरीके से समीक्षा करें.
आपको इन चीज़ों की ज़रूरत होगी
2. सेट अप किया जा रहा है
कोडलैब के इस टूल में यह माना जाता है कि आपने कोडलैब के बारे में शुरुआती जानकारी में दिए गए, दस्तावेज़ के एआई को सेटअप करने के सभी चरणों को पूरा कर लिया है.
आगे बढ़ने से पहले, कृपया नीचे दिए गए चरणों को पूरा करें:
- Cloud Shell शुरू करना
- दस्तावेज़ एआई को चालू करना और Cloud Storage के एपीआई
- Python क्लाइंट लाइब्रेरी इंस्टॉल करना
आपको Vertex AI API को भी चालू करना होगा.
- कंसोल में सबसे ऊपर मौजूद खोज बार का इस्तेमाल करके, "Vertex AI API" खोजें. इसके बाद, अपने Google Cloud प्रोजेक्ट में एपीआई का इस्तेमाल करने के लिए, चालू करें पर क्लिक करें
- इसके अलावा,
gcloud
निर्देश का इस्तेमाल करके भी एपीआई को चालू किया जा सकता है.
gcloud services enable aiplatform.googleapis.com
3. प्रोसेसर बनाना
इस लैब के लिए, सबसे पहले आपको एक्सपेंस प्रोसेसर का एक इंस्टेंस बनाना होगा.
- कंसोल में, दस्तावेज़ एआई प्लैटफ़ॉर्म की खास जानकारी पर जाएं
- प्रोसेसर बनाएं पर क्लिक करें, नीचे स्क्रोल करके खास पर जाएं और खर्च पार्सर चुनें.
- इसे
codelab-expense-parser
नाम दें (या कुछ और जो आपको याद रहेगा) और सूची में अपना सबसे नज़दीकी इलाका चुनें. - अपना प्रोसेसर बनाने के लिए, बनाएं पर क्लिक करें
- प्रोसेसर आईडी को कॉपी करें. आपको बाद में अपने कोड में इसका इस्तेमाल करना होगा.
- Cloud Shell में,
PROJECT_ID-hitl-results
का इस्तेमाल नाम के तौर पर करके एक स्टोरेज बकेट बनाएं:
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
- अपने उपयोगकर्ता खाते को अपने लैब प्रोजेक्ट में, Vertex AI एडमिन IAM भूमिका से बाइंड करें
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin
4. ह्यूमन-इन-द-लूप को कॉन्फ़िगर करें
इस टास्क में, पहले बनाए गए खर्च प्रोसेसर के लिए, मैन्युअल तरीके से समीक्षा को कॉन्फ़िगर किया जाएगा.
- कंसोल में, नेविगेशन मेन्यू खोलें और दस्तावेज़ एआई (AI) चुनें.
- Human-in-the-loop AI पर क्लिक करें.
- प्रोसेसर की मानवीय समीक्षा वाला पेज खोलने के लिए,
codelab-expense-parser
पर क्लिक करें. - Human-in-the-Loop को कॉन्फ़िगर करें पर क्लिक करें.
- दस्तावेज़ लेवल फ़िल्टर चुनें.
- कॉन्फ़िडेंस थ्रेशोल्ड % के स्लाइडर को 50% पर सेट करें.
- विशेषज्ञ विकल्प को मेरे विशेषज्ञों का इस्तेमाल करें पर सेट रहने दें.
- स्पेशलिस्ट पूल ड्रॉप-डाउन बॉक्स पर क्लिक करें. इसके बाद, नए खास लोगों के लिए पूल पर क्लिक करें.
- पूल का नाम के लिए, नया विशेषज्ञ पूल डायलॉग में
Codelab HITL Pool
डालें. - पूल मैनेजर और स्पेशलिस्ट के लिए अपना निजी ईमेल पता डालें
- पूल बनाएं पर क्लिक करें.
इस प्रोसेस को पूरा होने में कुछ मिनट लगेंगे. आपको Vertex AI noreply-vertex@google.com
से एक ईमेल मिलेगा.
- अपने-आप असाइन होने की सुविधा चेकबॉक्स से सही का निशान हटाएं.
- शुल्कों की पुष्टि करें सेक्शन में, चेकबॉक्स पर क्लिक करें.
- निर्देशों की जगह पर क्लिक करें और इसे सेव करने की जगह में कॉपी करें: - पाथ में
gs://
प्रीफ़िक्स शामिल न करें
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
- नतीजों की जगह में, ब्राउज़ करें पर क्लिक करें और वह Cloud Storage बकेट चुनें जिसे आपने पहले बनाया था.
- चुनें पर क्लिक करें.
- कॉन्फ़िगरेशन सेव करें पर क्लिक करें.
अब Console में, लूप में मौजूद इंसानों को कॉन्फ़िगर करना दिखेगा. इसे पूरा होने में कुछ मिनट लगेंगे.
- कॉन्फ़िगरेशन पूरा हो जाने पर, कंसोल आपको ह्यूमन-इन-द-लूप को सक्षम करने का संकेत देगा.
- इस सुविधा को चालू करने के लिए, 'स्विच करें' बटन पर क्लिक करें.
- इसके बाद, पॉप-अप डायलॉग में चालू करें पर क्लिक करें.
खर्च के सैंपल के लिए फ़ॉर्म अपलोड करें
- हमारे पास Google Cloud Storage में सेव किए गए सैंपल फ़ॉर्म का एक सैंपल उपलब्ध है. आप इसे नीचे दिए गए बटन या निर्देश से डाउनलोड कर सकते हैं:
gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
- ह्यूमन-इन-द-लूप को सक्षम करने के बाद, दस्तावेज़ अपलोड करें बटन पर क्लिक करें और अभी-अभी डाउनलोड किया गया नमूना दस्तावेज़ ब्राउज़ करें.
- अपलोड करें पर क्लिक करें और इसके पूरा होने का इंतज़ार करें.
5. किसी आइटम की मैन्युअल तरीके से समीक्षा करने के लिए उसे असाइन करना
- इस पेज पर, आपको पूल मैनेजर और स्पेशलिस्ट कंसोल के लिंक दिखेंगे. ये लिंक
Vertex AI noreply-vertex@google.com
से भेजे जाने वाले ईमेल में भी दिखेंगे.- इन्हें
https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks
की तरह दिखना चाहिए - Manager कंसोल के लिंक पर क्लिक करें.
- इन्हें
- डेटा लेबलिंग कंसोल में, टास्क असाइनमेंट पेज खोलने के लिए टास्क टैब के टाइटल पर क्लिक करें.
- असाइन नहीं किया गया चेक बॉक्स पर क्लिक करें. आपको दिखेगा कि codelab-expense-parser-P1 टास्क की सूची में नई एंट्री जोड़ी गई है.
- codelab-expense-parser-P1 चुनें.
- असाइनमेंट मैनेज करें पर क्लिक करें.
- ईमेल से विशेषज्ञों को शामिल करें टेक्स्ट बॉक्स में अपना निजी ईमेल पता डालें. इसके बाद, ड्रॉपडाउन मेन्यू से उसे चुनें.
- लागू करें पर क्लिक करें.
अब स्क्रीन पर दिखेगा कि यह टास्क आपको असाइन किया गया है. आप शायद पाएं कि इसे लागू होने और दिखने में कुछ मिनट लग सकते हैं.
- नया उपयोगकर्ता चुनें और मेन्यू आइकॉन पर क्लिक करें.
- पॉप-अप मेन्यू में, सभी टास्क को असाइन करें पर क्लिक करें.
- बदलाव लागू करें पर क्लिक करें.
- समीक्षा करें पर क्लिक करें.
6. मैन्युअल तरीके से समीक्षा करने का टास्क करें
- Cloud Console में, Human-in-the-Loop कॉन्फ़िगरेशन पेज पर वापस जाएं.
विशेषज्ञ (कर्मचारी) कंसोल पर जाने के लिए लिंक पर क्लिक करें. यह https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx
जैसा दिखेगा.
वर्कर कंसोल में, आपका नया टास्क खुलेगा.
- उस लाइन आइटम पर कर्सर घुमाएं जिसमें चार मिनट वाली मीटिंग है और बदलाव करें (पेंसिल) आइकॉन पर क्लिक करें.
- वैल्यू में बदलाव करें, ताकि ऐडम के साथ मीटिंग करने के लिए इस्तेमाल होने वाले टेक्स्ट में बदलाव किया जा सके. टेक्स्ट देखने के लिए, आपको टेक्स्ट बॉक्स में नीचे की ओर स्क्रोल करना पड़ सकता है.
- लागू करें पर क्लिक करें.
- नीचे दिए गए आइटम के लिए, पुष्टि करें (हरे टिक) आइकॉन पर क्लिक करें.
- हाइलाइट की गई अन्य इकाइयों के लिए, पुष्टि करें आइकॉन पर क्लिक करें.
- सबमिट करें पर क्लिक करें. समीक्षा टास्क अब आपकी लेबलर सूची से हटा दिया गया है.
7. पूरे हो चुके टास्क देखें
- Manager कंसोल पर वापस जाएं.
- Tasks पर क्लिक करें. इसके बाद, Ongoing
को चुनें
- विशेषज्ञ पर क्लिक करें.
- अपना ईमेल पता चुनें.
- असाइनमेंट मैनेज करें पर क्लिक करें.
Select specialists working on specific tasks
औरSelect tasks
ड्रॉपडाउन से, expense-processor-P1 को चुनें. चुने गए हर विकल्प के लिए, लागू करें पर क्लिक करें. आपको असाइन किए गए expense-processor-P1 के संदर्भ मेन्यू में, विशेषज्ञों को देखें चुनें
लेबलर के ज़रिए लेबल करने का काम सबमिट करने के बाद जवाब दिए गए टास्क की संख्या और कुल समय अपडेट किया जाएगा, लेकिन इस व्यू में डेटा दिखाई देने में कुछ मिनट लग सकते हैं.
- विशेषज्ञों का पॉप-अप बंद करें और विशेषज्ञ टैब देखें.
- अपने उपयोगकर्ता नाम के लिए संदर्भ मेन्यू पर क्लिक करें और टास्क देखें चुनें.
इस व्यू में उपयोगकर्ता के लिए टास्क की सूची, उन्हें पूरा करने की संख्या और लगने वाला समय दिखाया गया है, जैसा कि नीचे दिखाया गया है:
8. बधाई हो
बधाई हो, आपने Document AI Human-in-the-Loop का इस्तेमाल करके, उन दस्तावेज़ों की मानवीय समीक्षा को कॉन्फ़िगर कर लिया है जिन्हें Document AI खर्च प्रोसेसर की मदद से प्रोसेस किया गया था.
मिटाना
इस ट्यूटोरियल में इस्तेमाल किए गए संसाधनों के लिए, आपके Google Cloud खाते पर लगने वाले शुल्क से बचने के लिए:
- Cloud Console में, संसाधन मैनेज करें पेज पर जाएं.
- प्रोजेक्ट की सूची में, अपना प्रोजेक्ट चुनें. इसके बाद, 'मिटाएं' पर क्लिक करें.
- डायलॉग बॉक्स में, प्रोजेक्ट आईडी टाइप करें. इसके बाद, प्रोजेक्ट मिटाने के लिए 'शट डाउन करें' पर क्लिक करें.
ज़्यादा जानें
इन फ़ॉलो-अप कोडलैब की मदद से, दस्तावेज़ एआई (AI) के बारे में ज़्यादा जानें.
संसाधन
- दस्तावेज़ों का भविष्य - YouTube प्लेलिस्ट
- दस्तावेज़ एआई से जुड़ा दस्तावेज़
- दस्तावेज़ एआई Python क्लाइंट लाइब्रेरी
- दस्तावेज़ के एआई सैंपल
लाइसेंस
इस काम को क्रिएटिव कॉमंस एट्रिब्यूशन 2.0 जेनरिक लाइसेंस के तहत लाइसेंस मिला है.