AI Platform Notebooks की मदद से अपने इनवॉइस पार्स करने के लिए, प्रोक्योरमेंट डॉक्यूमेंट एआई (AI) का इस्तेमाल करें

1. खास जानकारी

c65b9ae04aa1853.png

Procurement Document AI क्या है?

कंपनियां, हर साल हज़ारों इनवॉइस, रसीदें, और उनसे जुड़े अन्य दस्तावेज़ों के साथ-साथ खरीदारी की बड़ी पाइपलाइन मैनेज करती हैं. Procurement DocAI का इस्तेमाल करके, अपने "डार्क डेटा" को बेहतर तरीके से प्रोसेस करें. जैसे, PDF, इमेज, और हाथ से लिखे गए फ़ॉर्म. इससे, खरीदारी की पूरी प्रोसेस में मैन्युअल तरीके से किए जाने वाले काम को कम किया जा सकता है. इनवॉइस और रसीदों जैसे अनस्ट्रक्चर्ड दस्तावेज़ों को स्ट्रक्चर्ड डेटा में बदलकर, बड़े पैमाने पर खरीदारी से जुड़े डेटा को अपने-आप कैप्चर करने की सुविधा चालू करें. इससे परिचालन क्षमता को बढ़ाया जा सकता है, ग्राहक अनुभव को बेहतर बनाया जा सकता है, और सोच-समझकर फ़ैसले लिए जा सकते हैं.

इस कोडलैब में, हम Document AI Platform को सेट अप करने, सैंपल इनवॉइस को प्रोसेस करने, और AI Platform Notebook में इकाइयों को निकालने और उन्हें विज़ुअलाइज़ करने का तरीका जानेंगे.

आपको क्या सीखने को मिलेगा

  • Document AI Platform का इस्तेमाल शुरू करने का तरीका
  • Procurement DocAI Solution का इस्तेमाल करके, स्कीमा के मुताबिक इकाइयां निकालना
  • AI Platform Notebooks इंस्टेंस बनाना और उसे पसंद के मुताबिक बनाना

आपको इन चीज़ों की ज़रूरत होगी

  • Google Cloud प्रोजेक्ट
  • कोई ब्राउज़र, जैसे कि Chrome या Firefox
  • Python 3 की जानकारी

सर्वे

इस ट्यूटोरियल का इस्तेमाल कैसे किया जाएगा?

सिर्फ़ इसे पढ़ें इसे पढ़ें और एक्सरसाइज़ पूरी करें

Python के साथ अपने अनुभव को आप क्या रेटिंग देंगे?

शुरुआती सामान्य एडवांस

Google Cloud की सेवाओं को इस्तेमाल करने के अपने अनुभव को आप क्या रेटिंग देंगे?

शुरुआती सामान्य एडवांस

2. सेटअप और ज़रूरी शर्तें

अपने हिसाब से एनवायरमेंट सेट अप करना

  1. Cloud Console में साइन इन करें. इसके बाद, नया प्रोजेक्ट बनाएं या किसी मौजूदा प्रोजेक्ट का फिर से इस्तेमाल करें. (अगर आपके पास पहले से Gmail या G Suite खाता नहीं है, तो आपको एक खाता बनाना होगा.)

प्रोजेक्ट आईडी याद रखें. यह सभी Google Cloud प्रोजेक्ट के लिए एक यूनीक नाम होता है. (ऊपर दिया गया नाम पहले से मौजूद है और आपके लिए काम नहीं करेगा. माफ़ करें!). आपको यह आईडी बाद में PROJECT_ID के तौर पर देना होगा.

  1. इसके बाद, Google Cloud के संसाधनों का इस्तेमाल करने के लिए, आपको Cloud Console में बिलिंग चालू करनी होगी.

"सफ़ाई करना" सेक्शन में दिए गए निर्देशों का पालन ज़रूर करें. इस सेक्शन में, संसाधनों को बंद करने का तरीका बताया गया है, ताकि इस ट्यूटोरियल के बाद आपसे बिलिंग न की जाए. Google Cloud के नए उपयोगकर्ता, मुफ़्त में आज़माने के लिए 300 डॉलर के प्रोग्राम में शामिल हो सकते हैं.

3. Cloud Document AI API को चालू करना

Document AI का इस्तेमाल शुरू करने से पहले, आपको एपीआई चालू करना होगा. अपने ब्राउज़र में Cloud Console खोलें.

  1. नेविगेशन मेन्यू ☰ > एपीआई और सेवाएं > लाइब्रेरी पर क्लिक करें. Search API
  2. "Document AI API" खोजें. इसके बाद, अपने Google Cloud प्रोजेक्ट में एपीआई का इस्तेमाल करने के लिए, चालू करें पर क्लिक करें

4. प्रोसेसर बनाना और उसकी जांच करना

इस ट्यूटोरियल में Document AI Platform का इस्तेमाल करने के लिए, आपको सबसे पहले फ़ॉर्म पार्सर प्रोसेसर का एक इंस्टेंस बनाना होगा.

  1. कंसोल में, Document AI Platform की खास जानकारी पर जाएं
  2. प्रोसेसर बनाएं पर क्लिक करें और इनवॉइस पार्सर चुनेंप्रोसेसर
  3. प्रोसेसर का नाम डालें और सूची से अपना देश/इलाका चुनें.
  4. प्रोसेसर बनाने के लिए, बनाएं पर क्लिक करें
  5. अपने प्रोसेसर आईडी को कॉपी करें. आपको इसका इस्तेमाल बाद में अपने कोड में करना होगा.

(ज़रूरी नहीं) दस्तावेज़ अपलोड करके, कंसोल में अपने प्रोसेसर को आज़माया जा सकता है. दस्तावेज़ अपलोड करें पर क्लिक करें और पार्स करने के लिए कोई फ़ॉर्म चुनें. अगर आपके पास कोई फ़ॉर्म उपलब्ध नहीं है, तो इस सैंपल फ़ॉर्म को डाउनलोड करके इस्तेमाल किया जा सकता है.

बिल

आउटपुट ऐसा दिखना चाहिए: पार्स किया गया इनवॉइस

5. AI Platform Notebook बनाना

Cloud Console के AI Platform Notebooks सेक्शन पर जाएं और नया इंस्टेंस पर क्लिक करें. इसके बाद, Python का नया इंस्टेंस टाइप चुनें:

a81c82876c6c16f9.png

डिफ़ॉल्ट विकल्पों का इस्तेमाल करें. इसके बाद, बनाएं पर क्लिक करें. इंस्टेंस बन जाने के बाद, JupyterLab खोलें को चुनें.

6. सैंपल कोड पाना

Document AI Notebooks GitHub Repo से सीधे तौर पर सैंपल कोड इंपोर्ट करें. अपनी नोटबुक में, सबसे ऊपर मौजूद मेन्यू में जाकर Git > Clone a Repository पर जाएं या Git आइकॉन: Git पर क्लिक करें

डेटा स्टोर करने की जगह का यह यूआरएल चिपकाएं:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

रिपॉज़िटरी क्लोन होने के बाद, documentai-notebooks/specialized/ डायरेक्ट्री पर क्लिक करें और specialized_form_parser.ipynb नोटबुक खोलें. उस सेल को ढूंढें जहां GCP प्रोजेक्ट और Document AI प्रोसेसर आईडी के बारे में बताया गया है.

vars

चौथे चरण में मिला GCP प्रोजेक्ट आईडी और प्रोसेसर आईडी चिपकाएं. अपनी नोटबुक सेव करें.

7. इकाइयों को एक्सट्रैक्ट और विज़ुअलाइज़ करना

अब इनवॉइस से स्कीमा के मुताबिक बनाई गई इकाइयों और उनके कॉन्फ़िडेंस स्कोर को निकाला जा सकता है. Document रिस्पॉन्स ऑब्जेक्ट में, इकाइयों की सूची होती है. स्कीमा के मुताबिक बनाई गई इकाइयों के बारे में ज़्यादा जानने के लिए, Invoice Parser का क्विकस्टार्ट पढ़ें.

अपनी नोटबुक की सभी सेल चलाएं और टेबल के फ़ॉर्मैट में मौजूद आउटपुट तक नीचे की ओर स्क्रोल करें. पहले वाला कोड, हर इकाई के हिसाब से काम करता है और नतीजों के साथ Pandas DataFrame बनाता है. टेबल

अब नीचे की ओर स्क्रोल करके, विज़ुअलाइज़ेशन कॉम्पोनेंट पर जाएं. Document ऑब्जेक्ट रिस्पॉन्स में, दस्तावेज़ के हर पेज के लिए स्पेस के हिसाब से लेआउट की जानकारी होती है. यहां, हर फ़ॉर्म फ़ील्ड के लेआउट की जानकारी का इस्तेमाल करके, इमेज पर बाउंडिंग बॉक्स बनाए गए हैं. इस डेटा का इस्तेमाल, Document AI को किसी फ़्रंटएंड ऐप्लिकेशन में इंटिग्रेट करने के लिए किया जा सकता है.

पॉलिस

8. बधाई हो

बधाई हो, आपने इनवॉइस से डेटा निकालने के लिए, Procurement Document AI Solution का इस्तेमाल कर लिया है. हमारा सुझाव है कि आप दूसरे फ़ॉर्म टाइप आज़माकर देखें.

खाली करने के लिए जगह

इस ट्यूटोरियल में इस्तेमाल किए गए संसाधनों के लिए, अपने Google Cloud खाते से शुल्क न लिए जाने के लिए, अपनी नोटबुक बंद करें या GCP प्रोजेक्ट मिटाएं.

AI Platform Notebooks इंस्टेंस बंद करना

AI Platform Notebooks इंस्टेंस बंद करने के लिए, इन निर्देशों का पालन करें.

प्रोजेक्ट मिटाना

बिलिंग बंद करने का सबसे आसान तरीका यह है कि ट्यूटोरियल के लिए बनाया गया प्रोजेक्ट मिटा दें.

प्रोजेक्ट मिटाने के लिए:

  1. GCP Console में, प्रोजेक्ट पेज पर जाएं. प्रोजेक्ट पेज
  2. प्रोजेक्ट की सूची में, वह प्रोजेक्ट चुनें जिसे आपको मिटाना है. इसके बाद, मिटाएं पर क्लिक करें.
  3. डायलॉग बॉक्स में, प्रोजेक्ट आईडी टाइप करें. इसके बाद, प्रोजेक्ट मिटाने के लिए बंद करें पर क्लिक करें.

ज़्यादा जानें

लाइसेंस

इस काम के लिए, Creative Commons एट्रिब्यूशन 2.0 जेनेरिक लाइसेंस के तहत लाइसेंस मिला है.