रीट्रिवल-ऑगमेंटेड जनरेशन की मदद से एजेंट बनाना

1. परिचय

खास जानकारी

इस लैब का मकसद, Google Cloud में एंड-टू-एंड एजेंटिक रिट्रीवल-ऑगमेंटेड जनरेशन (आरएजी) ऐप्लिकेशन डेवलप करने का तरीका सीखना है. इस लैब में, आपको फ़ाइनेंशियल एनालिसिस एजेंट बनाना होगा.यह एजेंट, दो अलग-अलग सोर्स से मिली जानकारी को मिलाकर सवालों के जवाब दे सकता है. ये सोर्स हैं: अनस्ट्रक्चर्ड दस्तावेज़ (Alphabet की तिमाही एसईसी फ़ाइलिंग - वित्तीय स्टेटमेंट और ऑपरेशनल जानकारी, जिसे अमेरिका में हर सार्वजनिक कंपनी, Securities and Exchange Commission को सबमिट करती है) और स्ट्रक्चर्ड डेटा (शेयर की पिछली कीमतें).

आपको Vertex AI Search का इस्तेमाल करके, बिना स्ट्रक्चर वाली फ़ाइनेंशियल रिपोर्ट के लिए एक बेहतरीन सिमैंटिक सर्च इंजन बनाना होगा. स्ट्रक्चर्ड डेटा के लिए, आपको कस्टम Python टूल बनाना होगा. आखिर में, एजेंट डेवलपमेंट किट (एडीके) का इस्तेमाल करके, एक ऐसा इंटेलिजेंट एजेंट बनाया जाएगा जो उपयोगकर्ता की क्वेरी को समझ सके, यह तय कर सके कि किस टूल का इस्तेमाल करना है, और जानकारी को एक साथ मिलाकर जवाब दे सके.

आपको क्या करना होगा

  • निजी दस्तावेज़ों में सिमैंटिक सर्च करने के लिए, Vertex AI Search डेटा स्टोर सेट अप करें.
  • किसी एजेंट के लिए, टूल के तौर पर कस्टम Python फ़ंक्शन बनाना.
  • एक से ज़्यादा टूल वाले एजेंट को बनाने के लिए, एजेंट डेवलपमेंट किट (एडीके) का इस्तेमाल करें.
  • मुश्किल सवालों के जवाब देने के लिए, अनस्ट्रक्चर्ड और स्ट्रक्चर्ड डेटा सोर्स से जानकारी इकट्ठा करें.
  • ऐसे एजेंट के साथ टेस्ट और इंटरैक्ट करें जो तर्क देने की क्षमता रखता हो.

आपको क्या सीखने को मिलेगा

इस लैब में, आपको इनके बारे में जानकारी मिलेगी:

  • Retrieval-Augmented Generation (RAG) और Agentic RAG के मुख्य सिद्धांत.
  • Vertex AI Search का इस्तेमाल करके, दस्तावेज़ों में सिमैंटिक सर्च की सुविधा लागू करने का तरीका.
  • कस्टम टूल बनाकर, एजेंट को स्ट्रक्चर्ड डेटा दिखाने का तरीका.
  • एजेंट डेवलपमेंट किट (एडीके) की मदद से, कई टूल वाले एजेंट को बनाने और व्यवस्थित करने का तरीका.
  • एजेंट, कई डेटा सोर्स का इस्तेमाल करके मुश्किल सवालों के जवाब देने के लिए, तर्क और प्लानिंग का इस्तेमाल कैसे करते हैं.

2. Retrieval-Augmented Generation को समझना

लार्ज जनरेटिव मॉडल (लार्ज लैंग्वेज मॉडल या एलएलएम, विज़न-लैंग्वेज मॉडल वगैरह) बहुत ज़्यादा असरदार होते हैं. हालांकि, इनकी कुछ सीमाएं होती हैं. इन मॉडल को प्री-ट्रेनिंग के दौरान जो डेटा दिया जाता है, वे उसी के आधार पर जवाब देते हैं. इसलिए, इनके जवाबों में नई जानकारी शामिल नहीं होती और वे तुरंत पुराने हो जाते हैं. फ़ाइन-ट्यूनिंग के बाद भी, मॉडल का ज्ञान ज़्यादा अपडेट नहीं होता. ऐसा इसलिए, क्योंकि ट्रेनिंग के बाद के चरणों का मकसद यह नहीं होता.

लार्ज लैंग्वेज मॉडल को इस तरह से ट्रेन किया जाता है कि वे कुछ जवाब दे सकें. भले ही, मॉडल के पास ऐसे जवाब की पुष्टि करने वाली तथ्यपरक जानकारी न हो. खास तौर पर, "सोचने" वाले मॉडल को इस तरह से ट्रेन किया जाता है. ऐसा तब होता है, जब वे कहते हैं कि मॉडल "हलुसिनेट" करता है. इसका मतलब है कि वह भरोसे के साथ ऐसी जानकारी जनरेट करता है जो भरोसेमंद लगती है, लेकिन तथ्यों के हिसाब से गलत होती है.

Retrieval-Augmented Generation (RAG), एक बेहतरीन आर्किटेक्चरल पैटर्न है. इसे इन समस्याओं को हल करने के लिए डिज़ाइन किया गया है. यह एक आर्किटेक्चरल फ़्रेमवर्क है. यह बड़े लैंग्वेज मॉडल की क्षमताओं को बेहतर बनाता है. इसके लिए, यह उन्हें रीयल-टाइम में बाहरी और भरोसेमंद जानकारी के सोर्स से कनेक्ट करता है. आरएजी सिस्टम में मौजूद एलएलएम, पहले से मौजूद जानकारी पर पूरी तरह से निर्भर नहीं रहता. इसके बजाय, यह उपयोगकर्ता की क्वेरी से जुड़ी काम की जानकारी को पहले खोजता है. इसके बाद, उस जानकारी का इस्तेमाल करके ज़्यादा सटीक, समय के हिसाब से सही, और कॉन्टेक्स्ट के हिसाब से जवाब जनरेट करता है.

यह तरीका, जनरेटिव मॉडल की सबसे बड़ी कमियों को सीधे तौर पर दूर करता है. जैसे, इनकी जानकारी किसी समय पर तय होती है. साथ ही, ये गलत जानकारी या "हलुसनेशन" जनरेट कर सकते हैं. आरएजी, एलएलएम को "ओपन-बुक परीक्षा" देने जैसा है. इसमें "बुक" आपका निजी, डोमेन के हिसाब से, और अप-टू-डेट डेटा होता है. एलएलएम को तथ्यों के आधार पर जानकारी देने की इस प्रोसेस को "ग्राउंडिंग" कहा जाता है.

आरएजी के तीन चरण

स्टैंडर्ड Retrieval-Augmented Generation प्रोसेस को तीन आसान चरणों में बांटा जा सकता है:

  1. जानकारी पाना: जब कोई उपयोगकर्ता क्वेरी सबमिट करता है, तो सिस्टम सबसे पहले किसी बाहरी नॉलेज बेस (जैसे, दस्तावेज़ रिपॉज़िटरी, डेटाबेस या वेबसाइट) में क्वेरी से जुड़ी जानकारी खोजता है.
  2. बढ़ाना: इसके बाद, निकाली गई जानकारी को उपयोगकर्ता की ओरिजनल क्वेरी के साथ मिलाकर, एक बड़ा प्रॉम्प्ट बनाया जाता है. इस तकनीक को कभी-कभी "प्रॉम्प्ट स्टफ़िंग" कहा जाता है, क्योंकि यह प्रॉम्प्ट में तथ्यों के हिसाब से कॉन्टेक्स्ट जोड़ती है.
  3. जनरेट करना: इस बेहतर प्रॉम्प्ट को एलएलएम में डाला जाता है. इसके बाद, एलएलएम जवाब जनरेट करता है. मॉडल को काम का और तथ्यों पर आधारित डेटा दिया गया है. इसलिए, इसका आउटपुट "ग्राउंडेड" होता है. साथ ही, इसमें गलत या पुरानी जानकारी होने की संभावना बहुत कम होती है.

RAG के फ़ायदे

RAG फ़्रेमवर्क के आने से, भरोसेमंद और काम के एआई ऐप्लिकेशन बनाने में मदद मिली है. इसके मुख्य फ़ायदे ये हैं:

  • ज़्यादा सटीक जानकारी और गलत जानकारी का कम होना: आरएजी, जवाबों को बाहरी तथ्यों के आधार पर तैयार करता है. इन तथ्यों की पुष्टि की जा सकती है. इससे एलएलएम के गलत जानकारी देने का जोखिम काफ़ी कम हो जाता है.
  • अप-टू-डेट जानकारी ऐक्सेस करना: RAG सिस्टम को लगातार अपडेट होने वाले नॉलेज बेस से कनेक्ट किया जा सकता है. इससे, उन्हें बिलकुल नई जानकारी के आधार पर जवाब देने की सुविधा मिलती है. यह सुविधा, स्टैटिक तौर पर ट्रेन किए गए एलएलएम के लिए उपलब्ध नहीं है.
  • उपयोगकर्ताओं का भरोसा बढ़ाना और पारदर्शिता बढ़ाना: एलएलएम का जवाब, खोजे गए दस्तावेज़ों पर आधारित होता है. इसलिए, सिस्टम अपने सोर्स के उद्धरण और लिंक दे सकता है. इससे उपयोगकर्ताओं को जानकारी की पुष्टि करने का मौका मिलता है. इससे ऐप्लिकेशन पर उनका भरोसा बढ़ता है.
  • लागत: नए डेटा के साथ एलएलएम को लगातार बेहतर बनाना या फिर से ट्रेन करना, कंप्यूटेशनल और वित्तीय तौर पर महंगा होता है. RAG की मदद से, मॉडल की जानकारी को अपडेट करना उतना ही आसान है जितना बाहरी डेटा सोर्स को अपडेट करना. यह ज़्यादा असरदार है.
  • डोमेन के हिसाब से जानकारी और निजता: RAG की मदद से, लोग और संगठन क्वेरी के समय अपने निजी और मालिकाना हक वाले डेटा को एलएलएम के लिए उपलब्ध करा सकते हैं. इसके लिए, उन्हें मॉडल के ट्रेनिंग सेट में उस संवेदनशील डेटा को शामिल करने की ज़रूरत नहीं होती. इससे, डेटा की निजता और सुरक्षा बनाए रखते हुए, डोमेन के हिसाब से बेहतर ऐप्लिकेशन इस्तेमाल किए जा सकते हैं.

फिर से पाना

"जानकारी वापस पाना" चरण, किसी भी RAG सिस्टम का मुख्य हिस्सा होता है. सीधे तौर पर खोजी गई जानकारी की क्वालिटी और उसके काम का होना, जनरेट किए गए जवाब की क्वालिटी और उसके काम का होना तय करता है. अक्सर, असरदार RAG ऐप्लिकेशन को अलग-अलग तकनीकों का इस्तेमाल करके, अलग-अलग तरह के डेटा सोर्स से जानकारी वापस पाने की ज़रूरत होती है. जानकारी पाने के मुख्य तरीकों को तीन कैटगरी में बांटा गया है: कीवर्ड पर आधारित, सिमैंटिक, और स्ट्रक्चर्ड.

अनस्ट्रक्चर्ड डेटा से जानकारी पाना

पहले, अनस्ट्रक्चर्ड डेटा को वापस पाने की सुविधा को पारंपरिक खोज के नाम से जाना जाता था. इसमें कई बदलाव किए गए हैं. आपको दोनों मुख्य तरीकों से फ़ायदा मिल सकता है.

सिमैंटिक सर्च, सबसे असरदार तकनीक है. इसे Google Cloud में बड़े पैमाने पर इस्तेमाल किया जा सकता है. साथ ही, इससे बेहतरीन परफ़ॉर्मेंस मिलती है और इस पर आपका पूरा कंट्रोल होता है.

  • कीवर्ड के आधार पर (लेक्सिकल) खोज: यह खोज करने का पारंपरिक तरीका है. इसकी शुरुआत 1970 के दशक में हुई थी, जब जानकारी पाने के लिए सिस्टम बनाए गए थे. लेक्सिकल सर्च, उपयोगकर्ता की क्वेरी में मौजूद शब्दों (या "टोकन") को नॉलेज बेस में मौजूद दस्तावेज़ों में मौजूद शब्दों से मैच करती है. यह उन क्वेरी के लिए बहुत कारगर है जिनमें कुछ खास शब्दों के बारे में सटीक जानकारी देना ज़रूरी होता है. जैसे, प्रॉडक्ट कोड, कानूनी शर्तें या यूनीक नाम.
  • सिमेंटिक सर्च: सिमेंटिक सर्च या "मतलब के साथ खोज" एक ज़्यादा आधुनिक तरीका है. इसका मकसद, उपयोगकर्ता के इंटेंट और उसकी क्वेरी के कॉन्टेक्स्ट के हिसाब से मतलब को समझना है. इसमें सिर्फ़ कीवर्ड के शाब्दिक मतलब को नहीं समझा जाता. मॉडर्न सिमैंटिक सर्च, एंबेड करने की प्रोसेस पर आधारित होती है. यह मशीन लर्निंग की एक ऐसी तकनीक है जो कॉम्प्लेक्स और ज़्यादा डाइमेंशन वाले डेटा को कम डाइमेंशन वाले वेक्टर स्पेस में मैप करती है. इन वेक्टर को इस तरह से डिज़ाइन किया गया है कि एक जैसे मतलब वाले टेक्स्ट, वेक्टर स्पेस में एक-दूसरे के नज़दीक मौजूद हों. "परिवारों के लिए कुत्ते की सबसे अच्छी नस्लें कौनसी हैं?" क्वेरी को एक वेक्टर में बदल दिया जाता है. इसके बाद, सिस्टम ऐसे दस्तावेज़ वेक्टर खोजता है जो उस स्पेस में "सबसे नज़दीकी पड़ोसी" होते हैं. इससे, ऐसे दस्तावेज़ों को ढूंढने में मदद मिलती है जिनमें "गोल्डन रिट्रीवर" या "दोस्ताना कुत्ते" के बारे में बताया गया हो. भले ही, उनमें "कुत्ता" शब्द शामिल न हो. ज़्यादा डाइमेंशन वाली इस खोज को, Approximate Nearest Neighbor (ANN) एल्गोरिदम की मदद से बेहतर बनाया जाता है. क्वेरी वेक्टर की तुलना हर दस्तावेज़ वेक्टर से करने के बजाय, एएनएन एल्गोरिदम इंडेक्सिंग स्ट्रक्चर का इस्तेमाल करते हैं. इससे, मिलते-जुलते वेक्टर को तुरंत ढूंढा जा सकता है. क्वेरी वेक्टर की तुलना हर दस्तावेज़ वेक्टर से करने में, बड़े डेटासेट के लिए बहुत ज़्यादा समय लगता है.

स्ट्रक्चर्ड डेटा से जानकारी पाना

सभी ज़रूरी जानकारी, बिना स्ट्रक्चर वाले दस्तावेज़ों में सेव नहीं होती है. अक्सर, सबसे सटीक और काम की जानकारी स्ट्रक्चर्ड फ़ॉर्मैट में होती है. जैसे, रिलेशनल डेटाबेस, NoSQL डेटाबेस या किसी तरह का एपीआई. जैसे, मौसम के डेटा या शेयर की कीमत के लिए REST API.

स्ट्रक्चर्ड डेटा से जानकारी पाना, आम तौर पर अनस्ट्रक्चर्ड टेक्स्ट को खोजने की तुलना में ज़्यादा सटीक और आसान होता है. सिमेंटिक समानता खोजने के बजाय, भाषा मॉडल को सटीक क्वेरी बनाने और उसे लागू करने की सुविधा दी जा सकती है. जैसे, किसी डेटाबेस पर SQL क्वेरी या किसी खास जगह और तारीख के लिए मौसम के एपीआई को एपीआई कॉल.

इसे फ़ंक्शन-कॉलिंग के ज़रिए लागू किया जाता है. यह वही तकनीक है जो एआई एजेंट को काम करने की सुविधा देती है. इससे भाषा मॉडल, एक्ज़ीक्यूटेबल कोड और बाहरी सिस्टम के साथ एक तय स्ट्रक्चर में इंटरैक्ट कर पाते हैं.

3. आरएजी पाइपलाइन से लेकर एजेंटिक आरएजी तक

जैसे-जैसे RAG का कॉन्सेप्ट विकसित हुआ है वैसे-वैसे इसे लागू करने के लिए आर्किटेक्चर भी विकसित हुए हैं. यह एक सामान्य और लीनियर पाइपलाइन के तौर पर शुरू हुआ था. अब यह एक डाइनैमिक और इंटेलिजेंट सिस्टम बन गया है, जिसे एआई एजेंट मैनेज करते हैं.

  • सिंपल (या नैव) आरएजी: यह बुनियादी आर्किटेक्चर है, जिसके बारे में हमने अब तक बात की है. यह तीन चरणों वाली एक लीनियर प्रोसेस है: जानकारी पाना, जानकारी बढ़ाना, और जनरेट करना. यह एक प्रतिक्रियात्मक मॉडल है. यह हर क्वेरी के लिए एक तय किए गए पाथ का पालन करता है. यह सीधे तौर पर पूछे गए सवालों के जवाब देने के लिए बहुत असरदार है.
  • ऐडवांस आरएजी: यह एक ऐसा तरीका है जिसमें पाइपलाइन में अतिरिक्त चरण जोड़े जाते हैं, ताकि खोजे गए कॉन्टेक्स्ट की क्वालिटी को बेहतर बनाया जा सके. ये सुधार, डेटा वापस पाने से पहले या बाद में किए जा सकते हैं.
    • प्री-रिट्रीवल: क्वेरी को फिर से लिखने या उसे बड़ा करने जैसी तकनीकों का इस्तेमाल किया जा सकता है. सिस्टम, शुरुआती क्वेरी का विश्लेषण कर सकता है और उसे फिर से लिख सकता है, ताकि जानकारी पाने के सिस्टम के लिए वह ज़्यादा असरदार हो.
    • नतीजे मिलने के बाद: दस्तावेज़ों का शुरुआती सेट मिलने के बाद, री-रैंकिंग मॉडल लागू किया जा सकता है. इससे दस्तावेज़ों को काम का होने के आधार पर स्कोर किया जा सकता है और सबसे काम के दस्तावेज़ों को सबसे ऊपर दिखाया जा सकता है. यह हाइब्रिड सर्च के लिए खास तौर पर ज़रूरी है. जानकारी पाने के बाद, अगला चरण यह होता है कि मिले हुए कॉन्टेक्स्ट को फ़िल्टर किया जाए या कंप्रेस किया जाए. इससे यह पक्का किया जा सकता है कि एलएलएम को सिर्फ़ सबसे ज़रूरी जानकारी मिले.
  • एजेंटिक आरएजी: यह आरएजी आर्किटेक्चर का सबसे नया वर्शन है. इसमें फ़िक्स्ड पाइपलाइन की जगह, अपने-आप काम करने वाली और स्मार्ट प्रोसेस का इस्तेमाल किया जाता है. एजेंटिक आरएजी सिस्टम में, पूरे वर्कफ़्लो को एक या उससे ज़्यादा एआई एजेंट मैनेज करते हैं. ये एजेंट, तर्क दे सकते हैं, प्लान बना सकते हैं, और अपनी कार्रवाइयां डाइनैमिक तरीके से चुन सकते हैं.

एजेंटिक आरएजी को समझने के लिए, यह जानना ज़रूरी है कि एआई एजेंट क्या होता है. एजेंट, सिर्फ़ एक एलएलएम नहीं होता. यह एक ऐसा सिस्टम है जिसमें कई मुख्य कॉम्पोनेंट होते हैं:

  1. तर्क करने वाले इंजन के तौर पर एलएलएम: एजेंट, Gemini जैसे शक्तिशाली एलएलएम का इस्तेमाल सिर्फ़ टेक्स्ट जनरेट करने के लिए नहीं करता है. बल्कि, इसे प्लानिंग करने, फ़ैसले लेने, और मुश्किल कामों को आसान बनाने के लिए, अपने मुख्य "दिमाग" के तौर पर इस्तेमाल करता है.
  2. टूल का सेट: एजेंट को फ़ंक्शन के टूलकिट का ऐक्सेस दिया जाता है. एजेंट अपने लक्ष्यों को पूरा करने के लिए, इन फ़ंक्शन का इस्तेमाल कर सकता है. ये टूल कुछ भी हो सकते हैं: कैलकुलेटर, वेब खोज एपीआई, ईमेल भेजने का फ़ंक्शन या इस लैब के लिए सबसे ज़रूरी - हमारी अलग-अलग नॉलेज बेस के लिए रिट्रीवर.
  3. मेमोरी: एजेंट को शॉर्ट-टर्म मेमोरी (मौजूदा बातचीत के संदर्भ को याद रखने के लिए) और लॉन्ग-टर्म मेमोरी (पिछले इंटरैक्शन से जानकारी याद रखने के लिए) के साथ डिज़ाइन किया जा सकता है. इससे, आपको ज़्यादा बेहतर और सुसंगत अनुभव मिल पाते हैं.
  4. प्लानिंग और रिफ़्लेक्शन: सबसे अडवांस एजेंट, तर्क करने के बेहतर तरीके दिखाते हैं. इन्हें कोई मुश्किल लक्ष्य दिया जा सकता है. साथ ही, इसे हासिल करने के लिए कई चरणों वाला प्लान बनाया जा सकता है. इसके बाद, वे इस प्लान को लागू कर सकते हैं. साथ ही, अपनी कार्रवाइयों के नतीजों पर विचार कर सकते हैं, गड़बड़ियों की पहचान कर सकते हैं, और बेहतर नतीजे पाने के लिए अपने तरीके में सुधार कर सकते हैं.

एजेंटिक आरएजी, एआई के काम करने के तरीके को पूरी तरह से बदल देता है. ऐसा इसलिए, क्योंकि यह एआई को अपने हिसाब से काम करने और ज़्यादा स्मार्ट तरीके से जवाब देने की सुविधा देता है. यह सुविधा, स्टैटिक पाइपलाइन में नहीं होती.

  • लचीलापन और अडैप्टेबिलिटी: एजेंट को जानकारी पाने के लिए, सिर्फ़ एक तरीके का इस्तेमाल करने की ज़रूरत नहीं होती. उपयोगकर्ता की क्वेरी के आधार पर, यह जानकारी के सबसे अच्छे सोर्स के बारे में बता सकता है. यह पहले स्ट्रक्चर्ड डेटाबेस से क्वेरी कर सकता है. इसके बाद, बिना स्ट्रक्चर वाले दस्तावेज़ों पर सिमैंटिक सर्च कर सकता है. अगर इसे अब भी जवाब नहीं मिलता है, तो यह Google Search टूल का इस्तेमाल करके, सार्वजनिक वेब पर खोज कर सकता है. यह सब, उपयोगकर्ता के एक ही अनुरोध के संदर्भ में किया जाता है.
  • मुश्किल और कई चरणों वाली रीज़निंग: यह आर्किटेक्चर, मुश्किल क्वेरी को हैंडल करने में बेहतर है. ऐसी क्वेरी के लिए, कई चरणों में जानकारी को क्रम से वापस पाना और उसे प्रोसेस करना ज़रूरी होता है.

इस क्वेरी पर विचार करें: "क्रिस्टोफ़र नोलन के निर्देशन में बनी टॉप 3 साइंस फ़िक्शन फ़िल्में खोजो. साथ ही, हर फ़िल्म की कहानी के बारे में कम शब्दों में जानकारी दो." ऐसे में, सामान्य RAG पाइपलाइन काम नहीं करेगी.

हालांकि, एजेंट इस बारे में ज़्यादा जानकारी दे सकता है:

  1. प्लान: सबसे पहले, मुझे फ़िल्में ढूंढनी हैं. इसके बाद, मुझे हर फ़िल्म की कहानी ढूंढनी है.
  2. पहली कार्रवाई: स्ट्रक्चर्ड डेटा टूल का इस्तेमाल करके, नोलन की साइंस फ़िक्शन फ़िल्मों के डेटाबेस से क्वेरी करें: सबसे ज़्यादा रेटिंग वाली तीन फ़िल्में, रेटिंग के हिसाब से घटते क्रम में.
  3. पहली जानकारी: टूल ने "इंसेप्शन", "इंटरस्टेलर", और "टेनेट" फ़िल्मों के नाम दिखाए.
  4. दूसरी कार्रवाई: "इंसेप्शन" की कहानी ढूंढने के लिए, अनस्ट्रक्चर्ड डेटा टूल (सिमैंटिक सर्च) का इस्तेमाल करें.
  5. दूसरी जानकारी: प्लॉट की जानकारी वापस मिल जाती है.
  6. तीसरी कार्रवाई: "इंटरस्टेलर" के लिए भी यही प्रोसेस दोहराएं.
  7. चौथी कार्रवाई: "टेनेट" के लिए भी यही प्रोसेस दोहराएं.
  8. फ़ाइनल जवाब तैयार करना: खोजे गए सभी नतीजों को मिलाकर, उपयोगकर्ता के लिए एक जवाब तैयार करना.

RAG और एजेंट

4. प्रोजेक्ट सेटअप करना

Google खाता

अगर आपके पास पहले से कोई निजी Google खाता नहीं है, तो आपको Google खाता बनाना होगा.

ऑफ़िस या स्कूल वाले खाते के बजाय, निजी खाते का इस्तेमाल करें.

Google Cloud Console में साइन इन करना

किसी निजी Google खाते का इस्तेमाल करके, Google Cloud Console में साइन इन करें.

बिलिंग चालू करें

ट्रायल बिलिंग खाते का इस्तेमाल करें (ज़रूरी नहीं)

इस वर्कशॉप को चलाने के लिए, आपके पास कुछ क्रेडिट वाला बिलिंग खाता होना चाहिए. अगर आपको अपने बिलिंग सिस्टम का इस्तेमाल करना है, तो इस चरण को छोड़ा जा सकता है.

  1. इस लिंक पर क्लिक करें और किसी निजी Google खाते से साइन इन करें. आपको कुछ ऐसा दिखेगा:क्रेडिट पेज के लिए यहां क्लिक करें
  2. अपने क्रेडिट ऐक्सेस करने के लिए यहां क्लिक करें बटन पर क्लिक करें. इससे आपको बिलिंग प्रोफ़ाइल सेट अप करने वाले पेज पर भेज दिया जाएगाबिलिंग प्रोफ़ाइल पेज सेट अप करना
  3. पुष्टि करें पर क्लिक करें. अब आप Google Cloud Platform के ट्रायल बिलिंग खाते से कनेक्ट हो गए हैं.बिलिंग की खास जानकारी देने वाले पेज का स्क्रीनशॉट

निजी बिलिंग खाता सेट अप करना

अगर आपने Google Cloud क्रेडिट का इस्तेमाल करके बिलिंग सेट अप की है, तो इस चरण को छोड़ा जा सकता है.

निजी बिलिंग खाता सेट अप करने के लिए, Cloud Console में बिलिंग की सुविधा चालू करने के लिए यहां जाएं.

ध्यान दें:

  • इस लैब को पूरा करने में, Cloud संसाधनों पर 1 डॉलर से कम का खर्च आना चाहिए.
  • ज़्यादा शुल्क से बचने के लिए, इस लैब के आखिर में दिए गए निर्देशों का पालन करके संसाधनों को मिटाया जा सकता है.
  • नए उपयोगकर्ता, 300 डॉलर के मुफ़्त में आज़माने की सुविधा का फ़ायदा पा सकते हैं.

प्रोजेक्ट बनाना (ज़रूरी नहीं)

अगर आपके पास कोई ऐसा मौजूदा प्रोजेक्ट नहीं है जिसका इस्तेमाल आपको इस लैब के लिए करना है, तो यहां नया प्रोजेक्ट बनाएं.

5. Cloud Shell Editor खोलें

  1. सीधे Cloud Shell Editor पर जाने के लिए, इस लिंक पर क्लिक करें
  2. अगर आज किसी भी समय अनुमति देने के लिए कहा जाता है, तो जारी रखने के लिए अनुमति दें पर क्लिक करें.Cloud Shell को अनुमति देने के लिए क्लिक करें
  3. अगर टर्मिनल स्क्रीन पर सबसे नीचे नहीं दिखता है, तो इसे खोलें:
    • देखें पर क्लिक करें
    • टर्मिनलCloud Shell Editor में नया टर्मिनल खोलें पर क्लिक करें
  4. टर्मिनल में, इस कमांड का इस्तेमाल करके अपना प्रोजेक्ट सेट करें:
    gcloud config set project [PROJECT_ID]
    
    • उदाहरण:
      gcloud config set project lab-project-id-example
      
    • अगर आपको अपना प्रोजेक्ट आईडी याद नहीं है, तो इन कमांड का इस्तेमाल करके अपने सभी प्रोजेक्ट आईडी की सूची देखी जा सकती है:
      gcloud projects list
      
      Cloud Shell Editor के टर्मिनल में प्रोजेक्ट आईडी सेट करना
  5. आपको यह मैसेज दिखेगा:
    Updated property [core/project].
    

6. एपीआई चालू करें

Agent Development Kit और Vertex AI Search का इस्तेमाल करने के लिए, आपको अपने Google Cloud प्रोजेक्ट में ज़रूरी एपीआई चालू करने होंगे.

  1. टर्मिनल में, इन एपीआई को चालू करें:
    gcloud services enable \
        aiplatform.googleapis.com \
        discoveryengine.googleapis.com
    

एपीआई के बारे में जानकारी

  • Vertex AI API (aiplatform.googleapis.com) की मदद से, एजेंट को Gemini मॉडल के साथ बातचीत करने की सुविधा मिलती है. इससे एजेंट को तर्क देने और जवाब जनरेट करने में मदद मिलती है.
  • Discovery Engine API (discoveryengine.googleapis.com) की मदद से, Vertex AI Search काम करता है. इससे आपको डेटा स्टोर बनाने और अपने अनस्ट्रक्चर्ड दस्तावेज़ों पर सिमैंटिक सर्च करने की सुविधा मिलती है.

7. एनवायरमेंट सेट अप करना

एआई एजेंट को कोड करने से पहले, आपको डेवलपमेंट एनवायरमेंट तैयार करना होगा. साथ ही, ज़रूरी लाइब्रेरी इंस्टॉल करनी होंगी और ज़रूरी डेटा फ़ाइलें बनानी होंगी.

वर्चुअल एनवायरमेंट बनाना और डिपेंडेंसी इंस्टॉल करना

  1. अपने एजेंट के लिए एक डायरेक्ट्री बनाएं और उसमें जाएं. टर्मिनल में यह कोड चलाएं:
    mkdir financial_agent
    cd financial_agent
    
  2. वर्चुअल एनवायरमेंट बनाएं:
    uv venv --python 3.12
    
  3. वर्चुअल एनवायरमेंट चालू करें:
    source .venv/bin/activate
    
  4. एजेंट डेवलपमेंट किट (एडीके) और pandas इंस्टॉल करें.
    uv pip install google-adk pandas
    

शेयर की कीमत का डेटा बनाना

लैब को स्टॉक के पुराने डेटा की ज़रूरत होती है, ताकि यह दिखाया जा सके कि एजेंट, स्ट्रक्चर्ड टूल का इस्तेमाल कर सकता है या नहीं. इसलिए, आपको इस डेटा वाली एक CSV फ़ाइल बनानी होगी.

  1. financial_agent डायरेक्ट्री में, goog.csv फ़ाइल बनाएं. इसके लिए, टर्मिनल में यह कमांड चलाएं:
    cat <<EOF > goog.csv
    Date,Open,High,Low,Close,Adj Close,Volume
    2023-01-03,89.830002,91.550003,89.019997,89.699997,89.699997,20738500
    2023-03-31,101.440002,103.889999,101.040001,103.730003,103.730003,36823200
    2023-06-30,120.870003,122.029999,120.300003,120.970001,120.970001,23824700
    2023-09-29,134.080002,134.550003,131.320007,131.850006,131.850006,21124200
    2025-07-10,185.000000,188.000000,184.500000,186.500000,186.500000,25000000
    EOF
    

एनवायरमेंट वैरिएबल कॉन्फ़िगर करना

  1. financial_agent डायरेक्ट्री में, अपने एजेंट के एनवायरमेंट वैरिएबल को कॉन्फ़िगर करने के लिए, .env फ़ाइल बनाएं. इससे ADK को पता चलता है कि किस प्रोजेक्ट, जगह, और मॉडल का इस्तेमाल करना है. टर्मिनल में यह कोड चलाएं:
    # Create the .env file using the captured variables
    cat << EOF > .env
    GOOGLE_GENAI_USE_VERTEXAI=TRUE
    GOOGLE_CLOUD_PROJECT="${GOOGLE_CLOUD_PROJECT}"
    GOOGLE_CLOUD_LOCATION="us-central1"
    EOF
    

ध्यान दें: लैब में बाद में, अगर आपको .env फ़ाइल में बदलाव करना है, लेकिन आपको वह financial_agent डायरेक्ट्री में नहीं दिख रही है, तो "देखें / छिपी हुई फ़ाइलें टॉगल करें" मेन्यू आइटम का इस्तेमाल करके, Cloud Shell Editor में छिपी हुई फ़ाइलों को दिखाने की सुविधा को टॉगल करें.

छिपी हुई फ़ाइलों को टॉगल करें

8. Vertex AI Search में डेटा स्टोर बनाना

एजेंट को Alphabet की फ़ाइनेंशियल रिपोर्ट के बारे में सवालों के जवाब देने की सुविधा चालू करने के लिए, आपको Vertex AI Search डेटा स्टोर बनाना होगा. इसमें Alphabet की सार्वजनिक एसईसी फ़ाइलिंग शामिल होंगी.

  1. नए ब्राउज़र टैब में, Cloud Console (console.cloud.google.com) खोलें. इसके बाद, सबसे ऊपर मौजूद खोज बार का इस्तेमाल करके, एआई ऐप्लिकेशन पर जाएं.
    एआई का इस्तेमाल
  2. अगर आपसे कहा जाए, तो नियम और शर्तों वाले चेकबॉक्स को चुनें. इसके बाद, जारी रखें और एपीआई चालू करें पर क्लिक करें.
  3. बाईं ओर मौजूद नेविगेशन मेन्यू में जाकर, डेटा स्टोर चुनें.
    डेटा स्टोर
  4. + डेटा स्टोर बनाएं पर क्लिक करें.
  5. Cloud Storage कार्ड ढूंढें और चुनें पर क्लिक करें.
    डेटा स्टोर - GCS
  6. डेटा सोर्स के लिए, अनस्ट्रक्चर्ड दस्तावेज़ चुनें.
    डेटा स्टोर - अनस्ट्रक्चर्ड दस्तावेज़
  7. इंपोर्ट सोर्स के लिए, Google Cloud Storage का पाथ डालें cloud-samples-data/gen-app-builder/search/alphabet-sec-filings. इंपोर्ट सोर्स के लिए, वह फ़ोल्डर या फ़ाइल चुनें जिसे आपको इंपोर्ट करना है.
  8. जारी रखें पर क्लिक करें.
  9. जगह की जानकारी को global पर सेट रखें.
  10. डेटा स्टोर के नाम के लिए, यह डालें
    alphabet-sec-filings
    
  11. दस्तावेज़ प्रोसेस करने के विकल्प सेक्शन को बड़ा करें.
    डेटा स्टोर - प्रोसेसिंग के विकल्प
  12. डिफ़ॉल्ट दस्तावेज़ पार्सर ड्रॉपडाउन सूची में, लेआउट पार्सर चुनें.
    डेटा स्टोर - लेआउट पार्सर
  13. लेआउट पार्सर की सेटिंग के विकल्पों में जाकर, टेबल एनोटेशन चालू करें और इमेज एनोटेशन चालू करें को चुनें.
  14. जारी रखें पर क्लिक करें.
  15. कीमत के मॉडल के तौर पर सामान्य कीमत चुनें. इसके बाद, बनाएं पर क्लिक करें.
  16. आपका डेटा स्टोर, दस्तावेज़ों को इंपोर्ट करना शुरू कर देगा.
    डेटा स्टोर - विकल्प चालू करें
  17. डेटा स्टोर के नाम पर क्लिक करें. इसके बाद, डेटा स्टोर टेबल से उसका आईडी कॉपी करें. आपको इसकी ज़रूरत अगले चरण में पड़ेगी.
    डेटा स्टोर - प्रॉपर्टी
  18. Cloud Shell Editor में .env फ़ाइल खोलें और डेटा स्टोर आईडी को DATA_STORE_ID="YOUR_DATA_STORE_ID" के तौर पर जोड़ें. YOUR_DATA_STORE_ID को पिछले चरण के आईडी से बदलें.ध्यान दें: डेटास्टोर में डेटा इंपोर्ट करने, पार्स करने, और इंडेक्स करने में कुछ मिनट लगेंगे. प्रोसेस की जांच करने के लिए, डेटा स्टोर के नाम पर क्लिक करके उसकी प्रॉपर्टी खोलें. इसके बाद, गतिविधि टैब खोलें. स्टेटस के "इंपोर्ट पूरा हो गया" होने का इंतज़ार करें. डेटा स्टोर - गतिविधि

9. स्ट्रक्चर्ड डेटा के लिए कस्टम टूल बनाना

इसके बाद, आपको एक Python फ़ंक्शन बनाना होगा, जो एजेंट के लिए टूल के तौर पर काम करेगा. यह टूल, goog.csv फ़ाइल को पढ़ेगा, ताकि किसी तारीख के लिए स्टॉक की पुरानी कीमतें मिल सकें.

  1. अपनी financial_agent डायरेक्ट्री में, agent.py नाम की एक नई फ़ाइल बनाएं. टर्मिनल में यह कमांड चलाएं:
    cloudshell edit agent.py
    
  2. agent.py में यह Python कोड जोड़ें. यह कोड, डिपेंडेंसी इंपोर्ट करता है और get_stock_price फ़ंक्शन को तय करता है.
    from datetime import datetime
    import os
    import logging
    
    import google.cloud.logging
    from google.adk.tools import VertexAiSearchTool
    from google.adk.tools.agent_tool import AgentTool
    from google.adk.agents import LlmAgent
    
    import pandas as pd
    
    def get_stock_price(date: str) -> dict:
        """Gets the closing stock price for a given date.
    
        Args:
            date: The date to get the stock price for, in YYYY-MM-DD format.
    
        Returns:
            A dictionary containing the closing price, or an error message if the
            date is not found or the format is incorrect.
        """
        try:
            # Load the CSV file
            df = pd.read_csv('goog.csv')
            # Convert the 'Date' column to datetime objects
            df['Date'] = pd.to_datetime(df['Date'])
            # Convert the input string to a datetime object
            query_date = datetime.strptime(date, '%Y-%m-%d')
            # Find the row for the given date
            row = df[df['Date'] == query_date]
    
            if not row.empty:
                # Get the closing price
                close_price = row['Close'].iloc[0]
                return {"status": "success", "date": date, "closing_price": close_price}
            else:
                return {"status": "error", "message": f"No data found for date: {date}"}
        except FileNotFoundError:
            return {"status": "error", "message": "Stock data file (goog.csv) not found."}
        except Exception as e:
            return {"status": "error", "message": f"An error occurred: {str(e)}"}
    

फंक्शन की पूरी जानकारी देने वाली डॉकस्ट्रिंग पर ध्यान दें. इसमें बताया गया है कि फ़ंक्शन क्या करता है, इसके पैरामीटर (Args) क्या हैं, और यह क्या दिखाता है (Returns). ADK इस डॉकस्ट्रिंग का इस्तेमाल करके, एजेंट को यह सिखाता है कि इस टूल का इस्तेमाल कब और कैसे करना है.

10. आरएजी एजेंट बनाना और उसे चलाना

अब एजेंट को असेंबल करने का समय है. अनस्ट्रक्चर्ड डेटा के लिए, Vertex AI Search टूल को स्ट्रक्चर्ड डेटा के लिए बनाए गए अपने कस्टम get_stock_price टूल के साथ जोड़ें.

  1. अपनी agent.py फ़ाइल में यह कोड जोड़ें. यह कोड, ज़रूरी ADK क्लास इंपोर्ट करता है, टूल के इंस्टेंस बनाता है, और एजेंट को तय करता है.
    logging.basicConfig(level=logging.INFO)
    cloud_logging_client = google.cloud.logging.Client()
    cloud_logging_client.setup_logging()
    
    # 1. Create the Vertex AI Search tool
    full_datastore_id = f"projects/{os.environ['GOOGLE_CLOUD_PROJECT']}/locations/global/collections/default_collection/dataStores/{os.environ['DATA_STORE_ID']}"
    vertex_ai_search_tool = VertexAiSearchTool(
        data_store_id=full_datastore_id
    )
    
    # 2. Define the Search+Q&A agent
    # Since we cannot combine tools with other tools in a single agent,
    # we create a separate Search+Q&A agent which will be used as a tool by the main root agent.
    
    doc_qa_agent = LlmAgent(
        name="search_and_qna_agent",
        model="gemini-2.5-flash",
        tools=[vertex_ai_search_tool],
        instruction="""You are a helpful assistant that answers questions based on information found in the document store.
        Use the search tool to find relevant information before answering.
        If the answer isn't in the documents, say that you couldn't find the information.
        """,
        description="Answers questions using a specific Vertex AI Search datastore.",
    )
    
    # 3. Define the root agent with 2 tools.
    
    root_agent = LlmAgent(
        name="financial_agent",
        model="gemini-2.5-flash",
        tools=[
            AgentTool(doc_qa_agent),
            get_stock_price,
        ],
        instruction="""You are an Financial Analytics Agent that answers question about Alphabet stock prices (using get_stock_price tool)
        and historical performance based on the data in Vertex AI Search datastore (using doc_qa_agent tool)."""
    )
    
  2. अपने टर्मिनल में, financial_agent डायरेक्ट्री में जाकर, ADK का वेब इंटरफ़ेस लॉन्च करें, ताकि अपने एजेंट के साथ इंटरैक्ट किया जा सके:
    adk web ~
    
  3. अपने ब्राउज़र में ADK Dev UI खोलने के लिए, टर्मिनल आउटपुट में दिए गए लिंक (आम तौर पर http://127.0.0.1:8000) पर क्लिक करें.

11. एजेंट को टेस्ट करना

अब अपने एजेंट की तर्क करने की क्षमता की जांच की जा सकती है. साथ ही, मुश्किल सवालों के जवाब देने के लिए, उसके टूल इस्तेमाल किए जा सकते हैं.

  1. ADK Dev UI में, पक्का करें कि ड्रॉपडाउन मेन्यू से financial_agent चुना गया हो.
  2. ऐसा सवाल पूछें जिसके लिए, एसईसी फ़ाइलिंग (अनस्ट्रक्चर्ड डेटा) से जानकारी की ज़रूरत हो. चैट में यह क्वेरी डालें:
    What were the total revenues for the quarter ending on March 31, 2023?
    
    एजेंट को search_and_qna_agent को कॉल करना चाहिए. यह VertexAiSearchTool का इस्तेमाल करके, वित्तीय दस्तावेज़ों में जवाब ढूंढता है.
  3. इसके बाद, ऐसा सवाल पूछें जिसके लिए आपके कस्टम टूल (स्ट्रक्चर्ड डेटा) का इस्तेमाल करना ज़रूरी हो. ध्यान दें कि प्रॉम्प्ट में तारीख का फ़ॉर्मैट, फ़ंक्शन के लिए ज़रूरी फ़ॉर्मैट से पूरी तरह मेल खाना ज़रूरी नहीं है. एलएलएम इसे फिर से फ़ॉर्मैट करने में सक्षम है.
    What was the closing stock price for Alphabet on July 10, 2025?
    
    एजेंट को आपके get_stock_price टूल पर कॉल करना चाहिए. फ़ंक्शन कॉल और उसके नतीजे की जांच करने के लिए, चैट में मौजूद टूल आइकॉन पर क्लिक करें.
  4. आखिर में, कोई ऐसा मुश्किल सवाल पूछें जिसके लिए एजेंट को दोनों टूल का इस्तेमाल करना पड़े और नतीजों को एक साथ जोड़ना पड़े.
    According to the 10-Q filing for the period ending March 31, 2023, what were the company's net cash provided by operating activities, and what was the stock's closing price on that date?
    
    इस क्वेरी से, एजेंट को कई चरणों वाला प्लान बनाने के लिए मजबूर किया जाएगा:
    • सबसे पहले, यह VertexAiSearchTool का इस्तेमाल करके, एसईसी फ़ाइलिंग में कैश फ़्लो की जानकारी ढूंढेगा.
    • इसके बाद, यह शेयर की कीमत की ज़रूरत को समझेगा और तारीख 2023-03-31 के साथ get_stock_price फ़ंक्शन को कॉल करेगा.
    • आखिर में, यह दोनों तरह की जानकारी को मिलाकर एक जवाब तैयार करेगा.
  5. जब आपका काम पूरा हो जाए, तो ब्राउज़र टैब को बंद करें. साथ ही, ADK सर्वर को रोकने के लिए टर्मिनल में CTRL+C दबाएं.

12. अपने टास्क के लिए कोई सेवा चुनना

Vertex AI Search, वेक्टर सर्च की ऐसी सेवा नहीं है जिसका इस्तेमाल सिर्फ़ आप कर सकते हैं. मैनेज की गई ऐसी सेवा का भी इस्तेमाल किया जा सकता है जो Retrieval-Augmented Generation के पूरे फ़्लो को अपने-आप पूरा करती है: Vertex AI RAG Engine.

Vertex AI RAG Engine

यह दस्तावेज़ों को शामिल करने से लेकर, उन्हें वापस पाने और फिर से रैंक करने तक की सभी प्रोसेस को मैनेज करता है. RAG इंजन, Pinecone और Weaviate जैसे कई वेक्टर स्टोर के साथ काम करता है.

आपके पास कई खास वेक्टर डेटाबेस को खुद होस्ट करने का विकल्प भी होता है. इसके अलावा, डेटाबेस इंजन में वेक्टर इंडेक्स की सुविधाओं का इस्तेमाल किया जा सकता है. जैसे, PostgreSQL सेवा में pgvector (जैसे, AlloyDB या BigQuery वेक्टर सर्च.

वेक्टर सर्च की सुविधा देने वाली कुछ अन्य सेवाएं ये हैं:

Google Cloud पर किसी सेवा को चुनने के बारे में सामान्य दिशा-निर्देश यहां दिए गए हैं:

  • अगर आपके पास पहले से ही काम करने वाला और अच्छी तरह से स्केल किया गया, वेक्टर सर्च का डू-इट-योरसेल्फ़ इन्फ़्रास्ट्रक्चर है, तो उसे Google Kubernetes Engine पर डिप्लॉय करें. जैसे, Weaviate या DIY PostgreSQL.
  • अगर आपका डेटा BigQuery, AlloyDB, Firestore या किसी अन्य डेटाबेस में है, तो वेक्टर सर्च की सुविधाओं का इस्तेमाल करें. अगर उस डेटाबेस में बड़ी क्वेरी के हिस्से के तौर पर, बड़े पैमाने पर सिमैंटिक सर्च की जा सकती है, तो ऐसा करें. उदाहरण के लिए, अगर आपके पास BigQuery टेबल में प्रॉडक्ट के ब्यौरे और/या इमेज हैं, तो टेक्स्ट और/या इमेज एम्बेड करने वाला कॉलम जोड़ने से, बड़े पैमाने पर मिलते-जुलते प्रॉडक्ट खोजने की सुविधा का इस्तेमाल किया जा सकेगा. ScANN सर्च की सुविधा वाले वेक्टर इंडेक्स, इंडेक्स में अरबों आइटम के साथ काम करते हैं.
  • अगर आपको मैनेज किए जा रहे प्लैटफ़ॉर्म पर, कम समय में और कम मेहनत में काम शुरू करना है, तो Vertex AI Search को चुनें. यह पूरी तरह से मैनेज किया जाने वाला सर्च इंजन और रिट्रीवर एपीआई है. यह एंटरप्राइज़ के उन जटिल इस्तेमाल के मामलों के लिए सबसे सही है जिनमें बेहतर क्वालिटी, स्केलेबिलिटी, और ऐक्सेस कंट्रोल की ज़रूरत होती है. इससे, एंटरप्राइज़ के अलग-अलग डेटा सोर्स से कनेक्ट करना आसान हो जाता है. साथ ही, कई सोर्स में खोज करने की सुविधा मिलती है.
  • अगर आपको डेवलपर के लिए ऐसा RAG इंजन चाहिए जिसे इस्तेमाल करना आसान हो और जिसमें ज़रूरत के हिसाब से बदलाव किया जा सके, तो Vertex AI RAG Engine का इस्तेमाल करें. यह तेज़ी से प्रोटोटाइपिंग और डेवलपमेंट को बढ़ावा देता है. साथ ही, इसमें फ़्लेक्सिबिलिटी भी बनी रहती है.
  • जवाब जनरेट करने के लिए, जानकारी खोजने की सुविधा को बेहतर बनाने वाले रेफ़रंस आर्किटेक्चर के बारे में जानें.

13. नतीजा

बधाई हो! आपने जानकारी खोजने की सुविधा के साथ एआई एजेंट को बना लिया है और उसकी जांच कर ली है. आपने यह सीखा:

  • Vertex AI Search की सिमैंटिक सर्च की बेहतर सुविधाओं का इस्तेमाल करके, बिना किसी स्ट्रक्चर वाले दस्तावेज़ों के लिए नॉलेज बेस बनाएं.
  • स्ट्रक्चर्ड डेटा को वापस पाने के टूल के तौर पर काम करने के लिए, कस्टम Python फ़ंक्शन बनाएं.
  • Gemini की मदद से काम करने वाले मल्टी-टूल एजेंट को बनाने के लिए, एजेंट डेवलपमेंट किट (एडीके) का इस्तेमाल करें.
  • एक ऐसा एजेंट बनाएं जो मुश्किल सवालों के जवाब देने के लिए, कई चरणों में तर्क कर सके. साथ ही, ऐसे सवालों के जवाब दे सके जिनके लिए कई सोर्स से जानकारी इकट्ठा करनी पड़ती है.

इस लैब में, एजेंटिक आरएजी के मुख्य सिद्धांतों के बारे में बताया गया है. यह Google Cloud पर, समझदार, सटीक, और कॉन्टेक्स्ट के हिसाब से काम करने वाले एआई ऐप्लिकेशन बनाने के लिए एक बेहतरीन आर्किटेक्चर है.

प्रोटोटाइप से लेकर प्रोडक्शन तक

यह लैब, Google Cloud की मदद से प्रोडक्शन-रेडी एआई बनाने के बारे में जानकारी देने वाले लर्निंग पाथ का हिस्सा है.

  • प्रोटोटाइप से लेकर प्रोडक्शन तक के सभी चरणों के बारे में जानने के लिए, पूरा पाठ्यक्रम देखें.
  • #ProductionReadyAI हैशटैग का इस्तेमाल करके, अपनी प्रोग्रेस शेयर करें.