1. परिचय
खास जानकारी
इस लैब में, आपको सामान्य चैटबॉट से आगे बढ़कर, डिस्ट्रिब्यूट किया गया मल्टी-एजेंट सिस्टम बनाना होगा.
एक एलएलएम सवालों के जवाब दे सकता है. हालांकि, असल ज़िंदगी में कई बार खास भूमिकाओं की ज़रूरत होती है. बैकएंड इंजीनियर से यूज़र इंटरफ़ेस (यूआई) डिज़ाइन करने के लिए नहीं कहा जाता. साथ ही, डिज़ाइनर से डेटाबेस क्वेरी को ऑप्टिमाइज़ करने के लिए नहीं कहा जाता. इसी तरह, हम खास एआई एजेंट बना सकते हैं. ये एजेंट, एक काम पर फ़ोकस करते हैं और मुश्किल समस्याओं को हल करने के लिए एक-दूसरे के साथ मिलकर काम करते हैं.
आपको कोर्स बनाने का सिस्टम बनाना होगा. इसमें ये शामिल होंगे:
- रिसर्चर एजेंट: ताज़ा जानकारी पाने के लिए,
google_searchका इस्तेमाल करता है. - जज एजेंट: रिसर्च की क्वालिटी और पूरी जानकारी के लिए उसकी आलोचना करना.
- कॉन्टेंट बिल्डर एजेंट: रिसर्च को व्यवस्थित कोर्स में बदलना.
- ऑर्केस्ट्रेटर एजेंट: यह एजेंट, वर्कफ़्लो और इन विशेषज्ञों के बीच बातचीत को मैनेज करता है.
ज़रूरी शर्तें
- Python की बुनियादी जानकारी.
- Google Cloud Console के बारे में जानकारी होना.
आपको क्या करना होगा
- टूल का इस्तेमाल करने वाले एजेंट (
researcher) को तय करें, जो वेब पर खोज कर सके. judgeके लिए, Pydantic की मदद से स्ट्रक्चर्ड आउटपुट लागू करो.- एजेंट-टू-एजेंट (A2A) प्रोटोकॉल का इस्तेमाल करके, रिमोट एजेंट से कनेक्ट करें.
- रिसर्चर और जज के बीच सुझाव/राय देने या शिकायत करने का तरीका बनाने के लिए,
LoopAgentबनाएं. - एडीके का इस्तेमाल करके, डिस्ट्रिब्यूट किए गए सिस्टम को स्थानीय तौर पर चलाएं.
- मल्टी-एजेंट सिस्टम को Google Cloud Run पर डिप्लॉय करें.
आर्किटेक्चर और ऑर्केस्ट्रेशन के सिद्धांत
कोड लिखने से पहले, आइए समझते हैं कि ये एजेंट एक साथ कैसे काम करते हैं. हम कोर्स बनाने की पाइपलाइन तैयार कर रहे हैं.
सिस्टम डिज़ाइन

एजेंट की मदद से ऑर्केस्ट्रेशन करना
स्टैंडर्ड एजेंट (जैसे, रिसर्चर) काम करते हैं. ऑर्केस्ट्रेटर एजेंट (जैसे, LoopAgent या SequentialAgent) अन्य एजेंट मैनेज करते हैं. उनके पास अपने टूल नहीं होते. उनका "टूल" काम सौंपना होता है.
LoopAgent: यह कोड मेंwhileलूप की तरह काम करता है. यह किसी शर्त के पूरा होने या ज़्यादा से ज़्यादा इटरेशन तक पहुंचने तक, एजेंट के क्रम को बार-बार चलाता है. हम इसका इस्तेमाल रिसर्च लूप के लिए करते हैं:- रिसर्चर को जानकारी मिलती है.
- जज इसकी समीक्षा करता है.
- अगर Judge "Fail" कहता है, तो EscalationChecker लूप को जारी रखने देता है.
- अगर Judge "पास" कहता है, तो EscalationChecker लूप को बंद कर देता है.
SequentialAgent: यह स्टैंडर्ड स्क्रिप्ट के तौर पर काम करता है. यह एजेंट को एक के बाद एक करके चलाता है. हम इसका इस्तेमाल हाई-लेवल पाइपलाइन के लिए करते हैं:- सबसे पहले, रिसर्च लूप को तब तक चलाएं, जब तक कि यह अच्छे डेटा के साथ पूरा न हो जाए.
- इसके बाद, कोर्स लिखने के लिए कॉन्टेंट बिल्डर का इस्तेमाल करें.
इन दोनों को मिलाकर, हम एक ऐसा मज़बूत सिस्टम बनाते हैं जो फ़ाइनल आउटपुट जनरेट करने से पहले, खुद ही गड़बड़ियों को ठीक कर सकता है.
2. सेटअप
एनवायरमेंट सेटअप करना
Cloud Shell खोलें: एक नया टैब खोलें और shell.cloud.google.com टाइप करें
स्टार्टर कोड पाना
- स्टार्टर रिपॉज़िटरी को अपनी होम डायरेक्ट्री में क्लोन करें:
cd ~ git clone https://github.com/amitkmaraj/prai-roadshow-lab-1-starter.git cd prai-roadshow-lab-1-starter - बिलिंग से ऑनरैंप क्रेडिट को जोड़ने के लिए, init स्क्रिप्ट चलाएं.
chmod +x ./init.sh ./init.sh - इस फ़ोल्डर को अपने एडिटर में खोलें.
एपीआई चालू करें
अब आपके पास एक नया प्रोजेक्ट है. इसलिए, Google Cloud की ज़रूरी सेवाएं चालू करने के लिए, यह निर्देश चलाएं:
gcloud services enable \
run.googleapis.com \
artifactregistry.googleapis.com \
cloudbuild.googleapis.com \
aiplatform.googleapis.com \
compute.googleapis.com
इसमें कुछ सेकंड लग सकते हैं.
डिपेंडेंसी इंस्टॉल करना
हम uv का इस्तेमाल, डिपेंडेंसी को तेज़ी से मैनेज करने के लिए करते हैं.
- प्रोजेक्ट की डिपेंडेंसी इंस्टॉल करें:
# Ensure you have uv installed: pip install uv uv sync - Google Cloud प्रोजेक्ट आईडी सेट करें.
- अहम जानकारी: Cloud Console के डैशबोर्ड में जाकर या
gcloud config get-value projectचलाकर, अपना प्रोजेक्ट आईडी देखा जा सकता है.
export GOOGLE_CLOUD_PROJECT=$(gcloud config get-value project) - अहम जानकारी: Cloud Console के डैशबोर्ड में जाकर या
- बाकी एनवायरमेंट वैरिएबल सेट करें:
चेतावनी: एनवायरमेंट वैरिएबल, नए टर्मिनल सेशन में नहीं बने रहते हैं. अगर आपने कोई नया टर्मिनल टैब खोला है, तो आपको एक्सपोर्ट करने के इन निर्देशों को फिर से चलाना ज़रूरी है.export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=true
3. 🕵️ रिसर्चर एजेंट

रिसर्चर एक विशेषज्ञ होता है. इसका काम सिर्फ़ जानकारी ढूंढना है. इसके लिए, इसे एक टूल का ऐक्सेस चाहिए: Google Search.
रिसर्चर को अलग क्यों किया गया है?
ज़्यादा जानकारी: एक ही एजेंट को सभी काम क्यों नहीं सौंपे जाते?
छोटे और खास मकसद के लिए बनाए गए एजेंटों का आकलन और डीबग करना आसान होता है. अगर रिसर्च सही नहीं है, तो रिसर्चर के प्रॉम्प्ट को दोहराएं. अगर कोर्स का फ़ॉर्मैट सही नहीं है, तो कॉन्टेंट बिल्डर का इस्तेमाल करके उसे ठीक करें. मोनोलिथिक "सब कुछ करने वाले" प्रॉम्प्ट में, किसी एक चीज़ को ठीक करने से अक्सर दूसरी चीज़ खराब हो जाती है.
- अगर Cloud Shell में काम किया जा रहा है, तो Cloud Shell एडिटर खोलने के लिए, यह कमांड चलाएं:
अगर आपको अपने लोकल एनवायरमेंट में काम करना है, तो अपना पसंदीदा IDE खोलें.cloudshell workspace . agents/researcher/agent.pyखोलें.- आपको एक TODO के साथ स्केलेटन दिखेगा.
researcherएजेंट को तय करने के लिए, यह कोड जोड़ें:# ... existing imports ... # Define the Researcher Agent researcher = Agent( name="researcher", model=MODEL, description="Gathers information on a topic using Google Search.", instruction=""" You are an expert researcher. Your goal is to find comprehensive and accurate information on the user's topic. Use the `google_search` tool to find relevant information. Summarize your findings clearly. If you receive feedback that your research is insufficient, use the feedback to refine your next search. """, tools=[google_search], ) root_agent = researcher
मुख्य सिद्धांत: टूल का इस्तेमाल
हम tools=[google_search] को नोटिस भेजते हैं. ADK, LLM को इस टूल के बारे में बताने की जटिलता को मैनेज करता है. जब मॉडल को लगता है कि उसे जानकारी की ज़रूरत है, तब वह स्ट्रक्चर्ड टूल कॉल जनरेट करता है. इसके बाद, ADK Python फ़ंक्शन google_search को लागू करता है और नतीजे को वापस मॉडल को भेजता है.
4. ⚖️ जज एजेंट

रिसर्चर कड़ी मेहनत करता है, लेकिन एलएलएम सुस्त हो सकते हैं. काम की समीक्षा करने के लिए, हमें जज की ज़रूरत है. जज, रिसर्च को स्वीकार करता है और पास/फ़ेल का आकलन करके जवाब देता है.
स्ट्रक्चर्ड आउटपुट
ज़्यादा जानकारी: वर्कफ़्लो को ऑटोमेट करने के लिए, हमें अनुमानित आउटपुट की ज़रूरत होती है. टेक्स्ट की लंबी-चौड़ी समीक्षा को प्रोग्राम के हिसाब से पार्स करना मुश्किल होता है. Pydantic का इस्तेमाल करके, JSON स्कीमा लागू करने से यह पक्का किया जाता है कि Judge, बूलियन pass या fail वैल्यू देता है. इस वैल्यू के आधार पर हमारा कोड भरोसेमंद तरीके से काम कर सकता है.
agents/judge/agent.pyखोलें.JudgeFeedbackस्कीमा औरjudgeएजेंट तय करें.# 1. Define the Schema class JudgeFeedback(BaseModel): """Structured feedback from the Judge agent.""" status: Literal["pass", "fail"] = Field( description="Whether the research is sufficient ('pass') or needs more work ('fail')." ) feedback: str = Field( description="Detailed feedback on what is missing. If 'pass', a brief confirmation." ) # 2. Define the Agent judge = Agent( name="judge", model=MODEL, description="Evaluates research findings for completeness and accuracy.", instruction=""" You are a strict editor. Evaluate the 'research_findings' against the user's original request. If the findings are missing key info, return status='fail'. If they are comprehensive, return status='pass'. """, output_schema=JudgeFeedback, # Disallow delegation because it should only output the schema disallow_transfer_to_parent=True, disallow_transfer_to_peers=True, ) root_agent = judge
मुख्य कॉन्सेप्ट: एजेंट के व्यवहार को सीमित करना
हम disallow_transfer_to_parent=True और disallow_transfer_to_peers=True सेट करते हैं. इससे जज को सिर्फ़ स्ट्रक्चर्ड JudgeFeedback वापस करने के लिए मजबूर किया जाता है. यह उपयोगकर्ता के साथ "चैट" करने या किसी दूसरे एजेंट को काम सौंपने का फ़ैसला नहीं कर सकता. इससे यह हमारे लॉजिक फ़्लो में एक डिटरमिनिस्टिक कॉम्पोनेंट बन जाता है.
5. 🧪 आइसोलेशन में टेस्टिंग
इन्हें कनेक्ट करने से पहले, हम यह पुष्टि कर सकते हैं कि हर एजेंट काम करता है. ADK की मदद से, एजेंट को अलग-अलग चलाया जा सकता है.
मुख्य कॉन्सेप्ट: इंटरैक्टिव रनटाइम
adk run एक लाइटवेट एनवायरमेंट बनाता है, जिसमें आपको "उपयोगकर्ता" के तौर पर ऐक्सेस मिलता है. इससे एजेंट के निर्देशों और टूल के इस्तेमाल की अलग से जांच की जा सकती है. अगर एजेंट यहां काम नहीं करता है (जैसे, Google Search का इस्तेमाल नहीं कर पाता), तो वह ऑर्केस्ट्रेशन में भी काम नहीं करेगा.
- रिसर्चर को इंटरैक्टिव तरीके से चलाएं. ध्यान दें कि हम एजेंट की खास डायरेक्ट्री की ओर इशारा करते हैं:
# This runs the researcher agent in interactive mode uv run adk run agents/researcher - चैट प्रॉम्प्ट में, यह टाइप करें:
इसे Google Search टूल का इस्तेमाल करना चाहिए और जवाब देना चाहिए.ध्यान दें: अगर आपको कोई ऐसी गड़बड़ी दिखती है जिसमें प्रोजेक्ट, जगह की जानकारी, और Vertex के इस्तेमाल के बारे में जानकारी नहीं दी गई है, तो पक्का करें कि आपका प्रोजेक्ट आईडी सेट हो. इसके बाद, यह कमांड चलाएं:Find the population of Tokyo in 2020export GOOGLE_CLOUD_PROJECT=$(gcloud config get-value project) export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=true - चैट से बाहर निकलें (Ctrl+C).
- जज को इंटरैक्टिव तरीके से चलाएं:
uv run adk run agents/judge - चैट प्रॉम्प्ट में, इनपुट को सिम्युलेट करें:
इसेTopic: Tokyo. Findings: Tokyo is a city.status='fail'जवाब देना चाहिए, क्योंकि जवाब में दी गई जानकारी बहुत कम है.
6. ✍️ कॉन्टेंट बिल्डर एजेंट

कॉन्टेंट बिल्डर, क्रिएटिव राइटर है. यह मंज़ूरी पा चुकी रिसर्च को कोर्स में बदल देता है.
agents/content_builder/agent.pyखोलें.content_builderएजेंट तय करें.content_builder = Agent( name="content_builder", model=MODEL, description="Transforms research findings into a structured course.", instruction=""" You are an expert course creator. Take the approved 'research_findings' and transform them into a well-structured, engaging course module. **Formatting Rules:** 1. Start with a main title using a single `#` (H1). 2. Use `##` (H2) for main section headings. 3. Use bullet points and clear paragraphs. 4. Maintain a professional but engaging tone. Ensure the content directly addresses the user's original request. """, ) root_agent = content_builder
मुख्य कॉन्सेप्ट: कॉन्टेक्स्ट प्रोपगेशन
आपके मन में यह सवाल आ सकता है कि "कॉन्टेंट बिल्डर को यह कैसे पता चलता है कि रिसर्चर ने क्या खोजा है?" ADK में, पाइपलाइन में मौजूद एजेंट session.state शेयर करते हैं. बाद में, Orchestrator में हम Researcher और Judge को कॉन्फ़िगर करेंगे, ताकि वे अपने आउटपुट को इस शेयर की गई स्थिति में सेव कर सकें. Content Builder के प्रॉम्प्ट के पास इस इतिहास का ऐक्सेस होता है.
7. 🎻 ऑर्केस्ट्रेटर

ऑर्केस्ट्रेटर, हमारी मल्टी-एजेंट टीम का मैनेजर होता है. विशेषज्ञ एजेंट (रिसर्चर, जज, कॉन्टेंट बिल्डर) खास टास्क पूरे करते हैं. हालांकि, ऑर्केस्ट्रेटर का काम वर्कफ़्लो को मैनेज करना और यह पक्का करना है कि उनके बीच जानकारी सही तरीके से शेयर हो.
🌐 आर्किटेक्चर: एजेंट-टू-एजेंट (A2A)

इस लैब में, हम डिस्ट्रिब्यूटेड सिस्टम बना रहे हैं. हम सभी एजेंट को एक ही Python प्रोसेस में चलाने के बजाय, उन्हें स्वतंत्र माइक्रोसेवाओं के तौर पर डिप्लॉय करते हैं. इससे हर एजेंट को अलग-अलग स्केल करने और पूरे सिस्टम को क्रैश किए बिना काम न करने की अनुमति मिलती है.
इसके लिए, हम Agent-to-Agent (A2A) प्रोटोकॉल का इस्तेमाल करते हैं.
A2A प्रोटोकॉल
ज़्यादा जानकारी: प्रोडक्शन सिस्टम में, एजेंट अलग-अलग सर्वर (या अलग-अलग क्लाउड) पर काम करते हैं. A2A प्रोटोकॉल, उन्हें एचटीटीपी पर एक-दूसरे को खोजने और उनसे बातचीत करने का एक स्टैंडर्ड तरीका उपलब्ध कराता है. RemoteA2aAgent, इस प्रोटोकॉल के लिए एडीके क्लाइंट है.
agents/orchestrator/agent.pyखोलें.- टिप्पणी
# TODO: Define Remote Agentsया रिमोट एजेंट की परिभाषाओं वाला सेक्शन ढूंढें. - कनेक्शन तय करने के लिए, यह कोड जोड़ें. पक्का करें कि आपने इसे इंपोर्ट किए गए एजेंट के बाद और किसी अन्य एजेंट की परिभाषाओं के पहले रखा हो.
# ... existing code ... # Connect to the Researcher (Localhost port 8001) researcher_url = os.environ.get("RESEARCHER_AGENT_CARD_URL", "http://localhost:8001/a2a/agent/.well-known/agent-card.json") researcher = RemoteA2aAgent( name="researcher", agent_card=researcher_url, description="Gathers information using Google Search.", # IMPORTANT: Save the output to state for the Judge to see after_agent_callback=create_save_output_callback("research_findings"), # IMPORTANT: Use authenticated client for communication httpx_client=create_authenticated_client(researcher_url) ) # Connect to the Judge (Localhost port 8002) judge_url = os.environ.get("JUDGE_AGENT_CARD_URL", "http://localhost:8002/a2a/agent/.well-known/agent-card.json") judge = RemoteA2aAgent( name="judge", agent_card=judge_url, description="Evaluates research.", after_agent_callback=create_save_output_callback("judge_feedback"), httpx_client=create_authenticated_client(judge_url) ) # Content Builder (Localhost port 8003) content_builder_url = os.environ.get("CONTENT_BUILDER_AGENT_CARD_URL", "http://localhost:8003/a2a/agent/.well-known/agent-card.json") content_builder = RemoteA2aAgent( name="content_builder", agent_card=content_builder_url, description="Builds the course.", httpx_client=create_authenticated_client(content_builder_url) )
8. 🛑 एस्केलेशन चेकर
लूप को रोकने का कोई तरीका होना चाहिए. अगर जज "पास" कहता है, तो हमें लूप से तुरंत बाहर निकलना है और कॉन्टेंट बिल्डर पर जाना है.
BaseAgent के साथ कस्टम लॉजिक
ज़्यादा जानकारी: सभी एजेंट, एलएलएम का इस्तेमाल नहीं करते. कभी-कभी आपको Python के सामान्य लॉजिक की ज़रूरत होती है. BaseAgent की मदद से, सिर्फ़ कोड चलाने वाला एजेंट तय किया जा सकता है. इस मामले में, हम सेशन की स्थिति की जांच करते हैं और EventActions(escalate=True) को रोकने के लिए, EventActions(escalate=True) का इस्तेमाल करते हैं.LoopAgent
- अब भी
agents/orchestrator/agent.pyमें है. EscalationCheckerTODO प्लेसहोल्डर ढूंढें.- इसे इस तरीके से बदलें:
class EscalationChecker(BaseAgent): """Checks the judge's feedback and escalates (breaks the loop) if it passed.""" async def _run_async_impl( self, ctx: InvocationContext ) -> AsyncGenerator[Event, None]: # Retrieve the feedback saved by the Judge feedback = ctx.session.state.get("judge_feedback") print(f"[EscalationChecker] Feedback: {feedback}") # Check for 'pass' status is_pass = False if isinstance(feedback, dict) and feedback.get("status") == "pass": is_pass = True # Handle string fallback if JSON parsing failed elif isinstance(feedback, str) and '"status": "pass"' in feedback: is_pass = True if is_pass: # 'escalate=True' tells the parent LoopAgent to stop looping yield Event(author=self.name, actions=EventActions(escalate=True)) else: # Continue the loop yield Event(author=self.name) escalation_checker = EscalationChecker(name="escalation_checker")
मुख्य कॉन्सेप्ट: इवेंट के ज़रिए कंट्रोल फ़्लो
एजेंट, सिर्फ़ टेक्स्ट से नहीं, बल्कि इवेंट से भी कम्यूनिकेट करते हैं. escalate=True के साथ इवेंट को यिल्ड करके, यह एजेंट अपने पैरंट (LoopAgent) को एक सिग्नल भेजता है. LoopAgent को इस सिग्नल को पकड़ने और लूप को खत्म करने के लिए प्रोग्राम किया गया है.
9. 🔁 रिसर्च लूप

हमें एक फ़ीडबैक लूप की ज़रूरत है: रिसर्च -> जज -> (फ़ेल) -> रिसर्च -> ...
- अब भी
agents/orchestrator/agent.pyमें है. research_loopकी परिभाषा जोड़ें. इसेEscalationCheckerक्लास औरescalation_checkerइंस्टेंस के बाद रखें.research_loop = LoopAgent( name="research_loop", description="Iteratively researches and judges until quality standards are met.", sub_agents=[researcher, judge, escalation_checker], max_iterations=3, )
मुख्य कॉन्सेप्ट: LoopAgent
LoopAgent, अपने sub_agents को क्रम से दिखाता है.
researcher: डेटा ढूंढता है.judge: डेटा का आकलन करता है.escalation_checker: यह तय करता है किyield Event(escalate=True)है या नहीं. अगरescalate=Trueहोता है, तो लूप जल्दी बंद हो जाता है. अगर ऐसा नहीं होता है, तो यह रिसर्चर (max_iterationsतक) के लिए फिर से शुरू हो जाता है.
10. 🔗 फ़ाइनल पाइपलाइन

आखिर में, सभी इमेज को एक साथ स्टिच करें.
- अब भी
agents/orchestrator/agent.pyमें है. - फ़ाइल में सबसे नीचे मौजूद
root_agentको तय करें. पक्का करें कि यह मौजूदाroot_agent = Noneप्लेसहोल्डर की जगह ले ले.root_agent = SequentialAgent( name="course_creation_pipeline", description="A pipeline that researches a topic and then builds a course from it.", sub_agents=[research_loop, content_builder], )
मुख्य सिद्धांत: क्रम के हिसाब से कंपोज़िशन
ध्यान दें कि research_loop खुद एक एजेंट (LoopAgent) है. हम इसे SequentialAgent में मौजूद किसी अन्य सब-एजेंट की तरह ही मानते हैं. इस कंपोज़ेबिलिटी की मदद से, आसान पैटर्न (सीक्वेंस के अंदर लूप, राउटर के अंदर सीक्वेंस वगैरह) को नेस्ट करके, जटिल लॉजिक बनाया जा सकता है.
11. 💻 स्थानीय तौर पर चलाना
सब कुछ चलाने से पहले, आइए देखते हैं कि ADK, डिस्ट्रिब्यूट किए गए एनवायरमेंट को स्थानीय तौर पर कैसे सिम्युलेट करता है.
ज़्यादा जानकारी: लोकल डेवलपमेंट कैसे काम करता है
माइक्रोसर्विसेज़ आर्किटेक्चर में, हर एजेंट अपने सर्वर के तौर पर काम करता है. डप्लॉय करने पर, आपके पास चार अलग-अलग Cloud Run सेवाएं होंगी. अगर आपको चार टर्मिनल टैब खोलने हैं और चार कमांड चलाने हैं, तो इसे स्थानीय तौर पर सिम्युलेट करना मुश्किल हो सकता है.
यह स्क्रिप्ट, रिसर्चर (पोर्ट 8001), जज (8002), और कॉन्टेंट बिल्डर (8003) के लिए uvicorn प्रोसेस शुरू करती है. यह RESEARCHER_AGENT_CARD_URL जैसे एनवायरमेंट वैरिएबल सेट करता है और उन्हें ऑर्केस्ट्रेटर (पोर्ट 8004) को पास करता है. हम इसे बाद में क्लाउड में इसी तरह कॉन्फ़िगर करेंगे!

- ऑर्केस्ट्रेशन स्क्रिप्ट चलाएं:
इससे चार अलग-अलग प्रोसेस शुरू होती हैं../run_local.sh - इसे आज़माएं:
- Cloud Shell का इस्तेमाल करने पर: वेब झलक बटन (टर्मिनल में सबसे ऊपर दाईं ओर) -> पोर्ट 8080 पर झलक देखें -> पोर्ट बदलें पर क्लिक करके
8000पर सेट करें. - अगर स्थानीय तौर पर चल रहा है: अपने ब्राउज़र में
http://localhost:8000खोलें. - प्रॉम्प्ट: "कॉफ़ी के इतिहास के बारे में एक कोर्स बनाओ."
- देखें: Orchestrator, रिसर्चर को कॉल करेगा. आउटपुट, जज को भेजा जाता है. अगर जज इसे स्वीकार नहीं करता है, तो यह लूप जारी रहता है!
- "इंटरनल सर्वर की गड़बड़ी" / पुष्टि करने से जुड़ी गड़बड़ियां: अगर आपको पुष्टि करने से जुड़ी गड़बड़ियां दिखती हैं (जैसे,
google-authसे जुड़ी), तो पक्का करें कि आपनेgcloud auth application-default loginचलाया हो. ऐसा तब करें, जब इसे लोकल मशीन पर चलाया जा रहा हो. Cloud Shell में, पक्का करें कि आपकाGOOGLE_CLOUD_PROJECTएनवायरमेंट वैरिएबल सही तरीके से सेट किया गया हो. - टर्मिनल से जुड़ी गड़बड़ियां: अगर नई टर्मिनल विंडो में कमांड काम नहीं करती है, तो अपने एनवायरमेंट वैरिएबल (
GOOGLE_CLOUD_PROJECTवगैरह) को फिर से एक्सपोर्ट करना न भूलें.
- Cloud Shell का इस्तेमाल करने पर: वेब झलक बटन (टर्मिनल में सबसे ऊपर दाईं ओर) -> पोर्ट 8080 पर झलक देखें -> पोर्ट बदलें पर क्लिक करके
- अलग-अलग एजेंट की टेस्टिंग: पूरा सिस्टम चालू होने पर भी, सीधे तौर पर उनके पोर्ट को टारगेट करके, खास एजेंट की टेस्टिंग की जा सकती है. यह पूरी चेन को ट्रिगर किए बिना, किसी कॉम्पोनेंट को डीबग करने के लिए काम आता है.
- सिर्फ़ रिसर्चर के लिए (पोर्ट 8001):
http://localhost:8001 - सिर्फ़ जज करें (पोर्ट 8002):
http://localhost:8002 - सिर्फ़ Content Builder (पोर्ट 8003):
http://localhost:8003 - ऑर्केस्ट्रेटर (पोर्ट 8004):
http://localhost:8004(ऑर्केस्ट्रेटर लॉजिक को सीधे तौर पर ऐक्सेस करने की सुविधा)
- सिर्फ़ रिसर्चर के लिए (पोर्ट 8001):
12. 🚀 Cloud Run पर डिप्लॉय करें
क्लाउड में पुष्टि की जा रही है. हम हर एजेंट को एक अलग सेवा के तौर पर डिप्लॉय करेंगे.
डिप्लॉयमेंट कॉन्फ़िगरेशन के बारे में जानकारी
Cloud Run पर एजेंट डिप्लॉय करते समय, हम कई एनवायरमेंट वैरिएबल पास करते हैं. इनसे एजेंट के व्यवहार और कनेक्टिविटी को कॉन्फ़िगर किया जाता है:
GOOGLE_CLOUD_PROJECT: इससे यह पक्का किया जाता है कि एजेंट, लॉगिंग और Vertex AI कॉल के लिए सही Google Cloud प्रोजेक्ट का इस्तेमाल करे.GOOGLE_GENAI_USE_VERTEXAI: यह एजेंट फ़्रेमवर्क (ADK) को बताता है कि मॉडल इन्फ़रेंस के लिए, Gemini API को सीधे तौर पर कॉल करने के बजाय Vertex AI का इस्तेमाल करें.[AGENT]_AGENT_CARD_URL: यह Orchestrator के लिए ज़रूरी है. इससे Orchestrator को यह पता चलता है कि रिमोट एजेंट कहां मिलेंगे. इसे डिप्लॉय किए गए Cloud Run यूआरएल (खास तौर पर एजेंट कार्ड पाथ) पर सेट करके, हम Orchestrator को इंटरनेट पर Researcher, Judge, और Content Builder को खोजने और उनसे कम्यूनिकेट करने की अनुमति देते हैं.
- रिसर्चर को डिप्लॉय करना:
यूआरएल कैप्चर करें:gcloud run deploy researcher \ --source agents/researcher/ \ --region us-central1 \ --allow-unauthenticated \ --labels dev-tutorial=prod-ready-1 \ --set-env-vars GOOGLE_CLOUD_PROJECT=$GOOGLE_CLOUD_PROJECT \ --set-env-vars GOOGLE_GENAI_USE_VERTEXAI="true"RESEARCHER_URL=$(gcloud run services describe researcher --region us-central1 --format='value(status.url)') echo $RESEARCHER_URL - जज को डिप्लॉय करना:
यूआरएल कैप्चर करें:gcloud run deploy judge \ --source agents/judge/ \ --region us-central1 \ --allow-unauthenticated \ --labels dev-tutorial=prod-ready-1 \ --set-env-vars GOOGLE_CLOUD_PROJECT=$GOOGLE_CLOUD_PROJECT \ --set-env-vars GOOGLE_GENAI_USE_VERTEXAI="true"JUDGE_URL=$(gcloud run services describe judge --region us-central1 --format='value(status.url)') echo $JUDGE_URL - Content Builder को डिप्लॉय करना:
यूआरएल कैप्चर करें:gcloud run deploy content-builder \ --source agents/content_builder/ \ --region us-central1 \ --allow-unauthenticated \ --labels dev-tutorial=prod-ready-1 \ --set-env-vars GOOGLE_CLOUD_PROJECT=$GOOGLE_CLOUD_PROJECT \ --set-env-vars GOOGLE_GENAI_USE_VERTEXAI="true"CONTENT_BUILDER_URL=$(gcloud run services describe content-builder --region us-central1 --format='value(status.url)') echo $CONTENT_BUILDER_URL - ऑर्केस्ट्रेटर को डिप्लॉय करें: कैप्चर किए गए एनवायरमेंट वैरिएबल का इस्तेमाल करके, ऑर्केस्ट्रेटर को कॉन्फ़िगर करें.
यूआरएल कैप्चर करें:gcloud run deploy orchestrator \ --source agents/orchestrator/ \ --region us-central1 \ --allow-unauthenticated \ --labels dev-tutorial=prod-ready-1 \ --set-env-vars RESEARCHER_AGENT_CARD_URL=$RESEARCHER_URL/a2a/agent/.well-known/agent-card.json \ --set-env-vars JUDGE_AGENT_CARD_URL=$JUDGE_URL/a2a/agent/.well-known/agent-card.json \ --set-env-vars CONTENT_BUILDER_AGENT_CARD_URL=$CONTENT_BUILDER_URL/a2a/agent/.well-known/agent-card.json \ --set-env-vars GOOGLE_CLOUD_PROJECT=$GOOGLE_CLOUD_PROJECT \ --set-env-vars GOOGLE_GENAI_USE_VERTEXAI="true"ORCHESTRATOR_URL=$(gcloud run services describe orchestrator --region us-central1 --format='value(status.url)') echo $ORCHESTRATOR_URL - फ़्रंटएंड डिप्लॉय करना:
gcloud run deploy course-creator \ --source app \ --region us-central1 \ --allow-unauthenticated \ --labels dev-tutorial=prod-ready-1 \ --set-env-vars AGENT_SERVER_URL=$ORCHESTRATOR_URL \ --set-env-vars GOOGLE_CLOUD_PROJECT=$GOOGLE_CLOUD_PROJECT - रिमोट डिप्लॉयमेंट की जांच करें: डिप्लॉय किए गए Orchestrator का यूआरएल खोलें. अब यह पूरी तरह से क्लाउड में चल रहा है. साथ ही, यह Google के सर्वरलेस इंफ़्रास्ट्रक्चर का इस्तेमाल करके, आपके एजेंट को स्केल कर रहा है!अहम जानकारी: आपको सभी माइक्रो-सेवाएं और उनके यूआरएल, Cloud Run इंटरफ़ेस में मिलेंगे
13. खास जानकारी
बधाई हो! आपने प्रोडक्शन के लिए तैयार, डिस्ट्रिब्यूट किया गया मल्टी-एजेंट सिस्टम बना लिया है और उसे डिप्लॉय कर दिया है.
हमने क्या-क्या हासिल किया
- मुश्किल टास्क को छोटे-छोटे हिस्सों में बांटा गया: हमने एक बड़े प्रॉम्प्ट के बजाय, काम को अलग-अलग भूमिकाओं (रिसर्चर, जज, कॉन्टेंट बिल्डर) में बांटा.
- क्वालिटी कंट्रोल लागू किया गया: हमने
LoopAgentऔर स्ट्रक्चर्डJudgeका इस्तेमाल किया, ताकि यह पक्का किया जा सके कि फ़ाइनल चरण में सिर्फ़ अच्छी क्वालिटी की जानकारी पहुंचे. - प्रोडक्शन के लिए बनाया गया: हमने Agent-to-Agent (A2A) प्रोटोकॉल और Cloud Run का इस्तेमाल करके एक ऐसा सिस्टम बनाया है जिसमें हर एजेंट एक स्वतंत्र और स्केलेबल माइक्रोसेवा है. यह एक ही Python स्क्रिप्ट में सब कुछ चलाने से ज़्यादा बेहतर है.
- ऑर्केस्ट्रेशन: हमने कंट्रोल फ़्लो के पैटर्न को साफ़ तौर पर तय करने के लिए,
SequentialAgentऔरLoopAgentका इस्तेमाल किया.
अगले चरण
अब आपके पास बुनियादी जानकारी है. इसलिए, इस सिस्टम को बेहतर बनाया जा सकता है:
- ज़्यादा टूल जोड़ें: रिसर्चर को इंटरनल दस्तावेज़ों या एपीआई का ऐक्सेस दें.
- जज को बेहतर बनाएं: ज़्यादा खास मानदंड जोड़ें या "ह्यूमन इन द लूप" चरण जोड़ें.
- मॉडल बदलना: अलग-अलग एजेंट के लिए अलग-अलग मॉडल इस्तेमाल करके देखें. उदाहरण के लिए, जज के लिए तेज़ मॉडल और कॉन्टेंट राइटर के लिए बेहतर मॉडल.
अब आपके पास Google Cloud पर, भरोसेमंद और जटिल एजेंटिक वर्कफ़्लो बनाने का विकल्प है!