Cloud Run वर्कर पूल पर, एक बार में जवाब देने वाले ADK एजेंट को होस्ट करने का तरीका

1. परिचय

खास जानकारी

इस कोडलैब में, एजेंट डेवलपमेंट किट (एडीके) का इस्तेमाल करके, बड़े पैमाने पर काम करने वाला एसिंक्रोनस एजेंट सिस्टम बनाने का तरीका बताया गया है. आपको Cloud Run वर्कर पूल बनाना होगा. यह ADK क्विकस्टार्ट वेदर एजेंट को होस्ट करेगा. यह PubSub पुल सदस्यता से प्रोसेसिंग टास्क करता है.

आपको क्या सीखने को मिलेगा

  • एजेंट डेवलपमेंट किट (एडीके) की मदद से, सिंगल-टर्न एजेंट बनाने का तरीका.
  • PubSub सदस्यता से डेटा पाने वाले Cloud Run वर्कर पूल को डिप्लॉय करने का तरीका.

2. शुरू करने से पहले

एपीआई चालू करें

इस कोडलैब का इस्तेमाल शुरू करने से पहले, इन एपीआई को चालू करें. इसके लिए, यह कमांड चलाएं:

gcloud services enable \
    run.googleapis.com \
    cloudbuild.googleapis.com \
    artifactregistry.googleapis.com \
    pubsub.googleapis.com \
    aiplatform.googleapis.com

3. सेटअप और ज़रूरी शर्तें

ज़रूरी संसाधन सेट अप करने के लिए, यह तरीका अपनाएं:

  1. इस कोडलैब के लिए एनवायरमेंट वैरिएबल सेट करें:
export PROJECT_ID=<YOUR_PROJECT_ID>
export REGION=europe-west1

# AR repo
export AR_REPO="codelab-agent-wp"

# Application Names
export WORKER_APP_NAME="multi-tool-agent-worker"

# Pub/Sub Resources
export MY_TOPIC="pull-pubsub-topic-agent"
export MY_SUBSCRIPTION="agent-wp-sub"

# Service Accounts
export WORKER_SA_NAME="agent-worker-sa"
export WORKER_SA_ADDRESS="${WORKER_SA_NAME}@${PROJECT_ID}.iam.gserviceaccount.com"

सेवा खाते बनाना

सुरक्षा के लिए, हम अपने वर्कर के लिए एक खास सेवा खाता बनाएंगे, ताकि उसके पास सिर्फ़ वे अनुमतियां हों जिनकी उसे ज़रूरत है.

वर्कर के लिए सेवा खाता बनाएं:

gcloud iam service-accounts create ${WORKER_SA_NAME} \
    --display-name="Service Account for ADK Agent Worker"

सेवा खाते को ज़रूरी भूमिकाएं असाइन करें. इसे Pub/Sub से मैसेज पाने होते हैं. साथ ही, ADK में इस्तेमाल किए गए Vertex AI मॉडल को शुरू करना होता है.

# Role for subscribing to Pub/Sub
gcloud projects add-iam-policy-binding ${PROJECT_ID} \
    --member="serviceAccount:${WORKER_SA_ADDRESS}" \
    --role="roles/pubsub.admin"

# Role for invoking Vertex AI
gcloud projects add-iam-policy-binding ${PROJECT_ID} \
    --member="serviceAccount:${WORKER_SA_ADDRESS}" \
    --role="roles/aiplatform.user"

Pub/Sub संसाधन बनाना

Pub/Sub का वह विषय बनाएं जो हमारी टास्क सूची के तौर पर काम करेगा.

gcloud pubsub topics create $MY_TOPIC

वर्कर के लिए, Pub/Sub सदस्यता बनाएं, ताकि वह मैसेज पुल कर सके.

gcloud pubsub subscriptions create $MY_SUBSCRIPTION --topic=$MY_TOPIC

4. Cloud Run वर्कर पूल बनाना

अपने प्रोजेक्ट agents-wp के लिए एक डायरेक्ट्री बनाएं.

mkdir agents-wp && cd agents-wp

Dockerfile बनाएं

touch Dockerfile

और अपनी Dockerfile में यह कॉन्टेंट जोड़ें

FROM python:3.11-slim
WORKDIR /app

# Create a non-root user
RUN adduser --disabled-password --gecos "" myuser

# Switch to the non-root user
USER myuser

# Set up environment variables
ENV PATH="/home/myuser/.local/bin:$PATH"

# Copy agent files
COPY --chown=myuser:myuser multi_tool_agent/ /app/multi_tool_agent/

# Install dependencies from requirements.txt
RUN pip install -r /app/multi_tool_agent/requirements.txt

# Set the entrypoint to run the agent as a worker
CMD ["python3", "/app/multi_tool_agent/main.py"]

इसके अंदर, multi_tool_agent नाम की एक सबडायरेक्ट्री बनाएं. फ़ोल्डर के नाम multi_tool_agent में मौजूद अंडरस्कोर पर ध्यान दें. यह फ़ोल्डर, उस ADK एजेंट के नाम से मेल खाना चाहिए जिसे आपको बाद में डिप्लॉय करना है.

mkdir multi_tool_agent && cd multi_tool_agent

__init__.py फ़ाइल बनाना

touch __init__.py

और __init__.py फ़ाइल में यह जोड़ें

from . import agent

agent.py फ़ाइल बनाना

touch agent.py

और agent.py फ़ाइल में यह कॉन्टेंट जोड़ें

import datetime
from zoneinfo import ZoneInfo

from google.adk.agents.llm_agent import Agent

def get_weather(city: str) -> dict:
    """Retrieves the current weather report for a specified city.

    Args:
        city (str): The name of the city for which to retrieve the weather report.

    Returns:
        dict: status and result or error msg.
    """
    print(f"--- Entering get_weather function for city: {city} ---")
    if city.lower() == "new york":
        result = {
            "status": "success",
            "report": (
                "The weather in New York is sunny with a temperature of 25 degrees"
                " Celsius (77 degrees Fahrenheit)."
            ),
        }
    else:
        result = {
            "status": "error",
            "error_message": f"Weather information for '{city}' is not available.",
        }
    print(f"--- Exiting get_weather function with result: {result} ---")
    return result


def get_current_time(city: str) -> dict:
    """Returns the current time in a specified city.

    Args:
        city (str): The name of the city for which to retrieve the current time.

    Returns:
        dict: status and result or error msg.
    """
    print(f"--- Entering get_current_time function for city: {city} ---")
    if city.lower() == "new york":
        tz_identifier = "America/New_York"
    else:
        result = {
            "status": "error",
            "error_message": (
                f"Sorry, I don't have timezone information for {city}."
            ),
        }
        print(f"--- Exiting get_current_time function with result: {result} ---")
        return result

    tz = ZoneInfo(tz_identifier)
    now = datetime.datetime.now(tz)
    report = (
        f'The current time in {city} is {now.strftime("%Y-%m-%d %H:%M:%S %Z%z")}'
    )
    result = {"status": "success", "report": report}
    print(f"--- Exiting get_current_time function with result: {result} ---")
    return result


print("--- Creating root_agent ---")
root_agent = Agent(
    name="weather_time_agent",
    model="gemini-2.5-flash",
    description=(
        "Agent to answer questions about the time and weather in a city."
    ),
    instruction=(
        "You are a helpful agent who can answer user questions about the time and weather in a city."
    ),
    tools=[get_weather, get_current_time],
)
print("--- root_agent created ---")

main.py फ़ाइल बनाना

touch main.py

और main.py फ़ाइल में यह जोड़ें

import asyncio
import os

from google.adk.runners import InMemoryRunner, Runner
from google.genai import types
from google.cloud import pubsub_v1

from agent import root_agent

# --- Runner-based Invocation with Proper Async Handling ---

APP_NAME = "multi_tool_agent_worker"
USER_ID = "pubsub_user"

async def process_message(runner: Runner, message_data: bytes):
    """Processes a single message using the agent runner."""
    print(f"Processing message: {message_data}")
    try:
        prompt = message_data.decode("utf-8")
        session = await runner.session_service.create_session(
            app_name=APP_NAME,
            user_id=USER_ID
        )
        final_response_text = ""
        async for event in runner.run_async(
            user_id=USER_ID,
            session_id=session.id,
            new_message=types.Content(
                role="user", parts=[types.Part.from_text(text=prompt)]
            ),
        ):
            if event.content and event.content.parts:
                if event.author != "user":
                    # Filter out thought parts to get only the final response text
                    final_response_text += "".join(
                        part.text or "" for part in event.content.parts if not part.thought
                    )
        print(f"Agent response: {final_response_text}")

    except Exception as e:
        print(f"Error processing message: {e}")

async def async_worker(queue: asyncio.Queue, runner: Runner):
    """Continuously gets messages from the queue and processes them."""
    while True:
        message = await queue.get()
        if message is None:  # Sentinel for stopping
            break
        await process_message(runner, message.data)
        message.ack()
        queue.task_done()


async def main():
    """Sets up the Pub/Sub subscriber and the async worker."""
    project_id = os.environ.get("GOOGLE_CLOUD_PROJECT")
    subscription_id = os.environ.get("SUBSCRIPTION_ID")

    if not project_id or not subscription_id:
        print("GOOGLE_CLOUD_PROJECT and SUBSCRIPTION_ID environment variables must be set.")
        return

    runner = InMemoryRunner(agent=root_agent, app_name=APP_NAME)
    message_queue = asyncio.Queue()

    subscriber = pubsub_v1.SubscriberClient()
    subscription_path = subscriber.subscription_path(project_id, subscription_id)

    loop = asyncio.get_running_loop()

    callback = lambda message: loop.call_soon_threadsafe(
        message_queue.put_nowait, message
    )

    print(f"Listening for messages on {subscription_path}...\n")
    streaming_pull_future = subscriber.subscribe(subscription_path, callback=callback)

    worker_task = asyncio.create_task(async_worker(message_queue, runner))

    try:
        # This will block until the subscription is cancelled or an error occurs.
        await loop.run_in_executor(None, streaming_pull_future.result)
    except KeyboardInterrupt:
        print("Shutting down...")
    finally:
        streaming_pull_future.cancel()
        await message_queue.put(None)  # Stop the worker
        await worker_task  # Wait for the worker to finish
        await runner.close()
        subscriber.close()


if __name__ == "__main__":
    try:
        asyncio.run(main())
    except KeyboardInterrupt:
        print("Exiting.")

requirements.txt फ़ाइल बनाना

touch requirements.txt

इसके बाद, requirements.txt फ़ाइल में यह कोड जोड़ें

google-adk
google-cloud-pubsub
google-cloud-aiplatform

आपके पास ऐसा फ़ोल्डर स्ट्रक्चर होना चाहिए

agents-wp
  - multi_tool_agent
      - __init__.py
      - agent.py
      - main.py
      - requirements.txt
  - Dockerfile

5. बनाना और डिप्लॉय करना

Artifact Registry में डेटा स्टोर करने की जगह बनाना

आपको कंटेनर इमेज सेव करने के लिए, किसी जगह की ज़रूरत होगी.

gcloud artifacts repositories create codelab-agent-wp \
    --repository-format=docker \
    --location=${REGION} \
    --description="Repo for Cloud Run source deployments"

कंटेनर इमेज बनाना

उस रूट agents-wp डायरेक्ट्री पर जाएं जहां आपकी Dockerfile मौजूद है

cd ..

और यहां दी गई बिल्ड कमांड चलाएं.

gcloud builds submit . --tag \
${REGION}-docker.pkg.dev/${PROJECT_ID}/${AR_REPO}/${WORKER_APP_NAME}:latest

Cloud Run पर डिप्लॉय करें

एजेंट वर्कर इमेज को डिप्लॉय करें.

gcloud beta run worker-pools deploy ${WORKER_APP_NAME} \
 --image=${REGION}-docker.pkg.dev/${PROJECT_ID}/${AR_REPO}/${WORKER_APP_NAME}:latest  \
 --service-account=${WORKER_SA_ADDRESS} \
 --region=${REGION} \
 --set-env-vars="SUBSCRIPTION_ID=${MY_SUBSCRIPTION}"  \
 --set-env-vars="PYTHONUNBUFFERED=1" \
 --set-env-vars="GOOGLE_GENAI_USE_VERTEXAI=1" \
 --set-env-vars="GOOGLE_CLOUD_PROJECT=${PROJECT_ID}" \
 --set-env-vars="GOOGLE_CLOUD_LOCATION=${REGION}"

6. एजेंट को टेस्ट करना

Pub/Sub विषय पर सीधे तौर पर कोई मैसेज पब्लिश करके, वर्कर की जांच की जा सकती है.

gcloud pubsub topics publish ${MY_TOPIC} --message="What is the weather in New York?"

Google Cloud Console में, इस कमांड को चलाकर अपनी मल्टी-टूल-एजेंट-वर्कर सेवा के लॉग देखे जा सकते हैं.

gcloud logging read 'resource.type="cloud_run_worker_pool" AND resource.labels.worker_pool_name="'$WORKER_APP_NAME'" AND resource.labels.location="'$REGION'"' --limit 10 --format="value(textPayload)"

आपको ऐसा आउटपुट दिखेगा जिससे पता चलेगा कि मैसेज मिल गया है और उसे प्रोसेस कर लिया गया है. इसके बाद, आपको एजेंट का जवाब दिखेगा.

Agent response: The weather in New York is sunny with a temperature of 25 degrees Celsius (77 degrees Fahrenheit).

7. बधाई हो!

कोडलैब पूरा करने के लिए बधाई!

हमारा सुझाव है कि वर्कर पूल और होस्ट एजेंट के बारे में जानने के लिए, Cloud Run का दस्तावेज़ पढ़ें.

हमने क्या-क्या कवर किया है

  • एजेंट डेवलपमेंट किट (एडीके) की मदद से, सिंगल-टर्न एजेंट बनाने का तरीका.
  • PubSub सदस्यता से डेटा पाने वाले Cloud Run वर्कर पूल को डिप्लॉय करने का तरीका.

8. व्यवस्थित करें

शुल्क से बचने के लिए, बनाए गए संसाधनों को मिटाएं.

Cloud Run worker pool मिटाना

gcloud beta run worker-pools delete ${WORKER_APP_NAME} --region=${REGION}

Pub/Sub संसाधन मिटाना

gcloud pubsub subscriptions delete ${MY_SUBSCRIPTION}

gcloud pubsub topics delete ${MY_TOPIC}

Artifact Registry रिपॉज़िटरी मिटाना

gcloud artifacts repositories delete ${AR_REPO} --location=$REGION

सेवा खाता मिटाना

gcloud iam service-accounts delete ${WORKER_SA_ADDRESS}

पूरे प्रोजेक्ट को मिटाने के लिए, संसाधन मैनेज करें पर जाएं. इसके बाद, दूसरे चरण में बनाया गया प्रोजेक्ट चुनें और मिटाएं को चुनें. प्रोजेक्ट मिटाने पर, आपको Cloud SDK में प्रोजेक्ट बदलने होंगे. gcloud projects list कमांड चलाकर, सभी उपलब्ध प्रोजेक्ट की सूची देखी जा सकती है.