Tworzenie systemu z wieloma agentami za pomocą ADK, wdrażanie w Agent Engine i rozpoczynanie pracy z protokołem A2A

1. Cel tego modułu

W tym praktycznym module utworzysz aplikację z wieloma agentami za pomocą ADK (Agent Development Kit) , która generuje obraz na podstawie prompta i ocenia go pod kątem zgodności z promptem. Jeśli obraz nie spełnia w zadowalający sposób wymagań opisanych w prompcie, agent będzie generować obrazy, dopóki nie powstanie obraz spełniający Twoje wymagania. Każdy z agentów w tym praktycznym przykładzie ma jeden cel, a agenci współpracują ze sobą, aby osiągnąć cel ogólny. Dowiesz się, jak testować aplikację lokalnie i wdrażać ją w Vertex AI Agent Engine.

Czego się nauczysz

Poznaj podstawy ADK (Agent Development Kit) i dowiedz się, jak utworzyć system wieloagentowy.
Dowiedz się, jak łatwo wdrażać i używać agentów w Vertex AI Agent Engine.
Podstawowe informacje o protokole A2A
Dowiedz się, jak używać razem protokołu A2A i ADK (Agent Development Kit) do tworzenia otwartych agentów.

2. Konfiguracja projektu

Jeśli nie masz jeszcze projektu, którego możesz użyć, musisz utworzyć nowy projekt w konsoli GCP.
W tym module do wykonania zadań użyjemy GCP Cloud Shell. Otwórz Cloud Shell i ustaw projekt za pomocą Cloud Shell.
Otwórz GCP Cloud Shell, klikając tutaj: Cloud Shell . Jeśli pojawi się wyskakujące okienko „Autoryzuj Shell”, kliknij je, aby autoryzować edytor Cloud Shell.
Aby sprawdzić, czy projekt jest już uwierzytelniony, użyj w terminalu Cloud Shell tego polecenia:

gcloud auth list

Aby potwierdzić projekt, uruchom w Cloud Shell to polecenie:

gcloud config list project

Skopiuj identyfikator projektu i użyj tego polecenia, aby go ustawić:

gcloud config set project <YOUR_PROJECT_ID>

Jeśli nie pamiętasz identyfikatora projektu, możesz wyświetlić listę wszystkich identyfikatorów projektów za pomocą polecenia

gcloud projects list

3. Włącz interfejsy API

Aby przeprowadzić to ćwiczenie, musimy włączyć niektóre usługi API. Uruchom w Cloud Shell to polecenie.

gcloud services enable aiplatform.googleapis.com
gcloud services enable cloudresourcemanager.googleapis.com

Przedstawiamy interfejsy API

Interfejs Vertex AI API (aiplatform.googleapis.com) umożliwia dostęp do platformy Vertex AI, dzięki czemu aplikacja może wchodzić w interakcje z modelami Gemini w celu generowania tekstu, prowadzenia sesji czatu i wywoływania funkcji.
Interfejs Cloud Resource Manager API (cloudresourcemanager.googleapis.com) umożliwia zautomatyzowane zarządzanie metadanymi projektów Google Cloud, takimi jak identyfikator i nazwa projektu, które są często wymagane przez inne narzędzia i pakiety SDK do weryfikacji tożsamości i uprawnień projektu.

4. Wprowadzenie do pakietu Agent Development Kit

Pakiet Agent Development Kit oferuje kilka kluczowych korzyści dla deweloperów tworzących aplikacje oparte na agentach:

Systemy wieloagentowe: twórz modułowe i skalowalne aplikacje, łącząc w hierarchii wielu wyspecjalizowanych agentów. Umożliwia złożoną koordynację i delegowanie.
Bogaty ekosystem narzędzi: wyposaż agentów w różne funkcje: korzystaj z gotowych narzędzi (wyszukiwanie, wykonywanie kodu itp.), twórz funkcje niestandardowe, integruj narzędzia z zewnętrznych platform agentów (LangChain, CrewAI) lub używaj innych agentów jako narzędzi.
Elastyczna orkiestracja: definiuj przepływy pracy za pomocą agentów przepływu pracy (SequentialAgent, ParallelAgent i LoopAgent) w przypadku przewidywalnych potoków lub korzystaj z dynamicznego kierowania opartego na LLM (LlmAgent przekazywanie) w celu dostosowywania zachowań.
Zintegrowane środowisko programistyczne: lokalne tworzenie, testowanie i debugowanie za pomocą zaawansowanego interfejsu wiersza poleceń i interaktywnego interfejsu programistycznego. Sprawdzaj zdarzenia, stan i kroki wykonywania agenta.
Wbudowana ocena: systematycznie oceniaj skuteczność agenta, sprawdzając zarówno jakość ostatecznej odpowiedzi, jak i trajektorię wykonania krok po kroku na podstawie predefiniowanych przypadków testowych.
Gotowość do wdrożenia: konteneryzuj i wdrażaj agentów w dowolnym miejscu – uruchamiaj lokalnie, skaluj za pomocą Vertex AI Agent Engine lub integruj z infrastrukturą niestandardową za pomocą Cloud Run lub Dockera.

Inne pakiety SDK generatywnej AI lub platformy agentów również umożliwiają wysyłanie zapytań do modeli, a nawet udostępnianie im narzędzi, ale dynamiczna koordynacja między wieloma modelami wymaga znacznego nakładu pracy z Twojej strony.

Zestaw Agent Development Kit oferuje bardziej zaawansowane ramy niż te narzędzia, co pozwala łatwo łączyć ze sobą wiele agentów w celu tworzenia złożonych, ale łatwych w utrzymaniu procesów.

Rysunek 1. Pozycjonowanie ADK (Agent Development Kit)

5. Wprowadzenie do Vertex AI Agent Engine

Vertex AI Agent Engine to w pełni zarządzana usługa wdrażania agentów w Google Cloud. Dzięki Vertex AI Agent Engine programiści mogą tworzyć, dostosowywać, wdrażać, obsługiwać i zarządzać agentami AI OSS( ADK (Agent Development Kit) , LangChain, LangGraph, CrewAI, AutoGen i inne) w Vertex AI.

Silnik agenta udostępnia też usługi do obsługi danych użytkownika, zwanych też pamięcią agenta. Obecnie dostępne są 2 rodzaje usług pamięci.

Pamięć krótkotrwała: dzięki sesjom w Agent Engine możesz przechowywać, zarządzać i pobierać historię bieżącej rozmowy (stan) w ramach jednej sesji jako pamięć krótkotrwałą.
Pamięć długotrwała: dzięki bankowi pamięci Agent Engine możesz przechowywać, przekształcać i pobierać wspomnienia (stan), zwłaszcza w wielu sesjach, jako wspomnienia długotrwałe.

Możesz też wdrażać agentów w innych usługach Google Cloud, takich jak Cloud Run czy GKE. W przypadku tych zastosowań warto rozważyć użycie Vertex AI Agent Engine.

Stanowe zarządzane środowisko wykonawcze: jeśli potrzebujesz stanowego, w pełni zarządzanego środowiska wykonawczego do wdrożenia agenta, Vertex AI Agent Engine jest dobrym wyborem, ponieważ abstrahuje od typowych zadań, takich jak zarządzanie sesjami i trwałość agentów AI.
Wykonywanie kodu: jeśli Twój agent musi wykonać kod, który jest generowany dynamicznie podczas sesji użytkownika, Agent Engine udostępnia bezpieczną piaskownicę, w której możesz go uruchomić.
Elastyczna pamięć długoterminowa: jeśli potrzebujesz elastycznej pamięci długoterminowej dla swoich agentów, możesz skorzystać z Vertex AI Memory Bank, który można używać z Vertex AI Agent Engine. Zapewnia on elastyczny sposób zapamiętywania informacji o użytkowniku, które można wykorzystywać w różnych sesjach.

Możesz też połączyć Vertex AI Agent Engine z innymi środowiskami wykonawczymi, takimi jak Cloud Run, aby utworzyć elastyczną architekturę aplikacji. Poniżej znajdziesz przykładową architekturę referencyjną, która wykorzystuje różne usługi do tworzenia agenta.

Ilustracja 2. Przykładowa architektura referencyjna do tworzenia agentów przy użyciu wielu usług.

6. Wprowadzenie do A2A

Protokół Agent2Agent (A2A) to otwarty standard, który umożliwia płynną i bezpieczną komunikację oraz współpracę między autonomicznymi agentami AI z różnych platform, od różnych dostawców i z różnych domen.

Uniwersalna interoperacyjność: A2A umożliwia agentom współpracę niezależnie od ich technologii bazowych, tworząc prawdziwy ekosystem wieloagentowy. Oznacza to, że agenci stworzeni przez różne firmy na różnych platformach mogą się komunikować i koordynować działania.
Odkrywanie możliwości: agenci mogą reklamować swoje możliwości za pomocą „kart agenta” (dokumentów JSON), które opisują ich tożsamość, obsługiwane funkcje A2A, umiejętności i wymagania dotyczące uwierzytelniania. Umożliwia to innym agentom odkrywanie i wybieranie agenta najbardziej odpowiedniego do danego zadania.
Bezpieczeństwo w standardzie: bezpieczeństwo to podstawowa zasada. A2A wykorzystuje mechanizmy uwierzytelniania i autoryzacji klasy korporacyjnej, które korzystają ze standardów takich jak HTTPS/TLS, JWT, OIDC i klucze API, aby zapewnić bezpieczne interakcje i chronić dane wrażliwe.
Niezależność od typu treści: protokół obsługuje różne typy treści, w tym tekst, dźwięk i streaming wideo, a także interaktywne formularze i osadzone ramki iframe. Dzięki temu agenci mogą wymieniać informacje w formacie najbardziej odpowiednim dla danego zadania i użytkownika.
Ustrukturyzowane zarządzanie zadaniami: A2A definiuje jasne protokoły delegowania, monitorowania i wykonywania zadań. Umożliwia grupowanie powiązanych zadań i zarządzanie nimi na różnych platformach za pomocą unikalnych identyfikatorów zadań. Zadania mogą przechodzić przez określone cykle życia (np. przesłane, w trakcie realizacji, ukończone).
Nieprzejrzyste wykonywanie: ważną cechą jest to, że agenci nie muszą ujawniać innym agentom swoich wewnętrznych procesów rozumowania, pamięci ani konkretnych narzędzi. Udostępniają tylko usługi, które można wywołać, co zwiększa modułowość i prywatność.
Oparte na istniejących standardach: A2A wykorzystuje sprawdzone technologie internetowe, takie jak HTTP, Server-Sent Events (SSE) do przesyłania strumieniowego w czasie rzeczywistym i JSON-RPC do wymiany danych strukturalnych, co ułatwia integrację z istniejącą infrastrukturą IT.
Komunikacja asynchroniczna: protokół został zaprojektowany z myślą o komunikacji asynchronicznej, co ułatwia elastyczne wykonywanie zadań i umożliwia wysyłanie powiadomień push o aktualizacjach nawet wtedy, gdy połączenie nie jest utrzymywane w sposób ciągły.

7. Architektura agenta

W tym module utworzysz aplikację z wieloma agentami, która wygeneruje obraz zgodnie z Twoimi specyfikacjami i oceni go, zanim go wyświetli.

System ma strukturę z głównym agentem o nazwie image_scoring, który koordynuje cały proces. Ten główny agent ma podrzędnego agenta o nazwie image_generation_scoring_agent, który z kolei ma własnych agentów podrzędnych do bardziej szczegółowych zadań. W ten sposób powstaje hierarchia, w której główny agent deleguje zadania do swoich podagentów.

Ilustracja 3. Ogólny przepływ pracy agenta.

Lista wszystkich agentów

Agent	Purpose	Podwykonawcy
ocena_zdjęć (główny agent)	Jest to agent główny, który zarządza całym przepływem pracy. W pętli wielokrotnie uruchamia image_generation_scoring_agent i checker_agent, aż zostanie spełniony warunek zakończenia.	image_generation_scoring_agent checker_agent_instance
image_generation_scoring_agent (Sub-agent of image_scoring)	Ten agent odpowiada za podstawową logikę generowania i oceniania obrazów. W tym celu wykonuje sekwencję 3 podagentów.	image_generation_prompt_agent image_generation_agent scoring_images_prompt
checker_agent_instance (podagent agenta image_scoring)	Ten agent sprawdza, czy proces oceniania obrazu powinien być kontynuowany, czy zakończony. Do oceny warunku zakończenia używa narzędzia check_tool_condition.	-
checker_agent_instance (podagent agenta image_scoring)	Ten agent jest ekspertem w tworzeniu promptów do generowania obrazów. Otrzymuje on tekst wejściowy i generuje szczegółowy prompt odpowiedni dla modelu generującego obrazy.	-
image_generation_prompt_agent (podagent agenta image_generation_scoring_agent)	Ten agent jest ekspertem w tworzeniu promptów do generowania obrazów. Otrzymuje on tekst wejściowy i generuje szczegółowy prompt odpowiedni dla modelu generowania obrazów.	-
scoring_images_prompt (sub-agent usługi image_generation_scoring_agent):	Ten agent jest ekspertem w ocenianiu i punktowaniu obrazów na podstawie różnych kryteriów. Otrzymuje wygenerowany obraz i przypisuje mu ocenę.	-

Lista wszystkich użytych narzędzi

Narzędzie	Opis	Klient użytkownika
check_tool_condition	To narzędzie sprawdza, czy warunek zakończenia pętli został spełniony lub czy osiągnięto maksymalną liczbę iteracji. Jeśli któryś z tych warunków jest spełniony, pętla zostaje przerwana.	checker_agent_instance
generate_images	To narzędzie generuje obrazy przy użyciu modelu Imagen 3. Może też zapisywać wygenerowane obrazy w zasobniku Google Cloud Storage.	image_generation_agent
get_policy	To narzędzie pobiera zasady z pliku JSON. Zasady są używane przez image_generation_prompt_agent do tworzenia promptu generowania obrazów i przez scoring_images_prompt do oceniania obrazów.	image_generation_agent
get_image	To narzędzie wczytuje wygenerowany artefakt obrazu, aby można było go ocenić.	scoring_images_prompt
set_score	To narzędzie ustawia łączny wynik wygenerowanego obrazu w stanie sesji.	scoring_images_prompt

8. Instalowanie ADK i konfigurowanie środowiska

W tym praktycznym module użyjemy Cloud Shell do wykonania zadań.

Przygotowywanie karty edytora Cloud Shell

Kliknij ten link, aby przejść bezpośrednio do edytora Cloud Shell.
Kliknij Dalej.
Gdy pojawi się prośba o autoryzację Cloud Shell, kliknij Autoryzuj.
W dalszej części tego modułu możesz pracować w tym oknie jako środowisku IDE z edytorem Cloud Shell i terminalem Cloud Shell.
Otwórz nowy terminal, klikając Terminal>New Terminal (Terminal>Nowy terminal) w edytorze Cloud Shell. Wszystkie polecenia poniżej będą uruchamiane w tym terminalu.

Pobieranie i instalowanie ADK oraz przykładowego kodu na potrzeby tego modułu

Wykonaj te polecenia, aby sklonować potrzebne źródło z GitHub i zainstalować niezbędne biblioteki. Uruchom polecenia w terminalu otwartym w edytorze Cloud Shell.

#create the project directory
mkdir ~/imagescoring
cd ~/imagescoring
#clone the code in the local directory
git clone https://github.com/haren-bh/multiagenthandson.git

Do utworzenia środowiska Pythona użyjemy narzędzia uv (uruchom w terminalu edytora Cloud Shell):

#Install uv if you do not have installed yet
pip install uv

#Create the virtual environment
uv venv .adkvenv

source .adkvenv/bin/activate

#go to the project directory
cd ~/imagescoring/multiagenthandson

#install dependencies
uv pip install -r pyproject.toml

Jeśli nie masz zasobnika Cloud Storage, utwórz nowy w Google Cloud Storage. Zasobnik możesz też utworzyć za pomocą polecenia gsutil. Przyznaj Agent Engine dostęp do Google Cloud Storage (uruchom w terminalu edytora Cloud Shell).

# First, make sure your PROJECT_ID variable is set
PROJECT_ID=$(gcloud config get-value project)

# Now, create the bucket with a unique name
# We'll use the project ID to help ensure uniqueness
gsutil mb gs://${PROJECT_ID}-imagescoring-bucket

#Now lets give Agent Engine the permission to access Cloud Storage
# 1. Get the current Project ID (text) and Project Number (numeric)
PROJECT_ID=$(gcloud config get-value project)
PROJECT_NUMBER=$(gcloud projects describe $PROJECT_ID --format="value(projectNumber)")

# 2. Construct the Reasoning Engine Service Account email
SA_EMAIL="service-${PROJECT_NUMBER}@gcp-sa-aiplatform-re.iam.gserviceaccount.com"
# 3. Create Agent Engine Service account if not already created
gcloud beta services identity create --service=aiplatform.googleapis.com --project=${PROJECT_NUMBER}

# 3. Grant GCS Access
gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SA_EMAIL" --role="roles/storage.objectUser" --condition=None

W edytorze kliknij kolejno View (Widok) –> Toggle hidden files (Przełącz ukryte pliki). W folderze image_scoring utwórz plik .env o tej treści: Dodaj wymagane informacje, takie jak nazwa projektu i zasobnik Cloud Storage (uruchom w terminalu edytora Cloud Shell).

#go to image_scoring folder
cd ~/imagescoring/multiagenthandson/image_scoring

cat <<EOF>> .env
GOOGLE_GENAI_USE_VERTEXAI=1
GOOGLE_CLOUD_PROJECT=$(gcloud config get-value project)
GOOGLE_CLOUD_LOCATION=us-central1
GOOGLE_CLOUD_STORAGE_BUCKET=$(gcloud config get-value project)-imagescoring-bucket
GCS_BUCKET_NAME=$(gcloud config get-value project)-imagescoring-bucket
SCORE_THRESHOLD=40
IMAGEN_MODEL="imagen-3.0-generate-002"
GENAI_MODEL="gemini-2.5-flash"
EOF

W menu edytora Cloud Shell wybierz Plik > Otwórz folder.
W wyświetlonym oknie dodaj po nazwie użytkownika te informacje o folderze: imagescoring/. Kliknij OK. W panelu eksploratora po lewej stronie powinna być teraz widoczna pełna struktura projektu.
W panelu bocznym Eksploratora otwórz folder image_scoring. Kliknij plik agent.py, aby go otworzyć i sprawdzić strukturę agenta. Ten agent zawiera agenta głównego, który połączy się z pozostałymi agentami podrzędnymi.

Ilustracja 4. Struktura folderów widoczna w panelu bocznym Eksploratora. Aby zobaczyć zawartość pliku, wystarczy go kliknąć.

Wróć do katalogu głównego multiagenthandson w terminalu i wykonaj to polecenie, aby uruchomić agenta lokalnie (uruchom w terminalu edytora Cloud Shell).

#go to the directory multiagenthandson
cd ~/imagescoring/multiagenthandson
# Run the following command to run agents locally
adk web

Ilustracja 5. Uruchamianie aplikacji ADK

Kliknij z naciśniętym klawiszem Ctrl (CMD+kliknięcie w systemie macOS) adres http:// wyświetlany w terminalu, aby otworzyć klienta GUI ADK w przeglądarce. Powinien wyglądać jak na rysunku 5.
W menu u góry po lewej stronie wybierz image_scoring (patrz rysunek 5). Teraz wygenerujmy kilka obrazów. Obrazy powinny też znajdować się w zasobniku Google Cloud Storage. Wypróbuj te prompty lub własne.

Spokojny górski krajobraz o zachodzie słońca
Kot na rowerze

Rysunek 6. Przykładowe dane wyjściowe

9. Wdrażanie w Agent Engine

Teraz wdrażamy agenta w Agent Engine. Agent Engine to w pełni zarządzana usługa do wdrażania agentów w GCP. Agent Engine jest zgodny z pakietem ADK (Agent Development Kit), więc agenci utworzeni za pomocą pakietu ADK (Agent Development Kit) mogą być wdrażani w Agent Engine.

Zanim przejdziesz do poniższych kroków w terminalu edytora Cloud Shell, wyłącz serwer ADK, naciskając Ctrl+C.
Utwórz plik requirements.txt za pomocą narzędzia Poetry. Poetry użyje pliku pyproject.toml do utworzenia pliku requirements.txt. Po uruchomieniu polecenia sprawdź, czy utworzono plik requirements.txt (uruchom w terminalu edytora Cloud Shell).

# Go to the parent folder containing pyproject.toml file
cd ~/imagescoring/multiagenthandson

# install poetry-plugin-export
uv pip install poetry-plugin-export

#Create requirements.txt file
python3 -m poetry export -f requirements.txt --output requirements.txt --without-hashes

Utwórz pakiet. Musimy spakować aplikację w pakiet Pythona .whl. Wykorzystamy do tego poezję. Po wykonaniu polecenia sprawdź, czy utworzono folder dist i czy zawiera on plik .whl (uruchom w terminalu edytora Cloud Shell).

# Go to the parent folder containing pyproject.toml file
cd ~/imagescoring/multiagenthandson

#Create python package, to create whl file
python3 -m poetry build

Teraz przygotujemy skrypt, który wdroży naszego agenta oceniającego obrazy w usłudze Agent Engine. W katalogu deploy znajdź plik deploy.py w panelu bocznym edytora Cloud Shell i kliknij go, aby otworzyć. Sprawdź jego zawartość w ten sposób:

import vertexai
from image_scoring.agent import root_agent
import os
import glob # To easily find the wheel file
from dotenv import load_dotenv

# Load environment variables from image_scoring/.env
env_path = os.path.join(os.path.dirname(__file__), "..", "image_scoring", ".env")
load_dotenv(env_path)

PROJECT_ID = os.getenv("GOOGLE_CLOUD_PROJECT")
LOCATION = os.getenv("GOOGLE_CLOUD_LOCATION", "us-central1")
STAGING_BUCKET = f"gs://{os.getenv('GOOGLE_CLOUD_STORAGE_BUCKET')}"

from vertexai import agent_engines

client=vertexai.Client(
    project=PROJECT_ID,
    location=LOCATION,
)
remote_app = client.agent_engines.create(
    agent=root_agent,
    config={
        "display_name": "image-scoring",
        "staging_bucket": STAGING_BUCKET,
        "requirements": open(os.path.join(os.getcwd(), "requirements.txt")).readlines() + ["./dist/image_scoring-0.1.0-py3-none-any.whl"],
        "extra_packages": [
            "./dist/image_scoring-0.1.0-py3-none-any.whl",
        ],     "env_vars":{"GCS_BUCKET_NAME":os.getenv('GOOGLE_CLOUD_STORAGE_BUCKET')}
    }
)
print(f"DEBUG: AgentEngine attributes: {dir(remote_app)}")
try:
    print(remote_app.api_resource.name)
except AttributeError:
    print("Could not find resource_name, check DEBUG output above.")

Możemy teraz uruchomić skrypt wdrażania. Najpierw przejdź do folderu najwyższego poziomu multiagenthandson (uruchom w terminalu edytora Cloud Shell).

#go to multiagenthandson folder
cd ~/imagescoring/multiagenthandson

#run deploy script from the parent folder containing deploy.py
python3 -m deploy.deploy

Po wdrożeniu powinna pojawić się informacja podobna do tej poniżej:

Ilustracja 7. Przykładowe dane wyjściowe

Teraz przetestujmy wdrożonego agenta. Aby przetestować zdalnie wdrożony silnik agenta, najpierw skopiuj lokalizację agenta z danych wyjściowych wdrożenia w terminalu. Powinno to wyglądać mniej więcej tak: projects/85469421903/locations/us-central1/reasoningEngines/7369674597261639680 .
W panelu bocznym edytora Cloud Shell otwórz folder testclient, kliknij remote_test.py, aby otworzyć plik, a następnie zmień te wiersze:

REASONING_ENGINE_ID = "projects/xxx/locations/us-central1/reasoningEngines/xxx"  # TODO: Change this

W katalogu głównym multiagenthandson uruchom w terminalu edytora Cloud Shell to polecenie. Wynik powinien być zgodny z rysunkiem 8.

#go to multiagenthandson folder
cd ~/imagescoring/multiagenthandson

#execute remote_test.py
python3 -m testclient.remote_test

Rysunek 8. Przykładowe dane wyjściowe

10. Tworzenie agenta A2A

W tym kroku utworzymy prostego agenta A2A na podstawie agenta utworzonego w poprzednich krokach. Obecnych agentów ADK (Agent Development Kit) można publikować w ramach protokołu A2A. Oto najważniejsze informacje, które poznasz w tym kroku.

Poznaj podstawy protokołu A2A.
Dowiedz się, jak protokoły ADK i A2A współpracują ze sobą.
Dowiedz się, jak korzystać z protokołu A2A.

W tym ćwiczeniu praktycznym użyjemy kodu z folderu image_scoring_adk_a2a_server. Zanim rozpoczniesz zadanie, zmień katalog na ten folder (uruchom w terminalu edytora Cloud Shell).

#change directory to image_scoring_adk_a2a_server
cd ~/imagescoring/multiagenthandson/image_scoring_adk_a2a_server

#copy the env file
cp ~/imagescoring/multiagenthandson/image_scoring/.env remote_a2a/image_scoring

1. Utwórz kartę agenta A2A

Protokół A2A wymaga karty agenta, która zawiera wszystkie informacje o agencie, takie jak jego możliwości, przewodnik po korzystaniu z niego itp. Po wdrożeniu agenta A2A kartę agenta można wyświetlić za pomocą linku „.well-known/agent-card.json”. Klienci mogą korzystać z tych informacji, aby wysyłać prośby do pracowników obsługi klienta.

Przejdź do katalogu remote_a2a/image_scoring i znajdź plik agents.json w panelu bocznym edytora Cloud Shell. Kliknij plik, aby go otworzyć, i sprawdź, czy jego zawartość jest zgodna z tą poniżej:

{
 "name": "image_scoring",
 "description": "Agent that generates images based on user prompts and scores their adherence to the prompt.",
 "url": "http://localhost:8001/a2a/image_scoring",
 "version": "1.0.0",
 "defaultInputModes": ["text/plain"],
 "defaultOutputModes": ["image/png", "text/plain"],
 "capabilities": {
   "streaming": true,
   "functions": true
 },
 "skills": [
   {
     "id": "generate_and_score_image",
     "name": "Generate and Score Image",
     "description": "Generates an image from a given text prompt and then evaluates how well the generated image adheres to the original prompt, providing a score.",
     "tags": ["image generation", "image scoring", "evaluation", "AI art"],
     "examples": [
       "Generate an image of a futuristic city at sunset",
       "Create an image of a cat playing a piano",
       "Show me an image of a serene forest with a hidden waterfall"
     ]
   }
 ]
}

2. Utwórz agenta A2A W katalogu głównym image_scoring_adk_a2a_server sprawdź, czy istnieje plik a2a_agent.py. Możesz go otworzyć, klikając nazwę pliku w panelu bocznym edytora Cloud Shell. Ten plik służy jako punkt wejścia agenta A2A i powinien zawierać te treści:

#change directory to image_scoring_adk_a2a_server
cd ~/imagescoring/multiagenthandson/image_scoring_adk_a2a_server

from google.adk.agents.remote_a2a_agent import RemoteA2aAgent

root_agent = RemoteA2aAgent(
   name="image_scoring",
   description="Agent to give interesting facts.",
   agent_card="http://localhost:8001/a2a/image_scoring/.well-known/agent.json",
  
   # Optional configurations
   timeout=300.0,          # HTTP timeout (seconds)
   httpx_client=None,      # Custom HTTP client
)

3. Uruchom agenta A2A

Możemy teraz uruchomić agenta. Aby uruchomić agenta, wykonaj to polecenie w głównym folderze image_scoring_adk_a2a_server (uruchom w terminalu edytora Cloud Shell).

#following command runs the ADK agent as a2a agent
adk api_server --a2a --port 8001 remote_a2a

4. Testowanie agenta A2A

Gdy agent będzie działać, możemy go przetestować. Najpierw sprawdźmy kartę agenta. Otwórz nowy terminal, wybierając Terminal> New Terminal (Nowy terminal), i uruchom to polecenie (uruchom je w nowo otwartym terminalu edytora Cloud Shell).

#Execute the following 
curl http://localhost:8001/a2a/image_scoring/.well-known/agent.json

Wykonanie powyższego polecenia powinno spowodować wyświetlenie karty agenta A2A, która zawiera głównie treść pliku agent.json utworzonego w poprzednim kroku.

Teraz wyślijmy prośbę do agenta. Możemy użyć curl, aby wysłać żądanie do agenta (uruchom w nowo otwartym terminalu edytora Cloud Shell):

curl -X POST   http://localhost:8001/a2a/image_scoring   -H 'Content-Type: application/json'   -d '{
    "id": "uuid-123",
    "params": {
      "message": {
        "messageId": "msg-456",
        "parts": [{"text": "Create an image of a cat"}],
        "role": "user"
      }
    }
  }'

W powyższym żądaniu możesz zmienić prompt, modyfikując wiersz „Utwórz obraz kota”. Po uruchomieniu polecenia możesz sprawdzić obraz wyjściowy w określonej usłudze Google Cloud Storage.

11. Czyszczenie danych

Teraz usuńmy to, co właśnie utworzyliśmy.

Usuń utworzony przed chwilą serwer Vertex AI Agent Engine. Aby przejść do Vertex AI, wpisz „Vertex AI” na pasku wyszukiwania w konsoli Google Cloud. Po lewej stronie kliknij Silnik agenta.Aby usunąć agenta, kliknij Usuń.

Ilustracja 9. Instancje Vertex AI Agent Engine możesz usunąć z konsoli Google Cloud.

Usuwanie plików w Cloud Shell

#Execute the following to delete the files
cd ~
rm -R ~/imagescoring

Usuń zasobnik. W konsoli GCP otwórz Cloud Storage , wybierz i usuń zasobnik.

Ilustracja 10. Usuwanie zasobnika

12. Podsumowanie

Gratulacje! Udało Ci się wdrożyć aplikację z wieloma agentami ADK (Agent Development Kit) w Vertex AI Agent Engine. To ważne osiągnięcie, które obejmuje podstawowy cykl życia nowoczesnej aplikacji natywnej dla chmury i zapewnia solidną podstawę do wdrażania własnych złożonych systemów opartych na agentach.

Podsumowanie

W tym module nauczyliśmy się:

Tworzenie aplikacji z wieloma agentami za pomocą pakietu ADK (Agent Development Kit)
wdrożyć aplikację w Vertex AI Agent Engine,
Utwórz agenta, który może komunikować się za pomocą protokołu A2A.

Przydatne materiały

Od prototypu do produkcji

Ten moduł jest częścią ścieżki szkoleniowej dotyczącej AI gotowej do wdrożenia w Google Cloud.

Poznaj pełny program nauczania, aby przejść od prototypu do produkcji.
Udostępniaj swoje postępy z hasztagiem #ProductionReadyAI.