Tworzenie prostego agenta podróży za pomocą pakietu ADK i interfejsu wiersza poleceń Gemini

1. Wprowadzenie

9344c1d1a9f221b7.png

Last Updated: 2026-02-02

Tworzenie prostego agenta podróży za pomocą ADK

Witamy na warsztatach ADK w języku Python(*), które dzięki interfejsowi wiersza poleceń Gemini są dostarczane z bateriami.

Ten codelab jest podzielony na 2 etapy:

  1. Typowa, prosta ścieżka nauki: konfiguracja + natychmiastowa satysfakcja.
  2. Spersonalizowana ścieżka, na której wybierasz zadanie do rozwiązania przy pomocy interfejsu wiersza poleceń Gemini

Druga część sprawia, że te ćwiczenia są idealne na hackathon (i można w nich wygrać nagrody za najbardziej kreatywne rozwiązania).

Milestone1: Twój pierwszy agent z ADK i interfejsem wiersza poleceń Gemini

Celem tego etapu jest krok po kroku utworzenie prostego agenta podróży za pomocą pakietu ADK.

Najpierw skonfigurujemy interfejs wiersza poleceń Gemini, aby ułatwić nam kodowanie za pomocą ADK. Dzięki temu lokalna powłoka będzie mogła wybrać najnowszą wersję ADK Pythona, wstawić kod i dokumenty oraz udostępnić najnowszy/najlepszy kod, który pomoże Ci osiągnąć cel.

Jest to część, w której ręcznie tworzymy w prosty sposób w pełni działającą aplikację. Zwykle zajmuje to około godziny (plus czas instalacji).

Etap 2. Rozszerzanie możliwości agenta

Następnie przedstawiamy Ci kilkanaście opcji (o różnym stopniu trudności), które pozwolą Ci rozszerzyć aplikację zgodnie z Twoimi potrzebami. Dzięki temu możesz poznać różne aspekty (interfejs, operacje, złożone interakcje z agentem itp.).

Co utworzysz

W tym ćwiczeniu w Codelabs utworzysz aplikację Travel Agent za pomocą ADK i interfejsu wiersza poleceń Gemini. Twoja aplikacja będzie:

  • Łączenie się z interfejsami API Airbnb za pomocą platformy MCP Airbnb.
  • wyszukiwać w internecie aktualnych informacji (pogoda, daty itp.),
  • wykonywać niestandardowe narzędzia,
  • Utwórz obrazy apartamentów lub pokoi za pomocą narzędzia NanoBanana.

Interfejs wiersza poleceń Gemini przeprowadzi Cię przez wszystkie te czynności: pisanie i sprawdzanie kodu oraz wyszukiwanie najnowszych dokumentów w lokalnej kopii repozytorium ADK (w Pythonie lub w Twoim ulubionym języku).

Czego się nauczysz

  • Tworzenie aplikacji za pomocą ADK
  • Jak używać interfejsu wiersza poleceń Gemini do kodowania aplikacji na podstawie lokalnych dokumentów
  • Jak wchodzić w interakcje z serwerem MCP, aby łączyć się ze źródłami danych zewnętrznych w czasie rzeczywistym, np. w ten sposób:

Czego potrzebujesz

  • komputer, na którym można instalować pakiety (np. npm install ..);
  • Podstawowe umiejętności programowania w języku Python, TypeScript, Go lub Java.
  • Zdecydowanie zalecamy korzystanie z IDE ( Antigravity, VSCode, IntelliJ, vim).

Dlaczego warto używać ADK i interfejsu wiersza poleceń Gemini?

Niektórzy z Was mogą się zastanawiać: dlaczego muszę używać ADK (pakietu SDK do tworzenia agentów) w połączeniu z lokalnym narzędziem do pomocy w kodowaniu agentów (np. interfejsem wiersza poleceń Gemini)? Powodem jest to, że oba narzędzia są niezwykle potężne, ale ich interakcja nie jest prosta. Wiele osób próbowało używać ich razem, ale bez powodzenia (głównie z powodu problemów z „pętlą w pętli”). W tych ćwiczeniach znajdziesz kilka wskazówek, jak to zrobić.

2. Przygotowania

Wybierz jedną z tych opcji: Self-paced environment setup (Konfiguracja środowiska we własnym tempie), jeśli chcesz uruchomić to

samouczek na własnym komputerze lub uruchomić Cloud Shell, jeśli chcesz przeprowadzić ten samouczek w całości w chmurze.

Samodzielne konfigurowanie środowiska

  1. Zaloguj się w konsoli Google Cloud i utwórz nowy projekt lub użyj istniejącego. Jeśli nie masz jeszcze konta Gmail ani Google Workspace, musisz je utworzyć.

295004821bab6a87.png

37d264871000675d.png

96d86d3d5655cdbe.png

  • Nazwa projektu to wyświetlana nazwa uczestników tego projektu. Jest to ciąg znaków, który nie jest używany przez interfejsy API Google. Zawsze możesz ją zaktualizować.
  • Identyfikator projektu jest unikalny we wszystkich projektach Google Cloud i nie można go zmienić po ustawieniu. Konsola Cloud automatycznie generuje unikalny ciąg znaków. Zwykle nie musisz się nim przejmować. W większości ćwiczeń z programowania musisz odwoływać się do identyfikatora projektu (zwykle oznaczanego jako PROJECT_ID). Jeśli wygenerowany identyfikator Ci się nie podoba, możesz wygenerować inny losowy identyfikator. Możesz też spróbować własnej nazwy i sprawdzić, czy jest dostępna. Po tym kroku nie można go zmienić i pozostaje on taki przez cały czas trwania projektu.
  • Warto wiedzieć, że istnieje trzecia wartość, numer projektu, której używają niektóre interfejsy API. Więcej informacji o tych 3 wartościach znajdziesz w dokumentacji.
  1. Następnie musisz włączyć płatności w konsoli Cloud, aby korzystać z zasobów i interfejsów API Google Cloud. Wykonanie tego laboratorium nie będzie kosztować dużo, a może nawet nic. Aby wyłączyć zasoby i uniknąć naliczania opłat po zakończeniu tego samouczka, możesz usunąć utworzone zasoby lub projekt. Nowi użytkownicy Google Cloud mogą skorzystać z programu bezpłatnego okresu próbnego, w którym mają do dyspozycji środki w wysokości 300 USD.

Uruchamianie Cloud Shell

Z Google Cloud można korzystać zdalnie na laptopie, ale w tym module praktycznym będziesz używać Google Cloud Shell, czyli środowiska wiersza poleceń działającego w chmurze.

W konsoli Google Cloud kliknij ikonę Cloud Shell na pasku narzędzi w prawym górnym rogu:

Aktywowanie Cloud Shell

Uzyskanie dostępu do środowiska i połączenie się z nim powinno zająć tylko kilka chwil. Po zakończeniu powinno wyświetlić się coś takiego:

Zrzut ekranu terminala Google Cloud Shell pokazujący, że środowisko zostało połączone

Ta maszyna wirtualna zawiera wszystkie potrzebne narzędzia dla programistów. Zawiera również stały katalog domowy o pojemności 5 GB i działa w Google Cloud, co znacznie zwiększa wydajność sieci i usprawnia proces uwierzytelniania. Wszystkie zadania w tym laboratorium możesz wykonać w przeglądarce. Nie musisz niczego instalować.

Wymagania wstępne (instalacja)

Aby wykonać ten samouczek, musisz zainstalować:

1. Python i uv

pythonuv (system zarządzania pakietami dla Pythona). Jest to wymagane w przypadku ADK. Sprawdź, czy masz zainstalowany pakiet uv:

$ curl -LsSf https://astral.sh/uv/install.sh | sh

Dlaczego uv? Możesz używać dowolnego menedżera Pythona, ale użycie uv zapewni, że konfiguracja ENV/PATH dla Pythona będzie taka sama dla Ciebie i interfejsu wiersza poleceń Gemini, więc środowisko powłoki będzie w większości takie samo jak w przypadku interfejsu wiersza poleceń Gemini. Jeśli na przykład użyjesz virtualenv , interfejs wiersza poleceń Gemini będzie musiał wykonać czynności takie jak „source .env/venv/bin/activate && my-original-command”, aby naśladować Twoje środowisko.

2. Interfejs wiersza poleceń Gemini

Instrukcje instalacji interfejsu wiersza poleceń Gemini znajdziesz tutaj: https://github.com/google-gemini/gemini-cli .

Uwaga: wymaga to zainstalowania npm lub npx.

npm install -g @google/gemini-cli

  1. Na Mac możesz użyć brew zgodnie z oficjalną dokumentacją.
  2. W systemie Windows możesz użyć chocolatey lub po prostu pobrać plik wykonywalny ze strony https://nodejs.org/en/download.

W kroku 4 (później) będziesz też potrzebować zainstalowanej aplikacji npx. Zarówno npm, jak i npx powinny być naturalną częścią interfejsu wiersza poleceń Gemini. Jeśli nie, poproś o pomoc interfejs wiersza poleceń Gemini.

Opcjonalnie możesz też zainstalować just, czyli bardziej zaawansowane i samodokumentujące się narzędzie Makefile. Możesz też poprosić interfejs wiersza poleceń Gemini o pomoc w instalacji.

efade99623113f1.png

Uwierzytelnianie

Potrzebujesz projektu Google Cloud z włączoną usługą Vertex AI lub klucza interfejsu API Google AI Studio.

Opcja A (zalecana w przypadku warsztatów): wyeksportuj klucz interfejsu API:

export GOOGLE_API_KEY="your-api-key"

Opcja B (Vertex AI): uwierzytelnij się za pomocą gcloud:

export GOOGLE_CLOUD_PROJECT="YOUR_PROJECT_ID"
export GOOGLE_CLOUD_LOCATION="YOUR_PROJECT_LOCATION"
export GOOGLE_GENAI_USE_VERTEXAI=true
gcloud auth application-default login

Konfigurowanie środowiska pracy

W sekcji mysolution/ utworzysz WŁASNE rozwiązanie, więc utwórz folder i 2 potrzebne pliki.

W tym momencie możesz otworzyć IDE (Visual Studio Code, IntelliJ, RubyMine itp.) i otworzyć folder.

# 1. Find an empty directory, and download this repo.
git clone https://github.com/palladius/ai-friendly-agents/
cd ai-friendly-agents/adk/workshops/simple-travel-agent/

# 2. Create your solution empty skeleton
mkdir -p mysolution/
touch mysolution/__init__.py mysolution/agent.py

# 3. This installs ADK and MCP via `uv` by reading pyproject.toml
uv sync

# 4. Call Gemini CLI
gemini  # This runs Gemini CLI under the simple-travel-agent/ folder.
# Login with your GMail account.

uv sync nie jest bezwzględnie wymagane, ale jeśli się nie powiedzie, oznacza to, że musisz naprawić instalację Pythona lub uv.

Dostępne rozwiązania

Cały kod znajduje się w folderze 📂 steps/. Możesz stamtąd skopiować kod.

Te ćwiczenia z programowania nie mają na celu nauczenia Cię pisania dobrego kodu ADK. Chodzi w nich o skonfigurowanie środowiska, aby automatycznie generować DOBRY kod zgodnie z Twoimi instrukcjami.

  1. Instalowanie oprogramowania
  2. konfigurowanie lub uruchamianie,
  3. wchodzenie w pozytywne pętle informacji zwrotnych,

To jest to, czego naprawdę chcemy Cię tutaj nauczyć. Możesz też przetestować je wszystkie jednocześnie za pomocą $ just web-4steps.

3. Krok 1. Podstawowy agent

abfef47ab2ff0c98.png

Zacznijmy od utworzenia podstawowego agenta, który może prowadzić rozmowę.

Edytuj plik o nazwie mysolution/__init__.py, dodając do niego ten kod:

from .agent import root_agent

To takie proste. Dzięki temu pakiet ADK będzie wiedzieć, gdzie znajduje się Twój kod: w agent.py.

Edytuj plik o nazwie mysolution/agent.py, dodając do niego ten kod:

from google.adk.agents import Agent

root_agent = Agent(
    name="travel_basic",
    model="gemini-2.5-flash",
    instruction="You are a helpful travel assistant." +
    "You can help with general travel advice based on your knowledge.",
)

Testowanie agenta

Dotyczy to wszystkich kroków. ADK umożliwia testowanie agenta na 2 sposoby: za pomocą interfejsu wiersza poleceń i w internecie.

  • CLI najlepiej sprawdza się w przypadku szybkich i zautomatyzowanych testów
  • Internet to najlepsze narzędzie do wizualnego sprawdzania, co się dzieje, korzystania z mikrofonu (!) i rozwiązywania problemów.

Wskazówka: na potrzeby tego ćwiczenia, aby wykonać dowolne działanie (z wyjątkiem testów jednostkowych), użyj internetu. To naprawdę niesamowite! Interfejs wiersza poleceń powinien służyć tylko do testowania automatycznego.

Dobry prompt, który prawidłowo testuje kroki 1–2–3–4, może wyglądać tak (inteligentny „prompt lakmusowy”):

# <!– litmus prompt –> Dzień dobry, chcę zarezerwować hotel w Paryżu na jutrzejszy wieczór, na jedną noc, w centrum Paryża. Najlepiej w pobliżu dworca Gare de Lyon. Budżet: poniżej 200 EUR za noc.

  1. Podaj datę w formacie RRRRMMDD i dzień tygodnia, który będzie jutro.
  2. Podaj co najmniej 3 hotele, które widzisz na jutro. Chcę zobaczyć: > cenę, adres, ocenę (w formacie XX/YY, np. „4,7/5” – z Google Hotels, Booking lub Airbnb), liczbę opinii. Podaj je w formacie TABULAR. Nazwa hotelu powinna być połączona z adresem URL hotelu (nie musisz dodawać kolumny adresu URL). Upewnij się, że link jest prawidłowy (działa, a strona zawiera informacje o hotelu).

Jest to inteligentny prompt, ponieważ testuje czas i hotele. W krokach 1, 2 i 3 nie powiedzie się, a w kroku 4 powinien się w pełni udać. Możesz oczywiście użyć dowolnego prompta, jakiego chcesz.

Uruchom go w bashu (interfejs wiersza poleceń):

# 1. If ADK was installed:
adk run mysolution/
# ... but if you get: -bash: adk: command not found"
# 2. Call ADK cli script through UV to avoid python install nightmares.
uv run adk run mysolution/

Wypróbuj go, używając „testowego prompta” powyżej.

Prawdopodobnie nie będzie znać konkretnych dat. Musimy nauczyć go rozpoznawania daty.

W przypadku internetu możesz to zrobić w ten sposób:

  1. uv run adk web . : uruchamia wszystkich agentów w tym folderze. Chcesz wskazać podfolder „mysolution/”
  2. w prawym górnym rogu kliknij mysolution/ (zobacz obraz obok);
  3. Zadaj pytanie w formie tekstowej lub głosowej, np. „litmus prompt”.

TODO(ricc): <image here>

Pamiętaj, że w przypadku wersji CLI musisz wywołać adk web z folderu wyższego poziomu.

Oto możliwe rozwiązanie z półhalucynacją daty. Uwaga: 3 z 5 linków do rezerwacji działają. Nieźle.

4. Krok 2. Dodaj narzędzie now()

Agent nie wie, co to jest „dziś”. Dajmy mu narzędzie.

TODO(image): ricc put here image of step2.

Dodaj tę funkcję do agent.py tuż przed definicją root_agent:

from datetime import datetime

def now() -> dict:
    """Returns the current date and time."""
    my_datetime = ... # Ask Gemini CLI to help you!
    return {
        "status": "success",
        "current_time": my_datetime
    }

Zaktualizuj definicję agenta, aby uwzględnić narzędzie:

  # file XXX.py

  travel_agent = LlmAgent(
        name="..",
        model="..",
        instruction="..",
        tools=[now] # <== This is the only line you want to add.
    )

Uruchom go ponownie i zadaj to samo pytanie. Powinien teraz znać datę (dobrze) i nie podawać konkretnych hoteli (źle).

Możesz też przetestować to w ten sposób:

# Let's pretend we're in Milan. This should call the tool
# and respond correctly (possibly with some TZ math issues)

echo "What time is it in Milan?" | uv run adk run mysolution/

5. Krok 3. Zmieńmy temat: google_search

Wiesz już, jak utworzyć niestandardowe narzędzie. Teraz omówimy, jak korzystać z jednego z zaawansowanych wbudowanych narzędzi udostępnianych przez pakiet ADK: google_search. Dzięki temu nasz agent może uzyskiwać dostęp do informacji z internetu w czasie rzeczywistym.

3cd72c019b8b225f.png

Twoim zadaniem jest zmodyfikowanie agenta z kroku 2. Zamiast narzędzia now zaimportujesz i użyjesz narzędzia google_search z biblioteki ADK.

# Full Code: `steps/step03_search/agent.py`
# Remember to REMOVE the now() tool here. See above why.
from google.adk.agents import Agent
from google.adk.tools import google_search

root_agent = Agent(
    name="travel_agent",
    model="gemini-2.5-flash",
    tools=[google_search],
    instruction="""You are a travel agent.
Your job is to help the user plan a trip.
You have access to a search engine.
If you don't know the answer, you can use the search engine.
When you are done, reply with "DONE".""",
)

Jak uruchomić

Tak samo jak w kroku 1.

Tylko dla ekspertów Aby uzyskać bardziej zaawansowaną integrację (z użyciem google_searchnow), sprawdź kod w steps/step03b_search_and_tool/agent.py i uruchom go za pomocą just run-step3b. Jest to całkowicie opcjonalne.

6. Krok 4. Bardziej zaawansowane narzędzie: MCP

TODO(ricc): dodać obraz 4

Omówiliśmy już narzędzia niestandardowe i wbudowane, więc teraz przejdźmy do czegoś bardziej zaawansowanego: wzorca Model-as-a-Tool, który korzysta z protokołu Model Context Protocol (MCP).

Aby skupić się na zaawansowanych możliwościach MCP, ponownie zastąpimy poprzednie narzędzie (google_search). Wprowadzimy ponownie proste narzędzie now, które będzie działać równolegle z narzędziem airbnb_mcp. Pokazuje to, jak agent może używać wielu zgodnych narzędzi (w tym przypadku FunctionToolMCPToolset) do wykonywania złożonych zadań.

# Full Code: steps/step04_mcp/agent.py
# ... Imports as before
from google.adk.tools.mcp_tool.mcp_toolset import MCPToolset
from google.adk.tools.mcp_tool.mcp_session_manager import StdioConnectionParams
from mcp import StdioServerParameters

def now() -> dict:
    # ... as before

# Configure the Airbnb MCP Toolset
airbnb_mcp = MCPToolset(
    connection_params=StdioConnectionParams(
        server_params=StdioServerParameters(
            command='npx',
            args=["-y", "@openbnb/mcp-server-airbnb", "--ignore-robots-txt"],
        ),
    )
)

root_agent = Agent(
    name="travel_mcp",
    model="gemini-2.5-flash",
    instruction="You are a helpful travel assistant. You can find accommodation using Airbnb, and have access to the current time.",
    tools=[now, airbnb_mcp],
)

Jak uruchomić

Ten krok wymaga zainstalowania na urządzeniu aplikacji npx. W pozostałych przypadkach postępuj tak samo jak powyżej.

Zastrzeżenia/ błędy

  1. Jeśli pojawi się robots.txtbłąd ograniczenia, możesz zastosować w przypadku MCP poprawkę z dyrektywą ignorowania robotów. Więcej informacji znajdziesz w dokumentacji: https://github.com/openbnb-org/mcp-server-airbnb
  2. Jeśli pojawi się błąd timeout (5 sekund to zbyt mało, aby Airbnb uzyskało odpowiedzi), zapoznaj się z dokumentacją ADK, aby dowiedzieć się, jak wydłużyć limit czasu, np. do 30 sekund. Możesz też użyć interfejsu wiersza poleceń Gemini. Pamiętaj, że 3 grudnia 2025 r. Cloud Shell zwrócił błąd przekroczenia limitu czasu. Naprawiłem go, ale nadal pojawiały się błędy, dopóki nie wymusiłem powrotu do poprzedniej wersji: args=["-y", "@openbnb/mcp-server-airbnb@0.1.2", "--ignore-robots-txt"].

7. 🏅 Kamień milowy nr 1 osiągnięty!

🏅 Gratulacje! 🏅 Jesteś teraz ekspertem od ADK! Udało Ci się ukończyć pierwszą część warsztatów i skutecznie utworzyć oraz przetestować agentów AI za pomocą narzędzi niestandardowych, wbudowanych i zaawansowanych narzędzi MCP. Możesz teraz tworzyć własnych niesamowitych agentów za pomocą pakietu Google Agent Development Kit.

Masz teraz działającego agenta podróży, który zna godzinę i może przeszukiwać internet. Teraz nie ma już żadnych ograniczeń!

Teraz możesz dodać dodatkową funkcję za pomocą „interfejsu wiersza poleceń Gemini”.

8. 🏅 Etap 2. Tworzenie kodu w ADK za pomocą interfejsu wiersza poleceń Gemini

Teraz przechodzimy do najciekawszej części warsztatów.

  1. upewnij się, że git commitzapiszesz kod w bezpiecznym miejscu. Możesz rozwidlić oryginalny kod lub utworzyć gałąź. Nie martw się, interfejs wiersza poleceń Gemini Ci w tym pomoże.
  2. Znajdź 💡 pomysł do wdrożenia. Możesz sprawdzić pomysły poniżej, znaleźć własny lub poprosić Gemini o przejrzenie dokumentacji w folderze rag/ i zaproponowanie kilku inteligentnych pomysłów.
  3. Zapoznaj się z wymaganiami wstępnymi, aby mieć pewność, że Gemini może odczytywać dokumenty ADK.

💡 Pomysły

Oto menu z pomysłami o różnym stopniu złożoności.

  1. 🟢 [łatwe] Czy znasz wiele języków? Chcesz przekazać go, java czy Typescript? Refaktoryzacja istniejącego kodu jest bardzo prosta. Pamiętaj tylko, aby pobrać odpowiedni pakiet ADK i poprosić interfejs wiersza poleceń Gemini o wykonanie tłumaczenia.
  2. 🟢 [łatwe] Dodaj emotikony lub określ format wyjściowy (np. tabela z emotikonem hotelu, a następnie ceną i emotikonami gwiazdek od 1 do 5 – możesz też użyć 🌕🌕🌕🌗🌑, aby uwzględnić połówki).
  3. 🟢 [łatwe] Zmień prompt, aby nauczyć go, czego konkretnie szukasz lub czego nie chcesz (np. miejsce przyjazne zwierzętom, bez parteru, ciche, blisko transportu publicznego), i przetestuj go. Możesz dodać osobistą ocenę, np. „ocena od 1 do 10 wystawiona przez TWOJE_IMIĘ”, na podstawie powyższych informacji i posortować wyniki według tej oceny.
  4. 🟢 [łatwe] Czy w pokoju jest jakiś operator? Wdróż w Cloud Run. lub Vertex AI Agent Engine. Czy wiesz, że możesz zintegrować tego agenta i wywoływać go bezpośrednio z nowej usługi Gemini Enterprise?
  5. 🟢 [easy] Zintegruj `adk run`` z 🍌 NanoBanana MCP. Wymaga klucza interfejsu Gemini API. Tutaj możesz tworzyć obrazy, ale nie możesz ich wizualizować. Poniżej znajdziesz trudniejszą wersję.
  6. 🟡 [medium] Utwórz subagenta, który wykona HotelSearch, i utwórz BudgetAgent lub LocationAgent, które mogą powtarzać i iterować wyniki wyszukiwania hoteli, uwzględniając Twoje potrzeby dotyczące lokalizacji, np. „nie więcej niż X km od LOKALIZACJI”. Jeśli interfejs API na to nie pozwala, może być konieczna wymiana informacji z użyciem GoogleSearch. Uwaga: interfejs wiersza poleceń Gemini może Ci pomóc.
  7. 🟡 [średni] Wdróż AirbnbReviewAgent, który analizuje opinie i podsumowuje pozytywne i negatywne aspekty w kilku punktach oznaczonych kolorami dla 1 lub N hoteli w wynikach wyszukiwania. Masz już 2 składniki (GoogleSearch i MCP Airbnb), więc musisz połączyć je z głównym agentem i być może opracować protokół komunikacji między nimi.
  8. 🟡 [średni] Integracja z A2A. Utwórz agenta A2A. Ponownie poproś o pomoc interfejs wiersza poleceń Gemini.
  9. 🔴 [complex] Możesz zintegrować Loty lub inne funkcje MCP, aby utworzyć wieloaspektowe, wielofunkcyjne biuro podróży.
  10. 🔴 [complex] Zintegruj ADK web z 🍌 NanoBanana MCP. Jest to trudniejsze niż powyższe zadanie. Wskazówki znajdziesz na stronie https://github.com/palladius/ai-friendly-agents/issues/11. Zajęło to autorowi 3 godziny rozmów z interfejsem wiersza poleceń Gemini, Gemini3 i czytania dokumentów/kodu z rag/.

Szukasz dalszych inspiracji?

  1. Pomysły znajdziesz w świetnym samouczku ADK Maurizio.
  2. Poproś interfejs wiersza poleceń Gemini o znalezienie pomysłów na podstawie dokumentacji w rag/. Przykładowy prompt: Is there a feature in here which seems very succulent to you? Give me 3 proposals and let's implement together the one I choose.

Wymagania wstępne dotyczące ADK „RAG”

Aby zakodować funkcję, zalecamy pobranie całego pakietu ADK python ADK (uwaga: można go bardzo łatwo dostosować do ulubionego języka, np. Javy lub Go!).

Kod znajduje się w katalogu ./rag i można go pobrać za pomocą polecenia ./download-adk.sh.

Ponieważ folder rag jest wymieniony w pliku .gitignore, upewnij się, że plik .gemini/settings.json zawiera te elementy:

{
 "context": {
   "includeDirectories": ["rag"]
 }
}

Why? Chcemy, aby Gemini mógł odczytywać te pliki, gdy są bezpiecznie ignorowane przez Git. Teoretycznie możesz też odkryć wszystkie pliki .gitignore, ustawiając context.fileFiltering.respectGitIgnore na false, ale spowoduje to wyświetlenie wielu niepotrzebnych plików node_modules/__pycache__/, więc preferowaną opcją jest jawne uwzględnienie folderu.

9. Dalsze kroki

Ciekawostka: te warsztaty zostały przygotowane przy użyciu interfejsu wiersza poleceń Gemini. Jeśli chcesz się dowiedzieć, jak to zrobiłem, zajrzyj do plików GEMINI.mdWORKSHOP_PLAN.md w tym folderze.

Wyciągnięte wnioski

Dowiedzieliśmy się, jak sparować ADK z interfejsem wiersza poleceń Gemini

Materiały dodatkowe

6d05afb6b8b235d8.png