Pierwsze kroki z rozszerzeniami interfejsu wiersza poleceń Gemini

1. Wprowadzenie

Interfejs wiersza poleceń Gemini to agent open source oparty na AI, który zapewnia dostęp do modeli Gemini bezpośrednio z wiersza poleceń. Sam w sobie jest potężnym narzędziem, ale jego prawdziwy potencjał można wykorzystać dzięki rozszerzeniom interfejsu wiersza poleceń Gemini.

Rozszerzenia to oficjalny i standardowy sposób na zwiększenie możliwości interfejsu wiersza poleceń Gemini. Przed wprowadzeniem rozszerzeń dostosowywanie interfejsu wiersza poleceń często wymagało ręcznej edycji plików konfiguracyjnych, takich jak settings.json, co mogło być „niechlujne i podatne na błędy”.

Rozszerzenie to „kontener” na dostosowania interfejsu wiersza poleceń Gemini. Jest to samodzielny, wersjonowany i łatwy do rozpowszechniania pakiet, który zawiera wszystkie komponenty potrzebne do nauczenia Gemini nowych umiejętności. Ten „kontener transportowy” może obejmować :

  • Konfiguracje serwera MCP: łączą Gemini z zewnętrznymi narzędziami i interfejsami API, takimi jak interfejsy API Google Cloud lub usługi innych firm.
  • Pliki kontekstowe (GEMINI.md): są to „scenariusze”, które zawierają szczegółowe instrukcje i wytyczne dotyczące skutecznego korzystania z nowych narzędzi.
  • Niestandardowe polecenia ukośnika (pliki .toml): zawierają złożone, wieloetapowe prompty w postaci prostych, łatwych w użyciu poleceń, takich jak /deploy.
  • Ograniczenia narzędzi (excludeTools): mogą wyłączyć wbudowane narzędzia, aby stworzyć bezpieczniejsze lub bardziej ukierunkowane środowisko.

Główną zaletą rozszerzeń jest przekształcenie interfejsu wiersza poleceń Gemini z osobistego asystenta w skalowalną platformę gotową do użycia w przedsiębiorstwie. Zespół może spakować cały stos chmurowy w jedno rozszerzenie, dzięki czemu nowi programiści mogą zacząć efektywnie pracować za pomocą jednego polecenia.

Z tego ćwiczenia w Codelabs dowiesz się, jak korzystać z tego zaawansowanego ekosystemu. Nie będziesz tworzyć rozszerzenia, ale zainstalujesz i użyjesz 4 różnych rozszerzeń, aby dodać do terminala funkcje wdrażania aplikacji, analizy bezpieczeństwa, analizy danych i infrastruktury jako kodu.

Co musisz zrobić

  • Zainstaluj i skonfiguruj interfejs wiersza poleceń Gemini oraz wymagania wstępne Google Cloud.
  • Przejrzyj oficjalną Galerię rozszerzeń interfejsu wiersza poleceń Gemini, aby znaleźć rozszerzenia.
  • Do instalowania rozszerzeń, wyświetlania ich listy i zarządzania nimi używaj interfejsu wiersza poleceń gemini extensions.
  • Poznaj kilka rozszerzeń interfejsu wiersza poleceń Gemini

Czego się nauczysz

  • Czym są rozszerzenia interfejsu wiersza poleceń Gemini i dlaczego są standardem dostosowywania interfejsu wiersza poleceń.
  • Jak wyszukiwać i instalować rozszerzenia z Galerii rozszerzeń lub z adresu URL GitHub.
  • Funkcje poleceń zarządzania kluczami: gemini extensions install, gemini extensions listgemini extensions update.
  • Instalowanie i używanie kilku rozszerzeń interfejsu wiersza poleceń Gemini

Czego potrzebujesz

  • przeglądarki Chrome,
  • konto Gmail,
  • Projekt w chmurze z włączonymi płatnościami

Te warsztaty są przeznaczone dla użytkowników i deweloperów na wszystkich poziomach zaawansowania (w tym dla początkujących). Zakładamy, że znasz interfejs wiersza poleceń Gemini, ale podamy instrukcje jego instalacji od zera. Jeśli chcesz zapoznać się z interfejsem wiersza poleceń Gemini, wypróbuj codelab: Hands-on with Gemini CLI (Praktyczne ćwiczenia z interfejsem wiersza poleceń Gemini).

2. Zanim zaczniesz

Utwórz projekt

  1. W konsoli Google Cloud na stronie selektora projektów wybierz lub utwórz projekt Google Cloud.
  2. Sprawdź, czy w projekcie Cloud włączone są płatności. Dowiedz się, jak sprawdzić, czy w projekcie są włączone płatności.
  1. Będziesz używać Cloud Shell, czyli środowiska wiersza poleceń działającego w Google Cloud, które jest wstępnie załadowane narzędziem bq. U góry konsoli Google Cloud kliknij Aktywuj Cloud Shell.

Obraz przycisku Aktywuj Cloud Shell

  1. Po połączeniu z Cloud Shell sprawdź, czy jesteś już uwierzytelniony i czy projekt jest ustawiony na Twój identyfikator projektu, używając tego polecenia:
gcloud auth list
  1. Aby potwierdzić, że polecenie gcloud zna Twój projekt, uruchom w Cloud Shell to polecenie:
gcloud config list project
  1. Jeśli projekt nie jest ustawiony, użyj tego polecenia, aby go ustawić:
gcloud config set project <YOUR_PROJECT_ID>
  1. Włącz wymagane interfejsy API za pomocą polecenia pokazanego poniżej. Może to potrwać kilka minut, więc zachowaj cierpliwość.
gcloud services enable cloudresourcemanager.googleapis.com \
                       servicenetworking.googleapis.com \
                       run.googleapis.com \
                       cloudbuild.googleapis.com \

Po pomyślnym wykonaniu polecenia powinien wyświetlić się komunikat podobny do tego poniżej:

Operation "operations/..." finished successfully.

Jeśli pominiesz jakiś interfejs API, możesz go włączyć w trakcie wdrażania.

Więcej informacji o poleceniach gcloud i ich użyciu znajdziesz w dokumentacji.Zanim skonfigurujesz i uruchomisz interfejs Gemini CLI, utwórz folder, który będzie służyć jako folder domowy dla wszystkich projektów, które w nim utworzysz. To punkt wyjścia dla interfejsu Gemini CLI, choć w razie potrzeby będzie on odwoływać się też do innych folderów w systemie, o których dowiesz się później.

Utwórz przykładowy folder (gemini-cli-projects) i przejdź do niego za pomocą poleceń pokazanych poniżej. Jeśli wolisz użyć innej nazwy folderu, możesz to zrobić.

mkdir gemini-cli-projects

Przejdźmy do tego folderu:

cd gemini-cli-projects

Możesz bezpośrednio uruchomić interfejs wiersza poleceń Gemini za pomocą polecenia gemini w nowym terminalu Cloud Shell lub powinien on już być uruchomiony w osobnym terminalu Cloud Shell.

Pierwsze kroki z interfejsem wiersza poleceń Gemini

Musimy się upewnić, że wszystko w środowisku interfejsu wiersza poleceń Gemini działa prawidłowo, aby móc podać pierwszy prompt, jak pokazano poniżej:

Give me a famous quote on Artificial Intelligence and who said that?

Zauważysz, że w wyniku naszego zapytania wywołane zostało narzędzie GoogleSearch (wbudowane w interfejs wiersza poleceń Gemini). Innymi słowy, masz już dostęp do jednego z zaawansowanych wbudowanych narzędzi interfejsu Gemini CLI, czyli GoogleSearch, które opiera swoje odpowiedzi na informacjach pobranych z internetu. Powinna pojawić się odpowiedź na Twoje zapytanie.

Zacznijmy od rozszerzeń.

3. Co to jest rozszerzenie?

Rozszerzenie to samodzielny pakiet z możliwością określania wersji i łatwego rozpowszechniania. Możesz to traktować jako „kontener wysyłkowy” dla dostosowań interfejsu wiersza poleceń Gemini, który łączy wszystko, co jest potrzebne do określonego przepływu pracy, w jeden, uporządkowany pakiet.

816cd3c3d4057c11.png

Rozszerzenie może zawierać dowolną kombinację tych elementów:

  • niestandardowe polecenia po ukośniku (pliki .toml);
  • konfiguracje serwera MCP (które wcześniej znajdowały się w pliku settings.json);
  • Pliki kontekstu (GEMINI.md) zawierające szczegółowe instrukcje i wytyczne dla modelu.
  • Ograniczenia narzędzi (excludeTools), aby stworzyć bezpieczniejsze i bardziej ukierunkowane środowisko.

Dlaczego warto korzystać z rozszerzeń? Podstawowe korzyści

Wprowadzenie rozszerzeń do dostosowywania zapewnia kilka istotnych korzyści:

  • Instalacja za pomocą jednego polecenia: to kluczowa funkcja. Zamiast wieloetapowej konfiguracji ręcznej użytkownik może zainstalować kompletny, złożony zestaw narzędzi za pomocą jednego polecenia: gemini extensions install <URL> lub gemini extensions install --path=some/local/path. W powyższym poleceniu <URL> może być adresem URL GitHub, na którym hostujesz rozszerzenie.
  • Uproszczone udostępnianie: udostępnianie pracy jest tak proste, jak udostępnianie pojedynczego adresu URL repozytorium Git. Koniec z przekazywaniem pojedynczych plików i fragmentów konfiguracji.
  • Wersjonowanie i zarządzanie zależnościami: ponieważ rozszerzenia są zwykle hostowane w repozytoriach Git, masz bezpłatną kontrolę wersji. Istnieją gemini extensions update command, aby zaktualizować rozszerzenie do najnowszej wersji.
  • Wykrywalność i ekosystem: rozszerzenia stanowią podstawę bogatego i otwartego ekosystemu, podobnie jak platformy handlowe w przypadku VS Code czy Chrome. Mechanizm rozszerzeń może stanowić podstawę przyszłego sklepu, w którym te rozszerzenia będą dostępne do sprawdzenia, pobrania i nie tylko, w prawdziwym stylu społecznościowym.

Wprowadzenie struktury rozszerzeń jest wyraźnym sygnałem, że interfejs wiersza poleceń Gemini przekształca się z potężnego samodzielnego narzędzia w prawdziwą platformę z możliwością rozbudowy.

4. Podstawowe informacje o rozszerzeniach

W tej sekcji omówimy elementy ekosystemu rozszerzeń, z których korzystają użytkownicy: wyszukiwanie rozszerzeńzarządzanie nimi.

Galeria rozszerzeń to centralne miejsce, w którym znajdziesz wszystkie oficjalne rozszerzenia Google i firm zewnętrznych:

  1. Otwórz w przeglądarce ten adres URL: https://geminicli.com/extensions/browse/.
  2. Ta galeria to mechanizm wykrywania w ekosystemie. Możesz zobaczyć rozszerzenia od firm takich jak GitHub, Redis i DynaTrace, co pokazuje szeroki zakres dostępnych narzędzi.
  3. Przewiń w dół i znajdź kartę rozszerzenia Cloud Run.
  4. Zwróć uwagę, że karta zawiera opis, autora (Google) i przycisk polecenia Copy install, który można kliknąć. Jest to najprostszy sposób uzyskania polecenia instalacji rozszerzenia.

Rozszerzenia interfejsu wiersza poleceń Gemini – polecenia zarządzania

Polecenie gemini extensions to punkt wejścia do zarządzania lokalnymi rozszerzeniami.

Uruchom je w terminalu, aby wyświetlić listę dostępnych poleceń.

5a774a9fab1be3ed.png

Polecenia są proste (instalacja/odinstalowanie, lista, aktualizacja, włączanie/wyłączanie itp.). W tym laboratorium użyjemy niektórych z nich.

Sprawdź swój obecny stan

Zanim cokolwiek zainstalujemy, sprawdźmy, czy mamy „czystą kartę”.

  1. Uruchom polecenie gemini extensions list:
  2. Powinny się wyświetlić te dane wyjściowe, potwierdzające, że nie zainstalowano jeszcze żadnych rozszerzeń.
No extensions installed.

5. Rozszerzenie Cloud Run (wdrażanie aplikacji)

Rozszerzenie Cloud Run dostępne w galerii rozszerzeń interfejsu wiersza poleceń Gemini to serwer MCP, który umożliwia wdrażanie aplikacji w Cloud Run.

Poniżej znajduje się karta rozszerzenia Cloud Run z galerii rozszerzeń:

648026b7668d0db.png

Najpierw zainstaluj rozszerzenie Cloud Run, klikając Skopiuj polecenie instalacji, jak pokazano powyżej. Następnie wklej to polecenie w terminalu Cloud Shell (powinno być podobne do tego poniżej):

gemini extensions install https://github.com/GoogleCloudPlatform/cloud-run-mcp

Po uruchomieniu powyższego polecenia zobaczysz prośbę o potwierdzenie. Zatwierdź je. Rozszerzenie Cloud Run powinno zostać zainstalowane.

Installing extension "cloud-run".
**Extensions may introduce unexpected behavior. Ensure you have investigated the extension source and trust the author.**
This extension will run the following MCP servers:
  * cloud-run (local): npx -y @google-cloud/cloud-run-mcp
This extension will append info to your gemini.md context using gemini-extension/GEMINI.md
Do you want to continue? [Y/n]: Y
Extension "cloud-run" installed successfully and enabled.

Jeśli teraz wykonasz polecenie gemini extensions list, powinna się wyświetlić zainstalowana usługa Cloud Run, jak pokazano poniżej:

✓ cloud-run (1.0.0)
 Path: <HOME_FOLDER>/.gemini/extensions/cloud-run
 Source: https://github.com/GoogleCloudPlatform/cloud-run-mcp (Type: github-release)
 Release tag: v1.5.0
 Enabled (User): true
 Enabled (Workspace): true
 Context files:
  <HOME_FOLDER>/.gemini/extensions/cloud-run/gemini-extension/GEMINI.md
 MCP servers:
  cloud-run

Jeśli teraz uruchomisz interfejs Gemini CLI i wykonasz polecenie /mcp, zobaczysz te informacje:

7ca93915c06e4ce2.png

Wróćmy teraz do Cloud Shell i spróbujmy wdrożyć aplikację. W tym celu musimy najpierw mieć prostą aplikację do wdrożenia w Cloud Run. Wykonaj te czynności:

Upewnij się, że jesteś w folderze utworzonym wcześniej, czyli gemini-cli-projects. Utwórz w nim kolejny folder o nazwie gemini-cloud-run i przejdź do niego.

mkdir gemini-cloud-run

cd gemini-cloud-run

Teraz utwórz w tym folderze 2 pliki (app.pyrequirements.txt), których zawartość podano poniżej:

app.py

from flask import Flask
app = Flask(__name__)
@app.route('/')
def hello_world():
  return 'Hello from Gemini and Cloud Run!'
if __name__ == "__main__":
  app.run(debug=True, host='0.0.0.0', port=8080)

requirements.txt

Flask
gunicorn

Teraz uruchom interfejs wiersza poleceń Gemini z folderu gemini-cloud-run. Gdy terminal będzie gotowy, wpisz ten prompt:

/deploy --project="PROJECT_ID" --location="PROJECT_LOCATION" --name="SERVICE_NAME"

Musisz podać PROJECT_ID (identyfikator projektu Google Cloud), PROJECT_LOCATIONSERVICE_NAME. Jeśli nie podasz tych informacji, polecenie Cloud Run wywoła odpowiednie narzędzia, które pomogą Ci je wybrać.

W ramach tego procesu wybierze odpowiednie narzędzie z zainstalowanego przez nas rozszerzenia serwera MCP Cloud Run. Powinien pojawić się na przykład taki komunikat:

9dcf78679bffd710.png

Zezwól na używanie narzędzia.

Znakomicie. Interfejs wiersza poleceń Gemini ma teraz wszystkie potrzebne informacje oraz Twoją zgodę na wykonywanie narzędzi. Teraz wykona cały potok wdrażania: skompiluje obraz Dockera, przeniesie go do Artifact Registry, skonfiguruje i wdroży nową usługę Cloud Run.

Po chwili (a dokładniej po 2–3 minutach) zobaczysz komunikat o pomyślnym zakończeniu z adresem URL usługi. Przykładowe uruchomienie:

The Cloud Run service SERVICE_NAME has been deployed from the current folder in project PROJECT_ID.
  You can view the service in the Cloud Console: https://console.cloud.google.com/run/detail/PROJECT_LOCATION/SERVICE_NAME?project=PROJECT_ID
  The service is accessible at: https://SERVICE_NAME-SOME-ID.a.run.app

Kliknij ten link. Powinna być widoczna aplikacja Flask obsługująca stronę główną:

92414fd2270ccc46.png

Pokazuje to możliwości rozszerzenia interfejsu wiersza poleceń Gemini (w tym przypadku Cloud Run), które całkowicie ukrywa złożoność poleceń gcloud CLI i po prostu dba o wszystkie szczegóły.

Możesz wypróbować inne narzędzia na serwerze MCP Cloud Run.

6. Rozszerzenie BigQuery (analizowanie dużych zbiorów danych)

Aby skorzystać z tej usługi, potrzebne Ci będą:

  • projekt Google Cloud z włączonym interfejsem BigQuery API,
  • Uprawnienia:
  • Użytkownik BigQuery (roles/bigquery.user)
  1. Uruchom to polecenie, aby ustawić zmienną środowiskową BIGQUERY_PROJECT. Jest to projekt, w którym będą wykonywane zadania BigQuery, ale niekoniecznie projekt, w którym znajdują się dane (chociaż mogą to być te same projekty).
export BIGQUERY_PROJECT=<YOUR_GCP_PROJECT_ID>
  1. Zainstaluj rozszerzenie BigQuery Data Analytics za pomocą poniższego polecenia. Zezwól na instalację. Po pomyślnej instalacji w konfiguracji będą zainstalowane 2 rozszerzenia : cloud-runbigquery-data-analytics.
gemini extensions install https://github.com/gemini-cli-extensions/bigquery-data-analytics
  1. Uruchommy ponownie interfejs wiersza poleceń Gemini za pomocą tego polecenia:
gemini

Interfejs wiersza poleceń Gemini powinien uruchomić się w terminalu: 7a140fbd0d7f7d3c.png

Poniższe polecenia należy wpisać w terminalu interfejsu wiersza poleceń Gemini.

  1. Aby sprawdzić, czy rozszerzenie BigQuery jest zainstalowane i gotowe do użycia, wpisz to polecenie:
/extensions list

Powinno być widoczne również rozszerzenie bigquery-data-analytics.

9461d5119d9dc693.png

  1. Aby sprawdzić dostępne narzędzia, uruchom to polecenie:
/mcp list

fd23c246e2a6e4db.png

  1. Zadajmy podstawowe pytanie analityczne dotyczące publicznego zbioru danych BigQuery: look ecommerce. Ten zbiór danych zawiera informacje o klientach, produktach i zamówieniach z fikcyjnej strony e-commerce z odzieżą. Wpisz ten prompt w interfejsie wiersza poleceń Gemini:
Look at BigQuery's the look ecommerce public dataset. Identify the top 5 products that had the most orders.
  • Interfejs Gemini CLI zapyta, czy chcesz zezwolić na wykonanie narzędzi BigQuery. Aby kontynuować, wybierz trzecią opcję: Yes, always allow all tools from server "bigquery_data_analytics". 3d6e7372e5147216.png
  • W tle Gemini wygeneruje odpowiednie zapytanie SQL, wywoła narzędzie execute_sql i zwróci odpowiedź w języku naturalnym wraz z danymi:

ac5c0cd94bc3bb78.png

  1. Teraz poprosimy Gemini o prognozę współczynnika zwrotów produktów na podstawie danych historycznych. W przypadku tego polecenia interfejs Gemini CLI nie powinien próbować generować rozbudowanego kodu SQL w celu utworzenia prognozy. Zamiast tego powinien wywołać narzędzie forecast z serwera MCP, które będzie korzystać z funkcji AI.Forecast w BigQuery:
Forecast what the return rate will be next month.
  • Powinna pojawić się odpowiedź podobna do tej:

8a763a03852984ff.png

7. Dalsze eksplorowanie

To koniec naszego laboratorium, w którym omówiliśmy, czym są rozszerzenia interfejsu wiersza poleceń Gemini, podstawowe polecenia do pracy z nimi oraz 2 rozszerzenia : cloud-runbigquery-data-analytics.

Odwiedź Galerię rozszerzeń Gemini na stronie https://geminicli.com/extensions/, aby poznać obecnie dostępne rozszerzenia (w momencie pisania tego artykułu było ich ponad 100), z których możesz już korzystać. Każda karta rozszerzenia zawiera informacje, typ rozszerzenia (MCP, Context itp.), link do repozytorium GitHub oraz polecenie instalacji rozszerzenia w Twoim środowisku.

1c26d4f029747914.png

8. Gratulacje

Gratulacje. Wiesz już, czym są rozszerzenia interfejsu wiersza poleceń Gemini oraz jak instalować i używać różnych rozszerzeń interfejsu wiersza poleceń Gemini.

Dokumentacja