Erste Schritte mit Gemini CLI-Erweiterungen

1. Einführung

Gemini CLI ist ein Open-Source-KI-Agent für Ihr Terminal, der die Leistungsfähigkeit von Gemini-Modellen direkt in Ihre Befehlszeile bringt. Gemini CLI ist zwar schon für sich genommen leistungsstark, aber ihr volles Potenzial wird erst durch Gemini CLI-Erweiterungen freigesetzt.

Erweiterungen sind die offizielle und standardisierte Möglichkeit, die Funktionen der Gemini CLI zu erweitern. Vor der Einführung von Erweiterungen war für die Anpassung der Befehlszeile oft eine manuelle Bearbeitung von Konfigurationsdateien wie settings.json erforderlich, was „unübersichtlich und fehleranfällig“ sein konnte.

Stellen Sie sich eine Erweiterung als „Versandcontainer“ für Gemini CLI-Anpassungen vor. Es handelt sich um ein in sich geschlossenes, versionierbares und leicht verteilbares Paket, in dem alle Komponenten gebündelt sind, die erforderlich sind, um Gemini neue Fähigkeiten beizubringen. Dieser „Versandcontainer“ kann Folgendes umfassen :

  • MCP-Serverkonfigurationen: Diese verbinden Gemini mit externen Tools und APIs wie den Google Cloud APIs oder Diensten von Drittanbietern.
  • Kontextdateien (GEMINI.md): Das sind „Playbooks“, die dem Modell spezifische Anleitungen und Richtlinien für die effektive Nutzung der neuen Tools geben.
  • Benutzerdefinierte Slash-Befehle (.toml-Dateien): Diese kapseln komplexe, mehrstufige Prompts in einfachen, benutzerfreundlichen Befehlen wie /deploy.
  • Tooleinschränkungen (excludeTools): Damit können integrierte Tools deaktiviert werden, um eine sicherere oder fokussiertere Umgebung zu schaffen.

Der Hauptvorteil von Erweiterungen besteht darin, dass die Gemini CLI von einem persönlichen Assistenten in eine skalierbare, unternehmenstaugliche Plattform umgewandelt wird. Ein Team kann seinen gesamten Cloud-Stack in einer einzigen Erweiterung verpacken, sodass neue Entwickler mit einem einzigen Befehl produktiv werden können.

In diesem Codelab erfahren Sie, wie Sie dieses leistungsstarke Ökosystem nutzen können. Sie erstellen keine Erweiterung, sondern installieren und verwenden vier verschiedene Erweiterungen, um Ihrem Terminal Funktionen für die Anwendungsbereitstellung, Sicherheitsanalyse, Datenanalyse und Infrastructure-as-Code hinzuzufügen.

Aufgaben

  • Installieren und konfigurieren Sie die Gemini CLI und die Google Cloud-Voraussetzungen.
  • In der offiziellen Galerie für Gemini CLI-Erweiterungen finden Sie Erweiterungen.
  • Mit der gemini extensions-Befehlszeile können Sie Erweiterungen installieren, auflisten und verwalten.
  • Einige Gemini CLI-Erweiterungen ausprobieren

Lerninhalte

  • Was Gemini CLI-Erweiterungen sind und warum sie der Standard für die Anpassung der Befehlszeile sind.
  • So finden und installieren Sie Erweiterungen über die Erweiterungsgalerie oder eine GitHub-URL.
  • Die Funktion der Schlüsselverwaltungsbefehle: gemini extensions install, gemini extensions list und gemini extensions update.
  • Einige Gemini CLI-Erweiterungen installieren und verwenden

Voraussetzungen

  • Chrome-Webbrowser
  • Ein Gmail-Konto
  • Ein Cloud-Projekt mit aktivierter Abrechnung

Dieses Codelab richtet sich an Nutzer und Entwickler aller Erfahrungsstufen, auch an Anfänger. Sie sollten mit der Gemini-Befehlszeile vertraut sein. Es werden jedoch Schritte zur Installation der Gemini-Befehlszeile bereitgestellt. Wenn Sie sich mit der Gemini CLI vertraut machen möchten, können Sie das Codelab „Gemini CLI ausprobieren“ durcharbeiten.

2. Hinweis

Projekt erstellen

  1. Wählen Sie in der Google Cloud Console auf der Seite zur Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.
  2. Die Abrechnung für das Cloud-Projekt muss aktiviert sein. So prüfen Sie, ob die Abrechnung für ein Projekt aktiviert ist.
  1. Sie verwenden Cloud Shell, eine Befehlszeilenumgebung, die in Google Cloud ausgeführt wird und in der „bq“ vorinstalliert ist. Klicken Sie oben in der Google Cloud Console auf „Cloud Shell aktivieren“.

Bild der Schaltfläche „Cloud Shell aktivieren“

  1. Wenn Sie mit Cloud Shell verbunden sind, können Sie mit dem folgenden Befehl prüfen, ob Sie bereits authentifiziert sind und das Projekt auf Ihre Projekt-ID festgelegt ist:
gcloud auth list
  1. Führen Sie den folgenden Befehl in Cloud Shell aus, um zu bestätigen, dass der gcloud-Befehl Ihr Projekt kennt.
gcloud config list project
  1. Wenn Ihr Projekt nicht festgelegt ist, verwenden Sie den folgenden Befehl, um es festzulegen:
gcloud config set project <YOUR_PROJECT_ID>
  1. Aktivieren Sie die erforderlichen APIs mit dem unten gezeigten Befehl. Dies kann einige Minuten dauern.
gcloud services enable cloudresourcemanager.googleapis.com \
                       servicenetworking.googleapis.com \
                       run.googleapis.com \
                       cloudbuild.googleapis.com \

Bei erfolgreicher Ausführung des Befehls sollte eine Meldung wie die unten gezeigte angezeigt werden:

Operation "operations/..." finished successfully.

Wenn eine API fehlt, können Sie sie jederzeit während der Implementierung aktivieren.

Hier finden Sie die Dokumentation zu gcloud-Befehlen und zur Verwendung.Bevor Sie die Einrichtung vornehmen und die Gemini CLI ausführen, erstellen wir einen Ordner, den Sie als Stammordner für alle Projekte verwenden, die Sie darin erstellen. Dies ist ein Ausgangspunkt für die Arbeit mit der Gemini-Befehlszeile. Bei Bedarf wird auch auf einige andere Ordner auf Ihrem System verwiesen, die Sie später verwenden können.

Erstellen Sie einen Beispielordner (gemini-cli-projects) und wechseln Sie mit den unten gezeigten Befehlen zu diesem Ordner. Wenn Sie einen anderen Ordnernamen verwenden möchten, können Sie das tun.

mkdir gemini-cli-projects

Rufen wir diesen Ordner auf:

cd gemini-cli-projects

Sie können die Gemini CLI direkt über den Befehl gemini in einem neuen Cloud Shell-Terminal starten. Alternativ wurde sie möglicherweise bereits in einem separaten Cloud Shell-Terminal gestartet.

Erste Interaktion mit der Gemini-Befehlszeile

Wir müssen sicherstellen, dass alles mit unserer Gemini-Befehlszeilenumgebung in Ordnung ist, damit wir unseren ersten Prompt wie unten gezeigt eingeben können:

Give me a famous quote on Artificial Intelligence and who said that?

Sie werden feststellen, dass unsere Anfrage das Tool GoogleSearch (ein integriertes Tool in der Gemini-Befehlszeile) aufgerufen hat. Mit anderen Worten: Sie haben bereits eines der leistungsstarken integrierten Tools der Gemini CLI verwendet, nämlich GoogleSearch, das seine Antworten auf Informationen aus dem Web stützt. Sie sollten eine Antwort auf Ihre Anfrage erhalten.

Als Nächstes sehen wir uns Erweiterungen an.

3. Was ist eine Erweiterung?

Eine Erweiterung ist ein eigenständiges, versionierbares und einfach verteilbares Paket. Stellen Sie sich das als „Versandcontainer“ für Ihre Gemini CLI-Anpassungen vor, in dem alles, was für einen bestimmten Workflow benötigt wird, in einem einzigen, übersichtlichen Paket gebündelt ist.

816cd3c3d4057c11.png

Eine Erweiterung kann eine beliebige Kombination aus folgenden Elementen enthalten:

  • Benutzerdefinierte Slash-Befehle (Ihre TOML-Dateien).
  • MCP-Serverkonfigurationen (die sich zuvor in settings.json befanden).
  • Kontextdateien (GEMINI.md), um dem Modell spezifische Anweisungen und Richtlinien zu geben.
  • Tool-Einschränkungen (excludeTools), um eine sicherere und fokussiertere Umgebung zu schaffen.

Vorteile von Erweiterungen Die wichtigsten Vorteile

Die Verwendung von Erweiterungen für Ihre Anpassungen bietet mehrere wichtige Vorteile:

  • Installation mit einem Befehl: Das ist wichtig. Statt einer manuellen Einrichtung in mehreren Schritten kann ein Nutzer ein komplettes, komplexes Toolset mit einem einzigen Befehl installieren: gemini extensions install <URL> oder gemini extensions install --path=some/local/path. Die <URL> im obigen Befehl kann die Github-URL sein, auf der Sie die Erweiterung gehostet haben.
  • Vereinfachte Verteilung: Sie können Ihre Arbeit ganz einfach freigeben, indem Sie eine einzelne Git-Repository-URL teilen. Es ist nicht mehr nötig, einzelne Dateien und Konfigurations-Snippets weiterzugeben.
  • Versionsverwaltung und Abhängigkeitsmanagement: Da Erweiterungen in der Regel in Git-Repositories gehostet werden, erhalten Sie die Versionsverwaltung kostenlos. Es gibt gemini extensions update command, um eine Erweiterung auf die neueste Version zu aktualisieren.
  • Auffindbarkeit und Ökosystem: Erweiterungen sind die Grundlage für ein umfangreiches und offenes Ökosystem, ähnlich wie die Marktplätze für VS Code oder Chrome. Der Erweiterungsmechanismus könnte die Grundlage für einen zukünftigen Marktplatz bilden, auf dem diese Erweiterungen im Community-Stil zur Überprüfung, zum Download usw. verfügbar sind.

Die Einführung des Erweiterungsframeworks ist ein deutliches Signal dafür, dass sich Gemini CLI von einem leistungsstarken eigenständigen Tool zu einer wirklich erweiterbaren Plattform entwickelt.

4. Grundlagen von Extensions

In diesem Abschnitt werden die nutzerorientierten Teile des Erweiterungs-Ökosystems behandelt: Erweiterungen finden und Erweiterungen verwalten.

Die Erweiterungsgalerie ist der zentrale Marktplatz für alle offiziellen Google- und Drittanbietererweiterungen:

  1. Öffnen Sie die folgende URL in Ihrem Browser: https://geminicli.com/extensions/browse/.
  2. Diese Galerie ist die Suchmaschine für das Ökosystem. Sie sehen Erweiterungen von Unternehmen wie GitHub, Redis und DynaTrace, die die Bandbreite der verfügbaren Tools zeigen.
  3. Scrollen Sie nach unten zur Erweiterungskarte für Cloud Run.
  4. Die Karte enthält eine Beschreibung, den Autor (Google) und eine Copy install-Schaltfläche für einen Klick. Das ist die einfachste Möglichkeit, den Installationsbefehl für eine Erweiterung zu erhalten.

Gemini CLI Extensions – Management Commands

Der Befehl gemini extensions ist Ihr Einstiegspunkt für die Verwaltung Ihrer lokalen Erweiterungen.

Führen Sie den Befehl im Terminal aus, um die Liste der verfügbaren Befehle aufzurufen.

5a774a9fab1be3ed.png

Die Befehle sind einfach (installieren/deinstallieren, auflisten, aktualisieren, aktivieren/deaktivieren usw.). Einige davon werden in diesem Codelab verwendet.

Aktuellen Status prüfen

Bevor wir etwas installieren, sollten wir prüfen, ob wir wirklich bei Null anfangen.

  1. Führen Sie den Befehl gemini extensions list aus:
  2. Sie sollten die folgende Ausgabe sehen, die bestätigt, dass noch keine Erweiterungen installiert sind.
No extensions installed.

5. Cloud Run-Erweiterung (App bereitstellen)

Die in der Gemini CLI-Erweiterungsgalerie verfügbare Cloud Run-Erweiterung ist ein MCP-Server, mit dem wir unsere Anwendungen in Cloud Run bereitstellen können.

Die Karte für die Cloud Run-Erweiterung aus der Erweiterungsgalerie ist unten zu sehen:

648026b7668d0db.png

Installieren Sie zuerst die Cloud Run-Erweiterung, indem Sie wie oben gezeigt auf Installationsbefehl kopieren klicken. Fügen Sie diesen Befehl dann in das Cloud Shell-Terminal ein (er sollte dem folgenden ähneln):

gemini extensions install https://github.com/GoogleCloudPlatform/cloud-run-mcp

Wenn Sie den oben genannten Befehl ausführen, werden Sie aufgefordert, die Aktion zu bestätigen. Erteile deine Genehmigung. Die Cloud Run-Erweiterung sollte dann installiert werden.

Installing extension "cloud-run".
**Extensions may introduce unexpected behavior. Ensure you have investigated the extension source and trust the author.**
This extension will run the following MCP servers:
  * cloud-run (local): npx -y @google-cloud/cloud-run-mcp
This extension will append info to your gemini.md context using gemini-extension/GEMINI.md
Do you want to continue? [Y/n]: Y
Extension "cloud-run" installed successfully and enabled.

Wenn Sie jetzt den Befehl zum Auflisten der Gemini-Erweiterungen ausführen, sollte die Cloud Run-Erweiterung wie unten dargestellt installiert sein:

✓ cloud-run (1.0.0)
 Path: <HOME_FOLDER>/.gemini/extensions/cloud-run
 Source: https://github.com/GoogleCloudPlatform/cloud-run-mcp (Type: github-release)
 Release tag: v1.5.0
 Enabled (User): true
 Enabled (Workspace): true
 Context files:
  <HOME_FOLDER>/.gemini/extensions/cloud-run/gemini-extension/GEMINI.md
 MCP servers:
  cloud-run

Wenn Sie die Gemini CLI jetzt starten und den Befehl /mcp ausführen, wird Folgendes angezeigt:

7ca93915c06e4ce2.png

Kehren wir nun zu Cloud Shell zurück und versuchen wir, eine Anwendung bereitzustellen. Dazu benötigen wir zuerst eine einfache Anwendung, die in Cloud Run bereitgestellt werden kann. Gehen Sie dazu so vor:

Achten Sie darauf, dass Sie sich im Ordner gemini-cli-projects befinden, den wir zuvor erstellt haben. Erstellen Sie in diesem Ordner einen weiteren Ordner mit dem Namen gemini-cloud-run und rufen Sie ihn auf.

mkdir gemini-cloud-run

cd gemini-cloud-run

Erstellen Sie nun zwei Dateien in diesem Ordner (app.py- und requirements.txt-Datei), deren Inhalt unten angegeben ist:

app.py

from flask import Flask
app = Flask(__name__)
@app.route('/')
def hello_world():
  return 'Hello from Gemini and Cloud Run!'
if __name__ == "__main__":
  app.run(debug=True, host='0.0.0.0', port=8080)

requirements.txt

Flask
gunicorn

Starten Sie jetzt die Gemini CLI über den Ordner gemini-cloud-run. Wenn das Terminal bereit ist, geben Sie den folgenden Prompt ein:

/deploy --project="PROJECT_ID" --location="PROJECT_LOCATION" --name="SERVICE_NAME"

Sie müssen die PROJECT_ID (Google Cloud-Projekt-ID), die PROJECT_LOCATION und die SERVICE_NAME angeben. Wenn Sie diese nicht angeben, ruft der Cloud Run-Befehl die entsprechenden Tools auf, um Ihnen bei der Auswahl zu helfen.

Im Rahmen des Prozesses wird das richtige Tool aus der installierten Cloud Run MCP Server Extension ausgewählt. Sie sollten beispielsweise eine Meldung wie diese sehen:

9dcf78679bffd710.png

Erlaube die Verwendung des Tools.

Geschafft! Die Gemini CLI hat jetzt alle Informationen, die sie benötigt, sowie Ihre Berechtigung zum Ausführen der Tools. Die gesamte Bereitstellungspipeline wird jetzt ausgeführt: Das Docker-Image wird erstellt, per Push in Artifact Registry übertragen und ein neuer Cloud Run-Dienst wird konfiguriert und bereitgestellt.

Nach einigen Augenblicken (eigentlich 2–3 Minuten) wird eine Erfolgsmeldung mit einer Dienst-URL angezeigt. Unten sehen Sie einen Beispielaufruf:

The Cloud Run service SERVICE_NAME has been deployed from the current folder in project PROJECT_ID.
  You can view the service in the Cloud Console: https://console.cloud.google.com/run/detail/PROJECT_LOCATION/SERVICE_NAME?project=PROJECT_ID
  The service is accessible at: https://SERVICE_NAME-SOME-ID.a.run.app

Klicken Sie auf den Link. Die Flask-App sollte die Startseite bereitstellen:

92414fd2270ccc46.png

Das zeigt, wie leistungsstark eine Gemini CLI-Erweiterung (in diesem Fall Cloud Run) ist. Sie hat die Komplexität der gcloud CLI-Befehle vollständig gekapselt und sich einfach um alle Details gekümmert.

Sehen Sie sich ruhig die anderen Tools auf dem Cloud Run MCP-Server an.

6. Die BigQuery-Erweiterung (große Datasets analysieren)

Sie benötigen:

  • Ein Google Cloud-Projekt, für das die BigQuery API aktiviert ist.
  • IAM-Berechtigungen:
  • BigQuery-Nutzer (roles/bigquery.user)
  1. Führen Sie diesen Befehl aus, um die Umgebungsvariable BIGQUERY_PROJECT festzulegen. In diesem Projekt werden die BigQuery-Jobs ausgeführt. Es muss nicht unbedingt das Projekt sein, in dem sich Ihre Daten befinden (obwohl das der Fall sein kann).
export BIGQUERY_PROJECT=<YOUR_GCP_PROJECT_ID>
  1. Installieren Sie die BigQuery Data Analytics-Erweiterung mit dem folgenden Befehl. Erteilen Sie die Berechtigung zur Installation. Nach der erfolgreichen Installation haben Sie nun zwei Erweiterungen in Ihrer Einrichtung installiert : cloud-run und bigquery-data-analytics.
gemini extensions install https://github.com/gemini-cli-extensions/bigquery-data-analytics
  1. Starten wir die Gemini CLI noch einmal mit dem folgenden Befehl:
gemini

Die Gemini CLI sollte in Ihrem Terminal gestartet werden: 7a140fbd0d7f7d3c.png

Die folgenden Befehle sollten in das Gemini CLI-Terminal eingegeben werden.

  1. Prüfen Sie mit dem folgenden Slash-Befehl, ob die BigQuery-Erweiterung installiert und einsatzbereit ist:
/extensions list

Die Erweiterung bigquery-data-analytics sollte ebenfalls aufgeführt sein.

9461d5119d9dc693.png

  1. Führen Sie den folgenden Befehl aus, um die verfügbaren Tools aufzurufen:
/mcp list

fd23c246e2a6e4db.png

  1. Stellen wir eine grundlegende Analysefrage zum öffentlichen BigQuery-Dataset: die Look-E-Commerce-Funktion. Dieses Dataset enthält Daten zu Kunden, Produkten und Bestellungen für eine fiktive E-Commerce-Website für Bekleidung. Geben Sie diesen Prompt in der Gemini CLI ein:
Look at BigQuery's the look ecommerce public dataset. Identify the top 5 products that had the most orders.
  • Gemini CLI fragt, ob Sie die Ausführung der BigQuery-Tools zulassen möchten. Wählen Sie zum Fortfahren die dritte Option aus: Yes, always allow all tools from server "bigquery_data_analytics". 3d6e7372e5147216.png
  • Im Hintergrund generiert Gemini die entsprechende SQL-Abfrage, ruft das Tool execute_sql auf und gibt neben Ihren Daten eine Antwort in natürlicher Sprache zurück:

ac5c0cd94bc3bb78.png

  1. Jetzt bitten wir Gemini, die Rückgabequote von Produkten auf Grundlage von Verlaufsdaten vorherzusagen. Für diesen Befehl sollte die Gemini CLI nicht versuchen, ausführlichen SQL-Code zu generieren, um diese Prognose zu erstellen. Stattdessen sollte das Tool forecast vom MCP-Server aufgerufen werden, das im Hintergrund AI.Forecast von BigQuery verwendet:
Forecast what the return rate will be next month.
  • Die Antwort sollte so aussehen:

8a763a03852984ff.png

7. Weitere Informationen

Damit ist unser Codelab abgeschlossen. Wir haben behandelt, was Gemini CLI-Erweiterungen sind, grundlegende Befehle für die Arbeit mit ihnen und zwei Erweiterungen : cloud-run und bigquery-data-analytics.

Unter https://geminicli.com/extensions/ finden Sie die derzeit verfügbaren Erweiterungen (zum Zeitpunkt der Erstellung dieses Dokuments über 100). Jede Erweiterungskarte enthält Informationen, den Typ der Erweiterung (MCP, Kontext usw.) sowie den Link zum GitHub-Repository und einen Befehl zum Installieren der Erweiterung in Ihrer Umgebung.

1c26d4f029747914.png

8. Glückwunsch

Herzlichen Glückwunsch! Sie haben jetzt verstanden, was Gemini CLI-Erweiterungen sind und wie Sie verschiedene Gemini CLI-Erweiterungen installieren und verwenden.

Referenzdokumente