1. Einführung
In diesem Codelab erfahren Sie mehr über die Gemini CLI, einen Open-Source-KI-Agenten, der die Leistungsfähigkeit von Gemini direkt in Ihr Terminal bringt.
Lerninhalte
- Gemini CLI installieren und konfigurieren
- Tools, integrierte Befehle und das Konfigurieren von MCP-Servern in der Gemini CLI
- Gemini CLI über die Datei
GEMINI.mdanpassen - Einige Anwendungsfälle mit der Gemini CLI
Voraussetzungen
Dieses Codelab kann vollständig in Google Cloud Shell ausgeführt werden, wo die Gemini CLI vorinstalliert ist.
Wenn Sie lieber auf Ihrem eigenen Computer arbeiten möchten, finden Sie einen Abschnitt zur lokalen Installation der Gemini CLI.
Sie benötigen Folgendes:
- Chrome-Webbrowser
- Ein Gmail-Konto
Dieses Codelab richtet sich an Nutzer und Entwickler aller Erfahrungsstufen, auch an Anfänger. Die Anwendungsfälle im Codelab wurden in Entwickler- und Nichtentwickleraufgaben unterteilt. Die Anwendungsfälle für Entwickler zeigen, wie Sie mit der Gemini CLI Code erstellen und mit einem GitHub-Repository zusammenarbeiten können, um gängige Entwicklungsaufgaben wie Codeerklärung/-verständnis, Generieren von Dokumentation und Beheben von Problemen auszuführen. Wir empfehlen, diese Anwendungsfälle im Codelab durchzugehen. Am Ende gibt es einen optionalen Abschnitt, in dem mehrere alltägliche Aufgaben behandelt werden, die nicht auf Entwickler ausgerichtet sind.
2. Hinweis
Projekt erstellen
- Wählen Sie in der Google Cloud Console auf der Seite zur Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.
- Die Abrechnung für das Cloud-Projekt muss aktiviert sein. So prüfen Sie, ob die Abrechnung für ein Projekt aktiviert ist.
- Sie verwenden Cloud Shell, eine Befehlszeilenumgebung, die in Google Cloud ausgeführt wird und in der „bq“ vorinstalliert ist. Klicken Sie oben in der Google Cloud Console auf „Cloud Shell aktivieren“.

- Wenn Sie mit Cloud Shell verbunden sind, können Sie mit dem folgenden Befehl prüfen, ob Sie bereits authentifiziert sind und das Projekt auf Ihre Projekt-ID festgelegt ist:
gcloud auth list
- Führen Sie den folgenden Befehl in Cloud Shell aus, um zu bestätigen, dass der gcloud-Befehl Ihr Projekt kennt.
gcloud config list project
- Wenn Ihr Projekt nicht festgelegt ist, verwenden Sie den folgenden Befehl, um es festzulegen:
gcloud config set project <YOUR_PROJECT_ID>
3. Installation
Bevor Sie die Einrichtung vornehmen und die Gemini CLI ausführen, erstellen wir einen Ordner, den wir als Home-Ordner für alle Projekte verwenden, die wir darin erstellen. Dies ist ein Ausgangspunkt für die Arbeit mit der Gemini CLI. Bei Bedarf wird auch auf einige andere Ordner auf Ihrem System verwiesen, die Sie später benötigen.
Erstellen Sie einen Beispielordner (gemini-cli-projects) und wechseln Sie mit den unten gezeigten Befehlen zu diesem Ordner. Wenn Sie einen anderen Ordnernamen verwenden möchten, können Sie das tun.
mkdir gemini-cli-projects
Rufen wir diesen Ordner auf:
cd gemini-cli-projects
Sie können Gemini CLI direkt über den Befehl gemini starten.
Fahren Sie direkt mit dem nächsten Abschnitt fort (Konfiguration der Gemini CLI über settings.json).
Wenn Sie die Gemini CLI lokal installieren möchten, folgen Sie der Anleitung unten.
Als Erstes müssen Sie Node 20+ auf Ihrem Computer installieren. Sobald dies abgeschlossen ist, können Sie die Gemini CLI mit einer der folgenden Methoden installieren und ausführen:
- Sie können die Gemini CLI zuerst global auf Ihrem System installieren. Möglicherweise benötigen Sie Administratorzugriff, um diesen Schritt auszuführen.
# option 1: install Gemini CLI
npm install -g @google/gemini-cli
# .. and then run
gemini
- Führen Sie sie mit dem folgenden Befehl aus:
# option 2: run without installing Gemini CLI
npx https://github.com/google-gemini/gemini-cli
Mit dem folgenden Befehl können Sie prüfen, ob die CLI installiert ist:
gemini --version
Wenn Sie die Gemini CLI über eine der oben genannten Methoden gestartet haben, sollte der folgende Bildschirm angezeigt werden, auf dem Sie aufgefordert werden, ein Design auszuwählen. Wähle eine aus:

Nachdem Sie das ausgewählt haben, werden Sie nach der Authentifizierungsmethode gefragt. Es wird empfohlen, in diesem Lab Ihr privates Google-Konto und keine Konten zu verwenden, die nicht mit Google oder Google Workspace verknüpft sind. Mit dieser kostenlosen Lizenz erhalten Sie Zugriff auf Gemini 2.5 Pro und sein Kontextfenster von 1 Million Tokens. In der kostenlosen Stufe sind 60 Modellanfragen pro Minute und 1.000 Anfragen pro Tag kostenlos möglich.
Wenn Sie die Limits des aktuellen kostenlosen Kontingents für Google-Konten erreichen, können Sie den Gemini API-Schlüssel oder sogar Google Cloud Vertex AI verwenden. Dazu benötigen Sie eine Projekt-ID und den Standortnamen für dieses Projekt. Wenn Sie andere Authentifizierungsmethoden verwenden möchten, lesen Sie den Abschnitt Authentifizierung in der Dokumentation.

Klicken Sie auf „Eingabe“. Dadurch wird eine Google-Authentifizierungsseite im Browser geöffnet. Fahren Sie mit der Authentifizierung mit Ihrem Google-Konto fort, akzeptieren Sie die Nutzungsbedingungen und sobald Sie erfolgreich authentifiziert wurden, sehen Sie, dass die Gemini CLI bereit ist und auf Ihren Befehl wartet. Hier ein Beispiel-Screenshot:

4. Konfiguration der Gemini-Befehlszeile über settings.json
Wenn Sie Cloud Shell zum Ausführen von Gemini auswählen, werden ein Standarddesign für die Gemini CLI und die Authentifizierungsmethode bereits für Sie ausgewählt und konfiguriert.
Wenn Sie die Gemini CLI auf Ihrem Computer installiert und zum ersten Mal gestartet haben, haben Sie ein Design und dann eine Authentifizierungsmethode ausgewählt.
Bei nachfolgenden Ausführungen der Gemini CLI werden Sie nicht mehr aufgefordert, ein Thema und eine Authentifizierungsmethode auszuwählen. Das bedeutet, dass sie irgendwo gespeichert wird. Die Datei, die dafür verwendet wird, heißt settings.json. Mit ihr lässt sich die Gemini CLI anpassen.
Einstellungen werden mit der folgenden Priorität angewendet (Cloud Shell stellt nur Nutzereinstellungen zur Verfügung):
- System:
/etc/gemini-cli/settings.json(gilt für alle Nutzer, überschreibt Nutzer- und Arbeitsbereichseinstellungen). - Workspace:
.gemini/settings.json(überschreibt die Nutzereinstellungen). - Nutzer:
~/.gemini/settings.json.
Windows-Nutzer: %USERPROFILE%.gemini\settings.json (wird in der Regel zu C:\Users<IhrNutzername>.gemini\settings.json erweitert)
System: %ProgramData%\gemini-cli\settings.json (wird in der Regel zu C:\ProgramData\gemini-cli\settings.json erweitert)
Mac-Nutzer: ~/.gemini/settings.json (wird zu /Users/<IhrNutzername>/.gemini/settings.json erweitert)
System: /etc/gemini-cli/settings.json
Wenn Sie sich erinnern, haben Sie beim Auswählen des Designs festgelegt, dass die Einstellungen in den Nutzereinstellungen gespeichert werden sollen. Rufen Sie also ~/.gemini folder auf. Dort finden Sie die Datei settings.json.
Meine settings.json-Datei ist unten zu sehen. Wenn Sie ein anderes Design ausgewählt hätten, würde der Name dort angezeigt.
{
"theme": "Default",
"selectedAuthType": "oauth-personal" or "cloud-shell"
}
5. Erste Interaktion mit der Gemini CLI
Legen wir mit der Gemini CLI los und geben Sie Ihre erste Anfrage wie unten gezeigt ein:
Give me a famous quote on Artificial Intelligence and who said that?
Die erwartete Antwort lautet:
GoogleSearch Searching the web for: "famous quote on Artificial Intelligence and who said it" ...
Search results for "famous quote on Artificial Intelligence and who said it" returned.
✦ "The development of full artificial intelligence could spell the end of the human race." - Stephen Hawking.
Sie werden feststellen, dass unsere Anfrage das Tool GoogleSearch (ein integriertes Tool in der Gemini CLI) aufgerufen hat. Mit anderen Worten: Sie haben bereits eines der leistungsstarken integrierten Tools der Gemini CLIs verwendet, nämlich GoogleSearch, das seine Antworten auf Informationen aus dem Web stützt. Im nächsten Abschnitt erfahren Sie mehr über Tools.
Wenn Sie /help (Schrägstrich) eingeben, sehen Sie eine Vielzahl von Befehlen und Tastenkombinationen.
Beenden wir die Gemini CLI jetzt. Sie können das entweder über den Befehl /quit oder durch zweimaliges Ausführen von Ctrl-C in der interaktiven Gemini CLI-Terminalsitzung tun.
6. Gemini CLI – Befehlsparameter
Beim Starten der Gemini CLI können Sie einige Befehlszeilenparameter angeben. Eine vollständige Liste der Optionen erhalten Sie mit --help (siehe unten).
gemini --help
Dadurch sollten alle verfügbaren Optionen angezeigt werden. Weitere Informationen finden Sie in der Dokumentation.
Sehen wir uns einige davon an. Zuerst müssen Sie die Gemini-Befehlszeile so konfigurieren, dass entweder das Pro- oder das Flash-Modell verwendet wird. Zum Zeitpunkt der Erstellung dieses Labs werden nur diese beiden Modelle unterstützt. Standardmäßig wird das Modell Gemini 2.5 Pro verwendet. Wenn Sie das Flash-Modell verwenden möchten, können Sie dies beim Starten der Gemini CLI über den Parameter -m tun, wie unten gezeigt:
gemini -m "gemini-2.5-flash"
Wenn Sie so vorgehen, können Sie das Modell unten rechts im Gemini CLI-Terminal prüfen:

Sobald Sie sich in der Gemini CLI-Anwendung befinden, können Sie mit dem Befehl „/model“ ein Dialogfeld öffnen, in dem Sie ein Modell auswählen können. Unten sehen Sie einen Beispiel-Lauf. Je nach Ihren Anforderungen und den gegebenen Anleitungen können Sie das Modell immer wieder wechseln, um das richtige für die Aufgabe auszuwählen. Berücksichtigen Sie dabei die Komplexität und die Notwendigkeit, die Kosten zu kontrollieren.

Nicht interaktiver Modus
Eine interessante Option ist die Ausführung der Gemini CLI im nicht interaktiven Modus. Das bedeutet, dass Sie den Prompt direkt eingeben und er beantwortet wird, ohne dass das interaktive Terminal von Gemini CLI geöffnet wird. Das ist sehr nützlich, wenn Sie die Gemini CLI automatisiert als Teil eines Skripts oder eines anderen Automatisierungsprozesses verwenden möchten. Sie verwenden den Parameter -p, um den Prompt für die Gemini CLI anzugeben, wie unten gezeigt. Alternativ können Sie auch das positionelle Argument verwenden, um den Prompt anzugeben.
gemini "What is the gcloud command to deploy to Cloud Run"
Beachten Sie jedoch, dass es keine Möglichkeit gibt, das Gespräch mit Folgefragen fortzusetzen. In diesem Modus können Sie auch keine Tools (einschließlich WriteFile) autorisieren oder Shell-Befehle ausführen.
7. Gemini CLI – integrierte Tools
Die Gemini CLI enthält eine Reihe integrierter Tools. In der Dokumentation zu den Tools heißt es: „Das Gemini-Modell verwendet diese Tools, um mit Ihrer lokalen Umgebung zu interagieren, auf Informationen zuzugreifen und Aktionen auszuführen. Diese Tools erweitern die Funktionen der CLI und ermöglichen es ihr, über die Textgenerierung hinauszugehen und bei einer Vielzahl von Aufgaben zu helfen.“
Rufen Sie den Befehl /tools wie unten gezeigt auf, um eine Liste der aktuellen integrierten Tools zu erhalten:
Available Gemini CLI tools:
- Codebase Investigator Agent (codebase_investigator)
- Edit (replace)
- FindFiles (glob)
- GoogleSearch (google_web_search)
- ReadFile (read_file)
- ReadFolder (list_directory)
- SaveMemory (save_memory)
- SearchText (search_file_content)
- Shell (run_shell_command)
- WebFetch (web_fetch)
- WriteFile (write_file)
- WriteTodos (write_todos)
Eine der ersten Fragen, die Sie sich stellen sollten, ist, ob Gemini CLI diese Tools einfach aufrufen kann, wann immer es möchte. Die Standardantwort ist Nein, wenn es um vertrauliche Vorgänge geht, bei denen möglicherweise in das lokale System geschrieben, aus einem externen System gelesen oder auf das externe Netzwerk zugegriffen wird.
Wenn Sie die Befehlszeile starten, ist zwar eine --yolo verfügbar (was in der Regel nicht empfohlen wird), aber die Gemini-Befehlszeile fordert Sie auf, die Berechtigung zum Ausführen des ausgewählten Tools zu erteilen. Sie können die Berechtigung verweigern, sie einmalig ausführen lassen oder eine allgemeine Berechtigung erteilen, damit sie immer ausgeführt wird. Sie haben und sollten die volle Kontrolle über die Dinge haben.
Wir verwenden einen Prompt, mit dem Gemini CLI eines der integrierten Tools auswählt und ausführt. So können Sie besser nachvollziehen, wie alles funktioniert.
Stellen Sie sich vor, Sie möchten Informationen zu den neuesten Finanznachrichten weltweit abrufen und in einer Datei im lokalen Arbeitsverzeichnis speichern, aus dem Sie die Gemini CLI gestartet haben. Verwenden Sie den folgenden Prompt:
Search for the latest headlines today in the world of finance and save them in a file named finance-news-today.txt
Stellen Sie sich vor, was es tun sollte. Idealerweise sollte es eine Google-Suche durchführen, um Nachrichten aus relevanten Informationsquellen zu erhalten, die Finanznachrichten liefern können. Anschließend muss eine Datei mit dem Namen finance-news-today.txt mit dem entsprechenden Inhalt erstellt werden. Dazu ist eine Schreiboperation auf Ihrem lokalen System erforderlich, für die Sie die Berechtigung erteilen müssen.
Sehen wir uns an, was passiert (Sie sollten auf Ihrem Computer genauso vorgehen).
Zuerst wird das Tool GoogleSearch aufgerufen, um im Web zu suchen und die Ergebnisse abzurufen, wie unten dargestellt:
GoogleSearch Searching the web for: "latest finance headlines today"
Search results for "latest finance headlines today" returned.
Danach kann der Inhalt in die Datei geschrieben werden. Dazu wird das Tool WriteFile verwendet. Da es sich dabei um einen sensiblen Vorgang (write) handelt, werden Sie um Ihre Erlaubnis gebeten. Sie können den Berechtigungstyp festlegen, z.B. „Einmal erlauben“ oder „Immer erlauben“. Wählen Sie jetzt „Einmal erlauben“ aus.

Die Informationen werden dann in die Datei geschrieben und unten wird eine Erfolgsmeldung angezeigt:
✦ I have successfully saved the latest finance headlines into the file finance-news-today.txt.
Wie kann ich prüfen, ob die Datei geschrieben wurde? Sie können das @file verwenden, um den Inhalt vorlesen zu lassen. Wenn Sie @ eingeben, wird eine Liste der Dateien im aktuellen Ordner angezeigt. Die Datei, die gerade erstellt wurde, ist ebenfalls in der Liste enthalten. Wählen Sie diese Option aus und senden Sie den Prompt ab. Mein Prompt lautet so:
read the contents of @finance-news-today.txt
Dadurch werden die erforderlichen Tools (ReadManyFiles, ReadFile) aufgerufen und die Inhalte werden wie unten dargestellt angezeigt:

8. Gemini CLI – Shell-Modus
Jetzt ist ein guter Zeitpunkt, um zu lernen, wie Sie direkt über die Gemini CLI mit der Shell arbeiten. Sie können in den Shell-Modus wechseln, indem Sie im Nachrichtenfeld ! drücken. Dadurch wird in den Shell-Modus gewechselt. Sie können zurückkehren, indem Sie noch einmal auf ! oder auf die Taste ESC drücken.
Im Shell-Modus wird am Anfang des Prompts das ! angezeigt, wie unten zu sehen:

Sie können dies direkt mit Standardbefehlen wie pwd und ls prüfen, wie unten gezeigt. Bei den Befehlen wird von einem Linux-Betriebssystem ausgegangen. Wenn Sie ein anderes Betriebssystem (Windows) verwenden, nutzen Sie bitte entsprechende Befehle wie cd, dir und type. Beachten Sie, dass die Ausgabe dieser Aufrufe im Kontextfenster des Modells enthalten ist.

Mit dem Befehl cat können Sie den Inhalt der Datei ausdrucken.

Übung: Hier ist eine kurze Übung, die Sie ausprobieren können. Wählen Sie einen RSS-Feed aus. Geben Sie einen Prompt in die Gemini CLI ein, um die Inhalte des RSS-Feeds abzurufen und die Ergebnisse auf bestimmte Weise zu formatieren. So kannst du etwas zu Beginn des Tages automatisieren. Sie können Gemini CLI sogar fragen, ob es für einen bestimmten Bereich einen RSS-Feed gibt, z.B. für die Versionshinweise zu Google Cloud.
Hier ein Beispiel für einen Prompt:
Get the latest release notes for Google Cloud from its RSS Feed and display the key points in a well-formatted list.
Mit diesem Prompt sollte idealerweise zuerst das Tool GoogleSearch aufgerufen werden, um den Google Cloud Platform-RSS-Feed zu finden. Anschließend wird das Tool WebFetch verwendet, um den Inhalt des RSS-Feeds abzurufen und anzuzeigen.
9. Gemini CLI-Erweiterungen
Wie in der Dokumentation beschrieben, werden mit Gemini CLI-Erweiterungen Prompts, MCP-Server und benutzerdefinierte Befehle in einem vertrauten und benutzerfreundlichen Format verpackt. Mit Erweiterungen können Sie die Funktionen der Gemini CLI erweitern und mit anderen teilen. Sie ist der primäre Mechanismus, um die Funktionalität der Gemini CLI über die integrierten Tools hinaus zu erweitern.
Eine Erweiterung ist ein eigenständiges, versionierbares und einfach verteilbares Paket. Stellen Sie sich das als „Versandcontainer“ für Ihre Gemini CLI-Anpassungen vor, in dem alles, was für einen bestimmten Workflow benötigt wird, in einem einzigen, übersichtlichen Paket gebündelt ist.

Eine Erweiterung kann eine beliebige Kombination aus folgenden Elementen enthalten:
- Benutzerdefinierte Slash-Befehle (Ihre TOML-Dateien).
- MCP-Serverkonfigurationen (die sich zuvor in settings.json befanden).
- Kontextdateien (GEMINI.md), um dem Modell spezifische Anweisungen und Richtlinien zu geben.
- Tool-Einschränkungen (excludeTools), um eine sicherere und fokussiertere Umgebung zu schaffen.
Erweiterungsgalerie ansehen
Die Erweiterungsgalerie ist der zentrale Marktplatz für alle offiziellen Google- und Drittanbietererweiterungen:
- Öffnen Sie die folgende URL in Ihrem Browser:
https://geminicli.com/extensions/browse/. - Diese Galerie ist die Suchmaschine für das Ökosystem. Sie sehen Erweiterungen von Unternehmen wie GitHub, Redis und DynaTrace, die die Bandbreite der verfügbaren Tools zeigen.
- Scrollen Sie nach unten zur Erweiterungskarte für Cloud Run.
- Die Karte enthält eine Beschreibung, den Autor (Google) und eine
Copy-Schaltfläche für einen Ein-Klick-Befehl. Das ist die einfachste Möglichkeit, den Installationsbefehl für eine Erweiterung zu erhalten.
Gemini CLI-Erweiterungen – Verwaltungsbefehle
Der Befehl gemini extensions ist Ihr Einstiegspunkt für die Verwaltung Ihrer lokalen Erweiterungen.
Führen Sie den Befehl im Terminal aus, um die Liste der verfügbaren Befehle aufzurufen.
gemini extensions <command>
Manage Gemini CLI extensions.
Commands:
gemini extensions install <source> [--auto-update] [--pre-release]
Installs an extension from a git repository URL or a local path.
gemini extensions uninstall <names..>
Uninstalls one or more extensions.
gemini extensions list
Lists installed extensions.
gemini extensions update [<name>] [--all]
Updates all extensions or a named extension to the latest version.
gemini extensions disable [--scope] <name>
Disables an extension.
gemini extensions enable [--scope] <name>
Enables an extension.
gemini extensions link <path>
Links an extension from a local path. Updates made to the local path
will always be reflected.
gemini extensions new <path> [template]
Create a new extension from a boilerplate example.
gemini extensions validate <path>
Validates an extension from a local path.
Die Befehle sind einfach (installieren/deinstallieren, auflisten, aktualisieren, aktivieren/deaktivieren usw.). Einige davon werden in diesem Codelab verwendet.
Aktuelle Liste der Erweiterungen aufrufen
Bevor wir etwas installieren, sollten wir prüfen, ob wir wirklich bei Null anfangen.
- Führen Sie den Befehl
gemini extensions listaus: - Sie sollten die folgende Ausgabe sehen, die bestätigt, dass noch keine Erweiterungen installiert sind.
No extensions installed.
Github-MCP-Server konfigurieren
Ein Gemini CLI-Erweiterungstyp ist ein MCP-Server. Ein MCP-Server ist eine Anwendung, die Tools und Ressourcen über das Model Context Protocol für die Gemini CLI bereitstellt und so die Interaktion mit externen Systemen und Datenquellen ermöglicht. MCP-Server fungieren als Brücke zwischen dem Gemini-Modell und Ihrer lokalen Umgebung oder anderen Diensten wie APIs.
Der Github-MCP-Server ist in der Gemini-Erweiterungsgalerie verfügbar. Klicken Sie darauf, um die Karte „Erweiterungen“ zu öffnen. Dort sehen Sie auch den Befehl zum Installieren der Erweiterung:

Kopieren Sie den Code einfach oder verwenden Sie den folgenden Befehl:
gemini extensions install https://github.com/github/github-mcp-server
Fahren Sie mit den erforderlichen Berechtigungen fort. Nach der Installation sollte diese Erweiterung in der Liste der Erweiterungen angezeigt werden, wenn Sie den Befehl gemini extensions list eingeben.
✓ github (1.0.0)
ID: faa318861b48de8d83c95eb8cd5e82c02393493978d198a0e7bf67fcb1bd22cb
name: c0b0109d9439de57fe3cf03abeccbc52f4c98170c732d3b69af5e6395ace574e
Path: /home/romin/.gemini/extensions/github
Source: https://github.com/github/github-mcp-server (Type: git)
Enabled (User): true
Enabled (Workspace): true
MCP servers:
github
Sie sehen den Pfad der Erweiterung. In diesem Ordner befindet sich eine Datei namens gemini-extension.json, deren Inhalt unten angezeigt wird:
{
"name": "github",
"version": "1.0.0",
"mcpServers": {
"github": {
"description": "--description–",
"httpUrl": "https://api.githubcopilot.com/mcp/",
"headers": {
"Authorization": "Bearer $GITHUB_MCP_PAT"
}
}
}
}
Das persönliche Zugriffstoken (Personal Access Token, PAT) wird über eine Umgebungsvariable gelesen. Sie benötigen zuerst ein persönliches Zugriffstoken (PAT) von GitHub. Wenn Sie das haben, müssen Sie eine .env-Datei erstellen und diesen Wert dort einfügen oder eine Umgebungsvariable wie folgt erstellen (ersetzen Sie PAT_VALUE durch den tatsächlichen Wert):
export GITHUB_MCP_PAT=PAT_VALUE
Sie sollten die Gemini-Befehlszeile neu starten. Nach dem Start können Sie mit dem Befehl „/mcp list“ die Liste der MCP-Server und der jeweiligen verfügbaren Tools aufrufen. Sie sollten den GitHub-MCP-Server in Grün sehen, zusammen mit seinen Tools (mehr als 30). Unten sehen Sie eine unvollständige Liste:
🟢 github (von GitHub) – Bereit (40 Tools)
Tools:
- add_comment_to_pending_review
- add_issue_comment
- assign_copilot_to_issue
- create_branch
- create_or_update_file
- create_pull_request
- create_repository
- delete_file
- fork_repository
- get_commit
- get_file_contents
- get_label
- get_latest_release
- get_me
- get_release_by_tag
- get_tag
- get_team_members
- get_teams
- issue_read
Wir beginnen mit einem Prompt, der eines der Tools vom GitHub-MCP-Server aufruft. Geben Sie den folgenden Prompt ein: „Wer bin ich auf GitHub?“ Dadurch wird in der Gemini-Befehlszeile das richtige Tool ausgewählt und Sie werden um Ihre Einwilligung gebeten.

Sobald Sie die Genehmigung erteilt haben, wird das Ergebnis wie unten dargestellt abgerufen:
✦ You are rominirani, a Developer Advocate at Google Cloud, located in Mumbai. You have 125 public repositories and 256 followers.
Sie sollten jetzt mit einem Ihrer GitHub-Projekte arbeiten. Geben Sie Ihre Anfragen in natürlicher Sprache ein, z. B.:
- Beschreibe das Repository <repo-name> für mich.
- Klonen Sie das Repository <repo-name> auf meinen lokalen Computer.
- Beschreibe @<Dateiname> oder @<Verzeichnisname>/
- Welche verschiedenen Komponenten gibt es in diesem Repository?
- Ich habe die erforderlichen Änderungen vorgenommen. Kannst du die Änderungen per Push auf GitHub übertragen und die GitHub-MCP-Servertools dafür verwenden?
Später in diesem Lab finden Sie eine Übung, in der Sie ausführlich mit dem Github-MCP-Server arbeiten.
Cloud Run-MCP-Server konfigurieren
Die Cloud Run-Erweiterung, die in der Galerie der Gemini CLI-Erweiterungen verfügbar ist, ist ein MCP-Server, mit dem wir unsere Anwendungen in Cloud Run bereitstellen können.
Die Karte für die Cloud Run-Erweiterung aus der Erweiterungsgalerie ist unten zu sehen:

Installieren Sie zuerst die Cloud Run-Erweiterung, indem Sie wie oben gezeigt auf Installationsbefehl kopieren klicken. Fügen Sie diesen Befehl dann in das Cloud Shell-Terminal ein (er sollte dem folgenden ähneln):
gemini extensions install https://github.com/GoogleCloudPlatform/cloud-run-mcp
Wenn Sie den oben genannten Befehl ausführen, werden Sie aufgefordert, die Aktion zu bestätigen. Erteile deine Genehmigung. Die Cloud Run-Erweiterung sollte dann installiert werden.
Wenn Sie jetzt den Befehl gemini extensions list ausführen, sollte die Cloud Run-Erweiterung wie unten dargestellt installiert sein:
✓ cloud-run (1.0.0)
ID: 3c1a38909b6d7d90b6acc8ca1e80d97b4a867253a3cd12d841b2aab4e556a58f
name: 0b1820c1f0c043bbb3b54f496d862c02172424c930eb965d61f468be52e6f127
Path: /home/romin/.gemini/extensions/cloud-run
Source: https://github.com/GoogleCloudPlatform/cloud-run-mcp (Type: git)
Enabled (User): true
Enabled (Workspace): true
Context files:
/home/romin/.gemini/extensions/cloud-run/gemini-extension/GEMINI.md
MCP servers:
cloud-run
Wenn Sie die Gemini CLI jetzt starten und den Befehl /mcp list ausführen, wird Folgendes angezeigt:
🟢 cloud-run (from cloud-run) - Ready (8 tools, 2 prompts)
Tools:
- create_project
- deploy_container_image
- deploy_file_contents
- deploy_local_folder
- get_service
- get_service_log
- list_projects
- list_services
Prompts:
- deploy
- logs
Das sind nur einige der Gemini CLI-Erweiterungen, deren Konfiguration wir gezeigt haben. In der Extensions Gallery finden Sie weitere Erweiterungen. Sie können auch das Codelab Erste Schritte mit Gemini CLI-Erweiterungen durcharbeiten.
10. Anwendungsfälle zum Ausprobieren
Die Gemini CLI kann für eine Vielzahl von Anwendungsfällen verwendet werden, die sowohl für Entwickler als auch für Nicht-Entwickler relevant sind. Hier werden einige Szenarien vorgestellt, die Sie je nach Interesse ausprobieren können.
In jedem dieser Fälle wird der Prompt bereitgestellt. Sie können dies im interaktiven oder nicht interaktiven Modus der Gemini CLI über den Parameter -p beim Starten der Gemini CLI ausprobieren.
Vibe Coding mit der Gemini-Befehlszeile
Wir verwenden die Gemini CLI, um eine Anwendung zu viben. In dieser Aufgabe bitten Sie die Gemini CLI, eine Anwendung zu generieren, und übertragen dann die erste Version per Push in ein GitHub-Repository.
Voraussetzung
Für die Aufgaben in diesem Abschnitt gelten einige Voraussetzungen:
- Git
- Gemini CLI mit der Github Gemini CLI-Erweiterung (haben wir bereits erledigt) oder wenn Sie
gh( Github CLI-Tool) eingerichtet haben, funktioniert das auch. - Grundkenntnisse in Git und etwas Programmierwissen
Wir gehen davon aus, dass Sie die Gemini CLI in einem bestimmten Ordner Ihrer Wahl gestartet haben.
Beginnen Sie mit einem ersten Prompt. Sie können sie nach Belieben anpassen. Während der Sitzung mit der Gemini CLI werden Sie um Berechtigungen zum Erstellen der Dateien usw. gebeten. Erteilen Sie die erforderlichen Berechtigungen.
In dieser Aufgabe soll die Anwendung nicht von der Gemini CLI ausgeführt oder getestet werden, da wir etwas mehr Kontrolle haben möchten. Das ist aber ganz Ihnen überlassen.
Generate a website for a 1-day event filled with technical talks. There are going to be 6 talks in a single track of 1 hour each. Each talk has the following information: title, 1 or maximum of 2 speakers, category (1 or maximum of 3 keywords), duration and a description. The website has a single page where users can see the schedule for the entire day with the timings. There will be one lunch break of an hour and the event starts at 10:00 AM. Keep a 10 minute transition between talks. I would like to use Node.js on the server side and standard HTML, JavaScript and CSS on the front-end. The users should be able to search the talks based on category.
I would like you to proceed in the following way:
1. Plan out how you would design and code this application.
2. Ask me for any clarifications along the way.
3. Once I am fine with it, do generate the code and provide me instructions to run and test locally.
Die nächsten Prompts und Antworten sind ein Beispiel für einen beobachteten Ablauf. Gemini CLI erstellt einen Plan und bittet Sie um Bestätigungen / Klarstellungen oder fährt fort. Bitte folgen Sie der Anleitung. Hier ist ein Beispiel für einen Konversationsverlauf:
1. Backend (Node.js/Express):
* Set up an Express server to serve the static frontend files.
* Create an /api/schedule endpoint that will:
* Generate the event schedule dynamically, including talk timings and the lunch break, based on your requirements.
* Store mock talk data (title, speakers, category, description).
* Filter the schedule based on a category query parameter.
2. Frontend (HTML, CSS, JavaScript):
* Create an index.html file for the main structure.
* Develop style.css for a clean and responsive design.
* Write script.js to:
* Fetch the schedule data from the backend.
* Dynamically render the talks and lunch break on the page.
* Implement a search input that filters talks by category, updating the displayed schedule without a full page reload.
3. Schedule Logic:
* The backend will handle calculating the precise start and end times for each 1-hour talk, factoring in the 10:00 AM start, 10-minute transitions, and the 1-hour lunch break.
Before I proceed with the code, could you please clarify the following:
* Example Talk Data: Could you provide some example talk titles, speakers, categories (keywords), and descriptions? This will help me create realistic dummy data for the schedule.
* Lunch Break Placement: Where should the 1-hour lunch break be placed in the schedule? (e.g., after the 3rd talk, at 1 PM, etc.)
* Styling Preferences: Do you have any specific styling preferences (e.g., color scheme, modern/minimalist, etc.)? If not, I will go with a clean, simple design.
✦ I will create a single-page website for your event. Here's my plan:
✓ WriteTodos Set 7 todo(s)
✦ I am waiting for your clarifications regarding the example talk data, lunch break placement, and styling preferences before I proceed with generating the code.
Schließlich wurde mir folgende Zusammenfassung angezeigt:
✦ Instructions to Run and Test Locally:
1. Start the server:
Open your terminal in the project directory (/home/romin/gemini-cli-projects/event-website/) and run:
1 node server.js
You should see a message in the terminal indicating: Server running on http://localhost:3000.
2. Open in your browser:
Open your web browser and navigate to:
http://localhost:3000
3. Test functionality:
* You should see the event schedule displayed on the page, with talks and a lunch break.
* Search by category: In the "Search by category..." input box, type a category keyword (e.g., "AI", "Web Development", "Python", "Security").
* Click the "Search" button. The schedule displayed should filter to only show talks matching that category.
* Click the "Reset" button to clear the search filter and view the full schedule again.
Let me know if you encounter any issues or if you'd like to make any modifications or additions to the website!
Nachdem wir die Anleitung zum Starten des Servers befolgt und die Startseite aufgerufen haben, wurde eine Beispielwebsite wie unten dargestellt angezeigt (wenn Sie denselben Prompt verwendet haben, sollte eine Variante einer ähnlichen Website angezeigt werden):

Sie können mit der Gemini CLI weitere Änderungen vornehmen. Wenn Sie mit den Änderungen zufrieden sind, können Sie sie per Push in ein GitHub-Repository übertragen.
Erstellen wir zuerst eine .gitignore-Datei. Dabei kann Ihnen die Gemini CLI helfen.
Create a .gitignore file for this project.
Im nächsten Schritt müssen Sie Gemini CLI anweisen, dieses Repository in unser GitHub-Konto zu übertragen. Dadurch werden die GitHub-MCP-Servertools im Hintergrund ausgeführt.
Geben Sie einen Prompt ähnlich dem folgenden ein:
Great! I would now like to push all of this to a new repository in my Github account. I would like to name this repository <Your-Name>-event-talks-app
Hier werden eine Reihe von Befehlen durchlaufen:
- Im Folgenden wird gezeigt, wie Sie das Repository anlegen.
- Es werden mehrere Git-Befehle verwendet: „init“, „add“ und „commit“ zum Verwalten des lokalen Git-Repositorys.
- Anschließend wird das Git-Remote-Repository eingerichtet und ein Push ausgeführt.
Hinweis:Es kann vorkommen, dass die Gemini CLI ein Zeitlimit überschreitet oder einen falschen Nutzernamen verwendet. Interagieren Sie mit ihr und schlagen Sie Korrekturen vor.
Wenn alles gut geht, sollten Sie ein GitHub-Repository haben. Hier sehen Sie einen Beispiel-Screenshot:

Sie haben für dieses Projekt noch kein README.md generiert. Das ist eine gute Übung für den nächsten Abschnitt, in dem wir mit dem gerade erstellten Repository arbeiten.
Mit der Gemini CLI an einem GitHub-Repository arbeiten
In diesem Anwendungsfall verwenden Sie die Gemini CLI, um mit einem GitHub-Repository zu arbeiten. Sie führen mehrere Aufgaben aus, darunter:
- Codebasis verstehen
- Dokumentation erstellen
- Neue Funktion implementieren
- Änderungen per Commit in das Repository übertragen und per Push hochladen
- An einem GitHub-Issue arbeiten und die vorgeschlagenen Änderungen implementieren
Das sollte eine gute Grundlage sein, um dann mit Ihren Repositories zu arbeiten und die Gemini CLI als Assistent für diese entwicklerspezifischen Aufgaben zu verwenden.
Voraussetzung
Für die Aufgaben in diesem Abschnitt benötigen Sie Folgendes:
- Git
- Gemini CLI mit der Github MCP Gemini CLI-Erweiterung (haben wir bereits erledigt) oder wenn Sie
gh( Github CLI-Tool) eingerichtet haben. - Grundkenntnisse von Git und etwas Programmierwissen (in diesem Beispiel verwenden wir Node.js, da Sie die Umgebung möglicherweise bereits auf Ihrem Computer eingerichtet haben, weil Sie die Gemini CLI installiert haben). Sie können später aber auch ein Repository Ihrer Wahl mit einer anderen Programmiersprache und einem anderen Framework auswählen.
- Sie sollten den vorherigen Abschnitt abgeschlossen haben und das Repository zur Hand haben, in dem wir eine Event Talks-Website erstellt haben.
Verwenden Sie Gemini CLI weiterhin über den Ordner/das Verzeichnis, das Sie zum Generieren der Event Talks-Anwendung verwendet haben. Bei Bedarf können Sie das Repository auf Ihren lokalen Computer klonen und Gemini CLI dann über dieses Verzeichnis starten. Probieren Sie die folgenden Szenarien aus:
Codebasis verstehen
- Ich möchte dieses Projekt im Detail verstehen. Erkläre mir die wichtigsten Funktionen und unterteile sie dann in Server- und Clientseite. Nimm einen Beispielablauf und zeige mir, wie die Anfrage und Antwort funktionieren.
Explain @server.js
README-Datei generieren
- Generiere eine
README-Datei für dieses Projekt.
Neue Funktion implementieren
- Ich möchte eine neue Funktion implementieren, mit der Nutzer auch nach einem bestimmten Sprecher suchen können. Erstelle zuerst einen Plan, wie du diese Änderung implementieren würdest, und dann können wir den Code generieren.
Sie sollten einen Plan erhalten, den Sie genehmigen können. Nach der Genehmigung werden die Änderungen von der Gemini CLI vorgenommen. Testen Sie Ihre Änderungen und bitten Sie Gemini CLI, Fehler zu beheben, falls welche auftreten (was wahrscheinlich ist).
Wenn die Änderungen in Ordnung sind, können Sie sie mit denselben Schritten committen und per Push in das Remote-Repository übertragen.
Probleme auf Grundlage vorgeschlagener Funktionen generieren
Lass uns hier etwas Interessantes ausprobieren. Sie werden Gemini CLI fragen, wie die Nutzerfreundlichkeit dieser Anwendung verbessert werden kann. Basierend auf der Antwort kann Gemini CLI diese Vorschläge als Probleme im selben GitHub-Repository erstellen. Dazu wird das Tool create_issue vom GitHub-MCP-Server verwendet.
Probieren Sie den folgenden Prompt aus:
- Ich möchte, dass Sie die Anwendung aus Sicht der Nutzererfahrung bewerten. Nutzerfreundlichkeit, Reaktionsfähigkeit, hilfreiche Meldungen und mehr. Bitte erstelle eine Liste mit Verbesserungsvorschlägen und dann entsprechende Issues im GitHub-Repository.
Idealerweise werden die Verbesserungen zuerst mit Ihnen geteilt und dann mit Ihrer Erlaubnis die Probleme im GitHub-Repository erstellt. Hier ist ein Beispiel-Screenshot aus unserem Lauf:

An einem GitHub-Issue arbeiten und die vorgeschlagenen Änderungen implementieren
Sie können jetzt eines der zuvor generierten Probleme auswählen und Gemini CLI bitten, es zu bearbeiten und zu implementieren.
Unten sehen Sie ein Beispiel für ein Problem, das generiert wurde:

Kopieren Sie die vollständige Problem-URL und geben Sie einen Prompt wie diesen ein:
- Bitte lesen Sie sich das Problem
<YOUR_ISSUE_URL>durch und informieren Sie sich, welche Änderungen vorgenommen werden müssen. Erstelle zuerst einen Plan und zeige dann die vorgeschlagenen Änderungen im Code.
Sie können die Änderungen genehmigen und per Push in das Repository übertragen. Sie können Gemini sogar bitten, das Problem zu schließen.
(Optional) Alltägliche Aufgaben
Die unten aufgeführten Anwendungsfälle sind Aufgaben, die Sie möglicherweise regelmäßig ausführen. Dazu gehören das Organisieren von Dateien in Ordnern, das Abrufen und Zusammenfassen von Inhalten aus dem Web, das Verarbeiten von Bilddateien und das Extrahieren von Inhalten daraus, das Arbeiten mit Datenbanken und vieles mehr.
Sie können sich gern alle Anwendungsfälle ansehen, die Sie interessieren.
Dateien/Ordner organisieren
Mit der Gemini CLI können Sie die Dateien je nach Bedarf nach Typen in verschiedenen Ordnern organisieren. Rufen Sie auf Ihrem Computer einen Ordner mit mehreren Dateien auf, z. B. TXT, PNG, JPG, PDF und MP4. Das ist wahrscheinlich Ihr Desktop oder Ihr Downloadordner.
Hier sehen Sie einen Beispielordner und den Inhalt des Ordners (möglicherweise haben Sie andere Dateien):

Gehen Sie zu diesem Ordner und starten Sie die Gemini CLI. Sie bitten die Gemini CLI zuerst, die Ordner „Bilder“, „Dokumente“ und „Videos“ zu erstellen, und dann, die Dateien in den Ordnern zu organisieren.
Die Gemini CLI fordert Sie häufig um Erlaubnis, bevor Befehle ausgeführt werden, insbesondere solche, die Ihr Dateisystem ändern (z. B. Dateien schreiben, verschieben oder löschen). Prüfen Sie diese Aufforderungen immer sorgfältig, bevor Sie Berechtigungen erteilen. Das ist Ihr Sicherheitsnetz.
Create the following folders "Images","Documents","Videos"
Geben Sie dann den folgenden Prompt ein:
Go through all the files in this folder and then organize them by moving all the files ending with .jpg, .jpeg, .gif into the "Images" folder. Move all ".txt" files into the "Documents" folder. Move all the ".mp4" files in the "Videos" folder.
Ein Beispiel für den endgültigen Zustand des Ordners sehen Sie unten. Es sollten neue Unterordner erstellt und die Dateien je nach Typ in die entsprechenden Unterordner verschoben werden.

Einige weitere Organisationsszenarien (die Prompts sind neben dem jeweiligen Szenario angegeben):
- Zusammenfassung:Erstelle für jedes Dokument im Ordner „Documents“ eine TXT-Datei im selben Ordner mit dem Namen „summary_ORIGINAL_FILENAME.txt“, die eine Zusammenfassung der wichtigsten Punkte des Dokuments in drei Sätzen enthält.
- Nach Typ kategorisieren:Alle PDF- und DOCX-Dateien in diesem Verzeichnis scannen. Verschiebe alle Dateien, die „invoice“ im Namen oder Inhalt enthalten, in den Ordner „Financial/Invoices“. Verschieben Sie Dateien mit dem Begriff „receipt“ in den Ordner „Financial/Receipts“. Alle anderen DOCX-Dateien werden in „Berichte“ gespeichert.
- Schlüsselinformationen extrahieren (und „taggen“): Lesen Sie für jede PDF-Datei im Ordner „Finanziell/Rechnungen“ den Inhalt. Wenn Sie ein Datum finden, benennen Sie die Datei so um, dass das Datum im Format JJJJ-MM-TT enthalten ist, z.B. ‘invoice_2025-07-26_original_name.pdf'.
Bilder organisieren
Sehen wir uns an, wie Sie Bildinhalte auf Ihrem Computer organisieren können.
So kannst du es ausprobieren:
- Sie benötigen ein Verzeichnis mit verschiedenen Bilddateien (JPG, PNG usw.). Einige sollten EXIF-Daten enthalten (die meisten Fotos von Kameras/Smartphones haben diese).
- Wechseln Sie zu diesem Verzeichnis.
- Starten Sie die Gemini-Befehlszeile.
Probieren Sie eines der folgenden Szenarien aus (die Prompts sind neben dem jeweiligen Szenario angegeben):
- Nach Datum umbenennen (EXIF-Daten): Benennt alle JPG- und PNG-Dateien in diesem Verzeichnis um, sodass das Erstellungsdatum aus den EXIF-Daten im Format „JJJJMMTT_HHMMSS_original_name.jpg“ enthalten ist. Wenn kein EXIF-Datum gefunden wird, verwenden Sie das Datum der letzten Änderung der Datei.
- Bildbeschreibungen erstellen:Beschreiben Sie für jedes Bild in diesem Ordner, was auf dem Bild zu sehen ist, und speichern Sie die Beschreibung in einer Textdatei mit dem Namen „description_ORIGINAL_DATEINAME.txt“ im selben Verzeichnis.
- Duplikate identifizieren (konzeptionell, erfordert komplexere Logik): Finde alle doppelten Bilder in diesem Ordner basierend auf ihrem visuellen Inhalt und liste ihre Dateinamen auf. Löschen Sie sie noch nicht.
Artikel zusammenfassen (lokale Dateien oder Web)
Sie können die URL, das Thema und die lokalen Dateinamen in den folgenden Szenarien nach Bedarf ändern. Die angegebenen Dateinamen sind Beispieldateinamen. Sie können sie durch Dateinamen von Dateien ersetzen, die sich auf Ihrem System befinden.
Probieren Sie eines der folgenden Szenarien aus (die Prompts sind neben dem jeweiligen Szenario angegeben):
- Webartikel zusammenfassen (einzelne URL): Gehen Sie zu https://medium.com/google-cloud/getting-started-with-gemini-cli-8cc4674a1371 und fassen Sie die drei wichtigsten Punkte dieses Nachrichtenartikels zusammen.
- Mehrere Webartikel zusammenfassen (z.B. aus einer Suche): Suchen Sie mit der Google Suche nach den neuesten Nachrichtenartikeln zu „Gemini CLI“. Fasse die fünf wichtigsten relevanten Artikel in jeweils zwei bis drei Sätzen zusammen und liste ihre URLs auf.
- Lokale Textdatei zusammenfassen:Fasse die wichtigsten Punkte des Artikels in „my_research_paper.txt“ zusammen. Konzentrieren Sie sich auf die Methodik und die Schlussfolgerungen.
- Lokales PDF zusammenfassen: „Lies ‚financial_report_Q2_2025.pdf‘.“ Fasse die erwähnte finanzielle Leistung und die wichtigsten Herausforderungen zusammen.
Spezifische Informationen extrahieren (lokale Dateien oder Web)
Sie können die URL, das Thema und die lokalen Dateinamen in den folgenden Szenarien nach Bedarf ändern. Die angegebenen Dateinamen sind Beispieldateinamen. Sie können sie durch Dateinamen von Dateien ersetzen, die sich auf Ihrem System befinden.
Probieren Sie eines der folgenden Szenarien aus (die Prompts sind neben dem jeweiligen Szenario angegeben):
- Entitäten aus einem lokalen Artikel extrahieren:Liste aus „biography.txt“ alle benannten Personen und die mit ihnen verbundenen wichtigen Daten auf.
- Daten aus einer Tabelle in einem PDF extrahieren:Extrahiere aus „quarterly_sales.pdf“ die Daten aus der Tabelle auf Seite 3, in der „Product Sales by Region“ (Produktumsatz nach Region) aufgeführt ist, und stelle sie in einer Markdown-Tabelle dar.
- Nachrichtenüberschriften und ‑quellen von einer Nachrichtenwebsite extrahieren:Rufen Sie „https://news.google.com/“ (oder eine ähnliche Nachrichtenseite) auf. Extrahieren Sie die wichtigsten Schlagzeilen von der Titelseite und die entsprechenden Nachrichtenquellen. Stelle sie als Aufzählungsliste dar.
- Produktspezifikationen auf einer E-Commerce-Seite finden:Rufen Sie „https://www.amazon.in/Google-Cloud-Certified-Associate-Engineer/dp/1119871441“ auf (Beispiel für ein Buch). Extrahieren Sie den Buchtitel, den Autor und andere Details. Stellen Sie die Informationen in einem strukturierten JSON-Format dar.
- Extrahieren Sie die Dauer eines Videos in einem bestimmten Format (z. B. „2h37m42s“).
Fragen basierend auf Inhalten beantworten (RAG-ähnliches Verhalten)
Sie können die URL, das Thema und die lokalen Dateinamen in den folgenden Szenarien nach Bedarf ändern. Die angegebenen Dateinamen sind Beispieldateinamen. Sie können sie durch Dateinamen von Dateien ersetzen, die sich auf Ihrem System befinden.
Probieren Sie eines der folgenden Szenarien aus (die Prompts sind neben dem jeweiligen Szenario angegeben):
- Fragen und Antworten zu einem lokalen Dokument:Ich hänge „user_manual.pdf“ an. Wie kann ich Probleme mit der Netzwerkverbindung beheben?
- Fragen und Antworten auf einer Webseite:Was sind laut WHO die primären Gesundheitsrisiken, die mit dem Klimawandel verbunden sind, wenn man die Inhalte von „https://www.who.int/news-room/fact-sheets/detail/climate-change-and-health“ zugrunde legt?
- Informationen aus mehreren Quellen vergleichen:Ich habe zwei Nachrichtenartikel: „article1.txt“ und „article2.txt“. Beide befassen sich mit den jüngsten Änderungen der Wirtschaftspolitik. Vergleichen und stellen Sie ihre Ansichten zu den potenziellen Auswirkungen auf kleine Unternehmen gegenüber.
Inhaltsgenerierung basierend auf extrahierten Informationen
Sie können die URL, das Thema und die lokalen Dateinamen in den folgenden Szenarien nach Bedarf ändern.
Probieren Sie eines der folgenden Szenarien aus (die Prompts sind neben dem jeweiligen Szenario angegeben):
- Kurzfassung eines Artikels erstellen:Lies @tech_innovation_article.txt. Schreibe eine kurze, ansprechende Meldung (ca. 150 Wörter) für einen Unternehmensnewsletter, in der du die neue Technologie und ihr Potenzial hervorhebst.
- E‑Mail mit Zusammenfassung eines Besprechungstranskripts entwerfen:Hier ist eine Datei mit einem Besprechungstranskript: @meeting_transcript.txt. Verfassen Sie eine E-Mail an das Team, in der Sie die wichtigsten getroffenen Entscheidungen und zugewiesenen Aufgaben zusammenfassen und angeben, wer für die einzelnen Aufgaben verantwortlich ist.
Multimodale Unterstützung für Gemini CLI
Die Gemini-Befehlszeile unterstützt mehrere Modelle über Gemini. Sie können sie bitten, Dateien mit unterschiedlichen Inhaltsformaten gemäß Ihren Anforderungen zu verarbeiten.
Sie verarbeiten eine Reihe von Rechnungsbildern mit der Gemini CLI und extrahieren wichtige Informationen daraus. Gehen Sie dazu so vor:
- Erstellen Sie einen Ordner auf Ihrem Computer und laden Sie einige Rechnungen aus dem folgenden GitHub-Repository herunter.
- Gemini CLI über diesen Ordner starten
Geben Sie den folgenden Prompt ein, um Informationen aus den Rechnungen in Form einer Tabelle zu extrahieren.
The current folder contains a list of invoice files in Image format. Go through all the files in this folder and extract the following invoice information in the form of a table: Invoice No, Invoice Date, Invoice Sent By, Due Date, Due Amount.
Die Ausgabe sollte idealerweise so aussehen:

Hier ist ein weiteres Szenario, in dem Sie zusätzliche abgeleitete Spalten anfordern können. Angenommen, Sie möchten für alle Fälligkeitsdaten von Rechnungen, die in der Vergangenheit liegen, ein rotes Kreuz-Emoji anzeigen. Sie können einen Prompt so eingeben:
list all files with .png extension in this folder. Extract the invoice information from it by reading them locally and display it in a table format containing the following column headers: : Invoice No, Invoice Date, Invoice Sent By, Due Date, Due Amount. Add a column at the end of the table that shows a red cross emoji in case the due date is in the past.
Dies führt zu folgender Ausgabe:

Wenden Sie dies auf alle Ihre eigenen Dateien an, die nicht im Textformat vorliegen.
Mit der Gemini-Befehlszeile mit Datenbanken arbeiten
Mit der Gemini CLI können Sie effizienter mit verschiedenen Datenbanken arbeiten. Sie können Gemini in BigQuery für verschiedene Szenarien verwenden, z. B. für Abfragen in natürlicher Sprache, den Export von Daten, das Entwerfen von Datenbankschemas und das Generieren realistischer Testdaten.
Für diese Aufgabe müssen Sie SQLite3 verwenden. Sie müssen SQLite3 installieren und die Chinook-Beispieldatenbank haben.
Hier finden Sie eine kurze Anleitung zum Einrichten von SQLite3:
- macOS: SQLite3 ist vorinstalliert. Bestätigen Sie die Identität mit
sqlite3 --version. Installieren Sie es bei Bedarf mit Homebrew:brew install sqlite3. - Windows: Laden Sie die vorkompilierten Binärdateien von der SQLite-Website herunter. Extrahieren Sie die Dateien in ein Verzeichnis (z.B.
C:\sqlite). Fügen Sie dieses Verzeichnis der PATH-Umgebungsvariable Ihres Systems hinzu. - Linux: Debian/Ubuntu:
sudo apt update && sudo apt install sqlite3
Laden Sie die Chinook-Beispieldatenbank herunter (direkter Downloadlink).
Für die Ausführung dieser Prompts empfiehlt es sich, im Verzeichnis gemini-cli-projects einen Ordner (database-tasks) zu erstellen. Kopieren Sie die Chinook-Datenbankdatei in diesen Ordner. Prüfen Sie, ob das sqlite3-Tool auf Ihrem System eingerichtet und im Pfad verfügbar ist, damit die Gemini CLI es verwenden kann. Starten Sie die Gemini-Befehlszeile.
Das Diagramm des Datenbankschemas ist unten zu sehen:

Angenommen, Sie befinden sich in einem Ordner mit dem Namen database-tasks und die Chinook-Datenbankdatei hat den Namen chinook.db.
Im Folgenden finden Sie einige Prompts, die Ihnen die Arbeit mit Datenbanken erleichtern können. Wir gehen kurz auf die erste ein, um die angeforderte Berechtigung zu veranschaulichen.
Beginnen Sie mit dem Prompt, um die in der Datenbank vorhandenen Tabellen aufzulisten:
What tables are present in the file: chinook.db
Dabei wird das Tool verwendet, um die Datei zu lesen, und dann wird das Dienstprogramm sqlite3 auf Ihrem System verwendet, um die erforderlichen Schritte auszuführen:

Erteilen Sie die Berechtigung, das Programm einmal auszuführen, um die erwartete Ausgabe zu erhalten:

Probieren Sie die folgenden Prompts oder einen anderen Prompt Ihrer Wahl aus:
- Wie viele Mitarbeiter gibt es?
- Wie lautet das Schema der Tabelle „invoices“?
- Welche drei Rechnungen haben den höchsten Gesamtbetrag und von welchen Kunden wurden sie ausgestellt?
Gemini CLI erledigt zwei Dinge: Es wird die richtige SQL-Anweisung generiert, die Ihren Anforderungen entspricht, und der richtige sqlite3-Befehl wird ausgegeben.
Mit der Gemini CLI Daten generieren
Sie können Gemini CLI auffordern, Daten in verschiedenen Datenformaten zu generieren. Das kann von Inhalten bis hin zu JSON-Daten reichen, die Sie möglicherweise simulieren müssen. Wir konzentrieren uns hier auf Szenarien, die für Entwickler/Tester relevant sind.
Hier sind einige Prompts, die Sie ausprobieren können:
JSON-Daten von Beispielkundenrezensionen generieren
Generate a JSON array of 3 synthetic customer reviews for a new smartphone. Each review should have 'reviewId' (string, UUID-like), 'productId' (string, e.g., 'SMARTPHONE_X'), 'rating' (integer, 1-5), 'reviewText' (string, 20-50 words), and 'reviewDate' (string, YYYY-MM-DD format).
Mock-API-Antworten (JSON) generieren
Generate a JSON array representing 7 daily sales records for a mock API endpoint. Each record should include 'date' (YYYY-MM-DD, chronologically increasing), 'revenue' (float, between 5000.00 and 20000.00), 'unitsSold' (integer, between 100 and 500), and 'region' (string, either 'North', 'South', 'East', 'West').
SQL-Beispielanweisungen zum Einfügen von Daten in die Datenbank generieren
Generate 5 SQL INSERT statements for a table named 'users' with columns: 'id' (INTEGER, primary key), 'username' (VARCHAR(50), unique), 'email' (VARCHAR(100)), 'password_hash' (VARCHAR(255)), 'created_at' (DATETIME, current timestamp). Ensure the password_hash is a placeholder string like 'hashed_password_X'.
CSV-Daten zum Laden/Analysieren von Daten generieren
Generate 10 lines of CSV data, including a header row, for customer transactions. Columns should be: 'TransactionID' (unique string), 'CustomerID' (integer), 'ItemPurchased' (string, e.g., 'Laptop', 'Monitor', 'Keyboard'), 'Quantity' (integer, 1-3), 'UnitPrice' (float, between 100.00 and 1500.00), 'TransactionDate' (YYYY-MM-DD).
Konfigurationsdatei (YAML) generieren
Generate a sample YAML configuration for a 'user_service'. Include sections for 'database' with 'host', 'port', 'username', 'password', 'database_name'. Also include a 'api_keys' section with 'payment_gateway' and 'email_service' placeholders. Use realistic default values.
Testdaten für Grenzfälle/Validierung generieren
Generate a JSON array of 8 email addresses for testing purposes. Include a mix of: 2 valid standard emails, 2 with missing '@', 2 with invalid domains (e.g., '.com1'), and 2 with special characters in the local part that are usually invalid (e.g., spaces or multiple dots).
11. Glückwunsch
Sie haben die Gemini CLI, ihre Funktionen und einige Anwendungsfälle kennengelernt.