このページは Cloud Translation API によって翻訳されました。

Gemini CLI を使った実践演習

1. はじめに

この Codelab では、Gemini の威力をターミナルに直接取り込むオープンソースの AI エージェントである Gemini CLI について学習します。

Gemini CLI プロジェクトはオープンソースです。公開ロードマップはこちらでご覧いただけます。

この Codelab では、次のようなアクティビティでステップバイステップのアプローチを採用します。

Gemini CLI のインストール
基本的な構成
Gemini CLI のツールと組み込みコマンドを調べる
GEMINI.md ファイルを使用して Gemini CLI をカスタマイズする
Gemini CLI を使用したユースケースの例

必要なもの

Chrome ウェブブラウザ
Gmail アカウント
マシンに Node 20 以降がインストールされているローカルマシン。

この Codelab は、初心者を含むあらゆるレベルのユーザーとデベロッパーを対象としています。

2. インストール

設定を実行して Gemini CLI を実行する前に、その中に作成するすべてのプロジェクトのホームフォルダとして使用するフォルダを作成しましょう。これは Gemini CLI が動作するための出発点ですが、必要に応じてシステム上の他のフォルダも参照します。これについては後で説明します。

サンプルフォルダ（gemini-cli-projects）を作成し、次のコマンドを使用してそのフォルダに移動します。別のフォルダ名を使用する場合は、そのようにしてください。

mkdir gemini-cli-projects

そのフォルダに移動します。

cd gemini-cli-projects

Gemini CLI を実行するには、次のいずれかの方法を使用します。

次のコマンドで実行します。

npx https://github.com/google-gemini/gemini-cli

まず、システムに Gemini CLI をグローバルにインストールできます。そのためには、管理者権限が必要です。

npm install -g @google/gemini-cli

次のコマンドで実行します。

gemini

上記の方法で Gemini CLI を起動すると、テーマの選択を求める次の画面が表示されます。お好みのものを選択してください。

選択すると、認証方法が求められます。このラボでは、Google 以外の関連アカウントや Google Workspace 関連アカウントではなく、個人の Google アカウントを使用することをおすすめします。この無償ライセンスがあれば、Gemini 2.5 Pro と、100 万トークンのコンテキストウィンドウを利用できます。無料枠では、1 分あたり 60 件のモデルリクエストと 1 日あたり 1,000 件のリクエストを無料で利用できます。

Google アカウントに付与されている現在の無料割り当ての上限に達した場合は、Gemini API キーまたは Google Cloud Vertex AI を使用できます。この場合、プロジェクト ID とそのプロジェクトのロケーション名が必要になります。他の認証方法を使用する場合は、ドキュメントの認証セクションを参照してください。

[Enter] をクリックします。ブラウザで Google 認証ページが開きます。Google アカウントで認証を行い、利用規約に同意します。認証が完了すると、Gemini CLI がコマンドを待機していることがわかります。以下にスクリーンショットの例を示します。

「/help」（スラッシュ）を入力すると、次のようにさまざまなコマンドとキーボードショートカットが表示されます。

Gemini CLI との最初のやり取り

ボックスに最初のメッセージを入力します。次のようなクエリを指定します。

クエリの結果、GoogleSearch ツール（Gemini CLI の組み込みツール）が呼び出されたことがわかります。これは、Gemini CLI の強力な組み込みツールの 1 つである GoogleSearch を使用して、ウェブから取得した情報に基づいて回答を生成する興味深い方法です。ツールについては、次のセクションで詳しく説明します。

ここでは Gemini CLI を終了します。これを行うには、/quit コマンドを使用するか、対話型 Gemini CLI ターミナルセッションで Ctrl-C を 2 回実行します。

Gemini CLI カスタマイズファイル : settings.json

Gemini CLI を初めて起動したときに、テーマと認証方法を選択するように求められたことを思い出してください。Gemini CLI を次回以降実行するときは、テーマと認証方法の選択を求められることはありません。つまり、どこかに保存され、使用されるファイルは settings.json と呼ばれ、Gemini CLI をカスタマイズする方法です。

設定は次の優先順位で適用されます。

ワークスペース: .gemini/settings.json（ユーザー設定とシステム設定をオーバーライドします）。
ユーザー: ~/.gemini/settings.json（システム設定をオーバーライドします）。
システム: /etc/gemini-cli/settings.json（すべてのユーザーに適用されます）。

テーマを選択したときに、ユーザー設定に設定を保存するよう求められたことを思い出してください。~/.gemini folder にアクセスすると、settings.json ファイルが表示されます。

settings.json ファイルを以下に示します。別のテーマを選択していた場合は、その名前が表示されます。

{
  "theme": "Default",
  "selectedAuthType": "oauth-personal"
}

3. Gemini CLI コマンドパラメータ

Gemini CLI の起動時に指定できるコマンドラインパラメータがいくつかあります。オプションの全リストを取得するには、次のように --help を使用します。

gemini --help

これにより、利用可能なすべてのオプションが表示されます。こちらのドキュメントをご覧ください。

そのうちのいくつかを見てみましょう。1 つ目は、Pro モデルまたは Flash モデルを使用するように Gemini CLI を構成することです。このラボの作成時点では、サポートされているモデルはこれら 2 つのみです。デフォルトでは Gemini 2.5 Pro モデルが使用されますが、Flash モデルを使用する場合は、次のように -m パラメータを使用して Gemini CLI の起動時に指定できます。

gemini -m "gemini-2.5-flash"

上記の方法で開始すると、次の図に示すように、Gemini CLI ターミナルの右下でモデルを確認できます。

非インタラクティブモード

興味深いオプションは、非インタラクティブモードで Gemini CLI を実行することです。つまり、Gemini CLI のインタラクティブターミナルを開くことなく、プロンプトを直接指定して、応答を得ることができます。これは、スクリプトや他の自動化プロセスの一部として Gemini CLI を自動的に使用する場合に非常に便利です。-p パラメータを使用して、次のように Gemini CLI にプロンプトを指定します。

gemini -p "What is the gcloud command to deploy to Cloud Run"

フォローアップの質問で会話を続けることはできませんので、ご注意ください。

4. Gemini CLI - 組み込みツール

Gemini CLI には一連の組み込みツールが付属しており、ツールに関するドキュメントには「Gemini モデルはこれらのツールを使用してローカル環境とやり取りし、情報にアクセスしてアクションを実行します。これらのツールは CLI の機能を強化し、テキスト生成だけでなく、幅広いタスクを支援できるようにします。」

現在の組み込みツールの一覧を取得するには、次のように /tools コマンドを呼び出すだけです。

すぐに思いつくことの 1 つは、Gemini CLI が必要に応じてこれらのツールを呼び出すことができるかどうかを自問することです。ローカルシステムへの書き込み、外部システムからの読み取り、外部ネットワークへのアクセスなど、機密性の高いオペレーションについては、デフォルトの回答は「いいえ」です。

CLI を起動すると --yolomode が使用可能になりますが、ここでは使用しません。Gemini CLI は、選択したツールを実行する権限を求めるプロンプトを表示します。権限を拒否したり、1 回だけ実行したり、常に実行する包括的な権限を付与したりできます。すべてを完全に制御できる状態にすべきです。

Gemini CLI が組み込みツールのいずれかを選択して実行するプロンプトを送信し、その仕組みを理解しましょう。

世界中の最新の金融ニュースに関する情報を取得し、Gemini CLI を起動したローカルの作業ディレクトリにあるファイルに保存したいと考えています。次のプロンプトを入力します。

Search for the latest headlines today in the world of finance and save them in a file named finance-news-today.txt

このツールが何をするべきかを考えてみましょう。理想的には、Google 検索を実行して、金融ニュースを提供できる関連性の高い情報源からニュースを取得する必要があります。次に、そのコンテンツを含む finance-news-today.txt という名前のファイルを作成する必要があります（ローカルシステムへの書き込みオペレーションには権限が必要です）。

何が起こるか見てみましょう（ご自身のマシンでも同じように進めてください）。

まず、GoogleSearch ツールを呼び出してウェブを検索します。

検索が完了すると、次のようにデータが取得されます。

完了すると、ファイルに書き込む準備が整い、WriteFile ツールが使用されますが、これは機密性の高いオペレーション（書き込み）であるため、権限を求められます。権限の種類（1 回のみ許可、常に許可など）を決定できます。ここでは、[1 回のみ許可] を選択します。

これにより、情報がファイルに書き込まれ、次のような成功メッセージが表示されます。

ファイルが書き込まれたかどうかを確認するにはどうすればよいですか？@file を使用して、コンテンツの読み上げをリクエストできます。以下に示すように、プロンプトを指定します。@ と入力すると、現在のフォルダ内のファイルの一覧が表示され、作成したばかりのファイルが表示されます。そのコースを選択して、プロンプトを送信します。プロンプトは次のとおりです。

read the contents of @finance-news-today.txt

これにより、必要なツール（ReadManyFiles、ReadFile）が呼び出され、次のようにコンテンツが表示されます。

また、Gemini CLI 内から Shell を直接操作する方法を学ぶ良い機会でもあります。メッセージボックスで ! を押すと、シェルモードに切り替わります。シェルモードに切り替わります。! キーをもう一度押すか、ESC キーを押すと、元に戻ります。

シェルモードでは、次のようにプロンプトの先頭に ! が表示されます。

次のように、pwd や ls などの標準コマンドを使用して直接確認できます。

本日、cat コマンドを使用してファイルの内容を出力できます。

演習: 以下の演習を試してください。任意の RSS フィードを選択します。Gemini CLI にプロンプトを指定して、RSS フィードのコンテンツを取得し、特定の方法で結果をフォーマットします。これは、1 日の始まりに何かを自動化するのに適した方法です。

ヒント: 最終的に、Gemini CLI で WebFetch ツールを使用するようにします。

5. Model Context Protocol（MCP）サーバーの構成

MCP サーバーは、Model Context Protocol を介してツールとリソースを Gemini CLI に公開するアプリケーションです。これにより、外部システムやデータソースとやり取りできます。MCP サーバーは、Gemini モデルとローカル環境や API などの他のサービス間のブリッジとして機能します。

MCP サーバーを使用すると、Gemini CLI はツールを検出して実行できます。これにより、Gemini CLI の機能が拡張され、データベース、API、カスタムスクリプト、特殊なワークフローとのやり取りなど、組み込み機能を超えたアクションを実行できるようになります。

Gemini CLI は、カスタムツールの検出と使用のために MCP サーバーを構成することをサポートしています。Gemini CLI を起動している場合は、次のように /mcp コマンドを使用して、構成された MCP サーバーを確認できます。

MCP サーバーを構成していない場合は、Gemini CLI の MCP サーバーのドキュメントが起動します。

MCP サーバーは、~/.gemini/settings.json ファイルまたはプロジェクトのルートディレクトリでグローバルレベルで構成できます。.gemini/settings.json ファイルを作成するか、開きます。ファイル内で、次のように mcpServers 構成ブロックを追加する必要があります。

"mcpServers": {
    "server_name_1": {},
    "server_name_2": {},
    "server_name_n": {}
 }

各サーバー構成は、次のプロパティをサポートしています（リファレンスドキュメント）。

必須（次のいずれか）

command（文字列）: Stdio トランスポートの実行可能ファイルへのパス
url（文字列）: SSE エンドポイント URL（例: "http://localhost:8080/sse")
httpUrl（文字列）: HTTP ストリーミングエンドポイント URL

省略可

args（文字列配列）: Stdio トランスポートのコマンドライン引数
headers（オブジェクト）: url または httpUrl を使用する場合のカスタム HTTP ヘッダー
env（オブジェクト）: サーバープロセスの環境変数。値は、$VAR_NAME または ${VAR_NAME} 構文を使用して環境変数を参照できます。
cwd（文字列）: Stdio トランスポートの作業ディレクトリ
timeout（数値）: リクエストのタイムアウト（ミリ秒単位）（デフォルト: 600,000 ミリ秒 = 10 分）
trust（ブール値）: true の場合、このサーバーのすべてのツール呼び出し確認をバイパスします（デフォルト: false）。
includeTools（文字列配列）: この MCP サーバーから含めるツール名のリスト。指定すると、このサーバーから利用できるのは、ここに記載されているツールのみになります（ホワイトリストの動作）。指定しない場合、サーバーのすべてのツールがデフォルトで有効になります。
excludeTools（文字列配列）: この MCP サーバーから除外するツール名のリスト。ここに記載されているツールは、サーバーで公開されていても、モデルでは使用できません。注: excludeTools は includeTools よりも優先されます。ツールが両方のリストに含まれている場合は、除外されます。

GitHub を使用している場合に必要になる可能性のある主要な MCP サーバーの 1 つを構成しましょう。ただし、Gemini CLI はシステムにある git ツールを呼び出すため、代わりにそれを使用するように Gemini CLI に指示することもできます。コマンドの実行をサポートしてくれますが、システムにこれらのツールが設定されている必要があります。

Github MCP サーバー

Github の公式 MCP サーバーには、公開するツールとその構成方法に関する十分なドキュメントが用意されています。Gemini CLI はリモート MCP サーバーもサポートしているため、ローカルで実行するかリモートで実行するかを選択できます。

このチュートリアルでは、Github のリモート MCP サーバーオプションを使用することにしました。そのためには、まず Github の個人用アクセストークン（PAT）が必要です。

MCP サーバーオブジェクトを settings.json ファイルに追加する必要があります。システム上の settings.json ファイル全体を以下に示します。追加の設定がある場合もありますが、mcpServers オブジェクトは次のようになります。

{
  "theme": "Default",
  "selectedAuthType": "oauth-personal",
  "mcpServers": {
       "github": {
            "httpUrl": "https://api.githubcopilot.com/mcp/",
            "headers": {
                "Authorization": "GITHUB_PAT"
            },
            "timeout": 5000
       }
  }
}

Github MCP サーバーの構成で settings.json を更新したら、Gemini CLI を再起動するか、/mcp refresh コマンドを実行します。次のスクリーンショットは、マシンに構成されている Github MCP サーバーと、Gemini CLI で MCP を操作するために使用できるさまざまなツールを示しています。

まず、GitHub MCP サーバーのツールの 1 つを呼び出すプロンプトから始めましょう。次のプロンプトを入力します。

Github MCP サーバーから適切なツールが選択されますが、他の組み込みツールと同様に、ツールを呼び出すための明示的な権限も必要になります。出力を確認してみましょう。

これで、GitHub プロジェクトのいずれかを使用できるようになりました。次のように自然言語でクエリを指定します。

<repo-name> について説明して
ローカルマシンに <repo-name> のクローンを作成します。
@<ファイル名> または @<ディレクトリ名>/ を説明します。
このリポジトリのコンポーネントにはどのようなものがありますか？
必要な変更を行いました。変更を Github に push し、Github MCP Server ツールを使用して変更できます。

この後のラボで、GitHub MCP サーバーの詳細な操作演習を行います。

Context7 MCP サーバー

Context7 は、LLM と AI コードエディタの最新のドキュメントを提供します。選択したフレームワークの最新のドキュメントを使用して LLM にコンテキストを提供したい場合は、Context7 MCP サーバーを構成することをおすすめします。

ライブラリが Context7 のホームページに表示されていることを確認します。

settings.json ファイルに追加する必要がある MCP サーバーは次のとおりです。

"context7": {
      "httpUrl": "https://mcp.context7.com/mcp"
    }

MCP サーバーが構成され、Gemini CLI が正常に読み込まれると、次のように Context7 ツールを表示できるようになります。

プロンプトで具体的な指示を出し、特定の XYZ フレームワークを使用してアプリケーションやコードスニペットを生成する際に、最新のドキュメントに Context7 を使用するよう Gemini CLI にリクエストできるようになりました。

Google の Agent Development Kit（ADK）を使用してエージェントを作成するプロンプトの例を次に示します。プロンプトで、Context7 MCP サーバー経由で同じドキュメントを検索するように指定しています。

I am working on coding an Agent using the Agent Development Kit (ADK) from Google. I would like to know how to create the LLMAgent in Python. Use Context7 for the latest documentation on ADK and specifically use /google/adk-python, /google/adk-docs and adk.wiki

受信した出力は次のとおりです。

Google スライド MCP サーバー

https://github.com/matteoantoci/google-slides-mcp の Github プロジェクトは、Google Slides API とのやり取りを行うための MCP サーバーを提供します。これにより、Google スライドのプレゼンテーションの作成、読み取り、変更をプログラムで行うことができます。

MCP サーバーを構成する手順は、プロジェクトに記載されています。サーバーを構築し、Google Cloud プロジェクトと OAuth 2.0 トークンを構成してから、settings.json ファイルで MCP サーバーを構成する Node.js 環境が必要です。

セットアップが完了したら、次のようなプロンプトを実行できます。

「web_url」から最新の情報を抽出し、要点にまとめて「my_presentation」という名前のプレゼンテーションを作成します。

ぜひお試しください。

その他の MCP サーバー

関心をお持ちいただける可能性のある MCP サーバーの追加リストは次のとおりです。

Firebase MCP サーバー
Google Gen AI Media Services（Imagen、Veo、Lyria）
MCP Toolbox for Databases（Firestore、BigQuery、Google Cloud データベースを操作）
Google Workspace MCP サーバー（ドキュメント、スプレッドシート、カレンダー、Gmail と連携）

上記の MCP サーバーの設定手順については、こちらのブログ投稿をご覧ください。

6. 試してみるユースケース

Gemini CLI は、デベロッパーとデベロッパー以外の両方に適用される幅広いユースケースに適用できます。ここではいくつかのシナリオを紹介します。興味のある分野に応じて、これらのシナリオを試すことができます。

いずれの場合も、プロンプトが提供されます。Gemini CLI の起動時に -p パラメータを使用して、Gemini CLI のインタラクティブモードまたは非インタラクティブモードでこの機能を試すことができます。

ファイル/フォルダの整理

Gemini CLI を使用して、必要に応じてさまざまなフォルダ内のタイプに応じてファイルを整理できます。パソコンのフォルダに移動し、.txt、.png、.jpg、.pdf、.mp4 などのファイルが複数あることを確認します。通常はデスクトップまたはダウンロードフォルダです。

そのフォルダに移動して、Gemini CLI を起動します。まず、画像、ドキュメント、動画などのフォルダをいくつか作成し、次にフォルダ内のファイルを整理するように指示します。

Gemini CLI は、コマンドを実行する前に権限を求めるプロンプトを表示することがよくあります。特に、ファイルシステムを変更するコマンド（ファイルの書き込み、移動、削除など）では、プロンプトが表示されます。権限を付与する前に、これらのプロンプトを必ずよく確認してください。これがセーフティネットです。

Create the following folders "Images","Documents","Videos"

次に、次のプロンプトを入力します。

Go through all the files in this folder and then organize them by moving all the files ending with .jpg, .jpeg, .gif into the "Images" folder. Move all ".txt" files into the "Documents" folder. Move all the ".mp4" files in the "Videos" folder.

その他の整理シナリオ（各シナリオの横にプロンプトが表示されます）:

要約: 「Documents」フォルダ内の各ドキュメントについて、ドキュメントの要点を 3 文で要約した「summary_ORIGINAL_FILENAME.txt」という名前の txt ファイルを同じフォルダに作成します。
タイプ別に分類: このディレクトリ内のすべての PDF ファイルと DOCX ファイルをスキャンします。名前またはコンテンツに「invoice」が含まれるすべてのファイルを「Financial/Invoices」フォルダに移動します。「receipt」を含むファイルを [Financial/Receipts] に移動します。その他の .docx ファイルは [Reports] に移動します。
キー情報の抽出（および「タグ付け」）: 「Financial/Invoices」フォルダ内の各 PDF ファイルについて、その内容を読み取ります。日付が見つかった場合は、ファイルの名前を変更して、その日付を YYYY-MM-DD 形式で含めます（例: ‘invoice_2025-07-26_original_name.pdf'.