Gemini Nano Banana を使用して一貫性のある画像を生成する

1. 概要

このラボでは、画像ライブラリ用のプロンプト ベースの生成パイプラインを構築する方法を学習します。

次の手順を行います。

  • 1️⃣ アーカイブ画像から始める
  • 2️⃣ キャラクターを抽出して新しい参照画像を作成する
  • 3️⃣ プロンプトと新しいアセットのみを使用して、一連のイラストを生成する

達成できることの概要は次のとおりです。

44dcd5631907d864.png

学習内容

  • 画像とプロンプトから一貫性のある新しい画像を生成する方法
  • キャラクター シートを作成する方法
  • 説明型または命令型のプロンプトの使用方法
  • Gemini の空間認識機能を活用する方法
  • アセット グラフの作成方法

必要なもの

  • ノートブック(Colab またはその他の Jupyter 環境)で Python を実行した経験がある
  • 課金が有効になっている Google Cloud プロジェクト(Vertex AI)または Gemini API キー(Google AI Studio)

ℹ️ このラボを Google Cloud で実行するための総費用は 1 USD 未満です。

95557c237d172e1f.png 8173aa8cca5ce8e2.png 3a82b6ec76ca4557.png 8173aa8cca5ce8e2.png 95dfef766eb02938.png

やってみましょう

2. 始める前に

Gemini API を使用するには、次の 2 つの主な方法があります。

  1. Google Cloud プロジェクトで Vertex AI を使用する
  2. Gemini API キーを使用して Google AI Studio 経由

🛠️ オプション 1 - Vertex AI 経由の Gemini API

要件:

  • Google Cloud プロジェクト
  • このプロジェクトで Vertex AI API を有効にする必要があります

🛠️ オプション 2 - Google AI Studio 経由の Gemini API

要件:

  • Gemini API キー

Google AI Studio から Gemini API キーを取得する方法をご覧ください。

3. ノートブックを実行する

ノートブックを開くツールを選択します。

🧰 ツール A - Colab でノートブックを開く

🧰 ツール B - Colab Enterprise または Vertex AI Workbench でノートブックを開く

💡 Colab Enterprise または Vertex AI Workbench インスタンスで構成された Google Cloud プロジェクトがすでに存在する場合は、この方法が適している可能性があります。

🧰 ツール C - GitHub からノートブックを取得して独自の環境で実行する

⚠️ GitHub からノートブックを取得(またはリポジトリのクローンを作成)し、独自の Jupyter 環境で実行する必要があります。

🗺️ ノートブックの目次

目次を開いてご利用いただくと、より簡単に移動できます。例:

61d63c0fb4aba335.png

🏁 ノートブックを実行する

準備が整いました。これで、ノートブックに沿って実行できるようになりました。楽しんでください。

4. 完了

b878bfbd803e7afe.png

以上で、この Codelab は完了です。

詳細