Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Visuelle Objekte mit Gemini und Nano Banana erkennen und bearbeiten

1. Übersicht

In diesem Lab werden die folgenden Aufgaben behandelt:

1️⃣ Visuelle Objekte in Bildern mit Gemini erkennen
2️⃣ Visuelle Objekte mit Nano Banana extrahieren und wiederherstellen
3️⃣ Wiederhergestellte Objekte mit Nano Banana bearbeiten und transformieren

Hier einige Beispiele für das, was Sie erreichen können:

Lerninhalte

Objekterkennung mit offenem Vokabular mithilfe des räumlichen Verständnisses von Gemini
Begrenzungsrahmen, Bildunterschriften und dynamische Labels mit Prompts in natürlicher Sprache extrahieren
Anleitung zum Wiederherstellen, Bereinigen und Begradigen verzerrter oder alter visueller Objekte
Imperative und beschreibende Prompts für die Bildbearbeitung schreiben
Bilder kreativ kolorieren und in völlig neue Stile transformieren
Bilder in fotorealistische Filmstills aus Live-Action-Filmen verwandeln

Voraussetzungen

Erfahrung mit dem Ausführen von Python in einem Notebook (in Colab oder einer anderen Jupyter-Umgebung)
Ein Google Cloud-Projekt oder ein Gemini API-Schlüssel mit aktivierter Abrechnung

ℹ️ Die Gesamtkosten für die Ausführung des Labs von Anfang bis Ende betragen weniger als 2 US-Dollar (45 generierte 1K-Bilder mit jeweils 1.290 Tokens).

Los gehts…

2. Hinweis

Für die Verwendung der Gemini API haben Sie zwei Hauptoptionen:

Über die Agent Platform (früher Vertex AI) mit einem Google Cloud-Projekt
Über Google AI Studio mit einem Gemini API-Schlüssel

🛠️ Option 1: Gemini API über die Agent Platform

Anforderungen:

Ein Google Cloud-Projekt
Die Agent Platform API muss für dieses Projekt aktiviert sein.

🛠️ Option 2: Gemini API über Google AI Studio

Voraussetzung:

Ein Gemini API-Schlüssel

Weitere Informationen zum Abrufen eines Gemini API-Schlüssels von Google AI Studio.

3. Notebook ausführen

Wählen Sie das gewünschte Tool aus, um das Notebook zu öffnen:

🧰 Tool A: Notebook in Colab öffnen

🧰 Tool B: Notebook in Colab Enterprise oder Workbench öffnen

💡 Diese Option ist möglicherweise besser geeignet, wenn Sie bereits ein Google Cloud-Projekt mit einer Colab Enterprise- oder Workbench-Instanz konfiguriert haben.

🧰 Tool C: Notebook von GitHub abrufen und in Ihrer eigenen Umgebung ausführen

⚠️ Sie müssen das Notebook von GitHub abrufen (oder das Repository klonen) und in Ihrer eigenen Jupyter-Umgebung ausführen.

🗺️ Inhaltsverzeichnis des Notebooks

Erweitern Sie das Inhaltsverzeichnis, um einfacher zu navigieren. Beispiel:

🏁 Notebook ausführen

Sie sind bereit. Sie können jetzt das Notebook ausführen. Viel Spaß!

4. Glückwunsch!

Herzlichen Glückwunsch zum Abschluss des Codelabs!

Weitere Informationen

Führen Sie das Codelab Konsistente Bilder mit Gemini Nano Banana generieren durch.
Weitere praktische Beispiele finden Sie im Notebook Nano Banana-Rezepte.
Weitere Anwendungsfälle finden Sie in der Prompt-Galerie der Agent Platform.
Bleiben Sie mit den Versionshinweisen zur Agent Platform auf dem Laufenden.