1. Übersicht
Einführung
Gemini 2.5 Pro ist das leistungsstärkste Modell von Google für Programmierung und Weltwissen.
Mit der 2.5-Serie sind die Gemini-Modelle jetzt hybride Logikmodelle. Gemini 2.5 Pro kann bei Aufgaben umfangreiche Denkprozesse durchlaufen und Tools verwenden, um die Richtigkeit der Antworten zu maximieren.
Gemini 2.5 Pro ist:
- Eine deutliche Verbesserung gegenüber früheren Modellen in Bezug auf Funktionen wie Programmierung, Schlussfolgern und Multimodalität.
- Branchenführend in Bezug auf Schlussfolgern mit erstklassiger Leistung bei Benchmarks für Mathematik und MINT-Fächer.
- Ein hervorragendes Modell für Code, mit besonders starken Webentwicklungsfunktionen.
- Besonders gut für komplexe Prompts, aber dennoch ausgewogen, einschließlich Platz 1 auf LMSys.
Lerninhalte
In diesem Tutorial erfahren Sie, wie Sie die Gemini API und das Google Gen AI SDK for Python mit dem Gemini 2.5 Pro-Modell verwenden.
Aufgaben in diesem Lab:
- Text aus Text-Prompts generieren
- Streaming-Text generieren
- Multi-Turn-Unterhaltungen starten
- Asynchrone Methoden verwenden
- Modellparameter konfigurieren
- Systemanweisungen festlegen
- Sicherheitsfilter verwenden
- Kontrollierte Ausgabe verwenden
- Tokens zählen
- Multimodale Daten (Audio, Code, Dokumente, Bilder, Videos) verarbeiten
- Automatische und manuelle Funktionsaufrufe verwenden
- Codeausführung
- Beispiele für den Thinking-Modus
2. Hinweis
Vorbereitung
Bevor Sie beginnen können, benötigen Sie ein Google Cloud-Projekt mit einem gültigen Rechnungskonto. Wählen Sie das Google Cloud-Projekt aus, das Sie verwenden möchten.
Für dieses Codelab verwenden wir Colab Enterprise, eine kollaborative, verwaltete Notebook-Umgebung mit den Sicherheits- und Compliance-Funktionen von Google Cloud.
Erforderliche APIs aktivieren
Klicken Sie auf die Schaltfläche unten, um die erforderlichen APIs für dieses Codelab in Ihrem Google Cloud-Projekt zu aktivieren: Vertex AI, Dataform und Compute Engine.
Colab-Notebook in Google Cloud kopieren
Klicken Sie auf die Schaltfläche unten, um das Tutorial-Notebook in Colab Enterprise zu öffnen. Dadurch wird eine Kopie des Colab-Notebooks in Ihrem aktuellen Google Cloud-Projekt erstellt, mit der Sie das Notebook ausführen können.
Los gehts!
3. Umgebung initialisieren
Nachdem Sie das Colab-Notebook erstellt haben, können Sie den darin enthaltenen Code ausführen. In den ersten Schritten werden die Abhängigkeiten installiert und die erforderlichen Bibliotheken importiert.
Schritte unter „Erste Schritte“ ausführen
Führen Sie zuerst die Zellen im Abschnitt „Erste Schritte“ nacheinander aus.

Hinweis: Sie können eine Zelle ausführen, indem Sie den Mauszeiger über die Codezelle halten, die Sie ausführen möchten, und dann auf das Symbol
„Zelle ausführen“ klicken.

Am Ende dieses Abschnitts haben Sie Folgendes getan:
- Google Gen AI SDK for Python installieren
- Die erforderlichen Bibliotheken für das Lab importieren
- Ein Google Cloud-Projekt für die Verwendung von Vertex AI einrichten
Jetzt generieren wir Text mit Gemini 2.5 Pro
4. Text mit Gemini generieren
In diesem Abschnitt des Notebooks verwenden Sie Gemini 2.5 Pro, um Textvervollständigungen zu generieren.
Führen Sie die nächsten Zellen im Notebook aus und nehmen Sie sich die Zeit, den Code zu lesen und zu verstehen, wie Sie das Google GenAI SDK verwenden.

Am Ende dieses Abschnitts haben Sie Folgendes gelernt:
- Wie Sie das zu verwendende Modell angeben.
- Ausgabegenerierung ohne Streaming im Vergleich zu Streaming.
- Verwendung der Multi-Turn-Chatfunktion des SDK.
- Asynchrones Aufrufen des SDK.
- Modellparameter konfigurieren.
- Systemanweisungen festlegen, um das Modellverhalten anzupassen.
- Inhaltssicherheitsfilter konfigurieren.
Als Nächstes sehen wir uns an, wie Sie multimodale Prompts an Gemini senden
5. Multimodale Prompts
In diesem Abschnitt des Notebooks verwenden Sie Gemini 2.5 Pro, um Bilder und Videos zu verarbeiten.
Führen Sie die folgenden Zellen im Notebook aus. 
Am Ende dieses Abschnitts haben Sie Folgendes gelernt:
- Einen Prompt senden, der aus einem Bild und Text besteht.
- Ein Video aus einer URL verarbeiten
Als Nächstes generieren wir klar definierte und strukturierte Ausgaben
6. Strukturierte Ausgaben
Wenn Sie die Antwort von Modellen in Code verwenden, ist es wichtig, dass Sie konsistente und zuverlässige Ausgaben vom Modell erhalten. Bei der kontrollierten Ausgabe können Sie ein Antwortschema definieren, um die Struktur der Modellausgabe, die Feldnamen und den erwarteten Datentyp für jedes Feld festzulegen.
Führen Sie die folgenden Zellen im Notebook aus. 
Als Nächstes sehen wir uns an, wie Sie die Ausgaben der Modelle fundieren
7. Fundierung
Wenn Sie vorhandene Wissensdatenbanken verwenden oder dem Modell Echtzeitinformationen zur Verfügung stellen möchten, sollten Sie die Ausgaben des Modells fundieren.
Mit Gemini und Vertex AI können Sie die Ausgabe in der Google Suche, in der Ausgabe von Funktionsantworten und schließlich im Code selbst fundieren. Mit der Codeausführung kann das Modell Code generieren und ausführen, dadurch aus den Ergebnissen lernen und iterieren, um die endgültige Ausgabe zu erhalten.
Führen Sie die folgenden Zellen im Notebook aus. 
Als Nächstes sehen wir uns die Denkfähigkeiten von Gemini 2.5 Pro an
8. Thinking
Der Thinking-Modus ist besonders nützlich für komplexe Aufgaben, die mehrere Runden der Strategieentwicklung und iterativer Lösungsfindung erfordern. Gemini 2.5-Modelle gehören zur Familie der Thinking Models (Denkmodelle). Sie besitzen die Fähigkeit, mithilfe interner Denkprozesse zu schlussfolgern, bevor sie Antworten geben. Das steigert sowohl ihre Leistung als auch ihre Genauigkeit.
Führen Sie die folgenden Zellen im Notebook aus. Beachten Sie dabei die Thinking-Ausgabe, bevor das Modell seine tatsächliche Ausgabe präsentiert. 
9. Fazit
Das wars! Sie haben gelernt, wie Sie die Leistungsfähigkeit von Gemini 2.5 Pro mit dem Google Gen AI SDK for Python nutzen können, einschließlich Textgenerierung, Multimodalität, Fundierung, strukturierte Ausgaben und erweiterte Denkfähigkeiten. Sie haben jetzt das grundlegende Wissen, um eigene innovative Anwendungen mit dem SDK zu entwickeln. Gemini 2.5 Pro mit seinem leistungsstarken Thinking- und Reasoning-Modus eröffnet neue Möglichkeiten und eignet sich für Innovationen in verschiedenen Anwendungsfällen.
Weitere Referenzen
- Siehe die Referenzdokumentation zum Google Gen AI SDK.
- Weitere Notebooks im GitHub-Repository für generative KI von Google Cloud
- KI-Modelle in Model Garden entdecken.