Einführung in Gemini 2.5 Pro in Google Cloud

1. Übersicht

Einführung

Gemini 2.5 Pro ist das leistungsstärkste Modell von Google für Programmierung und Weltwissen.

Mit der 2.5-Serie sind die Gemini-Modelle jetzt hybride Logikmodelle. Gemini 2.5 Pro kann bei Aufgaben umfangreiche Denkprozesse durchlaufen und Tools verwenden, um die Richtigkeit der Antworten zu maximieren.

Gemini 2.5 Pro ist:

  • Eine deutliche Verbesserung gegenüber früheren Modellen in Bezug auf Funktionen wie Programmierung, Schlussfolgern und Multimodalität.
  • Branchenführend in Bezug auf Schlussfolgern mit erstklassiger Leistung bei Benchmarks für Mathematik und MINT-Fächer.
  • Ein hervorragendes Modell für Code, mit besonders starken Webentwicklungsfunktionen.
  • Besonders gut für komplexe Prompts, aber dennoch ausgewogen, einschließlich Platz 1 auf LMSys.

Lerninhalte

In diesem Tutorial erfahren Sie, wie Sie die Gemini API und das Google Gen AI SDK for Python mit dem Gemini 2.5 Pro-Modell verwenden.

Aufgaben in diesem Lab:

  • Text aus Text-Prompts generieren
    • Streaming-Text generieren
    • Multi-Turn-Unterhaltungen starten
    • Asynchrone Methoden verwenden
  • Modellparameter konfigurieren
  • Systemanweisungen festlegen
  • Sicherheitsfilter verwenden
  • Kontrollierte Ausgabe verwenden
  • Tokens zählen
  • Multimodale Daten (Audio, Code, Dokumente, Bilder, Videos) verarbeiten
  • Automatische und manuelle Funktionsaufrufe verwenden
  • Codeausführung
  • Beispiele für den Thinking-Modus

2. Hinweis

Vorbereitung

Bevor Sie beginnen können, benötigen Sie ein Google Cloud-Projekt mit einem gültigen Rechnungskonto. Wählen Sie das Google Cloud-Projekt aus, das Sie verwenden möchten.

Für dieses Codelab verwenden wir Colab Enterprise, eine kollaborative, verwaltete Notebook-Umgebung mit den Sicherheits- und Compliance-Funktionen von Google Cloud.

Erforderliche APIs aktivieren

Klicken Sie auf die Schaltfläche unten, um die erforderlichen APIs für dieses Codelab in Ihrem Google Cloud-Projekt zu aktivieren: Vertex AI, Dataform und Compute Engine.

Colab-Notebook in Google Cloud kopieren

Klicken Sie auf die Schaltfläche unten, um das Tutorial-Notebook in Colab Enterprise zu öffnen. Dadurch wird eine Kopie des Colab-Notebooks in Ihrem aktuellen Google Cloud-Projekt erstellt, mit der Sie das Notebook ausführen können.

Los gehts!

3. Umgebung initialisieren

Nachdem Sie das Colab-Notebook erstellt haben, können Sie den darin enthaltenen Code ausführen. In den ersten Schritten werden die Abhängigkeiten installiert und die erforderlichen Bibliotheken importiert.

Schritte unter „Erste Schritte“ ausführen

Führen Sie zuerst die Zellen im Abschnitt „Erste Schritte“ nacheinander aus.

Codezellen im Abschnitt „Erste Schritte“

Hinweis: Sie können eine Zelle ausführen, indem Sie den Mauszeiger über die Codezelle halten, die Sie ausführen möchten, und dann auf das Symbol Symbol „Zelle ausführen“ „Zelle ausführen“ klicken.

Zelle ausführen

Am Ende dieses Abschnitts haben Sie Folgendes getan:

  • Google Gen AI SDK for Python installieren
  • Die erforderlichen Bibliotheken für das Lab importieren
  • Ein Google Cloud-Projekt für die Verwendung von Vertex AI einrichten

Jetzt generieren wir Text mit Gemini 2.5 Pro

4. Text mit Gemini generieren

In diesem Abschnitt des Notebooks verwenden Sie Gemini 2.5 Pro, um Textvervollständigungen zu generieren.

Führen Sie die nächsten Zellen im Notebook aus und nehmen Sie sich die Zeit, den Code zu lesen und zu verstehen, wie Sie das Google GenAI SDK verwenden.

Text aus Text-Prompts generieren

Am Ende dieses Abschnitts haben Sie Folgendes gelernt:

  • Wie Sie das zu verwendende Modell angeben.
  • Ausgabegenerierung ohne Streaming im Vergleich zu Streaming.
  • Verwendung der Multi-Turn-Chatfunktion des SDK.
  • Asynchrones Aufrufen des SDK.
  • Modellparameter konfigurieren.
  • Systemanweisungen festlegen, um das Modellverhalten anzupassen.
  • Inhaltssicherheitsfilter konfigurieren.

Als Nächstes sehen wir uns an, wie Sie multimodale Prompts an Gemini senden

5. Multimodale Prompts

In diesem Abschnitt des Notebooks verwenden Sie Gemini 2.5 Pro, um Bilder und Videos zu verarbeiten.

Führen Sie die folgenden Zellen im Notebook aus. Codezellen für multimodale Prompts

Am Ende dieses Abschnitts haben Sie Folgendes gelernt:

  • Einen Prompt senden, der aus einem Bild und Text besteht.
  • Ein Video aus einer URL verarbeiten

Als Nächstes generieren wir klar definierte und strukturierte Ausgaben

6. Strukturierte Ausgaben

Wenn Sie die Antwort von Modellen in Code verwenden, ist es wichtig, dass Sie konsistente und zuverlässige Ausgaben vom Modell erhalten. Bei der kontrollierten Ausgabe können Sie ein Antwortschema definieren, um die Struktur der Modellausgabe, die Feldnamen und den erwarteten Datentyp für jedes Feld festzulegen.

Führen Sie die folgenden Zellen im Notebook aus. Codezellen für kontrollierte Ausgabe

Als Nächstes sehen wir uns an, wie Sie die Ausgaben der Modelle fundieren

7. Fundierung

Wenn Sie vorhandene Wissensdatenbanken verwenden oder dem Modell Echtzeitinformationen zur Verfügung stellen möchten, sollten Sie die Ausgaben des Modells fundieren.

Mit Gemini und Vertex AI können Sie die Ausgabe in der Google Suche, in der Ausgabe von Funktionsantworten und schließlich im Code selbst fundieren. Mit der Codeausführung kann das Modell Code generieren und ausführen, dadurch aus den Ergebnissen lernen und iterieren, um die endgültige Ausgabe zu erhalten.

Führen Sie die folgenden Zellen im Notebook aus. Codezellen zum Testen von Grounding

Als Nächstes sehen wir uns die Denkfähigkeiten von Gemini 2.5 Pro an

8. Thinking

Der Thinking-Modus ist besonders nützlich für komplexe Aufgaben, die mehrere Runden der Strategieentwicklung und iterativer Lösungsfindung erfordern. Gemini 2.5-Modelle gehören zur Familie der Thinking Models (Denkmodelle). Sie besitzen die Fähigkeit, mithilfe interner Denkprozesse zu schlussfolgern, bevor sie Antworten geben. Das steigert sowohl ihre Leistung als auch ihre Genauigkeit.

Führen Sie die folgenden Zellen im Notebook aus. Beachten Sie dabei die Thinking-Ausgabe, bevor das Modell seine tatsächliche Ausgabe präsentiert. Codezellen zum Anzeigen der Ausgabe von „Thinking“

9. Fazit

Das wars! Sie haben gelernt, wie Sie die Leistungsfähigkeit von Gemini 2.5 Pro mit dem Google Gen AI SDK for Python nutzen können, einschließlich Textgenerierung, Multimodalität, Fundierung, strukturierte Ausgaben und erweiterte Denkfähigkeiten. Sie haben jetzt das grundlegende Wissen, um eigene innovative Anwendungen mit dem SDK zu entwickeln. Gemini 2.5 Pro mit seinem leistungsstarken Thinking- und Reasoning-Modus eröffnet neue Möglichkeiten und eignet sich für Innovationen in verschiedenen Anwendungsfällen.

Weitere Referenzen

Wie hat Ihnen dieses Codelab gefallen?

Sehr gut Durchschnittlich Könnte besser sein