Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

簡介：在 Google Cloud 上使用 Gemini 2.5 Pro

1. 總覽

簡介

Gemini 2.5 Pro 是 Google 最強大的模型，擅長編寫程式碼和處理世界知識。

2.5 系列的 Gemini 模型現在是混合式推論模型！在處理各類工作時，Gemini 2.5 Pro 能延伸思考並運用多種工具，盡可能提升回覆準確度。

Gemini 2.5 Pro 的特色如下：

在程式設計、推論和多模態等功能方面，都比先前的模型有顯著進步。
在數學和 STEM 基準測試中，以最先進的效能領先業界。
程式碼模型，網頁開發更是強項。
特別擅長處理複雜的提示，同時兼顧全面性，在 LMSys 排名第一。

課程內容

在本教學課程中，您將瞭解如何搭配 Gemini 2.5 Pro 模型，使用 Gemini API 和 Google Gen AI SDK for Python。

您將完成下列工作：

使用文字提示詞來生成文字
- 生成串流文字
- 展開多輪對話
- 使用非同步方法
設定模型參數
設定系統指令
使用安全篩選器
使用控制生成內容功能
計算詞元數
處理音訊、程式碼、文件、圖像、影片等多模態資料。
使用自動和手動函式呼叫功能
程式碼執行
思考模式範例

2. 事前準備

必要條件

如要開始使用，您必須擁有 Google Cloud 雲端專案和有效的帳單帳戶。請選取要使用的 Google Cloud 專案。

為執行本程式碼實驗室，我們將使用 Colab Enterprise。這項服務是協作式的代管筆記本環境，具備 Google Cloud 的安全防護和法規遵循功能。

啟用必用的 API。

點選下方按鈕，在 Google Cloud 雲端專案中啟用本程式碼研究室所需的 API：Vertex AI、Dataform 和 Compute Engine。

將 Colab 筆記本複製到 Google Cloud

按一下下方按鈕，在 Colab Enterprise 中開啟教學課程筆記本。這項操作會在目前的 Google Cloud 雲端專案中建立 Colab 筆記本副本，方便您執行筆記本。

讓我們開始吧！

3. 初始化環境

現在我們已建立 Colab 筆記本，可以執行筆記本中提供的程式碼。前幾個步驟會安裝依附元件，並匯入必要的程式庫。

執行「開始使用」中的步驟

首先，請依序執行「Getting Started」區段中的儲存格。

「開始使用」部分中的程式碼儲存格

注意：如要執行儲存格，請將滑鼠游標懸停在要執行的程式碼儲存格上，然後按一下「執行儲存格」圖示。

執行儲存格

完成本節後，您將完成下列操作。

安裝 Google Gen AI SDK for Python
匯入實驗室所需的程式庫
設定 Google Cloud 專案以使用 Vertex AI

現在使用 Gemini 2.5 Pro 生成文字

4. 使用 Gemini 生成文字

在本節的筆記本中，您將使用 Gemini 2.5 Pro 生成文字完成內容。

請繼續執行筆記本中的下一組儲存格，花點時間閱讀程式碼，瞭解如何使用 Google 生成式 AI SDK。

使用文字提示來生成文字

本節結束時，您將學會下列內容。

如何指定要使用的模型。
非串流與串流輸出內容生成。
使用 SDK 的多輪對話功能。
非同步呼叫 SDK。
設定模型參數。
設定系統指令，自訂模型行為。
設定內容安全篩選器。

接下來，我們將瞭解如何傳送多模態提示給 Gemini

5. 多模態提示

在本筆記本的這一節中，您將使用 Gemini 2.5 Pro 處理圖片和影片。

請繼續執行筆記本中的下列儲存格。多模態提示的程式碼儲存格

本節結束時，您將學會下列內容。

傳送包含圖片和文字的提示。
處理網址中的影片

接下來，我們會產生明確定義的結構化輸出內容

6. 結構化輸出內容

在程式碼中使用模型的回覆時，請務必確保模型輸出內容一致且可靠。您可使用控制生成內容功能定義回覆結構定義，指定模型輸出的結構、欄位名稱，以及每個欄位的預期資料類型。

請繼續執行筆記本中的下列儲存格。用於控制輸出內容的程式碼儲存格

接下來，我們將瞭解如何根據模型輸出內容

7. 建立基準

如要使用現有知識庫或提供即時資訊給模型，請考慮為模型輸出內容建立基準。

透過 Gemini 和 Vertex AI，您可以在 Google 搜尋、函式回覆輸出內容，以及程式碼本身建立輸出內容基準。模型可透過程式碼執行功能生成及運作執行程式碼，並從結果中反覆學習，直到生成最終內容。

請繼續執行筆記本中的下列儲存格。測試 Grounding 的程式碼儲存格

接下來，我們將瞭解 Gemini 2.5 Pro 的思考能力

8. 思考型

對於需要多輪規劃和反覆求解的複雜工作，特別適合使用思考模式。Gemini 2.5 模型是思考型模型，能夠在回答之前，先整理好自己的想法，進行推論，在效能和準確率方面都更勝以往。

請繼續執行筆記本中的下列儲存格。這麼做時，請注意模型呈現實際輸出內容前的推論輸出內容。顯示「思考」輸出內容的程式碼儲存格

9. 結語

恭喜！您已瞭解如何透過 Google Gen AI SDK for Python，運用 Gemini 2.5 Pro 的強大功能，包括文字生成、多模態、建立基準、結構化輸出內容和進階思考能力。您現在已具備基礎知識，可以開始使用 SDK 建構自己的創新應用程式。Gemini 2.5 Pro 具備強大的思考和推論模式，可為各種用途帶來創新可能。

其他參考資料

請參閱 Google Gen AI SDK 參考文件。
前往 Google Cloud 生成式 AI GitHub 存放區，查看其他筆記本。
探索 Model Garden 中的 AI 模型。

您覺得這個程式碼研究室如何？

表現優異

表現普通

表現不佳