1. 總覽
簡介
Gemini 2.5 Pro 是 Google 最強大的模型,擅長編寫程式碼和處理世界知識。
2.5 系列的 Gemini 模型現在是混合式推論模型!在處理各類工作時,Gemini 2.5 Pro 能延伸思考並運用多種工具,盡可能提升回覆準確度。
Gemini 2.5 Pro 的特色如下:
- 在程式設計、推論和多模態等功能方面,都比先前的模型有顯著進步。
- 在數學和 STEM 基準測試中,以最先進的效能領先業界。
- 程式碼模型,網頁開發更是強項。
- 特別擅長處理複雜的提示,同時兼顧全面性,在 LMSys 排名第一。
課程內容
在本教學課程中,您將瞭解如何搭配 Gemini 2.5 Pro 模型,使用 Gemini API 和 Google Gen AI SDK for Python。
您將完成下列工作:
- 使用文字提示詞來生成文字
- 生成串流文字
- 展開多輪對話
- 使用非同步方法
- 設定模型參數
- 設定系統指令
- 使用安全篩選器
- 使用控制生成內容功能
- 計算詞元數
- 處理音訊、程式碼、文件、圖像、影片等多模態資料。
- 使用自動和手動函式呼叫功能
- 程式碼執行
- 思考模式範例
2. 事前準備
必要條件
如要開始使用,您必須擁有 Google Cloud 雲端專案和有效的帳單帳戶。請選取要使用的 Google Cloud 專案。
為執行本程式碼實驗室,我們將使用 Colab Enterprise。這項服務是協作式的代管筆記本環境,具備 Google Cloud 的安全防護和法規遵循功能。
啟用必用的 API。
點選下方按鈕,在 Google Cloud 雲端專案中啟用本程式碼研究室所需的 API:Vertex AI、Dataform 和 Compute Engine。
將 Colab 筆記本複製到 Google Cloud
按一下下方按鈕,在 Colab Enterprise 中開啟教學課程筆記本。這項操作會在目前的 Google Cloud 雲端專案中建立 Colab 筆記本副本,方便您執行筆記本。
讓我們開始吧!
3. 初始化環境
現在我們已建立 Colab 筆記本,可以執行筆記本中提供的程式碼。前幾個步驟會安裝依附元件,並匯入必要的程式庫。
執行「開始使用」中的步驟
首先,請依序執行「Getting Started」區段中的儲存格。

注意:如要執行儲存格,請將滑鼠游標懸停在要執行的程式碼儲存格上,然後按一下「執行儲存格」圖示
。

完成本節後,您將完成下列操作。
- 安裝 Google Gen AI SDK for Python
- 匯入實驗室所需的程式庫
- 設定 Google Cloud 專案以使用 Vertex AI
現在使用 Gemini 2.5 Pro 生成文字
4. 使用 Gemini 生成文字
在本節的筆記本中,您將使用 Gemini 2.5 Pro 生成文字完成內容。
請繼續執行筆記本中的下一組儲存格,花點時間閱讀程式碼,瞭解如何使用 Google 生成式 AI SDK。

本節結束時,您將學會下列內容。
- 如何指定要使用的模型。
- 非串流與串流輸出內容生成。
- 使用 SDK 的多輪對話功能。
- 非同步呼叫 SDK。
- 設定模型參數。
- 設定系統指令,自訂模型行為。
- 設定內容安全篩選器。
接下來,我們將瞭解如何傳送多模態提示給 Gemini
5. 多模態提示
在本筆記本的這一節中,您將使用 Gemini 2.5 Pro 處理圖片和影片。
請繼續執行筆記本中的下列儲存格。
本節結束時,您將學會下列內容。
- 傳送包含圖片和文字的提示。
- 處理網址中的影片
接下來,我們會產生明確定義的結構化輸出內容
6. 結構化輸出內容
在程式碼中使用模型的回覆時,請務必確保模型輸出內容一致且可靠。您可使用控制生成內容功能定義回覆結構定義,指定模型輸出的結構、欄位名稱,以及每個欄位的預期資料類型。
請繼續執行筆記本中的下列儲存格。
接下來,我們將瞭解如何根據模型輸出內容
7. 建立基準
如要使用現有知識庫或提供即時資訊給模型,請考慮為模型輸出內容建立基準。
透過 Gemini 和 Vertex AI,您可以在 Google 搜尋、函式回覆輸出內容,以及程式碼本身建立輸出內容基準。模型可透過程式碼執行功能生成及運作執行程式碼,並從結果中反覆學習,直到生成最終內容。
請繼續執行筆記本中的下列儲存格。
接下來,我們將瞭解 Gemini 2.5 Pro 的思考能力
8. 思考型
對於需要多輪規劃和反覆求解的複雜工作,特別適合使用思考模式。Gemini 2.5 模型是思考型模型,能夠在回答之前,先整理好自己的想法,進行推論,在效能和準確率方面都更勝以往。
請繼續執行筆記本中的下列儲存格。這麼做時,請注意模型呈現實際輸出內容前的推論輸出內容。
9. 結語
恭喜!您已瞭解如何透過 Google Gen AI SDK for Python,運用 Gemini 2.5 Pro 的強大功能,包括文字生成、多模態、建立基準、結構化輸出內容和進階思考能力。您現在已具備基礎知識,可以開始使用 SDK 建構自己的創新應用程式。Gemini 2.5 Pro 具備強大的思考和推論模式,可為各種用途帶來創新可能。
其他參考資料
- 請參閱 Google Gen AI SDK 參考文件。
- 前往 Google Cloud 生成式 AI GitHub 存放區,查看其他筆記本。
- 探索 Model Garden 中的 AI 模型。