簡介:在 Google Cloud 上使用 Gemini 2.5 Pro

1. 總覽

簡介

Gemini 2.5 Pro 是 Google 最強大的模型,擅長編寫程式碼和處理世界知識。

2.5 系列的 Gemini 模型現在是混合式推論模型!在處理各類工作時,Gemini 2.5 Pro 能延伸思考並運用多種工具,盡可能提升回覆準確度。

Gemini 2.5 Pro 的特色如下:

  • 在程式設計、推論和多模態等功能方面,都比先前的模型有顯著進步。
  • 在數學和 STEM 基準測試中,以最先進的效能領先業界。
  • 程式碼模型,網頁開發更是強項。
  • 特別擅長處理複雜的提示,同時兼顧全面性,在 LMSys 排名第一。

課程內容

在本教學課程中,您將瞭解如何搭配 Gemini 2.5 Pro 模型,使用 Gemini API 和 Google Gen AI SDK for Python。

您將完成下列工作:

  • 使用文字提示詞來生成文字
    • 生成串流文字
    • 展開多輪對話
    • 使用非同步方法
  • 設定模型參數
  • 設定系統指令
  • 使用安全篩選器
  • 使用控制生成內容功能
  • 計算詞元數
  • 處理音訊、程式碼、文件、圖像、影片等多模態資料。
  • 使用自動和手動函式呼叫功能
  • 程式碼執行
  • 思考模式範例

2. 事前準備

必要條件

如要開始使用,您必須擁有 Google Cloud 雲端專案和有效的帳單帳戶。請選取要使用的 Google Cloud 專案。

為執行本程式碼實驗室,我們將使用 Colab Enterprise。這項服務是協作式的代管筆記本環境,具備 Google Cloud 的安全防護和法規遵循功能。

啟用必用的 API。

點選下方按鈕,在 Google Cloud 雲端專案中啟用本程式碼研究室所需的 API:Vertex AI、Dataform 和 Compute Engine。

將 Colab 筆記本複製到 Google Cloud

按一下下方按鈕,在 Colab Enterprise 中開啟教學課程筆記本。這項操作會在目前的 Google Cloud 雲端專案中建立 Colab 筆記本副本,方便您執行筆記本。

讓我們開始吧!

3. 初始化環境

現在我們已建立 Colab 筆記本,可以執行筆記本中提供的程式碼。前幾個步驟會安裝依附元件,並匯入必要的程式庫。

執行「開始使用」中的步驟

首先,請依序執行「Getting Started」區段中的儲存格。

「開始使用」部分中的程式碼儲存格

注意:如要執行儲存格,請將滑鼠游標懸停在要執行的程式碼儲存格上,然後按一下「執行儲存格」圖示 執行儲存格圖示

執行儲存格

完成本節後,您將完成下列操作。

  • 安裝 Google Gen AI SDK for Python
  • 匯入實驗室所需的程式庫
  • 設定 Google Cloud 專案以使用 Vertex AI

現在使用 Gemini 2.5 Pro 生成文字

4. 使用 Gemini 生成文字

在本節的筆記本中,您將使用 Gemini 2.5 Pro 生成文字完成內容。

請繼續執行筆記本中的下一組儲存格,花點時間閱讀程式碼,瞭解如何使用 Google 生成式 AI SDK。

使用文字提示來生成文字

本節結束時,您將學會下列內容。

  • 如何指定要使用的模型。
  • 非串流與串流輸出內容生成。
  • 使用 SDK 的多輪對話功能。
  • 非同步呼叫 SDK。
  • 設定模型參數。
  • 設定系統指令,自訂模型行為。
  • 設定內容安全篩選器。

接下來,我們將瞭解如何傳送多模態提示給 Gemini

5. 多模態提示

在本筆記本的這一節中,您將使用 Gemini 2.5 Pro 處理圖片和影片。

請繼續執行筆記本中的下列儲存格。多模態提示的程式碼儲存格

本節結束時,您將學會下列內容。

  • 傳送包含圖片和文字的提示。
  • 處理網址中的影片

接下來,我們會產生明確定義的結構化輸出內容

6. 結構化輸出內容

在程式碼中使用模型的回覆時,請務必確保模型輸出內容一致且可靠。您可使用控制生成內容功能定義回覆結構定義,指定模型輸出的結構、欄位名稱,以及每個欄位的預期資料類型。

請繼續執行筆記本中的下列儲存格。用於控制輸出內容的程式碼儲存格

接下來,我們將瞭解如何根據模型輸出內容

7. 建立基準

如要使用現有知識庫或提供即時資訊給模型,請考慮為模型輸出內容建立基準。

透過 Gemini 和 Vertex AI,您可以在 Google 搜尋、函式回覆輸出內容,以及程式碼本身建立輸出內容基準。模型可透過程式碼執行功能生成及運作執行程式碼,並從結果中反覆學習,直到生成最終內容。

請繼續執行筆記本中的下列儲存格。測試 Grounding 的程式碼儲存格

接下來,我們將瞭解 Gemini 2.5 Pro 的思考能力

8. 思考型

對於需要多輪規劃和反覆求解的複雜工作,特別適合使用思考模式。Gemini 2.5 模型是思考型模型,能夠在回答之前,先整理好自己的想法,進行推論,在效能和準確率方面都更勝以往。

請繼續執行筆記本中的下列儲存格。這麼做時,請注意模型呈現實際輸出內容前的推論輸出內容。顯示「思考」輸出內容的程式碼儲存格

9. 結語

恭喜!您已瞭解如何透過 Google Gen AI SDK for Python,運用 Gemini 2.5 Pro 的強大功能,包括文字生成、多模態、建立基準、結構化輸出內容和進階思考能力。您現在已具備基礎知識,可以開始使用 SDK 建構自己的創新應用程式。Gemini 2.5 Pro 具備強大的思考和推論模式,可為各種用途帶來創新可能。

其他參考資料

您覺得這個程式碼研究室如何?

表現優異 表現普通 表現不佳