簡介:在 Google Cloud 上使用 Gemini 2.5 Pro

簡介:在 Google Cloud 上使用 Gemini 2.5 Pro

程式碼研究室簡介

subject上次更新時間:4月 23, 2025
account_circle作者:Prashanth Subrahmanyam

1. 總覽

簡介

Gemini 2.5 Pro 是 Google 最強大的編碼和世界知識模型。

自 2.5 系列起,Gemini 模型已成為混合推論模型!Gemini 2.5 Pro 可在各項任務中進行更深入的思考,並使用工具盡可能提高回覆準確度。

Gemini 2.5 Pro 的特色如下:

  • 在程式設計、推理和多模態等功能方面,大幅超越先前模型。
  • 在數學與 STEM 基準測試中,具備業界領先的推理能力和頂尖效能。
  • 程式碼的絕佳模型,網頁開發更是強項。
  • 特別適合複雜的提示,同時兼顧全面性,包括 LMSys 的 #1。

課程內容

在本教學課程中,您將瞭解如何搭配使用 Gemini API 和 Google Gen AI SDK for Python 與 Gemini 2.5 Pro 模型。

您將完成下列工作:

  • 使用文字提示來生成文字
    • 生成逐句顯示文字
    • 開始多輪對話
    • 使用非同步方法
  • 設定模型參數
  • 設定系統指令
  • 使用安全篩選器
  • 使用控制生成
  • 計算符記
  • 處理多模態 (音訊、程式碼、文件、圖片、影片) 資料
  • 使用自動和手動函式呼叫
  • 執行程式碼
  • 思考模式範例

2. 事前準備

必要條件

您必須擁有具備有效帳單帳戶的 Google Cloud 專案,才能開始使用。請選取要使用的 Google Cloud 專案。

為了執行本程式碼研究室,我們將使用 Colab Enterprise,這是協作式的代管筆記本環境,具備 Google Cloud 的安全性和法規遵循功能。

啟用必要的 API

請點選下方按鈕,在 Google Cloud 專案中啟用本程式碼研究室所需的 API:Vertex AI、Dataform 和 Compute Engine。

將 Colab 筆記本複製到 Google Cloud

按一下下方按鈕,在 Colab Enterprise 中開啟教學筆記本。這項操作會在目前的 Google Cloud 專案中建立 Colab 筆記本副本,讓您執行筆記本。

讓我們開始吧!

3. 初始化環境

建立 Colab 筆記本後,您就可以執行筆記本中提供的程式碼。前幾個步驟會安裝依附元件並匯入必要的程式庫。

執行「開始使用」中的步驟

首先依序執行「入門指南」部分的儲存格。

入門區段中的程式碼儲存格

注意:您可以將滑鼠游標懸停在要執行的程式碼儲存格上,然後按一下「執行儲存格」圖示 執行儲存格圖示,即可執行儲存格。

執行儲存格

在本節結束時,您將完成以下操作。

  • 安裝 Python 適用的 Google Gen AI SDK
  • 匯入實驗室所需的程式庫
  • 設定 Google Cloud 專案以使用 Vertex AI

現在讓我們使用 Gemini 2.5 Pro 生成文字

4. 使用 Gemini 生成文字

在本節的 Notebook 中,您將使用 Gemini 2.5 Pro 產生文字完成內容。

請繼續在筆記本中執行下一組儲存格,花點時間閱讀程式碼,瞭解如何使用 Google GenAI SDK。

使用文字提示來生成文字

完成本節後,您將學到以下內容:

  • 如何指定要使用的模型。
  • 非串流與串流輸出內容產生。
  • 使用 SDK 的多輪對話功能。
  • 以非同步方式呼叫 SDK。
  • 設定模型參數。
  • 設定系統指令,自訂模型行為。
  • 設定內容安全性篩選器。

接下來,我們將說明如何向 Gemini 傳送多模態提示

5. 多模態提示

在本節的筆記本中,您將使用 Gemini 2.5 Pro 處理圖片和影片。

請在筆記本中執行下列儲存格。多模態提示的程式碼儲存格

完成本節後,您將學到以下內容:

  • 傳送含有圖片和文字的提示。
  • 處理網址中的影片

接下來,我們會產生明確且結構化的輸出內容

6. 結構化輸出內容

在程式碼中使用模型回應時,請務必從模型取得一致且可靠的輸出內容。您可使用控制生成功能定義回覆結構定義,指定模型輸出的結構、欄位名稱,以及每個欄位的預期資料類型。

請在筆記本中執行下列儲存格。用於控制輸出內容的程式碼儲存格

接下來,我們將說明如何將模型輸出內容接地

7. 連結

如果您想使用現有的知識庫,或為模型提供即時資訊,請考慮將模型的輸出內容置於基礎。

有了 Gemini 和 Vertex AI,您就能在 Google 搜尋、函式回覆的輸出內容,以及程式碼本身中建立基準。有了程式碼執行功能,模型就能生成及執行程式碼,進而根據結果學習並反覆執行,直到產生最終輸出內容為止。

請在筆記本中執行下列儲存格。用於測試 Grounding 的程式碼儲存格

接下來,我們將介紹 Gemini 2.5 Pro 的思考能力

8. 處理中

思考模式對於需要多輪規劃和反覆求解的複雜任務特別實用。Gemini 2.5 模型是會思考的模型,能夠在回答使用者的問題之前,先整理好自己的想法,進行推理判斷,在效能和準確性方面都更勝以往。

請在筆記本中執行下列儲存格。在您執行這項操作時,請注意模型在顯示實際輸出內容之前的思考輸出內容。程式碼儲存格,用於顯示「思考中」輸出內容

9. 結論

恭喜!您已瞭解如何使用 Google Gen AI SDK for Python 發揮 Gemini 2.5 Pro 的強大功能,涵蓋文字生成、多模態、基礎、結構化輸出,以及先進的思考能力。您現在已掌握基礎知識,可以開始使用 SDK 建構自己的創新應用程式。Gemini 2.5 Pro 具備強大的思考和推理模式,可開創新的可能性,並在各種用途中實現創新。

其他參考資料

您覺得這個程式碼研究室如何?