程式碼研究室簡介
1. 總覽
簡介
Gemini 2.5 Pro 是 Google 最強大的編碼和世界知識模型。
自 2.5 系列起,Gemini 模型已成為混合推論模型!Gemini 2.5 Pro 可在各項任務中進行更深入的思考,並使用工具盡可能提高回覆準確度。
Gemini 2.5 Pro 的特色如下:
- 在程式設計、推理和多模態等功能方面,大幅超越先前模型。
- 在數學與 STEM 基準測試中,具備業界領先的推理能力和頂尖效能。
- 程式碼的絕佳模型,網頁開發更是強項。
- 特別適合複雜的提示,同時兼顧全面性,包括 LMSys 的 #1。
課程內容
在本教學課程中,您將瞭解如何搭配使用 Gemini API 和 Google Gen AI SDK for Python 與 Gemini 2.5 Pro 模型。
您將完成下列工作:
- 使用文字提示來生成文字
- 生成逐句顯示文字
- 開始多輪對話
- 使用非同步方法
- 設定模型參數
- 設定系統指令
- 使用安全篩選器
- 使用控制生成
- 計算符記
- 處理多模態 (音訊、程式碼、文件、圖片、影片) 資料
- 使用自動和手動函式呼叫
- 執行程式碼
- 思考模式範例
2. 事前準備
必要條件
您必須擁有具備有效帳單帳戶的 Google Cloud 專案,才能開始使用。請選取要使用的 Google Cloud 專案。
為了執行本程式碼研究室,我們將使用 Colab Enterprise,這是協作式的代管筆記本環境,具備 Google Cloud 的安全性和法規遵循功能。
啟用必要的 API
請點選下方按鈕,在 Google Cloud 專案中啟用本程式碼研究室所需的 API:Vertex AI、Dataform 和 Compute Engine。
將 Colab 筆記本複製到 Google Cloud
按一下下方按鈕,在 Colab Enterprise 中開啟教學筆記本。這項操作會在目前的 Google Cloud 專案中建立 Colab 筆記本副本,讓您執行筆記本。
讓我們開始吧!
3. 初始化環境
建立 Colab 筆記本後,您就可以執行筆記本中提供的程式碼。前幾個步驟會安裝依附元件並匯入必要的程式庫。
執行「開始使用」中的步驟
首先依序執行「入門指南」部分的儲存格。
注意:您可以將滑鼠游標懸停在要執行的程式碼儲存格上,然後按一下「執行儲存格」圖示 ,即可執行儲存格。
在本節結束時,您將完成以下操作。
- 安裝 Python 適用的 Google Gen AI SDK
- 匯入實驗室所需的程式庫
- 設定 Google Cloud 專案以使用 Vertex AI
現在讓我們使用 Gemini 2.5 Pro 生成文字
4. 使用 Gemini 生成文字
在本節的 Notebook 中,您將使用 Gemini 2.5 Pro 產生文字完成內容。
請繼續在筆記本中執行下一組儲存格,花點時間閱讀程式碼,瞭解如何使用 Google GenAI SDK。
完成本節後,您將學到以下內容:
- 如何指定要使用的模型。
- 非串流與串流輸出內容產生。
- 使用 SDK 的多輪對話功能。
- 以非同步方式呼叫 SDK。
- 設定模型參數。
- 設定系統指令,自訂模型行為。
- 設定內容安全性篩選器。
接下來,我們將說明如何向 Gemini 傳送多模態提示
5. 多模態提示
在本節的筆記本中,您將使用 Gemini 2.5 Pro 處理圖片和影片。
請在筆記本中執行下列儲存格。
完成本節後,您將學到以下內容:
- 傳送含有圖片和文字的提示。
- 處理網址中的影片
接下來,我們會產生明確且結構化的輸出內容
6. 結構化輸出內容
在程式碼中使用模型回應時,請務必從模型取得一致且可靠的輸出內容。您可使用控制生成功能定義回覆結構定義,指定模型輸出的結構、欄位名稱,以及每個欄位的預期資料類型。
請在筆記本中執行下列儲存格。
接下來,我們將說明如何將模型輸出內容接地
7. 連結
如果您想使用現有的知識庫,或為模型提供即時資訊,請考慮將模型的輸出內容置於基礎。
有了 Gemini 和 Vertex AI,您就能在 Google 搜尋、函式回覆的輸出內容,以及程式碼本身中建立基準。有了程式碼執行功能,模型就能生成及執行程式碼,進而根據結果學習並反覆執行,直到產生最終輸出內容為止。
請在筆記本中執行下列儲存格。
接下來,我們將介紹 Gemini 2.5 Pro 的思考能力
8. 處理中
思考模式對於需要多輪規劃和反覆求解的複雜任務特別實用。Gemini 2.5 模型是會思考的模型,能夠在回答使用者的問題之前,先整理好自己的想法,進行推理判斷,在效能和準確性方面都更勝以往。
請在筆記本中執行下列儲存格。在您執行這項操作時,請注意模型在顯示實際輸出內容之前的思考輸出內容。
9. 結論
恭喜!您已瞭解如何使用 Google Gen AI SDK for Python 發揮 Gemini 2.5 Pro 的強大功能,涵蓋文字生成、多模態、基礎、結構化輸出,以及先進的思考能力。您現在已掌握基礎知識,可以開始使用 SDK 建構自己的創新應用程式。Gemini 2.5 Pro 具備強大的思考和推理模式,可開創新的可能性,並在各種用途中實現創新。
其他參考資料
- 請參閱 Google Gen AI SDK 參考文件。
- 前往 Google Cloud 生成式 AI GitHub 存放區,查看其他筆記本。
- 探索 Model Garden 中的 AI 模型。