Giới thiệu về Gemini 2.5 Pro trên Google Cloud

1. Tổng quan

Giới thiệu

Gemini 2.5 Pro là mô hình mạnh nhất của Google về lập trình và kiến thức thế giới.

Với dòng 2.5, các mô hình Gemini hiện là mô hình suy luận kết hợp! Gemini 2.5 Pro có thể áp dụng một lượng lớn khả năng tư duy cho các nhiệm vụ và sử dụng các công cụ để tối đa hoá độ chính xác của câu trả lời.

Gemini 2.5 Pro là:

  • Một cải tiến đáng kể so với các mô hình trước đây về các khả năng, bao gồm lập trình, suy luận và đa phương thức.
  • Dẫn đầu ngành về khả năng suy luận với hiệu suất hiện đại trong các điểm chuẩn Toán học và STEM.
  • Một mô hình tuyệt vời cho mã, đặc biệt là phát triển web.
  • Đặc biệt phù hợp với các câu lệnh phức tạp, đồng thời vẫn toàn diện, bao gồm cả vị trí số 1 trên LMSys.

Kiến thức bạn sẽ học được

Trong hướng dẫn này, bạn sẽ tìm hiểu cách sử dụng Gemini API và Google Gen AI SDK cho Python với mô hình Gemini 2.5 Pro.

Bạn sẽ hoàn thành các nhiệm vụ sau:

  • Tạo văn bản từ câu lệnh văn bản
    • Tạo văn bản truyền trực tuyến
    • Bắt đầu cuộc trò chuyện nhiều lượt
    • Sử dụng các phương thức không đồng bộ
  • Định cấu hình các tham số mô hình
  • Đặt hướng dẫn hệ thống
  • Sử dụng bộ lọc an toàn
  • Sử dụng tính năng tạo có kiểm soát
  • Đếm mã thông báo
  • Xử lý dữ liệu đa phương thức (âm thanh, mã, tài liệu, hình ảnh, video)
  • Sử dụng tính năng gọi hàm tự động và thủ công
  • Thực thi mã
  • Ví dụ về chế độ tư duy

2. Trước khi bắt đầu

Điều kiện tiên quyết

Trước khi bắt đầu, bạn cần có một dự án trên Google Cloud có tài khoản thanh toán hợp lệ. Vui lòng chọn dự án trên Google Cloud mà bạn muốn sử dụng.

Để chạy lớp học lập trình này, chúng ta sẽ sử dụng Colab Enterprise. Đây là một môi trường sổ tay được quản lý, có tính cộng tác, với các khả năng bảo mật và tuân thủ của Google Cloud.

Bật các API bắt buộc

Nhấp vào nút bên dưới để bật các API cần thiết cho lớp học lập trình này trong dự án trên đám mây của bạn trên Google Cloud: Vertex AI, Dataform và Compute Engine.

Sao chép sổ tay Colab vào Google Cloud

Nhấp vào nút bên dưới để mở sổ tay hướng dẫn trong Colab Enterprise. Thao tác này sẽ tạo một bản sao của Sổ tay Colab trong dự án trên đám mây hiện tại của bạn trên Google Cloud. Sau đó, bạn có thể chạy sổ tay này.

Hãy bắt đầu!

3. Khởi chạy môi trường

Giờ đây, sau khi tạo sổ tay Colab, chúng ta có thể thực thi mã được cung cấp trong sổ tay. Một vài bước đầu tiên sẽ cài đặt các phần phụ thuộc và nhập các thư viện cần thiết.

Chạy các bước trong phần Bắt đầu

Trước tiên, hãy chạy các ô trong phần Bắt đầu lần lượt.

Các ô mã trong phần bắt đầu

Lưu ý: Bạn có thể chạy một ô bằng cách giữ con trỏ chuột trên ô mã mà bạn muốn chạy, sau đó nhấp vào biểu tượng Biểu tượng chạy ô Chạy ô.

Chạy ô

Khi kết thúc phần này, bạn sẽ thực hiện những việc sau.

  • Cài đặt Google Gen AI SDK cho Python
  • Nhập các thư viện cần thiết cho phòng thí nghiệm
  • Thiết lập một dự án trên Google Cloud để sử dụng Vertex AI

Bây giờ, hãy sử dụng Gemini 2.5 Pro để tạo văn bản

4. Tạo văn bản bằng Gemini

Trong phần này của Sổ tay, bạn sẽ sử dụng Gemini 2.5 Pro để tạo văn bản hoàn chỉnh.

Hãy tiếp tục và thực thi tập hợp ô tiếp theo trong sổ tay, dành thời gian đọc kỹ mã và tìm hiểu cách sử dụng Google GenAI SDK.

Tạo văn bản từ câu lệnh dạng văn bản

Khi kết thúc phần này, bạn sẽ học được những điều sau.

  • Cách chỉ định mô hình cần sử dụng.
  • Tạo kết quả đầu ra không truyền trực tuyến so với truyền trực tuyến.
  • Sử dụng khả năng trò chuyện nhiều lượt của SDK.
  • Gọi SDK không đồng bộ.
  • Định cấu hình các tham số mô hình.
  • Đặt hướng dẫn hệ thống để tuỳ chỉnh hành vi của mô hình.
  • Định cấu hình bộ lọc an toàn nội dung.

Tiếp theo, chúng ta sẽ xem cách gửi câu lệnh đa phương thức đến Gemini

5. Câu lệnh đa phương thức

Trong phần này của Sổ tay, bạn sẽ sử dụng Gemini 2.5 Pro để xử lý hình ảnh và video.

Hãy tiếp tục và thực thi các ô sau trong sổ tay. Ô chứa mã cho câu lệnh đa phương thức

Khi kết thúc phần này, bạn sẽ học được những điều sau.

  • Gửi một câu lệnh bao gồm hình ảnh và văn bản.
  • Xử lý video từ một URL

Tiếp theo, chúng ta sẽ tạo kết quả đầu ra được xác định rõ và có cấu trúc

6. Kết quả có cấu trúc

Khi sử dụng phản hồi của các mô hình trong mã, điều quan trọng là chúng ta phải nhận được kết quả đầu ra nhất quán và đáng tin cậy từ mô hình. Tính năng tạo có kiểm soát cho phép bạn xác định giản đồ phản hồi để chỉ định cấu trúc của kết quả đầu ra của mô hình, tên trường và loại dữ liệu dự kiến cho từng trường.

Hãy tiếp tục và thực thi các ô sau trong sổ tay. Ô chứa mã để kiểm soát đầu ra

Tiếp theo, chúng ta sẽ xem cách đặt cơ sở cho kết quả đầu ra của mô hình

7. Liên kết thực tế

Nếu bạn muốn sử dụng các cơ sở kiến thức hiện có hoặc cung cấp thông tin theo thời gian thực cho mô hình, thì bạn nên xem xét việc liên kết thực tế kết quả đầu ra của mô hình.

Với Gemini và Vertex AI, bạn có thể đặt cơ sở cho kết quả đầu ra trong Google Tìm kiếm, trên kết quả đầu ra của các phản hồi hàm và cuối cùng là trong chính mã. Tính năng Thực thi mã cho phép mô hình tạo mã và kích hoạt mã đó, từ đó học hỏi từ kết quả và lặp lại để nhận được kết quả đầu ra cuối cùng.

Hãy tiếp tục và thực thi các ô sau trong sổ tay. Các ô mã để kiểm thử tính năng Nền tảng

Tiếp theo, chúng ta sẽ xem các khả năng tư duy của Gemini 2.5 Pro

8. Tư duy

Chế độ tư duy đặc biệt hữu ích cho các nhiệm vụ phức tạp đòi hỏi nhiều vòng lập kế hoạch và giải quyết lặp đi lặp lại. Các mô hình Gemini 2.5 là những mô hình tư duy, có khả năng suy luận bằng cách suy nghĩ trước khi trả lời, đạt được hiệu suất tốt hơn và độ chính xác cao hơn.

Hãy tiếp tục và thực thi các ô sau trong sổ tay. Khi bạn thực hiện việc này, hãy lưu ý kết quả tư duy trước khi mô hình trình bày kết quả thực tế. Ô chứa mã để hiện kết quả của tính năng Tư duy

9. Kết luận

Xin chúc mừng! Bạn đã học được cách khai thác sức mạnh của Gemini 2.5 Pro bằng Google Gen AI SDK cho Python, bao gồm tạo văn bản, đa phương thức, liên kết thực tế, kết quả có cấu trúc và các khả năng tư duy nâng cao. Giờ đây, bạn đã có kiến thức nền tảng để bắt đầu xây dựng các ứng dụng sáng tạo của riêng mình bằng SDK. Gemini 2.5 Pro, với chế độ tư duy và suy luận mạnh mẽ, mở ra những khả năng mới và phù hợp với sự đổi mới trong nhiều trường hợp sử dụng.

Tài liệu tham khảo bổ sung

  • Xem tài liệu tham khảo về Google Gen AI SDK.
  • Khám phá các sổ tay khác trong kho lưu trữ GitHub về AI tạo sinh của Google Cloud .
  • Khám phá các mô hình AI trong Model Garden.

Bạn thấy lớp học lập trình này thế nào?

Tuyệt vời Trung bình Có thể tốt hơn