Giới thiệu về Gemini 2.5 Pro trên Google Cloud

Giới thiệu về Gemini 2.5 Pro trên Google Cloud

Thông tin về lớp học lập trình này

subjectLần cập nhật gần đây nhất: thg 4 23, 2025
account_circleTác giả: Prashanth Subrahmanyam

1. Tổng quan

Giới thiệu

Gemini 2.5 Pro là mô hình mạnh nhất của Google về lập trình và kiến thức thế giới.

Với phiên bản 2.5, các mô hình Gemini hiện là mô hình suy luận kết hợp! Gemini 2.5 Pro có thể áp dụng nhiều phương pháp tư duy hơn cho các nhiệm vụ và sử dụng các công cụ để tăng tối đa độ chính xác của câu trả lời.

Gemini 2.5 Pro là:

  • Một điểm cải tiến đáng kể so với các mô hình trước đây về các khả năng bao gồm lập trình, suy luận và đa phương thức.
  • Dẫn đầu ngành về khả năng suy luận với hiệu suất hiện đại trong các điểm chuẩn về Toán học và STEM.
  • Một mô hình tuyệt vời cho mã, với khả năng phát triển web đặc biệt mạnh mẽ.
  • Đặc biệt phù hợp với các câu lệnh phức tạp, đồng thời vẫn có tính toàn diện, bao gồm cả câu lệnh số 1 trên LMSys.

Kiến thức bạn sẽ học được

Trong hướng dẫn này, bạn sẽ tìm hiểu cách sử dụng API Gemini và SDK AI Gen của Google cho Python với mô hình Gemini 2.5 Pro.

Bạn sẽ hoàn thành các nhiệm vụ sau:

  • Tạo văn bản từ lời nhắc văn bản
    • Tạo văn bản phát trực tuyến
    • Bắt đầu cuộc trò chuyện nhiều lượt
    • Sử dụng phương thức không đồng bộ
  • Định cấu hình thông số mô hình
  • Đặt hướng dẫn hệ thống
  • Sử dụng bộ lọc an toàn
  • Sử dụng tính năng tạo có kiểm soát
  • Đếm mã thông báo
  • Xử lý dữ liệu đa phương thức (âm thanh, mã, tài liệu, hình ảnh, video)
  • Sử dụng lệnh gọi hàm tự động và thủ công
  • Thực thi mã
  • Ví dụ về chế độ suy nghĩ

2. Trước khi bắt đầu

Điều kiện tiên quyết

Để bắt đầu, bạn cần có một dự án trên Google Cloud có tài khoản thanh toán hợp lệ. Vui lòng chọn dự án Google Cloud mà bạn muốn sử dụng.

Để chạy lớp học lập trình này, chúng ta sẽ sử dụng Colab Enterprise. Đây là một môi trường sổ tay được quản lý và cộng tác, có các tính năng bảo mật và tuân thủ của Google Cloud.

Bật các API bắt buộc

Nhấp vào nút bên dưới để bật các API cần thiết cho lớp học lập trình này trong dự án Google Cloud của bạn: Vertex AI, Dataform và Compute Engine.

Sao chép sổ tay Colab vào Google Cloud

Nhấp vào nút bên dưới để mở sổ tay hướng dẫn trong Colab Enterprise. Thao tác này sẽ tạo một bản sao của Sổ tay Colab trong dự án Google Cloud hiện tại của bạn, sau đó cho phép bạn chạy sổ tay đó.

Hãy bắt đầu nào!

3. Khởi chạy môi trường

Giờ đây, khi đã tạo sổ tay Colab, chúng ta có thể thực thi mã được cung cấp trong sổ tay đó. Vài bước đầu tiên sẽ cài đặt các phần phụ thuộc và nhập các thư viện cần thiết.

Thực hiện các bước trong phần Bắt đầu

Trước tiên, hãy chạy lần lượt các ô trong phần Bắt đầu.

Các ô mã trong phần bắt đầu

Lưu ý: Bạn có thể chạy một ô bằng cách giữ con trỏ chuột trên ô chứa mã mà bạn muốn chạy, sau đó nhấp vào biểu tượng Chạy ô Biểu tượng chạy ô.

Chạy ô

Khi kết thúc phần này, bạn sẽ làm được những việc sau.

  • Cài đặt SDK Google Gen AI cho Python
  • Nhập các thư viện cần thiết cho lớp học này
  • Thiết lập dự án trên Google Cloud để sử dụng Vertex AI

Bây giờ, hãy sử dụng Gemini 2.5 Pro để tạo văn bản

4. Tạo văn bản bằng Gemini

Trong phần này của Sổ tay, bạn sẽ sử dụng Gemini 2.5 Pro để tạo nội dung hoàn thành văn bản.

Hãy tiếp tục thực thi nhóm ô tiếp theo trong sổ tay, dành thời gian đọc kỹ mã và tìm hiểu cách sử dụng SDK GenAI của Google.

Tạo văn bản từ câu lệnh văn bản

Khi kết thúc phần này, bạn sẽ nắm được những nội dung sau.

  • Cách chỉ định mô hình cần sử dụng.
  • Tạo đầu ra không truyền trực tuyến so với Tạo đầu ra truyền trực tuyến.
  • Sử dụng tính năng trò chuyện nhiều lượt của SDK.
  • Gọi SDK không đồng bộ.
  • Định cấu hình các tham số của mô hình.
  • Đặt hướng dẫn hệ thống để tuỳ chỉnh hành vi của mô hình.
  • Định cấu hình bộ lọc an toàn cho nội dung.

Tiếp theo, chúng ta sẽ xem cách gửi câu lệnh đa phương thức đến Gemini

5. Lời nhắc đa phương thức

Trong phần này của Sổ tay, bạn sẽ sử dụng Gemini 2.5 Pro để xử lý hình ảnh và video.

Hãy tiếp tục và thực thi các ô sau trong sổ tay. Ô mã cho lời nhắc đa phương thức

Khi kết thúc phần này, bạn sẽ nắm được những nội dung sau.

  • Gửi câu lệnh bao gồm hình ảnh và văn bản.
  • Xử lý video qua URL

Tiếp theo, chúng ta sẽ tạo ra các kết quả được xác định và có cấu trúc rõ ràng

6. Kết quả có cấu trúc

Khi sử dụng phản hồi của các mô hình trong mã, điều quan trọng là chúng ta phải nhận được kết quả nhất quán và đáng tin cậy từ mô hình. Tính năng tạo có kiểm soát cho phép bạn xác định giản đồ phản hồi để chỉ định cấu trúc của đầu ra của mô hình, tên trường và loại dữ liệu dự kiến cho mỗi trường.

Hãy tiếp tục và thực thi các ô sau trong sổ tay. Ô chứa mã cho đầu ra được kiểm soát

Tiếp theo, chúng ta sẽ xem cách căn chỉnh đầu ra của mô hình

7. Mặt đất

Nếu muốn sử dụng cơ sở tri thức hiện có hoặc cung cấp thông tin theo thời gian thực cho mô hình, bạn nên xem xét việc căn cứ kết quả của mô hình.

Với Gemini và Vertex AI, bạn có thể liên kết thực tế kết quả trong Google Tìm kiếm, kết quả của các câu trả lời hàm và cuối cùng là trong chính mã. Tính năng Thực thi mã cho phép mô hình tạo mã và chạy mã đó, nhờ đó học hỏi từ kết quả và lặp lại để có được kết quả cuối cùng.

Hãy tiếp tục và thực thi các ô sau trong sổ tay. Các ô mã để kiểm thử tính năng Kết nối đất

Tiếp theo, chúng ta sẽ xem khả năng tư duy của Gemini 2.5 Pro

8. Đang suy nghĩ

Chế độ suy nghĩ đặc biệt hữu ích cho các nhiệm vụ phức tạp đòi hỏi nhiều vòng lập kế hoạch và giải quyết lặp lại. Các mô hình Gemini 2.5 là những mô hình tư duy, có khả năng suy luận bằng cách suy nghĩ trước khi trả lời, đạt được hiệu suất tốt hơn và độ chính xác cao hơn.

Hãy tiếp tục và thực thi các ô sau trong sổ tay. Khi bạn làm như vậy, hãy lưu ý kết quả tư duy trước khi mô hình trình bày kết quả thực tế. Các ô chứa mã để hiển thị đầu ra của tính năng Suy nghĩ

9. Kết luận

Xin chúc mừng! Bạn đã tìm hiểu cách tận dụng sức mạnh của Gemini 2.5 Pro bằng cách sử dụng SDK Google Gen AI cho Python, bao gồm các tính năng tạo văn bản, đa phương thức, căn cứ, đầu ra có cấu trúc và khả năng tư duy nâng cao. Giờ đây, bạn đã có kiến thức cơ bản để bắt đầu xây dựng các ứng dụng sáng tạo của riêng mình bằng SDK. Với chế độ tư duy và lập luận mạnh mẽ, Gemini 2.5 Pro mở ra nhiều khả năng mới và tạo điều kiện cho sự đổi mới trong nhiều trường hợp sử dụng.

Tài liệu tham khảo khác

Bạn thấy lớp học lập trình này thế nào?