Pengantar Gemini 2.5 Pro di Google Cloud

Pengantar Gemini 2.5 Pro di Google Cloud

Tentang codelab ini

subjectTerakhir diperbarui Apr 23, 2025
account_circleDitulis oleh Prashanth Subrahmanyam

1. Ringkasan

Pengantar

Gemini 2.5 Pro adalah model Google yang paling kuat untuk coding dan pengetahuan dunia.

Dengan seri 2.5, model Gemini kini menjadi model penalaran campuran. Gemini 2.5 Pro dapat menerapkan pemikiran yang lebih panjang di berbagai tugas, dan menggunakan alat untuk memaksimalkan akurasi respons.

Gemini 2.5 Pro adalah:

  • Peningkatan yang signifikan dari model sebelumnya di berbagai kemampuan, termasuk coding, penalaran, dan multimodalitas.
  • Memiliki kemampuan penalaran terbaik di industri dengan performa canggih dalam benchmark Matematika & STEM.
  • Model yang luar biasa untuk kode, dengan pengembangan web yang sangat kuat.
  • Sangat cocok untuk perintah yang kompleks, sekaligus tetap menyeluruh, termasuk #1 di LMSys.

Yang akan Anda pelajari

Dalam tutorial ini, Anda akan mempelajari cara menggunakan Gemini API dan Google Gen AI SDK for Python dengan model Gemini 2.5 Pro.

Anda akan menyelesaikan tugas-tugas berikut:

  • Membuat teks dari perintah teks
    • Membuat teks streaming
    • Memulai multi-turn chat
    • Menggunakan metode asinkron
  • Mengonfigurasi parameter model
  • Mengatur petunjuk sistem
  • Menggunakan filter keamanan
  • Menggunakan pembuatan terkontrol
  • Menghitung token
  • Memproses data multimodal (audio, kode, dokumen, gambar, video)
  • Menggunakan panggilan fungsi otomatis dan manual
  • Eksekusi kode
  • Contoh mode berpikir

2. Sebelum memulai

Prasyarat

Sebelum dapat memulai, Anda memerlukan project Google Cloud dengan akun penagihan yang valid. Pilih project Google Cloud yang ingin Anda gunakan.

Untuk menjalankan codelab, kita akan menggunakan Colab Enterprise yang merupakan lingkungan notebook kolaboratif yang terkelola dan dilengkapi kemampuan keamanan serta kepatuhan Google Cloud.

Mengaktifkan API yang diperlukan

Klik tombol di bawah untuk mengaktifkan API yang diperlukan untuk codelab ini di project Google Cloud Anda: Vertex AI, Dataform, dan Compute Engine.

Menyalin notebook Colab ke Google Cloud

Klik tombol di bawah untuk membuka notebook tutorial di Colab Enterprise. Tindakan ini akan membuat salinan Notebook Colab di project Google Cloud Anda saat ini, yang kemudian akan memungkinkan Anda menjalankan notebook.

Mari kita mulai!

3. Melakukan Inisialisasi Lingkungan

Setelah membuat notebook Colab, kita dapat mengeksekusi kode yang disediakan dalam notebook. Beberapa langkah pertama akan menginstal dependensi dan mengimpor library yang diperlukan.

Jalankan langkah-langkah di Memulai

Pertama, jalankan sel di bagian Memulai satu per satu.

Sel kode di bagian memulai

Catatan: Anda dapat menjalankan sel dengan menahan kursor mouse di atas sel kode yang ingin dijalankan, lalu mengklik ikon Ikon jalankan sel Run cell.

Menjalankan sel

Di akhir bagian ini, Anda akan melakukan hal berikut.

  • Menginstal Google Gen AI SDK untuk Python
  • Mengimpor library yang diperlukan untuk lab
  • Menyiapkan project Google Cloud untuk menggunakan Vertex AI

Sekarang, mari kita gunakan Gemini 2.5 Pro untuk membuat teks

4. Membuat teks dengan Gemini

Di bagian Notebook ini, Anda akan menggunakan Gemini 2.5 Pro untuk membuat penyelesaian teks.

Lanjutkan dan jalankan kumpulan sel berikutnya di notebook, luangkan waktu untuk membaca kode dan memahami cara menggunakan Google GenAI SDK.

Membuat teks dari perintah teks

Di akhir bagian ini, Anda akan mempelajari hal berikut.

  • Cara menentukan model yang akan digunakan.
  • Pembuatan output non-streaming vs. Streaming.
  • Menggunakan kemampuan chat multi-giliran dari SDK.
  • Memanggil SDK secara asinkron.
  • Mengonfigurasi parameter model.
  • Menetapkan petunjuk sistem untuk menyesuaikan perilaku model.
  • Mengonfigurasi filter keamanan konten.

Selanjutnya, kita akan melihat cara mengirim perintah multimodal ke Gemini

5. Perintah multimodal

Di bagian Notebook ini, Anda akan menggunakan Gemini 2.5 Pro untuk memproses gambar dan video.

Lanjutkan dan jalankan sel berikut di notebook. Kode sel untuk perintah multimodal

Di akhir bagian ini, Anda akan mempelajari hal berikut.

  • Kirim perintah yang terdiri dari gambar dan teks.
  • Memproses video dari URL

Selanjutnya, kita akan membuat output yang terstruktur dan jelas

6. Output terstruktur

Saat menggunakan respons model dalam kode, penting bagi kita untuk mendapatkan output yang konsisten dan andal dari model. Pembuatan terkontrol memungkinkan Anda menentukan skema respons untuk menentukan struktur output model, nama kolom, dan jenis data yang diharapkan untuk setiap kolom.

Lanjutkan dan jalankan sel berikut di notebook. Sel kode untuk output terkontrol

Selanjutnya, kita akan melihat cara me-ground output model

7. Grounding

Jika ingin menggunakan basis pengetahuan yang ada atau memberikan informasi real time ke model, Anda harus melihat dasar output model.

Dengan Gemini dan Vertex AI, Anda dapat menghubungkan output di Google Penelusuran, pada output respons fungsi, dan akhirnya dalam kode itu sendiri. Eksekusi Kode memungkinkan model membuat kode dan menjalankannya, sehingga belajar dari hasil dan melakukan iterasi untuk mendapatkan output akhir.

Lanjutkan dan jalankan sel berikut di notebook. Sel kode untuk menguji Grounding

Selanjutnya, kita akan melihat kemampuan berpikir Gemini 2.5 Pro

8. Berpikir

Mode berpikir sangat berguna untuk tugas kompleks yang memerlukan beberapa kali penyusunan strategi dan penyelesaian secara berulang. Model Gemini 2.5 adalah model pemikiran yang memiliki kemampuan penalaran pemikirannya sebelum merespons, sehingga performa dan keakuratannya lebih baik.

Lanjutkan dan jalankan sel berikut di notebook. Saat melakukannya, perhatikan output pemikiran sebelum model menampilkan output sebenarnya. Sel kode untuk menampilkan output Pemikiran

9. Kesimpulan

Selamat! Anda telah mempelajari cara memanfaatkan kecanggihan Gemini 2.5 Pro menggunakan Google Gen AI SDK for Python, yang mencakup pembuatan teks, multimodalitas, dasar, output terstruktur, dan kemampuan pemikiran tingkat lanjutnya. Sekarang Anda memiliki pengetahuan dasar untuk mulai mem-build aplikasi inovatif Anda sendiri menggunakan SDK. Gemini 2.5 Pro, dengan mode pemikiran dan penalaran yang canggih, membuka peluang baru dan mendukung inovasi di berbagai kasus penggunaan.

Referensi tambahan

Bagaimana pendapat Anda tentang codelab ini?