Mendeteksi dan Mengedit Objek Visual dengan Gemini dan Nano Banana

1. Ringkasan

Dalam lab ini, Anda akan mempelajari tugas berikut:

  • 1️⃣ Mendeteksi objek visual dalam gambar dengan Gemini
  • 2️⃣ Mengekstrak dan memulihkan objek visual dengan Nano Banana
  • 3️⃣ Edit dan ubah objek yang dipulihkan dengan Nano Banana

Berikut beberapa contoh pencapaian Anda:

1f2cadc1fd825c64.png

Yang akan Anda pelajari

  • Cara melakukan deteksi objek dengan kosakata terbuka menggunakan pemahaman spasial Gemini
  • Cara mengekstrak kotak pembatas, teks, dan label dinamis menggunakan perintah bahasa alami
  • Cara memulihkan, membersihkan, dan meluruskan objek visual yang bengkok atau vintage
  • Cara menulis perintah imperatif dan deskriptif untuk pengeditan gambar
  • Cara mewarnai dan mengubah visual secara kreatif menjadi gaya yang benar-benar baru
  • Cara "membuat sinematik" visual menjadi gambar diam film live-action yang fotorealistik

Yang Anda butuhkan

  • Memahami cara menjalankan Python di notebook (di Colab atau lingkungan Jupyter lainnya)
  • Project Google Cloud (Vertex AI) atau kunci Gemini API (Google AI Studio) dengan penagihan diaktifkan

ℹ️ Total biaya untuk menjalankan lab dari awal hingga akhir kurang dari 2 USD (45 gambar 1K yang dihasilkan dengan 1.290 token setiap gambar).

ed255bd97afbedca.png fc7e616a26c8fa40.png c0b9ecec49c859f2.png fc7e616a26c8fa40.png 8f240cd033d2cc65.png

Mari kita mulai...

2. Sebelum memulai

Untuk menggunakan Gemini API, Anda memiliki dua opsi utama:

  1. Melalui Vertex AI dengan project Google Cloud
  2. Melalui Google AI Studio dengan kunci Gemini API

🛠️ Opsi 1 - Gemini API melalui Vertex AI

Persyaratan:

  • Project Google Cloud
  • Vertex AI API harus diaktifkan untuk project ini

🛠️ Opsi 2 - Gemini API melalui Google AI Studio

Persyaratan:

  • Kunci Gemini API

Pelajari lebih lanjut cara mendapatkan kunci Gemini API dari Google AI Studio.

3. Jalankan notebook

Pilih alat pilihan Anda untuk membuka notebook:

🧰 Alat A - Buka notebook di Colab

🧰 Alat B - Buka notebook di Colab Enterprise atau Vertex AI Workbench

💡 Opsi ini mungkin lebih disukai jika Anda telah mengonfigurasi project Google Cloud dengan instance Colab Enterprise atau Vertex AI Workbench.

🧰 Alat C - Dapatkan notebook dari GitHub dan jalankan di lingkungan Anda sendiri

⚠️ Anda harus mendapatkan notebook dari GitHub (atau meng-clone repositori) dan menjalankannya di lingkungan Jupyter Anda sendiri.

🗺️ Daftar isi notebook

Untuk navigasi yang lebih mudah, pastikan untuk meluaskan dan menggunakan daftar isi. Contoh:

de85f5dcc0fe059e.png

🏁 Jalankan notebook

Anda sudah siap. Sekarang Anda dapat mengikuti dan menjalankan notebook. Selamat bersenang-senang!...

4. Selamat!

e3299284f68f56f4.png

Selamat, Anda telah menyelesaikan codelab.

Pelajari lebih lanjut