Aplikasi Chat dengan PaLM API di Cloud Run

1. Pengantar

Codelab ini menunjukkan cara membangun dan men-deploy aplikasi chat berbasis AI di aplikasi web sebagai layanan Cloud Run di Google Cloud. Aplikasi chat ini memungkinkan pengguna membuat kueri dan mendapatkan respons menggunakan model PaLM untuk Chat Bison ( text-chat).

Yang akan Anda build

Anda akan membuat

  • Lingkungan di Google Cloud untuk menjalankan aplikasi
  • Gambar Docker untuk aplikasi
  • Layanan Cloud Run yang menjalankan aplikasi

2. Persyaratan

  • Browser, seperti Chrome atau Firefox
  • Project Google Cloud yang mengaktifkan penagihan

3. Sebelum memulai

  1. Di Konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud
  2. Pastikan penagihan diaktifkan untuk project Google Cloud Anda. Pelajari cara memeriksa apakah penagihan diaktifkan pada sebuah project
  3. Aktifkan Cloud Shell dari Konsol Google Cloud dengan mengikuti petunjuk di sini
  4. Jika project Anda belum ditetapkan, gunakan perintah berikut untuk menetapkannya:
gcloud config set project <YOUR_PROJECT_ID>
  1. Di Cloud Shell, tetapkan variabel lingkungan berikut:
export GCP_PROJECT=<YOUR_PROJECT_ID>
export GCP_REGION=us-central1
  1. Aktifkan Google Cloud API yang diperlukan dengan menjalankan perintah berikut di Terminal Cloud Shell:
gcloud services enable cloudbuild.googleapis.com cloudfunctions.googleapis.com run.googleapis.com logging.googleapis.com storage-component.googleapis.com aiplatform.googleapis.com

4. Menyiapkan lingkungan Anda

  1. Untuk menyalin kode contoh ke project Anda, clone repositori di Cloud Shell:
git clone https://github.com/rominirani/genai-apptemplates-googlecloud
  1. Perintah ini akan meng-clone konten repo ke dalam folder genai-templates-googlecloud.
  2. Buka folder project yang penting bagi kita dengan menjalankan perintah berikut dari Terminal Cloud Shell:
cd genai-apptemplates-googlecloud/chat-flask-cloudrun
  1. Tetapkan variabel lingkungan berikut untuk inisialisasi Vertex AI:

GCP_PROJECT : ID Project Google Cloud Anda. Misalnya: my_project.

GCP_REGION : Region tempat Anda ingin men-deploy Cloud Function. Misalnya: us-central1.

export GCP_PROJECT='YOUR_PROJECT'
export GCP_REGION='us-central1'

5. Membangun image Docker

Untuk membangun image Docker untuk aplikasi dan mengirimkannya ke Artifact Registry, lakukan hal berikut:

  1. Tetapkan variabel lingkungan untuk repositori Artifact Registry. Nama hanya boleh berisi huruf kecil, angka, dan tanda hubung, serta harus diawali dengan huruf dan diakhiri dengan huruf atau angka. Misalnya: my-chat-app-repo.
export AR_REPO='my-chat-app-repo'
  1. Tetapkan variabel lingkungan untuk nama layanan Anda. Misalnya: chat-flask-app.
export SERVICE_NAME='chat-flask-app'
  1. Buat repositori Anda dalam format Docker.
gcloud artifacts repositories create "$AR_REPO" --location="$GCP_REGION" --repository-format=Docker
  1. Mengonfigurasi autentikasi Docker.
gcloud auth configure-docker "$GCP_REGION-docker.pkg.dev"
  1. Membangun image
gcloud builds submit --tag "$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME"
  1. Untuk memastikan apakah image dikirim ke Artifact Registry, buka halaman Artifact Registry. Cari repositori yang Anda buat di halaman ini.

6. Men-deploy aplikasi

  1. Men-deploy aplikasi sebagai layanan di Cloud Run.
gcloud run deploy "$SERVICE_NAME" \ 
--port=8080 \ 
--image="$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME" \ 
--allow-unauthenticated \ 
--region=$GCP_REGION \ 
--platform=managed  \ 
--project=$GCP_PROJECT \ 
--set-env-vars=GCP_PROJECT=$GCP_PROJECT,GCP_REGION=$GCP_REGION

Langkah ini mungkin memerlukan waktu beberapa detik untuk diselesaikan.

  1. Untuk meluncurkan aplikasi chat, klik URL layanan.

56c06b62e0ac95bf.pngS

Aplikasi chat akan terbuka di tab baru seperti yang ditampilkan di screenshot berikut:

eebde9c35c171563.png

7. Pembersihan

Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam posting ini, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, buka halaman Manage resource.
  2. Dalam daftar project, pilih project yang ingin dihapus, lalu klik Delete.
  3. Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.
  4. Jika Anda ingin menyimpan project, lewati langkah-langkah di atas dan hapus layanan Cloud Run dengan membuka Cloud Run. Dari daftar layanan, centang layanan yang ingin dihapus, lalu klik DELETE.

8. Selamat

Selamat! Anda telah berhasil membangun dan men-deploy aplikasi chat berbasis AI untuk aplikasi web sebagai layanan Cloud Run di Google Cloud. Anda dapat menggunakan aplikasi chat ini untuk mengizinkan pengguna memasukkan kueri dan aplikasi ini akan memanggil model chat Vertex AI serta memberikan respons.