Aplikacja do obsługi czatu z interfejsem PaLM API w Cloud Run

1. Wprowadzenie

Dzięki temu ćwiczeniu w Codelabs dowiesz się, jak utworzyć i wdrożyć opartą na AI aplikację do obsługi czatu w aplikacji internetowej jako usługę Cloud Run w Google Cloud. Ta aplikacja do obsługi czatu umożliwia użytkownikom zadawanie pytań i uzyskiwanie odpowiedzi za pomocą modelu PaLM na potrzeby czatu Bison ( text-chat).

Co utworzysz

Tworzenie:

  • środowisko w Google Cloud do uruchomienia aplikacji,
  • Obraz Dockera aplikacji
  • Usługa Cloud Run, która uruchamia aplikację

2. Wymagania

  • przeglądarki, na przykład Chrome lub Firefox;
  • Projekt Google Cloud z włączonymi płatnościami

3. Zanim zaczniesz

  1. Na stronie selektora projektów w konsoli Google Cloud wybierz lub utwórz projekt Google Cloud.
  2. Sprawdź, czy w projekcie Google Cloud są włączone płatności. Dowiedz się, jak sprawdzić, czy w projekcie są włączone płatności.
  3. Aktywuj Cloud Shell z konsoli Google Cloud, wykonując instrukcje opisane tutaj
  4. Jeśli Twój projekt nie jest skonfigurowany, ustaw go za pomocą tego polecenia:
gcloud config set project <YOUR_PROJECT_ID>
  1. W Cloud Shell ustaw te zmienne środowiskowe:
export GCP_PROJECT=<YOUR_PROJECT_ID>
export GCP_REGION=us-central1
  1. Włącz niezbędne interfejsy API Google Cloud, wykonując w terminalu Cloud Shell te polecenia:
gcloud services enable cloudbuild.googleapis.com cloudfunctions.googleapis.com run.googleapis.com logging.googleapis.com storage-component.googleapis.com aiplatform.googleapis.com

4. Konfigurowanie środowiska

  1. Aby skopiować przykładowy kod do swojego projektu, skopiuj repozytorium w Cloud Shell:
git clone https://github.com/rominirani/genai-apptemplates-googlecloud
  1. To polecenie spowoduje sklonowanie zawartości repozytorium do folderu genai-templates-googlecloud.
  2. Przejdź do folderu projektu, który jest dla nas ważny, wykonując w terminalu Cloud Shell to polecenie:
cd genai-apptemplates-googlecloud/chat-flask-cloudrun
  1. Ustaw te zmienne środowiskowe na potrzeby inicjowania Vertex AI:

GCP_PROJECT : identyfikator Twojego projektu Google Cloud. Na przykład: mój_projekt.

GCP_REGION : region, w którym chcesz wdrożyć funkcję w Cloud Functions. Na przykład: us-central1.

export GCP_PROJECT='YOUR_PROJECT'
export GCP_REGION='us-central1'

5. Tworzenie obrazu Dockera

Aby utworzyć obraz Dockera dla aplikacji i wypchnąć go do Artifact Registry, wykonaj te czynności:

  1. Ustaw zmienną środowiskową dla repozytorium Artifact Registry. Nazwy mogą zawierać tylko małe litery, cyfry i łączniki. Muszą zaczynać się od litery i kończyć się literą lub cyfrą. Na przykład: my-chat-app-repo.
export AR_REPO='my-chat-app-repo'
  1. Ustaw zmienną środowiskową dla nazwy usługi. Na przykład: chat-flask-app.
export SERVICE_NAME='chat-flask-app'
  1. Utwórz repozytorium w formacie Dockera.
gcloud artifacts repositories create "$AR_REPO" --location="$GCP_REGION" --repository-format=Docker
  1. Skonfiguruj uwierzytelnianie Dockera.
gcloud auth configure-docker "$GCP_REGION-docker.pkg.dev"
  1. Utwórz obraz.
gcloud builds submit --tag "$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME"
  1. Aby sprawdzić, czy obraz jest wypchnięty do Artifact Registry, otwórz stronę Artifact Registry. Znajdź repozytorium utworzone na tej stronie.

6. Wdrażanie aplikacji

  1. wdrożyć aplikację jako usługę w Cloud Run,
gcloud run deploy "$SERVICE_NAME" \ 
--port=8080 \ 
--image="$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME" \ 
--allow-unauthenticated \ 
--region=$GCP_REGION \ 
--platform=managed  \ 
--project=$GCP_PROJECT \ 
--set-env-vars=GCP_PROJECT=$GCP_PROJECT,GCP_REGION=$GCP_REGION

Wykonanie tego kroku może potrwać kilka sekund.

  1. Aby uruchomić aplikację czatu, kliknij adres URL usługi.

56c06b62e0ac95bf.png

Aplikacja czatu otworzy się w nowej karcie, jak to widać na tym zrzucie ekranu:

eebde9c35c171563.png

7. Czyszczenie danych

Aby uniknąć obciążenia konta Google Cloud opłatami za zasoby zużyte w tym poście, wykonaj te czynności:

  1. W konsoli Google Cloud otwórz stronę Zarządzanie zasobami.
  2. Na liście projektów wybierz projekt do usunięcia, a potem kliknij Usuń.
  3. W oknie wpisz identyfikator projektu i kliknij Wyłącz, aby usunąć projekt.
  4. Jeśli chcesz zachować projekt, pomiń powyższe kroki i usuń usługę Cloud Run. W tym celu przejdź do Cloud Run i na liście usług zaznacz tę, którą chcesz usunąć, i kliknij USUŃ.

8. Gratulacje

Gratulacje! Udało Ci się utworzyć i wdrożyć opartą na AI aplikację do obsługi czatu na potrzeby aplikacji internetowej jako usługa Cloud Run w Google Cloud. Za pomocą tej aplikacji do obsługi czatu możesz umożliwić użytkownikom wpisywanie zapytań. Ta aplikacja wywoła model czatu Vertex AI i dostarczy odpowiedź.