1. Einführung
In diesem Codelab wird gezeigt, wie Sie eine KI-basierte Chat-App in einer Webanwendung als Cloud Run-Dienst in Google Cloud erstellen und bereitstellen. Mit dieser Chat-App können Nutzer Anfragen stellen und Antworten erhalten, indem sie das PaLM for Chat Bison-Modell ( text-chat) verwenden.
Aufgaben
Sie erstellen Folgendes:
- Eine Umgebung in Google Cloud zum Ausführen der Anwendung
- Ein Docker-Image für die Anwendung
- Einen Cloud Run-Dienst, der die Anwendung ausführt
2. Voraussetzungen
3. Hinweis
- Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.
- Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein. So prüfen Sie, ob die Abrechnung für ein Projekt aktiviert ist
- Aktivieren Sie Cloud Shell in der Google Cloud Console. Folgen Sie dazu dieser Anleitung hier.
- Wenn Ihr Projekt nicht festgelegt ist, verwenden Sie den folgenden Befehl, um es festzulegen:
gcloud config set project <YOUR_PROJECT_ID>
- Legen Sie in Cloud Shell die folgenden Umgebungsvariablen fest:
export GCP_PROJECT=<YOUR_PROJECT_ID>
export GCP_REGION=us-central1
- Aktivieren Sie die erforderlichen Google Cloud APIs, indem Sie die folgenden Befehle im Cloud Shell-Terminal ausführen:
gcloud services enable cloudbuild.googleapis.com cloudfunctions.googleapis.com run.googleapis.com logging.googleapis.com storage-component.googleapis.com aiplatform.googleapis.com
4. Umgebung einrichten
- Wenn Sie den Beispielcode in Ihr Projekt kopieren möchten, klonen Sie das Repository in Cloud Shell:
git clone https://github.com/rominirani/genai-apptemplates-googlecloud
- Mit diesem Befehl werden die Repository-Inhalte in den Ordner genai-templates-googlecloud geklont.
- Wechseln Sie zum Ordner des gewünschten Projekts, indem Sie den folgenden Befehl im Cloud Shell-Terminal ausführen:
cd genai-apptemplates-googlecloud/chat-flask-cloudrun
- Legen Sie die folgenden Umgebungsvariablen für die Vertex AI-Initialisierung fest:
GCP_PROJECT : Ihre Google Cloud-Projekt-ID. Beispiel: my_project.
GCP_REGION : Die Region, in der Sie Ihre Cloud-Funktion bereitstellen möchten. Beispiel: us-central1.
export GCP_PROJECT='YOUR_PROJECT'
export GCP_REGION='us-central1'
5. Docker-Image erstellen
So erstellen Sie ein Docker-Image für die Anwendung und übertragen es per Push an Artifact Registry:
- Legen Sie eine Umgebungsvariable für das Artifact Registry-Repository fest. Namen dürfen nur Kleinbuchstaben, Zahlen und Bindestriche enthalten und müssen mit einem Buchstaben beginnen und mit einem Buchstaben oder einer Zahl enden. Beispiel: my-chat-app-repo.
export AR_REPO='my-chat-app-repo'
- Legen Sie eine Umgebungsvariable für den Dienstnamen fest. Beispiel: chat-flask-app.
export SERVICE_NAME='chat-flask-app'
- Erstellen Sie Ihr Repository im Docker-Format.
gcloud artifacts repositories create "$AR_REPO" --location="$GCP_REGION" --repository-format=Docker
- Konfigurieren Sie die Docker-Authentifizierung.
gcloud auth configure-docker "$GCP_REGION-docker.pkg.dev"
- Erstellen Sie das Image.
gcloud builds submit --tag "$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME"
- Rufen Sie die Artifact Registry-Seite auf, um zu überprüfen, ob das Image an Artifact Registry übertragen wurde. Suchen Sie auf dieser Seite nach dem von Ihnen erstellten Repository.
6. Anwendung bereitstellen
- Stellen Sie die Anwendung als Dienst in Cloud Run bereit.
gcloud run deploy "$SERVICE_NAME" \
--port=8080 \
--image="$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME" \
--allow-unauthenticated \
--region=$GCP_REGION \
--platform=managed \
--project=$GCP_PROJECT \
--set-env-vars=GCP_PROJECT=$GCP_PROJECT,GCP_REGION=$GCP_REGION
Dieser Schritt kann einige Sekunden dauern.
- Klicken Sie auf die Dienst-URL, um die Chat-Anwendung zu starten.

Die Chat-Anwendung wird in einem neuen Tab geöffnet, wie im folgenden Screenshot zu sehen:

7. Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in diesem Beitrag verwendeten Ressourcen in Rechnung gestellt werden:
- Wechseln Sie in der Google Cloud Console zur Seite Ressourcen verwalten.
- Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie auf Löschen.
- Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Beenden , um das Projekt zu löschen.
- Wenn Sie Ihr Projekt beibehalten möchten, überspringen Sie die obigen Schritte und löschen Sie den Cloud Run-Dienst. Rufen Sie dazu Cloud Run auf, wählen Sie in der Liste der Dienste den Dienst aus, den Sie löschen möchten, und klicken Sie auf LÖSCHEN.
8. Glückwunsch
Glückwunsch! Sie haben erfolgreich eine KI-basierte Chat-App für eine Webanwendung als Cloud Run-Dienst in Google Cloud erstellt und bereitgestellt. Mit dieser Chat-App können Nutzer Anfragen eingeben. Die App ruft dann das Vertex AI-Chatmodell auf und gibt die Antwort aus.