Application de chat avec l'API PaLM dans Cloud Run

1. Introduction

Cet atelier de programmation vous explique comment créer et déployer une application de chat basée sur l'IA sur une application Web en tant que service Cloud Run sur Google Cloud. Cette application de chat permet aux utilisateurs d'interroger et d'obtenir une réponse à l'aide du modèle PaLM pour Chat Bison ( text-chat).

Ce que vous allez faire

Vous allez créer

  • Un environnement Google Cloud pour exécuter l'application
  • Une image Docker pour l'application
  • Un service Cloud Run qui exécute l'application

2. Conditions requises

  • Un navigateur tel que Chrome ou Firefox
  • Un projet Google Cloud avec facturation activée

3. Avant de commencer

  1. Dans la console Google Cloud, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.
  2. Assurez-vous que la facturation est activée pour votre projet Google Cloud. Découvrez comment vérifier si la facturation est activée sur un projet.
  3. Activez Cloud Shell depuis la console Google Cloud en suivant ces instructions.
  4. Si votre projet n'est pas défini, utilisez la commande suivante pour le définir :
gcloud config set project <YOUR_PROJECT_ID>
  1. Dans Cloud Shell, définissez les variables d'environnement suivantes:
export GCP_PROJECT=<YOUR_PROJECT_ID>
export GCP_REGION=us-central1
  1. Activez les API Google Cloud nécessaires en exécutant les commandes suivantes dans le terminal Cloud Shell:
gcloud services enable cloudbuild.googleapis.com cloudfunctions.googleapis.com run.googleapis.com logging.googleapis.com storage-component.googleapis.com aiplatform.googleapis.com

4. Configurer votre environnement

  1. Pour copier l'exemple de code dans votre projet, clonez le dépôt dans Cloud Shell:
git clone https://github.com/rominirani/genai-apptemplates-googlecloud
  1. Cette commande clone le contenu du dépôt dans le dossier genai-templates-googlecloud.
  2. Accédez au dossier du projet qui vous intéresse en exécutant la commande suivante depuis le terminal Cloud Shell:
cd genai-apptemplates-googlecloud/chat-flask-cloudrun
  1. Définissez les variables d'environnement suivantes pour l'initialisation de Vertex AI:

GCP_PROJECT : ID de votre projet Google Cloud. Par exemple: mon_projet.

GCP_REGION : région dans laquelle vous souhaitez déployer votre fonction Cloud Exemple: us-central1.

export GCP_PROJECT='YOUR_PROJECT'
export GCP_REGION='us-central1'

5. Créer une image Docker

Pour créer une image Docker pour l'application et la transférer vers Artifact Registry, procédez comme suit:

  1. Définissez une variable d'environnement pour le dépôt Artifact Registry. Les noms ne peuvent contenir que des lettres minuscules, des chiffres et des traits d'union. Ils doivent commencer par une lettre et se terminer par une lettre ou un chiffre. Par exemple: my-chat-app-repo.
export AR_REPO='my-chat-app-repo'
  1. Définissez une variable d'environnement pour le nom de votre service. Par exemple: chat-flask-app.
export SERVICE_NAME='chat-flask-app'
  1. Créez votre dépôt au format Docker.
gcloud artifacts repositories create "$AR_REPO" --location="$GCP_REGION" --repository-format=Docker
  1. Configurez l'authentification Docker.
gcloud auth configure-docker "$GCP_REGION-docker.pkg.dev"
  1. Créer l'image.
gcloud builds submit --tag "$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME"
  1. Pour vérifier si l'image a bien été transférée vers Artifact Registry, accédez à la page "Artifact Registry". Recherchez le dépôt que vous avez créé sur cette page.

6. Déployer l'application

  1. Déployer l'application en tant que service sur Cloud Run
gcloud run deploy "$SERVICE_NAME" \ 
--port=8080 \ 
--image="$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME" \ 
--allow-unauthenticated \ 
--region=$GCP_REGION \ 
--platform=managed  \ 
--project=$GCP_PROJECT \ 
--set-env-vars=GCP_PROJECT=$GCP_PROJECT,GCP_REGION=$GCP_REGION

Cette étape peut prendre quelques secondes.

  1. Pour lancer l'application de chat, cliquez sur l'URL du service.

56c06b62e0ac95bf.png

L'application de chat s'ouvre dans un nouvel onglet, comme illustré dans la capture d'écran suivante:

eebde9c35c171563.png

7. Effectuer un nettoyage

Pour éviter que les ressources utilisées dans cet article soient facturées sur votre compte Google Cloud, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Gérer les ressources.
  2. Dans la liste des projets, sélectionnez celui que vous souhaitez supprimer, puis cliquez sur Supprimer.
  3. Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.
  4. Si vous souhaitez conserver votre projet, ignorez les étapes ci-dessus et supprimez le service Cloud Run en accédant à Cloud Run. Dans la liste des services, cochez celui que vous souhaitez supprimer, puis cliquez sur SUPPRIMER.

8. Félicitations

Félicitations ! Vous venez de créer et de déployer une application de chat basée sur l'IA pour une application Web en tant que service Cloud Run sur Google Cloud. Vous pouvez utiliser cette application de chat pour permettre aux utilisateurs de saisir leur requête. Cette application appelle le modèle de chat Vertex AI et fournit la réponse.