1. Introduction
Cet atelier de programmation explique comment créer et déployer une application de chat basée sur l'IA dans une application Web en tant que service Cloud Run sur Google Cloud. Cette application de chat permet aux utilisateurs d'envoyer des requêtes et d'obtenir une réponse à l'aide du modèle PaLM pour le chat Bison ( text-chat).
Objectifs de l'atelier
Vous allez créer :
- un environnement dans Google Cloud pour exécuter l'application ;
- une image Docker pour l'application ;
- un service Cloud Run qui exécute l'application.
2. Conditions requises
3. Avant de commencer
- Dans la console Google Cloud, sur la page du sélecteur de projet, sélectionnez ou créez un projet Google Cloud.
- Assurez-vous que la facturation est activée pour votre projet Google Cloud. Découvrez comment vérifier si la facturation est activée pour un projet.
- Activez Cloud Shell depuis la console Google Cloud en suivant les instructions ici.
- Si votre projet n'est pas défini, utilisez la commande suivante pour le définir :
gcloud config set project <YOUR_PROJECT_ID>
- Dans Cloud Shell, définissez les variables d'environnement suivantes :
export GCP_PROJECT=<YOUR_PROJECT_ID>
export GCP_REGION=us-central1
- Activez les API Google Cloud nécessaires en exécutant les commandes suivantes dans le terminal Cloud Shell :
gcloud services enable cloudbuild.googleapis.com cloudfunctions.googleapis.com run.googleapis.com logging.googleapis.com storage-component.googleapis.com aiplatform.googleapis.com
4. Configurer votre environnement
- Pour copier l'exemple de code dans votre projet, clonez le dépôt dans Cloud Shell :
git clone https://github.com/rominirani/genai-apptemplates-googlecloud
- Cette commande clone le contenu du dépôt dans le dossier genai-templates-googlecloud.
- Accédez au dossier du projet qui vous intéresse en exécutant la commande suivante depuis le terminal Cloud Shell :
cd genai-apptemplates-googlecloud/chat-flask-cloudrun
- Définissez les variables d'environnement suivantes pour l'initialisation de Vertex AI :
GCP_PROJECT : ID de votre projet Google Cloud. Par exemple : my_project.
GCP_REGION : région dans laquelle vous souhaitez déployer votre fonction Cloud. Par exemple : us-central1.
export GCP_PROJECT='YOUR_PROJECT'
export GCP_REGION='us-central1'
5. Créer une image Docker
Pour créer une image Docker pour l'application et la transférer vers Artifact Registry, procédez comme suit :
- Définissez une variable d'environnement pour le dépôt Artifact Registry. Les noms ne peuvent contenir que des lettres minuscules, des chiffres et des traits d'union. Ils doivent commencer et se terminer par une lettre ou un chiffre. Par exemple : my-chat-app-repo.
export AR_REPO='my-chat-app-repo'
- Définissez une variable d'environnement pour le nom de votre service. Par exemple : chat-flask-app.
export SERVICE_NAME='chat-flask-app'
- Créez votre dépôt au format Docker.
gcloud artifacts repositories create "$AR_REPO" --location="$GCP_REGION" --repository-format=Docker
- Configurez l'authentification Docker.
gcloud auth configure-docker "$GCP_REGION-docker.pkg.dev"
- Créez l'image.
gcloud builds submit --tag "$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME"
- Pour vérifier si l'image a bien été transférée vers Artifact Registry, accédez à la page "Artifact Registry". Recherchez le dépôt que vous avez créé sur cette page.
6. Déployer l'application
- Déployez l'application en tant que service sur Cloud Run.
gcloud run deploy "$SERVICE_NAME" \
--port=8080 \
--image="$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME" \
--allow-unauthenticated \
--region=$GCP_REGION \
--platform=managed \
--project=$GCP_PROJECT \
--set-env-vars=GCP_PROJECT=$GCP_PROJECT,GCP_REGION=$GCP_REGION
Cette étape peut prendre quelques secondes.
- Pour lancer l'application de chat, cliquez sur l'URL du service.

L'application de chat s'ouvre dans un nouvel onglet, comme illustré dans la capture d'écran suivante :

7. Effectuer un nettoyage
Pour éviter que les ressources utilisées dans cet atelier soient facturées sur votre compte Google Cloud, procédez comme suit :
- Dans la console Google Cloud, accédez à la page Gérer les ressources.
- Dans la liste des projets, sélectionnez celui que vous souhaitez supprimer, puis cliquez sur Supprimer.
- Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.
- Si vous souhaitez conserver votre projet, ignorez les étapes ci-dessus et supprimez le service Cloud Run en accédant à Cloud Run. Dans la liste des services, cochez celui que vous souhaitez supprimer, puis cliquez sur SUPPRIMER.
8. Félicitations
Félicitations ! Vous venez de créer et de déployer une application de chat basée sur l'IA pour une application Web en tant que service Cloud Run sur Google Cloud. Vous pouvez utiliser cette application de chat pour permettre à vos utilisateurs de saisir leur requête. L'application appellera le modèle de chat Vertex AI et fournira la réponse.