App de chat com a API PaLM no Cloud Run

1. Introdução

Este codelab mostra como criar e implantar um app de chat baseado em IA em um aplicativo da Web como um serviço do Cloud Run no Google Cloud. Com esse app de chat, os usuários podem consultar e receber uma resposta usando o modelo PaLM for Chat-Bison ( text-chat).

O que você vai criar

Você vai criar

  • Um ambiente no Google Cloud para executar o aplicativo
  • Uma imagem do Docker para o aplicativo
  • Um serviço do Cloud Run que executa o aplicativo

2. Requisitos

  • Use um navegador, como o Chrome ou o Firefox.
  • Tenha um projeto do Google Cloud com o faturamento ativado.

3. Antes de começar

  1. No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
  2. Verifique se o faturamento está ativado para seu projeto do Google Cloud. Saiba como verificar se o faturamento está ativado em um projeto.
  3. Ative o Cloud Shell no console do Google Cloud seguindo estas instruções.
  4. Se o projeto não estiver definido, use este comando:
gcloud config set project <YOUR_PROJECT_ID>
  1. No Cloud Shell, defina as seguintes variáveis de ambiente:
export GCP_PROJECT=<YOUR_PROJECT_ID>
export GCP_REGION=us-central1
  1. Execute os comandos a seguir no terminal do Cloud Shell para ativar as APIs do Google Cloud necessárias:
gcloud services enable cloudbuild.googleapis.com cloudfunctions.googleapis.com run.googleapis.com logging.googleapis.com storage-component.googleapis.com aiplatform.googleapis.com

4. Configurar o ambiente

  1. Para copiar o exemplo de código para seu projeto, clone o repositório no Cloud Shell:
git clone https://github.com/rominirani/genai-apptemplates-googlecloud
  1. Esse comando clonará o conteúdo do repositório na pasta genai-templates-googlecloud.
  2. Execute o seguinte comando no terminal do Cloud Shell para acessar a pasta do projeto relevante:
cd genai-apptemplates-googlecloud/chat-flask-cloudrun
  1. Defina as variáveis de ambiente a seguir para a inicialização da Vertex AI:

GCP_PROJECT : o ID do projeto do Google Cloud. Por exemplo: my_project.

GCP_REGION : a região em que você quer implantar a função do Cloud. Por exemplo: us-central1.

export GCP_PROJECT='YOUR_PROJECT'
export GCP_REGION='us-central1'

5. Criar uma imagem do Docker

Para criar uma imagem Docker para o aplicativo e enviá-la para o Artifact Registry, faça o seguinte:

  1. Defina uma variável de ambiente para o repositório do Artifact Registry. Os nomes só podem conter letras minúsculas, números e hifens. Eles precisam começar com uma letra e terminar com uma letra ou um número. Por exemplo: my-chat-app-repo.
export AR_REPO='my-chat-app-repo'
  1. Defina uma variável de ambiente para o nome do serviço. Por exemplo: chat-flask-app.
export SERVICE_NAME='chat-flask-app'
  1. Crie seu repositório no formato Docker.
gcloud artifacts repositories create "$AR_REPO" --location="$GCP_REGION" --repository-format=Docker
  1. Configure a autenticação do Docker.
gcloud auth configure-docker "$GCP_REGION-docker.pkg.dev"
  1. Crie a imagem.
gcloud builds submit --tag "$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME"
  1. Para verificar se a imagem foi enviada para o Artifact Registry, acesse a página do Artifact Registry. Procure o repositório que você criou nesta página.

6. Implantar o aplicativo

  1. Implantar o aplicativo como serviço no Cloud Run.
gcloud run deploy "$SERVICE_NAME" \ 
--port=8080 \ 
--image="$GCP_REGION-docker.pkg.dev/$GCP_PROJECT/$AR_REPO/$SERVICE_NAME" \ 
--allow-unauthenticated \ 
--region=$GCP_REGION \ 
--platform=managed  \ 
--project=$GCP_PROJECT \ 
--set-env-vars=GCP_PROJECT=$GCP_PROJECT,GCP_REGION=$GCP_REGION

Esta etapa pode levar alguns segundos para ser concluída.

  1. Para iniciar o aplicativo de chat, clique no URL do serviço.

56c06b62e0ac95bf.png

O aplicativo de chat é aberto em uma nova guia, como mostra a captura de tela abaixo:

eebde9c35c171563.png

7. Limpar

Para evitar cobranças na sua conta do Google Cloud pelos recursos usados nesta postagem, siga estas etapas:

  1. No console do Google Cloud, acesse a página Gerenciar recursos.
  2. Na lista de projetos, selecione o projeto que você quer excluir e clique em Excluir.
  3. Na caixa de diálogo, digite o ID do projeto e clique em Encerrar para excluí-lo.
  4. Se quiser manter seu projeto, pule as etapas acima e exclua o serviço do Cloud Run. Para isso, acesse o Cloud Run e, na lista de serviços, marque aquele que você quer excluir e clique em EXCLUIR.

8. Parabéns

Parabéns! Você criou e implantou corretamente um app de chat baseado em IA para um aplicativo da Web como um serviço do Cloud Run no Google Cloud. É possível usar este app de chat para permitir que os usuários insiram as consultas, e ele vai invocar o modelo de chat da Vertex AI e fornecer a resposta.