1. Introdução
Este codelab mostra como invocar uma função do Cloud que inicializa o módulo da Vertex AI e fornece um endpoint para invocar o modelo PaLM Text Bison. Essa Função do Cloud é escrita em Python. Confira a lista de serviços usados:
- Cloud Functions
- API PaLM da Vertex AI
O que você vai criar
Você vai criar e implantar uma função do Cloud que fornece um endpoint para invocar o modelo PaLM Text Bison.
2. Requisitos
3. Antes de começar
- No console do Google Cloud, na página de seletor de projetos, selecione ou crie um projeto do Google Cloud.
- Verifique se o faturamento está ativado para o projeto na nuvem do Google Cloud. Saiba como verificar se o faturamento está ativado em um projeto.
- Ative o Cloud Shell no console do Google Cloud seguindo as instruções aqui.
- Se o projeto não estiver definido, use este comando:
gcloud config set project <YOUR_PROJECT_ID>
- No Cloud Shell, defina as seguintes variáveis de ambiente:
export GCP_PROJECT=<YOUR_PROJECT_ID>
export GCP_REGION=us-central1
- Execute os comandos a seguir no terminal do Cloud Shell para ativar as APIs do Cloud necessárias:
gcloud services enable cloudbuild.googleapis.com cloudfunctions.googleapis.com run.googleapis.com logging.googleapis.com storage-component.googleapis.com aiplatform.googleapis.com
4. Implante a Função do Cloud
Para criar e implantar o Cloud Functions, siga estas etapas:
- Clone o código do repositório https://github.com/rominirani/genai-apptemplates-googlecloud executando o seguinte comando no terminal do Cloud Shell:
git clone https://github.com/rominirani/genai-apptemplates-googlecloud
- Esse comando vai clonar o conteúdo do repositório na pasta genai-templates-googlecloud.
- Navegue até a pasta do projeto que nos interessa executando o seguinte comando no terminal do Cloud Shell:
cd genai-apptemplates-googlecloud/text-predict-cloudfunction
- Você vai encontrar os arquivos main.py e requirements.txt na pasta "text-predict-cloudfunction" executando o comando "dir" ou navegando até o editor do Cloud Shell.
- Para implantar o Cloud Function, execute o comando gcloud functions deploy:
gcloud functions deploy predictText --gen2 --runtime=python311 --region=$GCP_REGION --source=. --entry-point=predictText --trigger-http --set-env-vars=GCP_PROJECT=$GCP_PROJECT,GCP_REGION=$GCP_REGION --allow-unauthenticated --max-instances=1
Depois de implantar a função do Cloud, o URL dela vai aparecer no terminal do Cloud Shell. O URL está no seguinte formato:
https://$GCP_REGION-$GCP_PROJECT.cloudfunctions.net/predictText
5. Invocar a função do Cloud
Como essa função do Cloud Functions é implantada com um gatilho HTTP, é possível invocá-la diretamente. Confira um exemplo de chamada:
curl -m 70 -X POST https://$GCP_REGION-$GCP_PROJECT.cloudfunctions.net/predictText \
-H "Content-Type: application/json" \
-d '{
"prompt": "What are the best places to visit in the United States?"
}'
A saída será semelhante ao seguinte:

6. Limpar
Para evitar cobranças na sua conta do Google Cloud pelos recursos usados nesta postagem, siga estas etapas:
- No console do Google Cloud, acesse a página Gerenciar recursos.
- Na lista de projetos, selecione o projeto que você quer excluir e clique em Excluir.
- Na caixa de diálogo, digite o ID do projeto e clique em Encerrar para excluí-lo.
- Se quiser manter o projeto, pule as etapas acima e exclua a função do Cloud navegando até o Cloud Functions. Na lista de funções, marque aquela que você quer excluir e clique em EXCLUIR.
7. Parabéns
Parabéns! Você usou uma função do Cloud que envolve o modelo PaLM Text Bison. Confira a documentação do produto LLM da Vertex AI para saber mais sobre os modelos disponíveis.