Agente de IA generativa para preguntas y respuestas sobre documentos y acciones con llamadas a la API

Agente de IA generativa para preguntas y respuestas sobre documentos y acciones con llamadas a la API

Acerca de este codelab

subjectÚltima actualización: mar 18, 2025
account_circleEscrito por Andrey Shakirov

1. Descripción general

En este lab, crearás un agente de GenAI, lo conectarás a la aplicación de Cloud Run y lo integrarás en el espacio de trabajo de Slack.

8541c95a7fbc9be7.png

El lab tiene varias partes principales:

  • Implementa la aplicación de Cloud Run para integrarla con las APIs de Gemini
  • Crea e implementa un agente conversacional
  • Cómo integrar el agente en Slack
  • Configura el almacén de datos para preguntas y respuestas en documentos PDF

Requisitos previos

  • Para este lab, se da por sentado que el usuario tiene conocimientos previos sobre los entornos de shell y la consola de Cloud.

2. Configuración y requisitos

Configuración del proyecto de Cloud

  1. Accede a Google Cloud Console y crea un proyecto nuevo o reutiliza uno existente. Si aún no tienes una cuenta de Gmail o de Google Workspace, debes crear una.

fbef9caa1602edd0.png

a99b7ace416376c4.png

5e3ff691252acf41.png

  • El Nombre del proyecto es el nombre visible de los participantes de este proyecto. Es una cadena de caracteres que no se utiliza en las APIs de Google. Puedes actualizarla cuando quieras.
  • El ID del proyecto es único en todos los proyectos de Google Cloud y es inmutable (no se puede cambiar después de configurarlo). La consola de Cloud genera automáticamente una cadena única. Por lo general, no importa cuál sea. En la mayoría de los codelabs, deberás hacer referencia al ID de tu proyecto (suele identificarse como PROJECT_ID). Si no te gusta el ID que se generó, podrías generar otro aleatorio. También puedes probar uno propio y ver si está disponible. No se puede cambiar después de este paso y se usa el mismo durante todo el proyecto.
  • Recuerda que hay un tercer valor, un número de proyecto, que usan algunas APIs. Obtén más información sobre estos tres valores en la documentación.
  1. A continuación, deberás habilitar la facturación en la consola de Cloud para usar las APIs o los recursos de Cloud. Ejecutar este codelab no costará mucho, tal vez nada. Para cerrar recursos y evitar que se generen cobros más allá de este instructivo, puedes borrar los recursos que creaste o borrar el proyecto. Los usuarios nuevos de Google Cloud son aptos para participar en el programa Prueba gratuita de $300.

Configuración del entorno

Abre el chat de Gemini.

e1e9ad314691368a.png

Habilita la API de Gemini para Google Cloud:

990a0ceea7d05531.png

Haz clic en "Start chatting" y sigue una de las preguntas de ejemplo o escribe tu propia instrucción para probarla.

ed120d672468b412.png

Instrucciones que puedes probar:

  • Explica Cloud Run en 5 puntos clave.
  • Eres el gerente de producto de Google Cloud Run y debes explicarle Cloud Run a un estudiante en 5 puntos clave breves.
  • Eres gerente de producto de Google Cloud Run y le explicas Cloud Run a un desarrollador certificado de Kubernetes en 5 puntos clave breves.
  • Eres gerente de producto de Google Cloud Run y debes explicarle a un desarrollador sénior cuándo usarías Cloud Run en lugar de GKE en 5 puntos clave breves.

Consulta la Guía de instrucciones para obtener más información sobre cómo escribir mejores instrucciones.

Cómo Gemini para Google Cloud usa tus datos

Compromiso de Google con la privacidad

Google fue uno de los primeros en el sector en publicar un compromiso de privacidad con la IA y el AA, que describe nuestra creencia de que los clientes deben tener el nivel más alto de seguridad y control sobre sus datos que se almacenan en la nube.

Datos que envías y recibes

Las preguntas que le haces a Gemini, incluida cualquier información de entrada o código que envíes a Gemini para que lo analice o complete, se denominan instrucciones. Las respuestas o las terminaciones de código que recibes de Gemini se denominan respuestas. Gemini no usa tus instrucciones ni sus respuestas como datos para entrenar sus modelos.

Encriptación de instrucciones

Cuando envías instrucciones a Gemini, tus datos se encriptan en tránsito como entrada al modelo subyacente en Gemini.

Datos de programas generados a partir de Gemini

Gemini se entrena con código propio de Google Cloud y código de terceros seleccionado. Eres responsable de la seguridad, las pruebas y la eficacia de tu código, incluidos cualquier finalización, generación o análisis de código que te ofrezca Gemini.

Obtén más información sobre cómo Google maneja tus instrucciones.

3. Opciones para probar instrucciones

Tienes varias opciones para probar las instrucciones.

Vertex AI Studio es parte de la plataforma Vertex AI de Google Cloud, diseñada específicamente para simplificar y acelerar el desarrollo y el uso de modelos de IA generativa.

Google AI Studio es una herramienta basada en la Web para crear prototipos y experimentar con la ingeniería de instrucciones y la API de Gemini.

La app web de Google Gemini (gemini.google.com) es una herramienta basada en la Web diseñada para ayudarte a explorar y aprovechar el poder de los modelos de IA de Gemini de Google.

4. Clone el repositorio

Regresa a la consola de Google Cloud y activa Cloud Shell haciendo clic en el ícono que se encuentra a la derecha de la barra de búsqueda.

3e0c761ca41f315e.png

En la terminal abierta, ejecuta los siguientes comandos:

git clone https://github.com/GoogleCloudPlatform/genai-for-developers.git

cd genai
-for-developers

git checkout slack
-agent-jira-lab

Haz clic en "Abrir editor".

63e838aebfdd2423.png

En el elemento de menú “File / Open Folder”, abre “genai-for-developers”.

e3b9bd9682acf539.png

Abre una terminal nueva

4d9c41ab01ff4e97.png

5. Crear una cuenta de servicio.

Cree una cuenta de servicio nueva Usarás esta cuenta de servicio para realizar llamadas a la API de Gemini de Vertex AI desde la aplicación de Cloud Run.

Configura los detalles del proyecto con los detalles de tu proyecto de Qwiklabs.

Ejemplo: qwiklabs-gcp-00-2c10937585bb

gcloud config set project YOUR_QWIKLABS_PROJECT_ID

Crea una cuenta de servicio y otorga roles.

export LOCATION=us-central1
export PROJECT_ID=$(gcloud config get-value project)
export SERVICE_ACCOUNT_NAME='vertex-client'
export DISPLAY_NAME='Vertex Client'
export KEY_FILE_NAME='vertex-client-key'

gcloud iam service-accounts create $SERVICE_ACCOUNT_NAME --project $PROJECT_ID --display-name "$DISPLAY_NAME"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/aiplatform.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/aiplatform.user"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/cloudbuild.builds.editor"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/artifactregistry.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/storage.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/run.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/secretmanager.secretAccessor"

Si se te solicita autorización, haz clic en "Autorizar" para continuar.

6356559df3eccdda.png

Habilita los servicios necesarios para usar las APIs de Vertex AI y el chat de Gemini.

gcloud services enable \
    generativelanguage
.googleapis.com \
    aiplatform
.googleapis.com \
    cloudaicompanion
.googleapis.com \
    run
.googleapis.com \
    cloudresourcemanager
.googleapis.com

Habilita los servicios necesarios para usar las APIs de Vertex AI y el chat de Gemini.

gcloud services enable \
    artifactregistry.googleapis.com \
    cloudbuild.googleapis.com \
    runapps.googleapis.com \
    workstations.googleapis.com \
    servicemanagement.googleapis.com \
    secretmanager.googleapis.com \
    containerscanning.googleapis.com

Usa Gemini Code Assist para la explicación de código

Abre el archivo "devai-api/app/routes.py" y, luego, haz clic con el botón derecho en cualquier parte del archivo y selecciona "Gemini Code Assist > Explain this" en el menú contextual.

427ed40dd44cab8a.png

Revisa la explicación de Gemini para el archivo seleccionado.

a286d1e85bc42960.png

6. Implementa Devai-API en Cloud Run

Verifica que estés en la carpeta correcta.

cd ~/genai-for-developers/devai-api

En este lab, seguimos las prácticas recomendadas y usamos Secret Manager para almacenar y hacer referencia a los valores del token de acceso y la clave de API de LangChain en Cloud Run.

Configurar variables de entorno Ejecuta este comando tal como está, sin hacer ningún cambio.

export JIRA_API_TOKEN=your-jira-token
export JIRA_USERNAME="YOUR-EMAIL"
export JIRA_INSTANCE_URL="https://YOUR-JIRA-PROJECT.atlassian.net"
export JIRA_PROJECT_KEY="YOUR-JIRA-PROJECT-KEY"
export JIRA_CLOUD=true

export GITLAB_PERSONAL_ACCESS_TOKEN=your-gitlab-token
export GITLAB_URL="https://gitlab.com"
export GITLAB_BRANCH="devai"
export GITLAB_BASE_BRANCH="main"
export GITLAB_REPOSITORY="GITLAB-USERID/GITLAB-REPO"

export LANGCHAIN_API_KEY=your-langchain-key
export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_ENDPOINT="https://api.smith.langchain.com"

Crea y almacena varios secretos en Secret Manager.

echo -n $JIRA_API_TOKEN | \
 gcloud secrets create JIRA_API_TOKEN
\
 
--data-file=-

echo
-n $GITLAB_PERSONAL_ACCESS_TOKEN | \
 gcloud secrets create GITLAB_PERSONAL_ACCESS_TOKEN
\
 
--data-file=-

echo
-n $LANGCHAIN_API_KEY | \
 gcloud secrets create LANGCHAIN_API_KEY
\
 
--data-file=-

Implementa la aplicación en Cloud Run.

gcloud run deploy devai-api \
  --source=. \
  --region="$LOCATION" \
  --allow-unauthenticated \
  --service-account vertex-client \
  --set-env-vars PROJECT_ID="$PROJECT_ID" \
  --set-env-vars LOCATION="$LOCATION" \
  --set-env-vars GITLAB_URL="$GITLAB_URL" \
  --set-env-vars GITLAB_REPOSITORY="$GITLAB_REPOSITORY" \
  --set-env-vars GITLAB_BRANCH="$GITLAB_BRANCH" \
  --set-env-vars GITLAB_BASE_BRANCH="$GITLAB_BASE_BRANCH" \
  --set-env-vars JIRA_USERNAME="$JIRA_USERNAME" \
  --set-env-vars JIRA_INSTANCE_URL="$JIRA_INSTANCE_URL" \
  --set-env-vars JIRA_PROJECT_KEY="$JIRA_PROJECT_KEY" \
  --set-env-vars JIRA_CLOUD="$JIRA_CLOUD" \
  --set-env-vars LANGCHAIN_TRACING_V2="$LANGCHAIN_TRACING_V2" \
  --update-secrets="LANGCHAIN_API_KEY=LANGCHAIN_API_KEY:latest" \
  --update-secrets="GITLAB_PERSONAL_ACCESS_TOKEN=GITLAB_PERSONAL_ACCESS_TOKEN:latest" \
  --update-secrets="JIRA_API_TOKEN=JIRA_API_TOKEN:latest" \
  --min-instances=1 \
  --max-instances=3

Responde Y para crear el repositorio de Docker de Artifact Registry.

Deploying from source requires an Artifact Registry Docker repository to store built containers. A repository named [cloud-run-source-deploy] in 
region [us-central1] will be created.

Do you want to continue (Y/n)?  y

Pídele a Gemini que explique el comando:

What does this command do?

gcloud run deploy devai-api \
  --source=. \
  --region="$LOCATION" \
  --allow-unauthenticated \
  --service-account vertex-client \
  --set-env-vars PROJECT_ID="$PROJECT_ID" \
  --set-env-vars LOCATION="$LOCATION" \
  --set-env-vars GITLAB_URL="$GITLAB_URL" \
  --set-env-vars GITLAB_REPOSITORY="$GITLAB_REPOSITORY" \
  --set-env-vars GITLAB_BRANCH="$GITLAB_BRANCH" \
  --set-env-vars GITLAB_BASE_BRANCH="$GITLAB_BASE_BRANCH" \
  --set-env-vars JIRA_USERNAME="$JIRA_USERNAME" \
  --set-env-vars JIRA_INSTANCE_URL="$JIRA_INSTANCE_URL" \
  --set-env-vars JIRA_PROJECT_KEY="$JIRA_PROJECT_KEY" \
  --set-env-vars JIRA_CLOUD="$JIRA_CLOUD" \
  --set-env-vars LANGCHAIN_TRACING_V2="$LANGCHAIN_TRACING_V2" \
  --update-secrets="LANGCHAIN_API_KEY=LANGCHAIN_API_KEY:latest" \
  --update-secrets="GITLAB_PERSONAL_ACCESS_TOKEN=GITLAB_PERSONAL_ACCESS_TOKEN:latest" \
  --update-secrets="JIRA_API_TOKEN=JIRA_API_TOKEN:latest" \
  --min-instances=1 \
  --max-instances=3

34ed504e0bcf697b.png

Revisa el flujo de gcloud run deploy SERVICE_NAME --source=. a continuación. Obtén más información.

5c122a89dd11822e.png

En segundo plano, este comando usa buildpacks y Cloud Build de Google Cloud para compilar automáticamente imágenes de contenedor a partir del código fuente sin tener que instalar Docker en tu máquina ni configurar los paquetes de compilación o Cloud Build. Es decir, el comando único descrito anteriormente hace lo que requeriría el uso de los comandos gcloud builds submit y gcloud run deploy.

Si proporcionaste un Dockerfile(como lo hicimos en este repositorio), Cloud Build lo usará para compilar imágenes de contenedor en lugar de depender de los paquetes de compilación para detectar y compilar imágenes de contenedor automáticamente. Para obtener más información sobre los paquetes de compilación, consulta la documentación.

Revisa los registros de Cloud Build en Console.

Revisa la imagen de Docker creada en Artifact Registry.

Revisa los detalles de la instancia de Cloud Run en la consola de Cloud.

Ejecuta el comando curl para probar el extremo.

curl -X POST \
   
-H "Content-Type: application/json" \
   
-d '{"prompt": "PROJECT-100"}' \
   $
(gcloud  run services list --filter="(devai-api)" --format="value(URL)")/generate

La respuesta estará en formato Markdown. Se muestra en modo de vista previa para mejorar la legibilidad.

bda86deaa1c449a8.png

7. Vertex AI Agent Builder

Busca y abre "Agent Builder".

d189f2069d7bc7f6.png

Activa las APIs:

4bf2b240bd51db8.png

Crea una app de agente conversacional:

9ee179dbcca38234.png

Habilita la API de Dialogflow:

75f2fd509c16ab88.png

Selecciona tu proyecto:

bf6d60bebab949fe.png

Haz clic en "Crear agente":

42332fe32af5a74e.png

Selecciona “Crea tu propio plan”.

583c747540ce3217.png

Escribe "Agente" en Nombre visible y haz clic en "Crear".

e0056adc2f8af87.png

Establece el nombre de la guía:

Agent

Establecer objetivo:

Help user with questions about JIRA project

Instrucciones de configuración:

- Greet the users, then ask how you can help them today.
- Summarize the user's request and ask them to confirm that you understood correctly.
  - If necessary, seek clarifying details.
- Thank the user for their business and say goodbye.

Haz clic en "Guardar":

bb2569de77cd1f06.png

Prueba el agente con el chat del simulador que se encuentra a la derecha:

7477cf320aaec22.png

66a7569835ebc7e7.png

Coloca el cursor sobre el ícono de llave a la izquierda. Abre el menú Herramientas y crea una nueva herramienta:

ff635e2d135ea6d8.png

Selecciona OpenAPI en el menú desplegable Tipo.

Establece el nombre de la herramienta:

jira-project-status

Descripción del conjunto:

Provides JIRA project status

Establece el esquema (YAML): reemplaza TU URL DE CLOUD RUN. Cambia de pestaña y verifica la salida de la consola para la URL del servicio de Cloud Run.

openapi: 3.0.0
info:
 title: CR API
 version: 1.0.0
 description: >-
   This is the OpenAPI specification of a service.
servers:
 - url: 'https://YOUR CLOUD RUN URL'
paths:

 /generate:
   post:
     summary: Request impl
     operationId: generate
     requestBody:
       description: Request impl
       required: true
       content:
         application/json:
           schema:
             $ref: '#/components/schemas/Prompt'
     responses:
       '200':
         description: Generated
         content:
           application/json:
             schema:
               $ref: '#/components/schemas/ProjectStatus'
                 
components:
 schemas:
   Prompt:
     type: object
     required:
       - prompt
     properties:
       prompt:
         type: string
   ProjectStatus:
     type: object
     required:
       - message
     properties:
       message:
         type: string

Guarda la configuración de la herramienta:

ae78c21f48754d7a.png

Para volver a la configuración del agente, selecciona "Guías de implementación" en el menú de la izquierda y actualiza las instrucciones para usar la herramienta:

Agrega instrucciones para usar la nueva herramienta y haz clic en “Guardar”:

- Use ${TOOL: jira-project-status} to help the user with JIRA project status.

4dabf135b37b044b.png

Cambia a la pestaña "Ejemplos" y agrega un ejemplo nuevo:

a74004679865ab6e.png

Establece el nombre visible:

jira-project-flow

Con el menú de la parte inferior, modela la conversación entre el usuario y el agente:

Ejemplo del procedimiento:

Respuesta del agente: ¿Cuál es el ID del proyecto?

Entrada del usuario: TEST-PROJECT-100

Uso de la herramienta: jira-project-status

Respuesta del agente: Detalles del estado del proyecto.

6d54f90f1dc630fc.png

Usa la siguiente referencia para crear el ejemplo.

c80eef4210256e5a.png

5affaee4cd54616e.png

Haz clic en Guardar. Regresa al simulador de agentes y prueba el flujo. Restablece las conversaciones existentes.

f96e7f711561e559.png

85d0e12acf682357.png

¡Felicitaciones! Cuando integras herramientas vinculadas a la API implementada en Cloud Run, le otorgas al agente la capacidad de realizar acciones.

695f18b4e5f81de8.png

Revisa las prácticas recomendadas para los agentes de Vertex AI.

Revisa la configuración del agente disponible

  • Configuración de registro: Habilita Cloud Logging
  • Integración de Git: La integración de Git te permite enviar y extraer tu agente desde un repositorio de Git.
  • Selección de modelos generativos
  • Límites de tokens(entrada y salida)

f914db1d8a5d5447.png

Revisa los controles del simulador de agentes:

d1c4712603d4a8a2.png

8. Integración de Slack

Abre el menú Integrations y haz clic en “Connect” en la tarjeta de Slack.

6fc0ad95c28cb6c8.png

e7ee0826668bfa2b.png

b29574fd2a0f9725.png

Abre el vínculo y crea una app de Slack nueva en https://api.slack.com/apps.

cbf13edc1b284899.png

Selecciona una opción de "Manifiesto":

7721feb295693ea2.png

Elige un espacio de trabajo para desarrollar tu app

99a3d5b37cdf8f76.png

Cambia a YAML y pega este manifiesto:

display_information:
  name: Agent
  description: Agent
  background_color: "#1148b8"
features:
  app_home:
    home_tab_enabled: false
    messages_tab_enabled: true
    messages_tab_read_only_enabled: false
  bot_user:
    display_name: Agent
    always_online: true
oauth_config:
  scopes:
    bot:
      - app_mentions:read
      - chat:write
      - im:history
      - im:read
      - im:write
      - incoming-webhook
settings:
  event_subscriptions:
    request_url: https://dialogflow-slack-4vnhuutqka-uc.a.run.app
    bot_events:
      - app_mention
      - message.im
  org_deploy_enabled: false
  socket_mode_enabled: false
  token_rotation_enabled: false

Haz clic en "Crear":

5f0b3d2c44022eb9.png

Instalar en Workspace:

aa1c2ea1b700c838.png

Selecciona el canal "#general" y haz clic en "Permitir".

18eba659946fc65f.png

En "Información básica / Credenciales de la app", copia "Secreto de firma" y configúralo en la integración de Slack del agente como valor del campo "Token de firma".

31d62babb57e523d.png

bd9f7e3be3b9ea4e.png

Abre "OAuth y permisos", copia "Token de OAuth del usuario bot" y configúralo en la integración de Slack del agente como valor del campo "Token de acceso".

e74c7e003c31258.png

Establece los campos obligatorios y haz clic en "Iniciar".

El valor de "Token de acceso" del agente es "Token de OAuth del usuario bot" de Slack.

El valor de "Signing Token" del agente es "Signing Secret" de Slack.

8ea9f6856efa62cf.png

7e71e37750fd063a.png

Copia "URL de webhook" y vuelve a la configuración de la app de Slack.

Abre la sección "Event Subscriptions" y pega la URL.

a1e7271934c714d9.png

Guarda los cambios.

e6d9b43b3787b6e7.png

Abre "Slack" y agrega un agente escribiendo "@Agent".

Por ejemplo, agregar una app con el nombre "@CX".

72313066707f947b.png

63becbd80824f8d8.png

c98e193062b096f0.png

Pídele al agente un resumen del proyecto de JIRA.

6edfdb74760548ad.png

¡Felicitaciones! El agente se integró correctamente en el espacio de trabajo de Slack.

e1a792e199d697c7.png

9. Preguntas y respuestas sobre documentos PDF

En esta sección, se describe cómo establecer un almacén de datos con un documento PDF y vincularlo al agente, lo que habilita la funcionalidad de preguntas y respuestas según el contenido del documento.

Crea un bucket de Cloud Storage

Abre Cloud Shell: https://shell.cloud.google.com/

Establece el nombre del bucket con los últimos 5 dígitos de tu proyecto de GCP. Ejemplo: pdf-docs-3dw21

BUCKET_NAME=pdf-docs-LAST-5-DIGITS-OF-YOUR-PROJECT

Crea un bucket y sube un documento PDF.

gcloud storage buckets create gs://$BUCKET_NAME \
   
--location=us \
   
--default-storage-class=STANDARD \
   
--no-public-access-prevention \
   
--uniform-bucket-level-access

wget https
://services.google.com/fh/files/misc/exec_guide_gen_ai.pdf

gsutil cp exec_guide_gen_ai
.pdf gs://$BUCKET_NAME

Configuración del almacén de datos

Regresa a la Consola del agente, abre "Agent", desplázate hacia abajo y haz clic en "+ Data store".

9a5e4d6d1e040b86.png

Usa los siguientes valores:

Nombre de la herramienta: pdf-docs

Tipo: Data store

Descripción: pdf-docs

Haz clic en "Save".

60096b1c597347fa.png

Haz clic en "Add data stores" en la parte inferior de la página. Luego, haz clic en "Create new data store".

abb9e513ac905e75.png

Selecciona "Cloud Storage" como fuente de datos.

Selecciona: Unstructured documents

Selecciona tu bucket o carpeta de GCS.

42dec238c1d0ac2f.png

Selecciona "us" para la ubicación del almacén de datos.

En el nombre del almacén de datos, escribe: "pdf-docs"

Selecciona "Digital parser" en el menú desplegable.

Habilita la fragmentación avanzada.

Habilita los encabezados de principales en los fragmentos.

Haz clic en “Create”.

1a5222b86ee6c58e.png

3119b5fec43c9294.png

Haz clic en el almacén de datos y revisa Documentos, Actividad y Configuración de procesamiento.

872d9142615e90c9.png

La importación tardará entre 5 y 10 minutos en completarse.

d9739a4af2244e03.png

Opciones de análisis y división

Puedes controlar el análisis de contenido de las siguientes maneras:

  • Analizador digital. El analizador digital está activado de forma predeterminada para todos los tipos de archivos, a menos que se especifique un tipo de analizador diferente. El analizador digital procesa los documentos transferidos si no se especifica otro analizador predeterminado para el almacén de datos o si el analizador especificado no admite el tipo de archivo de un documento transferido.
  • Análisis de OCR para archivos PDF Versión preliminar pública. Si planeas subir archivos PDF escaneados o con texto dentro de imágenes, puedes activar el analizador de OCR para mejorar el indexado de PDF. Consulta Acerca del análisis de OCR para archivos PDF.
  • Analizador de diseño. Activa el analizador de diseño para archivos HTML, PDF o DOCX si planeas usar Vertex AI Search para RAG. Consulta Cómo dividir documentos para RAG para obtener información sobre este analizador y cómo activarlo.

Obtén más información sobre el análisis y la fragmentación de documentos.

Configuración de herramientas

Regresa a la pantalla de configuración de la herramienta del agente y actualiza los almacenes de datos disponibles.

Selecciona el almacén de datos que acabas de crear y haz clic en "Confirm".

2922f7d9bdb7b2bc.png

Configura la conexión a tierra.

Escribe "Google Cloud" para el nombre de la empresa.

Configuración de la carga útil: Marca "Include snippets in Conversational Messenger response payload". Establece el valor en 5.

Haga clic en "Guardar".

484e99caa7d1bc07.png

Configuración de las instrucciones del agente

Regresa a la configuración del agente.

Agrega una instrucción nueva:

- Provide detailed answer to users questions about the exec guide to gen ai using information in the ${TOOL:pdf-docs}

f6d27e58b68f9f7.png

Guarda la configuración.

Crea un ejemplo para la herramienta PDF-Docs

Cambia a la pestaña Ejemplos. Crear un ejemplo nuevo: Guide to generative AI

Con las acciones "+":

ee4f85ba3f47fda0.png

Agrega "Entrada del usuario":

What are the main capabilities for generative AI?

Agrega "Uso de herramientas".

  • Herramienta y acción: "pdf-docs"

Entrada (requestBody)

{
 
"query": "Main capabilities for generative AI",
 
"filter": "",
 
"userMetadata": {},
 
"fallback": ""
}

Resultado de la herramienta:

{
 
"answer": "Detailed answer about main capabilities for generative AI",
 
"snippets": [
   
{
     
"uri": "https://storage.cloud.google.com/pdf-docs-49ca4/exec_guide_gen_ai.pdf",
     
"text": "Detailed answer about main capabilities",
     
"title": "exec_guide_gen_ai"
   
}
 
]
}

Se agregó "Respuesta del agente"

Detailed answer about main capabilities. 

https
://storage.cloud.google.com/pdf-docs-49ca4/exec_guide_gen_ai.pdf

Ejemplo configurado:

d1da4c1d18709ea6.png

Configuración de invocación de herramientas:

a0d47a9dc04bb2f1.png

Cambia al simulador para probar la configuración.

Pregunta:

What are the 10 steps in the exec guide?

e682480a959125bc.png

Selecciona "Agent" en el menú desplegable Invocaciones y haz clic en "Save as example".

582759df60b9a342.png

Proporciona un nombre "user-question-flow".

Establece el resumen: "Agent helped user answer question based on the pdf document" y haz clic en Guardar.

Dale formato a la respuesta del agente y, luego, incluye el vínculo al documento PDF desde la sección de salida de la herramienta.

6ba5011ed26793f3.png

Guarda el ejemplo.

Regresa al simulador y haz clic en "Replay conversation". Verifica el formato de respuesta actualizado. Si ves un error después de guardar el ejemplo, es posible que debas actualizar la ventana del navegador y reiniciar la conversación enviando el mensaje de nuevo:

What are the 10 steps in the exec guide?

51698c5f1fbd2770.png

Haz otra pregunta:

What are the main capabilities in the exec guide?

7b636f489c05a13.png

Documento PDF de origen

5b3e6d2ceda99247.png

Pregunta:

What should I consider when evaluating projects?

1155edfbffcd14b2.png

Documento PDF de origen

57a0d331aa91f04b.png

Pregunta:

What are the priority use cases in Retail and CPG in the exec guide?

92264121fc8f06e.png

Documento PDF de origen

b4d07e6e7d9adc00.png

¡Felicitaciones! Ahora, el agente puede proporcionar respuestas fundamentadas en los documentos PDF.

197cf1ae70663fae.png

10. Agentes compilados previamente

A continuación, explorarás los agentes compilados previamente en el menú de la izquierda.

de49672bbb8112fd.png

Selecciona uno de los agentes y, luego, instálalo. Explora la configuración, las instrucciones y las herramientas del agente.

c2f1808c30d4c17b.png

11. ¡Felicitaciones!

¡Felicitaciones! Completaste el lab.

Temas abordados:

  • Cómo crear e implementar agentes conversacionales
  • Cómo agregar una herramienta para el agente respaldado por la aplicación de Cloud Run
  • Cómo integrar el agente en el espacio de trabajo de Slack
  • Cómo configurar el almacén de datos para preguntas y respuestas en documentos PDF

¿Qué sigue?

Limpia

Para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos usados en este instructivo, borra el proyecto que contiene los recursos o conserva el proyecto y borra los recursos individuales.

Borra el proyecto

La manera más fácil de eliminar la facturación es borrar el proyecto que creaste para el instructivo.

©2024 Google LLC Todos los derechos reservados. Google y el logotipo de Google son marcas de Google LLC. El resto de los nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que están asociados.