Document AI: Con interacción humana

1. Introducción

La API de Document AI es una solución de comprensión de documentos que toma datos no estructurados, como documentos, correos electrónicos, etc., y permite que los datos sean más fáciles de comprender, analizar y consumir.

Con la revisión humana, puedes lograr una mayor precisión en el procesamiento de documentos con la garantía de la revisión humana. La revisión humana puede aumentar la precisión y ayudar a las empresas a evaluar las predicciones con herramientas diseñadas específicamente para permitir esas revisiones. En este lab, configurarás y probarás un procesador de gastos con revisión humana para validar los resultados del procesador con las herramientas de administración y configuración de humanos en el circuito.

Requisitos previos

Este codelab se basa en contenido presentado en otros codelabs de Document AI.

Recomendamos que completes los siguientes codelabs antes de continuar.

Qué aprenderás

  • Configura la revisión manual para un procesador.
  • Crea un grupo de recursos de usuarios para la revisión humana.
  • Crea una tarea de revisión manual de prueba.
  • Asigna una tarea de revisión manual a un usuario.
  • Completar una revisión humana de un documento

Requisitos

  • Un proyecto de Google Cloud
  • Un navegador, como Chrome o Firefox
  • Conocimiento de Python 3

2. Cómo prepararte

En este codelab, se supone que ya completaste los pasos de configuración de Document AI que se indican en el codelab de introducción.

Completa estos pasos antes de continuar:

También deberás habilitar la API de Vertex AI.

  1. Con la barra de búsqueda en la parte superior de la consola, busca “API de Vertex AI” y, luego, haz clic en Habilitar para usar la API en tu proyecto de Google Cloud.
  2. Como alternativa, la API se puede habilitar con el siguiente comando gcloud.
gcloud services enable aiplatform.googleapis.com

3. Crea un procesador

Primero, debes crear una instancia del procesador de gastos para usarla en este lab.

  1. En la consola, navega a la Descripción general de la plataforma de Document AI.
  2. Haz clic en Crear procesador, desplázate hasta Especializado y selecciona Analizador de gastos.
  3. Asígnale el nombre codelab-expense-parser (o un nombre que no vayas a olvidar) y selecciona la región más cercana de la lista.
  4. Haz clic en Crear para crear tu procesador.
  5. Copia el ID del procesador. Debes usarlo en el código más adelante.
  6. En Cloud Shell, crea un bucket de almacenamiento con PROJECT_ID-hitl-results como nombre:
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
  1. Vincula tu cuenta de usuario al rol de administrador de IAM de Vertex AI en el proyecto del lab.
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin

4. Configura la interacción humana

En esta tarea, configurarás la revisión humana para el procesador de gastos que creaste anteriormente.

  1. En la consola, abre el menú de navegación y selecciona Document AI.
  2. Haz clic en IA con interacción humana. HITLMenu
  3. Haz clic en codelab-expense-parser para abrir la página de revisión manual del procesador.
  4. Haz clic en Configurar la interacción humana.

ConfigureHITL

  1. Selecciona Filtro a nivel de documento.
  2. Establece el control deslizante Umbral de confianza (%) en 50%.
  3. Deja la opción Especialistas configurada como Usar mis propios especialistas.

HITLFilters

  1. Haz clic en el cuadro desplegable Grupo de especialistas y, luego, en NUEVO GRUPO DE ESPECIALISTAS.
  2. En Nombre del grupo, ingresa Codelab HITL Pool en el diálogo Nuevo grupo de especialistas.
  3. Ingresa tu dirección de correo electrónico personal para los administradores del grupo y los especialistas.
  4. Haz clic en Crear grupo.

HITLSpecialistPool

Este proceso tardará unos minutos en completarse. Deberías recibir un correo electrónico de Vertex AI noreply-vertex@google.com.

  1. Deja desmarcada la casilla de verificación Asignación automática.
  2. Haz clic en la casilla de verificación de la sección Confirmar cargos.
  3. Haz clic en Ubicación de las instrucciones y copia esta ubicación de almacenamiento: NO incluyas el prefijo gs:// en la ruta de acceso.
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
  1. En Ubicación de los resultados, haz clic en Explorar y selecciona el bucket de Cloud Storage que creaste antes.
  2. Haz clic en Seleccionar.
  3. Haz clic en Guardar configuración.

La consola ahora mostrará el mensaje Configuring human-in-the-loop y tardará unos minutos en completarse.

HITLLoading

  1. Cuando se complete la configuración, la consola te pedirá que habilites la interacción humana.
  • Haz clic en el botón de activación para habilitar.
  • Luego, haz clic en Habilitar en el cuadro de diálogo emergente.

HITLEnable

Sube un formulario de gastos de muestra

  1. Tenemos un formulario de muestra para usar en Google Cloud Storage. Puedes descargarlo con el botón o el comando que se indican a continuación:

gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
  1. Después de habilitar la revisión humana, haz clic en el botón Subir documento y busca el documento de muestra que acabas de descargar.
  2. Haz clic en Subir y espera a que se complete.

5. Asigna un elemento para su revisión manual

  1. En esta página, deberías ver vínculos a las consolas de Pool Manager y Specialist. Estos vínculos también aparecerán en un correo electrónico de Vertex AI noreply-vertex@google.com.
    • Deberían verse como https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks.
    • Haz clic en el vínculo de la consola de Administrador.

  1. Una vez que estés en la consola de Data Labeling, haz clic en el título de la pestaña Tareas para abrir la página de asignación de tareas.
  2. Haz clic en la casilla de verificación Sin asignar. Deberías ver que se muestra una entrada nueva en la fila de tareas codelab-expense-parser-P1.

imagen

  1. Selecciona codelab-expense-parser-P1.
  2. Haz clic en Administrar tarea.
  3. Ingresa tu correo electrónico personal en el cuadro de texto Incluir especialistas por correo electrónico y, luego, selecciónalo en la lista desplegable.
  4. Haz clic en Aplicar.

Ahora, en la pantalla, se muestra que la tarea está asignada a ti. Es posible que la propagación y la visibilidad tarden unos minutos.

imagen

  1. Selecciona el usuario nuevo y haz clic en el ícono de menú.
  2. Haz clic en Asignar a todas las tareas en el menú emergente que aparece.

imagen

  1. Haz clic en Confirmar cambios.
  2. Haz clic en Confirmar.

imagen

6. Realiza la tarea de revisión manual

  1. Regresa a la página de configuración de Human-in-the-Loop en Cloud Console.

Haz clic en el vínculo para visitar la consola de Specialist (trabajador). Se verá como https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx.

Se abrirá la consola del trabajador y se mostrará tu tarea nueva.

imagen

  1. Coloca el cursor sobre la línea de pedido que contiene Reunión con 4 m y haz clic en el ícono de editar (lápiz).
  2. Edita el valor para cambiar el texto a Reunión con Adam. Es posible que debas desplazarte hacia abajo en el cuadro de texto para ver el texto.
  3. Haz clic en Aplicar.
  4. Haz clic en el ícono de Confirmar (marca de verificación verde) para el siguiente elemento. imagen
  5. Haz clic en el ícono de Confirmar para las otras entidades destacadas.
  6. Haz clic en Enviar. La tarea de revisión se quitó de la fila de etiquetadores.

7. Ver tareas completadas

  1. Regresa a la consola del administrador.
  2. Haz clic en Tareas y selecciona En curso.imagen
  3. Haz clic en Especialistas.
  4. Selecciona tu dirección de correo electrónico.
  5. Haz clic en Administrar tarea.
  6. Selecciona expense-processor-P1 en los menús desplegables Select specialists working on specific tasks y Select tasks. Haz clic en Aplicar para cada selección. En el menú contextual de expense-processor-P1 que se te asignó, selecciona Ver especialistas.

imagen

Una vez que el etiquetador envíe la tarea de etiquetado, se actualizará la cantidad de tareas respondidas y el tiempo total empleado, pero los datos de esta vista pueden tardar unos minutos en aparecer.

  1. Cierra la ventana emergente de especialistas y ve a la pestaña Especialistas.
  2. Haz clic en el menú contextual de tu nombre de usuario y selecciona Ver tareas.

En esta vista, se muestra la lista de tareas del usuario, la cantidad de tareas completadas y el tiempo que tardó en completarlas, como se muestra a continuación:

imagen

8. Felicitaciones

Felicitaciones, usaste correctamente la IA con interacción humana de Document AI para configurar la revisión humana de los documentos procesados con un procesador de gastos de Document AI.

Haz limpieza

Para evitar que se generen cargos en tu cuenta de Google Cloud por los recursos que usaste en este instructivo, sigue estos pasos:

  • En la consola de Cloud, ve a la página Administrar recursos.
  • En la lista de proyectos, selecciona tu proyecto y haz clic en Borrar.
  • En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrarlo.

Más información

Sigue aprendiendo sobre Document AI con estos codelabs de seguimiento.

Recursos

Licencia

Este trabajo cuenta con una licencia Atribución 2.0 Genérica de Creative Commons.