1. Introdução
A API Document AI é uma solução para compreensão de dados não estruturados, como documentos, e-mails etc., e facilita o entendimento, a análise e o consumo desses dados.
Com a revisão humana, é possível alcançar uma precisão maior no processamento de documentos com a garantia da revisão humana. A revisão humana pode aumentar a precisão e ajudar as empresas a avaliar as previsões usando ferramentas específicas para permitir essas revisões. Neste laboratório, você vai configurar e testar um processador de despesas com revisão humana para validar os resultados do processador usando ferramentas de configuração e gerenciamento human-in-the-loop.
Pré-requisitos
Este codelab se baseia no conteúdo apresentado em outros codelabs da Document AI.
Recomendamos que você conclua os codelabs a seguir antes de continuar.
- Reconhecimento óptico de caracteres (OCR) com a Document AI (Python)
- Análise de formulário com a Document AI (Python)
- Processadores especializados com a Document AI (Python)
O que você vai aprender
- Configurar a revisão humana de um processador.
- Criar um pool de recursos do usuário para revisão humana.
- Crie uma tarefa de teste de revisão humana.
- Atribuir uma tarefa de revisão humana a um usuário.
- Concluir a revisão humana de um documento.
O que é necessário
2. Etapas da configuração
Este codelab parte do princípio de que você concluiu as etapas de configuração da Document AI listadas no Codelab básico.
Conclua as etapas a seguir antes de continuar:
- Inicie o Cloud Shell
- Ative a Document AI e APIs do Cloud Storage
- Instalar a biblioteca de cliente Python
Também é necessário ativar a API Vertex AI.
- Pesquise "API Vertex AI" na barra de pesquisa na parte de cima do console e clique em Ativar para usar a API no projeto do Google Cloud
- Como alternativa, a API pode ser ativada usando o seguinte comando
gcloud
.
gcloud services enable aiplatform.googleapis.com
3. Crie um processador
Primeiro, crie uma instância do processador de despesas para usar neste laboratório.
- No console, navegue até Visão geral da Document AI Platform.
- Clique em Criar processador, role para baixo até Especializado e selecione Analisador de despesas.
- Nomeie como
codelab-expense-parser
ou de outra maneira, desde que você se lembre. Em seguida, selecione a região mais próxima na lista. - Clique em Criar para criar seu processador.
- Copie o ID do processador. Você precisará usá-la em seu código mais tarde.
- No Cloud Shell, crie um bucket de armazenamento usando
PROJECT_ID-hitl-results
como nome:
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
- Vincule sua conta de usuário ao papel IAM de administrador da Vertex AI no projeto do laboratório.
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin
4. Configurar o human-in-the-loop
Nesta tarefa, você vai configurar a revisão humana do processador de despesas criado anteriormente.
- No console, abra o Menu de navegação e selecione Document AI.
- Clique em IA human-in-the-loop.
- Clique em
codelab-expense-parser
para abrir a página "Revisão humana" do processador. - Clique em Configurar human-in-the-loop.
- Selecione Filtro no nível do documento.
- Defina o controle deslizante da %do limite de confiança como 50%.
- Deixe a opção Especialistas definida como Usar meus próprios especialistas.
- Clique no menu suspenso Grupo de especialistas e NOVO POOL DE ESPECIALISTAS.
- Em Nome do pool, digite
Codelab HITL Pool
na caixa de diálogo Novo pool de especialistas. - Insira seu endereço de e-mail pessoal de Administradores de piscinas e Especialistas.
- Clique em Criar pool.
Esse processo leva alguns minutos. Você receberá um e-mail de Vertex AI noreply-vertex@google.com
.
- Deixe a caixa de seleção Atribuição automática desmarcada.
- Clique na caixa de seleção da seção Confirmar cobranças.
- Clique em Instructions location e copie neste local de armazenamento: - NÃO inclua o prefixo
gs://
no caminho.
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
- Em Local de resultados, clique em Procurar e selecione o bucket do Cloud Storage criado anteriormente.
- Clique em Selecionar.
- Clique em Save Configuration.
O console vai exibir a mensagem Configurando human-in-the-loop e levar alguns minutos para ser concluído.
- Quando a configuração for concluída, o console solicitará que você ative o human-in-the-loop.
- Clique no botão para ativar.
- Em seguida, clique em ATIVAR na caixa de diálogo pop-up.
Fazer upload de um exemplo de formulário de despesas
- Temos um formulário de amostra para ser usado armazenado no Google Cloud Storage. Para fazer o download, use o botão ou o comando abaixo:
gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
- Depois de ativar o human-in-the-loop, clique no botão Fazer upload de documento e procure o documento de amostra que você acabou de transferir por download.
- Clique em Fazer upload e aguarde a conclusão.
5. Atribuir um item para revisão humana
- Nessa página, você encontra links para os consoles do gerenciador de pools e do especialista. Esses links também vão aparecer no e-mail de
Vertex AI noreply-vertex@google.com
.- Eles devem ficar assim:
https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks
- Clique no link para o console do administrador.
- Eles devem ficar assim:
- No Console de rotulagem de dados, clique no título da guia Tarefas para abrir a página de atribuição de tarefas.
- Clique na caixa de seleção Não atribuídos. Você verá uma nova entrada listada na fila de tarefas codelab-expense-parser-P1.
- Selecione codelab-expense-parser-P1.
- Clique em Gerenciar atividade.
- Insira seu e-mail pessoal na caixa de texto Incluir especialistas por e-mail e selecione-o na lista suspensa.
- Clique em Aplicar.
A tela vai mostrar que a tarefa foi atribuída a você. Isso pode levar alguns minutos para se propagar e ficar visível.
- Selecione o novo usuário e clique no ícone de menu.
- Clique em Atribuir a todas as tarefas no menu pop-up que aparece.
- Clique em Confirmar alterações.
- Clique em Fazer commit.
6. Realizar a tarefa de revisão humana
- Volte para a página de configuração do human-in-the-loop no console do Cloud.
Clique no link para acessar o console do especialista (Worker). Ele terá esta aparência: https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx
.
O console do worker será aberto e lista a nova tarefa.
- Passe o cursor sobre o item de linha que contém Reunião com 4 min e clique no ícone de edição (lápis).
- Edite o valor para mudar o texto para Reunião com Adam. Talvez seja necessário rolar para baixo na caixa de texto para ver o texto.
- Clique em Aplicar.
- Clique no ícone Confirmar (marca de verificação verde) para o item abaixo.
- Clique no ícone Confirmar para as outras entidades destacadas.
- Clique em Enviar. A tarefa de revisão foi removida da fila de rotuladores.
7. Ver tarefas concluídas
- Volte ao console do administrador.
- Clique em Tarefas e selecione Em andamento
- Clique em Especialistas.
- Selecione seu endereço de e-mail.
- Clique em Gerenciar atividade.
- Selecione expense-processor-P1 no menu suspenso
Select specialists working on specific tasks
eSelect tasks
. Clique em Aplicar para cada seleção. No menu de contexto de expense-processor-P1 atribuído a você, selecione Ver especialistas.
Depois que a tarefa de rotulagem for enviada pelo rotulador, o número de tarefas respondidas e o tempo total gasto serão atualizados, mas os dados nesta visualização podem levar alguns minutos para aparecer.
- Feche o pop-up de especialistas e acesse a guia Especialistas.
- Clique no menu de contexto do seu nome de usuário e selecione Exibir tarefas.
Essa visualização mostra a lista de tarefas do usuário, os números de conclusão e o tempo gasto, conforme mostrado abaixo:
8. Parabéns
Parabéns, você usou corretamente o recurso human-in-the-loop da Document AI para configurar a revisão humana de documentos processados usando um processador de despesas da Document AI.
Limpeza
Para evitar cobranças dos recursos usados neste tutorial na conta do Google Cloud, siga estas etapas:
- No console do Cloud, acesse a página Gerenciar recursos.
- Na lista de projetos, selecione o projeto e clique em "Excluir".
- Na caixa de diálogo, digite o ID do projeto e clique em "Encerrar" para excluí-lo.
Saiba mais
Saiba mais sobre a Document AI com estes codelabs de acompanhamento.
Recursos
- O futuro dos documentos — Playlist do YouTube (em inglês)
- Documentação da Document AI
- Biblioteca de cliente Python da Document AI
- Amostras da Document AI
Licença
Este conteúdo está sob a licença Atribuição 2.0 Genérica da Creative Commons.