Use o Procurement Document AI para analisar suas faturas com o AI Platform Notebooks

Use a Document AI para processar suas faturas com o AI Platform Notebooks

Sobre este codelab

subjectÚltimo jan. 24, 2022 atualizado
account_circleEscrito por Anu Srivastava

1. Visão geral

c65b9ae04aa1853.png

O que é a Document AI para compras?

As empresas gerenciam grandes pipelines de compras, incluindo milhares de faturas, recibos e outros documentos relacionados a cada ano. Use o Procurement DocAI para processar de maneira inteligente seus "dados obscuros", como PDFs, imagens e formulários manuscritos, e reduzir a sobrecarga manual do ciclo de compras. Automatize a captura de dados de compras em escala transformando documentos, como faturas e recibos, em dados estruturados para aumentar a eficiência operacional, melhorar a experiência do cliente e tomar decisões fundamentadas em análises métricas.

Neste codelab, vamos mostrar como configurar a Document AI Platform, processar uma fatura de exemplo, extrair e visualizar entidades em um notebook da AI Platform.

O que você vai aprender

  • Como começar a usar a plataforma Document AI
  • Extrair entidades esquematizadas usando a solução de Document AI para compras
  • Criar e personalizar uma instância do AI Platform Notebooks

O que é necessário

  • Um projeto do Google Cloud
  • Um navegador, como o Chrome ou o Firefox
  • Conhecimento sobre o Python 3

Pesquisa

Como você vai usar este tutorial?

Como você classificaria sua experiência com Python?

Como você classificaria sua experiência de uso dos serviços do Google Cloud?

2. Configuração e requisitos

Configuração de ambiente autoguiada

  1. Faça login no Console do Cloud e crie um novo projeto ou reutilize um existente. Crie uma se você ainda não tiver uma conta do Gmail ou do G Suite.

Lembre-se do ID do projeto, um nome exclusivo em todos os projetos do Google Cloud. (seu nome acima já foi escolhido e não funcionará para você). Você precisará fornecer esse ID posteriormente como PROJECT_ID.

  1. Em seguida, é necessário ativar o faturamento no console do Cloud para usar os recursos do Google Cloud.

Siga todas as instruções da seção "Limpeza". Na seção, você aprende a encerrar recursos para não incorrer em cobranças além deste tutorial. Novos usuários do Google Cloud estão qualificados para o programa de US$ 300 de avaliação sem custos.

3. Ativar a API Document AI do Cloud

Antes de começar a usar a Document AI, você precisa ativar a API. Abra o Console do Cloud no navegador.

  1. Clique em Menu de navegação > APIs e serviços > Biblioteca. API Search
  2. Pesquise por "API Document AI" e clique em Ativar para usar a API no seu projeto do Google Cloud

4. Crie e teste um processador

Primeiro, você precisa criar uma instância do processador Form Parser para usar no Document AI Platform para este tutorial.

  1. No console, navegue até a Visão geral do Document AI Platform.
  2. Clique em Criar processador e selecione Invoice ParserProcessadores
  3. Especifique um nome de processador e selecione sua região na lista.
  4. Clique em Criar para criar seu processador.
  5. Copie o ID do processador. Você precisará usá-la em seu código mais tarde.

(Opcional) É possível testar o processador no console fazendo upload de um documento. Clique em Fazer upload do documento e selecione um formulário para analisar. É possível fazer o download e usar este formulário de exemplo se você não tiver um disponível.

Fatura

A saída será semelhante a esta: Fatura analisada

5. Crie um notebook do AI Platform

Acesse a seção "Notebooks do AI Platform" do console do Google Cloud e clique em Nova instância. Em seguida, selecione o tipo de instância Python mais recente:

a81c82876c6c16f9.png

Use as opções padrão e clique em Criar. Quando a instância for criada, selecione Abrir o JupyterLab.

6. Acesse o código de amostra

Importe o código de exemplo diretamente do repositório do GitHub dos notebooks da Document AI. No notebook, acesse Git > Clone a repository no menu superior ou clique no ícone do Git: Git

Cole o seguinte URL do repositório:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Depois que o repositório for clonado, clique no diretório documentai-notebooks/specialized/ e abra o notebook specialized_form_parser.ipynb. Encontre a célula em que os IDs do projeto do GCP e do processador da Document AI são declarados.

vars

Cole o ID do projeto do GCP e o ID do processador da etapa 4. Salve o notebook.

7. Extrair e visualizar as entidades

Agora você pode extrair as entidades esquematizadas das faturas e as pontuações de confiança correspondentes. O objeto de resposta Document contém uma lista de entidades. Para saber mais sobre as entidades esquematizadas, leia o Guia de início rápido do Analisador de faturas.

Execute todas as células no notebook e role para baixo até a saída tabular. O código anterior itera por cada entidade e cria um DataFrame do Pandas com os resultados. tabela

Agora role para baixo até o componente de visualização. A resposta do objeto Document contém informações de layout espacial para cada página do documento. Abaixo, as informações de layout em cada campo do formulário são usadas para desenhar caixas delimitadoras na imagem. Esses dados podem ser usados para integrar a Document AI a um aplicativo de front-end.

poli

8. Parabéns

Parabéns! Você usou a solução de IA de documentos de compras para extrair dados de uma fatura. Incentivamos você a testar outros tipos de formulário.

Limpeza

Para evitar cobranças na sua conta do Google Cloud pelos recursos usados neste tutorial, desligue o notebook ou exclua o projeto do GCP.

Como encerrar a instância do AI Platform Notebooks

Siga estas instruções para encerrar uma instância do AI Platform Notebooks.

Excluir o projeto

O jeito mais fácil de evitar cobranças é excluindo o projeto que você criou para este tutorial.

Para excluir o projeto:

  1. No Console do GCP, acesse a página Projetos. Página "Projetos"
  2. Na lista de projetos, selecione um e clique em Excluir.
  3. Na caixa de diálogo, digite o ID do projeto e clique em Encerrar para excluir o projeto.

Saiba mais

Licença

Este conteúdo está sob a licença Atribuição 2.0 Genérica da Creative Commons.