Utilizza Procurement Document AI per analizzare le fatture utilizzando AI Platform Notebooks

1. Panoramica

c65b9ae04aa1853.png

Che cos'è Procurement Document AI?

Ogni anno, le aziende gestiscono grandi pipeline di approvvigionamento, tra cui migliaia di fatture, ricevute e altri documenti correlati. Utilizza Procurement DocAI per elaborare in modo intelligente i "dati oscuri", come PDF, immagini e moduli scritti a mano, per ridurre il sovraccarico manuale del ciclo di vita dell'approvvigionamento. Automatizza l'acquisizione di dati di approvvigionamento su larga scala trasformando documenti non strutturati come fatture e scontrini in dati strutturati per aumentare l'efficienza operativa, migliorare la customer experience e acquisire informazioni per il processo decisionale.

In questo codelab, vedremo come configurare la piattaforma Document AI, elaborare una fattura di esempio, estrarre e visualizzare le entità in un notebook di AI Platform.

Cosa imparerai a fare

  • Come iniziare a utilizzare la piattaforma Document AI
  • Estrarre le entità schematizzate utilizzando la soluzione Procurement DocAI
  • Creare e personalizzare un'istanza di notebook di AI Platform

Che cosa ti serve

  • Un progetto Google Cloud
  • Un browser, ad esempio Chrome o Firefox
  • Conoscenza di Python 3

Sondaggio

Come utilizzerai questo tutorial?

Lo leggerò solo Lo leggerò e completerò gli esercizi

Come valuteresti la tua esperienza con Python?

Principiante Intermedio Esperto

Come valuteresti la tua esperienza con l'utilizzo dei servizi Google Cloud?

Principiante Intermedio Esperto

2. Configurazione e requisiti

Configurazione dell'ambiente autonomo

  1. Accedi a Cloud Console e crea un nuovo progetto o riutilizzane uno esistente. (Se non hai già un account Gmail o Google Workspace, devi crearne uno.)

Ricorda l'ID progetto, un nome univoco tra tutti i progetti Google Cloud. (Il nome sopra è già stato utilizzato e non funzionerà per te, ci dispiace!). Dovrai fornire questo ID in un secondo momento come PROJECT_ID.

  1. Dopodiché, devi abilitare la fatturazione in Cloud Console per utilizzare le risorse Google Cloud.

Assicurati di seguire le istruzioni nella sezione "Eseguire la pulizia". La sezione ti consiglia come arrestare le risorse in modo che non vengano addebitati costi di fatturazione al termine di questo tutorial. I nuovi utenti di Google Cloud hanno diritto al programma di prova senza costi di 300$.

3. Abilitare l'API Cloud Document AI

Prima di poter iniziare a utilizzare Document AI, devi abilitare l'API. Apri Cloud Console nel browser.

  1. Fai clic sul menu di navigazione ☰ > API e servizi > Libreria. API Search
  2. Cerca "API Document AI", quindi fai clic su Abilita per utilizzare l'API nel tuo progetto Google Cloud

4. Creare e testare un processore

Per questo tutorial, devi prima creare un'istanza del processore Analizzatore sintattico dei moduli da utilizzare nella piattaforma Document AI.

  1. Nella console, vai alla panoramica della piattaforma Document AI
  2. Fai clic su Crea processore e seleziona Analizzatore sintattico delle fattureProcessori
  3. Specifica un nome del processore e seleziona la regione dall'elenco.
  4. Fai clic su Crea per creare il processore
  5. Copia l'ID del processore. Lo dovrai utilizzare nel tuo codice in un secondo momento.

(Facoltativo) Puoi testare il processore nella console caricando un documento. Fai clic su Carica documento e seleziona un modulo da analizzare. Se non ne hai uno disponibile, puoi scaricare e utilizzare questo modulo di esempio.

Fattura

L'output dovrebbe essere simile a questo: Fattura analizzata

5. Creare un notebook di AI Platform

Vai alla sezione Notebook di AI Platform di Cloud Console e fai clic su Nuova istanza. Quindi seleziona il tipo di istanza Python più recente:

a81c82876c6c16f9.png

Utilizza le opzioni predefinite e fai clic su Crea. Una volta creata l'istanza, seleziona Apri JupyterLab.

6. Recuperare il codice di esempio

Importa direttamente il codice campione dal repository GitHub dei notebook di Document AI Github Repo. Nel notebook, vai a Git > Clona un repository nel menu in alto oppure fai clic sull'icona Git: Git

Incolla il seguente URL del repository:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Una volta clonato il repository, fai clic sulla directory documentai-notebooks/specialized/ e apri il notebook specialized_form_parser.ipynb. Trova la cella in cui vengono dichiarati l'ID progetto Google Cloud e l'ID processore Document AI.

vars

Incolla l'ID progetto Google Cloud e l'ID processore del passaggio 4. Salva il notebook.

7. Estrarre e visualizzare le entità

Ora puoi estrarre le entità schematizzate dalle fatture e i relativi punteggi di attendibilità. L'oggetto di risposta Document contiene un elenco di entità. Per saperne di più sulle entità schematizzate, consulta la guida rapida all'analizzatore sintattico delle fatture quickstart.

Esegui tutte le celle del notebook e scorri verso il basso fino all'output tabulare. Il codice precedente scorre ogni entità e crea un DataFrame Pandas con i risultati. tabella

Ora scorri verso il basso fino al componente di visualizzazione. L'oggetto di risposta Document contiene informazioni sul layout spaziale per ogni pagina del documento. Di seguito, le informazioni sul layout di ogni campo del modulo vengono utilizzate per disegnare i riquadri di delimitazione sull'immagine. Questi dati possono essere utilizzati per l'integrazione di Document AI in un'applicazione frontend.

polys

8. Complimenti

Complimenti, hai utilizzato correttamente la soluzione Procurement Document AI per estrarre i dati da una fattura. Ti invitiamo a provare altri tipi di moduli.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, puoi arrestare il notebook o eliminare il progetto Google Cloud.

Arrestare l'istanza di notebook di AI Platform

Segui queste istruzioni per arrestare un'istanza di notebook di AI Platform.

Elimina il progetto

Il modo più semplice per eliminare la fatturazione è eliminare il progetto creato per il tutorial.

Per eliminare il progetto:

  1. Nella console di Google Cloud, vai alla pagina Progetti. Pagina dei progetti
  2. Nell'elenco dei progetti, seleziona quello da eliminare e fai clic su Elimina.
  3. Nella finestra di dialogo, digita l'ID progetto, quindi fai clic su Chiudi per eliminare il progetto.

Scopri di più

Licenza

Questo lavoro è concesso in licenza ai sensi di una licenza Creative Commons Attribution 2.0 Generic.