1. Introduzione
L'API Document AI è una soluzione di comprensione dei documenti che prende dati non strutturati, come documenti, email e così via, e li rende più facili da comprendere, analizzare e utilizzare.
Con la revisione umana puoi ottenere una maggiore precisione nell'elaborazione dei documenti con la garanzia di una revisione umana. La revisione umana può aumentare la precisione e aiuta le aziende a valutare le previsioni utilizzando strumenti appositamente progettati per consentire tali revisioni. In questo lab configurerai e testerai un processore di note spese utilizzando la revisione umana per convalidare i risultati del processore utilizzando gli strumenti di configurazione e gestione Human-in-the-Loop.
Prerequisiti
Questo codelab si basa sui contenuti presentati in altri codelab di Document AI.
Ti consigliamo di completare i seguenti Codelab prima di procedere.
- Riconoscimento ottico dei caratteri (OCR) con Document AI (Python)
- Analisi dei moduli con Document AI (Python)
- Processori specializzati con Document AI (Python)
Cosa imparerai a fare
- Configura la revisione umana per un processore.
- Crea un pool di risorse utente per la revisione umana.
- Crea un'attività di revisione umana di prova.
- Assegna a un utente un'attività di revisione da parte di persone fisiche.
- Completa una revisione umana di un documento.
Che cosa ti serve
2. Preparazione
Questo codelab presuppone che tu abbia completato i passaggi di configurazione di Document AI elencati nel codelab introduttivo.
Prima di procedere, completa i seguenti passaggi:
Dovrai anche abilitare l'API Vertex AI.
- Utilizzando la barra di ricerca nella parte superiore della console, cerca "API Vertex AI", quindi fai clic su Abilita per utilizzare l'API nel tuo progetto Google Cloud.
- In alternativa, l'API può essere abilitata utilizzando il seguente comando
gcloud.
gcloud services enable aiplatform.googleapis.com
3. Crea un processore
Per prima cosa, devi creare un'istanza di Expense Processor da utilizzare per questo lab.
- Nella console, vai alla panoramica della piattaforma Document AI.
- Fai clic su Crea processore, scorri verso il basso fino a Specializzato e seleziona Analizzatore sintattico delle note spese.
- Assegna il nome
codelab-expense-parser(o un altro nome che ricorderai) e seleziona la regione più vicina nell'elenco. - Fai clic su Crea per creare il processore.
- Copia l'ID processore. Lo dovrai utilizzare nel tuo codice in un secondo momento.
- In Cloud Shell, crea un bucket di archiviazione utilizzando
PROJECT_ID-hitl-resultscome nome:
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
- Associa il tuo account utente al ruolo Amministratore Vertex AI IAM nel progetto lab
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin
4. Configura human-in-the-loop
In questa attività configurerai la revisione umana per il processore di note spese che hai creato in precedenza.
- Nella console, apri il menu di navigazione e seleziona Document AI.
- Fai clic su AI human-in-the-loop.

- Fai clic su
codelab-expense-parserper aprire la pagina Revisione umana per il processore. - Fai clic su Configura human-in-the-loop.

- Seleziona Filtro a livello di documento.
- Imposta il cursore Soglia di confidenza % al 50%.
- Lascia l'opzione Esperti impostata su Utilizza i miei esperti.

- Fai clic nella casella del menu a discesa Pool di esperti e poi su NUOVO POOL DI ESPERTI.
- Per Nome pool, inserisci
Codelab HITL Poolnella finestra di dialogo Nuovo pool di esperti. - Inserisci il tuo indirizzo email personale per i gestori di pool e gli esperti.
- Fai clic su Crea pool.

Il completamento dell'operazione richiede alcuni minuti. Dovresti ricevere un'email da Vertex AI noreply-vertex@google.com.
- Lascia deselezionata la casella di controllo Assegnazione automatica.
- Seleziona la casella di controllo nella sezione Conferma addebiti.
- Fai clic su Posizione delle istruzioni e copia questa posizione di archiviazione: - NON includere il prefisso
gs://nel percorso
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
- In Posizione dei risultati, fai clic su Sfoglia e seleziona il bucket Cloud Storage creato in precedenza.
- Fai clic su Seleziona.
- Fai clic su Salva configurazione.
Ora nella console verrà visualizzato il messaggio Configurazione dell'intervento umano e l'operazione richiederà alcuni minuti.

- Al termine della configurazione, la console ti chiederà di attivare Human-in-the-Loop.
- Fai clic sul pulsante di attivazione/disattivazione per abilitarlo.
- Quindi fai clic su ATTIVA nella finestra di dialogo popup.

Carica un modulo di esempio per le note spese
- Abbiamo un modulo di esempio da utilizzare archiviato in Google Cloud Storage. Puoi scaricarlo con il pulsante o il comando riportato di seguito:
gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
- Dopo aver attivato l'intervento umano nel ciclo, fai clic sul pulsante Carica documento e cerca il documento di esempio appena scaricato.
- Fai clic su Carica e attendi il completamento.
5. Assegnare un elemento per la revisione umana
- In questa pagina dovresti visualizzare i link alle console del gestore di pool e dell'esperto. Questi link verranno visualizzati anche in un'email inviata da
Vertex AI noreply-vertex@google.com.- Dovrebbero avere un aspetto simile a questo:
https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks - Fai clic sul link alla console Manager.
- Dovrebbero avere un aspetto simile a questo:

- Una volta nella console Data Labeling, fai clic sul titolo della scheda Attività per aprire la pagina di assegnazione delle attività.
- Seleziona la casella di controllo Non assegnato. Dovresti vedere un nuovo elemento elencato nella coda di attività codelab-expense-parser-P1.

- Seleziona codelab-expense-parser-P1.
- Fai clic su Gestisci assegnazione.
- Inserisci il tuo indirizzo email personale nella casella di testo Includi specialisti via email, quindi selezionalo dall'elenco a discesa.
- Fai clic su Applica.
Il display ora mostra che l'attività è assegnata a te. Potresti notare che la propagazione e la visualizzazione potrebbero richiedere alcuni minuti.

- Seleziona il nuovo utente e fai clic sull'icona del menu.
- Fai clic su Assegna a tutte le attività dal menu popup visualizzato.

- Fai clic su Applica modifiche.
- Fai clic su Commit.

6. Esegui attività di revisione umana
- Torna alla pagina di configurazione di human-in-the-loop nella console Cloud.
Fai clic sul link per visitare la console Specialista (Worker). L'aspetto sarà simile a questo: https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx.
La console del lavoratore dovrebbe aprirsi e mostrare il nuovo task.

- Passa il mouse sopra l'elemento pubblicitario che contiene Riunione con 4m e fai clic sull'icona Modifica (a forma di matita).
- Modifica il valore in modo che il testo diventi Riunione con Adam. Potresti dover scorrere verso il basso nella casella di testo per visualizzare il testo.
- Fai clic su Applica.
- Fai clic sull'icona Conferma (segno di spunta verde) per l'elemento riportato di seguito.

- Fai clic sull'icona Conferma per le altre entità evidenziate.
- Fai clic su Invia. L'attività di revisione è stata rimossa dalla coda dell'etichettatore.
7. Visualizzare le attività completate
- Torna alla console del gestore.
- Fai clic su Attività e seleziona In corso
. - Fai clic su Specialisti.
- Seleziona il tuo indirizzo email.
- Fai clic su Gestisci assegnazione.
- Seleziona expense-processor-P1 dai menu a discesa
Select specialists working on specific taskseSelect tasks. Fai clic su Applica per ogni selezione. Nel menu contestuale per expense-processor-P1 che ti è stato assegnato, seleziona Visualizza esperti.

Una volta inviata l'attività di etichettatura dall'etichettatore, il numero di attività completate e il tempo totale impiegato verranno aggiornati, ma la visualizzazione dei dati potrebbe richiedere alcuni minuti.
- Chiudi il popup degli specialisti e visualizza la scheda Specialisti.
- Fai clic sul menu contestuale per il tuo nome utente e seleziona Visualizza attività.
Questa visualizzazione mostra l'elenco delle attività per l'utente, il numero di completamenti e il tempo impiegato, come mostrato di seguito:

8. Complimenti
Congratulazioni, hai utilizzato correttamente Document AI Human-in-the-Loop per configurare la revisione umana dei documenti elaborati utilizzando un processore di note spese Document AI.
Pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial:
- In Cloud Console, vai alla pagina Gestisci risorse.
- Nell'elenco dei progetti, seleziona il tuo progetto e poi fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID progetto, quindi fai clic su Chiudi per eliminare il progetto.
Scopri di più
Continua a scoprire Document AI con questi codelab di follow-up.
Risorse
- The Future of Documents - YouTube Playlist
- Documentazione di Document AI
- Libreria client Python di Document AI
- Esempi di Document AI
Licenza
Questo lavoro è concesso in licenza ai sensi di una licenza Creative Commons Attribution 2.0 Generic.