1. Einführung
Die Document AI API ist eine Lösung zur Dokumentverarbeitung, die unstrukturierte Daten wie Dokumente und E‑Mails leichter verständlich, analysierbar und nutzbar macht.
Durch die menschliche Überprüfung können Sie eine höhere Genauigkeit bei der Dokumentenverarbeitung erreichen. Die manuelle Überprüfung kann die Genauigkeit erhöhen und Unternehmen bei der Bewertung von Vorhersagen helfen, indem sie speziell entwickelte Tools verwenden, die diese Überprüfungen ermöglichen. In diesem Lab konfigurieren und testen Sie einen Ausgabenprozessor, bei dem die Ergebnisse des Prozessors mithilfe von Human-in-the-Loop-Konfigurations- und ‑Verwaltungstools manuell überprüft werden.
Voraussetzungen
Dieses Codelab baut auf Inhalten auf, die in anderen Document AI-Codelabs vorgestellt werden.
Wir empfehlen Ihnen, die folgenden Codelabs zu absolvieren, bevor Sie fortfahren.
- Optische Zeichenerkennung (OCR) mit Document AI (Python)
- Formulare mit Document AI parsen (Python)
- Spezialisierte Prozessoren mit Document AI verwenden (Python)
Lerninhalte
- Manuelle Überprüfung für einen Prozessor konfigurieren
- Erstellen Sie einen Ressourcenpool für Nutzer, die menschliche Überprüfungen durchführen.
- Erstellen Sie eine Testaufgabe für die manuelle Überprüfung.
- Weisen Sie einem Nutzer eine Aufgabe zur manuellen Überprüfung zu.
- Manuelle Überprüfung eines Dokuments durchführen
Voraussetzungen
- Google Cloud-Projekt
- Ein Browser wie Google Chrome oder Mozilla Firefox
- Kenntnisse von Python 3
2. Einrichtung
In diesem Codelab wird davon ausgegangen, dass Sie die im Einführungs-Codelab aufgeführten Einrichtungsschritte für Document AI ausgeführt haben.
Führen Sie die folgenden Schritte aus, bevor Sie fortfahren:
- Cloud Shell starten
- Document AI API und Cloud Storage API aktivieren
- Python-Clientbibliothek installieren
Außerdem müssen Sie die Vertex AI API aktivieren.
- Suchen Sie über die Suchleiste oben in der Console nach „Vertex AI API“ und klicken Sie dann auf Aktivieren, um die API in Ihrem Google Cloud-Projekt zu verwenden.
- Alternativ kann die API mit dem folgenden
gcloud-Befehl aktiviert werden.
gcloud services enable aiplatform.googleapis.com
3. Prozessor erstellen
Sie müssen zuerst eine Instanz des Expense-Prozessors erstellen, die Sie für dieses Lab verwenden können.
- Rufen Sie in der Console die Übersicht über die Document AI Platform auf.
- Klicken Sie auf Prozessor erstellen, scrollen Sie nach unten zu Spezialisiert und wählen Sie Ausgabenparser aus.
- Geben Sie dem Prozessor den Namen
codelab-expense-parser(oder einen anderen Namen, den Sie sich merken können) und wählen Sie die nächstgelegene Region aus der Liste aus. - Klicken Sie auf Erstellen, um den Prozessor zu erstellen.
- Kopieren Sie die Prozessor-ID. Sie müssen sie später in Ihrem Code verwenden.
- Erstellen Sie in Cloud Shell einen Speicher-Bucket mit
PROJECT_ID-hitl-resultsals Namen:
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
- Binden Sie Ihr Nutzerkonto an die Vertex AI Admin-IAM-Rolle in Ihrem Lab-Projekt.
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin
4. Human in the Loop konfigurieren
In dieser Aufgabe konfigurieren Sie die manuelle Überprüfung für den von Ihnen erstellten Ausgabenprozessor.
- Öffnen Sie in der Console das Navigationsmenü und wählen Sie Document AI aus.
- Klicken Sie auf Human-in-the-Loop-KI.

- Klicken Sie auf
codelab-expense-parser, um die Seite „Manuelle Überprüfung“ für den Prozessor zu öffnen. - Klicken Sie auf Human in the Loop konfigurieren.

- Wählen Sie Filter auf Dokumentebene aus.
- Stellen Sie den Schieberegler Konfidenzwert % auf 50 % ein.
- Lassen Sie die Option Experten auf Eigene Experten verwenden eingestellt.

- Klicken Sie auf das Drop-down-Menü Specialist pool (Pool für Spezialisten) und dann auf NEW SPECIALIST POOL (NEUER POOL FÜR SPEZIALISTEN).
- Geben Sie im Dialogfeld Neuer Spezialistenpool unter Poolname
Codelab HITL Poolein. - Geben Sie Ihre private E-Mail-Adresse für die Poolmanager und die Spezialisten ein.
- Klicken Sie auf Pool erstellen.

Das dauert einige Minuten. Sie sollten eine E‑Mail von Vertex AI noreply-vertex@google.com erhalten.
- Lassen Sie das Kästchen Automatische Zuweisung deaktiviert.
- Klicken Sie im Abschnitt Belastungen bestätigen auf das Kästchen.
- Klicken Sie auf Anleitung für den Speicherort und kopieren Sie diesen Speicherort: NICHT das Präfix
gs://in den Pfad einfügen
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
- Klicken Sie unter Speicherort der Ergebnisse auf Durchsuchen und wählen Sie den zuvor erstellten Cloud Storage-Bucket aus.
- Klicken Sie auf Auswählen.
- Klicken Sie auf Konfiguration speichern.
In der Konsole wird jetzt Konfiguration von Human-in-the-Loop angezeigt. Dies dauert einige Minuten.

- Wenn die Konfiguration abgeschlossen ist, werden Sie in der Console aufgefordert, „Human in the Loop“ zu aktivieren.
- Klicken Sie auf den Schalter, um die Funktion zu aktivieren.
- Klicken Sie dann im Pop-up-Dialogfeld auf AKTIVIEREN.

Beispiel für ein Spesenabrechnungsformular hochladen
- Wir haben ein Beispielformular, das in Google Cloud Storage gespeichert ist. Sie können sie über die Schaltfläche oder den Befehl unten herunterladen:
gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
- Klicken Sie nach der Aktivierung von Human-in-the-Loop auf die Schaltfläche Dokument hochladen und suchen Sie nach dem Beispieldokument, das Sie gerade heruntergeladen haben.
- Klicken Sie auf Hochladen und warten Sie, bis der Vorgang abgeschlossen ist.
5. Element zur manuellen Überprüfung zuweisen
- Auf dieser Seite sollten Links zur Pool Manager Console und zur Specialist Console angezeigt werden. Diese Links werden auch in einer E‑Mail von
Vertex AI noreply-vertex@google.comangezeigt.- Sie sollten so aussehen:
https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks - Klicken Sie auf den Link zur Manager-Konsole.
- Sie sollten so aussehen:

- Klicken Sie in der Data Labeling Console auf den Tabtitel Aufgaben, um die Seite für die Aufgabenzuweisung zu öffnen.
- Klicken Sie das Kästchen Nicht zugewiesen an. Sie sollten sehen, dass ein neuer Eintrag in der Aufgabenwarteschlange codelab-expense-parser-P1 aufgeführt ist.

- Wählen Sie codelab-expense-parser-P1 aus.
- Klicken Sie auf Zuweisung verwalten.
- Geben Sie Ihre private E‑Mail-Adresse in das Textfeld Spezialisten per E‑Mail einbeziehen ein und wählen Sie sie dann aus der Drop-down-Liste aus.
- Klicken Sie auf Übernehmen.
Auf dem Display wird jetzt angezeigt, dass die Aufgabe Ihnen zugewiesen ist. Es kann einige Minuten dauern, bis die Änderungen übernommen und sichtbar werden.

- Wählen Sie den neuen Nutzer aus und klicken Sie auf das Menüsymbol.
- Klicken Sie im Pop-up-Menü auf Assign to all tasks (Allen Aufgaben zuweisen).

- Klicken Sie auf Änderungen übernehmen.
- Klicken Sie auf Commit.

6. Manuelle Überprüfungsaufgabe ausführen
- Kehren Sie in der Cloud Console zur Konfigurationsseite für Human-in-the-Loop zurück.
Klicken Sie auf den Link, um die Specialist-Konsole (Worker) aufzurufen. Das sieht dann so aus: https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx.
Die Worker-Konsole sollte geöffnet werden und Ihre neue Aufgabe auflisten.

- Bewegen Sie den Mauszeiger auf die Zeile mit Meeting with 4m und klicken Sie auf das Stiftsymbol Bearbeiten.
- Ändern Sie den Wert, damit der Text Besprechung mit Adam lautet. Eventuell müssen Sie im Textfeld nach unten scrollen, um den Text zu sehen.
- Klicken Sie auf Übernehmen.
- Klicken Sie für das unten aufgeführte Element auf das Symbol Bestätigen (grünes Häkchen).

- Klicken Sie für die anderen hervorgehobenen Rechtssubjekte auf das Symbol Bestätigen.
- Klicken Sie auf Senden. Die Aufgabe zur Überprüfung wurde aus Ihrer Warteschlange für Labeler entfernt.
7. Erledigte Aufgaben ansehen
- Kehren Sie zur Manager-Konsole zurück.
- Klicken Sie auf Aufgaben und wählen Sie Laufend
aus. - Klicken Sie auf Spezialisten.
- Wählen Sie Ihre E‑Mail-Adresse aus.
- Klicken Sie auf Zuweisung verwalten.
- Wählen Sie im Drop-down-Menü
Select specialists working on specific tasksundSelect tasksdie Option expense-processor-P1 aus. Klicken Sie für jede Auswahl auf Übernehmen. Wählen Sie im Kontextmenü für expense-processor-P1, das Ihnen zugewiesen wurde, die Option View Specialists (Spezialisten ansehen) aus.

Sobald die Kennzeichnungsaufgabe vom Kennzeichner gesendet wurde, werden die Anzahl der beantworteten Aufgaben und die Gesamtzeit aktualisiert. Es kann jedoch einige Minuten dauern, bis die Daten in dieser Ansicht angezeigt werden.
- Schließen Sie das Pop-up-Fenster „Spezialisten“ und rufen Sie den Tab Spezialisten auf.
- Klicken Sie auf das Kontextmenü für Ihren Nutzernamen und wählen Sie Aufgaben ansehen aus.
In dieser Ansicht sehen Sie die Liste der Aufgaben für den Nutzer, die Anzahl der Abschlüsse und die benötigte Zeit, wie unten dargestellt:

8. Glückwunsch
Gute Arbeit. Sie haben Document AI Human-in-the-Loop erfolgreich verwendet, um die manuelle Überprüfung von Dokumenten zu konfigurieren, die mit einem Document AI-Prozessor für Ausgaben verarbeitet werden.
Clean-up
So vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:
- Wechseln Sie in der Cloud Console zur Seite Ressourcen verwalten.
- Wählen Sie in der Projektliste Ihr Projekt aus und klicken Sie auf „Löschen“.
- Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf „Beenden“, um das Projekt zu löschen.
Weitere Informationen
In diesen Codelabs erfahren Sie mehr über Document AI.
Ressourcen
- The Future of Documents – YouTube-Playlist
- Document AI-Dokumentation
- Python-Clientbibliothek für Document AI
- Document AI-Beispiele
Lizenz
Dieser Text ist mit einer Creative Commons Attribution 2.0 Generic License lizenziert.