Verwenden Sie Procurement Document AI, um Rechnungen mithilfe von AI Platform Notebooks zu parsen

1. Übersicht

c65b9ae04aa1853.png

Was ist Procurement Document AI?

Unternehmen verwalten umfangreiche Beschaffungspipelines, darunter jedes Jahr Tausende von Rechnungen, Belegen und anderen zugehörigen Dokumenten. Mit Procurement DocAI können Sie Ihre „Dark Data“ intelligent verarbeiten. wie PDFs, Bilder und handschriftliche Formulare, um den manuellen Aufwand im Beschaffungszyklus zu reduzieren. Automatisieren Sie die Erfassung von Beschaffungsdaten im großen Stil: Verwandeln Sie unstrukturierte Dokumente wie Rechnungen und Belege in strukturierte Daten, um die betriebliche Effizienz zu steigern, die Nutzerumgebung zu optimieren und fundierte Grundlagen für die Entscheidungsfindung zu legen.

In diesem Codelab erfahren Sie, wie Sie Document AI Platform einrichten, eine Beispielrechnung verarbeiten sowie Entitäten in einem AI Platform Notebook extrahieren und visualisieren.

Aufgaben in diesem Lab

  • Erste Schritte mit Document AI Platform
  • Schematisierte Entitäten mit der Procurement DocAI-Lösung extrahieren
  • AI Platform Notebooks-Instanz erstellen und anpassen

Voraussetzungen

  • Ein Google Cloud-Projekt
  • Ein Browser, z. B. Chrome oder Firefox
  • Kenntnisse in Python 3

Umfrage

Wie möchten Sie diese Anleitung nutzen?

<ph type="x-smartling-placeholder"></ph> Nur bis zum Ende lesen Lies sie dir durch und absolviere die Übungen

Wie würden Sie Ihre Erfahrung mit Python bewerten?

<ph type="x-smartling-placeholder"></ph> Neuling Mittel Kompetent

Wie würden Sie Ihre Erfahrungen im Umgang mit Google Cloud-Diensten bewerten?

<ph type="x-smartling-placeholder"></ph> Neuling Mittel Kompetent

2. Einrichtung und Anforderungen

Umgebung für das selbstbestimmte Lernen einrichten

  1. Melden Sie sich in der Cloud Console an und erstellen Sie ein neues Projekt oder verwenden Sie ein vorhandenes Projekt. Wenn Sie noch kein Gmail- oder G Suite-Konto haben, müssen Sie ein Konto erstellen.

Notieren Sie sich die Projekt-ID, also einen eindeutigen Namen in allen Google Cloud-Projekten. (Ihr Name oben ist bereits vergeben und funktioniert leider nicht.) Sie müssen diese ID später als PROJECT_ID angeben.

  1. Als Nächstes müssen Sie in der Cloud Console die Abrechnung aktivieren, um Google Cloud-Ressourcen verwenden zu können.

Folgen Sie der Anleitung im Abschnitt „Bereinigen“, . In diesem Abschnitt wird beschrieben, wie Sie Ressourcen herunterfahren, damit über diese Anleitung hinaus keine weiteren Kosten anfallen. Neue Google Cloud-Nutzer können an einem kostenlosen Testzeitraum mit 300$Guthaben teilnehmen.

3. Cloud Document AI API aktivieren

Bevor Sie Document AI verwenden können, müssen Sie die API aktivieren. Öffnen Sie die Cloud Console in Ihrem Browser.

  1. Klicke auf das Navigationsmenü 😃 > APIs und Dienste > Bibliothek: Search API
  2. Suchen Sie nach „Document AI API“. Klicken Sie dann auf Aktivieren, um die API in Ihrem Google Cloud-Projekt zu verwenden

4. Prozessor erstellen und testen

Sie müssen zuerst eine Instanz des Formularparser-Prozessors erstellen, der in der Document AI Platform für diese Anleitung verwendet werden soll.

  1. Rufen Sie in der Console die Document AI Platform – Übersicht auf.
  2. Klicken Sie auf Create Processor (Prozessor erstellen) und wählen Sie Invoice Parser (Rechnungsparser) aus.Prozessoren
  3. Geben Sie einen Prozessornamen an und wählen Sie Ihre Region aus der Liste aus.
  4. Klicken Sie auf Erstellen, um den Prozessor zu erstellen.
  5. Kopieren Sie Ihre Prozessor-ID. Sie müssen sie später in Ihrem Code verwenden.

(Optional) Sie können den Prozessor in der Konsole testen, indem Sie ein Dokument hochladen. Klicken Sie auf Dokument hochladen und wählen Sie ein Formular zum Parsen aus. Sie können dieses Beispielformular herunterladen und verwenden, falls Sie keins haben.

Rechnung

Die Ausgabe sollte so aussehen: Geparste Rechnung

5. AI Platform Notebook erstellen

Rufen Sie in der Cloud Console den Bereich AI Platform Notebooks auf und klicken Sie auf Neue Instanz. Wählen Sie dann den neuesten Python-Instanztyp aus:

a81c82876c6c16f9.png

Verwenden Sie die Standardoptionen und klicken Sie dann auf Erstellen. Nachdem die Instanz erstellt wurde, wählen Sie JupyterLab öffnen aus.

6. Beispielcode abrufen

Importieren Sie den Beispielcode direkt aus dem GitHub-Repository für Document AI Notebooks. Gehen Sie in Ihrem Notebook entweder zu Git > Repository klonen im oberen Menü oder auf das Git-Symbol klicken: Git

Fügen Sie die folgende Repository-URL ein:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Nachdem das Repository geklont wurde, klicken Sie sich durch das Verzeichnis documentai-notebooks/specialized/ und öffnen das Notebook specialized_form_parser.ipynb. Suchen Sie die Zelle, in der die IDs des GCP-Projekts und der Document AI-Prozessor-IDs deklariert sind.

vars

Fügen Sie die GCP-Projekt-ID und die Prozessor-ID aus Schritt 4 ein. Speichern Sie Ihr Notebook.

7. Entitäten extrahieren und visualisieren

Jetzt können Sie die schematisierten Entitäten aus den Rechnungen und ihren entsprechenden Konfidenzwerten extrahieren. Das Document-Antwortobjekt enthält eine Liste von Entitäten. Weitere Informationen zu den schematisierten Entitäten finden Sie in der Kurzanleitung zum Rechnungsparser.

Führen Sie alle Zellen in Ihrem Notebook aus und scrollen Sie nach unten zur tabellarischen Ausgabe. Der vorherige Code durchläuft alle Entitäten und erstellt einen Pandas-DataFrame mit den Ergebnissen. table

Scrollen Sie jetzt unten zur Visualisierungskomponente. Die Antwort des Document-Objekts enthält Informationen zum räumlichen Layout für jede Seite im Dokument. Unten werden die Layoutinformationen jedes Formularfelds verwendet, um Begrenzungsrahmen im Bild zu zeichnen. Diese Daten können für die Integration von Document AI in eine Front-End-Anwendung verwendet werden.

Polys

8. Glückwunsch

Herzlichen Glückwunsch! Sie haben mit Procurment Document AI Solution erfolgreich Daten aus einer Rechnung extrahiert. Wir empfehlen Ihnen, mit anderen Formulartypen zu experimentieren.

Bereinigen

Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, können Sie Ihr Notebook herunterfahren oder das GCP-Projekt löschen.

AI Platform Notebooks-Instanz herunterfahren

Folgen Sie dieser Anleitung, um eine AI Platform Notebooks-Instanz herunterzufahren.

Projekt löschen

Am einfachsten vermeiden Sie weitere Kosten durch Löschen des für die Anleitung erstellten Projekts.

So löschen Sie das Projekt:

  1. Rufen Sie in der GCP Console die Seite Projekte auf. Seite „Projekte“
  2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie auf Löschen.
  3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Beenden, um das Projekt zu löschen.

Weitere Informationen

Lizenz

Dieser Text ist mit einer Creative Commons Attribution 2.0 Generic License lizenziert.