Verwenden Sie Procurement Document AI, um Rechnungen mithilfe von AI Platform Notebooks zu parsen

1. Übersicht

c65b9ae04aa1853.png

Was ist Procurement Document AI?

Unternehmen verwalten große Beschaffungspipelines mit Tausenden von Rechnungen, Belegen und anderen zugehörigen Dokumenten pro Jahr. Mit Procurement DocAI können Sie Ihre „Dark Data“ wie PDFs, Bilder und handschriftliche Formulare intelligent verarbeiten, um den manuellen Aufwand im Beschaffungszyklus zu reduzieren. Automatisieren Sie die Erfassung von Beschaffungsdaten im großen Stil: Verwandeln Sie unstrukturierte Dokumente wie Rechnungen und Belege in strukturierte Daten, um die betriebliche Effizienz zu steigern, die Nutzerumgebung zu optimieren und fundierte Grundlagen für die Entscheidungsfindung zu legen.

In diesem Codelab erfahren Sie, wie Sie die Document AI Platform einrichten, eine Beispielrechnung verarbeiten und Entitäten in einem AI Platform Notebook extrahieren und visualisieren.

Lerninhalte

  • Erste Schritte mit der Document AI Platform
  • Schematisierte Entitäten mit der Procurement DocAI-Lösung extrahieren
  • AI Platform Notebooks-Instanz erstellen und anpassen

Voraussetzungen

  • Google Cloud-Projekt
  • Ein Browser wie Chrome oder Firefox
  • Kenntnisse in Python 3

Umfrage

Wie werden Sie diese Anleitung verwenden?

Nur lesen Lesen und Übungen durchführen

Wie würden Sie Ihre Kenntnisse in Python bewerten?

Anfänger Fortgeschritten Experte

Wie würden Sie Ihre Kenntnisse in der Verwendung von Google Cloud-Diensten bewerten?

Anfänger Fortgeschritten Experte

2. Einrichtung und Anforderungen

Umgebung zum selbstbestimmten Lernen einrichten

  1. Melden Sie sich in der Cloud Console an und erstellen Sie ein neues Projekt oder verwenden Sie ein vorhandenes. Wenn Sie noch kein Gmail- oder G Suite-Konto haben, müssen Sie eines erstellen.

Merken Sie sich die Projekt-ID, einen eindeutigen Namen für alle Google Cloud-Projekte. Der Name oben ist bereits vergeben und kann nicht verwendet werden. Sie müssen diese ID später als PROJECT_ID angeben.

  1. Als Nächstes müssen Sie die Abrechnung aktivieren in der Cloud Console aktivieren, um Google Cloud-Ressourcen verwenden zu können.

Folgen Sie allen Anweisungen im Abschnitt „Bereinigen“. In diesem Abschnitt erfahren Sie, wie Sie Ressourcen herunterfahren können, damit nach Abschluss dieser Anleitung keine Gebühren anfallen. Neue Google Cloud-Nutzer können am kostenlosen Testprogramm im Wert von 300$ teilnehmen.

3. Cloud Document AI API aktivieren

Bevor Sie mit Document AI arbeiten können, müssen Sie die API aktivieren. Öffnen Sie die Cloud Console in Ihrem Browser.

  1. Klicken Sie auf das Navigationsmenü ☰ > APIs & Dienste > Bibliothek. Search API
  2. Suchen Sie nach „Document AI API“ und klicken Sie dann auf Aktivieren , um die API in Ihrem Google Cloud-Projekt zu verwenden.

4. Prozessor erstellen und testen

Sie müssen zuerst eine Instanz des Formularparser-Prozessors erstellen, die Sie in der Document AI Platform für diese Anleitung verwenden können.

  1. Rufen Sie in der Console die Document AI Platform-Übersicht auf.
  2. Klicken Sie auf Prozessor erstellen und wählen Sie Rechnungsparser aus.Prozessoren
  3. Geben Sie einen Prozessornamen an und wählen Sie in der Liste Ihre Region aus.
  4. Klicken Sie auf Erstellen , um den Prozessor zu erstellen.
  5. Kopieren Sie Ihre Prozessor-ID. Sie müssen sie später in Ihrem Code verwenden.

(Optional) Sie können Ihren Prozessor in der Console testen, indem Sie ein Dokument hochladen. Klicken Sie auf Dokument hochladen und wählen Sie ein zu parsendes Formular aus. Sie können dieses Beispielformular herunterladen und verwenden, wenn Sie keines zur Verfügung haben.

Rechnung

Die Ausgabe sollte so aussehen: Geparste Rechnung

5. AI Platform Notebook erstellen

Rufen Sie in der Cloud Console den Abschnitt „AI Platform Notebooks“ auf und klicken Sie auf Neue Instanz. Wählen Sie dann den neuesten Python-Instanztyp aus:

a81c82876c6c16f9.png

Übernehmen Sie die Standardoptionen und klicken Sie auf Erstellen. Nachdem die Instanz erstellt wurde, klicken Sie auf JupyterLab öffnen.

6. Beispielcode abrufen

Importieren Sie den Beispielcode direkt aus dem Document AI Notebooks Github Repo. Rufen Sie in Ihrem Notebook im oberen Menü Git > Repository klonen auf oder klicken Sie auf das Git-Symbol: Git

Fügen Sie die folgende Repository-URL ein:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Nachdem das Repository geklont wurde, klicken Sie auf das Verzeichnis documentai-notebooks/specialized/ und öffnen Sie das Notebook specialized_form_parser.ipynb. Suchen Sie die Zelle, in der die GCP-Projekt- und Document AI-Prozessor-IDs deklariert sind.

vars

Fügen Sie Ihre GCP-Projekt-ID und Prozessor-ID aus Schritt 4 ein. Speichern Sie das Notebook.

7. Entitäten extrahieren und visualisieren

Sie können jetzt die schematisierten Entitäten aus den Rechnungen und die entsprechenden Konfidenzwerte extrahieren. Das Antwortobjekt „Document“ enthält eine Liste von Entitäten. Weitere Informationen zu den schematisierten Entitäten finden Sie in der Kurzanleitung zum Rechnungsparser quickstart.

Führen Sie alle Zellen in Ihrem Notebook aus und scrollen Sie zur tabellarischen Ausgabe. Der vorherige Code durchläuft jede Entität und erstellt mit den Ergebnissen einen Pandas DataFrame. Tabelle

Scrollen Sie nun nach unten zur Visualisierungskomponente. Die Antwort des Document-Objekts enthält Informationen zum räumlichen Layout für jede Seite im Dokument. Unten werden die Layoutinformationen zu jedem Formularfeld verwendet, um Begrenzungsrahmen auf dem Bild zu zeichnen. Diese Daten können verwendet werden, um Document AI in eine Frontend-Anwendung zu integrieren.

polys

8. Glückwunsch

Glückwunsch. Sie haben die Procurement Document AI-Lösung erfolgreich verwendet, um Daten aus einer Rechnung zu extrahieren. Wir empfehlen Ihnen, auch andere Formulararten auszuprobieren.

Bereinigen

Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, können Sie entweder das Notebook herunterfahren oder das GCP-Projekt löschen.

AI Platform Notebooks-Instanz herunterfahren

Folgen Sie dieser Anleitung, um eine AI Platform Notebooks-Instanz herunterzufahren.

Projekt löschen

Am einfachsten vermeiden Sie weitere Kosten durch Löschen des für die Anleitung erstellten Projekts.

So löschen Sie das Projekt:

  1. Rufen Sie in der GCP Console die Seite Projekte auf. Seite „Projekte“
  2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie auf Löschen.
  3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Beenden , um das Projekt zu löschen.

Weitere Informationen

Lizenz

Dieser Text ist mit einer Creative Commons Attribution 2.0 Generic License lizenziert.