Analizuj faktury za pomocą notatników w AI Platform za pomocą narzędzi Procurement Document AI

1. Przegląd

c65b9ae04aa1853.png

Czym jest Procurement Document AI?

Przedsiębiorstwa zarządzają dużymi potokami zamówień, w tym tysiącami faktur, rachunków i innych powiązanych dokumentów rocznie. Używaj Procurement DocAI do inteligentnego przetwarzania „ciemnych danych”, takich jak pliki PDF, obrazy i odręczne formularze, aby zmniejszyć nakład pracy ręcznej w cyklu życia zamówienia. Automatyzuj przechwytywanie danych dotyczących zakupów na dużą skalę, przekształcając nieuporządkowane dokumenty, takie jak faktury i paragony, w uporządkowane dane, aby zwiększyć wydajność operacyjną, poprawić wrażenia klienta i ułatwić podejmowanie decyzji.

W tym ćwiczeniu pokażemy, jak skonfigurować platformę Document AI, przetworzyć przykładową fakturę, wyodrębnić i wizualizować jednostki w notatniku AI Platform.

Czego się nauczysz

  • Pierwsze kroki z platformą Document AI
  • Wyodrębnianie jednostek schematycznych za pomocą rozwiązania Procurement DocAI
  • Tworzenie i dostosowywanie instancji notatników AI Platform

Czego potrzebujesz

  • Projekt Google Cloud
  • przeglądarka, np. Chrome lub Firefox;
  • Znajomość języka Python 3

Ankieta

Jak zamierzasz korzystać z tego samouczka?

Tylko przeczytaj Przeczytaj i wykonaj ćwiczenia

Jak oceniasz swoje doświadczenie z Pythonem?

Początkujący Średnio zaawansowany Zaawansowany

Jak oceniasz korzystanie z usług Google Cloud?

Początkujący Średnio zaawansowany Zaawansowany

2. Konfiguracja i wymagania

Samodzielne konfigurowanie środowiska

  1. Zaloguj się w konsoli Google Cloud i utwórz nowy projekt lub użyj istniejącego. (Jeśli nie masz jeszcze konta Gmail lub G Suite, musisz je utworzyć).

Zapamiętaj identyfikator projektu, czyli unikalną nazwę we wszystkich projektach Google Cloud. (Twoje imię i nazwisko powyżej są już zajęte i nie będą działać. Przepraszamy!). Musisz podać ten identyfikator później jako PROJECT_ID.

  1. Następnie musisz włączyć płatności w konsoli Google Cloud, aby móc korzystać z zasobów Google Cloud.

Pamiętaj, aby postępować zgodnie z instrukcjami w sekcji „Czyszczenie”. W tej sekcji znajdziesz informacje o tym, jak wyłączyć zasoby, aby uniknąć naliczenia opłat po zakończeniu tego samouczka. Nowi użytkownicy Google Cloud mogą skorzystać z programu bezpłatnego okresu próbnego, w którym mają do dyspozycji środki w wysokości 300 USD.

3. Włączanie interfejsu Cloud Document AI API

Zanim zaczniesz korzystać z Document AI, musisz włączyć interfejs API. Otwórz Cloud Console w przeglądarce.

  1. Kliknij Menu nawigacyjne ☰ > Interfejsy API i usługi > Biblioteka. Search API
  2. Wyszukaj „Document AI API”, a następnie kliknij Włącz, aby używać interfejsu API w projekcie w chmurze Google.

4. Tworzenie i testowanie procesora

Aby skorzystać z tego samouczka, musisz najpierw utworzyć instancję procesora Form Parser do użycia na platformie Document AI.

  1. W konsoli otwórz Przegląd platformy Document AI.
  2. Kliknij Utwórz procesor i wybierz Parser fakturProcesory
  3. Wpisz nazwę procesora i wybierz region z listy.
  4. Kliknij Utwórz, aby utworzyć procesor.
  5. Skopiuj identyfikator procesora. Będzie trzeba użyć go później w kodzie.

(Opcjonalnie) Możesz przetestować procesor w konsoli, przesyłając dokument. Kliknij Prześlij dokument i wybierz formularz do przeanalizowania. Jeśli nie masz takiego formularza, możesz pobrać i użyć tego przykładowego formularza.

Faktura

Dane wyjściowe powinny wyglądać tak: Przetworzona faktura

5. Tworzenie notatki w AI Platform

Otwórz sekcję AI Platform Notebooks w Cloud Console i kliknij Nowa instancja. Następnie wybierz najnowszy typ instancji Pythona:

a81c82876c6c16f9.png

Użyj opcji domyślnych, a potem kliknij Utwórz. Po utworzeniu instancji wybierz Otwórz JupyterLab.

6. Pobieranie przykładowego kodu

Bezpośrednio zaimportuj przykładowy kod z repozytorium GitHub w Notatnikach Document AI. W notatniku w menu u góry wybierz Git > Sklonuj repozytorium lub kliknij ikonę Git: Git.

Wklej ten adres URL repozytorium:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Po sklonowaniu repozytorium kliknij katalog documentai-notebooks/specialized/ i otwórz notatnik specialized_form_parser.ipynb. Znajdź komórkę, w której zadeklarowane są identyfikatory projektu GCP i procesora Document AI.

vars

Wklej identyfikator projektu GCP i identyfikator procesora z kroku 4. Zapisz notatnik.

7. Wyodrębnianie i wizualizacja encji

Teraz możesz wyodrębniać z faktur zdefiniowane encje i odpowiadające im wyniki wiarygodności. Obiekt odpowiedzi Document zawiera listę elementów. Więcej informacji o schematyzowanych encjach znajdziesz w krótkim wprowadzeniu do usługi Invoice Parser.

Uruchom kod ze wszystkich komórek w notatniku i przewiń w dół do danych wyjściowych w formie tabeli. Poprzedni kod iteruje po każdej encji i tworzy strukturę DataFrame biblioteki pandas z wynikami. tabela

Przewiń w dół do komponentu wizualizacji. Odpowiedź obiektu Document zawiera informacje o układzie przestrzennym każdej strony dokumentu. Informacje o układzie poszczególnych pól formularza są używane do rysowania na obrazie ramek ograniczających. Te dane mogą być używane do integrowania Document AI z aplikacją front-end.

polys

8. Gratulacje

Gratulacje! Udało Ci się wyodrębnić dane z faktury za pomocą rozwiązania Procurement Document AI. Zachęcamy do eksperymentowania z innymi typami formularzy.

Czyszczenie danych

Aby uniknąć obciążenia konta Google Cloud opłatami za zasoby zużyte w tym samouczku, możesz zamknąć notatnik lub usunąć projekt GCP.

Wyłączanie instancji notatników AI Platform

Aby zamknąć instancję Notatników w AI Platform, wykonaj te instrukcje.

Usuwanie projektu

Najprostszym sposobem na uniknięcie płatności jest usunięcie projektu utworzonego w tym samouczku.

Aby usunąć projekt:

  1. W konsoli GCP otwórz stronę Projekty. Strona projektów
  2. Z listy projektów wybierz projekt, który chcesz usunąć, i kliknij Usuń.
  3. W oknie wpisz identyfikator projektu i kliknij Wyłącz, aby usunąć projekt.

Więcej informacji

Licencja

To zadanie jest licencjonowane na podstawie ogólnej licencji Creative Commons Attribution 2.0.