1. Przegląd

Czym jest Procurement Document AI?
Przedsiębiorstwa zarządzają dużymi potokami zamówień, w tym tysiącami faktur, rachunków i innych powiązanych dokumentów rocznie. Używaj Procurement DocAI do inteligentnego przetwarzania „ciemnych danych”, takich jak pliki PDF, obrazy i odręczne formularze, aby zmniejszyć nakład pracy ręcznej w cyklu życia zamówienia. Automatyzuj przechwytywanie danych dotyczących zakupów na dużą skalę, przekształcając nieuporządkowane dokumenty, takie jak faktury i paragony, w uporządkowane dane, aby zwiększyć wydajność operacyjną, poprawić wrażenia klienta i ułatwić podejmowanie decyzji.
W tym ćwiczeniu pokażemy, jak skonfigurować platformę Document AI, przetworzyć przykładową fakturę, wyodrębnić i wizualizować jednostki w notatniku AI Platform.
Czego się nauczysz
- Pierwsze kroki z platformą Document AI
- Wyodrębnianie jednostek schematycznych za pomocą rozwiązania Procurement DocAI
- Tworzenie i dostosowywanie instancji notatników AI Platform
Czego potrzebujesz
Ankieta
Jak zamierzasz korzystać z tego samouczka?
Jak oceniasz swoje doświadczenie z Pythonem?
Jak oceniasz korzystanie z usług Google Cloud?
2. Konfiguracja i wymagania
Samodzielne konfigurowanie środowiska
- Zaloguj się w konsoli Google Cloud i utwórz nowy projekt lub użyj istniejącego. (Jeśli nie masz jeszcze konta Gmail lub G Suite, musisz je utworzyć).



Zapamiętaj identyfikator projektu, czyli unikalną nazwę we wszystkich projektach Google Cloud. (Twoje imię i nazwisko powyżej są już zajęte i nie będą działać. Przepraszamy!). Musisz podać ten identyfikator później jako PROJECT_ID.
- Następnie musisz włączyć płatności w konsoli Google Cloud, aby móc korzystać z zasobów Google Cloud.
Pamiętaj, aby postępować zgodnie z instrukcjami w sekcji „Czyszczenie”. W tej sekcji znajdziesz informacje o tym, jak wyłączyć zasoby, aby uniknąć naliczenia opłat po zakończeniu tego samouczka. Nowi użytkownicy Google Cloud mogą skorzystać z programu bezpłatnego okresu próbnego, w którym mają do dyspozycji środki w wysokości 300 USD.
3. Włączanie interfejsu Cloud Document AI API
Zanim zaczniesz korzystać z Document AI, musisz włączyć interfejs API. Otwórz Cloud Console w przeglądarce.
- Kliknij Menu nawigacyjne ☰ > Interfejsy API i usługi > Biblioteka.

- Wyszukaj „Document AI API”, a następnie kliknij Włącz, aby używać interfejsu API w projekcie w chmurze Google.
4. Tworzenie i testowanie procesora
Aby skorzystać z tego samouczka, musisz najpierw utworzyć instancję procesora Form Parser do użycia na platformie Document AI.
- W konsoli otwórz Przegląd platformy Document AI.
- Kliknij Utwórz procesor i wybierz Parser faktur

- Wpisz nazwę procesora i wybierz region z listy.
- Kliknij Utwórz, aby utworzyć procesor.
- Skopiuj identyfikator procesora. Będzie trzeba użyć go później w kodzie.
(Opcjonalnie) Możesz przetestować procesor w konsoli, przesyłając dokument. Kliknij Prześlij dokument i wybierz formularz do przeanalizowania. Jeśli nie masz takiego formularza, możesz pobrać i użyć tego przykładowego formularza.

Dane wyjściowe powinny wyglądać tak: 
5. Tworzenie notatki w AI Platform
Otwórz sekcję AI Platform Notebooks w Cloud Console i kliknij Nowa instancja. Następnie wybierz najnowszy typ instancji Pythona:

Użyj opcji domyślnych, a potem kliknij Utwórz. Po utworzeniu instancji wybierz Otwórz JupyterLab.
6. Pobieranie przykładowego kodu
Bezpośrednio zaimportuj przykładowy kod z repozytorium GitHub w Notatnikach Document AI. W notatniku w menu u góry wybierz Git > Sklonuj repozytorium lub kliknij ikonę Git:
.
Wklej ten adres URL repozytorium:
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
Po sklonowaniu repozytorium kliknij katalog documentai-notebooks/specialized/ i otwórz notatnik specialized_form_parser.ipynb. Znajdź komórkę, w której zadeklarowane są identyfikatory projektu GCP i procesora Document AI.

Wklej identyfikator projektu GCP i identyfikator procesora z kroku 4. Zapisz notatnik.
7. Wyodrębnianie i wizualizacja encji
Teraz możesz wyodrębniać z faktur zdefiniowane encje i odpowiadające im wyniki wiarygodności. Obiekt odpowiedzi Document zawiera listę elementów. Więcej informacji o schematyzowanych encjach znajdziesz w krótkim wprowadzeniu do usługi Invoice Parser.
Uruchom kod ze wszystkich komórek w notatniku i przewiń w dół do danych wyjściowych w formie tabeli. Poprzedni kod iteruje po każdej encji i tworzy strukturę DataFrame biblioteki pandas z wynikami. 
Przewiń w dół do komponentu wizualizacji. Odpowiedź obiektu Document zawiera informacje o układzie przestrzennym każdej strony dokumentu. Informacje o układzie poszczególnych pól formularza są używane do rysowania na obrazie ramek ograniczających. Te dane mogą być używane do integrowania Document AI z aplikacją front-end.

8. Gratulacje
Gratulacje! Udało Ci się wyodrębnić dane z faktury za pomocą rozwiązania Procurement Document AI. Zachęcamy do eksperymentowania z innymi typami formularzy.
Czyszczenie danych
Aby uniknąć obciążenia konta Google Cloud opłatami za zasoby zużyte w tym samouczku, możesz zamknąć notatnik lub usunąć projekt GCP.
Wyłączanie instancji notatników AI Platform
Aby zamknąć instancję Notatników w AI Platform, wykonaj te instrukcje.
Usuwanie projektu
Najprostszym sposobem na uniknięcie płatności jest usunięcie projektu utworzonego w tym samouczku.
Aby usunąć projekt:
- W konsoli GCP otwórz stronę Projekty. Strona projektów
- Z listy projektów wybierz projekt, który chcesz usunąć, i kliknij Usuń.
- W oknie wpisz identyfikator projektu i kliknij Wyłącz, aby usunąć projekt.