1. Wprowadzenie
Document AI API to rozwiązanie do analizy dokumentów, które przetwarza dane nieustrukturyzowane, takie jak dokumenty, e-maile itp., i ułatwia ich zrozumienie, analizowanie i wykorzystywanie.
Dzięki weryfikacji przez weryfikatora możesz uzyskać większą dokładność przetwarzania dokumentów i mieć pewność, że dokumenty są sprawdzane przez weryfikatora. Sprawdzanie przez weryfikatorów może zwiększyć dokładność i pomóc firmom oceniać prognozy za pomocą specjalnie zaprojektowanych narzędzi. W tym module skonfigurujesz i przetestujesz procesor wydatków, korzystając z weryfikacji manualnej, aby sprawdzić wyniki działania procesora za pomocą narzędzi do konfiguracji i zarządzania opartych na udziale człowieka.
Wymagania wstępne
To ćwiczenie opiera się na treściach przedstawionych w innych ćwiczeniach Document AI.
Zanim przejdziesz dalej, zalecamy wykonanie tych ćwiczeń z programowania.
- Optyczne rozpoznawanie znaków (OCR) za pomocą Document AI (Python)
- Analizowanie formularzy za pomocą Document AI (Python)
- Specjalistyczne procesory z Document AI (Python)
Czego się nauczysz
- Skonfiguruj weryfikację manualną procesora.
- Utwórz pulę zasobów użytkowników weryfikacji manualnej.
- Utwórz testowe zadanie weryfikacji manualnej.
- Przypisz zadanie weryfikacji manualnej użytkownikowi.
- Przeprowadź weryfikację manualną dokumentu.
Czego potrzebujesz
2. Przygotowania
W tym ćwiczeniu zakłada się, że masz już za sobą kroki konfiguracji Document AI wymienione w ćwiczeniu wprowadzającym.
Zanim przejdziesz dalej, wykonaj te czynności:
- Uruchamianie Cloud Shell
- Włącz interfejsy Document AI i Cloud Storage API
- Instalowanie biblioteki klienta Python
Musisz też włączyć interfejs Vertex AI API.
- Na pasku wyszukiwania u góry konsoli wyszukaj „Vertex AI API”, a potem kliknij Włącz, aby używać interfejsu API w projekcie w chmurze Google Cloud.
- Interfejs API można też włączyć za pomocą tego polecenia
gcloud.
gcloud services enable aiplatform.googleapis.com
3. Tworzenie procesora
Aby wykonać to ćwiczenie, musisz najpierw utworzyć instancję procesora wydatków.
- W konsoli otwórz Przegląd platformy Document AI.
- Kliknij Utwórz procesor, przewiń w dół do sekcji Specjalistyczne i wybierz Ekstraktor wydatków.
- Nadaj mu nazwę
codelab-expense-parser(lub inną, którą będziesz pamiętać) i wybierz z listy region, który znajduje się najbliżej Ciebie. - Kliknij Utwórz, aby utworzyć procesor.
- Skopiuj identyfikator procesora. Będzie trzeba użyć go później w kodzie.
- W Cloud Shell utwórz zasobnik pamięci, używając jako nazwy
PROJECT_ID-hitl-results:
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
- Powiąż swoje konto użytkownika z rolą uprawnień administratora Vertex AI w projekcie laboratorium.
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin
4. Konfigurowanie procesu z udziałem człowieka
W tym zadaniu skonfigurujesz weryfikację manualną dla utworzonego wcześniej procesora wydatków.
- W konsoli otwórz menu nawigacyjne i wybierz Document AI.
- Kliknij AI z udziałem człowieka.

- Kliknij
codelab-expense-parser, aby otworzyć stronę weryfikacji manualnej procesora. - Kliknij Skonfiguruj proces z udziałem człowieka.

- Kliknij Filtr na poziomie dokumentu.
- Ustaw suwak Próg ufności (%) na 50%.
- Pozostaw opcję Specjaliści ustawioną na Skorzystaj z pracy własnych specjalistów.

- Kliknij pole menu Pula specjalistów i wybierz NOWA PULA SPECJALISTÓW.
- W oknie Nowa pula specjalistów w polu Nazwa puli wpisz
Codelab HITL Pool. - Wpisz swój osobisty adres e-mail w sekcji Menedżerowie pul i Specjaliści.
- Kliknij Utwórz pulę.

Ich wykonanie może potrwać kilka minut. Powinien do Ciebie dotrzeć e-mail od Vertex AI noreply-vertex@google.com.
- Odznacz pole wyboru Automatyczne przydzielanie.
- Zaznacz pole wyboru w sekcji Potwierdzenie opłat.
- Kliknij Lokalizacja instrukcji i skopiuj tę lokalizację pamięci: - NIE uwzględniaj w ścieżce prefiksu
gs://.
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
- W sekcji Lokalizacja wyników kliknij Przeglądaj i wybierz utworzony wcześniej zasobnik Cloud Storage.
- Kliknij Wybierz.
- Kliknij Save Configuration (Zapisz konfigurację).
W konsoli pojawi się komunikat Konfigurowanie weryfikacji przez człowieka. Proces ten potrwa kilka minut.

- Po zakończeniu konfiguracji konsola wyświetli prośbę o włączenie procesu z udziałem człowieka.
- Kliknij przycisk przełączania, aby włączyć tę opcję.
- Następnie w wyskakującym okienku kliknij WŁĄCZ.

Przesyłanie przykładowego formularza wydatków
- Mamy przykładowy formularz do użycia przechowywany w Google Cloud Storage. Możesz go pobrać za pomocą przycisku lub polecenia poniżej:
gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
- Po włączeniu procesu z udziałem człowieka kliknij przycisk Prześlij dokument i wyszukaj pobrany przed chwilą przykładowy dokument.
- Kliknij Prześlij i poczekaj na zakończenie.
5. Przypisywanie elementu do weryfikacji manualnej
- Na tej stronie powinny być widoczne linki do konsoli menedżera puli i konsoli specjalisty. Linki te pojawią się też w e-mailu od
Vertex AI noreply-vertex@google.com.- Powinny wyglądać tak:
https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks - Kliknij link do konsoli Menedżer.
- Powinny wyglądać tak:

- W konsoli etykietowania danych kliknij tytuł karty Zadania, aby otworzyć stronę przypisywania zadań.
- Kliknij pole wyboru Nieprzypisane. Powinien pojawić się nowy wpis na liście kolejki zadań codelab-expense-parser-P1.

- Wybierz codelab-expense-parser-P1.
- Kliknij Zarządzaj przypisywaniem.
- Wpisz swój osobisty adres e-mail w polu tekstowym Uwzględnij specjalistów według adresu e-mail, a następnie wybierz go z menu.
- Kliknij Zastosuj.
Na wyświetlaczu pojawi się informacja, że zadanie jest przypisane do Ciebie. Zastosowanie zmian może potrwać kilka minut.

- Wybierz nowego użytkownika i kliknij ikonę menu.
- W menu, które się pojawi, kliknij Przypisz do wszystkich zadań.

- Kliknij Zatwierdź zmiany.
- Kliknij Zatwierdź.

6. Wykonywanie zadania weryfikacji manualnej
- Wróć do strony konfiguracji procesów z udziałem człowieka w konsoli Cloud.
Kliknij link, aby otworzyć konsolę specjalisty (pracownika). Będzie to wyglądać tak: https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx.
Konsola pracownika powinna się otworzyć i wyświetlić nowe zadanie.

- Najedź kursorem na element zamówienia zawierający Spotkanie z 4m i kliknij ikonę edytowania (ołówka).
- Edytuj wartość, aby zmienić tekst na Spotkanie z Adamem. Aby zobaczyć tekst, może być konieczne przewinięcie pola tekstowego w dół.
- Kliknij Zastosuj.
- Kliknij ikonę Potwierdź (zielony znacznik) w przypadku poniższego elementu.

- Kliknij ikonę Potwierdź w przypadku pozostałych wyróżnionych elementów.
- Kliknij Prześlij. Zadanie dotyczące opinii zostało usunięte z kolejki etykietującego.
7. Wyświetlanie ukończonych zadań
- Wróć do konsoli menedżera.
- Kliknij Zadania i wybierz W toku
. - Kliknij Specjaliści.
- Wybierz swój adres e-mail.
- Kliknij Zarządzaj przypisywaniem.
- Wybierz expense-processor-P1 z menu
Select specialists working on specific tasksiSelect tasks. Kliknij Zastosuj przy każdym wyborze. W menu kontekstowym expense-processor-P1, które zostało Ci przypisane, kliknij Wyświetl specjalistów.

Gdy osoba dodająca etykiety prześle zadanie, zaktualizuje się liczba wykonanych zadań i łączny czas ich wykonania, ale dane w tym widoku mogą pojawić się dopiero po kilku minutach.
- Zamknij wyskakujące okienko specjalistów i otwórz kartę Specjaliści.
- Kliknij menu kontekstowe przy nazwie użytkownika i wybierz Wyświetl zadania.
W tym widoku wyświetla się lista zadań użytkownika, liczba ukończonych zadań i czas potrzebny na ich wykonanie, jak pokazano poniżej:

8. Gratulacje
Gratulacje! Udało Ci się skonfigurować weryfikację przez człowieka w Document AI, aby sprawdzać dokumenty przetwarzane za pomocą procesora wydatków Document AI.
Czyszczenie
Aby uniknąć obciążenia konta Google Cloud opłatami za zasoby zużyte w tym samouczku:
- W Cloud Console otwórz stronę Zarządzanie zasobami.
- Na liście projektów wybierz projekt, a następnie kliknij Usuń.
- W oknie wpisz identyfikator projektu i kliknij Wyłącz, aby usunąć projekt.
Więcej informacji
Kontynuuj naukę o Document AI w tych modułach Codelabs.
Materiały
- Przyszłość dokumentów – playlista w YouTube
- Dokumentacja Document AI
- Biblioteka klienta Document AI w Pythonie
- Przykłady Document AI
Licencja
To zadanie jest licencjonowane na podstawie ogólnej licencji Creative Commons Attribution 2.0.