1. Введение
Document AI API — это решение для анализа документов, которое обрабатывает неструктурированные данные, такие как документы, электронные письма и т. д., и упрощает их понимание, анализ и использование.
Благодаря проверке человеком можно добиться более высокой точности обработки документов, гарантируя её достоверность. Проверка человеком повышает точность и помогает компаниям оценивать прогнозы с помощью специально разработанных инструментов, позволяющих проводить такие проверки. В этой лабораторной работе вы настроите и протестируете процессор учета расходов с использованием проверки человеком, чтобы подтвердить результаты работы процессора с помощью инструментов настройки и управления с участием человека.
Предварительные требования
Данный практический семинар основан на материалах других практических семинаров по искусственному интеллекту для работы с документами.
Перед продолжением рекомендуется выполнить следующие практические задания (Codelabs).
- Оптическое распознавание символов (OCR) с использованием Document AI (Python)
- Анализ форм с помощью Document AI (Python)
- Специализированные процессоры с поддержкой искусственного интеллекта для обработки документов (Python)
Что вы узнаете
- Настройте проверку данных человеком для обработчика.
- Создайте пул ресурсов для проведения экспертной оценки.
- Создайте тестовую задачу для проверки человеком.
- Назначьте пользователю задачу по проверке человеком.
- Проведите проверку документа человеком.
Что вам понадобится
2. Настройка
В этом практическом занятии предполагается, что вы выполнили шаги по настройке Document AI, описанные во вводном практическом занятии .
Перед продолжением выполните следующие шаги:
- Запустить Cloud Shell
- Включите API для работы с искусственным интеллектом документов и облачным хранилищем.
- Установите клиентскую библиотеку Python.
Вам также потребуется включить API Vertex AI.
- Воспользуйтесь строкой поиска в верхней части консоли, найдите "Vertex AI API", затем нажмите " Включить" , чтобы использовать API в вашем проекте Google Cloud.
- В качестве альтернативы, API можно включить с помощью следующей команды
gcloud.
gcloud services enable aiplatform.googleapis.com
3. Создайте процессор.
Для выполнения этой лабораторной работы необходимо сначала создать экземпляр обработчика расходов.
- В консоли перейдите к разделу «Обзор платформы Document AI».
- Нажмите «Создать обработчик» , прокрутите вниз до раздела «Специализированные» и выберите «Обработчик расходов» .
- Назовите его
codelab-expense-parser(или как-нибудь еще, что вы запомните) и выберите ближайший регион из списка. - Нажмите «Создать» , чтобы создать свой процессор.
- Скопируйте идентификатор процессора. Он понадобится вам в дальнейшем при работе с кодом.
- В Cloud Shell создайте хранилище (storage bucket), указав в качестве имени
PROJECT_ID-hitl-results:
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
- Привяжите свою учетную запись пользователя к роли администратора IAM в Vertex AI для вашего лабораторного проекта.
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin
4. Настройка взаимодействия человека с процессом.
В этом задании вам нужно будет настроить проверку данных человеком для созданного вами ранее процессора учета расходов.
- В консоли откройте меню «Навигация» и выберите «Документ AI» .
- Нажмите «Искусственный интеллект с участием человека» .

- Нажмите на
codelab-expense-parser, чтобы открыть страницу проверки человеком для обработчика платежей. - Нажмите «Настроить взаимодействие человека с системой» .

- Выберите фильтр на уровне документа .
- Установите ползунок «Порог доверия %» на 50%.
- Оставьте параметр «Специалисты» в значении «Использовать моих собственных специалистов» .

- В выпадающем списке «Специализированный бассейн» выберите «НОВЫЙ СПЕЦИАЛИЗИРОВАННЫЙ БАССЕЙН» .
- В диалоговом окне «Новый специализированный пул» в поле «Название пула » введите
Codelab HITL Pool. - Введите свой личный адрес электронной почты для связи с менеджерами и специалистами по бассейнам.
- Нажмите «Создать пул» .

Это займет несколько минут. Вы должны получить электронное письмо от Vertex AI noreply-vertex@google.com .
- Оставьте флажок «Автоматическое назначение» снятым.
- Установите флажок в разделе «Подтверждение платежей» .
- Щелкните по разделу «Инструкции» и скопируйте их в это место хранения: - НЕ включайте префикс
gs://в путь.
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
- В разделе «Расположение результатов » нажмите «Обзор» и выберите созданный ранее сегмент облачного хранилища.
- Нажмите «Выбрать» .
- Нажмите «Сохранить конфигурацию» .
В консоли отобразится сообщение «Настройка взаимодействия человека с пользователем» , на завершение процесса потребуется несколько минут.

- После завершения настройки консоль предложит вам включить режим "человек в контуре управления".
- Нажмите кнопку «Переключить», чтобы включить.
- Затем нажмите кнопку «Включить» во всплывающем диалоговом окне.

Загрузите образец формы отчета о расходах.
- У нас есть образец формы, хранящийся в Google Cloud Storage . Вы можете скачать его, используя кнопку или команду ниже:
gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
- После включения режима "Человек в контуре управления" нажмите кнопку " Загрузить документ" и найдите загруженный вами образец документа.
- Нажмите «Загрузить» и дождитесь завершения процесса.
5. Передать элемент на проверку человеку.
- На этой странице вы увидите ссылки на консоли управления бассейном и специализированные консоли. Эти ссылки также появятся в электронном письме от
Vertex AI noreply-vertex@google.com.- Они должны выглядеть примерно так:
https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks - Для открытия консоли менеджера нажмите на ссылку.
- Они должны выглядеть примерно так:

- В консоли разметки данных щелкните вкладку « Задачи» , чтобы открыть страницу назначения задач.
- Установите флажок «Не назначено» . Вы увидите, что в очереди задач codelab-expense-parser-P1 появилась новая запись.

- Выберите codelab-expense-parser-P1 .
- Нажмите «Управление назначением» .
- Введите свой личный адрес электронной почты в текстовое поле «Включить специалистов по электронной почте» , а затем выберите его из выпадающего списка.
- Нажмите «Применить» .
Теперь на экране отображается информация о том, что задача назначена вам. Возможно, потребуется несколько минут, чтобы это отобразилось.

- Выберите нового пользователя и нажмите на значок меню.
- В появившемся всплывающем меню нажмите кнопку «Назначить всем задачам» .

- Нажмите «Подтвердить изменения» .
- Нажмите «Подтвердить» .

6. Проведение проверки человеком.
- Вернитесь на страницу настройки «Человек в контуре управления» в облачной консоли.
Нажмите на ссылку, чтобы перейти в консоль специалиста (работника). Она будет выглядеть примерно так: https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx .
Должна открыться консоль пользователя, в которой отобразится ваша новая задача.

- Наведите курсор на строку, содержащую "Встреча с 4m" , и нажмите значок редактирования (карандаш).
- Измените значение, чтобы текст стал «Встреча с Адамом» . Возможно, вам придётся прокрутить текст вниз, чтобы увидеть новый текст.
- Нажмите «Применить» .
- Нажмите кнопку «Подтвердить» (зеленая галочка) для элемента ниже.

- Для остальных выделенных объектов нажмите значок «Подтвердить» .
- Нажмите «Отправить» . Задача проверки удалена из вашей очереди обработки меток.
7. Просмотр выполненных заданий
- Вернитесь в консоль менеджера.
- Нажмите «Задачи» и выберите «Выполняется».

- Специалисты Click.
- Выберите свой адрес электронной почты.
- Нажмите «Управление назначением» .
- Выберите специалиста по обработке расходов P1 из
Select specialists working on specific tasksиSelect tasks. Нажмите «Применить» для каждого выбранного специалиста. В контекстном меню для назначенного вам специалиста по обработке расходов P1 выберите «Просмотреть специалистов».

После того, как задача по разметке будет отправлена пользователем, количество выполненных задач и общее затраченное время будут обновлены, но отображение данных в этом разделе может занять несколько минут.
- Закройте всплывающее окно со списком специалистов и перейдите на вкладку «Специалисты» .
- Щелкните контекстное меню рядом с вашим именем пользователя и выберите «Просмотреть задачи» .
В этом представлении отображается список задач для пользователя, номера их выполнения и затраченное время, как показано ниже:

8. Поздравляем!
Поздравляем, вы успешно использовали функцию «человек в цикле» в Document AI для настройки ручной проверки документов, обрабатываемых с помощью процессора учета расходов Document AI.
Уборка
Чтобы избежать списания средств с вашего аккаунта Google Cloud за ресурсы, использованные в этом руководстве:
- В консоли Cloud перейдите на страницу «Управление ресурсами» .
- В списке проектов выберите свой проект и нажмите «Удалить».
- В диалоговом окне введите идентификатор проекта, а затем нажмите «Завершить», чтобы удалить проект.
Узнать больше
Продолжите изучение Document AI с помощью этих дополнительных практических занятий.
Ресурсы
- Будущее документов — плейлист на YouTube
- Документация по искусственному интеллекту
- Библиотека клиента Document AI Python
- Примеры документов, созданных с помощью ИИ.
Лицензия
Данная работа распространяется под лицензией Creative Commons Attribution 2.0 Generic.