Документ AI: Человек в курсе

1. Введение

Document AI API — это решение для анализа документов, которое обрабатывает неструктурированные данные, такие как документы, электронные письма и т. д., и упрощает их понимание, анализ и использование.

Благодаря проверке человеком можно добиться более высокой точности обработки документов, гарантируя её достоверность. Проверка человеком повышает точность и помогает компаниям оценивать прогнозы с помощью специально разработанных инструментов, позволяющих проводить такие проверки. В этой лабораторной работе вы настроите и протестируете процессор учета расходов с использованием проверки человеком, чтобы подтвердить результаты работы процессора с помощью инструментов настройки и управления с участием человека.

Предварительные требования

Данный практический семинар основан на материалах других практических семинаров по искусственному интеллекту для работы с документами.

Перед продолжением рекомендуется выполнить следующие практические задания (Codelabs).

Что вы узнаете

  • Настройте проверку данных человеком для обработчика.
  • Создайте пул ресурсов для проведения экспертной оценки.
  • Создайте тестовую задачу для проверки человеком.
  • Назначьте пользователю задачу по проверке человеком.
  • Проведите проверку документа человеком.

Что вам понадобится

  • Проект Google Cloud
  • Браузер, например Chrome или Firefox.
  • Знание Python 3

2. Настройка

В этом практическом занятии предполагается, что вы выполнили шаги по настройке Document AI, описанные во вводном практическом занятии .

Перед продолжением выполните следующие шаги:

Вам также потребуется включить API Vertex AI.

  1. Воспользуйтесь строкой поиска в верхней части консоли, найдите "Vertex AI API", затем нажмите " Включить" , чтобы использовать API в вашем проекте Google Cloud.
  2. В качестве альтернативы, API можно включить с помощью следующей команды gcloud .
gcloud services enable aiplatform.googleapis.com

3. Создайте процессор.

Для выполнения этой лабораторной работы необходимо сначала создать экземпляр обработчика расходов.

  1. В консоли перейдите к разделу «Обзор платформы Document AI».
  2. Нажмите «Создать обработчик» , прокрутите вниз до раздела «Специализированные» и выберите «Обработчик расходов» .
  3. Назовите его codelab-expense-parser (или как-нибудь еще, что вы запомните) и выберите ближайший регион из списка.
  4. Нажмите «Создать» , чтобы создать свой процессор.
  5. Скопируйте идентификатор процессора. Он понадобится вам в дальнейшем при работе с кодом.
  6. В Cloud Shell создайте хранилище (storage bucket), указав в качестве имени PROJECT_ID-hitl-results :
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
  1. Привяжите свою учетную запись пользователя к роли администратора IAM в Vertex AI для вашего лабораторного проекта.
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin

4. Настройка взаимодействия человека с процессом.

В этом задании вам нужно будет настроить проверку данных человеком для созданного вами ранее процессора учета расходов.

  1. В консоли откройте меню «Навигация» и выберите «Документ AI» .
  2. Нажмите «Искусственный интеллект с участием человека» . HITLMenu
  3. Нажмите на codelab-expense-parser , чтобы открыть страницу проверки человеком для обработчика платежей.
  4. Нажмите «Настроить взаимодействие человека с системой» .

ConfigureHITL

  1. Выберите фильтр на уровне документа .
  2. Установите ползунок «Порог доверия %» на 50%.
  3. Оставьте параметр «Специалисты» в значении «Использовать моих собственных специалистов» .

HITLFilters

  1. В выпадающем списке «Специализированный бассейн» выберите «НОВЫЙ СПЕЦИАЛИЗИРОВАННЫЙ БАССЕЙН» .
  2. В диалоговом окне «Новый специализированный пул» в поле «Название пула » введите Codelab HITL Pool .
  3. Введите свой личный адрес электронной почты для связи с менеджерами и специалистами по бассейнам.
  4. Нажмите «Создать пул» .

HITLSpecialistPool

Это займет несколько минут. Вы должны получить электронное письмо от Vertex AI noreply-vertex@google.com .

  1. Оставьте флажок «Автоматическое назначение» снятым.
  2. Установите флажок в разделе «Подтверждение платежей» .
  3. Щелкните по разделу «Инструкции» и скопируйте их в это место хранения: - НЕ включайте префикс gs:// в путь.
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
  1. В разделе «Расположение результатов » нажмите «Обзор» и выберите созданный ранее сегмент облачного хранилища.
  2. Нажмите «Выбрать» .
  3. Нажмите «Сохранить конфигурацию» .

В консоли отобразится сообщение «Настройка взаимодействия человека с пользователем» , на завершение процесса потребуется несколько минут.

HITLLoading

  1. После завершения настройки консоль предложит вам включить режим "человек в контуре управления".
  • Нажмите кнопку «Переключить», чтобы включить.
  • Затем нажмите кнопку «Включить» во всплывающем диалоговом окне.

HITLEnable

Загрузите образец формы отчета о расходах.

  1. У нас есть образец формы, хранящийся в Google Cloud Storage . Вы можете скачать его, используя кнопку или команду ниже:

gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
  1. После включения режима "Человек в контуре управления" нажмите кнопку " Загрузить документ" и найдите загруженный вами образец документа.
  2. Нажмите «Загрузить» и дождитесь завершения процесса.

5. Передать элемент на проверку человеку.

  1. На этой странице вы увидите ссылки на консоли управления бассейном и специализированные консоли. Эти ссылки также появятся в электронном письме от Vertex AI noreply-vertex@google.com .
    • Они должны выглядеть примерно так: https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks
    • Для открытия консоли менеджера нажмите на ссылку.

  1. В консоли разметки данных щелкните вкладку « Задачи» , чтобы открыть страницу назначения задач.
  2. Установите флажок «Не назначено» . Вы увидите, что в очереди задач codelab-expense-parser-P1 появилась новая запись.

изображение

  1. Выберите codelab-expense-parser-P1 .
  2. Нажмите «Управление назначением» .
  3. Введите свой личный адрес электронной почты в текстовое поле «Включить специалистов по электронной почте» , а затем выберите его из выпадающего списка.
  4. Нажмите «Применить» .

Теперь на экране отображается информация о том, что задача назначена вам. Возможно, потребуется несколько минут, чтобы это отобразилось.

изображение

  1. Выберите нового пользователя и нажмите на значок меню.
  2. В появившемся всплывающем меню нажмите кнопку «Назначить всем задачам» .

изображение

  1. Нажмите «Подтвердить изменения» .
  2. Нажмите «Подтвердить» .

изображение

6. Проведение проверки человеком.

  1. Вернитесь на страницу настройки «Человек в контуре управления» в облачной консоли.

Нажмите на ссылку, чтобы перейти в консоль специалиста (работника). Она будет выглядеть примерно так: https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx .

Должна открыться консоль пользователя, в которой отобразится ваша новая задача.

изображение

  1. Наведите курсор на строку, содержащую "Встреча с 4m" , и нажмите значок редактирования (карандаш).
  2. Измените значение, чтобы текст стал «Встреча с Адамом» . Возможно, вам придётся прокрутить текст вниз, чтобы увидеть новый текст.
  3. Нажмите «Применить» .
  4. Нажмите кнопку «Подтвердить» (зеленая галочка) для элемента ниже. изображение
  5. Для остальных выделенных объектов нажмите значок «Подтвердить» .
  6. Нажмите «Отправить» . Задача проверки удалена из вашей очереди обработки меток.

7. Просмотр выполненных заданий

  1. Вернитесь в консоль менеджера.
  2. Нажмите «Задачи» и выберите «Выполняется». изображение
  3. Специалисты Click.
  4. Выберите свой адрес электронной почты.
  5. Нажмите «Управление назначением» .
  6. Выберите специалиста по обработке расходов P1 из Select specialists working on specific tasks и Select tasks . Нажмите «Применить» для каждого выбранного специалиста. В контекстном меню для назначенного вам специалиста по обработке расходов P1 выберите «Просмотреть специалистов».

изображение

После того, как задача по разметке будет отправлена ​​пользователем, количество выполненных задач и общее затраченное время будут обновлены, но отображение данных в этом разделе может занять несколько минут.

  1. Закройте всплывающее окно со списком специалистов и перейдите на вкладку «Специалисты» .
  2. Щелкните контекстное меню рядом с вашим именем пользователя и выберите «Просмотреть задачи» .

В этом представлении отображается список задач для пользователя, номера их выполнения и затраченное время, как показано ниже:

изображение

8. Поздравляем!

Поздравляем, вы успешно использовали функцию «человек в цикле» в Document AI для настройки ручной проверки документов, обрабатываемых с помощью процессора учета расходов Document AI.

Уборка

Чтобы избежать списания средств с вашего аккаунта Google Cloud за ресурсы, использованные в этом руководстве:

  • В консоли Cloud перейдите на страницу «Управление ресурсами» .
  • В списке проектов выберите свой проект и нажмите «Удалить».
  • В диалоговом окне введите идентификатор проекта, а затем нажмите «Завершить», чтобы удалить проект.

Узнать больше

Продолжите изучение Document AI с помощью этих дополнительных практических занятий.

Ресурсы

Лицензия

Данная работа распространяется под лицензией Creative Commons Attribution 2.0 Generic.