Используйте искусственный интеллект документации по закупкам для анализа счетов с помощью блокнотов платформы искусственного интеллекта

1. Обзор

c65b9ae04aa1853.png

Что такое искусственный интеллект в документах закупок?

Предприятия ежегодно обрабатывают большие объемы закупочных процессов, включая тысячи счетов-фактур, квитанций и других сопутствующих документов. Используйте Procurement DocAI для интеллектуальной обработки ваших «скрытых данных», таких как PDF-файлы, изображения и рукописные формы, чтобы сократить ручной труд на протяжении всего цикла закупок. Автоматизируйте сбор данных о закупках в больших масштабах, преобразуя неструктурированные документы, такие как счета-фактуры и квитанции, в структурированные данные, чтобы повысить операционную эффективность, улучшить качество обслуживания клиентов и принимать обоснованные решения.

В этом практическом занятии мы рассмотрим, как настроить платформу Document AI Platform, обработать пример счета-фактуры, извлечь и визуализировать сущности в блокноте AI Platform Notebook.

Что вы узнаете

  • Как начать работу с платформой Document AI
  • Извлечение схематизированных объектов с помощью решения Procurement DocAI.
  • Создайте и настройте экземпляр блокнотов AI Platform.

Что вам понадобится

  • Проект Google Cloud
  • Браузер, например Chrome или Firefox.
  • Знание Python 3

Опрос

Как вы будете использовать этот учебный материал?

Прочитайте только от начала до конца. Прочитайте текст и выполните упражнения.

Как бы вы оценили свой опыт работы с Python?

Новичок Средний Профессионал

Как бы вы оценили свой опыт использования сервисов Google Cloud?

Новичок Средний Профессионал

2. Настройка и требования

Настройка среды для самостоятельного обучения

  1. Войдите в Cloud Console и создайте новый проект или используйте существующий. (Если у вас еще нет учетной записи Gmail или G Suite, вам необходимо ее создать .)

Запомните идентификатор проекта (Project ID) — уникальное имя для всех проектов Google Cloud. (Ваше имя уже занято и вам не подойдёт, извините!). Этот идентификатор необходимо будет указать позже в формате PROJECT_ID .

  1. Далее, для использования ресурсов Google Cloud необходимо включить оплату в Cloud Console.

Обязательно следуйте инструкциям в разделе «Очистка». В этом разделе указано, как отключить ресурсы, чтобы избежать дополнительных расходов после завершения этого руководства. Новые пользователи Google Cloud имеют право на бесплатную пробную версию стоимостью 300 долларов США .

3. Включите API Cloud Document AI.

Прежде чем начать использовать Document AI, необходимо включить API. Откройте консоль Cloud в браузере.

  1. Нажмите меню навигации ☰ > API и сервисы > Библиотека . API поиска
  2. Найдите "Document AI API", затем нажмите " Включить" , чтобы использовать API в своем проекте Google Cloud.

4. Создайте и протестируйте процессор.

Для использования в этом руководстве необходимо сначала создать экземпляр процессора Form Parser, который будет применяться в платформе Document AI.

  1. В консоли перейдите к разделу «Обзор платформы Document AI».
  2. Нажмите «Создать обработчик» и выберите «Обработчик счетов». Процессоры
  3. Укажите название процессора и выберите свой регион из списка.
  4. Нажмите «Создать» , чтобы создать свой процессор.
  5. Скопируйте идентификатор вашего процессора. Он понадобится вам в дальнейшем при работе с кодом.

(Необязательно) Вы можете протестировать свой процессор в консоли, загрузив документ. Нажмите «Загрузить документ» и выберите форму для анализа. Вы можете загрузить и использовать этот образец формы, если у вас нет подходящей формы.

Счет

Результат должен выглядеть примерно так: Разобранный счет-фактура

5. Создайте блокнот для платформы ИИ.

Перейдите в раздел «Блокноты платформы ИИ» в консоли Cloud и нажмите «Создать экземпляр» . Затем выберите последний тип экземпляра Python :

a81c82876c6c16f9.png

Используйте параметры по умолчанию, а затем нажмите «Создать ». После создания экземпляра выберите «Открыть JupyterLab» .

6. Получите пример кода

Импортируйте пример кода непосредственно из репозитория Document AI Notebooks на GitHub . В своем блокноте перейдите в меню Git > Клонировать репозиторий или щелкните значок Git: Гит

Вставьте следующий URL-адрес репозитория:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

После клонирования репозитория перейдите в каталог documentai-notebooks/specialized/ и откройте блокнот specialized_form_parser.ipynb . Найдите ячейку, где указаны идентификаторы проекта GCP и обработчика Document AI.

варс

Вставьте идентификатор вашего проекта GCP и идентификатор процессора из шага 4. Сохраните свой блокнот.

7. Извлечение и визуализация сущностей.

Теперь вы можете извлечь схематизированные сущности из счетов-фактур и соответствующие им оценки достоверности. Объект ответа Document содержит список сущностей. Чтобы узнать больше о схематизированных сущностях, ознакомьтесь с кратким руководством по работе с парсером счетов-фактур.

Запустите все ячейки в вашем блокноте и прокрутите вниз до табличного вывода. Предварительно приведенный код перебирает каждую сущность и создает DataFrame Pandas с результатами. стол

Теперь прокрутите вниз до компонента визуализации. Объект Document содержит информацию о пространственном расположении каждой страницы документа. Ниже информация о расположении каждого поля формы используется для построения ограничивающих рамок на изображении. Эти данные можно использовать для интеграции Document AI во фронтенд-приложение.

полисы

8. Поздравляем!

Поздравляем, вы успешно использовали решение Procurment Document AI для извлечения данных из счета-фактуры. Мы рекомендуем вам поэкспериментировать с другими типами форм.

Уборка

Чтобы избежать списания средств с вашего аккаунта Google Cloud за ресурсы, использованные в этом руководстве, вы можете либо закрыть свой ноутбук, либо удалить проект GCP.

Завершение работы экземпляра AI Platform Notebooks

Следуйте этим инструкциям, чтобы завершить работу экземпляра AI Platform Notebooks .

Удаление проекта

Самый простой способ избежать выставления счетов — удалить проект, созданный для этого урока.

Чтобы удалить проект:

  1. В консоли GCP перейдите на страницу «Проекты» . Страница «Проекты»
  2. В списке проектов выберите проект, который хотите удалить, и нажмите «Удалить» .
  3. В диалоговом окне введите идентификатор проекта, затем нажмите «Завершить» , чтобы удалить проект.

Узнать больше

Лицензия

Данная работа распространяется под лицензией Creative Commons Attribution 2.0 Generic.