Utiliser Procurement Document AI pour analyser vos factures à l'aide d'AI Platform Notebooks

1. Présentation

c65b9ae04aa1853.png

Qu'est-ce que Procurement Document AI ?

Les entreprises gèrent de grands pipelines d'approvisionnement, y compris des milliers de factures, de reçus et d'autres documents associés chaque année. Utilisez Procurement DocAI pour traiter intelligemment vos "données brutes" telles que les PDF, les images et les formulaires manuscrits afin de réduire la charge manuelle de votre cycle de vie des achats. Automatisez la capture de données d'approvisionnement à l'échelle requise en convertissant des documents non structurés comme des factures et des reçus en données structurées afin d'améliorer l'efficacité opérationnelle, d'améliorer l'expérience client et d'appuyer la prise de décisions.

Dans cet atelier de programmation, nous allons vous montrer comment configurer la plate-forme Document AI, traiter un exemple de facture, extraire et visualiser des entités dans un notebook AI Platform.

Points abordés

  • Premiers pas avec la plate-forme Document AI
  • Extraire des entités schématisées à l'aide de la solution Procurement DocAI
  • Créer et personnaliser une instance AI Platform Notebooks

Prérequis

  • Un projet Google Cloud
  • Un navigateur (Chrome ou Firefox, par exemple)
  • Connaissances sur Python 3

Enquête

Comment allez-vous utiliser ce tutoriel ?

Je vais le lire uniquement Je vais le lire et effectuer les exercices

Quel est votre niveau d'expérience avec Python ?

Débutant Intermédiaire Expert

Quel est votre niveau d'expérience avec les services Google Cloud ?

Débutant Intermédiaire Expert

2. Préparation

Configuration de l'environnement d'auto-formation

  1. Connectez-vous à Cloud Console, puis créez un projet ou réutilisez un projet existant. (Si vous n'avez pas encore de compte Gmail ou G Suite, vous devez en créer un.)

Mémorisez l'ID du projet. Il s'agit d'un nom unique permettant de différencier chaque projet Google Cloud. (Le nom ci-dessus est déjà pris. Vous devez en trouver un autre.) Vous devrez indiquer cet ID ultérieurement en tant que PROJECT_ID.

  1. Vous devez ensuite activer la facturation dans la console Cloud pour pouvoir utiliser les ressources Google Cloud.

Veillez à suivre les instructions figurant dans la section "Effectuer un nettoyage". Cette section vous indique comment arrêter les ressources afin d'éviter qu'elles ne vous soient facturées au-delà de ce tutoriel. Les nouveaux utilisateurs de Google Cloud peuvent participer au programme d'essai sans frais pour bénéficier d'un crédit de 300 $.

3. Activer l'API Cloud Document AI

Avant de pouvoir utiliser Document AI, vous devez activer l'API. Ouvrez Cloud Console dans votre navigateur.

  1. Cliquez sur le menu de navigation ☰ > API et services > Bibliothèque. API Search
  2. Recherchez "API Document AI", puis cliquez sur Activer pour utiliser l'API dans votre projet Google Cloud.

4. Créer et tester un outil de traitement

Vous devez d'abord créer une instance du processeur de l'analyseur de formulaires à utiliser dans la plate-forme Document AI lors de ce tutoriel.

  1. Dans la console, accédez à la page de présentation de la plate-forme Document AI.
  2. Cliquez sur Créer un processeur et sélectionnez Analyseur de facturesProcesseurs.
  3. Spécifiez un nom de processeur, puis sélectionnez votre région dans la liste.
  4. Cliquez sur Créer pour créer le processeur.
  5. Copiez votre ID de processeur. Vous devrez l'utiliser ultérieurement dans votre code.

(Facultatif) Vous pouvez tester votre processeur dans la console en important un document. Cliquez sur Upload Document (Importer un document), puis sélectionnez un formulaire à analyser. Vous pouvez télécharger et utiliser cet exemple de formulaire si vous n'en avez pas.

Facture

Le résultat doit se présenter comme suit : Facture analysée

5. Créer une instance AI Platform Notebook

Accédez à la section AI Platform Notebooks de la console Cloud, puis cliquez sur Nouvelle instance. Sélectionnez ensuite le dernier type d'instance Python :

a81c82876c6c16f9.png

Utilisez les options par défaut, puis cliquez sur Créer. Une fois l'instance créée, sélectionnez Ouvrir JupyterLab.

6. Obtenir l'exemple de code

Importez directement l'exemple de code depuis le dépôt GitHub Document AI Notebooks. Dans votre notebook, accédez à Git > Cloner un dépôt dans le menu du haut ou cliquez sur l'icône Git : Git.

Collez l'URL du dépôt suivante :

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Une fois le dépôt cloné, accédez au répertoire documentai-notebooks/specialized/ et ouvrez le notebook specialized_form_parser.ipynb. Recherchez la cellule dans laquelle les ID du projet GCP et du processeur Document AI sont déclarés.

vars

Collez l'ID de votre projet GCP et l'ID du processeur obtenus à l'étape 4. Enregistrez votre notebook.

7. Extraire et visualiser les entités

Vous pouvez à présent extraire les entités schématisées des factures et les scores de confiance correspondants. L'objet de réponse Document contient une liste d'entités. Pour en savoir plus sur les entités schématisées, consultez le guide de démarrage rapide de l'analyseur de factures.

Exécutez toutes les cellules de votre notebook et faites défiler la page jusqu'à la sortie tabulaire. Le code prior effectue une itération dans chaque entité et crée un DataFrame Pandas avec les résultats. table

Faites défiler la page vers le bas jusqu'au composant de visualisation. L'objet de réponse Document contient des informations sur la mise en page spatiale de chaque page du document. Vous trouverez ci-dessous les informations de mise en page de chaque champ de formulaire utilisées pour dessiner des cadres de sélection sur l'image. Ces données peuvent être utilisées pour intégrer Document AI dans une application frontend.

polys

8. Félicitations

Félicitations, vous avez utilisé la solution Document AI pour l'approvisionnement afin d'extraire des données d'une facture. Nous vous encourageons à tester d'autres types de formulaires.

Effectuer un nettoyage

Pour éviter que les ressources utilisées dans ce tutoriel soient facturées sur votre compte Google Cloud, vous pouvez arrêter votre notebook ou supprimer le projet GCP.

Arrêter une instance AI Platform Notebooks

Suivez ces instructions pour arrêter une instance AI Platform Notebooks.

Supprimer le projet

Le moyen le plus simple d'empêcher la facturation est de supprimer le projet que vous avez créé pour ce tutoriel.

Pour supprimer le projet :

  1. Dans la console GCP, accédez à la page Projets. Page "Projets"
  2. Dans la liste des projets, sélectionnez celui que vous souhaitez supprimer, puis cliquez sur Supprimer.
  3. Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.

En savoir plus

Licence

Ce document est publié sous une licence Creative Commons Attribution 2.0 Generic.