Utiliser Document AI pour l'approvisionnement pour analyser vos factures à l'aide d'AI Platform Notebooks
À propos de cet atelier de programmation
1. Présentation
Qu'est-ce que Document AI pour l'approvisionnement ?
Les entreprises gèrent chaque année de grands pipelines d'approvisionnement comprenant des milliers de factures, de reçus et d'autres documents associés. Utilisez Procurement DocAI pour traiter intelligemment vos "données obscures" telles que les PDF, les images et les formulaires manuscrits afin de réduire les frais généraux manuels de votre cycle d'approvisionnement. Automatisez la capture de données d'approvisionnement à l'échelle requise en convertissant des documents non structurés comme des factures et des reçus en données structurées afin d'améliorer l'efficacité opérationnelle, d'améliorer l'expérience client et d'appuyer la prise de décisions.
Dans cet atelier de programmation, nous allons voir comment configurer la plate-forme Document AI, traiter un exemple de facture, extraire et visualiser des entités dans un notebook AI Platform.
Points abordés
- Premiers pas avec la plate-forme Document AI
- Extraire des entités schématisées à l'aide de la solution Procurement DocAI
- Créer et personnaliser une instance AI Platform Notebooks
Prérequis
Enquête
Comment allez-vous utiliser ce tutoriel ?
Quel est votre niveau d'expérience avec Python ?
Quel est votre niveau d'expérience avec les services Google Cloud ?
2. Préparation
Configuration de l'environnement d'auto-formation
- Connectez-vous à Cloud Console, puis créez un projet ou réutilisez un projet existant. (Si vous n'avez pas encore de compte Gmail ou G Suite, vous devez en créer un.)
Mémorisez l'ID du projet. Il s'agit d'un nom unique permettant de différencier chaque projet Google Cloud. (Le nom ci-dessus est déjà pris. Vous devez en trouver un autre.) Vous devrez indiquer cet ID ultérieurement en tant que PROJECT_ID
.
- Vous devez ensuite activer la facturation dans la console Cloud pour pouvoir utiliser les ressources Google Cloud.
Veillez à suivre les instructions figurant dans la section "Effectuer un nettoyage". Cette section vous indique comment arrêter les ressources afin d'éviter qu'elles ne vous soient facturées au-delà de ce tutoriel. Les nouveaux utilisateurs de Google Cloud peuvent participer au programme d'essai sans frais pour bénéficier d'un crédit de 300 $.
3. Activer l'API Cloud Document AI
Avant de pouvoir utiliser Document AI, vous devez activer l'API. Ouvrez Cloud Console dans votre navigateur.
- Cliquez sur le menu de navigation ☰ > API et services > Bibliothèque.
- Recherchez "API Document AI", puis cliquez sur Activer pour utiliser l'API dans votre projet Google Cloud.
4. Créer et tester un outil de traitement
Vous devez d'abord créer une instance du processeur de l'analyseur de formulaires à utiliser dans la plate-forme Document AI lors de ce tutoriel.
- Dans la console, accédez à la page de présentation de la plate-forme Document AI.
- Cliquez sur Create Processor (Créer un processeur), puis sélectionnez Invoice Parser (Analyseur de factures).
- Spécifiez un nom de processeur, puis sélectionnez votre région dans la liste.
- Cliquez sur Créer pour créer le processeur.
- Copiez votre ID de processeur. Vous devrez l'utiliser ultérieurement dans votre code.
(Facultatif) Vous pouvez tester votre processeur dans la console en important un document. Cliquez sur Upload Document (Importer un document), puis sélectionnez un formulaire à analyser. Vous pouvez télécharger et utiliser cet exemple de formulaire si vous n'en avez pas.
Le résultat doit se présenter comme suit:
5. Créer une instance AI Platform Notebook
Accédez à la section AI Platform Notebooks de la console Cloud, puis cliquez sur Nouvelle instance. Sélectionnez ensuite le dernier type d'instance Python:
Utilisez les options par défaut, puis cliquez sur Créer. Une fois l'instance créée, sélectionnez Ouvrir JupyterLab.
6. Obtenir l'exemple de code
Importez directement l'exemple de code à partir du dépôt GitHub des notebooks Document AI. Dans votre notebook, accédez à Git > Cloner un dépôt dans le menu supérieur ou cliquez sur l'icône Git: .
Collez l'URL du dépôt suivante:
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
Une fois le dépôt cloné, accédez au répertoire documentai-notebooks/specialized/ et ouvrez le notebook specialized_form_parser.ipynb
. Recherchez la cellule dans laquelle les ID du projet GCP et du processeur Document AI sont déclarés.
Collez l'ID de votre projet GCP et l'ID du processeur obtenus à l'étape 4. Enregistrez votre notebook.
7. Extraire et visualiser les entités
Vous pouvez à présent extraire les entités schématisées des factures et les scores de confiance correspondants. L'objet de réponse Document contient une liste d'entités. Pour en savoir plus sur les entités schématisées, consultez le guide de démarrage rapide de l'analyseur de factures.
Exécutez toutes les cellules de votre notebook, puis faites défiler la page jusqu'à la sortie sous forme de tableau. Le code précédent itère dans chaque entité et crée un DataFrame Pandas avec les résultats.
Faites maintenant défiler la page vers le bas jusqu'au composant de visualisation. La réponse de l'objet Document contient des informations sur la mise en page spatiale pour chaque page du document. Ci-dessous, les informations de mise en page de chaque champ de formulaire sont utilisées pour dessiner des cadres de délimitation sur l'image. Ces données peuvent être utilisées pour intégrer Document AI à une application frontale.
8. Félicitations
Félicitations, vous avez réussi à utiliser la solution Document AI pour les achats afin d'extraire des données d'une facture. Nous vous encourageons à tester d'autres types de formulaires.
Effectuer un nettoyage
Pour éviter que les ressources utilisées lors de ce tutoriel soient facturées sur votre compte Google Cloud, vous pouvez arrêter votre notebook ou supprimer le projet GCP.
Arrêter une instance AI Platform Notebooks
Suivez ces instructions pour arrêter une instance AI Platform Notebooks.
Supprimer le projet
Le moyen le plus simple d'empêcher la facturation est de supprimer le projet que vous avez créé pour ce tutoriel.
Pour supprimer le projet :
- Dans la console GCP, accédez à la page Projets. Page "Projets"
- Dans la liste des projets, sélectionnez celui que vous souhaitez supprimer, puis cliquez sur Supprimer.
- Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.