از هوش مصنوعی سند تدارکات برای تجزیه فاکتورهای خود با استفاده از نوت بوک های پلتفرم هوش مصنوعی استفاده کنید

از هوش مصنوعی سند تدارکات برای تجزیه فاکتورهای خود با استفاده از نوت بوک های پلتفرم هوش مصنوعی استفاده کنید

درباره این codelab

subjectآخرین به‌روزرسانی: ژانویه ۲۴, ۲۰۲۲
account_circleنویسنده: Anu Srivastava

1. نمای کلی

c65b9ae04aa1853.png

هوش مصنوعی سند تدارکات چیست؟

شرکت ها خطوط لوله تدارکات بزرگ شامل هزاران صورتحساب، رسید و سایر اسناد مرتبط را هر ساله مدیریت می کنند. از Procurement DocAI برای پردازش هوشمندانه «داده‌های تاریک» خود مانند پی‌دی‌اف، تصاویر و فرم‌های دست‌نویس استفاده کنید تا هزینه‌های دستی چرخه عمر تدارکات خود را کاهش دهید. با تبدیل اسناد بدون ساختار مانند فاکتورها و رسیدها به داده های ساختاریافته برای افزایش کارایی عملیاتی، بهبود تجربه مشتری و اطلاع رسانی در تصمیم گیری، جمع آوری داده های تدارکات را در مقیاس خودکار کنید.

در این کد لبه به نحوه راه اندازی Document AI Platform، پردازش نمونه فاکتور، استخراج و تجسم موجودیت ها در یک Notebook پلتفرم هوش مصنوعی خواهیم پرداخت.

چیزی که یاد خواهید گرفت

  • چگونه با پلتفرم Document AI شروع کنیم
  • با استفاده از راه حل DocAI Procurement، موجودیت های طرحواره شده را استخراج کنید
  • یک نمونه نوت بوک پلتفرم هوش مصنوعی ایجاد و سفارشی کنید

آنچه شما نیاز دارید

  • یک پروژه Google Cloud
  • یک مرورگر، مانند کروم یا فایرفاکس
  • آشنایی با پایتون 3

نظرسنجی

چگونه از این آموزش استفاده خواهید کرد؟

تجربه خود را با پایتون چگونه ارزیابی می کنید؟

تجربه خود را در استفاده از خدمات Google Cloud چگونه ارزیابی می کنید؟

2. راه اندازی و الزامات

تنظیم محیط خود به خود

  1. به کنسول Cloud وارد شوید و یک پروژه جدید ایجاد کنید یا از یک موجود استفاده مجدد کنید. (اگر قبلاً یک حساب Gmail یا G Suite ندارید، باید یک حساب ایجاد کنید .)

شناسه پروژه را به خاطر بسپارید، یک نام منحصر به فرد در تمام پروژه های Google Cloud. (نام شما در بالا قبلاً گرفته شده است و برای شما کار نخواهد کرد، متاسفم!). شما باید این شناسه را بعداً به عنوان PROJECT_ID ارائه دهید.

  1. در مرحله بعد، برای استفاده از منابع Google Cloud، باید صورتحساب را در Cloud Console فعال کنید .

حتماً دستورالعمل‌های موجود در بخش «تمیز کردن» را دنبال کنید. این بخش به شما توصیه می کند که چگونه منابع را خاموش کنید تا بیش از این آموزش متحمل صورتحساب نشوید. کاربران جدید Google Cloud واجد شرایط برنامه آزمایشی رایگان 300 دلاری هستند.

3. Cloud Document AI API را فعال کنید

قبل از شروع استفاده از Document AI، باید API را فعال کنید. Cloud Console را در مرورگر خود باز کنید.

  1. روی منوی پیمایش ☰ > APIs & Services > Library کلیک کنید. جستجوی API
  2. «Document AI API» را جستجو کنید، سپس روی Enable کلیک کنید تا از API در پروژه Google Cloud خود استفاده کنید

4. یک پردازنده ایجاد و آزمایش کنید

ابتدا باید یک نمونه از پردازشگر Form Parser ایجاد کنید تا در Document AI Platform برای این آموزش استفاده کنید.

  1. در کنسول، به Document AI Platform Overview بروید
  2. روی Create Processor کلیک کنید و Invoice Parser را انتخاب کنید پردازنده ها
  3. نام پردازنده را مشخص کنید و منطقه خود را از لیست انتخاب کنید.
  4. برای ایجاد پردازنده خود روی Create کلیک کنید
  5. شناسه پردازنده خود را کپی کنید. بعدا باید از این در کد خود استفاده کنید.

(اختیاری) می توانید با آپلود یک سند، پردازنده خود را در کنسول آزمایش کنید. روی آپلود سند کلیک کنید و فرمی را برای تجزیه انتخاب کنید. اگر فرمی برای استفاده در دسترس ندارید، می توانید این نمونه فرم را دانلود و استفاده کنید.

فاکتور

خروجی باید به این شکل باشد: فاکتور تجزیه شده

5. یک نوت بوک پلتفرم هوش مصنوعی بسازید

به بخش AI Platform Notebooks در Cloud Console خود بروید و روی New Instance کلیک کنید. سپس آخرین نوع نمونه پایتون را انتخاب کنید:

a81c82876c6c16f9.png

از گزینه های پیش فرض استفاده کنید و سپس روی ایجاد کلیک کنید. پس از ایجاد نمونه، Open JupyterLab را انتخاب کنید.

6. کد نمونه را دریافت کنید

به طور مستقیم کد نمونه را از Document AI Notebooks Github Repo وارد کنید. در نوت بوک خود، یا به Git > Clone a Repository در منوی بالا بروید یا روی نماد Git کلیک کنید: Git

URL مخزن زیر را بچسبانید:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

پس از کلون شدن مخزن، از طریق دایرکتوری documentai-notebooks/specialized/ کلیک کنید و دفترچه specialized_form_parser.ipynb را باز کنید. سلولی را پیدا کنید که شناسه های پردازشگر پروژه GCP و AI سند اعلام شده است.

vars

شناسه پروژه GCP و شناسه پردازنده خود را از مرحله 4 جایگذاری کنید. نوت بوک خود را ذخیره کنید.

7. موجودیت ها را استخراج و تجسم کنید

اکنون می توانید موجودیت های طرحواره شده را از فاکتورها و امتیازهای اطمینان مربوط به آنها استخراج کنید. شی Document Response شامل لیستی از موجودیت ها است. برای مطالعه بیشتر در مورد موجودیت های طرحواره شده، شروع سریع تجزیه کننده فاکتور را بخوانید.

تمام سلول های نوت بوک خود را اجرا کنید و به سمت خروجی جدولی حرکت کنید. کد قبلی از طریق هر موجودیت تکرار می شود و یک Pandas DataFrame با نتایج ایجاد می کند. جدول

اکنون به قسمت تصویرسازی زیر بروید. پاسخ شی Document حاوی اطلاعات طرح بندی فضایی برای هر صفحه در سند است. در زیر، اطلاعات طرح بندی در هر فیلد فرم برای ترسیم کادرهای محدود کننده روی تصویر استفاده می شود. این داده ها را می توان برای ادغام Document AI در یک برنامه frontend استفاده کرد.

پلی

8. تبریک میگم

تبریک می گوییم، شما با موفقیت از راه حل هوش مصنوعی سند تدارکات برای استخراج داده ها از یک فاکتور استفاده کردید. ما شما را تشویق می کنیم که انواع فرم های دیگر را آزمایش کنید.

پاک کردن

برای جلوگیری از تحمیل هزینه به حساب Google Cloud خود برای منابع استفاده شده در این آموزش، می توانید دفترچه یادداشت خود را خاموش کنید یا پروژه GCP را حذف کنید.

خاموش کردن نمونه نوت‌بوک‌های پلتفرم هوش مصنوعی

برای خاموش کردن نمونه نوت‌بوک‌های پلتفرم هوش مصنوعی، این دستورالعمل‌ها را دنبال کنید.

حذف پروژه

ساده ترین راه برای حذف صورتحساب، حذف پروژه ای است که برای آموزش ایجاد کرده اید.

برای حذف پروژه:

  1. در کنسول GCP، به صفحه پروژه ها بروید. صفحه پروژه ها
  2. در لیست پروژه، پروژه ای را که می خواهید حذف کنید انتخاب کنید و روی Delete کلیک کنید.
  3. در گفتگو، شناسه پروژه را تایپ کنید، سپس روی Shut down کلیک کنید تا پروژه حذف شود.

بیشتر بدانید

مجوز

این اثر تحت مجوز Creative Commons Attribution 2.0 Generic مجوز دارد.