Sử dụng AI trong tài liệu mua sắm để phân tích cú pháp hoá đơn bằng Sổ tay trên nền tảng AI

1. Tổng quan

c65b9ae04aa1853.png

AI đối với tài liệu mua hàng là gì?

Các doanh nghiệp quản lý các quy trình mua sắm lớn bao gồm hàng nghìn hoá đơn, biên lai và các chứng từ liên quan khác mỗi năm. Sử dụng DocAI mua hàng để xử lý "dữ liệu tối" của bạn một cách thông minh chẳng hạn như tệp pdf, hình ảnh và biểu mẫu viết tay để giảm chi phí thủ công trong vòng đời mua hàng. Tự động thu thập dữ liệu quy trình mua hàng trên quy mô lớn bằng cách biến các tài liệu không theo cấu trúc (như hoá đơn và biên lai) thành dữ liệu có cấu trúc để tăng hiệu quả hoạt động, cải thiện trải nghiệm của khách hàng và cung cấp thông tin cho việc ra quyết định.

Trong lớp học lập trình này, chúng ta sẽ tìm hiểu cách thiết lập Nền tảng AI tạo tài liệu, cách xử lý hoá đơn mẫu, trích xuất và trực quan hoá các thực thể trong Sổ tay nền tảng AI.

Kiến thức bạn sẽ học được

  • Cách bắt đầu sử dụng Nền tảng AI cho tài liệu
  • Trích xuất các thực thể được giản đồ bằng giải pháp Mua sắm DocumentAI
  • Tạo và tuỳ chỉnh một thực thể của Sổ tay trên nền tảng AI

Bạn cần có

  • Một dự án trong Google Cloud
  • Một trình duyệt, chẳng hạn như Chrome hoặc Firefox
  • Kiến thức về Python 3

Khảo sát

Bạn sẽ sử dụng hướng dẫn này như thế nào?

Chỉ có thể đọc Đọc và hoàn thành bài tập

Bạn đánh giá thế nào về trải nghiệm sử dụng Python?

Người mới tập Trung cấp Thành thạo

Bạn đánh giá thế nào về trải nghiệm sử dụng các dịch vụ của Google Cloud?

Người mới tập Trung cấp Thành thạo

2. Thiết lập và yêu cầu

Thiết lập môi trường theo tiến độ riêng

  1. Đăng nhập vào Cloud Console rồi tạo dự án mới hoặc sử dụng lại dự án hiện có. (Nếu chưa có tài khoản Gmail hoặc G Suite, bạn phải tạo một tài khoản.)

Ghi nhớ mã dự án, tên duy nhất của tất cả dự án trên Google Cloud. (Rất tiếc, tên của bạn ở trên đã được sử dụng và sẽ không có hiệu lực cho bạn!). Sau này, bạn phải cung cấp mã nhận dạng này bằng tên PROJECT_ID.

  1. Tiếp theo, bạn phải bật tính năng thanh toán trong Cloud Console để sử dụng tài nguyên của Google Cloud.

Hãy nhớ làm theo mọi hướng dẫn trong phần "Dọn dẹp" . Phần này sẽ tư vấn cho bạn cách tắt các tài nguyên để bạn không phải chịu thanh toán ngoài hướng dẫn này. Người dùng mới của Google Cloud đủ điều kiện tham gia chương trình Dùng thử miễn phí 300 USD.

3. Bật Cloud Document AI API

Bạn phải bật API thì mới có thể bắt đầu sử dụng Document AI. Mở Cloud Console trong trình duyệt.

  1. Nhấp vào Trình đơn điều hướng ↗ > API và Dịch vụ > Thư viện. API Tìm kiếm
  2. Tìm "Document AI API" (API AI của tài liệu), rồi nhấp vào Bật để sử dụng API trong dự án Google Cloud

4. Tạo và kiểm thử bộ xử lý

Trước tiên, bạn phải tạo một thực thể của trình xử lý Trình phân tích cú pháp biểu mẫu để dùng trong Nền tảng AI của tài liệu cho hướng dẫn này.

  1. Trong bảng điều khiển, hãy chuyển đến phần Tổng quan về nền tảng AI cho tài liệu
  2. Nhấp vào Tạo đơn vị xử lý rồi chọn Trình phân tích cú pháp hoá đơnBộ xử lý
  3. Chỉ định tên đơn vị xử lý rồi chọn khu vực của bạn trong danh sách.
  4. Nhấp vào Tạo để tạo bộ xử lý
  5. Sao chép mã nhận dạng đơn vị xử lý. Bạn phải sử dụng mã này sau này.

(Không bắt buộc) Bạn có thể kiểm tra bộ xử lý của mình trong bảng điều khiển bằng cách tải một tài liệu lên. Nhấp vào Tải tài liệu lên và chọn một biểu mẫu để phân tích cú pháp. Bạn có thể tải xuống và sử dụng biểu mẫu mẫu này nếu không có sẵn biểu mẫu để sử dụng.

Hóa đơn

Kết quả đầu ra sẽ có dạng như sau: Hoá đơn được phân tích cú pháp

5. Tạo Sổ tay nền tảng AI

Chuyển đến mục Sổ tay trên nền tảng AI trên Cloud Console rồi nhấp vào Phiên bản mới. Sau đó, hãy chọn loại thực thể Python mới nhất:

a81c82876c6c16f9.png

Sử dụng các tuỳ chọn mặc định rồi nhấp vào Tạo. Sau khi tạo phiên bản, hãy chọn Open JupyterLab.

6. Nhận mã mẫu

Nhập trực tiếp mã mẫu từ Document AI Notebooks GitHub Repo. Trong sổ tay của bạn, hãy chuyển đến Git > Nhân bản một Kho lưu trữ ở trình đơn trên cùng hoặc nhấp vào biểu tượng Git: Git

Dán vào URL kho lưu trữ sau đây:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Sau khi kho lưu trữ được sao chép, hãy nhấp vào thư mục documentai-notebooks/specialized/ rồi mở sổ tay specialized_form_parser.ipynb. Tìm ô để khai báo Mã trình xử lý AI của tài liệu và dự án GCP.

biến

Dán Mã dự án GCP và Mã bộ xử lý ở bước 4. Lưu sổ tay của bạn.

7. Trích xuất và trực quan hoá các thực thể

Giờ đây, bạn có thể trích xuất các thực thể được giản đồ từ hoá đơn và điểm tin cậy tương ứng của chúng. Đối tượng phản hồi Document chứa danh sách các thực thể. Để đọc thêm về các thực thể được giản đồ, hãy đọc phần Bắt đầu nhanh về Trình phân tích cú pháp hoá đơn.

Chạy tất cả các ô trong sổ tay rồi di chuyển xuống kết quả dạng bảng. Mã nguồn trước đó lặp lại qua từng thực thể và tạo một Khung dữ liệu của Pandas kèm theo kết quả. bàn

Giờ hãy di chuyển xuống dưới đây để chuyển đến thành phần hình ảnh trực quan. Phản hồi đối tượng Tài liệu chứa thông tin bố cục không gian cho từng trang trong tài liệu. Dưới đây, thông tin bố cục trên mỗi trường biểu mẫu được dùng để vẽ các hộp giới hạn trên hình ảnh. Bạn có thể dùng dữ liệu này để tích hợp Document AI vào một ứng dụng giao diện người dùng.

hình nhiều hình

8. Xin chúc mừng

Xin chúc mừng! Bạn đã sử dụng thành công Giải pháp AI trong tài liệu mua hàng để trích xuất dữ liệu từ hoá đơn. Bạn nên thử nghiệm với các loại biểu mẫu khác.

Dọn dẹp

Để tránh làm phát sinh tài khoản Google Cloud của bạn cho các tài nguyên được sử dụng trong hướng dẫn này, bạn có thể tắt sổ tay của mình hoặc xoá Dự án GCP.

Tắt phiên bản Sổ tay trên nền tảng AI

Hãy làm theo các hướng dẫn này để tắt một phiên bản Sổ tay nền tảng AI.

Xoá dự án

Cách dễ nhất để loại bỏ việc thanh toán là xoá dự án bạn đã tạo cho phần hướng dẫn.

Cách xoá dự án:

  1. Trong Bảng điều khiển GCP, hãy chuyển đến trang Dự án. Trang Dự án
  2. Trong danh sách dự án, hãy chọn dự án mà bạn muốn xoá rồi nhấp vào Delete (Xoá).
  3. Trong hộp thoại, hãy nhập mã dự án rồi nhấp vào Tắt để xoá dự án.

Tìm hiểu thêm

Giấy phép

Tác phẩm này được cấp phép theo Giấy phép chung Ghi nhận tác giả Creative Commons 2.0.