Thông tin chi tiết về mô hình ngôn ngữ lớn (LLM) tại chỗ: BigQuery và Gemini cho Phân tích dữ liệu có cấu trúc và phi cấu trúc

1. Giới thiệu

Tập dữ liệu khổng lồ chứa thông tin chi tiết có giá trị nhưng việc trích xuất thông tin có ý nghĩa có thể là một nhiệm vụ khó khăn. Các công cụ phân tích truyền thống thường thiếu thông tin trong việc đưa ra những lời giải thích cặn kẽ, giống con người để giúp chúng tôi thực sự hiểu rõ câu chuyện trong dữ liệu của mình. Kho dữ liệu ngày càng lưu giữ ngày càng nhiều dữ liệu phi cấu trúc, nhưng không phải lúc nào cũng có thể truy cập vào dữ liệu đó để thu thập thông tin chi tiết. Văn bản, hình ảnh và video phi cấu trúc chứa thông tin có giá trị để phát triển doanh nghiệp của bạn. Các LLM cung cấp một cách thức mới mạnh mẽ để hiểu dữ liệu của bạn bằng cách giải thích, phân tích quan điểm, phát hiện đối tượng và nhiều hoạt động khác. Với sự xuất hiện của các mô hình đa phương thức (và khả năng lưu trữ dữ liệu đối tượng như hình ảnh và video trong BigQuery thông qua các bảng Đối tượng), việc tích hợp các LLM mạnh mẽ như Gemini 1.0 Pro (để phân tích dựa trên văn bản) và Gemini 1.0 Pro Vision (để phân tích văn bản và hình ảnh/video) với BigQuery có thể chuyển đổi cách bạn phân tích dữ liệu.

Trong lớp học lập trình này, chúng ta sẽ xem xét hai phương pháp sau để lấy thông tin chi tiết của mô hình ngôn ngữ lớn (LLM) từ dữ liệu doanh nghiệp của bạn và nhân rộng các thông tin chi tiết đó ra hàng nghìn hàng trong BigQuery:

Phương thức 1: Gọi mô hình từ xa

  • Gọi Gemini 1.0 Pro từ trong BigQuery bằng cách sử dụng ML.GENERATE_TEXT trong truy vấn SELECT.
  • Sử dụng phương pháp này khi mô hình đã có sẵn dưới dạng mô hình từ xa trong BigQuery và bạn muốn sử dụng ngay. Kiểm tra trạng thái của mô hình mà bạn muốn sử dụng trong tài liệu BigQuery.

Phương pháp 2: Triển khai hàm từ xa

  • Gọi một Hàm đám mây triển khai lệnh gọi Tầm nhìn của Gemini 1.0 Pro, được hiển thị dưới dạng chức năng từ xa trong BigQuery.
  • Hãy sử dụng phương pháp này khi mô hình bạn muốn sử dụng không có sẵn có sẵn dưới dạng mô hình từ xa hoặc bạn muốn linh hoạt hơn và tuỳ chỉnh hơn trong trường hợp sử dụng của mình.

Sản phẩm bạn sẽ tạo ra

  • Đối với phương thức Gọi mô hình từ xa, bạn sẽ tạo trình tóm tắt vị trí cho tập dữ liệu sách lưu trữ trên Internet (được cung cấp công khai trong BigQuery) bằng cách gọi mô hình từ xa cho Gemini 1.0 Pro trong cấu trúc ML.GENERATE_TEXT trong BigQuery.

Sơ đồ quy trình gọi mô hình từ xa

  • Đối với phương pháp Triển khai hàm từ xa, bạn sẽ tạo một trình xác thực hình ảnh để xác thực hình ảnh thử nghiệm dựa trên hình ảnh cơ sở. Để làm việc này, bạn sẽ tạo một tập dữ liệu chứa ảnh chụp màn hình hình ảnh thử nghiệm trong một bảng bên ngoài và yêu cầu Gemini 1.0 Pro Vision xác thực dữ liệu đó với hình ảnh cơ sở. Sau đó, bạn sẽ tạo một Hàm đám mây Java để triển khai lệnh gọi của Gemini Pro Vision và gọi nó dưới dạng một hàm từ xa trong BigQuery.

Sơ đồ quy trình triển khai hàm từ xa

Lưu ý:

Có thể có nhiều mô hình AI tạo sinh khác của Vertex AI được cung cấp làm mô hình từ xa trong BigQuery. Điều này có nghĩa là bạn có thể truy cập vào các mô hình này bằng cấu trúc ML.GENERATE_TEXT ngay từ BigQuery. Tuy nhiên, ngay cả trong trường hợp mô hình từ xa có thể sử dụng, bạn luôn có thể tạo các chế độ tuỳ chỉnh nâng cao cho trường hợp sử dụng của mình bằng Cloud Functions, sau đó truy cập vào các mô hình này dưới dạng các hàm từ xa từ BigQuery.

Tại sao nên sử dụng BigQuery?

BigQuery là kho dữ liệu đa đám mây, không máy chủ, có thể mở rộng quy mô từ byte lên đến petabyte mà không tốn chi phí vận hành. Do đó, đây là một lựa chọn tuyệt vời để lưu trữ dữ liệu huấn luyện công nghệ học máy. Nhờ sử dụng các chức năng phân tích và công nghệ Học máy của BigQuery (BQML) tích hợp sẵn, bạn có thể tạo thông tin dự đoán mà không cần mã chỉ bằng các truy vấn SQL. Ngoài ra, bạn có thể truy cập dữ liệu từ các nguồn bên ngoài thông qua các truy vấn liên kết, nhờ đó mà không cần thực hiện các quy trình ETL phức tạp.

BigQuery là một kho dữ liệu trên đám mây được quản lý toàn diện, giúp người dùng phân tích dữ liệu có cấu trúc, bán cấu trúc và không có cấu trúc.

2. Yêu cầu

  • Một trình duyệt, chẳng hạn như Chrome hoặc Firefox
  • Một dự án trên Google Cloud đã bật tính năng thanh toán.

3. Trước khi bắt đầu

  1. Trong Google Cloud Console, trên trang bộ chọn dự án, hãy chọn hoặc tạo một dự án trên Google Cloud.
  2. Đảm bảo rằng bạn đã bật tính năng thanh toán cho dự án trên Google Cloud. Tìm hiểu cách kiểm tra xem tính năng thanh toán có được bật trên một dự án hay không .
  3. Bạn sẽ sử dụng Cloud Shell, một môi trường dòng lệnh chạy trong Google Cloud được tải trước bằng bq. Nhấp vào Kích hoạt Cloud Shell ở đầu bảng điều khiển Google Cloud.

Hình ảnh nút Kích hoạt Cloud Shell

  1. Sau khi kết nối với Cloud Shell, bạn cần kiểm tra để chắc chắn rằng mình đã được xác thực và dự án được đặt thành mã dự án bằng lệnh sau đây:
gcloud auth list
  1. Chạy lệnh sau trong Cloud Shell để xác nhận rằng lệnh gcloud biết về dự án của bạn.
gcloud config list project
  1. Nếu dự án của bạn chưa được thiết lập, hãy sử dụng lệnh sau để thiết lập dự án:
gcloud config set project <YOUR_PROJECT_ID>
  1. Chuyển đến Gemini cho Google Cloud Marketplace để bật API này. Bạn cũng có thể sử dụng lệnh sau trong cửa sổ dòng lệnh Cloud Shell:
gcloud services enable cloudaicompanion.googleapis.com --project PROJECT_ID
  1. Đảm bảo rằng các API sau đã được bật:
  • BigQuery
  • Kết nối với BigQuery
  • Chức năng đám mây
  • Cloud Run
  • Vertex AI
  • Cloud Build
  • API Cloud Storage

Lựa chọn thay thế cho việc sử dụng lệnh gcloud là thông qua bảng điều khiển bằng đường liên kết này.

Hãy tham khảo tài liệu để biết các lệnh gcloud và cách sử dụng.

4. Tạo tập dữ liệu BigQuery và kết nối bên ngoài

Hãy bắt đầu bằng cách tạo một tập dữ liệu và kết nối tài nguyên trên đám mây.

Tập dữ liệu trong BigQuery là một vùng chứa tất cả các bảng và đối tượng cho ứng dụng của bạn.

Để tạo một tập dữ liệu, hãy làm như sau:

  1. Chuyển đến trang BigQuery trong bảng điều khiển Google Cloud.
  2. Trong bảng điều khiển Trình khám phá, hãy chọn dự án mà bạn muốn tạo tập dữ liệu.
  3. Mở rộng tuỳ chọn Hành động (biểu tượng dấu ba chấm dọc) rồi nhấp vào Tạo tập dữ liệu.

Hình ảnh trình đơn Thao tác và tuỳ chọn Tạo tập dữ liệu

  1. Nhấp vào Tạo tập dữ liệu.
  2. Nhập gemini_bq_fn vào trường Mã tập dữ liệu.
  3. Đặt loại vị trí của bạn là Multi-region và chấp nhận giá trị mặc định là US(multiple regions in United States.
  4. Nhấp vào Tạo tập dữ liệu.
  5. Kiểm tra để đảm bảo tập dữ liệu được tạo và liệt kê trong mã dự án trong ngăn Trình khám phá.

Bạn cần có kết nối BigQuery để tương tác với Chức năng đám mây của mình. Để tạo hàm từ xa, bạn phải tạo kết nối BigQuery. Trong lớp học lập trình này, chúng ta sẽ sử dụng kết nối BigLake để truy cập vào mô hình từ BigQuery thông qua Hàm Cloud. Các mối kết nối với BigLake giúp kết nối nguồn dữ liệu bên ngoài mà vẫn duy trì tính bảo mật và kiểm soát quyền truy cập chi tiết vào BigQuery, trong trường hợp của chúng ta là Vertex AI Gemini Pro API.

Để tạo kết nối với BigLake, hãy làm như sau:

  1. Nhấp vào Thêm trên ngăn Trình khám phá của trang BigQuery.

Bảng điều khiển BigQuery, trong đó nút THÊM được làm nổi bật để thêm kết nối bên ngoài

  1. Nhấp vào Kết nối với nguồn dữ liệu bên ngoài.
  2. Trong trình đơn Loại kết nối, hãy chọn Mô hình điều khiển từ xa Vertex AI, chức năng từ xa và BigLake (Tài nguyên đám mây).
  3. Trong trường Mã kết nối, hãy nhập tên kết nối là gemini-bq-conn.
  4. Đặt loại vị trí của bạn là Multi-region và chấp nhận giá trị mặc định là US(multiple regions in United States.
  5. Nhấp vào Tạo mối kết nối.
  6. Nhấp vào Go to connection (Chuyển đến kết nối), rồi sao chép mã tài khoản dịch vụ trong ngăn Connection info (Thông tin kết nối).

Ảnh chụp màn hình về thông tin kết nối

  1. Truy cập vào trang IAM và Quản trị viên rồi nhấp vào Cấp quyền truy cập.
  2. Dán mã tài khoản dịch vụ vào trường Nguyên tắc mới.
  3. Chọn vai trò Vertex AI user trong danh sách vai trò rồi nhấp vào Lưu.

Ảnh chụp màn hình Cấp quyền truy cập vào Tài khoản dịch vụ

Bạn hiện đã tạo thành công tập dữ liệu và kết nối BigQuery. Tiếp theo, bạn sẽ hoàn tất các bước cần thiết để gọi mô hình từ xa.

5. Trường hợp sử dụng 1 Gọi mô hình từ xa: Thiết lập lệnh gọi mô hình từ xa

Bây giờ, bạn đã tạo xong tập dữ liệu và kết nối, hãy tạo một mô hình trong BigQuery dựa trên mô hình nền tảng của Vertex AI Gemini Pro. Khi kết thúc bài tập này, bạn sẽ thiết lập và chạy ứng dụng LLM (mô hình ngôn ngữ lớn) bằng cách chỉ sử dụng các truy vấn SQL.

Bước 1: Tạo bảng BigQuery chứa dữ liệu đầu vào cho mô hình từ xa

Tạo một bảng có tên books trong tập dữ liệu của bạn. Bảng này có thể chứa khoảng 50 bản ghi từ bảng bigquery-public-data.gdelt_internetarchivebooks.1905 trong tập dữ liệu Internet Archive Books được BigQuery sử dụng công khai.

Để thực hiện việc này, hãy thực thi câu lệnh DDL (Ngôn ngữ định nghĩa dữ liệu) sau đây trong ngăn trình chỉnh sửa BigQuery SQL:

create or replace table gemini_bq_fn.books as (
select *
from
bigquery-public-data.gdelt_internetarchivebooks.1905 limit 50)

Bước 2 : Tạo mô hình BigQuery

Tạo một mô hình trong tập dữ liệu của bạn. Để thực hiện việc này, hãy chạy DDL sau đây từ ngăn BigQuery SQL Editor:

CREATE MODEL `gemini_bq_fn.gemini_remote_model`
REMOTE WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(ENDPOINT = 'gemini-pro');

Quan sát mô hình được tạo cùng với một tuỳ chọn để xem mô hình.

Bước 3 : Kiểm thử ứng dụng AI tạo sinh mới

Dùng hàm ML.GENERATE_TEXT trong truy vấn SELECT để gửi yêu cầu đến mô hình từ xa.

SELECT ml_generate_text_llm_result as Gemini_Response, prompt as Prompt
FROM ML.GENERATE_TEXT(MODEL `gemini_bq_fn.gemini_remote_model`,
 (select 'You are a text summarizer and standardizer. From the following text that contains address locations, standardize and print one standardized, consolidated address. You cannot return empty because you know how to pick up sensible data from the text in this field: ' ||
substring(locations, 0, 200) as prompt
from `gemini_bq_fn.books`),
STRUCT(
 TRUE AS flatten_json_output));

Bạn sẽ thấy kết quả sau:

Kết quả truy vấn ML.GENERATE_TEXT trong BigQuery

Xin chúc mừng! Bạn đã minh hoạ thành công cách sử dụng mô hình từ xa (dựa trên mô hình gemini-pro) với hàm ML.GENERATE_TEXT để phân tích dữ liệu văn bản trong bảng BigQuery.

Bây giờ, hãy thử một mô hình Vertex AI khác bằng các hàm từ xa của BigQuery. Giả sử bạn muốn tuỳ chỉnh và linh hoạt hơn về cách sử dụng mô hình này từ xa trong BigQuery. Các mô hình được hỗ trợ được liệt kê trong tài liệu BigQuery.

6. Trường hợp sử dụng 2 Triển khai hàm từ xa: Thiết lập phương thức triển khai hàm từ xa

Trong bài tập này, bạn sẽ tạo một hàm trong BigQuery dựa trên Java Cloud Function giúp triển khai mô hình nền tảng Gemini 1.0 Pro Vision. Trước tiên, bạn sẽ tạo và triển khai Hàm đám mây Java để so sánh hình ảnh bằng mô hình Tầm nhìn của Gemini 1.0 Pro. Sau đó, bạn sẽ tạo hàm từ xa trong BigQuery để gọi Hàm đám mây đã triển khai. Hãy nhớ rằng bạn có thể thực hiện cùng một quy trình cho mọi quá trình thực thi hàm từ xa trong BigQuery.

Hãy cùng bắt đầu nào!

Bước 1: Tạo hàm Java Cloud

Bạn sẽ tạo Hàm đám mây thế hệ 2 trong Java để xác thực hình ảnh thử nghiệm dựa trên hình ảnh cơ sở. Hình ảnh cơ sở được lưu trữ trong một tập dữ liệu chứa ảnh chụp màn hình của hình ảnh thử nghiệm trong một bảng bên ngoài trong BigQuery. Bạn sẽ xác thực hình ảnh bằng mô hình Gemini Pro Vision (SDK Java). Sau đó, bạn sẽ triển khai Java Cloud Function đến một điểm cuối REST.

Hãy làm theo các bước sau:

  1. Chạy Cloud Shell Editor.
  2. Nếu bạn đang sử dụng Trình chỉnh sửa cũ, hãy nhấp vào Dùng thử Trình chỉnh sửa mới.
  3. Trên thanh trạng thái, hãy nhấp vào Cloud Code – Đăng nhập.
  4. Nếu được nhắc cho phép Cloud Shell Editor thực hiện lệnh gọi API Google Cloud, hãy nhấp vào Uỷ quyền. Làm theo lời nhắc để đăng nhập vào Tài khoản Google của bạn. Bạn hiện đã kết nối với Google Cloud.
  5. Nếu bạn không thấy dự án của mình trong thanh trạng thái Mã đám mây, hãy nhấp vào Mã đám mây – Đăng nhập > Chọn dự án Google Cloud. Chọn dự án Google Cloud mà bạn muốn tạo Cloud Functions. Dự án này sẽ tải và trở thành dự án đang hoạt động trong Cloud Shell Editor.
  6. Trong thanh trạng thái Mã đám mây, hãy nhấp vào tên dự án đang hoạt động. Trong trình đơn Chọn nhanh hiện ra, chọn New Application (Ứng dụng mới).
  7. Trong hộp thoại Create New Application (Tạo ứng dụng mới), hãy chọn Cloud Functions application (ứng dụng của tính năng Cloud).

Trang bật lên Tạo ứng dụng mới 1

  1. Chọn Java: Hello World khi được nhắc chọn một mẫu.

Trang bật lên Tạo ứng dụng mới 2

  1. Nhập Gemini-BQ-Function làm tên dự án trong đường dẫn dự án. Cấu trúc dự án sẽ xuất hiện trong chế độ xem mới của Cloud Shell Editor.

Cấu trúc dự án mới của ứng dụng Hàm đám mây Java

  1. Thêm các phần phụ thuộc cần thiết trong thẻ <dependencies>... </dependencies> hoặc sao chép các phần phụ thuộc đó từ tệp pom.xml mẫu.
  2. Hãy đổi tên lớp từ HelloWorld.java thành tên có ý nghĩa hơn. Giả sử GeminiBigQueryFunction.java. Đổi tên gói cho phù hợp.
  3. Thay thế mã phần giữ chỗ trong tệp GeminiBigQueryFunction.Java bằng mã mẫu được cung cấp trong kho lưu trữ GitHub. Đừng quên thay thế biến <YOUR_PROJECT_ID> bằng mã dự án trong mã mẫu.
  4. Chuyển đến thiết bị đầu cuối Cloud Shell. Kiểm tra để đảm bảo rằng bạn đang ở trong thư mục dự án. Nếu chưa, hãy chuyển đến thư mục dự án bằng cách thực thi lệnh sau:
cd Gemini-BQ-Function
  1. Thực thi câu lệnh sau để xây dựng và triển khai Hàm đám mây:
gcloud functions deploy gemini-bq-fn --gen2 --runtime java17 --trigger-http --entry-point cloudcode.helloworld.GeminiBigQueryFunction --allow-unauthenticated --source .

Thay thế điểm truy cập trong lệnh bằng điểm truy cập của hàm. Dữ liệu đầu ra là URL REST ở định dạng sau:

https://us-central1-YOUR_PROJECT_ID.cloudfunctions.net/gemini-bq-fn
  1. Kiểm tra hàm đám mây này bằng cách chạy lệnh sau trên thiết bị đầu cuối:
gcloud functions call gemini-bq-fn --region=us-central1 --gen2 --data '{"calls":[["https://storage.googleapis.com/img_public_test/image_validator/baseline/1.JPG", "https://storage.googleapis.com/img_public_test/image_validator/test/2.JPG", "PROMPT_ABOUT_THE_IMAGES_TO_GEMINI"]]}'

Phản hồi cho câu lệnh mẫu ngẫu nhiên:

Chuỗi phản hồi JSON qua Cloud Function

Tuyệt vời! Chức năng đám mây chung cho mô hình Tầm nhìn của Gemini Pro đã sẵn sàng. Hãy sử dụng điểm cuối này trực tiếp trên dữ liệu BigQuery từ trong một hàm từ xa của BigQuery.

Bước 2: Tạo bảng đối tượng BigQuery và hàm từ xa

Điều kiện tiên quyết

Bạn sẽ cần một bộ chứa trên Cloud Storage cho phần này của bài tập. Làm theo các bước sau để tạo một bộ chứa Cloud Storage:

  1. Để tạo bộ chứa, hãy chuyển đến bảng điều khiển Cloud Storage rồi nhấp vào Tạo.
  2. Nhập demo-bq-gemini-public-image làm tên bộ chứa rồi nhấp vào Tạo.
  3. Bỏ đánh dấu lựa chọn Enforce public access prevention on this bucket. Mặc dù bạn đang tạo bộ chứa này để truy cập công khai trong bài tập này, chúng tôi khuyên bạn nên ngăn quyền truy cập công khai và cấp quyền cho các tài khoản dịch vụ cụ thể theo yêu cầu trong các trường hợp sử dụng của doanh nghiệp.
  4. Sau khi tạo bộ chứa, hãy chuyển đến thẻ Quyền để xem và thay đổi các quyền.
  5. Để thêm người dùng chính, hãy nhấp vào Cấp quyền truy cập. Hãy chỉ định mã tài khoản dịch vụ để cấp quyền cho một tài khoản cụ thể hoặc chỉ định allUsers để cấp quyền truy cập công khai vào bộ chứa của bạn.
  6. Chọn vai trò Storage Object Viewer rồi nhấp vào Lưu. Nếu được nhắc, hãy chọn cho phép truy cập công khai.
  7. Chuyển đến thẻ Đối tượng rồi tải hình ảnh cơ sở và hình ảnh thử nghiệm lên để so sánh. Đối với lớp học lập trình này, bạn có thể tải các đối tượng được cung cấp công khai sau đây lên: baseline.JPG, TEST1.JPGTEST2.JPG.

Tạo bảng đối tượng BigQuery

Tạo một bảng đối tượng bên ngoài từ BigQuery để truy cập vào dữ liệu phi cấu trúc trong bộ chứa bằng cách sử dụng kết nối và tập dữ liệu mà bạn đã tạo trước đó. Để thực hiện việc này, hãy thực thi câu lệnh DDL (Ngôn ngữ định nghĩa dữ liệu) sau đây trong ngăn trình chỉnh sửa truy vấn BigQuery:

CREATE OR REPLACE EXTERNAL TABLE `gemini_bq_fn.image_validation`
WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(object_metadata="SIMPLE", uris=["gs://demo-bq-gemini-public-image/*.JPG"]);

Kiểm tra để đảm bảo rằng bảng đối tượng mới có tên image_validation đã được tạo trong tập dữ liệu của bạn.

Tạo một Hàm từ xa BigQuery

Tạo một hàm từ xa trong BigQuery để gọi hàm Java Cloud Function giúp triển khai mô hình Tầm nhìn của Gemini Pro. Hãy tạo lớp này trong cùng một tập dữ liệu. Để thực hiện việc này, hãy chạy DDL sau đây từ ngăn trình chỉnh sửa SQL trên bảng điều khiển BigQuery:

CREATE OR REPLACE FUNCTION `gemini_bq_fn.FN_IMAGE_VALIDATE` (baseline STRING, test STRING, prompt STRING) RETURNS STRING
 REMOTE WITH CONNECTION `us.gemini-bq-conn`
 OPTIONS (
   endpoint = 'https://us-central1-<your project id>.cloudfunctions.net/gemini-bq-fn',
   max_batching_rows = 1
 );

URL điểm cuối là URL REST được trả về trước đó trong bài tập này. Thao tác này sẽ tạo hàm từ xa trong BigQuery. Có 3 tham số trong DDL ở trên. Hai tham số đầu tiên là URL tới hình ảnh được lưu trữ trong bảng đối tượng được tạo ở bước trước. Thông số cuối cùng là câu lệnh chuyển sang mô hình (Gemini Pro Vision). Bạn có thể tham khảo mã Java Cloud Functions được dùng để phân tích cú pháp chữ ký này:

Gson().fromJson(request.getReader(), JsonObject.class);
JsonArray calls_array = requestJson.getAsJsonArray("calls");
JsonArray calls = (JsonArray) calls_array.get(0);
String baseline_url = calls.get(0).toString().replace("\"", "");
String test_url = calls.get(1).toString().replace("\"", "");
String prompt_string = calls.get(2).toString();

Gọi Gemini từ BigQuery

Sử dụng hàm từ xa trong truy vấn SELECT để kiểm thử hàm xác thực hình ảnh dựa trên lời nhắc.

select gemini_bq_fn.FN_IMAGE_VALIDATE(
'https://storage.googleapis.com/demo-bq-gemini-public-image/Baseline.JPG',
REPLACE(uri, 'gs://', 'https://storage.googleapis.com/') ,
'You are an expert image validator who can respond with JSON result. Find 2 images here. The first one is the reference image. The second image is the test image. Compare the second image to see if the second image is similar to the first in terms of the text present in the image.  Respond ONLY in JSON Format with 3 attributes namely SIMILARITY which is a \"YES\" or \"NO\", SIMILARITY_SCORE which is a percentage and DIFFERENCE_COMMENT which is a string.' ) as IMAGE_VALIDATION_RESULT
from `gemini_bq_fn.image_validation`
where uri like '%TEST1%';  

Hãy thử truy vấn ở trên bằng các tệp đối tượng TEST1TEST2. Bạn sẽ thấy kết quả tương tự như sau:

Ảnh chụp màn hình kết quả chức năng từ xa BigQuery

Dưới đây là hình ảnh để bạn tham khảo:

Hình ảnh đường cơ sở

Hình ảnh tham chiếu đường cơ sở cho trường hợp kiểm thử

Hình ảnh thử nghiệm

Hình ảnh thử nghiệm 1 cho trường hợp kiểm tra

Xin lưu ý rằng cả hai hình ảnh này tương tự nhau ở chỗ chúng có chế độ xem bảng điều khiển trên đám mây của Duet AI, nhưng văn bản trong cả hai hình ảnh này lại khác nhau do mô hình ở định dạng JSON.

Như vậy, bạn đã kiểm thử thành công việc triển khai hàm từ xa.

7. Lợi ích và trường hợp sử dụng

Hãy cùng tìm hiểu một số lợi ích của việc tích hợp BigQuery và Gemini trong việc phân tích dữ liệu có cấu trúc và không có cấu trúc.

  • Đưa AI tạo sinh vào dữ liệu của bạn: Không còn phải di chuyển dữ liệu, sao chép và phức tạp thêm nữa. Bạn có thể phân tích dữ liệu và tạo thông tin chi tiết trong cùng một môi trường BigQuery.
  • Số liệu phân tích nâng cao: Giải thích ngôn ngữ tự nhiên của Gemini giúp bổ sung một lớp hiểu biết mới vào dữ liệu của bạn. Bạn có thể đạt được điều này bằng cách sử dụng các truy vấn SQL.
  • Khả năng mở rộng: Giải pháp này dễ dàng xử lý các tập dữ liệu lớn và hoạt động phân tích phức tạp.

Có rất nhiều ứng dụng cho việc này. Hãy xem xét các tình huống về tài chính (phân tích xu hướng thị trường), bán lẻ (ý kiến của khách hàng), chăm sóc sức khoẻ (bản tóm tắt báo cáo y tế), v.v. mà nhóm phân tích và kinh doanh của bạn có thể triển khai chúng mà không cần tốn nhiều công sức, nguồn lực cũng như ngôn ngữ và công cụ quen thuộc mà bạn lựa chọn.

8. Dọn dẹp

Để tránh bị tính phí vào tài khoản Google Cloud cho các tài nguyên sử dụng trong bài đăng này, hãy làm theo các bước sau:

  1. Trong bảng điều khiển Google Cloud, hãy chuyển đến trang Quản lý tài nguyên.
  2. Trong danh sách dự án, hãy chọn dự án mà bạn muốn xoá, sau đó nhấp vào Delete (Xoá).
  3. Trong hộp thoại, hãy nhập mã dự án rồi nhấp vào Tắt để xoá dự án.
  4. Nếu bạn muốn giữ lại dự án, hãy bỏ qua các bước ở trên và xoá Hàm đám mây bằng cách chuyển đến Cloud Functions và trong danh sách hàm, hãy chọn hàm mà bạn muốn xoá rồi nhấp vào Xoá.

9. Xin chúc mừng

Chúc mừng bạn! Nhờ các mô hình Gemini được tích hợp vào BigQuery, bạn không còn chỉ phân tích dữ liệu của mình nữa, mà còn có khả năng kể chuyện về dữ liệu. Bạn có thể tạo ra các câu chuyện ẩn giấu trong các tập dữ liệu và cải tiến cách bạn hiểu thông tin chi tiết của mình. Hãy bắt đầu thử nghiệm! Hãy áp dụng kỹ thuật này cho các tập dữ liệu của riêng bạn và khám phá những câu chuyện trong dữ liệu của bạn. Vì BigQuery hỗ trợ dữ liệu không có cấu trúc trong bảng đối tượng ( Bảng bên ngoài), hãy thử dùng Gemini Pro Vision để tạo thông tin chi tiết tạo sinh về dữ liệu hình ảnh. Hãy tham khảo tài liệu về Vertex AI, Hàm từ xa BigQueryChức năng đám mây để được hướng dẫn chi tiết hơn. Dưới đây là kho lưu trữ github cho dự án này. Hãy cho chúng tôi biết thành quả của bạn nhờ kiến thức này!