Thông tin chi tiết về mô hình ngôn ngữ lớn (LLM) tại chỗ: BigQuery và Gemini cho Phân tích dữ liệu có cấu trúc và phi cấu trúc

1. Giới thiệu

Các tập dữ liệu khổng lồ chứa đựng những thông tin chi tiết có giá trị, nhưng việc trích xuất thông tin có ý nghĩa có thể là một nhiệm vụ khó khăn. Các công cụ phân tích truyền thống thường không thể cung cấp những giải thích tinh tế, giống như con người, giúp chúng ta thực sự nắm bắt được câu chuyện trong dữ liệu của mình. Kho dữ liệu đang lưu trữ ngày càng nhiều dữ liệu không có cấu trúc, nhưng dữ liệu đó không phải lúc nào cũng có thể truy cập để thu thập thông tin chi tiết. Văn bản, hình ảnh và video không có cấu trúc chứa thông tin có giá trị để phát triển doanh nghiệp của bạn. Mô hình ngôn ngữ lớn (LLM) mang đến một cách thức mới mạnh mẽ để hiểu dữ liệu của bạn, cung cấp nội dung giải thích, phân tích cảm xúc, phát hiện đối tượng và nhiều thông tin khác. Với sự xuất hiện của các mô hình đa phương thức (và khả năng lưu trữ dữ liệu đối tượng như hình ảnh và video trong BigQuery thông qua Bảng đối tượng), việc tích hợp các LLM mạnh mẽ như Gemini 1.0 Pro (để phân tích dựa trên văn bản) và Gemini 1.0 Pro Vision (để phân tích văn bản và hình ảnh/video) với BigQuery có thể thay đổi cách bạn phân tích dữ liệu.

Trong lớp học lập trình này, chúng ta sẽ xem xét 2 phương pháp sau đây để rút ra thông tin chi tiết từ LLM trong dữ liệu doanh nghiệp của bạn và mở rộng những thông tin chi tiết đó thành hàng nghìn hàng trong BigQuery:

Phương thức 1: Gọi mô hình từ xa

  • Gọi Gemini 1.0 Pro từ BigQuery bằng cách sử dụng ML.GENERATE_TEXT trong truy vấn SELECT.
  • Hãy sử dụng phương pháp này khi mô hình đã có sẵn dưới dạng một mô hình từ xa trong BigQuery và bạn muốn sử dụng mô hình đó ngay lập tức. Kiểm tra trạng thái của mô hình mà bạn muốn sử dụng trong tài liệu BigQuery.

Phương thức 2: Triển khai hàm từ xa

  • Gọi một Cloud Function triển khai lệnh gọi Gemini 1.0 Pro Vision, được hiển thị dưới dạng một hàm từ xa trong BigQuery.
  • Hãy sử dụng phương pháp này khi mô hình bạn muốn dùng không có sẵn ngay lập tức dưới dạng một mô hình từ xa hoặc bạn muốn có thêm sự linh hoạt và khả năng tuỳ chỉnh trong trường hợp sử dụng của mình.

Sản phẩm bạn sẽ tạo ra

  • Đối với phương thức Remote Model Invocation (Gọi mô hình từ xa), bạn sẽ tạo một công cụ tóm tắt vị trí cho tập dữ liệu sách lưu trữ trên Internet (được cung cấp công khai trong BigQuery) bằng cách gọi mô hình từ xa cho Gemini 1.0 Pro trong cấu trúc ML.GENERATE_TEXT trong BigQuery.

Sơ đồ quy trình cho lệnh gọi mô hình từ xa

  • Đối với phương thức Triển khai hàm từ xa, bạn sẽ tạo một trình xác thực hình ảnh để xác thực hình ảnh thử nghiệm dựa trên hình ảnh cơ sở. Để làm việc này, bạn sẽ tạo một tập dữ liệu chứa ảnh chụp màn hình hình ảnh kiểm thử trong một bảng bên ngoài và yêu cầu Gemini 1.0 Pro Vision xác thực tập dữ liệu đó dựa trên hình ảnh cơ sở. Sau đó, bạn sẽ tạo một Cloud Functions bằng Java để triển khai lệnh gọi Gemini Pro Vision và gọi hàm đó dưới dạng một hàm từ xa trong BigQuery.

Sơ đồ quy trình triển khai chức năng từ xa

Lưu ý:

Có thể có thêm các mô hình AI tạo sinh của Vertex AI dưới dạng mô hình từ xa trong BigQuery. Điều này có nghĩa là bạn có thể truy cập vào các mô hình này bằng cấu trúc ML.GENERATE_TEXT ngay trong BigQuery. Tuy nhiên, ngay cả trong trường hợp có sẵn mô hình từ xa, bạn luôn có thể tạo các chế độ tuỳ chỉnh nâng cao cho trường hợp sử dụng của mình bằng Cloud Functions, sau đó truy cập vào các mô hình này dưới dạng hàm từ xa từ BigQuery.

Tại sao nên dùng BigQuery?

BigQuery là một kho dữ liệu đa đám mây, không máy chủ, có thể mở rộng từ byte đến petabyte với mức hao tổn tối thiểu về hoạt động. Do đó, đây là lựa chọn phù hợp để lưu trữ dữ liệu huấn luyện ML. Bằng cách sử dụng các chức năng phân tích và học máy (BQML) tích hợp của BigQuery, bạn có thể tạo các dự đoán không cần mã chỉ bằng cách sử dụng các truy vấn SQL. Ngoài ra, bạn có thể truy cập vào dữ liệu từ các nguồn bên ngoài bằng các truy vấn liên kết, nhờ đó, bạn không cần đến các quy trình ETL phức tạp.

BigQuery là một kho dữ liệu trên đám mây được quản lý hoàn toàn, giúp người dùng phân tích dữ liệu có cấu trúc, bán cấu trúc và không có cấu trúc.

2. Yêu cầu

  • Một trình duyệt, chẳng hạn như Chrome hoặc Firefox
  • Một dự án trên Google Cloud đã bật tính năng thanh toán.

3. Trước khi bắt đầu

  1. Trong Google Cloud Console, trên trang chọn dự án, hãy chọn hoặc tạo một dự án trên Google Cloud.
  2. Đảm bảo rằng bạn đã bật tính năng thanh toán cho dự án trên đám mây của bạn. Tìm hiểu cách kiểm tra xem tính năng thanh toán có được bật trong một dự án hay không .
  3. Bạn sẽ sử dụng Cloud Shell, một môi trường dòng lệnh chạy trong Google Cloud và được tải sẵn bằng bq. Nhấp vào Kích hoạt Cloud Shell ở đầu bảng điều khiển Google Cloud.

Hình ảnh nút Kích hoạt Cloud Shell

  1. Sau khi kết nối với Cloud Shell, bạn có thể kiểm tra để đảm bảo rằng bạn đã được xác thực và dự án được đặt thành mã dự án của bạn bằng lệnh sau:
gcloud auth list
  1. Chạy lệnh sau trong Cloud Shell để xác nhận rằng lệnh gcloud biết về dự án của bạn.
gcloud config list project
  1. Nếu bạn chưa đặt dự án, hãy dùng lệnh sau để đặt:
gcloud config set project <YOUR_PROJECT_ID>
  1. Chuyển đến Gemini for Google Cloud Marketplace để bật API. Bạn cũng có thể sử dụng lệnh sau trong cửa sổ dòng lệnh Cloud Shell:
gcloud services enable cloudaicompanion.googleapis.com --project PROJECT_ID
  1. Đảm bảo rằng bạn đã bật các API sau:
  • BigQuery
  • Kết nối BigQuery
  • Cloud Function
  • Cloud Run
  • Vertex AI
  • Cloud Build
  • Cloud Storage API

Ngoài việc sử dụng lệnh gcloud, bạn có thể truy cập vào bảng điều khiển bằng cách sử dụng đường liên kết này.

Tham khảo tài liệu để biết các lệnh và cách sử dụng gcloud.

4. Tạo tập dữ liệu BigQuery và mối kết nối bên ngoài

Hãy bắt đầu bằng cách tạo một tập dữ liệu và mối kết nối tài nguyên trên đám mây.

Tập dữ liệu trong BigQuery là một vùng chứa cho tất cả các bảng và đối tượng của ứng dụng.

Để tạo tập dữ liệu, hãy làm như sau:

  1. Chuyển đến trang BigQuery trong bảng điều khiển Cloud của Google.
  2. Trong bảng Trình khám phá, hãy chọn dự án mà bạn muốn tạo tập dữ liệu.
  3. Mở rộng lựa chọn Thao tác (biểu tượng dấu ba chấm dọc), rồi nhấp vào Tạo tập dữ liệu.

Hình ảnh về trình đơn Thao tác và lựa chọn Tạo tập dữ liệu

  1. Nhấp vào Tạo tập dữ liệu.
  2. Nhập gemini_bq_fn vào trường Mã nhận dạng tập dữ liệu.
  3. Đặt loại vị trí là Multi-region và chấp nhận giá trị mặc định là US(multiple regions in United States.
  4. Nhấp vào Tạo tập dữ liệu.
  5. Kiểm tra để đảm bảo tập dữ liệu được tạo và liệt kê trong mã dự án của bạn trong ngăn Trình khám phá.

Bạn cần có một kết nối BigQuery để tương tác với Cloud Function. Để tạo một hàm từ xa, bạn phải tạo một kết nối BigQuery. Trong lớp học lập trình này, chúng ta sẽ sử dụng kết nối BigLake để truy cập vào mô hình từ BigQuery thông qua Cloud Function. Các mối kết nối BigLake giúp kết nối nguồn dữ liệu bên ngoài trong khi vẫn duy trì quyền kiểm soát truy cập và bảo mật chi tiết của BigQuery, trong trường hợp này là Vertex AI Gemini Pro API.

Để tạo kết nối BigLake, hãy làm như sau:

  1. Nhấp vào Thêm trong ngăn Trình khám phá của trang BigQuery.

Bảng điều khiển BigQuery có nút THÊM được làm nổi bật để thêm kết nối bên ngoài

  1. Nhấp vào Kết nối với nguồn dữ liệu bên ngoài.
  2. Trong trình đơn Connection type (Loại kết nối), hãy chọn Vertex AI remote models, remote functions and BigLake (Cloud Resource) (Mô hình từ xa, hàm từ xa và BigLake (Tài nguyên đám mây) của Vertex AI).
  3. Trong trường Mã kết nối, hãy nhập tên kết nối là gemini-bq-conn.
  4. Đặt loại vị trí là Multi-region và chấp nhận giá trị mặc định là US(multiple regions in United States.
  5. Nhấp vào Tạo mối kết nối.
  6. Nhấp vào Chuyển đến phần kết nối,rồi sao chép mã nhận dạng tài khoản dịch vụ trong ngăn Thông tin kết nối.

Ảnh chụp màn hình thông tin kết nối

  1. Chuyển đến trang IAM và Quản trị rồi nhấp vào Cấp quyền truy cập.
  2. Dán mã tài khoản dịch vụ vào trường Nguyên tắc mới.
  3. Chọn vai trò Vertex AI user trong danh sách vai trò, rồi nhấp vào Lưu.

Cấp quyền truy cập vào ảnh chụp màn hình Tài khoản dịch vụ

Giờ đây, bạn đã tạo thành công tập dữ liệu và mối kết nối BigQuery. Tiếp theo, bạn sẽ hoàn tất các bước cần thiết để gọi mô hình từ xa.

5. Trường hợp sử dụng 1: Lệnh gọi mô hình từ xa: Thiết lập lệnh gọi mô hình từ xa

Bây giờ bạn đã tạo tập dữ liệu và mối kết nối, hãy tạo một mô hình trong BigQuery dựa trên mô hình cơ sở Vertex AI Gemini Pro. Khi kết thúc bài tập này, bạn sẽ có thể thiết lập và chạy ứng dụng LLM chỉ bằng cách sử dụng các truy vấn SQL.

Bước 1: Tạo một bảng BigQuery chứa dữ liệu đầu vào cho mô hình từ xa

Tạo một bảng có tên books trong tập dữ liệu của bạn. Bảng này có thể chứa khoảng 50 bản ghi từ bảng bigquery-public-data.gdelt_internetarchivebooks.1905 trong tập dữ liệu Internet Archive Books do BigQuery cung cấp cho mục đích sử dụng công khai.

Để thực hiện việc này, hãy thực thi câu lệnh DDL (Ngôn ngữ định nghĩa dữ liệu) sau đây trong ngăn trình chỉnh sửa SQL của BigQuery:

create or replace table gemini_bq_fn.books as (
select *
from
bigquery-public-data.gdelt_internetarchivebooks.1905 limit 50)

Bước 2 : Tạo một mô hình BigQuery

Tạo một mô hình trong tập dữ liệu của bạn. Để thực hiện việc này, hãy chạy DDL sau đây từ ngăn Trình chỉnh sửa SQL của BigQuery:

CREATE MODEL `gemini_bq_fn.gemini_remote_model`
REMOTE WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(ENDPOINT = 'gemini-pro');

Quan sát thấy mô hình được tạo kèm theo một lựa chọn để xem mô hình.

Bước 3 : Kiểm thử ứng dụng AI tạo sinh mới

Dùng hàm ML.GENERATE_TEXT trong truy vấn SELECT để gửi yêu cầu đến mô hình từ xa.

SELECT ml_generate_text_llm_result as Gemini_Response, prompt as Prompt
FROM ML.GENERATE_TEXT(MODEL `gemini_bq_fn.gemini_remote_model`,
 (select 'You are a text summarizer and standardizer. From the following text that contains address locations, standardize and print one standardized, consolidated address. You cannot return empty because you know how to pick up sensible data from the text in this field: ' ||
substring(locations, 0, 200) as prompt
from `gemini_bq_fn.books`),
STRUCT(
 TRUE AS flatten_json_output));

Bạn sẽ thấy kết quả sau:

Kết quả truy vấn ML.GENERATE_TEXT trong BigQuery

Xin chúc mừng! Bạn đã minh hoạ thành công cách sử dụng một mô hình từ xa (dựa trên mô hình gemini-pro) với hàm ML.GENERATE_TEXT để phân tích dữ liệu văn bản trong một bảng BigQuery.

Bây giờ, hãy thử một mô hình Vertex AI khác bằng cách sử dụng các hàm từ xa của BigQuery. Giả sử bạn muốn tăng khả năng tuỳ chỉnh và tính linh hoạt cho cách sử dụng mô hình từ xa trong BigQuery. Các mô hình được hỗ trợ có trong tài liệu của BigQuery.

6. Trường hợp sử dụng số 2 Triển khai chức năng từ xa: Thiết lập việc triển khai chức năng từ xa

Trong bài tập này, bạn sẽ tạo một hàm trong BigQuery dựa trên Java Cloud Function triển khai mô hình cơ sở Gemini 1.0 Pro Vision. Trước tiên, bạn sẽ tạo và triển khai Cloud Function bằng Java để so sánh hình ảnh bằng mô hình Gemini 1.0 Pro Vision, sau đó bạn sẽ tạo hàm từ xa trong BigQuery để gọi Cloud Function đã triển khai. Hãy nhớ rằng bạn có thể làm theo quy trình tương tự cho mọi hoạt động thực thi hàm từ xa trong BigQuery.

Vậy thì hãy cùng bắt đầu!

Bước 1: Tạo Java Cloud Function

Bạn sẽ tạo một Cloud Functions thế hệ thứ 2 bằng Java để xác thực hình ảnh kiểm thử dựa trên một hình ảnh cơ sở. Hình ảnh cơ sở được lưu trữ trong một tập dữ liệu chứa ảnh chụp màn hình hình ảnh kiểm thử trong một bảng bên ngoài trong BigQuery. Bạn sẽ xác thực hình ảnh bằng mô hình Gemini Pro Vision (Java SDK). Sau đó, bạn sẽ triển khai Java Cloud Function đến một điểm cuối REST.

Hãy làm theo các bước sau:

  1. Khởi chạy Cloud Shell Editor.
  2. Nếu bạn đang sử dụng Trình chỉnh sửa cũ, hãy nhấp vào Dùng thử Trình chỉnh sửa mới.
  3. Trong thanh trạng thái, hãy nhấp vào Cloud Code – Đăng nhập.
  4. Nếu được nhắc cho phép Cloud Shell Editor thực hiện các lệnh gọi API Google Cloud, hãy nhấp vào Uỷ quyền. Làm theo lời nhắc để đăng nhập vào Tài khoản Google của bạn. Bạn hiện đã kết nối với Google Cloud.
  5. Nếu bạn không thấy dự án của mình trong thanh trạng thái Cloud Code, hãy nhấp vào Cloud Code – Sign In > Select a Google Cloud project (Cloud Code – Đăng nhập > Chọn một dự án trên Google Cloud). Chọn dự án trên Google Cloud mà bạn muốn tạo Cloud Functions. Dự án sẽ tải và trở thành dự án đang hoạt động trong Cloud Shell Editor.
  6. Trong thanh trạng thái Cloud Code, hãy nhấp vào tên dự án đang hoạt động. Trong trình đơn Quick Pick (Chọn nhanh) xuất hiện, hãy chọn New Application (Ứng dụng mới).
  7. Trong hộp thoại Create New Application (Tạo ứng dụng mới), hãy chọn Cloud Functions application (Ứng dụng Chức năng đám mây).

Tạo trang bật lên Ứng dụng mới 1

  1. Chọn Java: Hello World khi được nhắc chọn một mẫu.

Tạo trang bật lên Ứng dụng mới 2

  1. Nhập Gemini-BQ-Function làm tên dự án trong đường dẫn dự án. Cấu trúc dự án sẽ xuất hiện trong một chế độ xem mới của Cloud Shell Editor.

Cấu trúc dự án ứng dụng Cloud Functions mới bằng Java

  1. Thêm các phần phụ thuộc cần thiết trong thẻ <dependencies>... </dependencies> hoặc sao chép các phần phụ thuộc từ tệp pom.xml mẫu.
  2. Đổi tên lớp học từ HelloWorld.java thành một tên có ý nghĩa hơn. Giả sử GeminiBigQueryFunction.java. Đổi tên gói cho phù hợp.
  3. Thay thế mã giữ chỗ trong tệp GeminiBigQueryFunction.Java bằng mã mẫu có trong kho lưu trữ GitHub. Đừng quên thay thế biến <YOUR_PROJECT_ID> bằng mã dự án của bạn trong mã mẫu.
  4. Chuyển đến thiết bị đầu cuối Cloud Shell. Kiểm tra để đảm bảo bạn đang ở trong thư mục dự án. Nếu không, hãy chuyển đến thư mục dự án bằng cách thực thi lệnh sau:
cd Gemini-BQ-Function
  1. Thực thi câu lệnh sau để tạo và triển khai Cloud Function:
gcloud functions deploy gemini-bq-fn --gen2 --runtime java17 --trigger-http --entry-point cloudcode.helloworld.GeminiBigQueryFunction --allow-unauthenticated --source .

Thay thế điểm nhập trong lệnh bằng điểm nhập của hàm. Đầu ra là một URL REST ở định dạng sau:

https://us-central1-YOUR_PROJECT_ID.cloudfunctions.net/gemini-bq-fn
  1. Kiểm thử Cloud Function này bằng cách chạy lệnh sau trong thiết bị đầu cuối:
gcloud functions call gemini-bq-fn --region=us-central1 --gen2 --data '{"calls":[["https://storage.googleapis.com/img_public_test/image_validator/baseline/1.JPG", "https://storage.googleapis.com/img_public_test/image_validator/test/2.JPG", "PROMPT_ABOUT_THE_IMAGES_TO_GEMINI"]]}'

Câu trả lời cho câu lệnh lấy mẫu ngẫu nhiên:

Chuỗi phản hồi JSON từ Cloud Functions

Tuyệt vời! Cloud Function chung để triển khai mô hình Gemini Pro Vision đã sẵn sàng. Hãy sử dụng điểm cuối này trực tiếp trên dữ liệu BigQuery trong một hàm từ xa của BigQuery.

Bước 2: Tạo một bảng đối tượng BigQuery và hàm từ xa

Điều kiện tiên quyết

Bạn sẽ cần một bộ chứa Cloud Storage cho phần này của bài tập. Hãy làm theo các bước sau để tạo một vùng lưu trữ Cloud Storage:

  1. Để tạo một vùng chứa, hãy chuyển đến bảng điều khiển Cloud Storage rồi nhấp vào Tạo.
  2. Nhập demo-bq-gemini-public-image làm tên nhóm và nhấp vào Tạo.
  3. Bỏ chọn chế độ Enforce public access prevention on this bucket. Mặc dù bạn đang tạo vùng lưu trữ này để truy cập công khai trong bài tập này, nhưng bạn nên ngăn chặn quyền truy cập công khai và cấp quyền cho các tài khoản dịch vụ cụ thể khi cần trong các trường hợp sử dụng doanh nghiệp của bạn.
  4. Sau khi tạo vùng chứa, hãy chuyển đến thẻ Quyền để xem và thay đổi quyền.
  5. Để thêm các chủ thể, hãy nhấp vào Cấp quyền truy cập. Chỉ định mã tài khoản dịch vụ để cấp quyền cho một tài khoản cụ thể hoặc chỉ định allUsers để cấp quyền truy cập công khai vào bộ chứa của bạn.
  6. Chọn vai trò Storage Object Viewer rồi nhấp vào Lưu. Nếu được nhắc, hãy chọn cho phép truy cập công khai.
  7. Chuyển đến thẻ Đối tượng rồi tải hình ảnh cơ sở và hình ảnh thử nghiệm lên để so sánh. Trong lớp học lập trình này, bạn có thể tải các đối tượng sau đây lên (các đối tượng này có sẵn công khai): baseline.JPG, TEST1.JPGTEST2.JPG.

Tạo bảng đối tượng BigQuery

Tạo một bảng đối tượng bên ngoài từ BigQuery để truy cập vào dữ liệu không có cấu trúc trong vùng lưu trữ bằng cách sử dụng mối kết nối và tập dữ liệu mà bạn đã tạo trước đó. Để thực hiện việc này, hãy thực thi câu lệnh DDL (Ngôn ngữ định nghĩa dữ liệu) sau đây trong ngăn trình chỉnh sửa truy vấn BigQuery:

CREATE OR REPLACE EXTERNAL TABLE `gemini_bq_fn.image_validation`
WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(object_metadata="SIMPLE", uris=["gs://demo-bq-gemini-public-image/*.JPG"]);

Kiểm tra để đảm bảo rằng một bảng đối tượng mới có tên là image_validation được tạo trong tập dữ liệu của bạn.

Tạo một hàm từ xa BigQuery

Tạo một hàm từ xa trong BigQuery để gọi Cloud Function của Java triển khai mô hình Gemini Pro Vision. Tạo chỉ số này trong cùng một tập dữ liệu. Để thực hiện việc này, hãy chạy DDL sau đây từ ngăn trình chỉnh sửa SQL của bảng điều khiển BigQuery:

CREATE OR REPLACE FUNCTION `gemini_bq_fn.FN_IMAGE_VALIDATE` (baseline STRING, test STRING, prompt STRING) RETURNS STRING
 REMOTE WITH CONNECTION `us.gemini-bq-conn`
 OPTIONS (
   endpoint = 'https://us-central1-<your project id>.cloudfunctions.net/gemini-bq-fn',
   max_batching_rows = 1
 );

URL điểm cuối là URL REST đã được trả về trước đó trong bài tập này. Thao tác này sẽ tạo hàm từ xa trong BigQuery. Có 3 tham số trong DDL ở trên. Hai tham số đầu tiên là URL của hình ảnh được lưu trữ trong bảng đối tượng mà bạn đã tạo ở bước trước. Tham số cuối cùng là câu lệnh cho mô hình (Gemini Pro Vision). Bạn có thể tham khảo mã Java Cloud Functions dùng để phân tích cú pháp chữ ký này:

Gson().fromJson(request.getReader(), JsonObject.class);
JsonArray calls_array = requestJson.getAsJsonArray("calls");
JsonArray calls = (JsonArray) calls_array.get(0);
String baseline_url = calls.get(0).toString().replace("\"", "");
String test_url = calls.get(1).toString().replace("\"", "");
String prompt_string = calls.get(2).toString();

Gọi Gemini từ BigQuery

Dùng hàm từ xa trong truy vấn SELECT để kiểm thử hàm xác thực hình ảnh dựa trên câu lệnh.

select gemini_bq_fn.FN_IMAGE_VALIDATE(
'https://storage.googleapis.com/demo-bq-gemini-public-image/Baseline.JPG',
REPLACE(uri, 'gs://', 'https://storage.googleapis.com/') ,
'You are an expert image validator who can respond with JSON result. Find 2 images here. The first one is the reference image. The second image is the test image. Compare the second image to see if the second image is similar to the first in terms of the text present in the image.  Respond ONLY in JSON Format with 3 attributes namely SIMILARITY which is a \"YES\" or \"NO\", SIMILARITY_SCORE which is a percentage and DIFFERENCE_COMMENT which is a string.' ) as IMAGE_VALIDATION_RESULT
from `gemini_bq_fn.image_validation`
where uri like '%TEST1%';  

Hãy thử truy vấn ở trên với các tệp đối tượng TEST1TEST2. Bạn sẽ thấy kết quả tương tự như sau:

Ảnh chụp màn hình Kết quả của hàm từ xa BigQuery

Sau đây là hình ảnh để bạn tham khảo:

Hình ảnh cơ sở

Hình ảnh tham chiếu cơ sở cho trường hợp kiểm thử

Hình ảnh thử nghiệm

Hình ảnh thử nghiệm 1 cho trường hợp thử nghiệm

Xin lưu ý rằng cả hai hình ảnh đều tương tự nhau ở chỗ chúng có chế độ xem bảng điều khiển đám mây Duet AI, nhưng văn bản trong cả hai hình ảnh đều khác nhau do mô hình tạo ra ở định dạng JSON.

Như vậy, bạn đã kiểm thử thành công việc triển khai hàm từ xa.

7. Lợi ích và trường hợp sử dụng

Hãy xem xét một số lợi ích của việc tích hợp BigQuery và Gemini để phân tích dữ liệu có cấu trúc và không có cấu trúc.

  • Đưa AI tạo sinh vào dữ liệu của bạn: Không còn phải di chuyển dữ liệu, trùng lặp và tăng độ phức tạp. Bạn có thể phân tích dữ liệu và tạo thông tin chi tiết trong cùng một môi trường BigQuery.
  • Phân tích nâng cao: Giải thích bằng ngôn ngữ tự nhiên của Gemini giúp bạn hiểu rõ hơn về dữ liệu của mình và bạn có thể đạt được điều này bằng cách sử dụng các truy vấn SQL.
  • Khả năng mở rộng: Giải pháp này xử lý các tập dữ liệu lớn và phân tích phức tạp một cách dễ dàng và ít tốn công sức.

Có rất nhiều ứng dụng cho việc này. Hãy cân nhắc các trường hợp trong lĩnh vực tài chính (phân tích xu hướng thị trường), bán lẻ (cảm xúc của khách hàng), chăm sóc sức khoẻ (bản tóm tắt báo cáo y tế), v.v. trong đó các nhóm phân tích và kinh doanh của bạn có thể triển khai những trường hợp này với tương đối ít công sức, tài nguyên và ngôn ngữ cũng như công cụ quen thuộc mà họ chọn.

8. Dọn dẹp

Để tránh bị tính phí vào tài khoản Google Cloud của bạn cho các tài nguyên được dùng trong bài đăng này, hãy làm theo các bước sau:

  1. Trong bảng điều khiển Google Cloud, hãy chuyển đến trang Quản lý tài nguyên.
  2. Trong danh sách dự án, hãy chọn dự án mà bạn muốn xoá, rồi nhấp vào Xoá.
  3. Trong hộp thoại, hãy nhập mã dự án rồi nhấp vào Tắt để xoá dự án.
  4. Nếu bạn muốn giữ lại dự án, hãy bỏ qua các bước trên và xoá Cloud Function bằng cách chuyển đến Cloud Functions, rồi trong danh sách các hàm, hãy đánh dấu vào hàm bạn muốn xoá và nhấp vào Xoá.

9. Xin chúc mừng

Xin chúc mừng. Với các mô hình Gemini được tích hợp vào BigQuery, bạn không chỉ phân tích dữ liệu mà còn là người kể chuyện dữ liệu. Bạn có thể tạo ra những thông tin ẩn trong tập dữ liệu và thay đổi cách bạn hiểu thông tin chi tiết. Hãy bắt đầu thử nghiệm! Áp dụng kỹ thuật này cho tập dữ liệu của riêng bạn và khám phá những câu chuyện trong dữ liệu của bạn. Vì BigQuery hỗ trợ dữ liệu không có cấu trúc trong bảng đối tượng ( Bảng bên ngoài), hãy thử sử dụng Gemini Pro Vision để tạo thông tin chi tiết mang tính tạo sinh về dữ liệu hình ảnh. Hãy tham khảo tài liệu về Vertex AI, Hàm từ xa của BigQueryCloud Functions để biết hướng dẫn chi tiết hơn. Đây là kho lưu trữ github cho dự án này. Hãy cho chúng tôi biết những gì bạn tạo ra nhờ kiến thức này!