1. Giới thiệu
Tập dữ liệu khổng lồ chứa thông tin chi tiết có giá trị nhưng việc trích xuất thông tin có ý nghĩa có thể là một nhiệm vụ khó khăn. Các công cụ phân tích truyền thống thường thiếu thông tin trong việc đưa ra những lời giải thích cặn kẽ, giống con người để giúp chúng tôi thực sự hiểu rõ câu chuyện trong dữ liệu của mình. Kho dữ liệu ngày càng lưu giữ ngày càng nhiều dữ liệu phi cấu trúc, nhưng không phải lúc nào cũng có thể truy cập vào dữ liệu đó để thu thập thông tin chi tiết. Văn bản, hình ảnh và video phi cấu trúc chứa thông tin có giá trị để phát triển doanh nghiệp của bạn. Các LLM cung cấp một cách thức mới mạnh mẽ để hiểu dữ liệu của bạn bằng cách giải thích, phân tích quan điểm, phát hiện đối tượng và nhiều hoạt động khác. Với sự xuất hiện của các mô hình đa phương thức (và khả năng lưu trữ dữ liệu đối tượng như hình ảnh và video trong BigQuery thông qua các bảng Đối tượng), việc tích hợp các LLM mạnh mẽ như Gemini 1.0 Pro (để phân tích dựa trên văn bản) và Gemini 1.0 Pro Vision (để phân tích văn bản và hình ảnh/video) với BigQuery có thể chuyển đổi cách bạn phân tích dữ liệu.
Trong lớp học lập trình này, chúng ta sẽ xem xét hai phương pháp sau để lấy thông tin chi tiết của mô hình ngôn ngữ lớn (LLM) từ dữ liệu doanh nghiệp của bạn và nhân rộng các thông tin chi tiết đó ra hàng nghìn hàng trong BigQuery:
Phương thức 1: Gọi mô hình từ xa
- Gọi Gemini 1.0 Pro từ trong BigQuery bằng cách sử dụng
ML.GENERATE_TEXT
trong truy vấnSELECT
. - Sử dụng phương pháp này khi mô hình đã có sẵn dưới dạng mô hình từ xa trong BigQuery và bạn muốn sử dụng ngay. Kiểm tra trạng thái của mô hình mà bạn muốn sử dụng trong tài liệu BigQuery.
Phương thức 2: Triển khai hàm từ xa
- Gọi một Hàm đám mây triển khai lệnh gọi Tầm nhìn của Gemini 1.0 Pro, được hiển thị dưới dạng chức năng từ xa trong BigQuery.
- Hãy sử dụng phương pháp này khi mô hình bạn muốn sử dụng không có sẵn có sẵn dưới dạng mô hình từ xa hoặc bạn muốn linh hoạt hơn và tuỳ chỉnh hơn trong trường hợp sử dụng của mình.
Sản phẩm bạn sẽ tạo ra
- Đối với phương thức Gọi mô hình từ xa, bạn sẽ tạo trình tóm tắt vị trí cho tập dữ liệu sách lưu trữ trên Internet (được cung cấp công khai trong BigQuery) bằng cách gọi mô hình từ xa cho Gemini 1.0 Pro trong cấu trúc ML.GENERATE_TEXT trong BigQuery.
- Đối với phương pháp Triển khai hàm từ xa, bạn sẽ tạo một trình xác thực hình ảnh để xác thực hình ảnh thử nghiệm dựa trên hình ảnh cơ sở. Để làm việc này, bạn sẽ tạo một tập dữ liệu chứa ảnh chụp màn hình hình ảnh thử nghiệm trong một bảng bên ngoài và yêu cầu Gemini 1.0 Pro Vision xác thực dữ liệu đó với hình ảnh cơ sở. Sau đó, bạn sẽ tạo một Hàm đám mây Java để triển khai lệnh gọi của Gemini Pro Vision và gọi nó dưới dạng một hàm từ xa trong BigQuery.
Lưu ý:
Có thể có nhiều mô hình AI tạo sinh khác của Vertex AI được cung cấp làm mô hình từ xa trong BigQuery. Điều này có nghĩa là bạn có thể truy cập vào các mô hình này bằng cấu trúc ML.GENERATE_TEXT
ngay từ BigQuery. Tuy nhiên, ngay cả trong trường hợp mô hình từ xa có thể sử dụng, bạn luôn có thể tạo các chế độ tuỳ chỉnh nâng cao cho trường hợp sử dụng của mình bằng Cloud Functions, sau đó truy cập vào các mô hình này dưới dạng các hàm từ xa từ BigQuery.
Tại sao nên sử dụng BigQuery?
BigQuery là kho dữ liệu đa đám mây, không máy chủ, có thể mở rộng quy mô từ byte đến petabyte mà không tốn chi phí vận hành. Do đó, đây là một lựa chọn tuyệt vời để lưu trữ dữ liệu huấn luyện công nghệ học máy. Nhờ sử dụng các chức năng phân tích và công nghệ Học máy của BigQuery (BQML) tích hợp sẵn, bạn có thể tạo thông tin dự đoán mà không cần mã chỉ bằng các truy vấn SQL. Ngoài ra, bạn có thể truy cập dữ liệu từ các nguồn bên ngoài bằng các truy vấn liên kết, nhờ đó mà không cần thực hiện các quy trình ETL phức tạp.
BigQuery là một kho dữ liệu trên đám mây được quản lý toàn diện, giúp người dùng phân tích dữ liệu có cấu trúc, bán cấu trúc và không có cấu trúc.
2. Yêu cầu
3. Trước khi bắt đầu
- Trong Google Cloud Console, trên trang bộ chọn dự án, hãy chọn hoặc tạo một dự án trên Google Cloud.
- Đảm bảo rằng bạn đã bật tính năng thanh toán cho dự án trên Google Cloud. Tìm hiểu cách kiểm tra xem tính năng thanh toán có được bật trên một dự án hay không .
- Bạn sẽ sử dụng Cloud Shell, một môi trường dòng lệnh chạy trong Google Cloud được tải trước bằng bq. Nhấp vào Kích hoạt Cloud Shell ở đầu bảng điều khiển Google Cloud.
- Sau khi kết nối với Cloud Shell, bạn cần kiểm tra để chắc chắn rằng mình đã được xác thực và dự án được đặt thành mã dự án bằng lệnh sau đây:
gcloud auth list
- Chạy lệnh sau trong Cloud Shell để xác nhận rằng lệnh gcloud biết về dự án của bạn.
gcloud config list project
- Nếu dự án của bạn chưa được thiết lập, hãy sử dụng lệnh sau để thiết lập dự án:
gcloud config set project <YOUR_PROJECT_ID>
- Chuyển đến Gemini cho Google Cloud Marketplace để bật API này. Bạn cũng có thể sử dụng lệnh sau trong cửa sổ dòng lệnh Cloud Shell:
gcloud services enable cloudaicompanion.googleapis.com --project PROJECT_ID
- Đảm bảo rằng các API sau đã được bật:
- BigQuery
- Kết nối với BigQuery
- Chức năng đám mây
- Cloud Run
- Vertex AI
- Cloud Build
- API Cloud Storage
Lựa chọn thay thế cho việc sử dụng lệnh gcloud là thông qua bảng điều khiển bằng đường liên kết này.
Hãy tham khảo tài liệu để biết các lệnh gcloud và cách sử dụng.
4. Tạo tập dữ liệu BigQuery và kết nối bên ngoài
Hãy bắt đầu bằng cách tạo một tập dữ liệu và kết nối tài nguyên trên đám mây.
Tập dữ liệu trong BigQuery là một vùng chứa tất cả các bảng và đối tượng cho ứng dụng của bạn.
Để tạo một tập dữ liệu, hãy làm như sau:
- Chuyển đến trang BigQuery trong bảng điều khiển Google Cloud.
- Trong bảng điều khiển Explorer, hãy chọn dự án mà bạn muốn tạo tập dữ liệu.
- Mở rộng tuỳ chọn Hành động (biểu tượng dấu ba chấm dọc) rồi nhấp vào Tạo tập dữ liệu.
- Nhấp vào Tạo tập dữ liệu.
- Nhập
gemini_bq_fn
vào trường Mã tập dữ liệu. - Đặt loại vị trí của bạn là
Multi-region
và chấp nhận giá trị mặc định làUS(multiple regions in United States.
- Nhấp vào Tạo tập dữ liệu.
- Kiểm tra để đảm bảo tập dữ liệu được tạo và liệt kê trong mã dự án trong ngăn Explorer.
Bạn cần có kết nối BigQuery để tương tác với Chức năng đám mây của mình. Để tạo hàm từ xa, bạn phải tạo kết nối BigQuery. Trong lớp học lập trình này, chúng ta sẽ sử dụng kết nối BigLake để truy cập vào mô hình từ BigQuery thông qua Hàm Cloud. Các mối kết nối với BigLake giúp kết nối nguồn dữ liệu bên ngoài mà vẫn duy trì tính bảo mật và kiểm soát quyền truy cập chi tiết vào BigQuery, trong trường hợp của chúng ta là Vertex AI Gemini Pro API.
Để tạo kết nối với BigLake, hãy làm như sau:
- Nhấp vào Thêm trên ngăn Trình khám phá của trang BigQuery.
- Nhấp vào Kết nối với nguồn dữ liệu bên ngoài.
- Trong trình đơn Loại kết nối, hãy chọn Mô hình điều khiển từ xa Vertex AI, chức năng từ xa và BigLake (Tài nguyên đám mây).
- Trong trường Mã kết nối, hãy nhập tên kết nối là
gemini-bq-conn
. - Đặt loại vị trí của bạn là
Multi-region
và chấp nhận giá trị mặc định làUS(multiple regions in United States.
- Nhấp vào Tạo mối kết nối.
- Nhấp vào Go to connection (Chuyển đến kết nối), rồi sao chép mã tài khoản dịch vụ trong ngăn Connection info (Thông tin kết nối).
- Chuyển đến IAM & Quản trị viên và nhấp vào Cấp quyền truy cập.
- Dán mã tài khoản dịch vụ vào trường Nguyên tắc mới.
- Chọn vai trò
Vertex AI user
trong danh sách vai trò rồi nhấp vào Lưu.
Bạn hiện đã tạo thành công tập dữ liệu và kết nối BigQuery. Tiếp theo, bạn sẽ hoàn tất các bước cần thiết để gọi mô hình từ xa.
5. Trường hợp sử dụng 1 Gọi mô hình từ xa: Thiết lập lệnh gọi mô hình từ xa
Bây giờ, bạn đã tạo xong tập dữ liệu và kết nối, hãy tạo một mô hình trong BigQuery dựa trên mô hình nền tảng của Vertex AI Gemini Pro. Khi kết thúc bài tập này, bạn sẽ thiết lập và chạy ứng dụng LLM (mô hình ngôn ngữ lớn) bằng cách chỉ sử dụng các truy vấn SQL.
Bước 1: Tạo bảng BigQuery chứa dữ liệu đầu vào cho mô hình từ xa
Tạo một bảng có tên books
trong tập dữ liệu của bạn. Bảng này có thể chứa khoảng 50 bản ghi từ bảng bigquery-public-data.gdelt_internetarchivebooks.1905
trong tập dữ liệu Internet Archive Books được BigQuery sử dụng công khai.
Để thực hiện việc này, hãy thực thi câu lệnh DDL (Ngôn ngữ định nghĩa dữ liệu) sau đây trong ngăn trình chỉnh sửa BigQuery SQL:
create or replace table gemini_bq_fn.books as (
select *
from
bigquery-public-data.gdelt_internetarchivebooks.1905 limit 50)
Bước 2 : Tạo mô hình BigQuery
Tạo một mô hình trong tập dữ liệu của bạn. Để thực hiện việc này, hãy chạy DDL sau đây từ ngăn BigQuery SQL Editor:
CREATE MODEL `gemini_bq_fn.gemini_remote_model`
REMOTE WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(ENDPOINT = 'gemini-pro');
Quan sát mô hình được tạo cùng với một tuỳ chọn để xem mô hình.
Bước 3 : Kiểm thử ứng dụng AI tạo sinh mới
Dùng hàm ML.GENERATE_TEXT
trong truy vấn SELECT
để gửi yêu cầu đến mô hình từ xa.
SELECT ml_generate_text_llm_result as Gemini_Response, prompt as Prompt
FROM ML.GENERATE_TEXT(MODEL `gemini_bq_fn.gemini_remote_model`,
(select 'You are a text summarizer and standardizer. From the following text that contains address locations, standardize and print one standardized, consolidated address. You cannot return empty because you know how to pick up sensible data from the text in this field: ' ||
substring(locations, 0, 200) as prompt
from `gemini_bq_fn.books`),
STRUCT(
TRUE AS flatten_json_output));
Bạn sẽ thấy kết quả sau:
Xin chúc mừng! Bạn đã minh hoạ thành công cách sử dụng mô hình từ xa (dựa trên mô hình gemini-pro
) với hàm ML.GENERATE_TEXT
để phân tích dữ liệu văn bản trong bảng BigQuery.
Bây giờ, hãy thử một mô hình Vertex AI khác bằng các hàm từ xa của BigQuery. Giả sử bạn muốn tuỳ chỉnh và linh hoạt hơn về cách sử dụng mô hình này từ xa trong BigQuery. Các mô hình được hỗ trợ được liệt kê trong tài liệu BigQuery.
6. Trường hợp sử dụng 2 Triển khai hàm từ xa: Thiết lập phương thức triển khai hàm từ xa
Trong bài tập này, bạn sẽ tạo một hàm trong BigQuery dựa trên Java Cloud Function giúp triển khai mô hình nền tảng Gemini 1.0 Pro Vision. Trước tiên, bạn sẽ tạo và triển khai Hàm đám mây Java để so sánh hình ảnh bằng mô hình Tầm nhìn của Gemini 1.0 Pro. Sau đó, bạn sẽ tạo hàm từ xa trong BigQuery để gọi Hàm đám mây đã triển khai. Hãy nhớ rằng bạn có thể thực hiện cùng một quy trình cho mọi quá trình thực thi hàm từ xa trong BigQuery.
Hãy cùng bắt đầu nào!
Bước 1: Tạo hàm Java Cloud
Bạn sẽ tạo Hàm đám mây thế hệ 2 trong Java để xác thực hình ảnh thử nghiệm dựa trên hình ảnh cơ sở. Hình ảnh cơ sở được lưu trữ trong một tập dữ liệu chứa ảnh chụp màn hình của hình ảnh thử nghiệm trong một bảng bên ngoài trong BigQuery. Bạn sẽ xác thực hình ảnh bằng mô hình Gemini Pro Vision (SDK Java). Sau đó, bạn sẽ triển khai Java Cloud Function đến một điểm cuối REST.
Hãy làm theo các bước sau:
- Chạy Cloud Shell Editor.
- Nếu bạn đang sử dụng Trình chỉnh sửa cũ, hãy nhấp vào Dùng thử Trình chỉnh sửa mới.
- Trên thanh trạng thái, hãy nhấp vào Cloud Code – Đăng nhập.
- Nếu được nhắc cho phép Cloud Shell Editor thực hiện lệnh gọi API Google Cloud, hãy nhấp vào Uỷ quyền. Làm theo lời nhắc để đăng nhập vào Tài khoản Google của bạn. Bạn hiện đã kết nối với Google Cloud.
- Nếu bạn không thấy dự án của mình trong thanh trạng thái Mã đám mây, hãy nhấp vào Mã đám mây – Đăng nhập > Chọn một dự án trong Google Cloud. Chọn dự án Google Cloud mà bạn muốn tạo Cloud Functions. Dự án này sẽ tải và trở thành dự án đang hoạt động trong Cloud Shell Editor.
- Trong thanh trạng thái Mã đám mây, hãy nhấp vào tên dự án đang hoạt động. Trong trình đơn Chọn nhanh hiện ra, chọn New Application (Ứng dụng mới).
- Trong hộp thoại Create New Application (Tạo ứng dụng mới), hãy chọn Cloud Functions application (ứng dụng của tính năng Cloud).
- Chọn Java: Hello World khi được nhắc chọn một mẫu.
- Nhập
Gemini-BQ-Function
làm tên dự án trong đường dẫn dự án. Cấu trúc dự án sẽ xuất hiện trong chế độ xem mới của Cloud Shell Editor.
- Thêm các phần phụ thuộc cần thiết trong thẻ
<dependencies>... </dependencies>
hoặc sao chép các phần phụ thuộc đó từ tệp pom.xml mẫu. - Hãy đổi tên lớp từ
HelloWorld.java
thành tên có ý nghĩa hơn. Giả sửGeminiBigQueryFunction.java
. Đổi tên gói cho phù hợp. - Thay thế mã phần giữ chỗ trong tệp GeminiBigQueryFunction.Java bằng mã mẫu được cung cấp trong kho lưu trữ GitHub. Hãy nhớ thay thế biến <YOUR_PROJECT_ID> bằng mã dự án của bạn trong mã mẫu.
- Chuyển đến thiết bị đầu cuối Cloud Shell. Kiểm tra để đảm bảo rằng bạn đang ở trong thư mục dự án. Nếu chưa, hãy chuyển đến thư mục dự án bằng cách thực thi lệnh sau:
cd Gemini-BQ-Function
- Thực thi câu lệnh sau để xây dựng và triển khai Hàm đám mây:
gcloud functions deploy gemini-bq-fn --gen2 --runtime java17 --trigger-http --entry-point cloudcode.helloworld.GeminiBigQueryFunction --allow-unauthenticated --source .
Thay thế điểm truy cập trong lệnh bằng điểm truy cập của hàm. Dữ liệu đầu ra là URL REST ở định dạng sau:
https://us-central1-YOUR_PROJECT_ID.cloudfunctions.net/gemini-bq-fn
- Kiểm tra hàm đám mây này bằng cách chạy lệnh sau trên thiết bị đầu cuối:
gcloud functions call gemini-bq-fn --region=us-central1 --gen2 --data '{"calls":[["https://storage.googleapis.com/img_public_test/image_validator/baseline/1.JPG", "https://storage.googleapis.com/img_public_test/image_validator/test/2.JPG", "PROMPT_ABOUT_THE_IMAGES_TO_GEMINI"]]}'
Phản hồi cho câu lệnh mẫu ngẫu nhiên:
Tuyệt vời! Chức năng đám mây chung cho mô hình Tầm nhìn Gemini Pro đã sẵn sàng. Hãy sử dụng điểm cuối này trực tiếp trên dữ liệu BigQuery từ trong một hàm từ xa của BigQuery.
Bước 2: Tạo bảng đối tượng BigQuery và hàm từ xa
Điều kiện tiên quyết
Bạn sẽ cần một bộ chứa trên Cloud Storage cho phần này của bài tập. Làm theo các bước sau để tạo một bộ chứa Cloud Storage:
- Để tạo bộ chứa, hãy chuyển đến bảng điều khiển Cloud Storage rồi nhấp vào Tạo.
- Nhập
demo-bq-gemini-public-image
làm tên bộ chứa rồi nhấp vào Tạo. - Bỏ đánh dấu lựa chọn
Enforce public access prevention on this bucket
. Mặc dù bạn đang tạo bộ chứa này để truy cập công khai trong bài tập này, chúng tôi khuyên bạn nên ngăn quyền truy cập công khai và cấp quyền cho các tài khoản dịch vụ cụ thể theo yêu cầu trong các trường hợp sử dụng của doanh nghiệp. - Sau khi tạo bộ chứa, hãy chuyển đến thẻ Quyền để xem và thay đổi các quyền.
- Để thêm người dùng chính, hãy nhấp vào Cấp quyền truy cập. Hãy chỉ định mã tài khoản dịch vụ để cấp quyền cho một tài khoản cụ thể hoặc chỉ định
allUsers
để cấp quyền truy cập công khai vào bộ chứa của bạn. - Chọn vai trò
Storage Object Viewer
rồi nhấp vào Lưu. Nếu được nhắc, hãy chọn cho phép truy cập công khai. - Chuyển đến thẻ Đối tượng rồi tải hình ảnh cơ sở và hình ảnh thử nghiệm lên để so sánh. Đối với lớp học lập trình này, bạn có thể tải các đối tượng được cung cấp công khai sau đây lên: baseline.JPG, TEST1.JPG và TEST2.JPG.
Tạo bảng đối tượng BigQuery
Tạo một bảng đối tượng bên ngoài từ BigQuery để truy cập vào dữ liệu phi cấu trúc trong bộ chứa bằng cách sử dụng kết nối và tập dữ liệu mà bạn đã tạo trước đó. Để thực hiện việc này, hãy thực thi câu lệnh DDL (Ngôn ngữ định nghĩa dữ liệu) sau đây trong ngăn trình chỉnh sửa truy vấn BigQuery:
CREATE OR REPLACE EXTERNAL TABLE `gemini_bq_fn.image_validation`
WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(object_metadata="SIMPLE", uris=["gs://demo-bq-gemini-public-image/*.JPG"]);
Kiểm tra để đảm bảo rằng bảng đối tượng mới có tên image_validation đã được tạo trong tập dữ liệu của bạn.
Tạo một Hàm từ xa BigQuery
Tạo một hàm từ xa trong BigQuery để gọi hàm Java Cloud Function giúp triển khai mô hình Tầm nhìn của Gemini Pro. Hãy tạo lớp này trong cùng một tập dữ liệu. Để thực hiện việc này, hãy chạy DDL sau đây từ ngăn trình chỉnh sửa SQL trên bảng điều khiển BigQuery:
CREATE OR REPLACE FUNCTION `gemini_bq_fn.FN_IMAGE_VALIDATE` (baseline STRING, test STRING, prompt STRING) RETURNS STRING
REMOTE WITH CONNECTION `us.gemini-bq-conn`
OPTIONS (
endpoint = 'https://us-central1-<your project id>.cloudfunctions.net/gemini-bq-fn',
max_batching_rows = 1
);
URL điểm cuối là URL REST được trả về trước đó trong bài tập này. Thao tác này sẽ tạo hàm từ xa trong BigQuery. Có 3 tham số trong DDL ở trên. Hai tham số đầu tiên là URL tới hình ảnh được lưu trữ trong bảng đối tượng được tạo ở bước trước. Thông số cuối cùng là câu lệnh chuyển sang mô hình (Gemini Pro Vision). Bạn có thể tham khảo mã Java Cloud Functions được dùng để phân tích cú pháp chữ ký này:
Gson().fromJson(request.getReader(), JsonObject.class);
JsonArray calls_array = requestJson.getAsJsonArray("calls");
JsonArray calls = (JsonArray) calls_array.get(0);
String baseline_url = calls.get(0).toString().replace("\"", "");
String test_url = calls.get(1).toString().replace("\"", "");
String prompt_string = calls.get(2).toString();
Gọi Gemini từ BigQuery
Sử dụng hàm từ xa trong truy vấn SELECT
để kiểm thử hàm xác thực hình ảnh dựa trên lời nhắc.
select gemini_bq_fn.FN_IMAGE_VALIDATE(
'https://storage.googleapis.com/demo-bq-gemini-public-image/Baseline.JPG',
REPLACE(uri, 'gs://', 'https://storage.googleapis.com/') ,
'You are an expert image validator who can respond with JSON result. Find 2 images here. The first one is the reference image. The second image is the test image. Compare the second image to see if the second image is similar to the first in terms of the text present in the image. Respond ONLY in JSON Format with 3 attributes namely SIMILARITY which is a \"YES\" or \"NO\", SIMILARITY_SCORE which is a percentage and DIFFERENCE_COMMENT which is a string.' ) as IMAGE_VALIDATION_RESULT
from `gemini_bq_fn.image_validation`
where uri like '%TEST1%';
Hãy thử truy vấn ở trên bằng các tệp đối tượng TEST1 và TEST2. Bạn sẽ thấy kết quả tương tự như sau:
Dưới đây là hình ảnh để bạn tham khảo:
Hình ảnh đường cơ sở
Hình ảnh thử nghiệm
Xin lưu ý rằng cả hai hình ảnh đều giống nhau ở chỗ chúng có chế độ xem bảng điều khiển đám mây của Duet AI, nhưng văn bản trong cả hai hình ảnh này lại khác nhau do mô hình ở định dạng JSON.
Như vậy, bạn đã kiểm thử thành công việc triển khai hàm từ xa.
7. Lợi ích và trường hợp sử dụng
Hãy cùng tìm hiểu một số lợi ích của việc tích hợp BigQuery và Gemini trong việc phân tích dữ liệu có cấu trúc và không có cấu trúc.
- Đưa AI tạo sinh vào dữ liệu của bạn: Không còn phải di chuyển dữ liệu, sao chép và phức tạp thêm nữa. Bạn có thể phân tích dữ liệu và tạo thông tin chi tiết trong cùng một môi trường BigQuery.
- Số liệu phân tích nâng cao: Giải thích ngôn ngữ tự nhiên của Gemini giúp bổ sung một lớp hiểu biết mới vào dữ liệu của bạn. Bạn có thể đạt được điều này bằng cách sử dụng các truy vấn SQL.
- Khả năng mở rộng: Giải pháp này dễ dàng xử lý các tập dữ liệu lớn và hoạt động phân tích phức tạp.
Có rất nhiều ứng dụng cho việc này. Hãy xem xét các tình huống về tài chính (phân tích xu hướng thị trường), bán lẻ (ý kiến của khách hàng), chăm sóc sức khoẻ (bản tóm tắt báo cáo y tế), v.v. mà nhóm phân tích và kinh doanh của bạn có thể triển khai chúng mà không cần tốn nhiều công sức, nguồn lực cũng như ngôn ngữ và công cụ quen thuộc mà bạn lựa chọn.
8. Dọn dẹp
Để tránh bị tính phí vào tài khoản Google Cloud cho các tài nguyên sử dụng trong bài đăng này, hãy làm theo các bước sau:
- Trong bảng điều khiển Google Cloud, hãy chuyển đến trang Quản lý tài nguyên.
- Trong danh sách dự án, hãy chọn dự án mà bạn muốn xoá, sau đó nhấp vào Delete (Xoá).
- Trong hộp thoại, hãy nhập mã dự án rồi nhấp vào Tắt để xoá dự án.
- Nếu bạn muốn giữ lại dự án, hãy bỏ qua các bước ở trên và xoá Hàm đám mây bằng cách chuyển đến Cloud Functions và trong danh sách hàm, hãy chọn hàm mà bạn muốn xoá rồi nhấp vào Xoá.
9. Xin chúc mừng
Chúc mừng bạn! Nhờ các mô hình Gemini được tích hợp vào BigQuery, bạn không còn chỉ phân tích dữ liệu của mình nữa, mà còn có khả năng kể chuyện về dữ liệu. Bạn có thể tạo ra các câu chuyện ẩn giấu trong các tập dữ liệu và cải tiến cách bạn hiểu thông tin chi tiết của mình. Hãy bắt đầu thử nghiệm! Hãy áp dụng kỹ thuật này cho các tập dữ liệu của riêng bạn và khám phá những câu chuyện trong dữ liệu của bạn. Vì BigQuery hỗ trợ dữ liệu không có cấu trúc trong bảng đối tượng ( Bảng bên ngoài), hãy thử dùng Gemini Pro Vision để tạo thông tin chi tiết tạo sinh về dữ liệu hình ảnh. Hãy tham khảo tài liệu về Vertex AI, Chức năng từ xa của BigQuery và Chức năng đám mây để được hướng dẫn chi tiết hơn. Dưới đây là kho lưu trữ github cho dự án này. Hãy cho chúng tôi biết thành quả của bạn nhờ kiến thức này!