תובנות לגבי מודלים גדולים של שפה (LLM) במקום: BigQuery & Gemini לניתוח נתונים מובנה & לא מובנה

1. מבוא

מערכי נתונים עצומים מכילים תובנות חשובות, אבל הפקת הבנה משמעותית יכולה להיות משימה מרתיעה. לרוב, הכלים המסורתיים לניתוח נתונים לא מספקים הסברים מגוונים, דמויי אדם, שעוזרים לנו להבין באמת את הסיפור שבנתונים שלנו. מחסני נתונים מכילים יותר ויותר נתונים לא מובנים, אבל לא תמיד ניתן היה לגשת לנתונים האלה כדי לקבל תובנות. טקסטים, תמונות וסרטונים לא מובנים מכילים מידע חשוב לפיתוח העסק. מודלים גדולים של שפה מספקים דרך חדשה ויעילה להבין את הנתונים, ולספק הסברים, ניתוח סנטימנטים, זיהוי אובייקטים ועוד. עם התפתחות המודלים רב-אופניים (והיכולת לאחסן נתונים של אובייקטים כמו תמונות וסרטונים ב-BigQuery באמצעות טבלאות אובייקטים), שילוב של מודלים גדולים של שפה (LLM) כמו Gemini 1.0 Pro (לניתוח מבוסס-טקסט) ו-Gemini 1.0 Pro Vision (לניתוח טקסט ותמונה/וידאו) עם BigQuery יכול לשנות את הדרך שבה אתם מנתחים נתונים.

ב-Codelab הזה, נבחן את שתי השיטות הבאות להפקת תובנות על LLM מהנתונים הארגוניים שלכם, ונגדיל את התובנות האלה לאלפי שורות ב-BigQuery:

שיטה 1: הפעלת המודל מרחוק

  • אפשר להפעיל את Gemini 1.0 Pro מתוך BigQuery באמצעות הפקודה ML.GENERATE_TEXT בשאילתה SELECT.
  • כדאי להשתמש בגישה הזו אם המודל כבר זמין כמודל מרוחק ב-BigQuery, ואתם רוצים להשתמש בו מראש. אתם יכולים לבדוק את הסטטוס של המודל שבו אתם רוצים להשתמש במסמכי התיעוד של BigQuery.

שיטה שנייה: הטמעה של פונקציות מרחוק

מה תפַתחו

  • בשיטה של הפעלת מודל מרחוק, יוצרים מסכם מיקום למערך הנתונים של הספרים בארכיון באינטרנט (שזמין באופן ציבורי ב-BigQuery) על ידי הפעלת המודל המרוחק של Gemini 1.0 Pro במבנה ML.GENERATE_TEXT ב-BigQuery.

תרשים זרימה להפעלת מודל מרחוק

  • בשיטה הטמעת פונקציות מרחוק יוצרים מאמת תמונות לאימות תמונות לבדיקה מול תמונת בסיס. לשם כך, צריך ליצור מערך נתונים שמכיל בטבלה חיצונית צילומי מסך של התמונות לבדיקה, ולבקש מ-Gemini 1.0 Pro Vision לאמת אותו מול תמונת הבסיס. לאחר מכן, יוצרים פונקציה של Java Cloud Functions שמטמיעה את הקריאה ל-Gemini Pro Vision ולהפעיל אותה כפונקציה מרוחקת ב-BigQuery.

תרשים זרימה של הטמעת פונקציה מרחוק

הערה:

יכול להיות שיש עוד מודלים של Vertex AI Generative AI שיהיו זמינים כמודלים מרחוק ב-BigQuery. פירוש הדבר הוא שאתם יכולים לגשת למודלים האלה באמצעות ה-build 'ML.GENERATE_TEXT' של BigQuery מ-BigQuery. עם זאת, גם במקרה של זמינות מודל מרחוק, תמיד יש אפשרות ליצור התאמות אישיות מתקדמות לתרחיש לדוגמה שלכם באמצעות Cloud Functions, ואז לגשת למודלים האלה כפונקציות מרחוק מ-BigQuery.

למה כדאי להשתמש ב-BigQuery?

BigQuery הוא מחסן נתונים (data warehouse) ללא שרת (serverless), שיכול להתאים לעומס (scaling) מבייטים עד פטה-בייט, עם תקורה תפעולית מינימלית, ולכן הוא מתאים במיוחד לאחסון נתוני אימון של למידת מכונה. באמצעות היכולות המובנות של BigQuery למידת מכונה (BQML) וניתוח נתונים, אתם יכולים ליצור חיזויים ללא צורך בכתיבת קוד באמצעות שאילתות SQL בלבד. בנוסף, אפשר לגשת לנתונים ממקורות חיצוניים באמצעות שאילתות מאוחדות, ללא צורך בצינורות עיבוד נתונים מורכבים (ETL).

BigQuery הוא מחסן נתונים (data warehouse) מנוהל בענן שעוזר למשתמשים לנתח נתונים מובנים, נתונים מובנים למחצה ולא מובנים.

2. דרישות

  • דפדפן כמו Chrome או Firefox
  • פרויקט ב-Google Cloud שמופעל בו חיוב.

3. לפני שמתחילים

  1. במסוף Google Cloud, בדף בורר הפרויקטים, בוחרים או יוצרים פרויקט ב-Google Cloud.
  2. הקפידו לוודא שהחיוב מופעל בפרויקט שלכם ב-Cloud. איך בודקים אם החיוב מופעל בפרויקט
  3. משתמשים ב-Cloud Shell, סביבת שורת הפקודה שפועלת ב-Google Cloud וכוללת טעינה מראש של bq. לוחצים על Activate Cloud Shell בחלק העליון של מסוף Google Cloud.

תמונת הלחצן של Activate Cloud Shell

  1. אחרי ההתחברות ל-Cloud Shell, בודקים שהאימות כבר בוצע ושהפרויקט מוגדר למזהה הפרויקט שלכם, באמצעות הפקודה הבאה:
gcloud auth list
  1. מריצים את הפקודה הבאה ב-Cloud Shell כדי לוודא שהפקודה של gcloud יודעת על הפרויקט שלכם.
gcloud config list project
  1. אם הפרויקט לא מוגדר, מגדירים אותו באמצעות הפקודה הבאה:
gcloud config set project <YOUR_PROJECT_ID>
  1. מפעילים את ה-API דרך Gemini ל-Google Cloud Marketplace. אפשר גם להשתמש בפקודה הבאה בטרמינל של Cloud Shell:
gcloud services enable cloudaicompanion.googleapis.com --project PROJECT_ID
  1. צריך לוודא שממשקי ה-API הבאים מופעלים:
  • BigQuery
  • חיבור ל-BigQuery
  • Cloud Function
  • Cloud Run
  • Vertex AI
  • Cloud Build
  • ממשקי API של Cloud Storage

החלופה לשימוש בפקודת gcloud עוברת דרך המסוף באמצעות הקישור הזה.

עיינו במאמרי העזרה לפקודות ולשימוש ב-gcloud.

4. יצירת מערך נתונים ב-BigQuery וחיבור חיצוני

נתחיל ביצירת מערך נתונים וחיבור משאבים ב-Cloud.

מערך נתונים ב-BigQuery הוא קונטיינר לכל הטבלאות והאובייקטים של האפליקציה.

כדי ליצור מערך נתונים:

  1. נכנסים אל הדף ב-BigQuery במסוף Google Cloud.
  2. בחלונית Explorer בוחרים את הפרויקט שבו רוצים ליצור את מערך הנתונים.
  3. מרחיבים את האפשרות פעולות (סמל שלוש הנקודות האנכיות) ולוחצים על Create dataset.

תמונה של תפריט פעולות והאפשרות Create dataset

  1. לוחצים על Create dataset.
  2. מזינים את הערך gemini_bq_fn בשדה Dataset ID.
  3. עליך להגדיר את סוג המיקום שלך בתור Multi-region ולאשר את ערך ברירת המחדל, שהוא US(multiple regions in United States.
  4. לוחצים על Create dataset.
  5. בודקים שמערך הנתונים נוצר ומופיע עם מזהה הפרויקט בחלונית Explorer.

כדי לבצע אינטראקציה עם הפונקציה של Cloud Functions, צריך חיבור של BigQuery. כדי ליצור פונקציה מרוחקת, צריך ליצור חיבור ל-BigQuery. ב-Codelab הזה נשתמש בחיבור BigLake כדי לגשת למודל מ-BigQuery דרך הפונקציה של Cloud Functions. חיבורי BigLake עוזרים לחבר את מקור הנתונים החיצוני תוך שמירה על אבטחה ובקרת גישה פרטנית ל-BigQuery, שבמקרה שלנו הוא Vertex AI Gemini Pro API.

כדי ליצור את החיבור ל-BigLake:

  1. לוחצים על Add בחלונית Explorer בדף BigQuery.

מסוף BigQuery עם הלחצן ADD מודגש כדי להוסיף חיבור חיצוני

  1. לוחצים על חיבורים למקורות נתונים חיצוניים.
  2. בתפריט Connection type (סוג החיבור), בוחרים באפשרות Vertex AI Remote models, Remote Functions (פונקציות מרחוק) ו-BigLake (Cloud Resource).
  3. בשדה Connection ID (מזהה החיבור), מזינים את שם החיבור בתור gemini-bq-conn.
  4. עליך להגדיר את סוג המיקום שלך בתור Multi-region ולאשר את ערך ברירת המחדל, שהוא US(multiple regions in United States.
  5. לוחצים על יצירת חיבור.
  6. לוחצים על מעבר לחיבור ומעתיקים את מזהה חשבון השירות בחלונית פרטי החיבור.

צילום מסך של פרטי החיבור

  1. נכנסים אל IAM & ניהול ולוחצים על הענקת גישה.
  2. מדביקים את מזהה חשבון השירות בשדה New principles (עקרונות חדשים).
  3. בוחרים את התפקיד Vertex AI user מרשימת התפקידים ולוחצים על Save.

הענקת גישה לצילום מסך של חשבון שירות

סיימתם ליצור את מערך הנתונים ואת החיבור ל-BigQuery. לאחר מכן, צריך להשלים את השלבים הנדרשים להפעלת המודל מרחוק.

5. תרחיש לדוגמה מס' 1: הפעלת מודל מרחוק: הגדרת הפעלה של מודל מרחוק

אחרי שיצרתם את מערך הנתונים והחיבור, בואו ניצור מודל ב-BigQuery שמבוסס על מודל הבסיס של Vertex AI Gemini Pro. בסוף התרגיל, האפליקציה שלכם ל-LLM תשתמשו בשאילתות SQL בלבד.

שלב 1: יצירת טבלה ב-BigQuery שמכילה את נתוני הקלט של המודל המרוחק

אפשר ליצור במערך הנתונים טבלה בשם books, שמכילה כ-50 רשומות מהטבלה bigquery-public-data.gdelt_internetarchivebooks.1905 במערך הנתונים Internet Archive Books, שמקורו ב-BigQuery לשימוש ציבורי.

כדי לעשות את זה, מריצים את הצהרת ה-DDL (שפת הגדרת הנתונים) הבאה מחלונית העריכה של BigQuery SQL:

create or replace table gemini_bq_fn.books as (
select *
from
bigquery-public-data.gdelt_internetarchivebooks.1905 limit 50)

שלב 2 : יצירת מודל BigQuery

יוצרים מודל במערך הנתונים. כדי לעשות את זה, מריצים את ה-DDL הבא מהחלונית של BigQuery SQL Editor:

CREATE MODEL `gemini_bq_fn.gemini_remote_model`
REMOTE WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(ENDPOINT = 'gemini-pro');

חשוב לזכור שהמודל נוצר עם אפשרות להציג את המודל.

שלב 3 : בדיקת האפליקציה החדשה של בינה מלאכותית גנרטיבית

אפשר להשתמש בפונקציה ML.GENERATE_TEXT בשאילתה של SELECT כדי לשלוח בקשה למודל המרוחק.

SELECT ml_generate_text_llm_result as Gemini_Response, prompt as Prompt
FROM ML.GENERATE_TEXT(MODEL `gemini_bq_fn.gemini_remote_model`,
 (select 'You are a text summarizer and standardizer. From the following text that contains address locations, standardize and print one standardized, consolidated address. You cannot return empty because you know how to pick up sensible data from the text in this field: ' ||
substring(locations, 0, 200) as prompt
from `gemini_bq_fn.books`),
STRUCT(
 TRUE AS flatten_json_output));

אמורה להופיע התוצאה הבאה:

תוצאת השאילתה ML.GENERATE_TEXT ב-BigQuery

מעולה! הוכחתם בהצלחה איך להשתמש במודל מרוחק (על סמך מודל gemini-pro) עם הפונקציה ML.GENERATE_TEXT כדי לנתח נתוני טקסט בטבלה של BigQuery.

עכשיו ננסה מודל אחר של Vertex AI באמצעות פונקציות מרוחקות של BigQuery. נניח שאתם רוצים להוסיף עוד התאמה אישית וגמישות לאופן השימוש במודל מרחוק ב-BigQuery. המודלים הנתמכים מפורטים במסמכי התיעוד של BigQuery.

6. תרחיש לדוגמה מס' 2: הטמעת פונקציה מרחוק: הגדרת הטמעת פונקציה מרחוק

בתרגיל הזה תיצרו פונקציה ב-BigQuery שמתבססת על הפונקציה של Java Cloud Functions שמטמיעה את מודל הבסיס של Gemini 1.0 Pro Vision. קודם כול, יוצרים ופורסים את הפונקציה של Java Cloud Functions כדי להשוות בין תמונות באמצעות מודל Gemini 1.0 Pro Vision, ולאחר מכן יוצרים את הפונקציה המרוחקת ב-BigQuery שמפעילה את הפונקציה של Cloud Functions שנפרסה. חשוב לזכור שאפשר לבצע את אותו תהליך בכל הפעלה של פונקציה מרחוק ב-BigQuery.

אז בואו נתחיל!

שלב 1: יצירת הפונקציה של Java Cloud Functions

נפתח פונקציה של Cloud Functions מדור 2 ב-Java לתיקוף תמונות לבדיקה מול תמונת בסיס. תמונת הבסיס מאוחסנת במערך נתונים שמכיל צילומי מסך של התמונות לבדיקה בטבלה חיצונית ב-BigQuery. יהיה צורך לאמת את התמונות באמצעות מודל Gemini Pro Vision (Java SDK). לאחר מכן תפרסו את הפונקציה של Java Cloud Functions בנקודת קצה ל-REST.

כך עושים זאת:

  1. מפעילים את Cloud Shell Editor.
  2. אם משתמשים בגרסה הקודמת של העורך, לוחצים על רוצה לנסות את העורך החדש?.
  3. בשורת הסטטוס, לוחצים על Cloud Code – כניסה.
  4. אם מתבקשים לאשר ל-Cloud Shell Editor לבצע קריאות ל-Google Cloud API, לוחצים על Authorize. פועלים לפי ההנחיות כדי להיכנס לחשבון Google. עכשיו התחברתם ל-Google Cloud.
  5. אם הפרויקט לא מופיע בשורת הסטטוס של Cloud Code, לוחצים על Cloud Code - Sign In > בוחרים פרויקט בענן של Google. בוחרים את הפרויקט ב-Google Cloud שבו רוצים ליצור את Cloud Functions. הפרויקט נטען והופך לפרויקט הפעיל ב-Cloud Shell Editor.
  6. בשורת הסטטוס של Cloud Code, לוחצים על שם הפרויקט הפעיל. בתפריט הבחירה המהירה שמופיע, בוחרים באפשרות New Application (אפליקציה חדשה).
  7. בתיבת הדו-שיח Create New Application (יצירת אפליקציה חדשה), בוחרים באפשרות Cloud Functions.

דף קופץ חדש של אפליקציה 1

  1. כשתתבקשו לבחור תבנית, בוחרים באפשרות Java: Hello World.

דף קופץ חדש של אפליקציה 2

  1. מזינים את Gemini-BQ-Function כשם הפרויקט בנתיב הפרויקט. מבנה הפרויקט מופיע בתצוגה חדשה של Cloud Shell Editor.

מבנה חדש של פרויקט לאפליקציות של הפונקציה של Java Cloud

  1. מוסיפים את יחסי התלות הנדרשים בתוך התג <dependencies>... </dependencies> או מעתיקים את יחסי התלות מהקובץ pom.xml לדוגמה.
  2. משנים את שם הכיתה מ-HelloWorld.java לשם משמעותי יותר. נניח GeminiBigQueryFunction.java. משנים את שם החבילה בהתאם.
  3. מחליפים את קוד ה-placeholder בקובץ GeminiBigQueryFunction.Java בקוד לדוגמה שמופיע במאגר GitHub. חשוב להחליף את המשתנה <YOUR_PROJECT_ID> לכלול את מזהה הפרויקט שלכם בקוד לדוגמה.
  4. נכנסים למסוף Cloud Shell. מוודאים שאתם נמצאים בספריית הפרויקט. אם לא, מריצים את הפקודה הבאה כדי לעבור לספריית הפרויקט:
cd Gemini-BQ-Function
  1. כדי ליצור ולפרוס את הפונקציה של Cloud Functions, מריצים את ההצהרה הבאה:
gcloud functions deploy gemini-bq-fn --gen2 --runtime java17 --trigger-http --entry-point cloudcode.helloworld.GeminiBigQueryFunction --allow-unauthenticated --source .

מחליפים את נקודת הכניסה בפקודה בנקודת הכניסה של הפונקציה. הפלט הוא כתובת URL ל-REST בפורמט הבא:

https://us-central1-YOUR_PROJECT_ID.cloudfunctions.net/gemini-bq-fn
  1. כדי לבדוק את הפונקציה של Cloud Functions, מריצים את הפקודה הבאה מהטרמינל:
gcloud functions call gemini-bq-fn --region=us-central1 --gen2 --data '{"calls":[["https://storage.googleapis.com/img_public_test/image_validator/baseline/1.JPG", "https://storage.googleapis.com/img_public_test/image_validator/test/2.JPG", "PROMPT_ABOUT_THE_IMAGES_TO_GEMINI"]]}'

תשובה לפרומפט לדוגמה אקראי:

מחרוזת תגובת JSON מהפונקציה של Cloud Functions

מדהים! הפונקציה הגנרית של Cloud Functions להטמעה של מודל Gemini Pro Vision מוכנה. נשתמש בנקודת הקצה הזו ישירות על נתוני BigQuery מתוך פונקציה מרוחקת של BigQuery.

שלב 2: יצירת טבלת אובייקטים ב-BigQuery ופונקציה מרוחקת

דרישות מוקדמות

יש צורך בקטגוריה של Cloud Storage לחלק הזה בתרגיל. כדי ליצור קטגוריה של Cloud Storage:

  1. כדי ליצור קטגוריה, נכנסים למסוף של Cloud Storage ולוחצים על Create.
  2. מזינים את demo-bq-gemini-public-image בתור שם הקטגוריה ולוחצים על Create.
  3. מבטלים את הסימון של האפשרות Enforce public access prevention on this bucket. בתרגיל הזה יוצרים את הקטגוריה הזו לגישה ציבורית, אבל מומלץ למנוע גישה ציבורית ולהעניק הרשאות לחשבונות שירות ספציפיים, כפי שנדרש בתרחישים לדוגמה של הארגון.
  4. אחרי שיוצרים את הקטגוריה, עוברים לכרטיסייה Permissions כדי לראות את ההרשאות ולשנות אותן.
  5. כדי להוסיף חשבונות משתמשים, לוחצים על Grant access. אפשר לציין מספר חשבון שירות כדי לתת הרשאות לחשבון ספציפי, או לציין allUsers כדי לתת גישה ציבורית לקטגוריה.
  6. בוחרים את התפקיד Storage Object Viewer ולוחצים על שמירה. אם מוצגת בקשה לעשות את זה, בוחרים אם לאפשר גישה ציבורית.
  7. עוברים לכרטיסייה Objects, מעלים תמונות בסיסיות ובודקים תמונות להשוואה. ב-Codelab הזה, אפשר להעלות את האובייקטים הבאים שזמינים באופן ציבורי: baseline.JPG, TEST1.JPG ו-TEST2.JPG.

יצירת טבלת אובייקטים ב-BigQuery

אפשר ליצור טבלת אובייקטים חיצונית מ-BigQuery כדי לגשת לנתונים הלא מובְנים בקטגוריה באמצעות החיבור ומערך הנתונים שיצרתם קודם. כדי לעשות את זה, מריצים את הצהרת ה-DDL (שפת הגדרת הנתונים) הבאה מחלונית עורך השאילתות של BigQuery:

CREATE OR REPLACE EXTERNAL TABLE `gemini_bq_fn.image_validation`
WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(object_metadata="SIMPLE", uris=["gs://demo-bq-gemini-public-image/*.JPG"]);

בודקים שבמערך הנתונים נוצרה טבלת אובייקטים חדשה בשם image_validation.

יצירת פונקציה מרוחקת של BigQuery

ליצור פונקציה מרוחקת ב-BigQuery כדי להפעיל את הפונקציה של Java Cloud Functions שמטמיעה את מודל Gemini Pro Vision. צריך ליצור את זה באותו מערך נתונים. כדי לעשות את זה, מריצים את ה-DDL הבא מהחלונית של עורך SQL במסוף BigQuery:

CREATE OR REPLACE FUNCTION `gemini_bq_fn.FN_IMAGE_VALIDATE` (baseline STRING, test STRING, prompt STRING) RETURNS STRING
 REMOTE WITH CONNECTION `us.gemini-bq-conn`
 OPTIONS (
   endpoint = 'https://us-central1-<your project id>.cloudfunctions.net/gemini-bq-fn',
   max_batching_rows = 1
 );

כתובת ה-URL של נקודת הקצה היא כתובת ה-URL ב-REST שהוחזרה מוקדם יותר בתרגיל הזה. הפעולה הזו יוצרת את הפונקציה המרוחקת ב-BigQuery. יש שלושה פרמטרים ב-DDL שלמעלה. שני הפרמטרים הראשונים הם כתובות URL של התמונות ששמורות בטבלת האובייקטים שנוצרה בשלב הקודם. הפרמטר האחרון הוא ההנחיה למודל (Gemini Pro Vision). אפשר לעיין בקוד Java Cloud Functions שמשמש לניתוח החתימה הזו:

Gson().fromJson(request.getReader(), JsonObject.class);
JsonArray calls_array = requestJson.getAsJsonArray("calls");
JsonArray calls = (JsonArray) calls_array.get(0);
String baseline_url = calls.get(0).toString().replace("\"", "");
String test_url = calls.get(1).toString().replace("\"", "");
String prompt_string = calls.get(2).toString();

הפעלת Gemini מ-BigQuery

צריך להשתמש בפונקציה המרוחקת בשאילתה SELECT כדי לבדוק את הפונקציה לאימות התמונות מול ההנחיה.

select gemini_bq_fn.FN_IMAGE_VALIDATE(
'https://storage.googleapis.com/demo-bq-gemini-public-image/Baseline.JPG',
REPLACE(uri, 'gs://', 'https://storage.googleapis.com/') ,
'You are an expert image validator who can respond with JSON result. Find 2 images here. The first one is the reference image. The second image is the test image. Compare the second image to see if the second image is similar to the first in terms of the text present in the image.  Respond ONLY in JSON Format with 3 attributes namely SIMILARITY which is a \"YES\" or \"NO\", SIMILARITY_SCORE which is a percentage and DIFFERENCE_COMMENT which is a string.' ) as IMAGE_VALIDATION_RESULT
from `gemini_bq_fn.image_validation`
where uri like '%TEST1%';  

מנסים את השאילתה שלמעלה עם קובצי האובייקטים TEST1 ו-TEST2. תוצג תוצאה שדומה לזו:

צילום מסך של תוצאת הפונקציה המרוחקת של BigQuery

הנה התמונות, לעיונך:

תמונת בסיס

תמונת עזר של בסיס להשוואה עבור מקרה הבדיקה

תמונת בדיקה

תמונה 1 של מקרה הבדיקה

שימו לב ששתי התמונות דומות בכך שהן כוללות את תצוגת מסוף Duet AI בענן, אבל הטקסט בשתיהן שונה ממה שמופיע במודל בפורמט JSON.

עכשיו, בדקתם את ההטמעה של הפונקציה מרחוק.

7. יתרונות ותרחישים לדוגמה

בואו נבחן כמה מהיתרונות של השילוב בין BigQuery ל-Gemini לניתוח נתונים מובְנים ולא מובנים.

  • מביאים את GenAI לנתונים: כבר לא צריך להעביר נתונים, לא ליצור כפילויות או להוסיף מורכבות. אפשר לנתח נתונים ולהפיק תובנות באותה סביבת BigQuery.
  • ניתוח נתונים משופר: ההסברים בשפה הטבעית של Gemini מוסיפים לנתונים שלכם שכבה חדשה של הבנה, ואפשר לעשות זאת באמצעות שאילתות SQL.
  • מדרגיות: פתרון זה מטפל במערכי נתונים גדולים ובניתוחים מורכבים בקלות ובמאמץ מינימלי.

יש לכך יישומים רבים. מומלץ להביא בחשבון תרחישים פיננסיים (ניתוח מגמות בשוק), קמעונאות (סנטימנט של לקוחות), שירותי בריאות (סיכומי דוחות רפואיים) וכו' שבהם הצוותים העסקיים והניתוחים יכולים ליישם את הנתונים האלה ללא מאמץ יחסית, משאבים וכלים מוכרים וכלים מוכרים לבחירה.

8. הסרת המשאבים

כדי לא לצבור חיובים לחשבון Google Cloud עבור המשאבים שבהם השתמשתם בפוסט הזה:

  1. במסוף Google Cloud, נכנסים לדף Manage resources:
  2. ברשימת הפרויקטים, בוחרים את הפרויקט שרוצים למחוק ולוחצים על Delete.
  3. כדי למחוק את הפרויקט, כותבים את מזהה הפרויקט בתיבת הדו-שיח ולוחצים על Shut down.
  4. אם רוצים לשמור את הפרויקט, מדלגים אל Cloud Functions ומוחקים את הפונקציה של Cloud Functions. ברשימת הפונקציות, מסמנים את הפונקציה שרוצים למחוק ולוחצים על Delete.

9. מזל טוב

מעולה. כשהמודלים של Gemini משולבים ב-BigQuery, אתם כבר לא צריכים לנתח את הנתונים – אתם יכולים להיות מספרים לסיפורים אישיים. אפשר ליצור את הנרטיבים המוסתרים במערכי הנתונים ולשנות את הדרך שבה מבינים את התובנות. אפשר להתחיל להתנסות! תוכלו להחיל את השיטה הזו על מערכי נתונים משלכם ולגלות את הסיפורים שבנתונים שלכם. אחרי ש-BigQuery תומך בנתונים לא מובנים בטבלאות של אובייקטים ( טבלאות חיצוניות), אפשר לנסות להשתמש ב-Gemini Pro Vision כדי ליצור תובנות גנרטיביות על נתוני תמונות. להנחיה מפורטת יותר, אפשר לעיין במסמכי התיעוד של Vertex AI, ב-BigQuery Remote Functions וב-Cloud Functions. זהו המאגר github של הפרויקט הזה. ספרו לנו מה פיתוחכם על הלמידה הזו.