תובנות לגבי מודלים גדולים של שפה (LLM) במקום: BigQuery & Gemini לניתוח נתונים מובנה & לא מובנה

1. מבוא

מערכי נתונים גדולים מכילים תובנות חשובות, אבל יכול להיות קשה להפיק מהם תובנות משמעותיות. לעתים קרובות, כלים מסורתיים לניתוח נתונים לא מספקים הסברים מפורטים ודומים לאלה של בני אדם, שיעזרו לנו להבין באמת את הסיפור שמאחורי הנתונים. מחסני נתונים מכילים יותר ויותר נתונים לא מובְנים, אבל לא תמיד יש גישה לנתונים האלה כדי להפיק מהם תובנות. טקסט לא מובנה, תמונות וסרטונים מכילים מידע חשוב שיכול לעזור לכם לפתח את העסק. מודלים גדולים של שפה (LLM) מציעים דרך חדשה ומתקדמת להבין את הנתונים שלכם, ומספקים הסברים, ניתוח סנטימנט, זיהוי אובייקטים ועוד. עם הופעתם של מודלים מרובי-מוֹדָלִים (והיכולת לאחסן נתוני אובייקטים כמו תמונות וסרטונים ב-BigQuery באמצעות טבלאות אובייקטים), שילוב של מודלים חזקים של LLM כמו Gemini 1.0 Pro (לניתוח מבוסס-טקסט) ו-Gemini 1.0 Pro Vision (לניתוח של טקסט ותמונות או סרטונים) עם BigQuery יכול לשנות את הדרך שבה אתם מנתחים נתונים.

ב-codelab הזה נבחן שתי שיטות להפקת תובנות מ-LLM מנתונים ארגוניים, ולהרחבת התובנות האלה לאלפי שורות ב-BigQuery:

שיטה 1: הפעלת מודל מרחוק

  • אפשר להפעיל את Gemini 1.0 Pro מתוך BigQuery באמצעות ML.GENERATE_TEXT בשאילתת SELECT.
  • משתמשים בגישה הזו כשהמודל כבר זמין כמודל מרוחק ב-BigQuery ורוצים להשתמש בו כמו שהוא. בודקים את הסטטוס של המודל שרוצים להשתמש בו במסמכי התיעוד של BigQuery.

שיטה 2: הטמעה של פונקציה מרחוק

מה תפַתחו

  • בשיטה Remote Model Invocation (הפעלת מודל מרחוק), תבנו כלי לסיכום מיקומים עבור מערך הנתונים של ספרים בארכיון האינטרנט (שזמין לציבור ב-BigQuery) על ידי הפעלת המודל מרחוק עבור Gemini 1.0 Pro במבנה ML.GENERATE_TEXT ב-BigQuery.

דיאגרמת זרימה להפעלת מודל מרחוק

  • בשיטה Remote Function Implementation (הטמעה של פונקציה מרחוק), תיצרו כלי תיקוף תמונות כדי לאמת תמונות של בדיקות בהשוואה לתמונת בסיס. לשם כך, יוצרים מערך נתונים שמכיל צילומי מסך של תמונות בדיקה בטבלה חיצונית ומבקשים מ-Gemini 1.0 Pro Vision לאמת אותו מול תמונת הבסיס. לאחר מכן, תיצרו פונקציה של Cloud Functions ב-Java שתטמיע קריאה ל-Gemini Pro Vision ותפעילו אותה כפונקציה מרוחקת ב-BigQuery.

דיאגרמת זרימה להטמעה של פונקציה מרחוק

הערה:

יכול להיות שיש עוד מודלים של Vertex AI Generative AI שזמינים כמודלים מרוחקים ב-BigQuery. המשמעות היא שאפשר לגשת למודלים האלה באמצעות מבנה ML.GENERATE_TEXT מ-BigQuery ללא צורך בהגדרה. עם זאת, גם אם המודל המרוחק זמין, תמיד יש לכם אפשרות ליצור התאמות אישיות מתקדמות לתרחיש השימוש שלכם באמצעות Cloud Functions, ואז לגשת למודלים האלה כפונקציות מרוחקות מ-BigQuery.

למה כדאי להשתמש ב-BigQuery?

BigQuery הוא מחסן נתונים בענן (data warehouse) ללא שרת, שפועל בכמה עננים ויכול להתרחב מבתים ועד פטה-בייט עם תקורה תפעולית מינימלית. לכן הוא בחירה מצוינת לאחסון נתונים לאימון מודלים של למידת מכונה. באמצעות יכולות למידת המכונה (BQML) והניתוח המובנות של BigQuery, אתם יכולים ליצור תחזיות ללא קוד באמצעות שאילתות SQL בלבד. בנוסף, אפשר לגשת לנתונים ממקורות חיצוניים באמצעות שאילתות מאוחדות, כך שאין צורך בצינורות ETL מורכבים.

‫BigQuery הוא מחסן נתונים בענן מנוהל במלואו, שמאפשר למשתמשים לנתח נתונים מובנים, חצי מובנים ולא מובנים.

2. דרישות

  • דפדפן, כמו Chrome או Firefox
  • פרויקט ב-Google Cloud שהחיוב בו מופעל.

3. לפני שמתחילים

  1. ב-מסוף Google Cloud, בדף לבחירת הפרויקט, בוחרים או יוצרים פרויקט ב-Google Cloud.
  2. הקפידו לוודא שהחיוב מופעל בפרויקט שלכם ב-Cloud. כך בודקים אם החיוב מופעל בפרויקט
  3. תשתמשו ב-Cloud Shell, סביבת שורת פקודה שפועלת ב-Google Cloud ומגיעה עם bq שנטען מראש. לוחצים על 'הפעלת Cloud Shell' בחלק העליון של מסוף Google Cloud.

תמונה של לחצן ההפעלה של Cloud Shell

  1. אחרי שמתחברים ל-Cloud Shell, אפשר לבדוק שכבר בוצע אימות ושהפרויקט מוגדר למזהה הפרויקט שלכם באמצעות הפקודה הבאה:
gcloud auth list
  1. מריצים את הפקודה הבאה ב-Cloud Shell כדי לוודא שפקודת gcloud מכירה את הפרויקט.
gcloud config list project
  1. אם הפרויקט לא מוגדר, משתמשים בפקודה הבאה כדי להגדיר אותו:
gcloud config set project <YOUR_PROJECT_ID>
  1. כדי להפעיל את ה-API, עוברים אל Gemini for Google Cloud Marketplace. אפשר גם להשתמש בפקודה הבאה במסוף של Cloud Shell:
gcloud services enable cloudaicompanion.googleapis.com --project PROJECT_ID
  1. מוודאים שממשקי ה-API הבאים מופעלים:
  • BigQuery
  • BigQuery Connection
  • Cloud Function
  • Cloud Run
  • Vertex AI
  • Cloud Build
  • Cloud Storage APIs

אפשרות נוספת היא להשתמש במסוף דרך הקישור הזה במקום להשתמש בפקודת gcloud.

אפשר לעיין במאמרי העזרה בנושא פקודות gcloud ושימוש בהן.

4. יצירת מערך נתונים ב-BigQuery וחיבור חיצוני

נתחיל ביצירת מערך נתונים וקישור למשאב ב-Cloud.

מערך נתונים ב-BigQuery הוא מאגר של כל הטבלאות והאובייקטים של האפליקציה.

כדי ליצור מערך נתונים:

  1. נכנסים לדף BigQuery במסוף Google Cloud.
  2. בחלונית Explorer, בוחרים את הפרויקט שבו רוצים ליצור את מערך הנתונים.
  3. מרחיבים את האפשרות פעולות (סמל האליפסה האנכית) ולוחצים על יצירת מערך נתונים.

תמונה של תפריט הפעולות והאפשרות &#39;יצירת מערך נתונים&#39;

  1. לוחצים על יצירת מערך נתונים.
  2. מזינים gemini_bq_fn בשדה Dataset ID (מזהה מערך הנתונים).
  3. מגדירים את סוג המיקום כ-Multi-region ומאשרים את ערך ברירת המחדל, שהוא US(multiple regions in United States.
  4. לוחצים על יצירת מערך נתונים.
  5. בודקים שמערך הנתונים נוצר ומופיע מתחת למזהה הפרויקט בחלונית Explorer.

כדי ליצור אינטראקציה עם Cloud Function, צריך חיבור ל-BigQuery. כדי ליצור פונקציה מרוחקת, צריך ליצור חיבור ל-BigQuery. ב-codelab הזה נשתמש בחיבור BigLake כדי לגשת למודל מ-BigQuery דרך Cloud Function. חיבורי BigLake עוזרים לחבר את מקור הנתונים החיצוני תוך שמירה על בקרת גישה ואבטחה מדויקות ב-BigQuery, שבמקרה שלנו הוא Vertex AI Gemini Pro API.

כדי ליצור את החיבור ל-BigLake:

  1. לוחצים על Add (הוספה) בחלונית Explorer (סייר) בדף BigQuery.

מסוף BigQuery עם לחצן ADD (הוספה) מודגש להוספת חיבור חיצוני

  1. לוחצים על חיבורים למקורות נתונים חיצוניים.
  2. בתפריט Connection type (סוג החיבור), בוחרים באפשרות Vertex AI remote models, remote functions and BigLake (Cloud Resource) (מודלים מרוחקים, פונקציות מרוחקות ו-BigLake של Vertex AI (משאב בענן)).
  3. בשדה מזהה החיבור, מזינים את שם החיבור בתור gemini-bq-conn.
  4. מגדירים את סוג המיקום כ-Multi-region ומאשרים את ערך ברירת המחדל, שהוא US(multiple regions in United States.
  5. לוחצים על יצירת קישור.
  6. לוחצים על Go to connection (מעבר לקישור) ומעתיקים את מזהה חשבון השירות בחלונית Connection info (פרטי הקישור).

צילום מסך של פרטי החיבור

  1. עוברים לדף IAM ואדמין ולוחצים על Grant access (מתן גישה).
  2. מדביקים את מזהה חשבון השירות בשדה New principles.
  3. בוחרים את התפקיד Vertex AI user מרשימת התפקידים ולוחצים על שמירה.

הענקת גישה לצילום מסך של חשבון שירות

יצרתם בהצלחה את מערך הנתונים ואת החיבור ל-BigQuery. לאחר מכן, תצטרכו להשלים את השלבים שנדרשים להפעלת מודל מרחוק.

5. תרחיש שימוש מספר 1: הפעלת מודל מרחוק: הגדרת הפעלת מודל מרחוק

אחרי שיצרתם את מערך הנתונים והחיבור, אפשר ליצור מודל ב-BigQuery על סמך מודל בסיסי של Vertex AI Gemini Pro. בסוף התרגיל הזה, אפליקציית ה-LLM שלכם תפעל באמצעות שאילתות SQL בלבד.

שלב 1: יוצרים טבלה ב-BigQuery שמכילה את נתוני הקלט של המודל המרוחק

יוצרים טבלה בשם books במערך הנתונים, שיכולה להכיל כ-50 רשומות מהטבלה bigquery-public-data.gdelt_internetarchivebooks.1905 במערך הנתונים Internet Archive Books, ש-BigQuery מספק לשימוש ציבורי.

כדי לעשות זאת, מריצים את הצהרת ה-DDL (שפת הגדרת נתונים) הבאה מחלונית עורך ה-SQL ב-BigQuery:

create or replace table gemini_bq_fn.books as (
select *
from
bigquery-public-data.gdelt_internetarchivebooks.1905 limit 50)

שלב 2 : יצירת מודל BigQuery

יוצרים מודל במערך הנתונים. כדי לעשות זאת, מריצים את ה-DDL הבא מחלונית עורך ה-SQL של BigQuery:

CREATE MODEL `gemini_bq_fn.gemini_remote_model`
REMOTE WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(ENDPOINT = 'gemini-pro');

שימו לב שהמודל נוצר עם אפשרות לצפייה בו.

שלב 3 : בדיקת אפליקציית ה-AI הגנרטיבי החדשה

משתמשים בפונקציה ML.GENERATE_TEXT בשאילתת SELECT כדי לשלוח בקשה למודל המרוחק.

SELECT ml_generate_text_llm_result as Gemini_Response, prompt as Prompt
FROM ML.GENERATE_TEXT(MODEL `gemini_bq_fn.gemini_remote_model`,
 (select 'You are a text summarizer and standardizer. From the following text that contains address locations, standardize and print one standardized, consolidated address. You cannot return empty because you know how to pick up sensible data from the text in this field: ' ||
substring(locations, 0, 200) as prompt
from `gemini_bq_fn.books`),
STRUCT(
 TRUE AS flatten_json_output));

אמורה להתקבל התוצאה הבאה:

תוצאת שאילתת ML.GENERATE_TEXT ב-BigQuery

מעולה! הצלחת להדגים איך להשתמש במודל מרוחק (מבוסס על מודל gemini-pro) עם הפונקציה ML.GENERATE_TEXT כדי לנתח נתוני טקסט בטבלה ב-BigQuery.

עכשיו ננסה מודל אחר של Vertex AI באמצעות פונקציות מרוחקות של BigQuery. נניח שאתם רוצים להוסיף עוד אפשרויות להתאמה אישית ולגמישות לשימוש במודל מרחוק ב-BigQuery. רשימת המודלים הנתמכים מופיעה במסמכי התיעוד של BigQuery.

6. תרחיש לדוגמה מספר 2: הטמעה של פונקציה מרחוק: הגדרת הטמעה של פונקציה מרחוק

בתרגיל הזה תיצרו פונקציה ב-BigQuery על סמך פונקציה של Cloud Functions ב-Java שמטמיעה את מודל הבסיס Gemini 1.0 Pro Vision. קודם יוצרים ופורסים את Java Cloud Function כדי להשוות תמונות באמצעות מודל Gemini 1.0 Pro Vision, ואז יוצרים את הפונקציה המרוחקת ב-BigQuery שמפעילה את Cloud Function שנפרסה. חשוב לזכור שאפשר לבצע את אותו התהליך לכל הרצה של פונקציה מרוחקת ב-BigQuery.

אז בואו נתחיל!

שלב 1: יצירת פונקציה של Cloud Functions ב-Java

תבנו פונקציה של Cloud Functions מדור שני ב-Java כדי לאמת תמונות בדיקה מול תמונת בסיס. תמונת הבסיס מאוחסנת במערך נתונים שמכיל צילומי מסך של תמונות הבדיקה בטבלה חיצונית ב-BigQuery. תאמתו את התמונות באמצעות מודל Gemini Pro Vision ‏ (Java SDK). לאחר מכן תפרסו את הפונקציה של Cloud Functions ב-Java בנקודת קצה של REST.

כך עושים את זה:

  1. מפעילים את Cloud Shell Editor.
  2. אם אתם משתמשים בכלי לעריכה מדור קודם, לוחצים על Try the new Editor (ניסיון השימוש בכלי העריכה החדש).
  3. בסרגל הסטטוס, לוחצים על Cloud Code - Sign In (קוד Cloud – כניסה).
  4. אם מתבקשים לאשר ל-Cloud Shell Editor לבצע קריאות ל-Google Cloud API, לוחצים על Authorize (אישור). פועלים לפי ההנחיות כדי להיכנס לחשבון Google. התחברתם עכשיו ל-Google Cloud.
  5. אם הפרויקט לא מופיע בסרגל הסטטוס של Cloud Code, לוחצים על Cloud Code - Sign In > Select a Google Cloud project (Cloud Code – כניסה > בחירת פרויקט ב-Google Cloud). בוחרים את הפרויקט בענן של Google שבו רוצים ליצור את Cloud Functions. הפרויקט נטען והופך לפרויקט הפעיל בכלי Cloud Shell Editor.
  6. בסרגל הסטטוס של Cloud Code, לוחצים על שם הפרויקט הפעיל. בתפריט 'בחירה מהירה' שמופיע, בוחרים באפשרות בקשה חדשה.
  7. בתיבת הדו-שיח Create New Application (יצירת אפליקציה חדשה), בוחרים באפשרות Cloud Functions application (אפליקציית Cloud Functions).

חלון קופץ של יצירת אפליקציה חדשה, שלב 1

  1. כשמוצגת בקשה לבחירת תבנית, בוחרים באפשרות Java: Hello World.

חלון קופץ של יצירת אפליקציה חדשה, עמוד 2

  1. מזינים את Gemini-BQ-Function כשם הפרויקט בנתיב הפרויקט. מבנה הפרויקט מופיע בתצוגה חדשה של Cloud Shell Editor.

מבנה חדש של פרויקט אפליקציה של פונקציה של Cloud Functions

  1. מוסיפים את יחסי התלות הנדרשים בתג <dependencies>... </dependencies> או מעתיקים את יחסי התלות מקובץ הדוגמה pom.xml.
  2. משנים את שם הכיתה מ-HelloWorld.java לשם בעל משמעות. נניח שGeminiBigQueryFunction.java. משנים את שם החבילה בהתאם.
  3. מחליפים את קוד ה-placeholder בקובץ GeminiBigQueryFunction.Java בקוד לדוגמה שמופיע במאגר GitHub. חשוב להחליף את המשתנה <YOUR_PROJECT_ID> במזהה הפרויקט שלכם בקוד לדוגמה.
  4. עוברים לטרמינל Cloud Shell. מוודאים שאתם נמצאים בספריית הפרויקט. אם לא, עוברים לספריית הפרויקט על ידי הפעלת הפקודה הבאה:
cd Gemini-BQ-Function
  1. מריצים את ההצהרה הבאה כדי לבנות ולפרוס את הפונקציה של Cloud Functions:
gcloud functions deploy gemini-bq-fn --gen2 --runtime java17 --trigger-http --entry-point cloudcode.helloworld.GeminiBigQueryFunction --allow-unauthenticated --source .

מחליפים את נקודת הכניסה בפקודה בנקודת הכניסה של הפונקציה. הפלט הוא כתובת URL של REST בפורמט הבא:

https://us-central1-YOUR_PROJECT_ID.cloudfunctions.net/gemini-bq-fn
  1. מריצים את הפקודה הבאה במסוף כדי לבדוק את הפונקציה של Cloud Functions:
gcloud functions call gemini-bq-fn --region=us-central1 --gen2 --data '{"calls":[["https://storage.googleapis.com/img_public_test/image_validator/baseline/1.JPG", "https://storage.googleapis.com/img_public_test/image_validator/test/2.JPG", "PROMPT_ABOUT_THE_IMAGES_TO_GEMINI"]]}'

תשובה להנחיה של מדגם אקראי:

מחרוזת תגובת JSON מפונקציה של Cloud Functions

מדהים! הפונקציה הגנרית של Cloud Functions למימוש מודל Gemini Pro Vision מוכנה. נשתמש בנקודת הקצה הזו ישירות בנתוני BigQuery מתוך פונקציה מרוחקת של BigQuery.

שלב 2: יוצרים טבלת אובייקטים ופונקציה מרוחקת ב-BigQuery

דרישות מוקדמות

תצטרכו קטגוריה של Cloud Storage בשביל החלק הזה של התרגיל. כדי ליצור קטגוריה של Cloud Storage:

  1. כדי ליצור קטגוריה, נכנסים למסוף Cloud Storage ולוחצים על יצירה.
  2. מזינים את demo-bq-gemini-public-image בתור שם הקטגוריה ולוחצים על יצירה.
  3. מבטלים את הסימון של האפשרות Enforce public access prevention on this bucket. במסגרת התרגיל הזה אתם יוצרים את הקטגוריה הזו לגישה ציבורית, אבל אנחנו ממליצים למנוע גישה ציבורית ולספק הרשאות לחשבונות שירות ספציפיים לפי הצורך בתרחישי השימוש שלכם בארגון.
  4. אחרי שיוצרים את ה-bucket, עוברים לכרטיסייה Permissions כדי לראות את ההרשאות ולשנות אותן.
  5. כדי להוסיף חשבונות משתמש, לוחצים על Grant access. מציינים מזהה של חשבון שירות כדי לתת הרשאות לחשבון ספציפי, או מציינים allUsers כדי לתת גישה ציבורית לקטגוריה.
  6. בוחרים את התפקיד Storage Object Viewer ולוחצים על שמירה. אם מוצגת בקשה, מאשרים גישה לכולם.
  7. עוברים לכרטיסייה אובייקטים ומעלים תמונות בסיס ותמונות לבדיקה כדי להשוות ביניהן. ב-Codelab הזה, אפשר להעלות את האובייקטים הבאים שזמינים לציבור: baseline.JPG,‏ TEST1.JPG ו-TEST2.JPG.

יצירת טבלת אובייקטים ב-BigQuery

יוצרים טבלת אובייקטים חיצונית מ-BigQuery כדי לגשת לנתונים הלא מובנים בדלי באמצעות החיבור ומערך הנתונים שיצרתם קודם. כדי לעשות זאת, מריצים את הצהרת ה-DDL (שפת הגדרת נתונים) הבאה מחלונית עורך השאילתות של BigQuery:

CREATE OR REPLACE EXTERNAL TABLE `gemini_bq_fn.image_validation`
WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(object_metadata="SIMPLE", uris=["gs://demo-bq-gemini-public-image/*.JPG"]);

בודקים אם נוצרה בערכת הנתונים טבלת אובייקטים חדשה בשם image_validation.

יצירת פונקציה מרוחקת ב-BigQuery

יוצרים פונקציה מרוחקת ב-BigQuery כדי להפעיל את פונקציית Java של Cloud Functions שמטמיעה את מודל Gemini Pro Vision. יוצרים את הטבלה הזו באותו מערך נתונים. כדי לעשות את זה, מריצים את ה-DDL הבא מחלונית עורך ה-SQL במסוף BigQuery:

CREATE OR REPLACE FUNCTION `gemini_bq_fn.FN_IMAGE_VALIDATE` (baseline STRING, test STRING, prompt STRING) RETURNS STRING
 REMOTE WITH CONNECTION `us.gemini-bq-conn`
 OPTIONS (
   endpoint = 'https://us-central1-<your project id>.cloudfunctions.net/gemini-bq-fn',
   max_batching_rows = 1
 );

כתובת ה-URL של נקודת הקצה היא כתובת ה-URL של REST שהוחזרה קודם בתרגיל הזה. הפעולה הזו יוצרת את הפונקציה המרוחקת ב-BigQuery. יש שלושה פרמטרים ב-DDL שלמעלה. שני הפרמטרים הראשונים הם כתובות URL של התמונות שמאוחסנות בטבלת האובייקטים שנוצרה בשלב הקודם. הפרמטר האחרון הוא ההנחיה למודל (Gemini Pro Vision). אפשר לעיין בקוד Java Cloud Functions שמשמש לניתוח החתימה הזו:

Gson().fromJson(request.getReader(), JsonObject.class);
JsonArray calls_array = requestJson.getAsJsonArray("calls");
JsonArray calls = (JsonArray) calls_array.get(0);
String baseline_url = calls.get(0).toString().replace("\"", "");
String test_url = calls.get(1).toString().replace("\"", "");
String prompt_string = calls.get(2).toString();

הפעלת Gemini מ-BigQuery

משתמשים בפונקציה המרוחקת בשאילתת SELECT כדי לבדוק את הפונקציה לאימות התמונות בהתאם להנחיה.

select gemini_bq_fn.FN_IMAGE_VALIDATE(
'https://storage.googleapis.com/demo-bq-gemini-public-image/Baseline.JPG',
REPLACE(uri, 'gs://', 'https://storage.googleapis.com/') ,
'You are an expert image validator who can respond with JSON result. Find 2 images here. The first one is the reference image. The second image is the test image. Compare the second image to see if the second image is similar to the first in terms of the text present in the image.  Respond ONLY in JSON Format with 3 attributes namely SIMILARITY which is a \"YES\" or \"NO\", SIMILARITY_SCORE which is a percentage and DIFFERENCE_COMMENT which is a string.' ) as IMAGE_VALIDATION_RESULT
from `gemini_bq_fn.image_validation`
where uri like '%TEST1%';  

מנסים את השאילתה שלמעלה עם קובצי האובייקט TEST1 ו-TEST2. תוצג תוצאה דומה לזו:

צילום מסך של תוצאה של פונקציה מרוחקת ב-BigQuery

אלה התמונות לעיונך:

תמונת בסיס

תמונה לדוגמה של Baseline לתרחיש הבדיקה

תמונה לבדיקה

תמונה לבדיקה 1 למקרה הבדיקה

שימו לב ששתי התמונות דומות, כי בשתיהן מוצג מסוף Google Cloud עם Duet AI, אבל הטקסט בשתיהן שונה כי הוא נוצר על ידי המודל בפורמט JSON.

כך בדקתם בהצלחה את ההטמעה של הפונקציה המרוחקת.

7. היתרונות ותרחישי השימוש

בואו נבחן כמה מהיתרונות של שילוב בין BigQuery ו-Gemini לניתוח נתונים מובנים ולא מובנים.

  • הוספת AI גנרטיבי לנתונים: לא צריך יותר להעביר נתונים, לשכפל אותם ולהוסיף מורכבות. אתם יכולים לנתח נתונים ולהפיק תובנות באותו סביבת BigQuery.
  • ניתוח משופר: ההסברים בשפה טבעית של Gemini מוסיפים שכבת הבנה חדשה לנתונים שלכם, ואפשר להשיג את זה באמצעות שאילתות SQL.
  • מדרגיות: הפתרון הזה מאפשר לטפל בקלות במערכי נתונים גדולים ובניתוחים מורכבים, ודורש עם תכנות מינימלי.

יש לזה הרבה שימושים. כדאי לחשוב על תרחישים בתחום הפיננסים (ניתוח מגמות בשוק), הקמעונאות (סנטימנט לקוחות), הבריאות (סיכומי דוחות רפואיים) וכו', שבהם צוותי הניתוח והצוותים העסקיים יכולים ליישם את הפתרונות האלה במאמץ נמוך יחסית, עם משאבים מוגבלים ובשפה ובכלי מוכרים לפי בחירתם.

8. הסרת המשאבים

כדי לא לצבור חיובים לחשבון Google Cloud על המשאבים שבהם השתמשתם במאמר הזה:

  1. במסוף Google Cloud, עוברים לדף Manage resources.
  2. ברשימת הפרויקטים, בוחרים את הפרויקט שרוצים למחוק ולוחצים על Delete.
  3. כדי למחוק את הפרויקט, כותבים את מזהה הפרויקט בתיבת הדו-שיח ולוחצים על Shut down.
  4. אם רוצים לשמור את הפרויקט, מדלגים על השלבים שלמעלה ומוחקים את Cloud Function. כדי לעשות את זה, עוברים אל Cloud Functions, מסמנים את הפונקציה שרוצים למחוק מתוך רשימת הפונקציות ולוחצים על מחיקה.

9. מזל טוב

מעולה. השילוב של מודלים של Gemini ב-BigQuery מאפשר לכם לא רק לנתח את הנתונים, אלא גם לספר סיפורים על סמך הנתונים. אתם יכולים ליצור את הנרטיבים הנסתרים במערכי הנתונים שלכם ולשנות את האופן שבו אתם מבינים את התובנות. התחילו להתנסות! אתם יכולים להשתמש בטכניקה הזו במערכי הנתונים שלכם כדי לגלות את הסיפורים שמתחבאים בנתונים. ‫BigQuery תומך בנתונים לא מובנים בטבלאות אובייקטים ( טבלאות חיצוניות), ולכן אפשר להשתמש ב-Gemini Pro Vision כדי ליצור תובנות גנרטיביות על נתוני תמונות. הנחיות מפורטות יותר זמינות במאמרי העזרה בנושא Vertex AI,‏ BigQuery Remote Functions ו-Cloud Functions. מאגר GitHub של הפרויקט הזה נשמח לשמוע מה יצרתם בעזרת התוכן הזה.