الإحصاءات المقدَّمة من النماذج اللغوية الكبيرة: BigQuery وGemini لتحليل البيانات المنظَّمة وغير المنظَّمة

1- مقدمة

تحتوي مجموعات البيانات الضخمة على رؤى قيمة، ولكن استخراج الفهم الهادف قد يكون مهمة شاقة. غالبًا ما تقصّر أدوات التحليل التقليدية في تقديم تفسيرات دقيقة تشبه الإنسان تساعدنا على استيعاب القصة حقًا ضمن بياناتنا. تحتوي مستودعات البيانات على المزيد والمزيد من البيانات غير المنظَّمة، ولكن لم يكن من الممكن الوصول إلى هذه البيانات دائمًا للحصول على إحصاءات. تحتوي النصوص والصور والفيديوهات غير المنظَّمة على معلومات قيّمة لتطوير نشاطك التجاري. تقدّم النماذج اللغوية الكبيرة طريقة جديدة وفعّالة لفهم بياناتك من خلال تقديم تفسيرات وتحليل الآراء ورصد العناصر وغير ذلك. مع ظهور نماذج متعدّدة الوسائط (وقدرة على تخزين بيانات العناصر، مثل الصور والفيديوهات في BigQuery من خلال جداول العناصر)، يمكن أن يؤدي دمج النماذج اللغوية الكبيرة، مثل Gemini 1.0 Pro (للتحليل المستند إلى النص) وGemini 1.0 Pro Vision (لتحليل النصوص والصور والفيديوهات) مع BigQuery، إلى تغيير طريقة تحليل البيانات.

في هذا الدرس التطبيقي حول الترميز، سنلقي نظرة على الطريقتَين التاليتَين لاستخلاص إحصاءات النماذج اللغوية الكبيرة من بيانات مؤسستك، وتوسيع نطاق هذه الإحصاءات لتشمل آلاف الصفوف في BigQuery:

الطريقة 1: استدعاء النموذج عن بُعد

  • يمكنك الاتصال بـ Gemini 1.0 Pro من داخل BigQuery باستخدام ML.GENERATE_TEXT في طلب البحث SELECT.
  • يمكنك استخدام هذه الطريقة عندما يكون النموذج متاحًا كنموذج عن بُعد في BigQuery وتريد استخدامه بطريقة غير تقليدية. تحقَّق من حالة النموذج الذي تريد استخدامه في مستندات BigQuery.

الطريقة 2: تنفيذ الدوال عن بُعد

  • يمكنك استدعاء إحدى وظائف السحابة الإلكترونية التي تُجري مكالمة Gemini 1.0 Pro Vision ظاهرةً على أنّها وظيفة عن بُعد في BigQuery.
  • يمكنك اتّباع هذا الأسلوب عندما لا يكون النموذج الذي تريد استخدامه متاحًا كنموذج عن بُعد أو عندما تريد الحصول على مزيد من المرونة والتخصيص في حالة الاستخدام.

ما الذي ستقوم ببنائه

  • بالنسبة إلى طريقة استدعاء النموذج عن بُعد، ستنشئ أداة تلخيص المواقع الجغرافية لمجموعة بيانات كتب أرشيف الإنترنت (متاحة للجميع في BigQuery) من خلال استدعاء النموذج البعيد في Gemini 1.0 Pro في بنية ML.GENERATE_TEXT في BigQuery.

الرسم البياني لتدفق النموذج عن بُعد

  • بالنسبة إلى طريقة تنفيذ الوظائف عن بُعد، عليك إنشاء أداة التحقّق من الصور للتحقّق من صحة صور الاختبار مقابل صورة أساسية. لإجراء ذلك، عليك إنشاء مجموعة بيانات تحتوي على لقطات شاشة تجريبية في جدول خارجي، وطلب من Gemini 1.0 Pro Vision التحقّق من صحتها مقارنةً بالصورة الأساسية. بعد ذلك، ستنشئ دالة Java Cloud لتنفيذ استدعاء Gemini Pro Vision وتستدعيه كوظيفة عن بُعد في BigQuery.

مخطط انسيابي لتنفيذ الدوال عن بُعد

ملاحظة:

قد يتوفّر المزيد من نماذج Vertex للذكاء الاصطناعي التوليدي كنماذج عن بُعد في BigQuery. وهذا يعني أنّه بإمكانك الوصول إلى هذه النماذج باستخدام بنية ML.GENERATE_TEXT المتاحة من BigQuery، وذلك بطريقة غير تقليدية. مع ذلك، حتى في حال توفُّر النموذج عن بُعد، يمكنك دائمًا إنشاء عمليات تخصيص متقدّمة لحالة الاستخدام باستخدام دوال السحابة، ثم الوصول إلى هذه النماذج كدوال عن بُعد من BigQuery.

ما هي أهمية BigQuery؟

BigQuery هو مستودع بيانات مستنِد إلى سُحب إلكترونية متعدّدة بدون خادم ويمكن توسيعه من البايت إلى البيتابايت مع أقل قدر من النفقات التشغيلية، وبالتالي يُعدّ خيارًا رائعًا لتخزين بيانات تدريب تعلُّم الآلة. باستخدام إمكانيات تعلُّم الآلة في BigQuery (BQML) المُدمَجة وإمكانات الإحصاءات، يمكنك إنشاء توقّعات بدون رموز باستخدام استعلامات SQL (لغة الاستعلام البنيوية) فقط. بالإضافة إلى ذلك، يمكنك الوصول إلى البيانات من مصادر خارجية باستخدام استعلامات موحدة، مما يغنيك عن الحاجة إلى خطوط ETL معقدة.

BigQuery هو مستودع بيانات سحابية مُدار بالكامل يساعد المستخدمين في تحليل البيانات المنظَّمة وشبه المنظَّمة وغير المنظَّمة.

‫2. الشروط

  • متصفح، مثل Chrome أو Firefox
  • مشروع على Google Cloud مع تفعيل الفوترة فيه

3- قبل البدء

  1. في Google Cloud Console، ضمن صفحة أداة اختيار المشاريع، اختَر مشروعًا على Google Cloud أو أنشئه.
  2. تأكَّد من تفعيل الفوترة لمشروعك على السحابة الإلكترونية. تعرَّف على كيفية التحقّق مما إذا كانت الفوترة مفعَّلة في مشروع .
  3. ستستخدم Cloud Shell، وهي بيئة سطر أوامر تعمل في Google Cloud ويتم تحميلها مسبقًا مع bq. انقر على "تفعيل Cloud Shell" في أعلى وحدة التحكّم في Google Cloud.

تفعيل صورة زر Cloud Shell

  1. بعد الربط بخدمة Cloud Shell، يمكنك التحقّق من أنّه تمت مصادقتك من قبل وأنّ المشروع مضبوط على رقم تعريف المشروع باستخدام الأمر التالي:
gcloud auth list
  1. شغّل الأمر التالي في Cloud Shell للتأكد من معرفة الأمر gcloud بمشروعك.
gcloud config list project
  1. إذا لم يتم ضبط مشروعك، استخدِم الأمر التالي لضبطه:
gcloud config set project <YOUR_PROJECT_ID>
  1. انتقِل إلى Gemini في Google Cloud Marketplace لتفعيل واجهة برمجة التطبيقات. يمكنك أيضًا استخدام الأمر التالي في الوحدة الطرفية في Cloud Shell:
gcloud services enable cloudaicompanion.googleapis.com --project PROJECT_ID
  1. تأكَّد من تفعيل واجهات برمجة التطبيقات التالية:
  • BigQuery
  • ربط BigQuery
  • وظيفة السحابة الإلكترونية
  • Cloud Run
  • Vertex AI
  • Cloud Build
  • واجهات برمجة التطبيقات في Cloud Storage

البديل لاستخدام الأمر gcloud هو الانتقال من خلال وحدة التحكّم باستخدام هذا الرابط.

يمكنك الرجوع إلى المستندات حول أوامر gcloud واستخدامها.

‫4. إنشاء مجموعة بيانات BigQuery واتصال خارجي

لنبدأ بإنشاء مجموعة بيانات واتصال موارد في السحابة الإلكترونية.

مجموعة البيانات في BigQuery هي حاوية لجميع الجداول والعناصر الخاصة بتطبيقك.

لإنشاء مجموعة بيانات، اتّبِع الخطوات التالية:

  1. انتقِل إلى صفحة BigQuery في وحدة التحكّم في Google Cloud.
  2. في لوحة المستكشف، اختَر المشروع الذي تريد إنشاء مجموعة البيانات فيه.
  3. وسِّع الخيار الإجراءات (رمز علامة الحذف الرأسي)، وانقر على إنشاء مجموعة بيانات.

صورة لقائمة &quot;الإجراءات&quot; والخيار &quot;إنشاء مجموعة بيانات&quot;

  1. انقر على إنشاء مجموعة بيانات.
  2. أدخِل gemini_bq_fn في حقل رقم تعريف مجموعة البيانات.
  3. اضبط نوع الموقع الجغرافي على Multi-region واقبل القيمة التلقائية، وهي US(multiple regions in United States..
  4. انقر على إنشاء مجموعة بيانات.
  5. تأكَّد من إنشاء مجموعة البيانات وإدراجها ضمن رقم تعريف المشروع في جزء المستكشف.

يجب توفُّر اتصال BigQuery للتفاعل مع دالة السحابة الإلكترونية. لإنشاء دالة عن بُعد، عليك إنشاء اتصال BigQuery. في هذا الدرس التطبيقي حول الترميز، سنستخدم اتصال BigLake للوصول إلى النموذج من BigQuery عبر دالة Cloud. تساعد عمليات الربط في BigLake على ربط مصدر البيانات الخارجي مع الاحتفاظ في الوقت نفسه بالتحكّم الدقيق في الوصول إلى BigQuery والتحكّم فيه، وهي في هذه الحالة واجهة Vertex AI Gemini Pro API.

لإنشاء ربط BigLake، اتّبِع الخطوات التالية:

  1. انقر على إضافة في جزء المستكشف من صفحة BigQuery.

وحدة تحكُّم BigQuery مع تمييز الزر &quot;إضافة&quot; لإضافة اتصال خارجي

  1. انقر على عمليات الربط بمصادر بيانات خارجية.
  2. من قائمة "نوع الاتصال"، اختَر نماذج Vertex AI عن بُعد والوظائف عن بُعد وBigLake (Cloud Resource).
  3. في الحقل معرّف الاتصال، أدخِل اسم عملية الربط على النحو التالي: gemini-bq-conn.
  4. اضبط نوع الموقع الجغرافي على Multi-region واقبل القيمة التلقائية، وهي US(multiple regions in United States..
  5. انقر على إنشاء عملية ربط.
  6. انقر على الانتقال إلى الاتصال، ثم انسخ رقم تعريف حساب الخدمة في لوحة معلومات الاتصال.

لقطة شاشة لمعلومات الاتصال

  1. انتقِل إلى صفحة إدارة الهوية وإمكانية الوصول والمشرف وانقر على منح إذن الوصول.
  2. الصِق رقم تعريف حساب الخدمة في حقل المبادئ الجديدة.
  3. اختَر الدور "Vertex AI user" من قائمة الأدوار، ثم انقر على حفظ.

منح إذن الوصول إلى لقطة شاشة حساب الخدمة

لقد قمت الآن بإنشاء مجموعة البيانات واتصال BigQuery بنجاح. بعد ذلك، ستُكمل الخطوات المطلوبة لاستدعاء النموذج عن بُعد.

5- حالة الاستخدام رقم 1 استدعاء النموذج عن بُعد: إعداد استدعاء النموذج عن بُعد

بعد أن أنشأت مجموعة بياناتك وربطتها، يمكنك إنشاء نموذج في BigQuery استنادًا إلى نموذج الأساس في Vertex AI Gemini Pro. في نهاية هذا التمرين، سيكون بإمكانك تشغيل تطبيق "النموذج اللغوي الكبير" (LLM) باستخدام استعلامات SQL (لغة الاستعلام البنيوية) فقط.

الخطوة 1: إنشاء جدول BigQuery يحتوي على بيانات الإدخال للنموذج البعيد

أنشئ جدولاً باسم books في مجموعة البيانات يمكن أن يحتوي على حوالي 50 سجلاً من الجدول bigquery-public-data.gdelt_internetarchivebooks.1905 في مجموعة بيانات كتب أرشيف الإنترنت التي تم الحصول عليها للاستخدام العام من خلال BigQuery.

للقيام بذلك، قم بتنفيذ عبارة DDL (لغة تعريف البيانات) التالية من جزء محرر BigQuery SQL:

create or replace table gemini_bq_fn.books as (
select *
from
bigquery-public-data.gdelt_internetarchivebooks.1905 limit 50)

الخطوة 2 : إنشاء نموذج BigQuery

أنشئ نموذجًا في مجموعة البيانات. للقيام بذلك، قم بتشغيل DDL التالية من جزء BigQuery SQL Editor:

CREATE MODEL `gemini_bq_fn.gemini_remote_model`
REMOTE WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(ENDPOINT = 'gemini-pro');

لاحظ أن النموذج يتم إنشاؤه مع خيار لعرض النموذج.

الخطوة 3 : اختبار تطبيق الذكاء الاصطناعي التوليدي الجديد

يمكنك استخدام الدالة ML.GENERATE_TEXT في طلب البحث SELECT لإرسال طلب إلى النموذج البعيد.

SELECT ml_generate_text_llm_result as Gemini_Response, prompt as Prompt
FROM ML.GENERATE_TEXT(MODEL `gemini_bq_fn.gemini_remote_model`,
 (select 'You are a text summarizer and standardizer. From the following text that contains address locations, standardize and print one standardized, consolidated address. You cannot return empty because you know how to pick up sensible data from the text in this field: ' ||
substring(locations, 0, 200) as prompt
from `gemini_bq_fn.books`),
STRUCT(
 TRUE AS flatten_json_output));

من المفترض أن تظهر لك النتيجة التالية:

نتيجة طلب البحث ML.GENERATE_TEXT في BigQuery

تهانينا! لقد أوضحت بنجاح كيفية استخدام نموذج عن بُعد (استنادًا إلى نموذج gemini-pro) مع الدالة ML.GENERATE_TEXT لتحليل البيانات النصية في جدول BigQuery.

لنجرب الآن نموذج Vertex AI آخر باستخدام الوظائف عن بُعد في BigQuery. لنفترض أنك تريد إضافة المزيد من التخصيص والمرونة إلى كيفية استخدام النموذج عن بُعد في BigQuery. يتم إدراج النماذج المتوافقة في مستندات BigQuery.

6. حالة الاستخدام رقم 2: تنفيذ الدالة عن بُعد: إعداد تنفيذ الوظيفة عن بُعد

في هذا التمرين، ستُنشئ دالة في BigQuery استنادًا إلى دالة Java Cloud التي تطبّق النموذج الأساسي لـ Gemini 1.0 Pro Vision. أولاً، عليك إنشاء دالة Java Cloud ونشرها لمقارنة الصور باستخدام نموذج Gemini 1.0 Pro Vision، ثمّ إنشاء الوظيفة عن بُعد في BigQuery التي تستدعي وظيفة السحابة الإلكترونية المفعّلة. تذكر أنه يمكن اتباع نفس الإجراء لأي تنفيذ دالة عن بُعد في BigQuery.

إذًا، هيا بنا نبدأ!

الخطوة 1: إنشاء دالة Java Cloud

ستُنشئ دالة السحابة الإلكترونية من الجيل الثاني في Java للتحقّق من صحة الصور الاختبارية مقابل صورة أساسية. يتم تخزين الصورة الأساسية في مجموعة بيانات تحتوي على لقطات شاشة اختبارية في جدول خارجي في BigQuery. يمكنك التحقّق من صحة الصور باستخدام نموذج Gemini Pro Vision (حزمة تطوير برامج Java). سيتم بعد ذلك نشر دالة Java Cloud على نقطة نهاية REST.

يُرجى اتّباع الخطوات التالية:

  1. افتح محرِّر Cloud Shell.
  2. إذا كنت تستخدم "أداة التعديل القديمة"، انقر على تجربة "محرّر إعلانات Google" الجديد.
  3. في شريط الحالة، انقر على رمز السحابة الإلكترونية - تسجيل الدخول.
  4. إذا طُلب منك تفويض Cloud Shell Editor لإجراء طلبات البيانات من Google Cloud API، انقر على تفويض. اتّبِع التعليمات التي تظهر على الشاشة لتسجيل الدخول إلى حسابك على Google. أنت الآن متصل الآن بخدمة Google Cloud.
  5. إذا لم يظهر مشروعك في شريط حالة Cloud Code، انقر على Cloud Code - تسجيل الدخول > اختيار مشروع على Google Cloud. اختَر مشروع Google Cloud الذي تريد إنشاء دوال Cloud فيه. يتم تحميل المشروع ويصبح المشروع النشط في "محرِّر Cloud Shell".
  6. في شريط حالة رمز السحابة الإلكترونية، انقر على اسم المشروع النشط. في قائمة "الاختيار السريع" التي تظهر، اختَر تطبيق جديد.
  7. في مربّع الحوار إنشاء تطبيق جديد، اختَر تطبيق Cloud Functions.

الصفحة المنبثقة &quot;إنشاء تطبيق جديد&quot; 1

  1. حدِّد Java: Hello World عند مطالبتك بتحديد نموذج.

الصفحة المنبثقة &quot;إنشاء تطبيق جديد&quot; 2

  1. أدخل Gemini-BQ-Function كاسم مشروعك في مسار المشروع. تظهر بنية المشروع في طريقة عرض جديدة لمحرِّر Cloud Shell.

بنية مشروع تطبيق دالة Java Cloud الجديدة

  1. أضِف الموارد التابعة اللازمة ضمن العلامة <dependencies>... </dependencies> أو انسخ الاعتماديات من نموذج ملف pom.xml.
  2. غيِّر اسم صفك من "HelloWorld.java" إلى اسم أكثر فائدة. لنفترض GeminiBigQueryFunction.java. أعِد تسمية الحزمة وفقًا لذلك.
  3. استخدِم نموذج الرمز المتوفّر في مستودع GitHub بدلاً من رمز العنصر النائب في الملف GeminiBigQueryFunction.Java. تأكد من استبدال المتغير <YOUR_PROJECT_ID> برقم تعريف مشروعك في نموذج التعليمة البرمجية.
  4. انتقِل إلى الوحدة الطرفية Cloud Shell. تأكد من أنك في دليل المشروع. إذا لم يكن الأمر كذلك، انتقِل إلى دليل المشروع من خلال تنفيذ الأمر التالي:
cd Gemini-BQ-Function
  1. نفِّذ العبارة التالية لإنشاء دالة Cloud ونشرها:
gcloud functions deploy gemini-bq-fn --gen2 --runtime java17 --trigger-http --entry-point cloudcode.helloworld.GeminiBigQueryFunction --allow-unauthenticated --source .

استبدل نقطة الدخول في الأمر بنقطة دخول الدالة. المخرج هو عنوان URL REST بالتنسيق التالي:

https://us-central1-YOUR_PROJECT_ID.cloudfunctions.net/gemini-bq-fn
  1. اختبِر "دالة السحابة الإلكترونية" هذه من خلال تنفيذ الأمر التالي من الوحدة الطرفية:
gcloud functions call gemini-bq-fn --region=us-central1 --gen2 --data '{"calls":[["https://storage.googleapis.com/img_public_test/image_validator/baseline/1.JPG", "https://storage.googleapis.com/img_public_test/image_validator/test/2.JPG", "PROMPT_ABOUT_THE_IMAGES_TO_GEMINI"]]}'

الرد على نموذج الطلب العشوائي:

سلسلة استجابة JSON من دالة السحابة الإلكترونية

رائع! أصبحت وظيفة السحابة الإلكترونية العامة لتنفيذ نموذج Gemini Pro Vision جاهزة. لنستخدم نقطة النهاية هذه مباشرةً على بيانات BigQuery من داخل دالة بعيدة في BigQuery.

الخطوة 2: إنشاء جدول عناصر في BigQuery ودالة عن بُعد

شرط أساسي

ستحتاج إلى حزمة Cloud Storage لهذا الجزء من التمرين. اتّبِع الخطوات التالية لإنشاء حزمة على Cloud Storage:

  1. لإنشاء حزمة، انتقِل إلى وحدة التحكّم في Cloud Storage وانقر على إنشاء.
  2. أدخِل demo-bq-gemini-public-image كاسم الحزمة وانقر على إنشاء.
  3. أزِل العلامة من المربّع بجانب Enforce public access prevention on this bucket. على الرغم من أنّك تنشئ هذه الحزمة للوصول العام في هذا التمرين، ننصحك بمنع وصول الجميع وتوفير أذونات لحسابات خدمة محدَّدة على النحو المطلوب في حالات الاستخدام الخاصة بمؤسستك.
  4. بعد إنشاء الحزمة، انتقِل إلى علامة التبويب الأذونات للاطّلاع على الأذونات وتغييرها.
  5. لإضافة عناصر رئيسية، انقر على منح إذن الوصول. يُرجى تحديد رقم تعريف حساب خدمة لمنح الأذونات لحساب محدّد أو تحديد allUsers لمنح إذن الوصول العلني إلى حزمتك.
  6. اختَر الدور "Storage Object Viewer" وانقر على حفظ. اختَر السماح بالوصول العام إذا طُلب منك ذلك.
  7. انتقِل إلى علامة التبويب العناصر وحمِّل صورًا أساسية واختبِر الصور لمقارنتها. بالنسبة إلى هذا الدرس التطبيقي حول الترميز، يمكنك تحميل العناصر التالية المتاحة للجميع: baseline.JPG وTEST1.JPG وTEST2.JPG.

إنشاء جدول عناصر في BigQuery

يمكنك إنشاء جدول عناصر خارجي من BigQuery للوصول إلى البيانات غير المنظَّمة في الحزمة باستخدام عملية الربط ومجموعة البيانات التي أنشأتها سابقًا. للقيام بذلك، قم بتنفيذ عبارة DDL (لغة تعريف البيانات) التالية من جزء محرر استعلام BigQuery:

CREATE OR REPLACE EXTERNAL TABLE `gemini_bq_fn.image_validation`
WITH CONNECTION `us.gemini-bq-conn`
OPTIONS(object_metadata="SIMPLE", uris=["gs://demo-bq-gemini-public-image/*.JPG"]);

تحقّق من إنشاء جدول عناصر جديد باسم image_validation في مجموعة البيانات.

إنشاء دالة عن بُعد في BigQuery

يمكنك إنشاء وظيفة عن بُعد في BigQuery لاستدعاء وظيفة Java Cloud التي تنفّذ نموذج Gemini Pro Vision. قم بإنشاء هذا في نفس مجموعة البيانات. للقيام بذلك، قم بتشغيل DDL التالية من جزء محرر SQL في وحدة تحكم BigQuery:

CREATE OR REPLACE FUNCTION `gemini_bq_fn.FN_IMAGE_VALIDATE` (baseline STRING, test STRING, prompt STRING) RETURNS STRING
 REMOTE WITH CONNECTION `us.gemini-bq-conn`
 OPTIONS (
   endpoint = 'https://us-central1-<your project id>.cloudfunctions.net/gemini-bq-fn',
   max_batching_rows = 1
 );

عنوان URL لنقطة النهاية هو عنوان REST الذي تم عرضه في وقت سابق في هذا التمرين. يؤدي هذا إلى إنشاء الدالة عن بُعد في BigQuery. هناك ثلاث معلمات في DDL المذكورة أعلاه. أول معلمين هما عناوين URL للصور المخزنة في جدول الكائنات الذي تم إنشاؤه في الخطوة السابقة. المَعلمة الأخيرة هي الطلب إلى النموذج (Gemini Pro Vision). يمكنك الرجوع إلى رمز دوال Java Cloud المستخدَم لتحليل هذا التوقيع:

Gson().fromJson(request.getReader(), JsonObject.class);
JsonArray calls_array = requestJson.getAsJsonArray("calls");
JsonArray calls = (JsonArray) calls_array.get(0);
String baseline_url = calls.get(0).toString().replace("\"", "");
String test_url = calls.get(1).toString().replace("\"", "");
String prompt_string = calls.get(2).toString();

استدعاء Gemini من BigQuery

يمكنك استخدام الوظيفة عن بُعد في طلب البحث SELECT لاختبار الدالة والتحقّق من صحة الصور في ضوء الطلب.

select gemini_bq_fn.FN_IMAGE_VALIDATE(
'https://storage.googleapis.com/demo-bq-gemini-public-image/Baseline.JPG',
REPLACE(uri, 'gs://', 'https://storage.googleapis.com/') ,
'You are an expert image validator who can respond with JSON result. Find 2 images here. The first one is the reference image. The second image is the test image. Compare the second image to see if the second image is similar to the first in terms of the text present in the image.  Respond ONLY in JSON Format with 3 attributes namely SIMILARITY which is a \"YES\" or \"NO\", SIMILARITY_SCORE which is a percentage and DIFFERENCE_COMMENT which is a string.' ) as IMAGE_VALIDATION_RESULT
from `gemini_bq_fn.image_validation`
where uri like '%TEST1%';  

جرِّب طلب البحث أعلاه مع ملفي الكائنين TEST1 وTEST2. ستظهر لك نتيجة مشابهة لما يلي:

لقطة شاشة لنتيجة الدالة عن بُعد في BigQuery

في ما يلي الصور التي يمكنك الرجوع إليها:

الصورة الأساسية

الصورة المرجعية لمرحلة الاختبار

صورة تجريبية

الصورة الاختبارية 1 لحالة الاختبار

يُرجى العلم أنّ كلتا الصورتَين متشابهتان من حيث أنّهما تعرضان وحدة التحكّم في السحابة الإلكترونية Duet AI، إلا أنّ النص فيهما مختلفان على النحو الذي يظهر به النموذج بتنسيق JSON.

يعني ذلك أنّه تم بنجاح اختبار تنفيذ الوظيفة عن بُعد.

7. الفوائد وحالات الاستخدام

لنلقِ نظرة على بعض مزايا دمج BigQuery وGemini لتحليلات البيانات المنظَّمة وغير المنظَّمة.

  • الاستفادة من الذكاء الاصطناعي التوليدي في بياناتك بدون الحاجة إلى نقل البيانات أو تكرارها وزيادة التعقيدات يمكنك تحليل البيانات وإنشاء إحصاءات داخل بيئة BigQuery نفسها.
  • الإحصاءات المحسَّنة: تضيف ميزة "تفسيرات اللغة الطبيعية" في Gemini طبقة جديدة من الفهم إلى بياناتك، ويمكنك تحقيق ذلك باستخدام طلبات لغة الاستعلامات البنيوية (SQL).
  • قابلية التوسع: يتعامل هذا الحل مع مجموعات البيانات الكبيرة والتحليلات المعقدة بسهولة وجهد منخفض باستخدام رمز برمجي.

هناك العديد من التطبيقات لهذا الغرض. ننصحك بالتفكير في السيناريوهات في مجال التمويل (تحليل مؤشرات السوق) والبيع بالتجزئة (آراء العملاء) والرعاية الصحية (ملخّصات التقارير الطبية)، وما إلى ذلك، حيث يمكن لفِرق الإحصاءات والأنشطة التجارية تنفيذ هذه السيناريوهات بجهد وموارد منخفضة نسبيًا ولغة وأداة مألوفة من اختيارك.

8. تَنظيم

لتجنُّب تحصيل رسوم من حسابك على Google Cloud مقابل الموارد المُستخدَمة في هذه المشاركة، يُرجى اتّباع الخطوات التالية:

  1. في وحدة تحكُّم Google Cloud، انتقِل إلى صفحة إدارة الموارد.
  2. في قائمة المشاريع، اختَر المشروع الذي تريد حذفه، ثم انقر على حذف.
  3. في مربّع الحوار، اكتب رقم تعريف المشروع، ثم انقر على إيقاف التشغيل لحذف المشروع.
  4. إذا أردت الاحتفاظ بمشروعك، تخطّي الخطوات أعلاه وحذف "دالة السحابة الإلكترونية" من خلال الانتقال إلى Cloud Functions ومن قائمة الوظائف، ضَع علامة في المربّع الذي تريد حذفه وانقر على Delete (حذف).

9. تهانينا

تهانينا. بفضل نماذج Gemini المُدمَجة في BigQuery، لم تعُد تقتصر مهامك على تحليل بياناتك، بل أصبحت راوِيًا للبيانات. يمكنك إنشاء الروايات المخفية داخل مجموعات البيانات الخاصة بك وتغيير الطريقة التي تفهم بها الرؤى لديك. بدء التجربة قم بتطبيق هذه التقنية على مجموعات البيانات الخاصة بك واكتشف القصص داخل بياناتك. بما أنّ أداة BigQuery تتيح البيانات غير المنظَّمة في جداول العناصر ( External Tables)، يمكنك تجربة استخدام Gemini Pro Vision لإنشاء إحصاءات من إنشاء الذكاء الاصطناعي التوليدي عن بيانات الصور. يمكنك الرجوع إلى مستندات Vertex AI ووظائف BigQuery عن بُعد ووظائف السحابة الإلكترونية للحصول على إرشادات أكثر تفصيلاً. في ما يلي مستودع github لهذا المشروع. دعنا نعرف ما الذي تبنيه من خلال هذا التعلم!