بدء استخدام Spanner Data Boost وBigQuery

1. مقدمة

في هذا الدرس التطبيقي حول الترميز، ستتعلّم كيفية استخدام Spanner Data Boost لطلب بيانات Spanner من BigQuery باستخدام استعلامات Spanner الموحّدة دون التأثير في قاعدة بيانات Spanner.

Spanner Data Boost هي خدمة مُدارة بالكامل بدون خادم وتوفّر موارد حوسبة مستقلة لأعباء العمل المتوافقة مع Spanner. تتيح لك ميزة "تعزيز البيانات" تنفيذ طلبات الإحصاءات وعمليات تصدير البيانات بتأثير شبه صفري على أحمال العمل الحالية على مثيل Spanner الموفّر باستخدام نموذج استخدام عند الطلب بدون خادم.

عند الإقران مع اتصالات BigQuery الخارجية، تسمح لك ميزة "تعزيز البيانات" بالاستعلام عن البيانات بسهولة من Spanner في منصة تحليلات البيانات الخاصة بك بدون حركة بيانات ETL معقدة.

المتطلبات الأساسية

الإلمام بأساسيات Google Cloud ووحدة التحكم
المهارات الأساسية في واجهة سطر الأوامر وGoogle Shell

ما ستتعرَّف عليه

كيفية نشر مثيل Spanner
كيفية تحميل بيانات لإنشاء قاعدة بيانات Spanner
كيفية الوصول إلى بيانات Spanner من BigQuery بدون خدمة "تحسين البيانات"
كيفية الوصول إلى بيانات Spanner من BigQuery باستخدام ميزة "تحسين البيانات"

المتطلبات

حساب على Google Cloud ومشروع على Google Cloud
متصفّح ويب، مثل Chrome

2. الإعداد والمتطلبات

إعداد بيئة ذاتية

سجِّل الدخول إلى Google Cloud Console وأنشئ مشروعًا جديدًا أو أعِد استخدام مشروع حالي. إذا لم يكن لديك حساب على Gmail أو Google Workspace، عليك إنشاء حساب.

اسم المشروع هو الاسم المعروض للمشاركين في هذا المشروع. وهي سلسلة أحرف لا تستخدمها Google APIs. ويمكنك تعديلها في أي وقت.
يكون رقم تعريف المشروع فريدًا في جميع مشاريع Google Cloud وغير قابل للتغيير (لا يمكن تغييره بعد تحديده). تنشئ Cloud Console سلسلة فريدة تلقائيًا. فعادةً لا تهتم بما هو. في معظم الدروس التطبيقية حول الترميز، يجب الإشارة إلى رقم تعريف المشروع (الذي يتم تحديده عادةً على أنّه PROJECT_ID). وإذا لم يعجبك رقم التعريف الذي تم إنشاؤه، يمكنك إنشاء رقم تعريف عشوائي آخر. ويمكنك بدلاً من ذلك تجربة طلبك الخاص ومعرفة ما إذا كان متاحًا. ولا يمكن تغييره بعد هذه الخطوة ويبقى طوال مدة المشروع.
لمعلوماتك، هناك قيمة ثالثة، وهي رقم المشروع، الذي تستخدمه بعض واجهات برمجة التطبيقات. اطّلِع على مزيد من المعلومات حول هذه القيم الثلاث في المستندات.

بعد ذلك، عليك تفعيل الفوترة في Cloud Console لاستخدام الموارد/واجهات برمجة التطبيقات في Cloud. لن يؤدي إكمال هذا الدرس التطبيقي حول الترميز إلى فرض أي تكاليف، إن وُجدت. لإيقاف تشغيل الموارد لتجنب تحمُّل الفواتير إلى ما هو أبعد من هذا البرنامج التعليمي، يمكنك حذف الموارد التي أنشأتها أو حذف المشروع. يكون مستخدمو Google Cloud الجدد مؤهَّلون للانضمام إلى برنامج فترة تجريبية مجانية بقيمة 300 دولار أمريكي.

بدء Cloud Shell

مع أنّه يمكن إدارة Google Cloud عن بُعد من الكمبيوتر المحمول، ستستخدم في هذا الدرس التطبيقي Google Cloud Shell، وهي بيئة سطر أوامر يتم تشغيلها في السحابة الإلكترونية.

من Google Cloud Console، انقر على رمز Cloud Shell في شريط الأدوات العلوي الأيسر:

من المفترَض أن تستغرق عملية إدارة الحسابات والاتصال بالبيئة بضع لحظات فقط. عند الانتهاء، من المفترض أن يظهر لك شيء مثل هذا:

يتم تحميل هذه الآلة الافتراضية مزوّدة بكل أدوات التطوير التي ستحتاج إليها. وتوفّر هذه الشبكة دليلاً رئيسيًا دائمًا بسعة 5 غيغابايت وتعمل على Google Cloud، ما يحسّن بشكل كبير من أداء الشبكة والمصادقة. يمكنك تنفيذ جميع أعمالك في هذا الدرس التطبيقي حول الترميز من خلال متصفّح. لا تحتاج إلى تثبيت أي تطبيقات.

3- إنشاء مثيل Spanner وقاعدة بيانات

تفعيل واجهة برمجة تطبيقات Spanner

داخل Cloud Shell، تأكَّد من إعداد رقم تعريف مشروعك:

gcloud config set project [YOUR-PROJECT-ID]
PROJECT_ID=$(gcloud config get-value project)

اضبط منطقتك التلقائية على us-central1. يمكنك تغيير هذه الإعدادات إلى منطقة مختلفة تتوافق مع الإعدادات الإقليمية لـ Spanner.

gcloud config set compute/region us-central1

تفعيل واجهة Spanner API:

gcloud services enable spanner.googleapis.com

إنشاء مثيل Spanner

في هذه الخطوة، نُعدّ مثيل Spanner للدرس التطبيقي حول الترميز. ولإجراء ذلك، افتح Cloud Shell وشغِّل الأمر التالي:

export SPANNER_INSTANCE_ID=codelab-demo
export SPANNER_REGION=regional-us-central1
gcloud spanner instances create $SPANNER_INSTANCE_ID \
--config=$SPANNER_REGION \
--description="Spanner Codelab instance" \
--nodes=1

إخراج الأمر:

$ gcloud spanner instances create $SPANNER_INSTANCE_ID \
--config=$SPANNER_REGION \
--description="Spanner Codelab instance" \
--nodes=1
Creating instance...done.

إنشاء قاعدة البيانات

بمجرد تشغيل المثيل الخاص بك، يمكنك إنشاء قاعدة البيانات. يسمح Spanner بقواعد بيانات متعددة على مثيل واحد.

قاعدة البيانات هي المكان الذي يمكنك فيه تعريف المخطط. يمكنك أيضًا التحكم في الأشخاص الذين يمكنهم الوصول إلى قاعدة البيانات، وإعداد تشفير مخصص، وتهيئة المحسِّن، وتعيين فترة الاحتفاظ.

لإنشاء قاعدة البيانات، يُرجى استخدام أداة سطر الأوامر gcloud مرة أخرى:

export SPANNER_DATABASE=codelab-db
gcloud spanner databases create $SPANNER_DATABASE \
 --instance=$SPANNER_INSTANCE_ID

إخراج الأمر:

$ gcloud spanner databases create $SPANNER_DATABASE \
 --instance=$SPANNER_INSTANCE_ID
Creating database...done.

4. تحميل البيانات

قبل أن تتمكن من استخدام "تعزيز البيانات"، تحتاج إلى بعض البيانات في قاعدة البيانات. لإجراء ذلك، عليك إنشاء حزمة Cloud Storage وتحميل عملية استيراد avro إلى الحزمة وبدء مهمة استيراد Dataflow لتحميل بيانات Avro إلى Spanner.