نقل بيانات ملف CSV إلى BigQuery باستخدام Cloud Data Fusion - العرض المجمَّع

لمحة عن هذا الدرس التطبيقي حول الترميز

تاريخ التعديل الأخير: مارس 28, 2022

تأليف: Google Cloud Healthcare and Life Science Solutions Team

1. مقدمة

تاريخ آخر تعديل: 28/02/2020

يعرض هذا الدرس التطبيقي حول الترميز نمطًا لنقل البيانات لنقل بيانات الرعاية الصحية بتنسيق CSV إلى BigQuery بشكل مجمّع. سنستخدم مسار البيانات المجمّعة في Cloud Data fusion في هذا التمرين المعملي. تم إنشاء بيانات اختبار الرعاية الصحية الواقعية وإتاحتها لك في حزمة Google Cloud Storage (gs://hcls_testing_data_fhir_10_patients/csv/) لك.

ستتعرف في هذا التمرين المعملي على الترميز ما يلي:

كيفية نقل بيانات ملف CSV (تحميل مجدول بشكل مجمّع) من GCS إلى BigQuery باستخدام ميزة Cloud Data Fusion
طريقة إنشاء مسار دمج البيانات بشكل مرئي في Cloud Data Fusion من أجل تحميل بيانات الرعاية الصحية وتحويلها وإخفاءها بشكل مجمّع

ما هي متطلبات تشغيل هذا الدرس التطبيقي حول الترميز؟

تحتاج إلى الوصول إلى مشروع Google Cloud Platform.
يجب أن تحصل على دور "مالك" لمشروع Google Cloud Platform.
بيانات الرعاية الصحية بتنسيق CSV، بما في ذلك العنوان.

إذا لم يكن لديك مشروع Google Cloud Platform، اتّبِع هذه الخطوات لإنشاء مشروع Google Cloud Platform جديد.

تم مسبقًا تحميل بيانات الرعاية الصحية بتنسيق CSV في حزمة GCS على الرابط gs://hcls_testing_data_fhir_10_patients/csv/. لكل ملف CSV للموارد بنية المخططات الفريدة. على سبيل المثال، يحتوي Patients.csv على مخطط مختلف عن Providers.csv. ويمكن العثور على ملفات المخططات المحمَّلة مسبقًا على الرابط gs://hcls_testing_data_fhir_10_patients/csv_schemas.

إذا كنت بحاجة إلى مجموعة بيانات جديدة، يمكنك إنشاؤها دائمًا باستخدام SyntheaTM. بعد ذلك، يمكنك تحميلها إلى خدمة GCS بدلاً من نسخها من الحزمة في خطوة "نسخ بيانات الإدخال".

2. إعداد مشروع Google Cloud Platform

إعداد متغيّرات واجهة الأوامر لبيئتك

للعثور على PROJECT_ID، راجِع المقالة تحديد المشاريع.

<!-- CODELAB: Initialize shell variables ->
<!-- Your current GCP Project ID ->
export PROJECT_ID=<PROJECT_ID>
<!-- A new GCS Bucket in your current Project  - INPUT ->
export BUCKET_NAME=<BUCKET_NAME>
<!-- A new BQ Dataset ID - OUTPUT ->
export DATASET_ID=<DATASET_ID>

أنشِئ حزمة GCS لتخزين بيانات الإدخال وسجلّات الأخطاء باستخدام أداة gsutil.

gsutil mb -l us gs://$BUCKET_NAME

الوصول إلى مجموعة البيانات الاصطناعية

من عنوان البريد الإلكتروني الذي تستخدمه لتسجيل الدخول إلى Cloud Console، أرسِل رسالة إلكترونية إلى hcls-solutions-external+subscribe@google.com لطلب الانضمام.
ستصلك رسالة إلكترونية تتضمّن تعليمات حول كيفية تأكيد الإجراء.
يمكنك استخدام خيار الردّ على الرسالة الإلكترونية للانضمام إلى المجموعة. لا تنقر على الزر.
بعد تلقّي رسالة التأكيد الإلكترونية، يمكنك الانتقال إلى الخطوة التالية في الدرس التطبيقي حول الترميز.

نسخ بيانات الإدخال:

gsutil -m cp -r gs://hcls_testing_data_fhir_10_patients/csv gs://$BUCKET_NAME

أنشِئ مجموعة بيانات BigQuery.

bq mk --location=us --dataset $PROJECT_ID:$DATASET_ID

3. إعداد بيئة Cloud Data Fusion

اتّبع هذه الخطوات لتفعيل Cloud Data Fusion API ومنح الأذونات المطلوبة:

تفعيل واجهات برمجة التطبيقات:

انتقِل إلى مكتبة واجهة برمجة التطبيقات لوحدة تحكُّم Google Cloud Platform.
من قائمة المشاريع، اختَر مشروعك.
في مكتبة واجهة برمجة التطبيقات، اختَر واجهة برمجة التطبيقات التي تريد تفعيلها. إذا كنت بحاجة إلى مساعدة للبحث عن واجهة برمجة التطبيقات، استخدِم حقل البحث و/أو الفلاتر.
في صفحة واجهة برمجة التطبيقات، انقر على "تفعيل".

إنشاء مثيل Cloud Data Fusion:

في وحدة تحكُّم Google Cloud Platform، اختَر ProjectID.
حدد "Data Fusion" (دمج البيانات) من القائمة اليمنى، ثم انقر فوق الزر "CREATE AN INSTANCE" في منتصف الصفحة (الإنشاء الأول)، أو انقر على الزر "إنشاء مثيل" في القائمة العلوية (إنشاء إضافي).

أدخِل اسم المثيل. اختَر Enterprise.

انقر فوق الزر "CREATE" (إنشاء).

إعداد أذونات المثيلات

بعد إنشاء مثيل، اتّبِع الخطوات التالية لمنح حساب الخدمة المرتبط بأذونات المثيل في مشروعك:

انتقِل إلى صفحة تفاصيل المثيل من خلال النقر على اسم المثيل.

انسخ حساب الخدمة.

انتقِل إلى صفحة "إدارة الهوية وإمكانية الوصول" في مشروعك.
في صفحة أذونات "إدارة الهوية وإمكانية الوصول"، سنضيف الآن حساب الخدمة كعضو جديد ونمنحه دور وكيل خدمة Cloud Data Fusion API. انقر على الزر إضافة، ثم الصِق "حساب الخدمة" في الحقل "الأعضاء الجدد" واختيار "إدارة الخدمة" -> دور وكيل خادم واجهة برمجة التطبيقات Data Fusion API
انقر على حفظ.

بعد تنفيذ هذه الخطوات، يمكنك البدء في استخدام Cloud Data Fusion من خلال النقر على الرابط عرض المثيل على صفحة مثيلات Cloud Data Fusion، أو صفحة تفاصيل المثيل.

إعداد قاعدة جدار الحماية.

انتقِل إلى وحدة تحكُّم Google Cloud Platform -> شبكة VPC -> قواعد جدار الحماية للتحقُّق مما إذا كانت قاعدة "allow-ssh" التلقائية متوفّرة أم لا.

وإذا لم يكن كذلك، أضِف قاعدة جدار حماية تسمح لجميع حركة بيانات SSH الواردة إلى الشبكة التلقائية.

استخدام سطر الأوامر:

gcloud beta compute --project={PROJECT_ID} firewall-rules create default-allow-ssh --direction=INGRESS --priority=1000 --network=default --action=ALLOW --rules=tcp:22 --source-ranges=0.0.0.0/0 --enable-logging

استخدام واجهة المستخدم: انقر على إنشاء قاعدة جدار حماية واملأ المعلومات:

4. إنشاء مخطط لعملية التحويل

الآن بعد أن أصبح لدينا بيئة Cloud Fusion في Google Cloud Platform، لننشئ مخططًا. نحتاج إلى هذا المخطط لتحويل بيانات CSV.

في نافذة Cloud Data Fusion، انقر على الرابط "عرض المثيل" في عمود "الإجراء". ستتم إعادة توجيهك إلى صفحة أخرى. انقر على url المقدَّم لفتح مثيل Cloud Data Fusion. اختيارك النقر على "بدء الجولة" أو "لا، شكرًا" في النافذة المنبثقة للترحيب.
توسيع نطاق "الهامبرغر" القائمة، حدد Pipeline -> استوديو YouTube

ضمن قسم "التحويل" في لوحة المكون الإضافي على اليمين، انقر نقرًا مزدوجًا على عقدة رانغلر، التي ستظهر في واجهة مستخدم "مسارات البيانات".

أشِر إلى عقدة Wrangler، وانقر على الخصائص. انقر على الزر Wrangle، ثم اختَر ملف مصدر .csv (على سبيل المثال،patis.csv)، والذي يجب أن يحتوي على جميع حقول البيانات لإنشاء المخطط المطلوب.
انقر على السهم المتّجه للأسفل (عمليات تحويل العمود) بجانب كل اسم عمود (على سبيل المثال، النص الأساسي).
بشكل افتراضي، ستفترض عملية الاستيراد الأولية أن هناك عمودًا واحدًا فقط في ملف البيانات. ولتحليله كملف CSV، انقر على تحليل ← CSV، ثم اختَر المُحدِّد وتحقَّق من "ضبط الصف الأول كرأس". المربع حسب الحاجة. انقر على الزر تطبيق.
انقر على السهم لأسفل بجوار حقل النص، وحدد حذف العمود لإزالة حقل النص. بالإضافة إلى ذلك، يمكنك تجربة عمليات تحويل أخرى مثل إزالة الأعمدة، وتغيير نوع البيانات لبعض الأعمدة (الإعداد التلقائي هو نوع "السلسلة")، وتقسيم الأعمدة، وضبط أسماء الأعمدة، وما إلى ذلك.

"الأعمدة" و"خطوات التحول" تعرض مخطط الإخراج ووصفة رانغلر. انقر على تطبيق في أعلى يسار الصفحة. انقر على الزر "تحقق". ظهور رسالة "لم يتم العثور على أخطاء" يشير إلى النجاح.

في مواقع Wrangler، انقر على القائمة المنسدلة الإجراءات من أجل تصدير المخطط المطلوب إلى وحدة التخزين المحلية لتتمكن من استيراده في المستقبل إذا لزم الأمر.
احفظ وصفة رانجلر لاستخدامها في المستقبل.

parse-as-csv :body ',' true
drop body

لإغلاق نافذة "خصائص رانجلر"، انقر على الزر X.

5. إنشاء عُقد لمسار التعلّم

في هذا القسم، سننشئ مكونات المسار.

في واجهة مستخدم "مسارات البيانات" في أعلى يمين الصفحة، من المفترض أن يظهر لك أنّه تم اختيار مسار البيانات - الدفعة كنوع لمسار البيانات.

توجد أقسام مختلفة في اللوحة اليمنى: "الفلتر" و"المصدر" و"التحويل" و"الإحصاءات" و"الحوض" و"الشروط والإجراءات" و"معالِجات الأخطاء و"التنبيهات" حيث يمكنك تحديد عُقدة أو عُقد لمسار العملية.

العقدة المصدر

اختَر عقدة المصدر.
ضمن قسم المصدر في لوحة المكونات الإضافية على اليمين، انقر نقرًا مزدوجًا على عقدة Google Cloud Storage التي تظهر في واجهة مستخدم "مسارات البيانات".
أشِر إلى عقدة مصدر GCS وانقر على الخصائص.

املأ الحقول المطلوبة. ضبط الحقول التالية:

التصنيف = {any text}
اسم المرجع = {any text}
رقم تعريف المشروع = الاكتشاف التلقائي
المسار = عنوان URL لخدمة GCS المطلوب تجميعه في مشروعك الحالي. على سبيل المثال، gs://$BUCKET_NAME/csv/
التنسيق = نص
حقل المسار = اسم الملف
اسم ملف المسار فقط = صحيح
قراءة الملفات بشكل متكرر = صحيح

إضافة الحقل "اسم الملف" إلى مخطط إخراج GCS بالنقر على الزر +.
انقر على المستندات للحصول على شرح تفصيلي. انقر على الزر "تحقق". ظهور رسالة "لم يتم العثور على أخطاء" يشير إلى النجاح.
لإغلاق خصائص GCS، انقر على الزر X.

تحويل العقدة

حدد عقدة التحويل.
ضمن قسم "التحويل" في لوحة المكونات الإضافية على اليمين، انقر نقرًا مزدوجًا على عقدة Wrangler، التي تظهر في واجهة مستخدم "مسارات البيانات". ربط عقدة مصدر GCS بعقدة تحويل Wrangler.
أشِر إلى عقدة Wrangler، وانقر على الخصائص.
انقر على القائمة المنسدلة الإجراءات واختَر استيراد لاستيراد مخطط محفوظ (على سبيل المثال: gs://hcls_testing_data_fhir_10_patients/csv_schemas/ schema (Patients).json)، والصق الوصفة المحفوظة من القسم السابق.
أو يمكنك إعادة استخدام عقدة Wrangler من القسم: إنشاء مخطط للتحويل.
املأ الحقول المطلوبة. ضبط الحقول التالية:

التصنيف = {any text}
اسم حقل الإدخال = {*}
Precondition = {filename != "patients.csv"} لتمييز كل ملف تم إدخاله (على سبيل المثال، .patis.csv وProvides.csv وallergies.csv وما إلى ذلك) من عقدة المصدر.

أضِف عقدة JavaScript لتنفيذ JavaScript الذي يقدّمه المستخدم والذي تحوّل السجلات. في هذا الدرس التطبيقي حول الترميز، نستخدم عقدة JavaScript للحصول على طابع زمني لكل تحديث سجلّ. ربط عقدة تحويل Wrangler بعقدة تحويل JavaScript. افتح خصائص JavaScript، وأضِف الدالة التالية:

function transform(input, emitter, context) {
  input.TIMESTAMP = (new Date()).getTime()*1000;
  emitter.emit(input);
}

أضف الحقل المُسمى TIMESTAMP إلى مخطط الإخراج (إذا لم يكن موجودًا) عن طريق النقر على العلامة +. اختَر الطابع الزمني كنوع البيانات.

انقر على المستندات للحصول على شرح تفصيلي. انقر على الزر "التحقّق من الصحة" للتحقّق من صحة جميع معلومات الإدخال. أخضر "لم يتم العثور على أخطاء" يشير إلى النجاح.
لإغلاق نافذة "تحويل الخصائص"، انقر على زر X.

إخفاء البيانات وإخفاء معلومات تحديد الهوية

يمكنك تحديد أعمدة البيانات الفردية من خلال النقر على السهم لأسفل في العمود وتطبيق قواعد الإخفاء ضمن اختيار البيانات "قناع" وفقًا للمتطلبات (على سبيل المثال، عمود رقم التأمين الاجتماعي (SSN).

ويمكنك إضافة المزيد من التوجيهات في نافذة وصفة الطعام في عقدة Wrangler. على سبيل المثال، استخدام توجيه التجزئة مع خوارزمية التجزئة التي تتبع البنية التالية لغرض إخفاء الهوية:

hash <column> <algorithm> <encode>

<column>: name of the column
<algorithm>: Hashing algorithm (i.e. MD5, SHA-1, etc.)
<encode>: default is true (hashed digest is encoded as hex with left-padding zeros). To disable hex encoding, set <encode> to false.

عقدة الحوض

اختر عقدة الحوض.
ضمن قسم الحوض في لوحة المكونات الإضافية على اليمين، انقر نقرًا مزدوجًا على عقدة BigQuery، التي ستظهر في واجهة مستخدم مسار البيانات.
أشِر إلى عقدة مستودع BigQuery وانقر على "Properties" (الخصائص).

املأ الحقول المطلوبة. ضبط الحقول التالية:

التصنيف = {any text}
اسم المرجع = {any text}
رقم تعريف المشروع = الاكتشاف التلقائي
مجموعة البيانات = مجموعة بيانات BigQuery المستخدمة في المشروع الحالي (أي DATASET_ID)
الجدول = {table name}

انقر على المستندات للحصول على شرح تفصيلي. انقر على الزر "التحقّق من الصحة" للتحقّق من صحة جميع معلومات الإدخال. أخضر "لم يتم العثور على أخطاء" يشير إلى النجاح.

لإغلاق خصائص BigQuery، انقر على الزر X.

6. إنشاء مسار البيانات المجمّعة

ربط جميع العُقد في مسار معيّن

اسحب سهم الاتصال > على الحافة اليمنى للعقدة المصدر وإفلاتها على الحافة اليسرى للعقدة الوجهة.
يمكن أن يكون للمسار عدة فروع تحصل على ملفات إدخال من نفس عقدة مصدر GCS.

قم بتسمية مسار الممر.

ما مِن إجراءات أخرى مطلوبة. لقد انتهيت للتو من إنشاء أول مسار لبيانات "الدُفعة" ويمكنك تفعيل المسار وتشغيله.

إرسال تنبيهات مسارات التعلّم عبر البريد الإلكتروني (اختياري)

لاستخدام ميزة إرسال رسالة تنبيه في مسار الأنابيب، تتطلب عملية الإعداد إعداد خادم بريد لإرسال البريد من مثيل جهاز افتراضي. يُرجى الاطّلاع على الرابط المرجعي أدناه للحصول على مزيد من المعلومات:

إرسال بريد إلكتروني من مثيل | مستندات Compute Engine

في هذا الدرس التطبيقي حول الترميز، نعدّ خدمة ترحيل البريد من خلال Mailgun باستخدام الخطوات التالية:

اتّبِع التعليمات الواردة في إرسال رسالة إلكترونية باستخدام Mailgun | مستندات Compute Engine لإعداد حساب على Mailgun وإعداد خدمة ترحيل البريد الإلكتروني في ما يلي تعديلات إضافية.
إضافة جميع المستلِمين إلى قائمة Mailgun المسموح بها. يمكن العثور على هذه القائمة في خيار Mailgun>إرسال>نظرة عامة في اللوحة اليمنى.

بعد أن ينقر المُستلِمون على "أوافق" في الرسالة الإلكترونية المُرسَلة من support@mailgun.net، يتم حفظ عناوين بريدهم الإلكتروني في القائمة المسموح بها لتلقّي الرسائل الإلكترونية التنبيهية بشأن مسار التعلّم.

الخطوة 3 من "قبل البدء" - أنشئ قاعدة جدار حماية على النحو التالي:

الخطوة 3 من "ضبط Mailgun كعملية ترحيل البريد باستخدام Postfix" اختَر موقع إلكتروني أو إنترنت مع مضيف ذكي، بدلاً من موقع إلكتروني فقط كما هو موضّح في التعليمات.

الخطوة 4 من "ضبط Mailgun كعملية ترحيل البريد باستخدام Postfix" عدِّل vi /etc/postfix/main.cf لإضافة 10.128.0.0/9 في نهاية mynetworks.

عدِّل vi /etc/postfix/master.cf لتغيير بروتوكول SMTP التلقائي (25) إلى المنفذ 587.

في أعلى يسار صفحة Data Fusion studio، انقر على Configure (إعداد). انقر على تنبيه مسار التعلّم وانقر على الزر + لفتح نافذة التنبيهات. اختَر SendEmail.

املأ نموذج ضبط البريد الإلكتروني. اختر إكمال، أو نجاح، أو تعذُّر من القائمة المنسدلة شرط التشغيل لكل نوع من أنواع التنبيهات. إذا كان تضمين الرمز المميّز لسير العمل = خطأ، سيتم إرسال المعلومات من حقل "الرسالة" فقط. إذا كان تضمين الرمز المميّز لسير العمل = صحيح، يتم إرسال المعلومات من حقل "الرسالة" والمعلومات التفصيلية حول "الرمز المميّز لسير العمل". يجب استخدام أحرف صغيرة مع البروتوكول. استخدام أي بيانات "مزيّفة" عنوان بريد إلكتروني آخر غير عنوان البريد الإلكتروني للشركة الخاص بالمرسِل.

7. ضبط المسار ونشره وتشغيله وجدولته

في أعلى يسار صفحة Data Fusion studio، انقر على Configure (إعداد). اختَر Spark for Engine Config. انقر على "حفظ" في نافذة "إعداد".

انقر على معاينة لمعاينة البيانات**،** ثم انقر على **معاينة** مرة أخرى للرجوع إلى النافذة السابقة. يمكنك أيضًا **تشغيل** المسار في وضع "المعاينة".

انقر على السجلات للاطّلاع على السجلّات.
انقر على حفظ لحفظ جميع التغييرات.
انقر على استيراد لاستيراد إعداد المسار المحفوظ عند إنشاء مسار جديد.
انقر على تصدير لتصدير إعداد المسار.
انقر على نشر لتفعيل العملية.
بعد نشر التطبيق، انقر على تشغيل وانتظر حتى اكتمال العملية.

يمكنك تكرار المسار من خلال اختيار "تكرار" ضمن الزر الإجراءات.
يمكنك تصدير تهيئة مسار التعلّم عن طريق اختيار "تصدير" ضمن زر الإجراءات.
انقر على مشغّلات البريد الوارد أو عوامل التشغيل الصادرة على الحافة اليمنى أو اليسرى من نافذة "استوديو YouTube" لضبط مشغّلات المسارات عند الحاجة.
انقر على جدولة لجدولة مسار التعلّم وتحميل البيانات بشكلٍ دوري.

يعرض الملخّص الرسوم البيانية لسجلّ التشغيل والسجلّات وسجلّات الأخطاء والتحذيرات.

8. التحقّق من الصحة

تم تنفيذ مسار "التحقّق من الصحة" بنجاح.

تحقَّق مما إذا كانت مجموعة بيانات BigQuery تحتوي على جميع الجداول.

bq ls $PROJECT_ID:$DATASET_ID

     tableId       Type    Labels   Time Partitioning
----------------- ------- -------- -------------------
 Allergies         TABLE
 Careplans         TABLE
 Conditions        TABLE
 Encounters        TABLE
 Imaging_Studies   TABLE
 Immunizations     TABLE
 Medications       TABLE
 Observations      TABLE
 Organizations     TABLE
 Patients          TABLE
 Procedures        TABLE
 Providers         TABLE

تلقّي رسائل إلكترونية للتنبيه (في حال ضبطها).

عرض النتائج

لعرض النتائج بعد تشغيل المسار:

إجراء طلب بحث عن الجدول في واجهة مستخدم BigQuery. الانتقال إلى واجهة مستخدم BIGQUERY
قم بتحديث الاستعلام أدناه إلى اسم مشروعك ومجموعة البيانات والجدول الخاص بك.

9. التنظيف

لتجنُّب تحمُّل الرسوم المفروضة على حسابك في Google Cloud Platform مقابل الموارد المستخدَمة في هذا البرنامج التعليمي:

بعد الانتهاء من البرنامج التعليمي، يمكنك إخلاء الموارد التي أنشأتها على Google Cloud Platform حتى لا تشغل حصتك ولن يتم تحرير فواتير لك بها في المستقبل. توضّح الأقسام التالية كيفية حذف هذه المراجع أو إيقافها.

حذف مجموعة بيانات BigQuery

اتبع هذه التعليمات لحذف مجموعة بيانات BigQuery التي أنشأتها كجزء من هذا البرنامج التعليمي.

حذف حزمة GCS

اتّبِع التعليمات التالية لحذف حزمة GCS التي أنشأتها كجزء من هذا الدليل التوجيهي.

حذف مثيل Cloud Data Fusion

اتَّبِع هذه التعليمات لحذف النسخة الافتراضية من Cloud Data Fusion.

حذف المشروع

أسهل طريقة لإزالة الفوترة هي حذف المشروع الذي أنشأته للبرنامج التعليمي.

لحذف المشروع:

تنبيه: يؤدي حذف المشروع إلى التأثيرات التالية:

تم حذف كل محتوى المشروع. إذا استخدمت مشروعًا حاليًا لهذا البرنامج التعليمي، فعند حذفه، يتم أيضًا حذف أي عمل آخر قمت به في هذا المشروع.
يتم فقدان أرقام تعريف المشاريع المخصّصة. عندما أنشأت هذا المشروع، ربما تكون قد أنشأت رقم تعريف مشروع مخصّصًا تريد استخدامه في المستقبل. للاحتفاظ بعناوين URL التي تستخدم رقم تعريف المشروع، مثل عنوان URL لـ appspot.com، احذف الموارد المحدّدة داخل المشروع بدلاً من حذف المشروع بالكامل.

إذا كنت تخطط لاستكشاف العديد من البرامج التعليمية والبدايات السريعة، فيمكن أن تساعدك إعادة استخدام المشروعات في تجنب تجاوز حدود حصة المشروع.

في وحدة تحكُّم Google Cloud Platform، انتقِل إلى صفحة المشاريع. الانتقال إلى صفحة "المشاريع"
في قائمة المشاريع، اختَر المشروع الذي تريد حذفه وانقر على حذف.
في مربّع الحوار، اكتب رقم تعريف المشروع، ثم انقر على إيقاف التشغيل لحذف المشروع.

10. تهانينا

تهانينا، لقد أكملت بنجاح التمرين المعملي حول الترميز لنقل بيانات الرعاية الصحية في BigQuery باستخدام Cloud Data Fusion.

تم استيراد بيانات ملف CSV من Google Cloud Storage إلى BigQuery.

لقد أنشأت بشكل مرئي مسار تكامل البيانات لتحميل بيانات الرعاية الصحية وتحويلها وإخفاءها بشكل مجمّع.

أنت الآن على علم بالخطوات الأساسية المطلوبة لبدء عملية تحليل بيانات الرعاية الصحية باستخدام BigQuery على Google Cloud Platform.

الإبلاغ عن خطأ