1. ভূমিকা

শেষ আপডেট: ২০২০-০২-২৮
এই কোডল্যাবটি রিয়েল টাইমে BigQuery-তে CSV ফর্ম্যাট করা স্বাস্থ্যসেবা ডেটা প্রবেশের জন্য একটি ডেটা ইনজেশন প্যাটার্ন প্রদর্শন করে। আমরা এই ল্যাবের জন্য ক্লাউড ডেটা ফিউশন রিয়েল টাইম ডেটা পাইপলাইন ব্যবহার করব। বাস্তবসম্মত স্বাস্থ্যসেবা পরীক্ষার ডেটা তৈরি করা হয়েছে এবং আপনার জন্য Google ক্লাউড স্টোরেজ বাকেটে (gs://hcls_testing_data_fhir_10_patients/csv/) উপলব্ধ করা হয়েছে।
এই কোড ল্যাবে আপনি শিখবেন:
- ক্লাউড ডেটা ফিউশন ব্যবহার করে পাব/সাব থেকে বিগকুয়েরিতে CSV ডেটা (রিয়েল টাইম লোডিং) কীভাবে গ্রহণ করবেন।
- ক্লাউড ডেটা ফিউশনে কীভাবে দৃশ্যত একটি ডেটা ইন্টিগ্রেশন পাইপলাইন তৈরি করবেন যাতে রিয়েল টাইমে স্বাস্থ্যসেবা ডেটা লোড, রূপান্তর এবং মাস্ক করা যায় ।
এই ডেমোটি চালানোর জন্য আপনার কী কী প্রয়োজন?
- আপনার একটি GCP প্রকল্পে অ্যাক্সেস প্রয়োজন।
- আপনাকে অবশ্যই GCP প্রকল্পের মালিকের ভূমিকায় নিযুক্ত করতে হবে।
- হেডার সহ CSV ফর্ম্যাটে স্বাস্থ্যসেবা ডেটা।
যদি আপনার কোন GCP প্রকল্প না থাকে, তাহলে একটি নতুন GCP প্রকল্প তৈরি করতে এই পদক্ষেপগুলি অনুসরণ করুন।
CSV ফর্ম্যাটে স্বাস্থ্যসেবা তথ্য gs://hcls_testing_data_fhir_10_patients/csv/ এ GCS বাকেটে আগে থেকে লোড করা হয়েছে। প্রতিটি CSV রিসোর্স ফাইলের একটি অনন্য স্কিমা কাঠামো রয়েছে। উদাহরণস্বরূপ, Patients.csv এর Providers.csv এর চেয়ে আলাদা স্কিমা রয়েছে। আগে থেকে লোড করা স্কিমা ফাইলগুলি gs://hcls_testing_data_fhir_10_patients/csv_schemas এ পাওয়া যাবে।
যদি আপনার একটি নতুন ডেটাসেটের প্রয়োজন হয়, তাহলে আপনি সর্বদা SyntheaTM ব্যবহার করে এটি তৈরি করতে পারেন। তারপর, কপি ইনপুট ডেটা ধাপে বাকেট থেকে কপি করার পরিবর্তে এটি GCS-এ আপলোড করুন।
2. GCP প্রকল্প সেটআপ
আপনার পরিবেশের জন্য শেল ভেরিয়েবলগুলি আরম্ভ করুন।
PROJECT_ID খুঁজে পেতে, Identifying projects দেখুন।
<!-- CODELAB: Initialize shell variables -> <!-- Your current GCP Project ID -> export PROJECT_ID=<PROJECT_ID> <!-- A new GCS Bucket in your current Project - INPUT -> export BUCKET_NAME=<BUCKET_NAME> <!-- A new BQ Dataset ID - OUTPUT -> export DATASET_ID=<DATASET_ID>
gsutil টুল ব্যবহার করে ইনপুট ডেটা এবং ত্রুটি লগ সংরক্ষণ করার জন্য একটি GCS বাকেট তৈরি করুন ।
gsutil mb -l us gs://$BUCKET_NAME
সিন্থেটিক ডেটাসেটে অ্যাক্সেস পান।
- ক্লাউড কনসোলে লগইন করার জন্য আপনি যে ইমেল ঠিকানাটি ব্যবহার করছেন, সেখান থেকে hcls-solutions-external+subscribe@google.com ঠিকানায় যোগদানের জন্য অনুরোধ জানিয়ে একটি ইমেল পাঠান।
- আপনি কীভাবে পদক্ষেপটি নিশ্চিত করবেন তার নির্দেশাবলী সহ একটি ইমেল পাবেন।
- গ্রুপে যোগদানের জন্য ইমেলের উত্তর দেওয়ার বিকল্পটি ব্যবহার করুন।
বোতাম। - একবার আপনি নিশ্চিতকরণ ইমেলটি পেয়ে গেলে, আপনি কোডল্যাবের পরবর্তী ধাপে যেতে পারেন।
ইনপুট ডেটা কপি করুন।
gsutil -m cp -r gs://hcls_testing_data_fhir_10_patients/csv gs://$BUCKET_NAME
একটি BigQuery ডেটাসেট তৈরি করুন।
bq mk --location=us --dataset $PROJECT_ID:$DATASET_ID
গুগল ক্লাউড এসডিকে ইনস্টল এবং ইনিশিয়ালাইজ করুন এবং পাব বা সাব টপিক এবং সাবস্ক্রিপশন তৈরি করুন।
gcloud init gcloud pubsub topics create your-topic gcloud pubsub subscriptions create --topic your-topic your-sub
৩. ক্লাউড ডেটা ফিউশন এনভায়রনমেন্ট সেটআপ
ক্লাউড ডেটা ফিউশন API সক্ষম করতে এবং প্রয়োজনীয় অনুমতি প্রদান করতে এই পদক্ষেপগুলি অনুসরণ করুন:
API গুলি সক্ষম করুন ।
- GCP কনসোল API লাইব্রেরিতে যান।
- প্রকল্প তালিকা থেকে, আপনার প্রকল্পটি নির্বাচন করুন।
- API লাইব্রেরিতে, আপনি যে API টি সক্ষম করতে চান তা নির্বাচন করুন ( Cloud Data Fusion API, Cloud Pub/Sub API)। যদি আপনার API খুঁজে পেতে সাহায্যের প্রয়োজন হয়, তাহলে অনুসন্ধান ক্ষেত্র এবং ফিল্টারগুলি ব্যবহার করুন।
- API পৃষ্ঠায়, ENABLE এ ক্লিক করুন।
একটি ক্লাউড ডেটা ফিউশন ইনস্ট্যান্স তৈরি করুন ।
- GCP কনসোলে, আপনার ProjectID নির্বাচন করুন।
- বাম মেনু থেকে ডেটা ফিউশন নির্বাচন করুন, তারপর পৃষ্ঠার মাঝখানে (প্রথম সৃষ্টি) "একটি ইন্সট্যান্স তৈরি করুন" বোতামে ক্লিক করুন, অথবা উপরের মেনুতে (অতিরিক্ত সৃষ্টি) "একটি ইন্সট্যান্স তৈরি করুন" বোতামে ক্লিক করুন।


- উদাহরণের নাম দিন। Enterprise নির্বাচন করুন।

- তৈরি করুন বোতামে ক্লিক করুন।
ইনস্ট্যান্স অনুমতি সেট আপ করুন।
একটি ইনস্ট্যান্স তৈরি করার পরে, আপনার প্রকল্পের ইনস্ট্যান্স অনুমতির সাথে সম্পর্কিত পরিষেবা অ্যাকাউন্টটি প্রদান করতে নিম্নলিখিত পদক্ষেপগুলি ব্যবহার করুন:
- ইনস্ট্যান্সের নামে ক্লিক করে ইনস্ট্যান্সের বিস্তারিত পৃষ্ঠায় যান।

- পরিষেবা অ্যাকাউন্টটি কপি করুন।

- আপনার প্রকল্পের IAM পৃষ্ঠায় যান।
- IAM অনুমতি পৃষ্ঠায়, Add বোতামে ক্লিক করে পরিষেবা অ্যাকাউন্টটিকে Cloud Data Fusion API Service Agent ভূমিকা প্রদান করুন। New members ক্ষেত্রে "service account" পেস্ট করুন এবং Service Management -> Cloud Data Fusion API Server Agent role নির্বাচন করুন।

- একটি পাব/সাব সাবস্ক্রাইবার ভূমিকা যোগ করতে + অন্য ভূমিকা যোগ করুন (অথবা ক্লাউড ডেটা ফিউশন API পরিষেবা এজেন্ট সম্পাদনা করুন) ক্লিক করুন।

- সংরক্ষণ করুন ক্লিক করুন।
এই ধাপগুলি সম্পন্ন হয়ে গেলে, আপনি ক্লাউড ডেটা ফিউশন ইনস্ট্যান্স পৃষ্ঠায় ভিউ ইনস্ট্যান্স লিঙ্কে ক্লিক করে অথবা একটি ইনস্ট্যান্সের বিশদ পৃষ্ঠায় ক্লিক করে ক্লাউড ডেটা ফিউশন ব্যবহার শুরু করতে পারেন।
ফায়ারওয়াল নিয়ম সেট আপ করুন।
- ডিফল্ট-allow-ssh নিয়মটি বিদ্যমান কিনা তা পরীক্ষা করতে GCP কনসোল -> VPC নেটওয়ার্ক -> ফায়ারওয়াল নিয়মগুলিতে নেভিগেট করুন।

- যদি না হয়, তাহলে একটি ফায়ারওয়াল নিয়ম যোগ করুন যা সমস্ত SSH ট্র্যাফিককে ডিফল্ট নেটওয়ার্কে প্রবেশের অনুমতি দেয়।
কমান্ড লাইন ব্যবহার করে:
gcloud beta compute --project={PROJECT_ID} firewall-rules create default-allow-ssh --direction=INGRESS --priority=1000 --network=default --action=ALLOW --rules=tcp:22 --source-ranges=0.0.0.0/0 --enable-logging
UI ব্যবহার করে: Create Firewall Rule এ ক্লিক করুন এবং তথ্য পূরণ করুন:


৪. পাইপলাইনের জন্য নোড তৈরি করুন
এখন যেহেতু আমাদের GCP-তে ক্লাউড ডেটা ফিউশন পরিবেশ আছে, আসুন নিম্নলিখিত পদক্ষেপগুলি ব্যবহার করে ক্লাউড ডেটা ফিউশনে ডেটা পাইপলাইন তৈরি করা শুরু করি:
- ক্লাউড ডেটা ফিউশন উইন্ডোতে, অ্যাকশন কলামে ভিউ ইনস্ট্যান্স লিঙ্কে ক্লিক করুন। আপনাকে অন্য একটি পৃষ্ঠায় পুনঃনির্দেশিত করা হবে। ক্লাউড ডেটা ফিউশন ইনস্ট্যান্স খুলতে প্রদত্ত URL এ ক্লিক করুন। আপনার পছন্দ "Start Tour" অথবা Welcome পপআপে "No, Thanks" বোতামে ক্লিক করা।
- "হ্যামবার্গার" মেনুটি প্রসারিত করুন, পাইপলাইন -> তালিকা নির্বাচন করুন

- উপরের ডান কোণে সবুজ + বোতামে ক্লিক করুন, তারপর Create Pipeline নির্বাচন করুন। অথবা "Create" a pipeline লিঙ্কে ক্লিক করুন।


- পাইপলাইন স্টুডিওটি প্রদর্শিত হলে, উপরের বাম দিকে, ড্রপডাউন থেকে ডেটা পাইপলাইন - রিয়েলটাইম নির্বাচন করুন।

- ডেটা পাইপলাইন UI-তে, আপনি বাম প্যানেলে ফিল্টার, সোর্স, ট্রান্সফর্ম, অ্যানালিটিক্স, সিঙ্ক, এরর হ্যান্ডলার এবং অ্যালার্ট হিসাবে বিভিন্ন বিভাগ দেখতে পাবেন যেখানে আপনি পাইপলাইনের জন্য একটি নোড বা নোড নির্বাচন করতে পারবেন।

একটি সোর্স নোড নির্বাচন করুন।
- বাম দিকের প্লাগইন প্যালেটের সোর্স বিভাগের অধীনে, ডেটা পাইপলাইনস UI-তে প্রদর্শিত Google Cloud PubSub নোডে ডাবল-ক্লিক করুন।
- PubSub সোর্স নোডের দিকে নির্দেশ করুন এবং Properties এ ক্লিক করুন।

- প্রয়োজনীয় ক্ষেত্রগুলি পূরণ করুন। নিম্নলিখিত ক্ষেত্রগুলি সেট করুন:
- লেবেল = {যেকোনো লেখা}
- রেফারেন্স নাম = {যেকোনো লেখা}
- প্রকল্প আইডি = স্বয়ংক্রিয় সনাক্তকরণ
- সাবস্ক্রিপশন = পাব/সাব টপিক তৈরি বিভাগে তৈরি সাবস্ক্রিপশন (উদাহরণস্বরূপ, your-sub )
- টপিক = পাব/সাব টপিক তৈরি বিভাগে তৈরি করা টপিক (উদাহরণস্বরূপ, your-topic )
- বিস্তারিত ব্যাখ্যার জন্য ডকুমেন্টেশনে ক্লিক করুন। সমস্ত ইনপুট তথ্য যাচাই করতে ভ্যালিডেট বোতামে ক্লিক করুন। সবুজ "কোনও ত্রুটি পাওয়া যায়নি" সাফল্য নির্দেশ করে।

- পাব/সাব প্রোপার্টি বন্ধ করতে, X বোতামে ক্লিক করুন।
ট্রান্সফর্ম নোড নির্বাচন করুন।
- বাম দিকের প্লাগইন প্যালেটের ট্রান্সফর্ম বিভাগের অধীনে, ডেটা পাইপলাইনস UI-তে প্রদর্শিত প্রোজেকশন নোডটিতে ডাবল-ক্লিক করুন। Pub/Sub সোর্স নোডকে প্রোজেকশন ট্রান্সফর্ম নোডের সাথে সংযুক্ত করুন।
- প্রজেকশন নোডের দিকে নির্দেশ করুন এবং Properties এ ক্লিক করুন।

- প্রয়োজনীয় ক্ষেত্রগুলি পূরণ করুন। নিম্নলিখিত ক্ষেত্রগুলি সেট করুন:
- রূপান্তর = বার্তাকে বাইট টাইপ থেকে স্ট্রিং টাইপে রূপান্তর করা।
- বাদ দেওয়ার জন্য ক্ষেত্র = {যেকোনো ক্ষেত্র}
- রাখার জন্য ক্ষেত্র = { message , timestamp , and attributes } ( উদাহরণস্বরূপ, attributes: key='filename':value='patients' Pub/Sub থেকে পাঠানো হয়েছে)
- পুনঃনামকরণের জন্য ক্ষেত্রগুলি = { বার্তা , টাইমস্ট্যাম্প }
- বিস্তারিত ব্যাখ্যার জন্য ডকুমেন্টেশনে ক্লিক করুন। সমস্ত ইনপুট তথ্য যাচাই করতে ভ্যালিডেট বোতামে ক্লিক করুন। সবুজ "কোনও ত্রুটি পাওয়া যায়নি" সাফল্য নির্দেশ করে।

- বাম দিকের প্লাগইন প্যালেটের ট্রান্সফর্ম বিভাগের অধীনে, ডাটা পাইপলাইনস UI-তে প্রদর্শিত Wrangler node-এ ডাবল ক্লিক করুন। Projection transform node-কে Wrangler transform node-এর সাথে সংযুক্ত করুন। Wrangler node-এর দিকে নির্দেশ করুন এবং Properties-এ ক্লিক করুন।

- একটি সংরক্ষিত স্কিমা আমদানি করতে অ্যাকশনস ড্রপ ডাউনে ক্লিক করুন এবং আমদানি নির্বাচন করুন (উদাহরণস্বরূপ: gs://hcls_testing_data_fhir_10_patients/csv_schemas/ schema (Patients).json )।
- আউটপুট স্কিমায় (যদি এটি বিদ্যমান না থাকে) TIMESTAMP ফিল্ডটি যোগ করুন, শেষ ফিল্ডের পাশে + বোতামে ক্লিক করুন এবং 'Null' বক্সটি চেক করুন।
- প্রয়োজনীয় ক্ষেত্রগুলি পূরণ করুন। নিম্নলিখিত ক্ষেত্রগুলি সেট করুন:
- লেবেল = {যেকোনো লেখা}
- ইনপুট ক্ষেত্রের নাম = {*}
- PubSub সোর্স নোড থেকে প্রেরিত প্রতিটি ধরণের রেকর্ড বা বার্তা ( যেমন, রোগী, প্রদানকারী, অ্যালার্জি ইত্যাদি ) আলাদা করার জন্য Precondition = { attributes.get("filename") != "patients" }।
- বিস্তারিত ব্যাখ্যার জন্য ডকুমেন্টেশনে ক্লিক করুন। সমস্ত ইনপুট তথ্য যাচাই করতে ভ্যালিডেট বোতামে ক্লিক করুন। সবুজ "কোনও ত্রুটি পাওয়া যায়নি" সাফল্য নির্দেশ করে।

- কলামের নামগুলি পছন্দের ক্রমে সেট করুন এবং আপনার প্রয়োজন নেই এমন ক্ষেত্রগুলি বাদ দিন। নিম্নলিখিত কোড স্নিপেটটি কপি করুন এবং রেসিপি বাক্সে পেস্ট করুন।
drop attributes parse-as-csv :body ',' false drop body set columns TIMESTAMP,Id,BIRTHDATE,DEATHDATE,SSN,DRIVERS,PASSPORT,PREFIX,FIRST,LAST,SUFFIX,MAIDEN,MARITAL,RACE,ETHNICITY,GENDER,BIRTHPLACE,ADDRESS,CITY,STATE,ZIP mask-number SSN xxxxxxx####

- ডেটা মাস্কিং এবং ডি-আইডেন্টিফিকেশনের জন্য Batch-Codelab - CSV থেকে BigQuery via CDF দেখুন। অথবা রেসিপি বাক্সে এই কোড স্নিপেট মাস্ক-নম্বর SSN xxxxxxx#### যোগ করুন।
- ট্রান্সফর্ম প্রোপার্টিজ উইন্ডোটি বন্ধ করতে, X বোতামটি ক্লিক করুন।
সিঙ্ক নোড নির্বাচন করুন।
- বাম দিকের প্লাগইন প্যালেটের সিঙ্ক বিভাগের অধীনে, ডেটা পাইপলাইন UI-তে প্রদর্শিত BigQuery নোডটিতে ডাবল ক্লিক করুন। র্যাংলার ট্রান্সফর্ম নোডকে BigQuery সিঙ্ক নোডের সাথে সংযুক্ত করুন।
- BigQuery সিঙ্ক নোডের দিকে নির্দেশ করুন এবং Properties-এ ক্লিক করুন।

- প্রয়োজনীয় ক্ষেত্রগুলি পূরণ করুন:
- লেবেল = {যেকোনো লেখা}
- রেফারেন্স নাম = {যেকোনো লেখা}
- প্রকল্প আইডি = স্বয়ংক্রিয় সনাক্তকরণ
- ডেটাসেট = বর্তমান প্রকল্পে ব্যবহৃত BigQuery ডেটাসেট (উদাহরণস্বরূপ, DATASET_ID)
- টেবিল = {টেবিলের নাম}
- বিস্তারিত ব্যাখ্যার জন্য ডকুমেন্টেশনে ক্লিক করুন। সমস্ত ইনপুট তথ্য যাচাই করতে ভ্যালিডেট বোতামে ক্লিক করুন। সবুজ "কোনও ত্রুটি পাওয়া যায়নি" সাফল্য নির্দেশ করে।

- BigQuery প্রোপার্টি বন্ধ করতে, X বোতামে ক্লিক করুন।
৫. রিয়েল টাইম ডেটা পাইপলাইন তৈরি করুন
পূর্ববর্তী বিভাগে আমরা ক্লাউড ডেটা ফিউশনে ডেটা পাইপলাইন তৈরির জন্য প্রয়োজনীয় নোড তৈরি করেছি। এই বিভাগে আমরা প্রকৃত পাইপলাইন তৈরির জন্য নোডগুলিকে সংযুক্ত করব।
একটি পাইপলাইনে সমস্ত নোড সংযুক্ত করা
- সোর্স নোডের ডান প্রান্তে একটি সংযোগ তীর > টেনে আনুন এবং গন্তব্য নোডের বাম প্রান্তে ফেলে দিন।
- একটি পাইপলাইনে একাধিক শাখা থাকতে পারে যা একই PubSub সোর্স নোড থেকে প্রকাশিত বার্তা পায়।

- পাইপলাইনটির নাম বল।
এই তো। তুমি তোমার প্রথম রিয়েল টাইম ডেটা পাইপলাইন তৈরি করেছো যা স্থাপন এবং চালানো হবে।
ক্লাউড পাব/সাবের মাধ্যমে বার্তা পাঠান
পাব/সাব UI ব্যবহার করে:
- GCP কনসোল -> Pub/Sub -> Topics-এ নেভিগেট করুন, your-topic নির্বাচন করুন, তারপর উপরের মেনুতে PUBLISH MESSAGE-এ ক্লিক করুন।

- বার্তা ক্ষেত্রে একবারে শুধুমাত্র একটি রেকর্ড সারি রাখুন। +ADD AN ATTRIBUTE বোতামে ক্লিক করুন। Provide Key = filename , Value = < type of record > ( যেমন, রোগী, প্রদানকারী, অ্যালার্জি ইত্যাদি )।
- বার্তাটি পাঠাতে প্রকাশ করুন বোতামে ক্লিক করুন।
gcloud কমান্ড ব্যবহার করে:
- ম্যানুয়ালি বার্তাটি প্রদান করুন।
gcloud pubsub topics publish <your-topic> --attribute <key>=<value> --message \ "paste one record row here"
- cat এবং sed unix কমান্ড ব্যবহার করে আধা-স্বয়ংক্রিয়ভাবে বার্তা প্রদান করুন। এই কমান্ডটি বিভিন্ন পরামিতি সহ বারবার চালানো যেতে পারে।
gcloud pubsub topics publish <your-topic> --attribute <key>=<value> --message \ "$(gsutil cat gs://$BUCKET_NAME/csv/<value>.csv | sed -n '#p')"
৬. পাইপলাইন কনফিগার, স্থাপন এবং চালান
এখন যেহেতু আমরা ডেটা পাইপলাইন তৈরি করেছি, আমরা এটি ক্লাউড ডেটা ফিউশনে স্থাপন এবং চালাতে পারি।

- কনফিগার ডিফল্ট রাখুন।
- ডেটা** প্রিভিউ করতে Preview-এ ক্লিক করুন।** পূর্ববর্তী উইন্ডোতে ফিরে যেতে আবার **Preview** এ ক্লিক করুন। আপনি **RUN** ক্লিক করে Preview মোডে পাইপলাইনটি চালাতে পারেন।

- লগ দেখতে লগ-এ ক্লিক করুন।
- সকল পরিবর্তন সংরক্ষণ করতে সংরক্ষণ করুন- এ ক্লিক করুন।
- নতুন পাইপলাইন তৈরি করার সময় সংরক্ষিত পাইপলাইন কনফিগারেশন আমদানি করতে আমদানিতে ক্লিক করুন।
- পাইপলাইন কনফিগারেশন এক্সপোর্ট করতে এক্সপোর্ট ক্লিক করুন।
- পাইপলাইন স্থাপন করতে Deploy এ ক্লিক করুন।
- একবার স্থাপন করা হলে, Run এ ক্লিক করুন এবং পাইপলাইনটি সম্পূর্ণ হওয়ার জন্য অপেক্ষা করুন।

- যেকোনো সময় পাইপলাইন চালানো বন্ধ করতে Stop এ ক্লিক করুন।
- আপনি Actions বোতামের নিচে "Duplicate" নির্বাচন করে পাইপলাইনটি ডুপ্লিকেট করতে পারেন।
- আপনি অ্যাকশন বোতামের অধীনে এক্সপোর্ট নির্বাচন করে পাইপলাইন কনফিগারেশন এক্সপোর্ট করতে পারেন।

- রান ইতিহাস, রেকর্ড, ত্রুটি লগ এবং সতর্কতার চার্ট দেখাতে সারাংশে ক্লিক করুন।
৭. বৈধতা
এই বিভাগে আমরা ডেটা পাইপলাইনের সম্পাদন যাচাই করব।
- পাইপলাইনটি সফলভাবে সম্পাদিত হয়েছে এবং ধারাবাহিকভাবে চলছে কিনা তা যাচাই করুন।

- TIMESTAMP-এর উপর ভিত্তি করে BigQuery টেবিলগুলিতে আপডেট করা রেকর্ড রয়েছে কিনা তা যাচাই করুন। এই উদাহরণে, 2019-06-25 তারিখে Pub/Sub বিষয়ে দুটি রোগীর রেকর্ড বা বার্তা এবং একটি অ্যালার্জি রেকর্ড বা বার্তা প্রকাশিত হয়েছিল।
bq query --nouse_legacy_sql 'select (select count(*) from \ '$PROJECT_ID.$DATASET_ID.Patients' where TIMESTAMP > "2019-06-25 \ 01:29:00.0000 UTC" ) as Patients, (select count(*) from \ '$PROJECT_ID.$DATASET_ID.Allergies' where TIMESTAMP > "2019-06-25 \ 01:29:00.0000 UTC") as Allergies;'
Waiting on bqjob_r14c8b94c1c0fe06a_0000016b960df4e1_1 ... (0s) Current status: DONE
+----------+-----------+
| Patients | Allergies |
+----------+-----------+
| 2 | 1 |
+----------+-----------+
- <your-topic> এ প্রকাশিত বার্তাগুলি <your-sub> গ্রাহক দ্বারা গৃহীত হয়েছে কিনা তা যাচাই করুন।
gcloud pubsub subscriptions pull --auto-ack <your-sub>

ফলাফল দেখা
রিয়েলটাইম পাইপলাইন চলাকালীন পাব/সাব টপিকে বার্তা প্রকাশিত হওয়ার পরে ফলাফল দেখতে:
- BigQuery UI-তে টেবিলটি কোয়েরি করুন। BIGQUERY UI-তে যান।
- নিচের কোয়েরিটি আপনার নিজস্ব প্রকল্পের নাম, ডেটাসেট এবং টেবিলে আপডেট করুন।

৮. পরিষ্কার করা
এই টিউটোরিয়ালে ব্যবহৃত রিসোর্সের জন্য আপনার Google ক্লাউড প্ল্যাটফর্ম অ্যাকাউন্টে চার্জ এড়াতে:
টিউটোরিয়ালটি শেষ করার পর, আপনি GCP-তে তৈরি করা রিসোর্সগুলি পরিষ্কার করতে পারেন যাতে সেগুলি কোটা দখল না করে এবং ভবিষ্যতে আপনাকে এর জন্য বিল করা না হয়। নিম্নলিখিত বিভাগগুলিতে এই রিসোর্সগুলি কীভাবে মুছবেন বা বন্ধ করবেন তা বর্ণনা করা হয়েছে।
BigQuery ডেটাসেট মুছে ফেলা হচ্ছে
এই টিউটোরিয়ালের অংশ হিসেবে আপনার তৈরি করা BigQuery ডেটাসেটটি মুছে ফেলার জন্য এই নির্দেশাবলী অনুসরণ করুন।
GCS বাকেট মুছে ফেলা হচ্ছে
এই টিউটোরিয়ালের অংশ হিসেবে আপনার তৈরি করা GCS বাকেটটি মুছে ফেলার জন্য এই নির্দেশাবলী অনুসরণ করুন।
ক্লাউড ডেটা ফিউশন ইনস্ট্যান্স মুছে ফেলা হচ্ছে
আপনার ক্লাউড ডেটা ফিউশন ইনস্ট্যান্স মুছে ফেলার জন্য এই নির্দেশাবলী অনুসরণ করুন।
প্রকল্পটি মুছে ফেলা হচ্ছে
বিলিং দূর করার সবচেয়ে সহজ উপায় হল টিউটোরিয়ালের জন্য তৈরি করা প্রকল্পটি মুছে ফেলা।
প্রকল্পটি মুছে ফেলার জন্য:
- GCP কনসোলে, প্রজেক্ট পৃষ্ঠায় যান। প্রজেক্ট পৃষ্ঠায় যান ।
- প্রকল্পের তালিকায়, আপনি যে প্রকল্পটি মুছতে চান তা নির্বাচন করুন এবং মুছুন ক্লিক করুন।
- ডায়ালগে, প্রজেক্ট আইডি টাইপ করুন, এবং তারপর প্রজেক্টটি মুছে ফেলতে Shut down এ ক্লিক করুন।
৯. অভিনন্দন
অভিনন্দন, আপনি ক্লাউড ডেটা ফিউশন ব্যবহার করে BigQuery-তে স্বাস্থ্যসেবা ডেটা প্রবেশের কোড ল্যাব সফলভাবে সম্পন্ন করেছেন।
আপনি Pub/Sub টপিকে CSV ডেটা প্রকাশ করেছেন এবং তারপর BigQuery-তে লোড করেছেন।
আপনি বাস্তব সময়ে স্বাস্থ্যসেবা তথ্য লোড, রূপান্তর এবং মাস্ক করার জন্য দৃশ্যত একটি ডেটা-ইন্টিগ্রেশন পাইপলাইন তৈরি করেছেন।
গুগল ক্লাউড প্ল্যাটফর্মে BigQuery দিয়ে আপনার স্বাস্থ্যসেবা ডেটা অ্যানালিটিক্স যাত্রা শুরু করার জন্য প্রয়োজনীয় মূল পদক্ষেপগুলি এখন আপনি জানেন।