ক্লাউড ডেটা ফিউশন ব্যবহার করে BigQuery-এ CSV (কমা-বিভক্ত মান) ডেটা ইনজেস্ট করুন - রিয়েল টাইম ইনজেশন

1. ভূমিকা

509db33558ae025.png সম্পর্কে

শেষ আপডেট: ২০২০-০২-২৮

এই কোডল্যাবটি রিয়েল টাইমে BigQuery-তে CSV ফর্ম্যাট করা স্বাস্থ্যসেবা ডেটা প্রবেশের জন্য একটি ডেটা ইনজেশন প্যাটার্ন প্রদর্শন করে। আমরা এই ল্যাবের জন্য ক্লাউড ডেটা ফিউশন রিয়েল টাইম ডেটা পাইপলাইন ব্যবহার করব। বাস্তবসম্মত স্বাস্থ্যসেবা পরীক্ষার ডেটা তৈরি করা হয়েছে এবং আপনার জন্য Google ক্লাউড স্টোরেজ বাকেটে (gs://hcls_testing_data_fhir_10_patients/csv/) উপলব্ধ করা হয়েছে।

এই কোড ল্যাবে আপনি শিখবেন:

  • ক্লাউড ডেটা ফিউশন ব্যবহার করে পাব/সাব থেকে বিগকুয়েরিতে CSV ডেটা (রিয়েল টাইম লোডিং) কীভাবে গ্রহণ করবেন।
  • ক্লাউড ডেটা ফিউশনে কীভাবে দৃশ্যত একটি ডেটা ইন্টিগ্রেশন পাইপলাইন তৈরি করবেন যাতে রিয়েল টাইমে স্বাস্থ্যসেবা ডেটা লোড, রূপান্তর এবং মাস্ক করা যায়

এই ডেমোটি চালানোর জন্য আপনার কী কী প্রয়োজন?

  • আপনার একটি GCP প্রকল্পে অ্যাক্সেস প্রয়োজন।
  • আপনাকে অবশ্যই GCP প্রকল্পের মালিকের ভূমিকায় নিযুক্ত করতে হবে।
  • হেডার সহ CSV ফর্ম্যাটে স্বাস্থ্যসেবা ডেটা।

যদি আপনার কোন GCP প্রকল্প না থাকে, তাহলে একটি নতুন GCP প্রকল্প তৈরি করতে এই পদক্ষেপগুলি অনুসরণ করুন।

CSV ফর্ম্যাটে স্বাস্থ্যসেবা তথ্য gs://hcls_testing_data_fhir_10_patients/csv/ এ GCS বাকেটে আগে থেকে লোড করা হয়েছে। প্রতিটি CSV রিসোর্স ফাইলের একটি অনন্য স্কিমা কাঠামো রয়েছে। উদাহরণস্বরূপ, Patients.csv এর Providers.csv এর চেয়ে আলাদা স্কিমা রয়েছে। আগে থেকে লোড করা স্কিমা ফাইলগুলি gs://hcls_testing_data_fhir_10_patients/csv_schemas এ পাওয়া যাবে।

যদি আপনার একটি নতুন ডেটাসেটের প্রয়োজন হয়, তাহলে আপনি সর্বদা SyntheaTM ব্যবহার করে এটি তৈরি করতে পারেন। তারপর, কপি ইনপুট ডেটা ধাপে বাকেট থেকে কপি করার পরিবর্তে এটি GCS-এ আপলোড করুন।

2. GCP প্রকল্প সেটআপ

আপনার পরিবেশের জন্য শেল ভেরিয়েবলগুলি আরম্ভ করুন।

PROJECT_ID খুঁজে পেতে, Identifying projects দেখুন।

<!-- CODELAB: Initialize shell variables ->
<!-- Your current GCP Project ID ->
export PROJECT_ID=<PROJECT_ID>
<!-- A new GCS Bucket in your current Project  - INPUT ->
export BUCKET_NAME=<BUCKET_NAME>
<!-- A new BQ Dataset ID - OUTPUT ->
export DATASET_ID=<DATASET_ID>

gsutil টুল ব্যবহার করে ইনপুট ডেটা এবং ত্রুটি লগ সংরক্ষণ করার জন্য একটি GCS বাকেট তৈরি করুন

gsutil mb -l us gs://$BUCKET_NAME

সিন্থেটিক ডেটাসেটে অ্যাক্সেস পান।

  1. ক্লাউড কনসোলে লগইন করার জন্য আপনি যে ইমেল ঠিকানাটি ব্যবহার করছেন, সেখান থেকে hcls-solutions-external+subscribe@google.com ঠিকানায় যোগদানের জন্য অনুরোধ জানিয়ে একটি ইমেল পাঠান।
  2. আপনি কীভাবে পদক্ষেপটি নিশ্চিত করবেন তার নির্দেশাবলী সহ একটি ইমেল পাবেন।
  3. গ্রুপে যোগদানের জন্য ইমেলের উত্তর দেওয়ার বিকল্পটি ব্যবহার করুন। 525a0fa752e0acae.png দ্বারা পোস্ট করা 1 অনুবাদ, বিস্তারিত সব অনুবাদ বোতাম।
  4. একবার আপনি নিশ্চিতকরণ ইমেলটি পেয়ে গেলে, আপনি কোডল্যাবের পরবর্তী ধাপে যেতে পারেন।

ইনপুট ডেটা কপি করুন।

gsutil -m cp -r gs://hcls_testing_data_fhir_10_patients/csv gs://$BUCKET_NAME

একটি BigQuery ডেটাসেট তৈরি করুন।

bq mk --location=us --dataset $PROJECT_ID:$DATASET_ID

গুগল ক্লাউড এসডিকে ইনস্টল এবং ইনিশিয়ালাইজ করুন এবং পাব বা সাব টপিক এবং সাবস্ক্রিপশন তৈরি করুন।

gcloud init
gcloud pubsub topics create your-topic
gcloud pubsub subscriptions create --topic your-topic your-sub

৩. ক্লাউড ডেটা ফিউশন এনভায়রনমেন্ট সেটআপ

ক্লাউড ডেটা ফিউশন API সক্ষম করতে এবং প্রয়োজনীয় অনুমতি প্রদান করতে এই পদক্ষেপগুলি অনুসরণ করুন:

API গুলি সক্ষম করুন

  1. GCP কনসোল API লাইব্রেরিতে যান।
  2. প্রকল্প তালিকা থেকে, আপনার প্রকল্পটি নির্বাচন করুন।
  3. API লাইব্রেরিতে, আপনি যে API টি সক্ষম করতে চান তা নির্বাচন করুন ( Cloud Data Fusion API, Cloud Pub/Sub API)। যদি আপনার API খুঁজে পেতে সাহায্যের প্রয়োজন হয়, তাহলে অনুসন্ধান ক্ষেত্র এবং ফিল্টারগুলি ব্যবহার করুন।
  4. API পৃষ্ঠায়, ENABLE এ ক্লিক করুন।

একটি ক্লাউড ডেটা ফিউশন ইনস্ট্যান্স তৈরি করুন

  1. GCP কনসোলে, আপনার ProjectID নির্বাচন করুন।
  2. বাম মেনু থেকে ডেটা ফিউশন নির্বাচন করুন, তারপর পৃষ্ঠার মাঝখানে (প্রথম সৃষ্টি) "একটি ইন্সট্যান্স তৈরি করুন" বোতামে ক্লিক করুন, অথবা উপরের মেনুতে (অতিরিক্ত সৃষ্টি) "একটি ইন্সট্যান্স তৈরি করুন" বোতামে ক্লিক করুন।

a828690ff3bf3c46.png সম্পর্কে

অনুসরণ

  1. উদাহরণের নাম দিন। Enterprise নির্বাচন করুন।

5af91e46917260ff.png সম্পর্কে

  1. তৈরি করুন বোতামে ক্লিক করুন।

ইনস্ট্যান্স অনুমতি সেট আপ করুন।

একটি ইনস্ট্যান্স তৈরি করার পরে, আপনার প্রকল্পের ইনস্ট্যান্স অনুমতির সাথে সম্পর্কিত পরিষেবা অ্যাকাউন্টটি প্রদান করতে নিম্নলিখিত পদক্ষেপগুলি ব্যবহার করুন:

  1. ইনস্ট্যান্সের নামে ক্লিক করে ইনস্ট্যান্সের বিস্তারিত পৃষ্ঠায় যান।

76ad691f795e1ab3.png সম্পর্কে

  1. পরিষেবা অ্যাকাউন্টটি কপি করুন।

6c91836afb72209d.png সম্পর্কে

  1. আপনার প্রকল্পের IAM পৃষ্ঠায় যান।
  2. IAM অনুমতি পৃষ্ঠায়, Add বোতামে ক্লিক করে পরিষেবা অ্যাকাউন্টটিকে Cloud Data Fusion API Service Agent ভূমিকা প্রদান করুন। New members ক্ষেত্রে "service account" পেস্ট করুন এবং Service Management -> Cloud Data Fusion API Server Agent role নির্বাচন করুন।

36f03d11c2a4ce0.png সম্পর্কে

  1. একটি পাব/সাব সাবস্ক্রাইবার ভূমিকা যোগ করতে + অন্য ভূমিকা যোগ করুন (অথবা ক্লাউড ডেটা ফিউশন API পরিষেবা এজেন্ট সম্পাদনা করুন) ক্লিক করুন।

b4bf5500b8cbe5f9.png সম্পর্কে

  1. সংরক্ষণ করুন ক্লিক করুন।

এই ধাপগুলি সম্পন্ন হয়ে গেলে, আপনি ক্লাউড ডেটা ফিউশন ইনস্ট্যান্স পৃষ্ঠায় ভিউ ইনস্ট্যান্স লিঙ্কে ক্লিক করে অথবা একটি ইনস্ট্যান্সের বিশদ পৃষ্ঠায় ক্লিক করে ক্লাউড ডেটা ফিউশন ব্যবহার শুরু করতে পারেন।

ফায়ারওয়াল নিয়ম সেট আপ করুন।

  1. ডিফল্ট-allow-ssh নিয়মটি বিদ্যমান কিনা তা পরীক্ষা করতে GCP কনসোল -> VPC নেটওয়ার্ক -> ফায়ারওয়াল নিয়মগুলিতে নেভিগেট করুন।

102adef44bbe3a45.png সম্পর্কে

  1. যদি না হয়, তাহলে একটি ফায়ারওয়াল নিয়ম যোগ করুন যা সমস্ত SSH ট্র্যাফিককে ডিফল্ট নেটওয়ার্কে প্রবেশের অনুমতি দেয়।

কমান্ড লাইন ব্যবহার করে:

gcloud beta compute --project={PROJECT_ID} firewall-rules create default-allow-ssh --direction=INGRESS --priority=1000 --network=default --action=ALLOW --rules=tcp:22 --source-ranges=0.0.0.0/0 --enable-logging

UI ব্যবহার করে: Create Firewall Rule এ ক্লিক করুন এবং তথ্য পূরণ করুন:

d9c69ac10496b3d9.png সম্পর্কে

2dc4971594b82a1f.png সম্পর্কে

৪. পাইপলাইনের জন্য নোড তৈরি করুন

এখন যেহেতু আমাদের GCP-তে ক্লাউড ডেটা ফিউশন পরিবেশ আছে, আসুন নিম্নলিখিত পদক্ষেপগুলি ব্যবহার করে ক্লাউড ডেটা ফিউশনে ডেটা পাইপলাইন তৈরি করা শুরু করি:

  1. ক্লাউড ডেটা ফিউশন উইন্ডোতে, অ্যাকশন কলামে ভিউ ইনস্ট্যান্স লিঙ্কে ক্লিক করুন। আপনাকে অন্য একটি পৃষ্ঠায় পুনঃনির্দেশিত করা হবে। ক্লাউড ডেটা ফিউশন ইনস্ট্যান্স খুলতে প্রদত্ত URL এ ক্লিক করুন। আপনার পছন্দ "Start Tour" অথবা Welcome পপআপে "No, Thanks" বোতামে ক্লিক করা।
  2. "হ্যামবার্গার" মেনুটি প্রসারিত করুন, পাইপলাইন -> তালিকা নির্বাচন করুন

317820def934a00a.png সম্পর্কে

  1. উপরের ডান কোণে সবুজ + বোতামে ক্লিক করুন, তারপর Create Pipeline নির্বাচন করুন। অথবা "Create" a pipeline লিঙ্কে ক্লিক করুন।

711975bb2c2416d7.png সম্পর্কে

3ec0a71409657fb8.png সম্পর্কে

  1. পাইপলাইন স্টুডিওটি প্রদর্শিত হলে, উপরের বাম দিকে, ড্রপডাউন থেকে ডেটা পাইপলাইন - রিয়েলটাইম নির্বাচন করুন।

372a889a81da5e66.png সম্পর্কে

  1. ডেটা পাইপলাইন UI-তে, আপনি বাম প্যানেলে ফিল্টার, সোর্স, ট্রান্সফর্ম, অ্যানালিটিক্স, সিঙ্ক, এরর হ্যান্ডলার এবং অ্যালার্ট হিসাবে বিভিন্ন বিভাগ দেখতে পাবেন যেখানে আপনি পাইপলাইনের জন্য একটি নোড বা নোড নির্বাচন করতে পারবেন।

c63de071d4580f2f.png সম্পর্কে

একটি সোর্স নোড নির্বাচন করুন।

  1. বাম দিকের প্লাগইন প্যালেটের সোর্স বিভাগের অধীনে, ডেটা পাইপলাইনস UI-তে প্রদর্শিত Google Cloud PubSub নোডে ডাবল-ক্লিক করুন।
  2. PubSub সোর্স নোডের দিকে নির্দেশ করুন এবং Properties এ ক্লিক করুন।

ed857a5134148d7b.png সম্পর্কে

  1. প্রয়োজনীয় ক্ষেত্রগুলি পূরণ করুন। নিম্নলিখিত ক্ষেত্রগুলি সেট করুন:
  • লেবেল = {যেকোনো লেখা}
  • রেফারেন্স নাম = {যেকোনো লেখা}
  • প্রকল্প আইডি = স্বয়ংক্রিয় সনাক্তকরণ
  • সাবস্ক্রিপশন = পাব/সাব টপিক তৈরি বিভাগে তৈরি সাবস্ক্রিপশন (উদাহরণস্বরূপ, your-sub )
  • টপিক = পাব/সাব টপিক তৈরি বিভাগে তৈরি করা টপিক (উদাহরণস্বরূপ, your-topic )
  1. বিস্তারিত ব্যাখ্যার জন্য ডকুমেন্টেশনে ক্লিক করুন। সমস্ত ইনপুট তথ্য যাচাই করতে ভ্যালিডেট বোতামে ক্লিক করুন। সবুজ "কোনও ত্রুটি পাওয়া যায়নি" সাফল্য নির্দেশ করে।

5c2774338b66bebe.png সম্পর্কে

  1. পাব/সাব প্রোপার্টি বন্ধ করতে, X বোতামে ক্লিক করুন।

ট্রান্সফর্ম নোড নির্বাচন করুন।

  1. বাম দিকের প্লাগইন প্যালেটের ট্রান্সফর্ম বিভাগের অধীনে, ডেটা পাইপলাইনস UI-তে প্রদর্শিত প্রোজেকশন নোডটিতে ডাবল-ক্লিক করুন। Pub/Sub সোর্স নোডকে প্রোজেকশন ট্রান্সফর্ম নোডের সাথে সংযুক্ত করুন।
  2. প্রজেকশন নোডের দিকে নির্দেশ করুন এবং Properties এ ক্লিক করুন।

b3a9a3878879bfd7.png সম্পর্কে

  1. প্রয়োজনীয় ক্ষেত্রগুলি পূরণ করুন। নিম্নলিখিত ক্ষেত্রগুলি সেট করুন:
  • রূপান্তর = বার্তাকে বাইট টাইপ থেকে স্ট্রিং টাইপে রূপান্তর করা।
  • বাদ দেওয়ার জন্য ক্ষেত্র = {যেকোনো ক্ষেত্র}
  • রাখার জন্য ক্ষেত্র = { message , timestamp , and attributes } ( উদাহরণস্বরূপ, attributes: key='filename':value='patients' Pub/Sub থেকে পাঠানো হয়েছে)
  • পুনঃনামকরণের জন্য ক্ষেত্রগুলি = { বার্তা , টাইমস্ট্যাম্প }
  1. বিস্তারিত ব্যাখ্যার জন্য ডকুমেন্টেশনে ক্লিক করুন। সমস্ত ইনপুট তথ্য যাচাই করতে ভ্যালিডেট বোতামে ক্লিক করুন। সবুজ "কোনও ত্রুটি পাওয়া যায়নি" সাফল্য নির্দেশ করে।

অনুসরণ

  1. বাম দিকের প্লাগইন প্যালেটের ট্রান্সফর্ম বিভাগের অধীনে, ডাটা পাইপলাইনস UI-তে প্রদর্শিত Wrangler node-এ ডাবল ক্লিক করুন। Projection transform node-কে Wrangler transform node-এর সাথে সংযুক্ত করুন। Wrangler node-এর দিকে নির্দেশ করুন এবং Properties-এ ক্লিক করুন।

aa44a4db5fe6623a.png সম্পর্কে

  1. একটি সংরক্ষিত স্কিমা আমদানি করতে অ্যাকশনস ড্রপ ডাউনে ক্লিক করুন এবং আমদানি নির্বাচন করুন (উদাহরণস্বরূপ: gs://hcls_testing_data_fhir_10_patients/csv_schemas/ schema (Patients).json )।
  2. আউটপুট স্কিমায় (যদি এটি বিদ্যমান না থাকে) TIMESTAMP ফিল্ডটি যোগ করুন, শেষ ফিল্ডের পাশে + বোতামে ক্লিক করুন এবং 'Null' বক্সটি চেক করুন।
  3. প্রয়োজনীয় ক্ষেত্রগুলি পূরণ করুন। নিম্নলিখিত ক্ষেত্রগুলি সেট করুন:
  • লেবেল = {যেকোনো লেখা}
  • ইনপুট ক্ষেত্রের নাম = {*}
  • PubSub সোর্স নোড থেকে প্রেরিত প্রতিটি ধরণের রেকর্ড বা বার্তা ( যেমন, রোগী, প্রদানকারী, অ্যালার্জি ইত্যাদি ) আলাদা করার জন্য Precondition = { attributes.get("filename") != "patients" }।
  1. বিস্তারিত ব্যাখ্যার জন্য ডকুমেন্টেশনে ক্লিক করুন। সমস্ত ইনপুট তথ্য যাচাই করতে ভ্যালিডেট বোতামে ক্লিক করুন। সবুজ "কোনও ত্রুটি পাওয়া যায়নি" সাফল্য নির্দেশ করে।

3b8e552cd2e3442c.png সম্পর্কে

  1. কলামের নামগুলি পছন্দের ক্রমে সেট করুন এবং আপনার প্রয়োজন নেই এমন ক্ষেত্রগুলি বাদ দিন। নিম্নলিখিত কোড স্নিপেটটি কপি করুন এবং রেসিপি বাক্সে পেস্ট করুন।
drop attributes
parse-as-csv :body ',' false
drop body
set columns TIMESTAMP,Id,BIRTHDATE,DEATHDATE,SSN,DRIVERS,PASSPORT,PREFIX,FIRST,LAST,SUFFIX,MAIDEN,MARITAL,RACE,ETHNICITY,GENDER,BIRTHPLACE,ADDRESS,CITY,STATE,ZIP
mask-number SSN xxxxxxx####

b93cb9952ca2de73.png সম্পর্কে

  1. ডেটা মাস্কিং এবং ডি-আইডেন্টিফিকেশনের জন্য Batch-Codelab - CSV থেকে BigQuery via CDF দেখুন। অথবা রেসিপি বাক্সে এই কোড স্নিপেট মাস্ক-নম্বর SSN xxxxxxx#### যোগ করুন।
  2. ট্রান্সফর্ম প্রোপার্টিজ উইন্ডোটি বন্ধ করতে, X বোতামটি ক্লিক করুন।

সিঙ্ক নোড নির্বাচন করুন।

  1. বাম দিকের প্লাগইন প্যালেটের সিঙ্ক বিভাগের অধীনে, ডেটা পাইপলাইন UI-তে প্রদর্শিত BigQuery নোডটিতে ডাবল ক্লিক করুন। র‍্যাংলার ট্রান্সফর্ম নোডকে BigQuery সিঙ্ক নোডের সাথে সংযুক্ত করুন।
  2. BigQuery সিঙ্ক নোডের দিকে নির্দেশ করুন এবং Properties-এ ক্লিক করুন।

1be711152c92c692.png সম্পর্কে

  1. প্রয়োজনীয় ক্ষেত্রগুলি পূরণ করুন:
  • লেবেল = {যেকোনো লেখা}
  • রেফারেন্স নাম = {যেকোনো লেখা}
  • প্রকল্প আইডি = স্বয়ংক্রিয় সনাক্তকরণ
  • ডেটাসেট = বর্তমান প্রকল্পে ব্যবহৃত BigQuery ডেটাসেট (উদাহরণস্বরূপ, DATASET_ID)
  • টেবিল = {টেবিলের নাম}
  1. বিস্তারিত ব্যাখ্যার জন্য ডকুমেন্টেশনে ক্লিক করুন। সমস্ত ইনপুট তথ্য যাচাই করতে ভ্যালিডেট বোতামে ক্লিক করুন। সবুজ "কোনও ত্রুটি পাওয়া যায়নি" সাফল্য নির্দেশ করে।

bba71de9f31e842a.png সম্পর্কে

  1. BigQuery প্রোপার্টি বন্ধ করতে, X বোতামে ক্লিক করুন।

৫. রিয়েল টাইম ডেটা পাইপলাইন তৈরি করুন

পূর্ববর্তী বিভাগে আমরা ক্লাউড ডেটা ফিউশনে ডেটা পাইপলাইন তৈরির জন্য প্রয়োজনীয় নোড তৈরি করেছি। এই বিভাগে আমরা প্রকৃত পাইপলাইন তৈরির জন্য নোডগুলিকে সংযুক্ত করব।

একটি পাইপলাইনে সমস্ত নোড সংযুক্ত করা

  1. সোর্স নোডের ডান প্রান্তে একটি সংযোগ তীর > টেনে আনুন এবং গন্তব্য নোডের বাম প্রান্তে ফেলে দিন।
  2. একটি পাইপলাইনে একাধিক শাখা থাকতে পারে যা একই PubSub সোর্স নোড থেকে প্রকাশিত বার্তা পায়।

b22908cc35364cdd.png সম্পর্কে

  1. পাইপলাইনটির নাম বল।

এই তো। তুমি তোমার প্রথম রিয়েল টাইম ডেটা পাইপলাইন তৈরি করেছো যা স্থাপন এবং চালানো হবে।

ক্লাউড পাব/সাবের মাধ্যমে বার্তা পাঠান

পাব/সাব UI ব্যবহার করে:

  1. GCP কনসোল -> Pub/Sub -> Topics-এ নেভিগেট করুন, your-topic নির্বাচন করুন, তারপর উপরের মেনুতে PUBLISH MESSAGE-এ ক্লিক করুন।

d65b2a6af1668ecd.png সম্পর্কে

  1. বার্তা ক্ষেত্রে একবারে শুধুমাত্র একটি রেকর্ড সারি রাখুন। +ADD AN ATTRIBUTE বোতামে ক্লিক করুন। Provide Key = filename , Value = < type of record > ( যেমন, রোগী, প্রদানকারী, অ্যালার্জি ইত্যাদি )।
  2. বার্তাটি পাঠাতে প্রকাশ করুন বোতামে ক্লিক করুন।

gcloud কমান্ড ব্যবহার করে:

  1. ম্যানুয়ালি বার্তাটি প্রদান করুন।
gcloud pubsub topics publish <your-topic> --attribute <key>=<value> --message \
"paste one record row here"
  1. cat এবং sed unix কমান্ড ব্যবহার করে আধা-স্বয়ংক্রিয়ভাবে বার্তা প্রদান করুন। এই কমান্ডটি বিভিন্ন পরামিতি সহ বারবার চালানো যেতে পারে।
gcloud pubsub topics publish <your-topic> --attribute <key>=<value> --message \
"$(gsutil cat gs://$BUCKET_NAME/csv/<value>.csv | sed -n '#p')"

৬. পাইপলাইন কনফিগার, স্থাপন এবং চালান

এখন যেহেতু আমরা ডেটা পাইপলাইন তৈরি করেছি, আমরা এটি ক্লাউড ডেটা ফিউশনে স্থাপন এবং চালাতে পারি।

অনুসরণ

  1. কনফিগার ডিফল্ট রাখুন।
  2. ডেটা** প্রিভিউ করতে Preview-এ ক্লিক করুন।** পূর্ববর্তী উইন্ডোতে ফিরে যেতে আবার **Preview** এ ক্লিক করুন। আপনি **RUN** ক্লিক করে Preview মোডে পাইপলাইনটি চালাতে পারেন।

b3c891e5e1aa20ae.png সম্পর্কে

  1. লগ দেখতে লগ-এ ক্লিক করুন।
  2. সকল পরিবর্তন সংরক্ষণ করতে সংরক্ষণ করুন- এ ক্লিক করুন।
  3. নতুন পাইপলাইন তৈরি করার সময় সংরক্ষিত পাইপলাইন কনফিগারেশন আমদানি করতে আমদানিতে ক্লিক করুন।
  4. পাইপলাইন কনফিগারেশন এক্সপোর্ট করতে এক্সপোর্ট ক্লিক করুন।
  5. পাইপলাইন স্থাপন করতে Deploy এ ক্লিক করুন।
  6. একবার স্থাপন করা হলে, Run এ ক্লিক করুন এবং পাইপলাইনটি সম্পূর্ণ হওয়ার জন্য অপেক্ষা করুন।

f01ba6b746ba53a.png

  1. যেকোনো সময় পাইপলাইন চালানো বন্ধ করতে Stop এ ক্লিক করুন।
  2. আপনি Actions বোতামের নিচে "Duplicate" নির্বাচন করে পাইপলাইনটি ডুপ্লিকেট করতে পারেন।
  3. আপনি অ্যাকশন বোতামের অধীনে এক্সপোর্ট নির্বাচন করে পাইপলাইন কনফিগারেশন এক্সপোর্ট করতে পারেন।

অনুসরণ

  1. রান ইতিহাস, রেকর্ড, ত্রুটি লগ এবং সতর্কতার চার্ট দেখাতে সারাংশে ক্লিক করুন।

৭. বৈধতা

এই বিভাগে আমরা ডেটা পাইপলাইনের সম্পাদন যাচাই করব।

  1. পাইপলাইনটি সফলভাবে সম্পাদিত হয়েছে এবং ধারাবাহিকভাবে চলছে কিনা তা যাচাই করুন।

1644dfac4a2d819d.png সম্পর্কে

  1. TIMESTAMP-এর উপর ভিত্তি করে BigQuery টেবিলগুলিতে আপডেট করা রেকর্ড রয়েছে কিনা তা যাচাই করুন। এই উদাহরণে, 2019-06-25 তারিখে Pub/Sub বিষয়ে দুটি রোগীর রেকর্ড বা বার্তা এবং একটি অ্যালার্জি রেকর্ড বা বার্তা প্রকাশিত হয়েছিল।
bq query --nouse_legacy_sql 'select (select count(*) from \
'$PROJECT_ID.$DATASET_ID.Patients'  where TIMESTAMP > "2019-06-25 \
01:29:00.0000 UTC" ) as Patients, (select count(*) from \
'$PROJECT_ID.$DATASET_ID.Allergies' where TIMESTAMP > "2019-06-25 \
01:29:00.0000 UTC") as Allergies;'
Waiting on bqjob_r14c8b94c1c0fe06a_0000016b960df4e1_1 ... (0s) Current status: DONE  
+----------+-----------+
| Patients | Allergies |
+----------+-----------+
|        2 |         1 |
+----------+-----------+
  1. <your-topic> এ প্রকাশিত বার্তাগুলি <your-sub> গ্রাহক দ্বারা গৃহীত হয়েছে কিনা তা যাচাই করুন।
gcloud pubsub subscriptions pull --auto-ack <your-sub>

অনুসরণ

ফলাফল দেখা

রিয়েলটাইম পাইপলাইন চলাকালীন পাব/সাব টপিকে বার্তা প্রকাশিত হওয়ার পরে ফলাফল দেখতে:

  1. BigQuery UI-তে টেবিলটি কোয়েরি করুন। BIGQUERY UI-তে যান।
  2. নিচের কোয়েরিটি আপনার নিজস্ব প্রকল্পের নাম, ডেটাসেট এবং টেবিলে আপডেট করুন।

6a1fb85bd868abc9.png সম্পর্কে

৮. পরিষ্কার করা

এই টিউটোরিয়ালে ব্যবহৃত রিসোর্সের জন্য আপনার Google ক্লাউড প্ল্যাটফর্ম অ্যাকাউন্টে চার্জ এড়াতে:

টিউটোরিয়ালটি শেষ করার পর, আপনি GCP-তে তৈরি করা রিসোর্সগুলি পরিষ্কার করতে পারেন যাতে সেগুলি কোটা দখল না করে এবং ভবিষ্যতে আপনাকে এর জন্য বিল করা না হয়। নিম্নলিখিত বিভাগগুলিতে এই রিসোর্সগুলি কীভাবে মুছবেন বা বন্ধ করবেন তা বর্ণনা করা হয়েছে।

BigQuery ডেটাসেট মুছে ফেলা হচ্ছে

এই টিউটোরিয়ালের অংশ হিসেবে আপনার তৈরি করা BigQuery ডেটাসেটটি মুছে ফেলার জন্য এই নির্দেশাবলী অনুসরণ করুন।

GCS বাকেট মুছে ফেলা হচ্ছে

এই টিউটোরিয়ালের অংশ হিসেবে আপনার তৈরি করা GCS বাকেটটি মুছে ফেলার জন্য এই নির্দেশাবলী অনুসরণ করুন।

ক্লাউড ডেটা ফিউশন ইনস্ট্যান্স মুছে ফেলা হচ্ছে

আপনার ক্লাউড ডেটা ফিউশন ইনস্ট্যান্স মুছে ফেলার জন্য এই নির্দেশাবলী অনুসরণ করুন।

প্রকল্পটি মুছে ফেলা হচ্ছে

বিলিং দূর করার সবচেয়ে সহজ উপায় হল টিউটোরিয়ালের জন্য তৈরি করা প্রকল্পটি মুছে ফেলা।

প্রকল্পটি মুছে ফেলার জন্য:

  1. GCP কনসোলে, প্রজেক্ট পৃষ্ঠায় যান। প্রজেক্ট পৃষ্ঠায় যান
  2. প্রকল্পের তালিকায়, আপনি যে প্রকল্পটি মুছতে চান তা নির্বাচন করুন এবং মুছুন ক্লিক করুন।
  3. ডায়ালগে, প্রজেক্ট আইডি টাইপ করুন, এবং তারপর প্রজেক্টটি মুছে ফেলতে Shut down এ ক্লিক করুন।

৯. অভিনন্দন

অভিনন্দন, আপনি ক্লাউড ডেটা ফিউশন ব্যবহার করে BigQuery-তে স্বাস্থ্যসেবা ডেটা প্রবেশের কোড ল্যাব সফলভাবে সম্পন্ন করেছেন।

আপনি Pub/Sub টপিকে CSV ডেটা প্রকাশ করেছেন এবং তারপর BigQuery-তে লোড করেছেন।

আপনি বাস্তব সময়ে স্বাস্থ্যসেবা তথ্য লোড, রূপান্তর এবং মাস্ক করার জন্য দৃশ্যত একটি ডেটা-ইন্টিগ্রেশন পাইপলাইন তৈরি করেছেন।

গুগল ক্লাউড প্ল্যাটফর্মে BigQuery দিয়ে আপনার স্বাস্থ্যসেবা ডেটা অ্যানালিটিক্স যাত্রা শুরু করার জন্য প্রয়োজনীয় মূল পদক্ষেপগুলি এখন আপনি জানেন।