১. ভূমিকা
সংক্ষিপ্ত বিবরণ
এই ল্যাবে, আপনি এআই ডেভেলপমেন্টে ব্যবহৃত সংবেদনশীল তথ্য সুরক্ষিত করার জন্য একটি স্বয়ংক্রিয় ডেটা স্যানিটাইজেশন পাইপলাইন তৈরি করবেন। আপনি গুগল ক্লাউডের সেনসিটিভ ডেটা প্রোটেকশন (পূর্বের ক্লাউড ডিএলপি) ব্যবহার করে অসংগঠিত টেক্সট, সংগঠিত টেবিল এবং ছবি সহ বিভিন্ন ডেটা ফরম্যাটের ব্যক্তিগত শনাক্তকরণযোগ্য তথ্য (পিআইআই) নিরীক্ষা, শ্রেণীবদ্ধ এবং পরিচয়হীন করবেন।
প্রেক্ষাপট
আপনি আপনার ডেভেলপমেন্ট টিমের নিরাপত্তা ও গোপনীয়তার প্রধান ব্যক্তি, এবং আপনার লক্ষ্য হলো এমন একটি কর্মপ্রবাহ প্রতিষ্ঠা করা যা সংবেদনশীল তথ্য শনাক্ত করে এবং ডেভেলপার ও মডেলদের কাছে তা উপলব্ধ করার আগে সেটির পরিচয় গোপন করে। একটি নতুন জেনারেটিভ এআই অ্যাপ্লিকেশন টিউন ও পরীক্ষা করার জন্য আপনার টিমের বাস্তবসম্মত, উচ্চ-মানের ডেটা প্রয়োজন, কিন্তু গ্রাহকের সরাসরি ডেটা ব্যবহার করা গোপনীয়তার ক্ষেত্রে গুরুতর চ্যালেঞ্জ তৈরি করে।
নিম্নলিখিত সারণিতে সেইসব গোপনীয়তার ঝুঁকিগুলো তালিকাভুক্ত করা হয়েছে, যেগুলো প্রশমিত করার বিষয়ে আপনি সবচেয়ে বেশি উদ্বিগ্ন:
ঝুঁকি | প্রশমন |
অসংগঠিত টেক্সট ফাইলে ব্যক্তিগত শনাক্তকরণ তথ্যের (পিআইআই) প্রকাশ (যেমন, সাপোর্ট চ্যাট লগ, ফিডব্যাক ফর্ম)। | একটি ডি-আইডেন্টিফিকেশন টেমপ্লেট তৈরি করুন যা সংবেদনশীল মানগুলিকে তাদের infoType দিয়ে প্রতিস্থাপন করে, প্রসঙ্গ অক্ষুণ্ণ রাখে এবং তথ্য প্রকাশের ঝুঁকি দূর করে। |
কাঠামোগত ডেটাসেট (CSV) থেকে ব্যক্তিগত শনাক্তকারী তথ্য (PII) মুছে ফেলা হলে তথ্যের উপযোগিতা হ্রাস পায় । | রেকর্ড ট্রান্সফরমেশন ব্যবহার করে নাম-এর মতো আইডেন্টিফায়ারগুলো বেছে বেছে গোপন করুন এবং স্ট্রিং-এর অন্যান্য অক্ষর অক্ষুণ্ণ রাখতে ক্যারেক্টার মাস্কিং- এর মতো কৌশল প্রয়োগ করুন, যাতে ডেভেলপাররা ডেটা দিয়ে পরীক্ষা চালিয়ে যেতে পারেন। |
ছবিতে এমবেড করা টেক্সট থেকে ব্যক্তিগত শনাক্তকরণ তথ্যের (PII) প্রকাশ (যেমন, স্ক্যান করা ডকুমেন্ট, ব্যবহারকারীর ছবি)। | একটি ছবি-নির্দিষ্ট পরিচয় গোপনকরণ টেমপ্লেট তৈরি করুন যা ছবির মধ্যে থাকা লেখা মুছে ফেলবে। |
বিভিন্ন ডেটা টাইপের ক্ষেত্রে হাতে করা তথ্য গোপন করার প্রক্রিয়াটি অসামঞ্জস্যপূর্ণ বা ত্রুটিপূর্ণ । | একটি একক, স্বয়ংক্রিয় সংবেদনশীল ডেটা সুরক্ষা জব কনফিগার করুন যা প্রক্রিয়াকৃত ফাইলের ধরনের উপর ভিত্তি করে ধারাবাহিকভাবে সঠিক ডি-আইডেন্টিফিকেশন টেমপ্লেট প্রয়োগ করে। |
আপনি যা শিখবেন
এই ল্যাবে আপনি শিখবেন কীভাবে:
- নির্দিষ্ট সংবেদনশীল তথ্যের প্রকার ( infoTypes ) সনাক্ত করার জন্য একটি পরিদর্শন টেমপ্লেট সংজ্ঞায়িত করুন।
- অসংগঠিত, সংগঠিত এবং চিত্র ডেটার জন্য স্বতন্ত্র পরিচয় গোপনকরণ নিয়ম তৈরি করুন।
- এমন একটিমাত্র জব কনফিগার ও রান করুন যা ফাইলের ধরনের ওপর ভিত্তি করে একটি সম্পূর্ণ বাকেটের বিষয়বস্তুতে স্বয়ংক্রিয়ভাবে সঠিক গোপনীয়তা প্রয়োগ করে ।
- একটি সুরক্ষিত আউটপুট স্থানে সংবেদনশীল তথ্যের সফল রূপান্তর যাচাই করুন।
২. প্রজেক্ট সেটআপ
গুগল অ্যাকাউন্ট
যদি আপনার আগে থেকে কোনো ব্যক্তিগত গুগল অ্যাকাউন্ট না থাকে, তাহলে আপনাকে অবশ্যই একটি গুগল অ্যাকাউন্ট তৈরি করতে হবে।
কর্মক্ষেত্র বা শিক্ষা প্রতিষ্ঠানের অ্যাকাউন্টের পরিবর্তে ব্যক্তিগত অ্যাকাউন্ট ব্যবহার করুন ।
গুগল ক্লাউড কনসোলে সাইন-ইন করুন
আপনার ব্যক্তিগত গুগল অ্যাকাউন্ট ব্যবহার করে গুগল ক্লাউড কনসোলে সাইন-ইন করুন।
বিলিং সক্ষম করুন
$5 গুগল ক্লাউড ক্রেডিট রিডিম করুন (ঐচ্ছিক)
এই কর্মশালাটি চালানোর জন্য আপনার একটি বিলিং অ্যাকাউন্ট প্রয়োজন, যাতে কিছু ব্যালেন্স আছে। আপনি যদি আপনার নিজস্ব বিলিং ব্যবহার করার পরিকল্পনা করেন, তবে এই ধাপটি বাদ দিতে পারেন।
- এই লিঙ্কে ক্লিক করুন এবং আপনার ব্যক্তিগত গুগল অ্যাকাউন্ট দিয়ে সাইন ইন করুন। আপনি এইরকম কিছু দেখতে পাবেন:

- "আপনার ক্রেডিট অ্যাক্সেস করতে এখানে ক্লিক করুন" বোতামটিতে ক্লিক করুন। এটি আপনাকে আপনার বিলিং প্রোফাইল সেট আপ করার পৃষ্ঠায় নিয়ে যাবে।

- নিশ্চিত করুন-এ ক্লিক করুন। আপনি এখন একটি গুগল ক্লাউড প্ল্যাটফর্ম ট্রায়াল বিলিং অ্যাকাউন্টের সাথে সংযুক্ত হয়েছেন।

একটি ব্যক্তিগত বিলিং অ্যাকাউন্ট তৈরি করুন
আপনি যদি গুগল ক্লাউড ক্রেডিট ব্যবহার করে বিলিং সেট আপ করেন, তাহলে এই ধাপটি এড়িয়ে যেতে পারেন।
একটি ব্যক্তিগত বিলিং অ্যাকাউন্ট তৈরি করতে, ক্লাউড কনসোলে বিলিং চালু করার জন্য এখানে যান ।
কিছু নোট:
- এই ল্যাবটি সম্পন্ন করতে ক্লাউড রিসোর্সে ১ মার্কিন ডলারেরও কম খরচ হওয়া উচিত।
- পরবর্তী চার্জ এড়াতে, এই ল্যাবের শেষে দেওয়া ধাপগুলো অনুসরণ করে আপনি রিসোর্সগুলো মুছে ফেলতে পারেন।
- নতুন ব্যবহারকারীরা ৩০০ মার্কিন ডলারের ফ্রি ট্রায়ালের জন্য যোগ্য।
একটি প্রকল্প তৈরি করুন (ঐচ্ছিক)
এই ল্যাবের জন্য ব্যবহার করার মতো আপনার যদি কোনো চলমান প্রজেক্ট না থাকে, তাহলে এখানে একটি নতুন প্রজেক্ট তৈরি করুন ।
৩. এপিআইগুলো সক্রিয় করুন
ক্লাউড শেল কনফিগার করুন
আপনার প্রজেক্টটি সফলভাবে তৈরি হয়ে গেলে, ক্লাউড শেল সেট আপ করার জন্য নিচের ধাপগুলো অনুসরণ করুন।
ক্লাউড শেল চালু করুন
shell.cloud.google.com- এ যান এবং যদি অনুমোদনের জন্য কোনো পপআপ দেখতে পান, তাহলে Authorize- এ ক্লিক করুন।
প্রজেক্ট আইডি সেট করুন
সঠিক প্রজেক্ট আইডি সেট করতে ক্লাউড শেল টার্মিনালে নিম্নলিখিত কমান্ডটি চালান। <your-project-id> জায়গায় উপরের প্রজেক্ট তৈরির ধাপ থেকে কপি করা আপনার আসল প্রজেক্ট আইডিটি বসান।
gcloud config set project <your-project-id>
এখন আপনি দেখতে পাবেন যে ক্লাউড শেল টার্মিনালে সঠিক প্রজেক্টটি নির্বাচিত হয়েছে।
সংবেদনশীল ডেটা সুরক্ষা সক্রিয় করুন
সংবেদনশীল ডেটা সুরক্ষা পরিষেবা এবং ক্লাউড স্টোরেজ ব্যবহার করার জন্য, আপনাকে নিশ্চিত করতে হবে যে আপনার গুগল ক্লাউড প্রজেক্টে এই API-গুলো সক্রিয় করা আছে।
- টার্মিনালে, এপিআইগুলো সক্রিয় করুন:
gcloud services enable dlp.googleapis.com storage.googleapis.com
বিকল্পভাবে, আপনি কনসোলে Security > Sensitive Data Protection and Cloud Storage- এ গিয়ে এবং প্রতিটি পরিষেবার জন্য অনুরোধ করা হলে Enable বোতামে ক্লিক করে এই API-গুলি সক্রিয় করতে পারেন।
৪. সংবেদনশীল ডেটা সহ বাকেট তৈরি করুন
ইনপুট এবং আউটপুট বাকেট তৈরি করুন
এই ধাপে, আপনি দুটি বাকেট তৈরি করবেন: একটি পরিদর্শনের জন্য প্রয়োজনীয় সংবেদনশীল ডেটা রাখার জন্য, এবং অন্যটি যেখানে সংবেদনশীল ডেটা সুরক্ষা (Sensitive Data Protection) পরিচয়বিহীন আউটপুট ফাইলগুলো সংরক্ষণ করবে। এছাড়াও আপনি নমুনা ডেটা ফাইলগুলো ডাউনলোড করে আপনার ইনপুট বাকেটে আপলোড করবেন।
- টার্মিনালে, ইনপুট ডেটার জন্য একটি এবং আউটপুটের জন্য একটি বাকেট তৈরি করতে নিম্নলিখিত কমান্ডগুলি চালান, তারপর
gs://dlp-codelab-dataথেকে নমুনা ডেটা দিয়ে ইনপুট বাকেটটি পূরণ করুন:PROJECT_ID=$(gcloud config get-value project) gsutil mb gs://input-$PROJECT_ID gsutil mb gs://output-$PROJECT_ID
ইনপুট বাকেটে সংবেদনশীল ডেটা যোগ করুন
এই ধাপে, আপনি গিটহাব থেকে পরীক্ষার ব্যক্তিগত শনাক্তকরণ তথ্য (PII) সম্বলিত নমুনা ডেটা ফাইলগুলো ডাউনলোড করে আপনার ইনপুট বাকেটে আপলোড করবেন।
- ক্লাউড শেলে, এই ল্যাবের জন্য প্রয়োজনীয় নমুনা ডেটা সম্বলিত
devrel-demosরিপোজিটরিটি ক্লোন করতে নিম্নলিখিত কমান্ডটি চালান।REPO_URL="https://github.com/GoogleCloudPlatform/devrel-demos.git" TARGET_PATH="security/sample-data" OUTPUT_FOLDER="sample-data" git clone --quiet --depth 1 --filter=blob:none --sparse "$REPO_URL" temp_loader cd temp_loader git sparse-checkout set "$TARGET_PATH" cd .. mv "temp_loader/$TARGET_PATH" "$OUTPUT_FOLDER" rm -rf temp_loader - এরপর, নমুনা ডেটাগুলো আপনার আগে তৈরি করা ইনপুট বাকেটে কপি করুন:
gsutil -m cp -r sample-data/* gs://input-$PROJECT_ID/ - ক্লাউড স্টোরেজ > বাকেটস- এ যান এবং আপনার ইম্পোর্ট করা ডেটা দেখতে ইনপুট বাকেটটিতে ক্লিক করুন।
৫. একটি ইন্সপেক্ট টেমপ্লেট তৈরি করুন
এই টাস্কে, আপনাকে একটি টেমপ্লেট তৈরি করতে হবে যা সেনসিটিভ ডেটা প্রোটেকশনকে বলে দেবে কী খুঁজতে হবে। এর ফলে আপনি আপনার ডেটা ও ভৌগোলিক অবস্থানের সাথে প্রাসঙ্গিক ইনফোটাইপগুলোর ওপর অনুসন্ধানকে কেন্দ্রীভূত করতে পারবেন, যা পারফরম্যান্স ও নির্ভুলতা উন্নত করে।
একটি পরিদর্শন টেমপ্লেট তৈরি করুন
এই ধাপে, কোনগুলো সংবেদনশীল ডেটা হিসেবে গণ্য হবে এবং নিরীক্ষা করা প্রয়োজন, তার নিয়মাবলী আপনি নির্ধারণ করবেন। সামঞ্জস্য নিশ্চিত করার জন্য আপনার পরিচয় গোপন করার কাজগুলোতে এই টেমপ্লেটটি পুনরায় ব্যবহার করা হবে।
- নেভিগেশন মেনু থেকে, সংবেদনশীল ডেটা সুরক্ষা > কনফিগারেশন > টেমপ্লেট- এ যান।
- টেমপ্লেট তৈরি করুন -এ ক্লিক করুন।
- টেমপ্লেট টাইপের জন্য, ইন্সপেক্ট (সংবেদনশীল ডেটা খুঁজুন) নির্বাচন করুন।
- টেমপ্লেট আইডি
pii-finderএ সেট করুন। - সনাক্তকরণ কনফিগার করতে এগিয়ে যান ।
- তথ্য প্রকার পরিচালনা করুন- এ ক্লিক করুন।
- ফিল্টার ব্যবহার করে নিম্নলিখিত তথ্য প্রকারগুলি (infoTypes) অনুসন্ধান করুন এবং প্রতিটির পাশের চেকবক্সে টিক দিন:
-
CREDIT_CARD_EXPIRATION_DATE -
CREDIT_CARD_NUMBER -
DATE_OF_BIRTH -
DRIVERS_LICENSE_NUMBER -
EMAIL_ADDRESS -
GCP_API_KEY -
GCP_CREDENTIALS -
ORGANIZATION_NAME -
PASSWORD -
PERSON_NAME -
PHONE_NUMBER -
US_SOCIAL_SECURITY_NUMBER
-
- আপনার আগ্রহের অন্যগুলোও নির্বাচন করুন এবং 'সম্পন্ন' বোতামে ক্লিক করুন।
- ফলাফল টেবিলটি পরীক্ষা করে নিশ্চিত করুন যে এই সমস্ত infoType যোগ করা হয়েছে।
- তৈরি করুন- এ ক্লিক করুন।
৬. পরিচয় গোপন করার টেমপ্লেট তৈরি করুন
এরপরে, বিভিন্ন ডেটা ফরম্যাট সামলানোর জন্য আপনাকে তিনটি আলাদা ডি-আইডেন্টিফিকেশন টেমপ্লেট তৈরি করতে হবে। এটি আপনাকে রূপান্তর প্রক্রিয়ার উপর সূক্ষ্ম নিয়ন্ত্রণ দেয় এবং প্রতিটি ফাইলের ধরনের জন্য সবচেয়ে উপযুক্ত পদ্ধতি প্রয়োগ করে। এই টেমপ্লেটগুলো আপনার এইমাত্র তৈরি করা ইন্সপেক্ট টেমপ্লেটের সাথে একযোগে কাজ করে।
অসংগঠিত ডেটার জন্য একটি টেমপ্লেট তৈরি করুন
এই টেমপ্লেটটি নির্ধারণ করবে যে চ্যাট লগ বা ফিডব্যাক ফর্মের মতো মুক্ত-ফর্মের টেক্সটে থাকা সংবেদনশীল ডেটা কীভাবে পরিচয়হীন করা হবে। নির্বাচিত পদ্ধতিটি সংবেদনশীল মানটিকে তার infoType নাম দিয়ে প্রতিস্থাপন করে এবং এর প্রাসঙ্গিকতা বজায় রাখে।
- টেমপ্লেট পৃষ্ঠায়, টেমপ্লেট তৈরি করুন- এ ক্লিক করুন।
- পরিচয় গোপন করার টেমপ্লেটটি সংজ্ঞায়িত করুন:
সম্পত্তি
মান (টাইপ করুন বা নির্বাচন করুন)
টেমপ্লেট টাইপ
পরিচয় গোপন করুন (সংবেদনশীল তথ্য মুছে ফেলুন)
ডেটা রূপান্তরের ধরণ
তথ্য প্রকার
টেমপ্লেট আইডি
de-identify-unstructured - ডি-আইডেন্টিফিকেশন কনফিগার করতে এগিয়ে যান ।
- Transformation method-এর অধীনে, Transformation: Replace with infoType name নির্বাচন করুন।
- তৈরি করুন- এ ক্লিক করুন।
- টেস্ট-এ ক্লিক করুন।
- ব্যক্তিগত শনাক্তকরণ তথ্য (PII) সম্বলিত একটি বার্তা পরীক্ষা করে দেখুন এটি কীভাবে রূপান্তরিত হবে:
Hi, my name is Alex and my SSN is 555-11-5555. You can reach me at +1-555-555-5555.
কাঠামোগত ডেটার জন্য একটি টেমপ্লেট তৈরি করুন
এই টেমপ্লেটটি বিশেষভাবে স্ট্রাকচার্ড ডেটাসেট , যেমন CSV ফাইলের মধ্যে থাকা সংবেদনশীল তথ্যকে লক্ষ্য করে। আপনি এটিকে এমনভাবে কনফিগার করবেন যাতে পরীক্ষার জন্য ডেটার উপযোগিতা বজায় রেখেও সংবেদনশীল ফিল্ডগুলোকে পরিচয়হীন রাখা যায়।
- টেমপ্লেট পৃষ্ঠায় ফিরে যান এবং 'টেমপ্লেট তৈরি করুন ' বোতামে ক্লিক করুন।
- পরিচয় গোপন করার টেমপ্লেটটি সংজ্ঞায়িত করুন:
সম্পত্তি
মান (টাইপ করুন বা নির্বাচন করুন)
টেমপ্লেট টাইপ
পরিচয় গোপন করুন (সংবেদনশীল তথ্য মুছে ফেলুন)
ডেটা রূপান্তরের ধরণ
রেকর্ড
টেমপ্লেট আইডি
de-identify-structured - ডি-আইডেন্টিফিকেশন কনফিগার করতে এগিয়ে যান । যেহেতু এই টেমপ্লেটটি স্ট্রাকচার্ড ডেটার জন্য প্রযোজ্য, তাই আমরা প্রায়শই অনুমান করতে পারি কোন ফিল্ড বা কলামগুলিতে নির্দিষ্ট ধরণের সংবেদনশীল ডেটা থাকবে। আপনি জানেন যে আপনার অ্যাপ্লিকেশন যে CSV ফাইল ব্যবহার করে, তাতে
user_idঅধীনে ব্যবহারকারীর ইমেল থাকে এবং সেইmessageপ্রায়শই গ্রাহকের সাথে কথোপকথন থেকে প্রাপ্ত ব্যক্তিগত শনাক্তকরণ তথ্য (PII) থাকে।agent_idমাস্কিং নিয়ে আপনি চিন্তিত নন, কারণ তারা কর্মচারী এবং কথোপকথনগুলো শনাক্তযোগ্য হওয়া উচিত। এই অংশটি নিম্নরূপভাবে পূরণ করুন:- রূপান্তর করার জন্য ক্ষেত্র বা কলাম :
user_id,message। - রূপান্তরের ধরণ : তথ্য প্রকারের সাথে মিল
- রূপান্তর পদ্ধতি : রূপান্তর যোগ করুন-এ ক্লিক করুন
- রূপান্তর : চরিত্রসহ মুখোশ।
- যে অক্ষরগুলো উপেক্ষা করতে হবে : মার্কিন বিরামচিহ্ন।
- রূপান্তর করার জন্য ক্ষেত্র বা কলাম :
- তৈরি করুন- এ ক্লিক করুন।
ছবির ডেটার জন্য একটি টেমপ্লেট তৈরি করুন
এই টেমপ্লেটটি স্ক্যান করা নথি বা ব্যবহারকারীর জমা দেওয়া ছবির মতো ইমেজের মধ্যে থাকা সংবেদনশীল টেক্সটকে পরিচয়হীন করার জন্য ডিজাইন করা হয়েছে। এটি ব্যক্তিগত শনাক্তকরণ তথ্য (PII) সনাক্ত ও গোপন করতে অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) প্রযুক্তি ব্যবহার করে।
- টেমপ্লেট পৃষ্ঠায় ফিরে যান এবং 'টেমপ্লেট তৈরি করুন ' বোতামে ক্লিক করুন।
- পরিচয় গোপন করার টেমপ্লেটটি সংজ্ঞায়িত করুন:
সম্পত্তি
মান (টাইপ করুন বা নির্বাচন করুন)
টেমপ্লেট টাইপ
পরিচয় গোপন করুন (সংবেদনশীল তথ্য মুছে ফেলুন)
ডেটা রূপান্তরের ধরণ
ছবি
টেমপ্লেট আইডি
de-identify-image - ডি-আইডেন্টিফিকেশন কনফিগার করতে এগিয়ে যান ।
- রূপান্তর করার জন্য ইনফোটাইপ: কোনো ইন্সপেকশন টেমপ্লেট বা ইন্সপেকশন কনফিগ-এ সংজ্ঞায়িত, শনাক্তকৃত এমন যেকোনো ইনফোটাইপ যা অন্য কোনো নিয়মে নির্দিষ্ট করা নেই ।
- তৈরি করুন- এ ক্লিক করুন।
৭. একটি ডি-আইডেন্টিফিকেশন জব তৈরি করুন এবং চালান
আপনার টেমপ্লেটগুলো সংজ্ঞায়িত করা হয়ে গেলে, আপনি এখন একটি একক জব তৈরি করবেন যা শনাক্ত ও পরিদর্শন করা ফাইলের ধরনের উপর ভিত্তি করে সঠিক ডি-আইডেন্টিফিকেশন টেমপ্লেটটি প্রয়োগ করবে। এর মাধ্যমে ক্লাউড স্টোরেজে সংরক্ষিত সংবেদনশীল ডেটার সুরক্ষা প্রক্রিয়াটি স্বয়ংক্রিয় হয়ে যায়।
ইনপুট ডেটা কনফিগার করুন
এই ধাপে, আপনাকে পরিচয় গোপন করার জন্য প্রয়োজনীয় ডেটার উৎস নির্দিষ্ট করতে হবে, যা হলো একটি ক্লাউড স্টোরেজ বাকেট এবং এতে সংবেদনশীল তথ্যসহ বিভিন্ন ধরনের ফাইল থাকে।
- সার্চ বারের মাধ্যমে সিকিউরিটি > সেনসিটিভ ডেটা প্রোটেকশন -এ যান।
- মেনুতে থাকা ‘পরিদর্শন’ (Inspection) বিকল্পে ক্লিক করুন।
- জব এবং জব ট্রিগার তৈরি করুন -এ ক্লিক করুন।
- কাজটি কনফিগার করুন:
সম্পত্তি
মান (টাইপ করুন বা নির্বাচন করুন)
চাকরির আইডি
pii-removerস্টোরেজ টাইপ
গুগল ক্লাউড স্টোরেজ
অবস্থানের ধরণ
ঐচ্ছিক অন্তর্ভুক্ত/বর্জন নিয়ম সহ একটি বাকেট স্ক্যান করুন
বালতির নাম
input-[your-project-id]
সনাক্তকরণ এবং ক্রিয়াকলাপগুলি কনফিগার করুন
এখন আপনি আপনার পূর্বে তৈরি করা টেমপ্লেটগুলোকে এই কাজের সাথে লিঙ্ক করুন, এবং বিষয়বস্তুর ধরনের উপর ভিত্তি করে সংবেদনশীল ডেটা সুরক্ষা বিভাগকে জানিয়ে দিন যে কীভাবে ব্যক্তিগতভাবে শনাক্তযোগ্য তথ্য (PII) পরীক্ষা করতে হবে এবং কোন পরিচয় গোপন করার পদ্ধতি প্রয়োগ করতে হবে।
- পরিদর্শন টেমপ্লেট :
projects/[your-project-id]/locations/global/inspectTemplates/pii-finder - ‘অ্যাকশন যোগ করুন’ এর অধীনে, ‘একটি পরিচয়বিহীন অনুলিপি তৈরি করুন’ নির্বাচন করুন এবং আপনার তৈরি করা টেমপ্লেটগুলো দিয়ে রূপান্তর টেমপ্লেটগুলো কনফিগার করুন।
-
Confirm whether you want to de-identify the findingsজন্য একটি পপ-আপ খুলবে, 'স্যাম্পলিং নিষ্ক্রিয় করুন ' (DISABLE SAMPLING) -এ ক্লিক করুন।
সম্পত্তি
মান (টাইপ করুন বা নির্বাচন করুন)
পরিচয় গোপন করার টেমপ্লেট
projects/[your-project-id]/locations/global/deidentifyTemplates/de-identify-unstructuredকাঠামোগত পরিচয় গোপনকরণ টেমপ্লেট
projects/[your-project-id]/locations/global/deidentifyTemplates/de-identify-structuredছবি সম্পাদনা টেমপ্লেট
projects/[your-project-id]/locations/global/deidentifyTemplates/de-identify-image - ক্লাউড স্টোরেজ আউটপুট অবস্থান কনফিগার করুন:
- URL :
gs://output-[your-project-id]
- URL :
- কাজটি অবিলম্বে চালানোর জন্য, Schedule-এর অধীনে নির্বাচনটি None হিসেবে রাখুন।
- তৈরি করুন- এ ক্লিক করুন।
-
Confirm job or job trigger createজন্য একটি পপ-আপ খুলবে, CONFIRM CREATE-এ ক্লিক করুন।
৮. ফলাফল যাচাই করুন।
চূড়ান্ত ধাপ হলো আউটপুট বাকেটের সমস্ত ফাইলের ধরন জুড়ে সংবেদনশীল ডেটা সফলভাবে এবং সঠিকভাবে গোপন করা হয়েছে কিনা তা নিশ্চিত করা। এটি নিশ্চিত করে যে আপনার পরিচয় গোপনকরণ পাইপলাইনটি প্রত্যাশিতভাবে কাজ করছে।
কাজের অবস্থা পর্যালোচনা করুন
কাজটি সফলভাবে সম্পন্ন হয়েছে কিনা তা নিশ্চিত করতে পর্যবেক্ষণ করুন এবং আউটপুট ফাইলগুলো দেখার আগে প্রাপ্ত ফলাফলের সারাংশ পর্যালোচনা করুন।
- জব ডিটেইলস ট্যাবে, জবটির স্ট্যাটাস ' Done' দেখানো পর্যন্ত অপেক্ষা করুন।
- ওভারভিউ- এর অধীনে, প্রাপ্ত তথ্যের সংখ্যা এবং শনাক্তকৃত প্রতিটি ইনফোটাইপের শতাংশ পর্যালোচনা করুন।
- কনফিগারেশন- এ ক্লিক করুন।
- অ্যাকশনস (Actions) পর্যন্ত স্ক্রল করুন এবং পরিচয়বিহীন ডেটা দেখতে আউটপুট বাকেটটিতে ক্লিক করুন:
gs://output-[your-project-id]।
ইনপুট এবং আউটপুট ফাইল তুলনা করুন
এই ধাপে, আপনার টেমপ্লেট অনুযায়ী ডেটা স্যানিটাইজেশন সঠিকভাবে প্রয়োগ করা হয়েছে কিনা তা নিশ্চিত করতে আপনি পরিচয়বিহীন ফাইলগুলো ম্যানুয়ালি পরিদর্শন করবেন।
- ছবি : আউটপুট বাকেট থেকে একটি ছবি খুলুন। যাচাই করুন যে আউটপুট ফাইলটিতে সমস্ত সংবেদনশীল লেখা মুছে ফেলা হয়েছে।

- অসংগঠিত লগ : উভয় বাকেট থেকে একটি লগ ফাইল দেখুন। নিশ্চিত করুন যে আউটপুট লগে PII (ব্যক্তিগতভাবে শনাক্তযোগ্য তথ্য) infoType নাম (যেমন,
[US_SOCIAL_SECURITY_NUMBER]) দ্বারা প্রতিস্থাপিত হয়েছে। - স্ট্রাকচার্ড CSV : উভয় বাকেট থেকে একটি CSV ফাইল খুলুন। যাচাই করুন যে আউটপুট ফাইলে ব্যবহারকারীর ইমেল এবং SSN-গুলি
####@####.comদিয়ে মাস্ক করা আছে।
৯. গবেষণাগার থেকে বাস্তবে: আপনার নিজের প্রকল্পে এটি কীভাবে ব্যবহার করবেন
আপনি যে নীতি ও কনফিগারেশনগুলো প্রয়োগ করেছেন, তা গুগল ক্লাউডে বাস্তব এআই প্রজেক্ট সুরক্ষিত করার একটি ব্লুপ্রিন্ট। আপনি এইমাত্র যে রিসোর্সগুলো তৈরি করেছেন—যেমন ইন্সপেক্ট টেমপ্লেট , ডি-আইডেন্টিফিকেশন টেমপ্লেট এবং অটোমেটেড জব —সেগুলো যেকোনো নতুন ডেটা ইনটেক প্রক্রিয়ার জন্য একটি সুরক্ষিত স্টার্টার টেমপ্লেট হিসেবে কাজ করে।
স্বয়ংক্রিয় ডেটা স্যানিটাইজেশন পাইপলাইন: আপনার সুরক্ষিত ডেটা গ্রহণ
আপনার সেটআপে আপনি এটি কীভাবে ব্যবহার করবেন
যখনই আপনার টিমের এআই ডেভেলপমেন্টের জন্য নতুন কাঁচা গ্রাহক ডেটা ইনজেস্ট করার প্রয়োজন হবে, আপনি সেটিকে এমন একটি পাইপলাইনের মাধ্যমে পাঠাবেন যা আপনার কনফিগার করা সেন্সিটিভ ডেটা প্রোটেকশন জবটিকে অন্তর্ভুক্ত করে। ম্যানুয়ালি পরিদর্শন এবং ডেটা গোপন করার পরিবর্তে, আপনি এই স্বয়ংক্রিয় ওয়ার্কফ্লোটি ব্যবহার করেন। এটি নিশ্চিত করে যে ডেটা সায়েন্টিস্ট এবং এআই মডেলগুলো শুধুমাত্র পরিচয়বিহীন ডেটার সাথেই কাজ করে, যা গোপনীয়তার ঝুঁকি উল্লেখযোগ্যভাবে হ্রাস করে।
উৎপাদনের সাথে সংযোগ স্থাপন
প্রোডাকশন পরিবেশে, আপনি এই ধারণাটিকে আরও এক ধাপ এগিয়ে নিয়ে যাবেন:
- জব ট্রিগারের মাধ্যমে অটোমেশন : কাজটি ম্যানুয়ালি চালানোর পরিবর্তে, আপনার ইনপুট ক্লাউড স্টোরেজ বাকেটে যখনই কোনো নতুন ফাইল আপলোড হবে, তখন আপনি একটি জব ট্রিগার সেট আপ করবেন। এটি একটি সম্পূর্ণ স্বয়ংক্রিয়, হস্তক্ষেপহীন শনাক্তকরণ এবং পরিচয় গোপন করার প্রক্রিয়া তৈরি করে।
- ডেটা লেক/ডেটা ওয়্যারহাউসের সাথে ইন্টিগ্রেশন : পরিচয়বিহীন আউটপুট ডেটা সাধারণত আরও বিশ্লেষণ এবং মডেল প্রশিক্ষণের জন্য একটি সুরক্ষিত ডেটা লেক (যেমন, ক্লাউড স্টোরেজে) বা ডেটা ওয়্যারহাউসে (যেমন, BigQuery ) পাঠানো হয়, যা ডেটার জীবনচক্র জুড়ে গোপনীয়তা বজায় রাখে।
সূক্ষ্ম পরিচয় গোপনকরণ কৌশল: গোপনীয়তা ও উপযোগিতার মধ্যে ভারসাম্য
আপনার সেটআপে আপনি এটি কীভাবে ব্যবহার করবেন
আপনার তৈরি করা বিভিন্ন ডি-আইডেন্টিফিকেশন টেমপ্লেটগুলো (আনস্ট্রাকচার্ড, স্ট্রাকচার্ড, ইমেজ) অত্যন্ত গুরুত্বপূর্ণ। আপনি আপনার এআই মডেলগুলোর নির্দিষ্ট প্রয়োজনের উপর ভিত্তি করে অনুরূপ স্বতন্ত্র কৌশল প্রয়োগ করবেন। এটি আপনার ডেভেলপমেন্ট টিমকে গোপনীয়তার সাথে আপোস না করেই তাদের মডেলের জন্য অত্যন্ত দরকারি ডেটা পেতে সাহায্য করে।
উৎপাদনের সাথে সংযোগ স্থাপন
উৎপাদন পরিবেশে এই সূক্ষ্ম নিয়ন্ত্রণ নিম্নলিখিত বিষয়গুলোর জন্য আরও বেশি গুরুত্বপূর্ণ হয়ে ওঠে:
- কাস্টম ইনফোটাইপ এবং ডিকশনারি : অত্যন্ত সুনির্দিষ্ট বা ডোমেন-নির্দিষ্ট সংবেদনশীল ডেটার জন্য, আপনি সেন্সিটিভ ডেটা প্রোটেকশন-এর মধ্যে কাস্টম ইনফোটাইপ এবং ডিকশনারি সংজ্ঞায়িত করবেন। এটি আপনার অনন্য ব্যবসায়িক প্রেক্ষাপটের জন্য বিশেষভাবে তৈরি ব্যাপক শনাক্তকরণ নিশ্চিত করে।
- ফরম্যাট-সংরক্ষণকারী এনক্রিপশন (FPE) : যেসব ক্ষেত্রে পরিচয় গোপন করা ডেটাকে তার আসল ফরম্যাট ধরে রাখতে হয় (যেমন, ইন্টিগ্রেশন টেস্টিংয়ের জন্য ক্রেডিট কার্ড নম্বর), সেখানে ফরম্যাট-সংরক্ষণকারী এনক্রিপশনের মতো উন্নত পরিচয় গোপন করার কৌশলগুলো বিবেচনা করা যেতে পারে। এটি বাস্তবসম্মত ডেটা প্যাটার্ন ব্যবহার করে গোপনীয়তা-সুরক্ষিত টেস্টিংয়ের সুযোগ করে দেয়।
পর্যবেক্ষণ ও নিরীক্ষা: ক্রমাগত সম্মতি নিশ্চিত করা
আপনার সেটআপে আপনি এটি কীভাবে ব্যবহার করবেন
সমস্ত ডেটা প্রক্রিয়াকরণ আপনার গোপনীয়তা নীতি মেনে চলছে এবং কোনো সংবেদনশীল তথ্য অনিচ্ছাকৃতভাবে প্রকাশ পাচ্ছে না, তা নিশ্চিত করার জন্য আপনাকে সংবেদনশীল ডেটা সুরক্ষা লগগুলি ক্রমাগত পর্যবেক্ষণ করতে হবে। কাজের সারাংশ এবং প্রাপ্ত তথ্য নিয়মিত পর্যালোচনা করা এই ধারাবাহিক নিরীক্ষারই একটি অংশ।
উৎপাদনের সাথে সংযোগ স্থাপন
একটি শক্তিশালী উৎপাদন ব্যবস্থার জন্য, এই মূল পদক্ষেপগুলো বিবেচনা করুন:
- সিকিউরিটি কমান্ড সেন্টারে প্রাপ্ত তথ্য পাঠান : সমন্বিত হুমকি ব্যবস্থাপনা এবং আপনার নিরাপত্তা পরিস্থিতির একটি কেন্দ্রীভূত চিত্র পেতে, আপনার সেনসিটিভ ডেটা প্রোটেকশন জবগুলোকে তাদের প্রাপ্ত তথ্যের সারসংক্ষেপ সরাসরি সিকিউরিটি কমান্ড সেন্টারে পাঠানোর জন্য কনফিগার করুন। এটি নিরাপত্তা সতর্কতা এবং গুরুত্বপূর্ণ তথ্যকে একত্রিত করে।
- সতর্কীকরণ এবং ঘটনা প্রতিক্রিয়া : আপনি সংবেদনশীল ডেটা সুরক্ষা সংক্রান্ত তথ্য বা কাজের ব্যর্থতার উপর ভিত্তি করে ক্লাউড মনিটরিং অ্যালার্ট সেট আপ করবেন। এটি নিশ্চিত করে যে আপনার নিরাপত্তা দল যেকোনো সম্ভাব্য নীতি লঙ্ঘন বা প্রক্রিয়াকরণ সমস্যা সম্পর্কে অবিলম্বে অবহিত হয়, যা দ্রুত ঘটনা প্রতিক্রিয়া সক্ষম করে।
১০. উপসংহার
অভিনন্দন! আপনি সফলভাবে একটি ডেটা সুরক্ষা কর্মপ্রবাহ তৈরি করেছেন যা স্বয়ংক্রিয়ভাবে একাধিক ডেটা প্রকার জুড়ে ব্যক্তিগত শনাক্তকরণ তথ্য (PII) সনাক্ত এবং পরিচয়হীন করতে পারে, যা পরবর্তী এআই উন্নয়ন এবং বিশ্লেষণে ব্যবহারের জন্য এটিকে নিরাপদ করে তোলে।
পুনরালোচনা
এই ল্যাবে, আপনি নিম্নলিখিত কাজগুলো সম্পন্ন করেছেন:
- নির্দিষ্ট সংবেদনশীল তথ্যের প্রকার ( infoTypes ) শনাক্ত করার জন্য একটি পরিদর্শন টেমপ্লেট সংজ্ঞায়িত করা হয়েছে।
- অসংগঠিত, সংগঠিত এবং চিত্র ডেটার জন্য স্বতন্ত্র পরিচয় গোপনকরণ নিয়ম তৈরি করা হয়েছে।
- একটিমাত্র জব কনফিগার করে চালানো হয়েছিল, যা ফাইলের ধরনের ওপর ভিত্তি করে একটি সম্পূর্ণ বাকেটের বিষয়বস্তুতে স্বয়ংক্রিয়ভাবে সঠিক গোপনীয়তা প্রয়োগ করত।
- সংবেদনশীল ডেটা একটি সুরক্ষিত আউটপুট স্থানে সফলভাবে স্থানান্তরিত হয়েছে তা যাচাই করা হয়েছে।
পরবর্তী পদক্ষেপ
- সিকিউরিটি কমান্ড সেন্টারে প্রাপ্ত ফলাফল পাঠান : আরও সমন্বিত থ্রেট ম্যানেজমেন্টের জন্য, জব অ্যাকশনটিকে এমনভাবে কনফিগার করুন যাতে এটি তার প্রাপ্ত ফলাফলের সারসংক্ষেপ সরাসরি সিকিউরিটি কমান্ড সেন্টারে পাঠিয়ে দেয়।
- ক্লাউড ফাংশন দিয়ে স্বয়ংক্রিয় করুন : প্রোডাকশন পরিবেশে, আপনি একটি ক্লাউড ফাংশন ব্যবহার করে ইনপুট বাকেটে নতুন কোনো ফাইল আপলোড হওয়ার সাথে সাথে এই ইন্সপেকশন জবটি স্বয়ংক্রিয়ভাবে চালু করতে পারেন।