Kaggle-এর সাথে ML/AI-তে আপনার প্রতিষ্ঠানকে আপস্কিল করুন

1। পরিচিতি

47566e1490c16443.png

শেষ আপডেট: 2024-05-10

কাগল কি?

Kaggle হল বৃহত্তম AI & ML সম্প্রদায়, সর্বশেষ কৌশল এবং প্রযুক্তির সাথে সমতল করার জন্য সমস্ত স্তরের ডেটা সায়েন্স এবং মেশিন লার্নিং উত্সাহীদের জন্য চূড়ান্ত প্ল্যাটফর্ম৷ আপনার পরবর্তী প্রকল্প কিকস্টার্ট করতে ডেটাসেট, নোটবুক এবং প্রাক-প্রশিক্ষিত মডেলগুলির একটি বিশাল ভান্ডার আবিষ্কার করুন। প্রতিযোগিতায় অংশগ্রহণ করুন, কোর্সগুলি থেকে শিখুন এবং বিশ্বজুড়ে 18 মিলিয়নেরও বেশি ব্যবহারকারীর একটি বৈচিত্র্যময় সম্প্রদায়ের সাথে সংযোগ করুন৷ আপনি একজন শিক্ষানবিস বা একজন অভিজ্ঞ পেশাদারই হোন না কেন, Kaggle হল আপনার দক্ষতা বাড়াতে, বক্ররেখা থেকে এগিয়ে থাকার এবং অত্যাধুনিক প্রকল্পগুলিতে সহযোগিতা করার জায়গা৷

আপনি কি নির্মাণ করবেন

এই কোডল্যাবে আপনি একটি কাগল প্রতিযোগিতা তৈরি, কনফিগার এবং চালু করবেন। আপনি প্রতিযোগীর অভিজ্ঞতার মধ্য দিয়ে হাঁটবেন এবং একটি আকর্ষক প্রতিযোগিতা চালানোর জন্য সেরা অনুশীলনগুলি বুঝতে পারবেন।

আপনি কি শিখবেন

  • হোস্টের পক্ষ থেকে কীভাবে একটি কাগল প্রতিযোগিতা তৈরি এবং পরিচালনা করতে হয় তা বুঝুন
  • অন্বেষণ থেকে জমা পর্যন্ত প্রতিযোগীর অভিজ্ঞতা নেভিগেট করুন
  • একটি আকর্ষক প্রতিযোগিতা চালানোর জন্য সর্বোত্তম অনুশীলন শিখুন

এই কোডল্যাবটি দ্রুত একটি প্রতিযোগিতা তৈরি করার উপর দৃষ্টি নিবদ্ধ করে এবং কাগলের ক্রমবর্ধমান প্রতিযোগিতার লাইব্রেরির সুবিধা দেয়।

আপনি কি প্রয়োজন হবে

  • একটি সাম্প্রতিক ওয়েব ব্রাউজার
  • পাইথন সম্পর্কে প্রাথমিক জ্ঞান

2. সেট আপ করা হচ্ছে

একটি কাগল অ্যাকাউন্ট তৈরি করুন

Kaggle ওয়েবসাইটে যান (https://www.kaggle.com/) এবং একটি বিনামূল্যে অ্যাকাউন্ট তৈরি করতে "নিবন্ধন করুন" এ ক্লিক করুন।

আপনার অ্যাকাউন্ট যাচাই করুন

  1. পৃষ্ঠার উপরের ডানদিকে আপনার প্রোফাইল ছবিতে ক্লিক করুন
  2. "আপনার প্রোফাইল" ক্লিক করুন
  3. প্রোফাইল সামগ্রীর ডানদিকে "সেটিংস" বোতামে ক্লিক করুন
  4. "ফোন যাচাইকরণ" এর অধীনে আপনার অ্যাকাউন্ট যাচাই করতে নির্দেশাবলী অনুসরণ করে৷

3. আপনার প্রথম প্রতিযোগিতা তৈরি করা

AI উৎপন্ন প্রতিযোগিতার টেমপ্লেট উপস্থাপন করা হচ্ছে

এআই জেনারেটেড কম্পিটিশন হল কাগলের একটি নতুন বৈশিষ্ট্য যা ব্যবহারকারীদের দ্রুত এবং সহজে মেশিন লার্নিং প্রতিযোগিতা তৈরি করতে দেয়। এটি কৃত্রিম ডেটাসেট তৈরি করতে AI ব্যবহার করে যা বিদ্যমান ডেটাসেটের পরিসংখ্যানগত বৈশিষ্ট্যকে অনুকরণ করে কোনো ব্যক্তিগতভাবে শনাক্তযোগ্য তথ্য না রেখে।

এখানে কিভাবে এটা কাজ করে:

  1. একটি টেমপ্লেট চয়ন করুন : বিভিন্ন মেশিন লার্নিং কাজের (যেমন, শ্রেণীবিভাগ, রিগ্রেশন) উপর ভিত্তি করে টেমপ্লেটগুলির একটি তালিকা থেকে নির্বাচন করুন।
  2. AI একটি ডেটাসেট তৈরি করে : Kaggle's AI আপনার নির্বাচিত টেমপ্লেটের উপর ভিত্তি করে আপনার প্রতিযোগিতার জন্য একটি নতুন ডেটাসেট তৈরি করে৷ এই ডেটাসেটটি আসলটির মতোই কিন্তু বৈশিষ্ট্যগুলির একটি উপসেট ব্যবহার করে এবং এতে সামান্য ভিন্ন বৈশিষ্ট্যের বিতরণ রয়েছে৷
  3. আপনার প্রতিযোগিতা কাস্টমাইজ করুন : প্রতিযোগিতার নাম, বিবরণ এবং টাইমলাইনের মতো প্রাথমিক বিবরণ লিখুন। আপনি আপনার প্রতিযোগিতার জন্য গোপনীয়তা সেটিংসও বেছে নিতে পারেন।
  4. লঞ্চ : বিস্তারিত চূড়ান্ত করার পরে এবং একটি লঞ্চ সেট করার পরে, আপনি আপনার প্রতিযোগিতা চালু করতে প্রস্তুত৷

এই বৈশিষ্ট্যটি প্রতিযোগিতা তৈরির প্রক্রিয়াটিকে সহজ করে তোলে, এটি আরও ব্যবহারকারীদের কাছে অ্যাক্সেসযোগ্য করে তোলে এবং ডেটাসেট প্রস্তুতির পরিবর্তে মেশিন লার্নিং দিকগুলিতে ফোকাস করতে সক্ষম করে।

একটি প্রতিযোগিতা তৈরি করুন

https://www.kaggle.com/competitions/new এ নেভিগেট করুন, "নতুন এআই জেনারেটেড প্রতিযোগিতা" নির্বাচন করুন

2629bf77a282a46c.png

"একটি কাঁকড়া বয়স ডেটাসেটের সাথে রিগ্রেশন" প্রতিযোগিতা নির্বাচন করুন।

প্রতিযোগিতার বিবরণ

2dd2228b9d686a6e.png

একটি বর্ণনামূলক নাম এবং সাবটাইটেল পূরণ করুন। উদাহরণ স্বরূপ, আপনি শিরোনাম হিসেবে '<Your Names>'s Test Crab Competition' ব্যবহার করতে পারেন এবং সাবটাইটেল হিসেবে 'আমার প্রথম প্রতিযোগীতা কিভাবে কাজ করে তা দেখতে পারেন'। মনে রাখবেন প্রতিযোগিতার URL স্বয়ংক্রিয়ভাবে শিরোনামের উপর ভিত্তি করে পূরণ করা হয়।

দৃশ্যমানতা এবং অ্যাক্সেস

আমাদের এখন প্রতিযোগিতার জন্য দৃশ্যমানতা এবং অ্যাক্সেস সেট করতে হবে।

5c7dcae412ddd574.png

দৃশ্যমানতা

  • সর্বজনীন : আপনার প্রতিযোগীতা Kaggle এ যে কেউ দৃশ্যমান। এটি অনুসন্ধান ফলাফলে প্রদর্শিত হবে, যাতে আগ্রহী যে কেউ যোগ দিতে পারেন৷
  • ব্যক্তিগত : আপনার প্রতিযোগিতা জনসাধারণের দৃষ্টিভঙ্গি থেকে লুকানো আছে। এটি অনুসন্ধানে প্রদর্শিত হবে না, এবং শুধুমাত্র আপনি বিশেষভাবে আমন্ত্রিত ব্যক্তিদের অংশগ্রহণ করতে পারেন৷

যারা যোগ দিতে পারেন

  • যে কেউ : এটি একটি খোলা দরজা নীতির মত। কাগলের যে কেউ আপনার প্রতিযোগিতায় যোগ দিতে পারেন।
  • শুধুমাত্র যাদের একটি লিঙ্ক আছে : এটি আরও একচেটিয়া। আপনি একটি বিশেষ লিঙ্ক তৈরি করবেন, এবং শুধুমাত্র সেই লিঙ্কের লোকেরা যোগ দিতে পারবেন।
  • সীমাবদ্ধ ইমেল তালিকা : এটি সবচেয়ে নিয়ন্ত্রিত বিকল্প। আপনি নির্দিষ্ট ইমেল ঠিকানা বা ডোমেনগুলির একটি তালিকা প্রদান করেন (যেমন @yourschool.edu), এবং শুধুমাত্র সেই ঠিকানাগুলির লোকেরা যোগ দিতে পারেন৷

আমরা পরে নোটবুক এবং মডেল সেটিং সক্ষম করার বিষয়ে আরও কথা বলব৷ আপাতত, এটি টগল করা আছে তা নিশ্চিত করুন। আমাদের উদাহরণ প্রতিযোগিতার জন্য এই সেটিংসগুলিকে ব্যক্তিগত এবং শুধুমাত্র লিঙ্ক সহ লোকেদের জন্য সেট করুন৷

শর্তাবলী পড়ুন এবং সম্মত হন এবং " প্রতিযোগিতা তৈরি করুন " এ ক্লিক করুন।

4. আপনার প্রতিযোগিতা বোঝা এবং কনফিগার করা

পর্দার আড়ালে আমরা একটি অনন্য ডেটাসেটের সাথে একটি সম্পূর্ণ নতুন প্রতিযোগিতা তৈরি করেছি। আসুন প্রতিযোগিতার সেটিংসের একটি দ্রুত পর্যালোচনা করি।

হোস্ট ট্যাব

হোস্ট ট্যাবে আপনার প্রতিযোগীতা সঠিকভাবে কনফিগার করার জন্য হোস্ট হিসাবে আপনার যা কিছু প্রয়োজন তা রয়েছে। বিশেষভাবে পৃষ্ঠার ডানদিকে পৃষ্ঠা তালিকা দেখুন:

bcedd6768cc4f32c.png

মৌলিক বিবরণ

এই বিভাগে অন্তর্ভুক্ত:

  • সাধারণ
  • গোপনীয়তা, অ্যাক্সেস এবং সম্পদ
  • টাইমলাইন
  • স্কোরিং এবং দল

প্রতিযোগিতা শুরু করার সময় আমরা সাধারণ এবং গোপনীয়তা বিভাগগুলি কভার করেছি।

টাইমলাইন

প্রতিযোগিতার শেষ তারিখ টাইমজোন সচেতন।

7141f4aea90bccb0.png

স্কোরিং এবং দল

স্কোরিং এবং টিম বিভাগটি আপনাকে নিয়ন্ত্রণ করতে দেয় যে কতজন লোক একটি দলে যোগ দিতে পারে, তারা প্রতিদিন কতবার জমা দিতে পারে এবং চূড়ান্ত মূল্যায়নের জন্য তাদের কতগুলি জমা দিতে হবে।

5efb6387612db941.png

ছবি

ছবিগুলি আপনাকে আপনার প্রতিযোগিতার জন্য ব্যানার এবং থাম্বনেইল কাস্টমাইজ করতে দেয়। এটি প্রতিযোগিতার হোম পৃষ্ঠার পাশাপাশি আপনার প্রতিযোগিতার তালিকাভুক্তির উপর প্রভাব ফেলবে।

6dfd442376a1c702.png

হোস্ট

এখানে আপনি আপনার প্রতিযোগিতার জন্য হোস্ট হিসাবে অন্যান্য Kaggle ব্যবহারকারীদের যোগ করতে পারেন। অন্যান্য হোস্টদের আপনার প্রতিযোগিতায় সম্পূর্ণ অ্যাক্সেস (লঞ্চ করা সহ) থাকবে।

8f8c90eb6baa7747.png

মূল্যায়ন মেট্রিক

মূল্যায়ন মেট্রিক ট্যাব প্রতিযোগিতার কেন্দ্রবিন্দু। স্ক্র্যাচ থেকে একটি প্রতিযোগিতা তৈরি করার সময়, এখানে আপনাকে কোন মূল্যায়ন (বা স্কোরিং) মেট্রিক ব্যবহার করতে হবে সে সম্পর্কে কিছু সতর্কতা অবলম্বন করতে হবে, আপনার সমাধান ফাইল আপলোড করতে হবে, পাবলিক/প্রাইভেট টেস্ট স্প্লিট সংজ্ঞায়িত করতে হবে এবং একটি নমুনা জমা দিতে হবে। যাইহোক যেহেতু আমরা একটি জেনারেটেড প্রতিযোগিতা ব্যবহার করেছি আমাদের এর কোনটি করার দরকার নেই!

স্কোরিং মেট্রিক

এটি নির্ধারণ করে যে সমাধান ফাইলের বিপরীতে কীভাবে জমা দেওয়া হয়। প্রতিটি মেট্রিক ডকুমেন্টেশন এবং প্রকৃত কোড উপলব্ধ আছে.

সমাধান ফাইল

যেহেতু আমরা একটি তৈরি প্রতিযোগিতা ব্যবহার করছি, এই ফাইলটি আপনার প্রতিযোগিতার জন্য অনন্য!

89fa1f42d177505a.png

সলিউশন স্যাম্পলিং আপনাকে সলিউশন ফাইলের পরিমাণ সামঞ্জস্য করতে দেয় যা প্রতিযোগিতার সময় জমা স্কোর করতে ব্যবহৃত হয় (সর্বজনীন লিডারবোর্ড) বনাম চূড়ান্ত লিডারবোর্ড নির্ধারণ করতে কতগুলি সারি ব্যবহার করা হয়। প্রতিযোগিতা চলাকালীন, ব্যবহারকারীদের চূড়ান্ত লিডারবোর্ডের (এখানে প্রাইভেট লিডারবোর্ড বলা হয়) জন্য তাদের জমা দেওয়া কোনটি ব্যবহার করা হবে (স্কোর করা ব্যক্তিগত জমা সেটিং এর উপর ভিত্তি করে) নির্বাচন করার অনুমতি দেওয়া হবে।

এই প্রক্রিয়াটি নিশ্চিত করে যে প্রতিযোগীদের অতিরিক্ত ফিটিং বা জমা দিয়ে বন্যার জন্য পুরস্কৃত করা হয় না।

স্যান্ডবক্স জমা

এগুলি প্রতিযোগিতার হোস্টদের নিশ্চিত করতে দেয় যে স্কোরিং প্রত্যাশিত হিসাবে কাজ করে এবং তাদের সাথে তুলনা করার জন্য প্রতিযোগীদের জন্য "বেঞ্চমার্ক" জমা দেওয়ার অনুমতি দেয়। এই বেঞ্চমার্ক জমাগুলি লিডারবোর্ডে প্রদর্শিত হবে।

দল এবং জমা

প্রতিযোগিতা চলাকালীন এটি হোস্টদের সমস্ত স্কোর ডাউনলোড করার পাশাপাশি দল পরিচালনা করতে দেয়। প্রতিযোগিতা শুরু হওয়ার আগে, এটি খালি।

চেকলিস্ট চালু করুন

এটি পরবর্তী বিভাগে কভার করা হবে!

5. আপনার প্রতিযোগিতা চালু করা

50b03df072c02e6a.png

প্রতিযোগিতার পৃষ্ঠার উপরে থেকে, "লঞ্চ চেকলিস্ট" বোতামে ক্লিক করুন।

চেকলিস্ট চালু করুন

লঞ্চ চেকলিস্ট একটি প্রতিযোগিতা শুরু করার আগে প্রয়োজনীয় পদক্ষেপগুলি দেখায়৷ যেহেতু আমরা ইতিমধ্যেই একটি প্রতিযোগিতার টেমপ্লেট থেকে শুরু করেছি, এই ধাপগুলির বেশিরভাগই ইতিমধ্যে সম্পন্ন হয়েছে! শুধুমাত্র দুটি কাজ বাকি আছে, একটি সময়সীমা সেট করা এবং প্রতিযোগিতার নিয়ম আপডেট করা।

938b9ed7bc4e0597.png

সময়সীমা সেট করুন

প্রথমে সেট ডেডলাইনের পাশের তীরটিতে ক্লিক করুন। প্রতিযোগিতা সাধারণত অন্তত কয়েক মাস স্থায়ী হয়। একটি প্রতিযোগিতার সর্বোচ্চ দৈর্ঘ্য এক বছর।

নিয়ম সম্পাদনা করুন

আপনার প্রতিযোগিতার নিয়ম চালু করার আগে ডিফল্ট টেমপ্লেট থেকে আপডেট করা দরকার। আপনি যদি কোনো শ্রেণী বা গোষ্ঠীর জন্য এই প্রতিযোগিতা চালাচ্ছেন তাহলে প্রত্যাশা সম্পর্কে কোনো তথ্য দেওয়ার জন্য এটি একটি ভালো জায়গা।

শুরু করা

আমরা লঞ্চের জন্য প্রস্তুত! এগিয়ে যান এবং আপনার প্রতিযোগিতা চালু করুন! আপনি এখন প্রতিযোগীদের যোগদানের জন্য প্রস্তুত!

6. প্রতিযোগীর অভিজ্ঞতা

এখন যেহেতু আপনি আপনার প্রতিযোগিতা চালু করেছেন, আসুন প্রতিযোগীর অভিজ্ঞতা কেমন তা দেখে নেওয়া যাক। আমরা প্রতিযোগিতায় যোগদান এবং একটি জমা জমা কভার করব। এর জন্য, আপনি এখানে Google IO ডেমো প্রতিযোগিতায় যোগ দিতে পারেন: https://www.kaggle.com/competitions/google-io-demo-competition

প্রতিযোগিতায় যোগদান

প্রতিযোগিতার হোম পেজে নেভিগেট করার পরে, উপরের ডানদিকে "প্রতিযোগিতায় যোগ দিন" বোতামে ক্লিক করুন তারপর নিয়মগুলি পড়ুন এবং স্বীকার করুন৷

আপনার প্রথম জমা করা হচ্ছে

কোড ট্যাবে যান এবং "নতুন নোটবুক" এ ক্লিক করুন। এটি একটি নোটবুক খুলবে যা আপনাকে প্রতিযোগিতায় জমা দেওয়ার অনুমতি দেবে।

প্রথমে আমরা ট্রেনে পড়ব এবং ডেটা পরীক্ষা করব

# পরীক্ষা এবং ট্রেনের ডেটা পড়ুন

ট্রেন = pd.read_csv('/kaggle/input/google-io-demo-competition/train.csv')

পরীক্ষা = pd.read_csv('/kaggle/input/google-io-demo-competition/test.csv')

চলুন ডেটা দেখে নেওয়া যাক।

# কিছু ডেটা দেখে নিন

train.head()

আসুন প্রশিক্ষণের জন্য ডেটা প্রস্তুত করি। এই ক্ষেত্রে আমরা সেক্স বাদ দেই কারণ এটি একটি সংখ্যাসূচক মান নয়। (ইঙ্গিত: এটি কীভাবে অন্তর্ভুক্ত করবেন তা খুঁজে বের করা আপনার মডেলের কর্মক্ষমতা উন্নত করা উচিত)।

 # পরীক্ষার ডেটা থেকে ফলাফল বাদ দিন

data = train.drop(কলাম=['বয়স', 'লিঙ্গ'])

উত্তর = ট্রেন ['বয়স']

তারপরে আমরা একটি মডেল তৈরি করি। এই ক্ষেত্রে আমরা একটি এলোমেলো বন মডেল করছি।

# মডেলের জন্য আমদানি

sklearn.model_selection import train_test_split থেকে

sklearn.ensemble থেকে আমদানি RandomForestRegressor

sklearn.metrics থেকে mean_absolute_error আমদানি করুন

মডেল = RandomForestRegressor()

# মডেলকে প্রশিক্ষণ দিন

model.fit(ডেটা, উত্তর)

একটি জমা তৈরি করুন:

ভবিষ্যদ্বাণী = মডেল.ভবিষ্যদ্বাণী(test.drop(columns=['Sex']))

জমা = pd.DataFrame({'id': পরীক্ষা['id'], 'বয়স': পূর্বাভাস})

submission.to_csv('submission.csv', index=False)

তারপর আপনি ডান পাশের মেনুতে "সাবমিট টু কম্পিটিশন" নির্বাচন করে প্রতিযোগিতায় জমা দিতে পারেন।

1cf17449cae53abe.png

একটি দুর্দান্ত প্রতিযোগিতা চালানোর জন্য টিপস

  1. একটি স্টার্টার নোটবুক অন্তর্ভুক্ত করা নিশ্চিত করুন যা একটি প্রাথমিক জমা দেয়
  2. প্রতিযোগিতার প্রথম দিকে আলোচনার ব্যবহার এবং নোটবুক শেয়ার করতে উৎসাহিত করুন
  3. আনন্দ কর!