Road to Data Science

14 April 2021

1 min read

২ মিনিটের জন্য নিজেকে বিড়াল চিন্তা করুন। যার আলুর চিপ্স ভীষণ পছন্দ। ডাটা সায়েন্সের আপনি কী বুঝবেন?

তবে, আপনার একজন বন্ধু আছে, সে আবার মানুষ। তার কাছে অনেক অনেক ডাটা আছে। থাকলেই বা কী? সে এগুলা মোটেও ইউজ করে না, ভীষণ অলস সে।

আলুর চিপ্স তো আপনার সে-ই মজা লাগে, একদিন ঠিক করলেন- আলুর চিপ্সের একটা ব্র‍্যান্ড খুলবেন আপনি, চিপ্সটা হবে টুনা স্বাদের। ডিসিশন ফাইনাল।

মানুষ আপনার চিপ্স পছন্দ করবে কি করবে না, দাম কত হবে, বা আদৌ সামনে এই জিনিসের চাহিদা আছে কিনা, এসব বিষয়ে আপনার বিন্দুমাত্র কোন ধারণা নাই। তবে এইটুকু আপনি জানেন যে, আপনার মানুষ বন্ধুর কাছে প্রচুর ডাটা আছে। আর ডাটা যে জাদুর মতো কাজ করে, এটা তো আল্লাহর দুনিয়ায় সবাই-ই জানে। গেলেন তার কাছে, যদি মানুষ বন্ধুটা আলুর চিপ্সের ব্র‍্যাণ্ড খোলার ব্যাপারে আপনাকে কোন সাহায্য করতে পারেন।

ডাটা সায়েন্স অন-লাইভ কোর্সে এনরোল করতে চাইলে ক্লিক করুন নীচের লিংকেঃ https://ostad.app/batch/data-science

আপনার মানুষ বন্ধুটা আপনাকে ডেটা দিতে রাজি হলো। শুধু তা-ই না, ডেটা তো খালি নিলেই হয় না, ডেটা কীভাবে ব্যবহার করতে হয়-সেটাও আপনাকে শিখাবে বলে সম্মত হলো। হ্যাঁ, এখন আপনার কাছে ডাটা আছে। ডাটা কে কী কী প্রশ্ন আপনি করবেন, আর তার থেকে কী কী উত্তর আপনি বের করবেন-টোটাল প্ল্যান রেডি।

প্রথমত, আপনি জানতে চেয়েছিলেন যে মানুষরা আপনার চিপ্সের টুনা গন্ধ পছন্দ করবে কিনা। আপনার মানুষ বন্ধু আপনাকে জানিয়ে দিয়েছেন, আপনি যদি একটি রেন্ডম মানুষকে বাছাই করেন, যিনি তার জীবনে কমপক্ষে একবার চিপস খেয়েছিলেন এবং তাকে জিজ্ঞাসা করেন তিনি এটি পছন্দ করেন কিনা, তবে কেবল দুটি উত্তর থাকতে পারে, হ্যাঁ বা না।

একইভাবে, আপনি যদি তাদের জিজ্ঞাসা করেন যে Sour Cream, Tomato এবং BBQ-এর মধ্যে তারা কোন স্বাদ পছন্দ করে তবে উত্তরটি অবশ্যই জলপাই স্বাদযুক্ত কিছু নয়। Sour Cream, tomato বা BBQ-এর মধ্যেই থাকবে উত্তর। অতএব, আপনি এই ধরণের প্রশ্নের বিকল্পগুলির একটি নির্দিষ্ট সেট থেকে একটি উত্তর বেছে নিতে পারেন। আপনার মানুষ বন্ধু আপনাকে এখন জানিয়েছে যে আপনি যে সমস্যাটি সফলভাবে আবিষ্কার করেছেন-তার নাম Classification.

এখন আসা যাক বাকী কোয়েশ্চনগুলোর ক্ষেত্রে। দাম সম্পর্কে কি আপনার বেসিক কোন আইডিয়া আছে?নেই, তো আর কী করা? হাতের কাছে ডাটা ছাড়া তো কিছুই নেই। ডাটা আপনাকে বললো, ১৬ আউন্সের Hay’s Chips এর দাম ৩.৬৬ ডলার। এই চিপ্সের ফ্লেভার হচ্ছে পেঁয়াজ এবং Sour Cream-এর. অন্যদিকে একটা ৮ আউন্সের Tingles চিপ্সের প্যাকেটের দাম ২ ডলার। এই চিপ্সটা টমেটো সালসা ফ্লেভারের। আপনি অবাক হয়ে খেয়াল করলেন, ডাটা থেকে আপনি অনেক কিছুই জানেন। যেমনঃ প্যাকেট সাইজ, ফ্লেভার, কী কী জিনিস ব্যাবহার করা হয়েছে একেক রকম চিপ্সে। আর সবগুলোর দামও নিশ্চয়ই ৩.৬৬ বা ২ ডলার হয় না। দাম অবশ্যই হেরফের করে একেক বিষয়ের উপর ডিপেন্ড করে।

উদাহরণস্বরূপ, চিপসের প্রথম 5 টি স্যাম্পলের দাম এরকম $ 2.19, $ 4.10, $ 3.50, $ 2.20 এবং $ 2.50, স্যাম্পলের দাম কেবল এই রেঞ্জের মধ্যে থাকতে হবে এমন কোনও নিয়ম নেই। $ 1.99 বা 50 4.50 হতে পারে, ডিপেন্ড করছে কতটা জটিল ফ্লেভার ইউজ করা হচ্ছে এবং প্যাকেটের সাইজ কেমন। আরেকটু খেয়াল করুন যে, আপনার মানুষ বন্ধু এটিকে একটি “Regression” হিসাবে অভিহিত করছে।

এই টাইপের Regression-কে বলে “Time Series Regression”. এই টাইপের Regression-এ আপনাকে অতীতের দামগুলোকে ব্যবহার করে একটা পার্টিকুলার জিনিসের দাম ফিউচারে কেমন হবে সেটা predict করতে হয়, আর পুরো প্রেডিকশনটা করতে হবে সময়ের সাথে। আপনার তিন নাম্বার প্রবলেমটা টাইম সিরিজ প্রবলেম। এ মাসের ডিমান্ডের উপর নির্ভর করে সামনের মাসে কেমন ডিমান্ড হবে-সেটা প্রেডিক্ট করা। আর একইভাবে, এই মাসের সেলসের উপর ডিপেন্ড করে সামনের মাসের সেলস প্রেডিক্ট করা। হয়তো বুঝতে পারছেন না, সমস্যা নেই। মানুষ বন্ধু তো আছেই, আপনাকে বুঝিয়ে দেয়ার জন্য।

এখন আপনি কিছু রিয়েল লাইফ কাজ করার জন্য একদম রেডি। কীভাবে ডাটা থেকে কোয়েশ্চন আইডেন্টফাই করতে হয়, এবং কীভাবে এপ্রোচ করতে হয়- সবকিছুই আপনি জানেন।

জয়েন করুন "Data Science On-live Course"-এঃ https://ostad.app/batch/data-science

Writer: Marjan Ferdousi, CTO at Insight Labs-Metsys, Fujitsu Research Institute, BUET CSE

Share this article

RELATED ARTICLES

ডাটা সায়েন্টিস্ট হওয়ার ৮ টি স্টেপ

আপনার কি মনে হচ্ছে না, ডেটা সাইনটিস্ট হওয়ার এখনি সময়? একবার চারপাশে খেয়াল করুন তো! তাহলে দেখতে পাবেন ডেটা সায়েন্স এখন সব জায়গায়। একের পর এক, ওয়ার্ল্ডওয়াইড কোম্পানিগুলো সবচেয়ে ডাইভার্স প্রবলেমগুলোর সলিউশনের জন্য ডেটা সায়েন্সের দিকে ঝুঁকছে।  এই পরিস্থিতি ডেটা সাইনটিস্টদের জব সেক্টর ও স্যালারি স্ট্রাকচার কিন্তু খুবই অ্যাডভান্টেজ পজিশনে আছে। তাই আর দেরি কেন?? ৮ টি স্টেপ ফলো করে, আপনিও হতে পারেন একজন ডাটা সায়েন্টিস্ট। 1. Learn data wrangling, data visualization, and reporting  আপনি যখন ডেটা সায

15 May 2024

যেভাবে সিভি/ রেজিউমে বানালে তা আপনাকে চাকরির নিশ্চয়তা দেবে

ডিজাইন সিভি তৈরি করে কঠিন হলে ও অসম্ভব নয় কিন্তু! -----লার্ন ডিজাইন// “প্রথমেই বলে নেয়া ভালো চাকরি পাওয়ার জন্য কোনো জটিল কিংবা দুর্বোধ্য সিভি বা রেজিউমে বানানোর প্রয়োজন নেই। একটি সিম্পল এবং রেলেভেন্ট সিভি হায়ারিং ম্যানেজারদের ইম্প্রেস করার জন্য যথেষ্ট। ডিজাইনার হিসেবে আপনি হয়তো মনযোগ আকর্ষনের জন্য কমপ্লেক্স এবং ইউনিক ডিজাইনের সিভসি/রেজিউমে বানানোর কথা ভাবছেন।কিন্তু সিভিটি যথাসম্ভব সিম্পল ও রেলেভেন্ট করা ভালো। কারণ যিনি প্রথমে আপনার সিভিটি দেখবেন তিনি হয়তো ডিজাইনার নাও হতে পারেন। একট

02 October 2023

মার্কেটিংয়ে ডেটা সায়েন্স ব্যবহার করার ৫টি উপায়

মার্কেটিংয়ে ডেটা সায়েন্সের ভূমিকা আপনি কি কখনো অনলাইন কোনো প্ল্যাটফর্ম থেকে কোনো কিছু কেনা কাটা করেছেন? করতে গিয়ে আপনি নিশ্চয়ই খেয়াল করেছেন যে, আপনাকে সবসময় একই ধরনের কিছু পণ্য ও সামগ্রী কিনার বিজ্ঞাপন দেখানো হয়। এখানেই রয়েছে মার্কেটিং জগতে ডেটা সায়েন্সের প্রয়োগ।  বর্তমান দুনিয়ার বেশিরভাগ ডেটা গত দুই বছরে তৈরি করা হয়েছে। তার সাথে সাথে আগের চেয়ে কোম্পানিগুলো আরো দ্রুত এই ডেটাসমূহ সংগ্রহ এবং অ্যানালাইস করতে পারছে। একজন ব্যক্তি যতবার একটি প্রতিষ্ঠানের ওয়েবসাইট, সোশ্যাল মিডিয়া পৃষ্ঠা বা POS সিস

01 October 2023

1 min read

পাইথনে দক্ষতা বৃদ্ধির জন্য ৫টি চ্যালেঞ্জ

পাইথনের বহুমুখী ব্যবহারযোগ্যতার কারণে বর্তমান বিশ্বে পাইথন সবচেয়ে জনপ্রিয় প্রোগ্রামিং ল্যাংগুয়েজ। পাইথন ভাষাটি ডেটা সায়েন্টিস্ট, ওয়েব ডেভেলপার এবং সফ্টওয়্যার ডেভেলপার সহ সকল ব্যাকগ্রাউন্ডের মানুষেরা ব্যবহার করে থাকে। তাই আপনি যদি পেশাগতভাবে ডেটা সাইন্সকে বেছে নিতে চান, তাহলে আপনার জন্য পাইথন ভাষাটিতে দক্ষতা অর্জন খুবই জরুরি।  পাইথন চ্যালেঞ্জগুলো নেয়ার কারণ কী?  কোডিং চ্যালেঞ্জগুলো আপনাকে আপনার পাইথনের সকল খুঁটিনাটি নলেজ গুলোকে প্র্যাকটিসে রাখতে হেল্প করে। এখানে আমরা কিছু চ্যালেঞ্জের কথা বলে

01 October 2023

অনলাইন লাইভ স্কিল ডেভেলপমেন্ট প্ল্যাটফর্ম।

ডাউনলোড করুন ওস্তাদ অ্যাপ

কমিউনিটি -এর সাথে কানেক্টেড থাকতে