মেশিন লার্নিংয়ের পরিসংখ্যান: একটি শিক্ষানবিশ গাইড



মেশিন লার্নিংয়ের জন্য পরিসংখ্যান সম্পর্কিত এই নিবন্ধটি উদাহরণ সহ বিভিন্ন ধারণা ওএস পরিসংখ্যান সম্পর্কিত একটি বিস্তৃত গাইড guide

ডেটা বোঝা এবং এ থেকে মান তৈরি করতে সক্ষম হওয়া দশকের দক্ষতা। মেশিন লার্নিং এমন একটি মূল দক্ষতা যা সংস্থাগুলি এটি পূরণ করতে সহায়তা করে। তবে, শুরু করার জন্য আপনার ঠিক ভিত্তি তৈরি করা দরকার। সুতরাং, এই নিবন্ধে, আমি কয়েকটি প্রাথমিক ধারণাটি কভার করব এবং মেশিন লার্নিংয়ে আপনার যাত্রা শুরু করার জন্য আপনাকে গাইডলাইন সরবরাহ করব। সুতরাং, মেশিন লার্নিংয়ের পরিসংখ্যান সম্পর্কিত এই নিবন্ধে, নিম্নলিখিত বিষয়গুলি আলোচনা করা হবে:

  1. সম্ভাবনা
  2. পরিসংখ্যান
  3. রৈখিক বীজগণিত

মেশিন লার্নিংয়ের সম্ভাবনা এবং পরিসংখ্যান:





সম্ভাবনা কী?

সম্ভাবনা পরিমাণে ঘটার সম্ভাবনার পরিমাণকে প্রমাণ করে। উদাহরণস্বরূপ, আপনি যদি কোনও ফর্সা, নিরপেক্ষ মরা রোল করেন তবে সম্ভাবনা এক বাঁক আপ 1/6 । এখন, আপনি যদি ডাব্লু ভাবছেনহাই? তাহলে উত্তরটি বেশ সহজ!

এটি কারণ ছয়টি সম্ভাবনা রয়েছে এবং সবগুলিই সমানভাবে সম্ভাবনা রয়েছে (ফর্সা ডাই)। সুতরাং আমরা যোগ করতে পারেন 1 + 1 + 1 + 1 + 1 + 1 = 6। তবে, যেহেতু আমরা আগ্রহী ইভেন্ট যেখানে 1 আপ হয় । এখানে ইভেন্টটি ঘটতে পারে কেবল একটি উপায়। অতএব,



1 টি পরিণত হওয়ার সম্ভাবনা = 1/6

অন্যান্য সমস্ত সংখ্যার ক্ষেত্রেও একই ঘটনা যেমনটি ঘটে থাকে তেমনই সমস্ত ঘটনা সমান সম্ভাবনাযুক্ত। সরল, তাই না?

ঠিক আছে, এই উদাহরণটির জন্য সম্ভাবনার একটি ঘন ঘন সংজ্ঞাটি মনে হবে - 1 টার্ন আপ হওয়ার সম্ভাবনা হ'ল ডাইয়ের অসীম সংখ্যাকে ঘূর্ণিত করা হলে ডাই ডোলানো মোট সময় পর্যন্ত 1 বার হওয়া সংখ্যার অনুপাত 1 বারএটি কীভাবে বোঝায়?



আসুন এটি আরও আকর্ষণীয় করে তুলি। দুটি ক্ষেত্রে বিবেচনা করুন - আপনি 5 বার একটি ন্যায্য মরা ঘূর্ণিত। একটি ক্ষেত্রে সংখ্যার সক্রিয়করণের ক্রমটি হ'ল - [1,4,2,6,4,3]। অন্য ক্ষেত্রে, আমরা পাই - [2,2,2,2,2,2]। আপনি কোনটি সম্ভবত বেশি বলে মনে করেন?

উভয়ই সমান সম্ভাবনা। অদ্ভুত মনে হচ্ছে?

এখন, অন্য একটি ক্ষেত্রে বিবেচনা করুন যেখানে প্রতিটি ক্ষেত্রে সমস্ত 5 রোল রয়েছে স্বতন্ত্র । অর্থ, একটি রোল অন্যটিকে প্রভাবিত করে না। প্রথম ক্ষেত্রে, যখন 6 টি পরিণত হয়, তখন এটির আগে 2 টি পরিণত হওয়ার কোনও ধারণা ছিল না। অতএব, সমস্ত 5 রোল সমান সম্ভাবনা রয়েছে।

একইভাবে, দ্বিতীয় ক্ষেত্রে সোজা 2s স্বাধীন ইভেন্টগুলির ক্রম হিসাবে বোঝা যায়। এবং এই সমস্ত ঘটনা সমান সম্ভাবনা। সামগ্রিকভাবে যেহেতু আমাদের একই ডাইস রয়েছে, প্রথম ক্ষেত্রে ক্ষেত্রে যদি একটি নির্দিষ্ট সংখ্যার উপরে যাওয়ার সম্ভাবনা থাকে তবে কেস টু হিসাবে একই হয়। পরবর্তী, মেশিন লার্নিংয়ের পরিসংখ্যান সম্পর্কিত এই নিবন্ধে, আসুন শব্দটি বুঝতে পারি understand স্বাধীনতা।

স্বাধীনতা

দুটি ঘটনা A এর ঘটনা ঘটনা B কে প্রভাবিত না করলে A এবং B স্বতন্ত্র বলে বলা হয় । উদাহরণস্বরূপ, আপনি যদি একটি মুদ্রা টস করেন এবং একটি ডাই রোল করেন তবে মুদ্রাটি মাথা বা লেজ দেখায় কিনা তা মরার ফলাফলের কোনও প্রভাব নেই। এছাড়াও, জন্য দুটি স্বাধীন ঘটনা ক এবং খ , দ্য A এবং B একসাথে ঘটতে পারে এমন সম্ভাবনা । সুতরাং উদাহরণস্বরূপ, আপনি যদি সেই সম্ভাবনাটি চান যা মুদ্রা প্রধান দেখায় এবং ডাই শো 3।

পি (এ এবং বি) = পি (এ) * পি (বি)

অতএব পি = এবং frac12 (মাথা ঘুরিয়ে নেওয়ার সম্ভাবনা) * ⅙ (3 টি বাঁকানোর সম্ভাবনা) = 1/12

পূর্ববর্তী উদাহরণে, উভয় ক্ষেত্রে, পি = ⅙ * ⅙ * ⅙ * ⅙ * ⅙ * ⅙ ⅙

এখন আসুন এমন ঘটনাগুলির বিষয়ে কথা বলি যা স্বাধীন নয়। নিম্নলিখিত টেবিলটি বিবেচনা করুন:

স্থূল স্থূল নয়
হৃদপিণ্ডজনিত সমস্যাচার পাঁচপনের
হার্টের সমস্যা নেই1030

১০০ জনের একটি সমীক্ষা নেওয়া হয়েছিল। 60 এর হার্টের সমস্যা ছিল এবং 40 জন হ'ল না। হৃদরোগের 60 টির মধ্যে 45 জন স্থূল ছিলেন। 40 টির মধ্যে হার্টের সমস্যা নেই, 10 স্থূল ছিলেন। যদি কেউ আপনাকে জিজ্ঞাসা করে -

  1. হার্টের সমস্যা হওয়ার সম্ভাবনা কত?
  2. হার্টের সমস্যা হওয়া এবং স্থূল না হওয়ার সম্ভাবনা কী?

প্রথম প্রশ্নের উত্তর সহজ - 60/100। দ্বিতীয়টির জন্য, এটি 15/100 হবে। এখন তৃতীয় প্রশ্নটি বিবেচনা করুন - এলোমেলোভাবে একজনকে বাছাই করা হয়েছিল। তাকে হৃদরোগ হয়েছে বলে জানা গেছে। সে স্থূলতার সম্ভাবনা কী?

mongodb কি জন্য ব্যবহৃত হয়

এখন আপনাকে দেওয়া তথ্য সম্পর্কে চিন্তা করুন - জানা যায় যে তাঁর হৃদরোগ রয়েছে। সুতরাং তিনি 40 জনের মধ্যে হতে পারবেন না যাদের হৃদরোগ নেই। সম্ভাব্য মাত্র 60 টি বিকল্প রয়েছে (টেবিলের শীর্ষ সারি)। এখন, এই হ্রাস সম্ভাবনার মধ্যে, তার স্থূলত্বের সম্ভাবনা 45/60। এখন, আপনি জানেন যে, স্বাধীন ইভেন্টগুলি কী, মেশিন লার্নিংয়ের পরিসংখ্যান সম্পর্কিত এই নিবন্ধে, আসুন শর্তযুক্ত সম্ভাবনাগুলি বুঝতে পারি।

শর্তাধীন সম্ভাবনা

শর্তসাপেক্ষ সম্ভাব্যতা বুঝতে, আসুন উপরের উদাহরণ দিয়ে আমাদের আলোচনা চালিয়ে নেওয়া যাক। স্থূলত্বের স্থিতি এবং হার্টের সমস্যায় ভুগার অবস্থা স্বাধীন নয়। যদি স্থূলকায় হওয়া হৃদপিণ্ডের সমস্যাগুলিকে প্রভাবিত না করে, তবে হৃদপিণ্ডের সমস্যাযুক্ত লোকদের মধ্যে স্থূলকায় ও স্থূলবিহীন মামলার সংখ্যা একই ছিল।

এছাড়াও, আমাদের দেওয়া হয়েছিল যে ব্যক্তির হার্টের সমস্যা রয়েছে এবং সে স্থূলতার সম্ভাবনা আমাদের খুঁজে বের করতে হয়েছিল। সুতরাং, সম্ভাব্যতা, এই ক্ষেত্রে, তাকে হৃদরোগের সমস্যা আছে কিনা তা শর্তযুক্ত বলা হয়। ইভেন্ট ইভেন্টে ঘটনার সম্ভাবনাটি যদি ইভেন্ট বি তে শর্তযুক্ত হয় তবে আমরা এটিকে উপস্থাপন করি

পি (এ | বি)

এখন, একটি উপপাদ্য রয়েছে যা আমাদের এই শর্তাধীন সম্ভাবনা গণনা করতে সহায়তা করে। একে বলা হয় the বেয়েস বিধি

পি (এ | বি) = পি (এ এবং বি) / পি (বি)

আমরা কেবল আলোচিত উদাহরণটি প্লাগ করে আপনি এই উপপাদ্যটি পরীক্ষা করতে পারেন। যদি আপনি এখনও অবধি বুঝতে পেরেছেন তবে আপনি নিম্নলিখিতটি দিয়ে শুরু করতে পারেন - নাইভ বেয়েস । এটি ইমেলটি স্প্যাম কিনা তা শ্রেণিবদ্ধ করতে শর্তযুক্ত সম্ভাবনাগুলি ব্যবহার করে। এটি অন্যান্য অনেক শ্রেণিবদ্ধকরণ কার্য সম্পাদন করতে পারে। তবে মূলত, শর্তাধীন সম্ভাবনা হ'ল ।

পরিসংখ্যান:

পরিসংখ্যান হয় বিপুল সংখ্যক ডেটা পয়েন্ট সম্পর্কে সংক্ষিপ্তসার এবং ইনফরমেশনগুলি ব্যবহার করতে ব্যবহৃত হয়। ডেটা সায়েন্স এবং মেশিন লার্নিংয়ে আপনি প্রায়শই নিম্নলিখিত পরিভাষা জুড়ে আসবেন

  • কেন্দ্রিকতা ব্যবস্থা
  • বিতরণ (বিশেষত স্বাভাবিক)

কেন্দ্রীভূতকরণের পদক্ষেপ এবং স্প্রেডের ব্যবস্থা

গড়:

গড় মাত্র একটি সংখ্যার গড় । গড়টি খুঁজে পেতে, আপনাকে সংখ্যাগুলি যোগ করতে হবে এবং সংখ্যার সংখ্যার সাথে ভাগ করতে হবে। উদাহরণস্বরূপ, [1,2,3,4,5] এর গড় 15/5 = 3।

mean-statistics-for-machine-learning

মধ্যমা:

মিডিয়ান হয় সংখ্যার একটি সেট মধ্যম উপাদান যখন তারা আরোহী ক্রমে সাজানো হয়। উদাহরণস্বরূপ, [1,2,4,3,5] নম্বরগুলি একটি আরোহী ক্রমে সাজানো হয়েছে [1,2,3,4,5]। এর মধ্যবর্তী একটিটি হ'ল 3. সুতরাং মধ্যকটি 3 হয় তবে সংখ্যার সংখ্যাটি সমান এবং তাই কোনও মাঝারি সংখ্যা না থাকলে কী হবে? সেক্ষেত্রে আপনি দুটি মধ্য-সর্বাধিক সংখ্যার গড় নেন। আরোহী ক্রমে 2n সংখ্যার ক্রমের জন্য, গড় নবম এবং (n + 1)তমমিডিয়ান পেতে সংখ্যা। উদাহরণ - [1,2,3,4,5,6] এর মাঝারি (3 + 4) / 2 = 3.5 রয়েছে

মোড:

মোড সহজভাবে হয় সংখ্যার সেটগুলিতে সর্বাধিক ঘন সংখ্যা । উদাহরণস্বরূপ, [1,2,3,3,4,5,5,5] এর মোড 5।

বৈচিত্র:

বৈকল্পিকতা কোনও কেন্দ্রীয়তা পরিমাপ নয়। এটি পরিমাপ করে আপনার ডেটা কীভাবে চারদিকে ছড়িয়ে পড়ে । এটি হিসাবে পরিমাণযুক্ত

এক্সএন সংখ্যাগুলির গড় is আপনি একটি বিন্দু নিন, গড়কে বিয়োগ করুন, এই পার্থক্যের বর্গ নিন। সমস্ত এন নম্বরগুলির জন্য এটি করুন এবং তাদের গড় করুন। বৈকল্পিকের বর্গমূলকে স্ট্যান্ডার্ড বিচ্যুতি বলে। এর পরে, মেশিন লার্নিংয়ের পরিসংখ্যান সম্পর্কিত এই নিবন্ধে আসুন আমরা সাধারণ বিতরণটি বুঝতে পারি।

স্বাভাবিক বন্টন

বিতরণ আমাদের সহায়তা করে আমাদের ডেটা কীভাবে ছড়িয়েছে তা বুঝুন । উদাহরণস্বরূপ, বয়সের উদাহরণে, আমরা বয়স্ক প্রাপ্তবয়স্কদের চেয়ে তরুণদের বেশি থাকতে পারি এবং তাই বয়সের ছোট মানগুলি বৃহত্তর মানগুলির চেয়ে বেশি। তবে কীভাবে আমরা একটি বন্টন সংজ্ঞায়িত করব? নীচের উদাহরণ বিবেচনা করুন

Y- অক্ষগুলি ঘনত্বের প্রতিনিধিত্ব করে। এই বিতরণটির মোড 30 হ'ল এটি চূড়া এবং অতএব সবচেয়ে ঘন ঘন। আমরা মাঝারিটিও সনাক্ত করতে পারি। মিডিয়ান এক্স-অক্ষের সেই বিন্দুতে অবস্থিত যেখানে বক্ররেখার অধীনে অর্ধেক অঞ্চল আচ্ছাদিত। যে কোনও সাধারণ বিতরণের অন্তর্গত অঞ্চলটি 1 কারণ সমস্ত ইভেন্টের সম্ভাবনার যোগফল 1 হয় example উদাহরণস্বরূপ,

উপরের ক্ষেত্রে মাঝারিটি প্রায় ৪. এটির অর্থ হ'ল 4 এর আগে বক্ররেখার অধীনে অঞ্চলটি 4 এর পরে একই হয় another অন্য উদাহরণ বিবেচনা করুন

দূরবর্তী পদ্ধতির প্রার্থনা জাভা উদাহরণ

আমরা তিনটি সাধারণ বিতরণ দেখতে পাই। নীল এবং লাল রঙেরগুলির একই অর্থ রয়েছে। লালটির একটি বৃহত্তর বৈচিত্র রয়েছে। সুতরাং, এটি নীল রঙের চেয়ে বেশি ছড়িয়ে পড়ে। তবে অঞ্চলটি যেহেতু 1 হতে হবে, তাই অঞ্চলটি অবিচ্ছিন্ন রাখতে লাল বক্ররেখার শিখরটি নীল বক্ররের চেয়ে ছোট।

আশা করি আপনি প্রাথমিক পরিসংখ্যান এবং সাধারণ বিতরণগুলি বুঝতে পেরেছেন। এখন, মেশিন লার্নিংয়ের পরিসংখ্যান সম্পর্কিত এই নিবন্ধের পরবর্তী, আসুন লিনিয়ার বীজগণিত সম্পর্কে শিখি।

রৈখিক বীজগণিত

লিনিয়ার বীজগণিত ছাড়া আধুনিক এআই সম্ভব হবে না। এটি এর মূল গঠন গভীর জ্ঞানার্জন এমনকি সাধারণ অ্যালগরিদমে এমনকি ব্যবহৃত হয়েছে । আর কোনও দেরি না করে চলুন শুরু করা যাক।

আপনার অবশ্যই ভেক্টরগুলির সাথে পরিচিত হতে হবে। এগুলি মহাকাশে এক ধরণের জ্যামিতিক উপস্থাপনা। উদাহরণস্বরূপ, একটি ভেক্টর [3,4] এর এক্স-অক্ষের সাথে 3 ইউনিট এবং y- অক্ষ সহ 4 ইউনিট রয়েছে। নিম্নলিখিত চিত্রটি বিবেচনা করুন -

ভেক্টর ডি 1 এর এক্স-অক্ষ বরাবর 0.707 ইউনিট এবং y- অক্ষ সহ 0.707 ইউনিট রয়েছে। একটি ভেক্টরটির 1 টি মাত্রা রয়েছে। অগত্যা এটির বিশালতা এবং দিক রয়েছে has উদাহরণ স্বরূপ,

উপরের চিত্রটিতে একটি ভেক্টর রয়েছে (4,3)। এর দৈর্ঘ্য 5 এবং এটি এক্স-অক্ষের সাহায্যে 36.9 ডিগ্রি করে।

এখন, ম্যাট্রিক্স কী? ম্যাট্রিক্স একটি সংখ্যার বহুমাত্রিক অ্যারে। এটি কি জন্য ব্যবহার করা হয়? আমরা সামনে দেখতে পাবেন। তবে প্রথমে এটি কীভাবে ব্যবহৃত হয় তা দেখুন।

ম্যাট্রিক্স

একটি ম্যাট্রিক্সের অনেকগুলি মাত্রা থাকতে পারে। আসুন একটি 2-মাত্রিক ম্যাট্রিক্স বিবেচনা করুন। এটিতে সারি (এম) এবং কলাম (এন) রয়েছে। সুতরাং এটিতে এম * এন উপাদান রয়েছে।

উদাহরণ স্বরূপ,

এই ম্যাট্রিক্সে 5 টি সারি এবং 5 টি কলাম রয়েছে। আসুন একে এ বলে ডাকি। সুতরাং এ (২,৩) হ'ল দ্বিতীয় সারিতে এবং তৃতীয় কলামে প্রবেশ 8 টি 8

এখন, যে আপনি ম্যাট্রিক্স কী তা জানেন, আমাদের ম্যাট্রিক্সের বিভিন্ন অপারেশনগুলি সন্ধান করতে দিন।

ম্যাট্রিক্স অপারেশনস

ম্যাট্রিক্সের সংযোজন

দুটি ম্যাট্রিক একই মাত্রা যোগ করা যেতে পারে। সংযোজন ঘটে উপাদান অনুসারে।

স্কেলার গুণ

একটি ম্যাট্রিক্স একটি স্কেলারের পরিমাণ দ্বারা গুণ করা যায়। এ জাতীয় একটি গুণাগুণ ম্যাট্রিক্সের প্রতিটি প্রবেশকে স্কেলারের দ্বারা বহুগুণে নিয়ে যায়। একটি স্কেলারটি কেবল একটি সংখ্যা

একটি গতিশীল অ্যারে কি

ম্যাট্রিক্স ট্রান্সপোজ

ম্যাট্রিক্স ট্রান্সপোজ সহজ। ম্যাট্রিক্স এ (মি, এন) এর জন্য, এটিকে এর ট্রান্সপোজ হতে দিন। তারপরে

এ '(আই, জে) = এ (জে, আই)

উদাহরণ স্বরূপ,

ম্যাট্রিক্স গুণ

এটি অন্যান্য অপারেশনগুলির চেয়ে সম্ভবত কিছুটা জটিল। আমরা এতে ডুব দেওয়ার আগে আসুন দুটি ভেক্টরের মধ্যে ডট পণ্যটি সংজ্ঞায়িত করা যাক।

ভেক্টর এক্স = [1,4,6,0] এবং ভেক্টর ওয়াই = [2,3,4,5] বিবেচনা করুন। তারপরে এক্স এবং ওয়াইয়ের মধ্যে ডট পণ্য হিসাবে সংজ্ঞায়িত করা হয়

এক্স.ওয়াই = 1 * 2 + 4 * 3 + 6 * 4 + 0 * 5 = 38

সুতরাং এটি উপাদান অনুসারে গুণ ও সংযোজন। এখন,আসুন দুটি (ম, এন) এবং বি (এন, কে) দুটি ম্যাট্রিক বিবেচনা করুন, যেখানে এম, এন, কে মাত্রা এবং তাই পূর্ণসংখ্যা হয়। আমরা ম্যাট্রিক্সের গুণকে হিসাবে সংজ্ঞায়িত করি

উপরের উদাহরণে, পণ্যটির প্রথম উপাদানটি (44) ডান ম্যাট্রিক্সের প্রথম কলাম সহ বাম ম্যাট্রিক্সের প্রথম সারির ডট পণ্য দ্বারা প্রাপ্ত হয়। একইভাবে, ডান ম্যাট্রিক্সের দ্বিতীয় কলামের সাথে বাম ম্যাট্রিক্সের প্রথম সারির ডট পণ্য দ্বারা 72 পাওয়া যায়।

নোট করুন যে বাম ম্যাট্রিক্সের জন্য, কলামগুলির সংখ্যা ডান কলামে সারি সংখ্যার সমান হওয়া উচিত। আমাদের ক্ষেত্রে, পণ্য AB উপস্থিত রয়েছে তবে BA নয় যেহেতু m k এর সমান নয়। দুটি ম্যাট্রিকের জন্য এ (এম, এন) এবং বি (এন, কে), পণ্য এবি সংজ্ঞায়িত করা হয় এবং পণ্যটির মাত্রা (এম, কে) (বাইরের সর্বাধিক মাত্রা (এম, এন), (এন, কে ))। তবে বিএ সংজ্ঞায়িত হয় না যতক্ষণ না মি = কে।

এটির সাথে আমরা স্ট্যাটিসটিক্স ফর মেশিন লার্নিংয়ের এই নিবন্ধটি শেষ করেছি। আমি আশা করি আপনি কিছু মেশিন লার্নিং জারগন কিছু বুঝতে পেরেছেন। যদিও এটি এখানেই শেষ হয় না। আপনি শিল্প প্রস্তুত কিনা তা নিশ্চিত করতে, আপনি ডেটা সায়েন্স এবং এআইতে এডুরিকার পাঠ্যক্রমগুলি পরীক্ষা করে দেখতে পারেন। তারা পাওয়া যাবে