গড়, মধ্যম এবং মোড ক্যালকুলেটর
যেকোন ডেটা সেটের জন্য গড়, মধ্যমা, মোড, রেঞ্জ এবং অন্যান্য পরিসংখ্যান গণনা করুন। তাত্ক্ষণিক, সঠিক ফলাফলের জন্য এই বিনামূল্যে অনলাইন গণিত ক্যালকুলেটরটি ব্যবহার করুন। কোন সাইনআপ নেই।
কেন্দ্রীয় প্রবণতার পরিমাপগুলি বোঝা
পরিসংখ্যানে,কেন্দ্রীয় প্রবণতার পরিমাপএকক মান যা একটি ডেটা সেটের কেন্দ্রীয় বা আদর্শ মান বর্ণনা করে। তিনটি সবচেয়ে গুরুত্বপূর্ণ মান হল গড়, মধ্যম, এবং মোড -- প্রত্যেকটি আপনাকে ডেটা সম্পর্কে ভিন্ন কিছু বলে, এবং প্রত্যেকটি বিভিন্ন পরিস্থিতিতে সবচেয়ে উপযুক্ত।
এই ডেটা সেট বিবেচনা করুনঃ পরীক্ষার স্কোর {55, 60, 70, 75, 75, 80, 95} প্রতিটি পরিমাপ একটি ভিন্ন দৃষ্টিকোণ দেয়ঃ
| ব্যবস্থা | মূল্য | কিভাবে হিসাব করা হয় | সেরা জন্য |
|---|---|---|---|
| গড় (গড়) | ৭২.৯ | (55+60+70+75+75+80+95) / 7 | সিম্যাট্রিক বন্টন |
| মধ্যম (মধ্যম মান) | 75 | বাছাইকৃত তথ্যের মধ্যম মান | বিভক্ত বন্টন, বহিরাগত মান |
| মোড (সবচেয়ে ঘন) | 75 | সর্বাধিক পুনরাবৃত্ত মান | শ্রেণিবদ্ধ তথ্য, শিখর খোঁজা |
| পরিসীমা | 40 | সর্বোচ্চ - সর্বনিম্ন = 95 - 55 | স্প্রেড পরিমাপ |
কোন একক পরিমাপ সর্বজনীনভাবে "সেরা" নয়। একটি ডেটা বিশ্লেষক বিতরণ আকৃতির উপর ভিত্তি করে উপযুক্ত পরিমাপ নির্বাচন করে, বহিরাগতদের উপস্থিতি, এবং প্রশ্ন জিজ্ঞাসা করা হচ্ছে। তিনটি - প্লাস তাদের সীমাবদ্ধতা বোঝা - পরিসংখ্যানগত সাক্ষরতার জন্য মৌলিক।
গড় (গণিত গড়): কিভাবে এটি গণনা করা যায়
দ্যগাণিতিক গড়হল সকল মানের যোগফলকে মানের সংখ্যার দ্বারা ভাগ করা। এটি কেন্দ্রীয় প্রবণতার সর্বাধিক ব্যবহৃত পরিমাপ এবং বেশিরভাগ লোকেরা যখন "গড়" বলে তখন তা বোঝায়।
সূত্রঃ গড় (x̄) = (Σxi) / n
যেখানে Σxi হল সমস্ত মানের যোগফল এবং n হল গণনা।
উদাহরণ:তথ্য = {3, 7, 8, 5, 12, 4, 9, 6}
- সমষ্টি: ৩ + ৭ + ৮ + ৫ + ১২ + ৪ + ৯ + ৬ = ৫৪
- গণনাঃ ৮টি মান
- গড় = 54 / 8 =৬.৭৫
গড় সংবেদনশীলবহিরাগতউদাহরণস্বরূপ, যদি উপরের সেটের একটি মান 12 এর পরিবর্তে 100 হয়, তবে গড়টি (54 - 12 + 100) / 8 = 142 / 8 = 17.75 এ ঝাঁপিয়ে পড়বে, যা বাকি তথ্যের "সাধারণ" মান থেকে অনেক দূরে।
বিশেষায়িত ব্যবহারের জন্য অন্যান্য ধরনের উপকরণঃ
- জ্যামিতিক গড়ঃn√(x1 x x2 x ... x xn) -- বৃদ্ধির হার, রিটার্ন, অনুপাতের জন্য ব্যবহৃত হয়
- হরমোনিক গড়ঃn / (1/x1 + 1/x2 + ... + 1/xn) -- গতি, হার, ইউনিট প্রতি মূল্যের জন্য ব্যবহৃত হয়
- ওজনযুক্ত গড়ঃΣ(wixi) / Σwi -- যখন ডেটা পয়েন্টের গুরুত্ব ভিন্ন হয় তখন ব্যবহৃত হয় (যেমন, GPA)
মিডিয়ান: মধ্যম মান
দ্যমধ্যমএকটি ডেটা সেটের মধ্যম মান যখন ক্রমবর্ধমান ক্রমে বাছাই করা হয়। এটি বিতরণকে ঠিক অর্ধেক ভাগ করে দেয়ঃ 50% মান মধ্যম এবং 50% এর উপরে পড়ে।
অদ্ভুত সংখ্যক মানের জন্যঃমিডিয়ান = (এন+১) /২ তম মান।
সমসংখ্যক মানের জন্যঃমিডিয়ান = n/2 th এবং (n/2 + 1) th মানের গড়।
| ডেটা সেট | n | বাছাই করা | মধ্যম |
|---|---|---|---|
| {4, 1, 9, 2, 6} | ৫ (অদ্ভুত) | {1, 2, 4, 6, 9} | ৪ (তৃতীয় মান) |
| {7, 3, 8, 5} | 4 (এমনকি) | {3, 5, 7, 8} | ৫+৭/২ = ৬ |
| {১০, ২০, ৩০, ৪০} | 4 (এমনকি) | {১০, ২০, ৩০, ৪০} | (২০+৩০/২ = ২৫) |
| {1, 1, 1, 1000} | 4 (এমনকি) | {1, 1, 1, 1000} | (1+1)/2 = 1 |
শেষ উদাহরণটি লক্ষ্য করুনঃ {1, 1, 1, 1000} এর গড় = 250.75, কিন্তু মধ্যমা = 1। এটি নিখুঁতভাবে চিত্রিত করে কেনবিভক্ত বন্টনগুলির জন্য গড়ের চেয়ে মধ্যমটি পছন্দ করা হয়মধ্যম আয়, আবাসন মূল্য, এবং হাসপাতালে থাকার সময়কাল সব মিডিয়ান হিসাবে রিপোর্ট করা হয় কারণ কয়েকটি অত্যন্ত উচ্চ মান গড়কে সাধারণ অভিজ্ঞতার প্রতিনিধিত্ব করে না।
মোডঃ সর্বাধিক ঘন ঘন মান
দ্যমোডএকটি ডেটা সেটে যে মানটি সবচেয়ে বেশি বার দেখা যায় তা হল:
- কোন মোড নেই:সমস্ত মান সমানভাবে প্রদর্শিত হয় (যেমন, {1, 2, 3, 4, 5})
- এক মোড (ইউনিমোডাল):একটি মান অন্য সবের চেয়ে বেশি প্রদর্শিত হয় (যেমন, {1, 2, 2, 3, 4} -> মোড = 2)
- দুটি মোড (বাইমোডাল):দুটি মান সবচেয়ে ঘন ঘন (যেমন, {1, 1, 2, 3, 3} -> মোড = 1 এবং 3)
- একাধিক মোড (মাল্টিমোডাল):তিন বা ততোধিক মান সবচেয়ে ঘন ঘন জন্য বদ্ধ
এই মোডটি বিশেষভাবে উপযোগীঃ
- শ্রেণিবদ্ধ তথ্যঃ"সবচেয়ে জনপ্রিয় জুতোর আকার কোনটি? (উদাহরণস্বরূপ, মার্কিন পুরুষদের জন্য আকার ১০)
- পৃথক তথ্য:"পরিবারে সাধারণত কয়টি সন্তান হয়?" (প্রায়শই ২ জন)
- বিতরণ আকৃতিঃএকটি বিমোডাল বন্টন (দুটি শিখর) আপনার ডেটাতে দুটি স্বতন্ত্র উপ-জনসংখ্যার পরামর্শ দেয় - অনুসন্ধানমূলক বিশ্লেষণে একটি সমালোচনামূলক গুরুত্বপূর্ণ সংকেত
| ডেটা সেট | মোড | প্রকার |
|---|---|---|
| {1, 2, 3, 4, 5} | নেই | কোন মোড নেই |
| {2, 4, 4, 6, 8} | 4 | ইউনিমডাল |
| {1, 1, 3, 5, 5} | ১ এবং ৫ | বিমোডাল |
| {a, b, b, c, c, d, d} | b, c, d | ট্রিমোডাল |
বিস্তারের পরিসীমা এবং অন্যান্য পরিমাপ
যখন গড়, মধ্যম, এবং মোড একটি বন্টনের কেন্দ্র বর্ণনা করে,ছড়িয়ে পড়ার পরিমাপএকটি ডেটা সেট বোঝার জন্য এগুলি সমানভাবে গুরুত্বপূর্ণ।
| ব্যবস্থা | সূত্র | উদাহরণ ({2, 4, 4, 6, 8}) | বহিরাগতদের প্রতি সংবেদনশীলতা |
|---|---|---|---|
| পরিসীমা | ম্যাক্স - মিনিট | ৮ - ২ = ৬ | খুব সংবেদনশীল |
| ইন্টারকোয়ার্টিল রেঞ্জ (আইকিউআর) | Q3 - Q1 | ৭ - ৩ = ৪ | প্রতিরোধী |
| ভেরিয়েন্স (σ2) | Σ ((xi - x̄) 2 / n | ৩.৪৪ | সংবেদনশীল |
| স্ট্যান্ডার্ড ডিভিয়েশন (σ) | √ভেরিয়েন্স | ১,৮৫৫ | সংবেদনশীল |
| গড় নিখুঁত বিচ্যুতি | Σ|xᵢ − x̄| / n | ১.৬ | মধ্যপন্থী |
{2, 4, 4, 6, 8} এর জন্যঃ গড় = 4.8, তাই বিচ্যুতি হলঃ (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24. বৈকল্পিক = (7.84+0.64+0.64+1.44+10.24) / 5 = 20.8 / 5 = 4.16. SD = √4.16 ~ 2.04.
স্ট্যান্ডার্ড ডিভিয়েশন হল পরিসংখ্যানের কাজের ঘোড়া -- এটি হাইপোথেসিস টেস্টিং, আস্থা ব্যবধান, স্বাভাবিক বন্টন গণনা এবং প্রক্রিয়া নিয়ন্ত্রণে প্রদর্শিত হয়। একটি নিম্ন স্ট্যান্ডার্ড ডিভিয়েশন মানে ডেটা গড়ের কাছাকাছি ক্লাস্টার করা হয়; একটি উচ্চ স্ট্যান্ডার্ড ডিভিয়েশন মানে ডেটা আরও ছড়িয়ে পড়ে।
কখন গড় বনাম মধ্যম বনাম মোড ব্যবহার করবেন
ভুল কেন্দ্রীয় প্রবণতা পরিমাপ নির্বাচন বিভ্রান্তিকর হতে পারে। এখানে একটি ব্যবহারিক গাইডঃ
| পরিস্থিতি | প্রস্তাবিত ব্যবস্থা | কেন? |
|---|---|---|
| সিম্যাট্রিক, কোন বহিরাগত | গড় | গাণিতিকভাবে সর্বাধিক পরিচালনাযোগ্য; সমস্ত ডেটা ব্যবহার করে |
| বিকৃত বন্টন | মধ্যম | চরম মান দ্বারা টানা না |
| আয় / আবাসন মূল্য | মধ্যম | কয়েকজন মিলিয়নেয়ার গড়কে উপরের দিকে ঠেলে দেয় |
| শ্রেণিবদ্ধ তথ্য | মোড | গড়/মিডিয়ান বিষয়শ্রেণীতে প্রযোজ্য নয় |
| সর্বাধিক সাধারণ মান | মোড | "সর্বাধিক জনপ্রিয়" এর সরাসরি উত্তর |
| গ্রেড গড় / জিপিএ | গড় (ওজনযুক্ত) | সমস্ত স্কোর সমানুপাতিকভাবে অবদান রাখে |
| স্টক রিটার্ন / বৃদ্ধির হার | জ্যামিতিক গড় | যৌগিক অ্যাকাউন্ট |
| বেঁচে থাকার সময়, হাসপাতালে থাকার সময় | মধ্যম | দীর্ঘমেয়াদী মামলা দ্বারা ডানদিকে skewed |
সুপরিচিত পর্যবেক্ষণঃ "গড় আমেরিকান একটি স্তন এবং একটি অণ্ডকোষ আছে" কেন bimodal বন্টন জন্য গড় বিভ্রান্তিকর হতে পারে চিত্রিত করে। এই ক্ষেত্রে, মোড (লিঙ্গ দ্বারা পৃথক) এবং মিডিয়ান সামগ্রিক গড় তুলনায় আরো তথ্যপূর্ণ বর্ণনাকারী হয়।
বাস্তব-বিশ্বের উদাহরণঃ গড়, মধ্যম, এবং মোড বাস্তবে
এই ধারণাগুলি কীভাবে বাস্তব পরিস্থিতিতে প্রয়োগ করা হয় তা বোঝা পরিসংখ্যানগত অন্তর্দৃষ্টি তৈরি করেঃ
- মার্কিন পরিবারের আয় (২০২৩):গড় ~ $ 105,000; মধ্যম ~ $ 74,580। এই ফাঁকটি আয় skewness প্রতিফলিত করে - খুব উচ্চ উপার্জনকারীদের একটি ছোট সংখ্যা নাটকীয়ভাবে গড় আপ টান। নীতি আলোচনা মধ্যম আয় ব্যবহার কারণ এটি ভাল "সাধারণ" পরিবারের প্রতিনিধিত্ব করে।
- দৌড় প্রতিযোগিতার সমাপ্তির সময়ঃ১০ কিলোমিটার দৌড়ে, গড় সমাপ্তির সময় মধ্যম সময়ের চেয়ে বেশি হতে পারে কারণ ধীর হাঁটা একটি দীর্ঘ ডান লেজ গঠন করে। মধ্যম সমাপ্তি প্যাকের রানারের বেশি প্রতিনিধিত্ব করে।
- ক্লাস টেস্টের স্কোরঃযদি একজন শিক্ষার্থী ৫/১০০ স্কোর করে এবং ২০ জন শিক্ষার্থী ৭৫-৯৫/১০০ স্কোর করে, তাহলে গড়কে বহিরাগত দ্বারা নীচে টেনে আনা হয়। শ্রেণীর পারফরম্যান্সকে আরও ভালভাবে উপস্থাপনের জন্য শিক্ষক মধ্যমটি রিপোর্ট করতে পারেন।
- জুতার আকারঃমোড হল সবচেয়ে কার্যকর পরিসংখ্যান -- খুচরা বিক্রেতারা মোডাল (সবচেয়ে সাধারণ) আকারের সর্বাধিক স্টক রাখে।
- গুণমান নিয়ন্ত্রণঃউত্পাদন ক্ষেত্রে, পণ্য পরিমাপের স্ট্যান্ডার্ড বিচ্যুতি প্রক্রিয়া ক্ষমতা নির্ধারণ করে। একটি নিম্ন SD এর অর্থ ধারাবাহিক উত্পাদন; একটি উচ্চ SD এর অর্থ উচ্চ ত্রুটি হার।
প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী
কোনটা ভালো, গড় নাকি মধ্যম?
উভয়ই সর্বজনীনভাবে ভাল নয় - তারা বিভিন্ন উদ্দেশ্যে কাজ করে। মধ্যমটি বহিরাগতদের বিরুদ্ধে আরও শক্তিশালী এবং skewed বন্টনগুলিতে (আয়ের, আবাসন মূল্য, বেঁচে থাকার সময়) "সাধারণ" প্রতিনিধিত্ব করে। গড়টি সমস্ত ডেটা পয়েন্ট ব্যবহার করে, সিম্যাট্রিক বন্টনের জন্য গাণিতিকভাবে সর্বোত্তম এবং স্ট্যান্ডার্ড বিচ্যুতি এবং অনুমান পরীক্ষার মতো আরও পরিসংখ্যানগত গণনার জন্য প্রয়োজনীয়। সম্পূর্ণ চিত্রের জন্য উভয়কে একসাথে ব্যবহার করুন।
একটি ডেটা সেটের কোন মোড থাকতে পারে না?
হ্যাঁ. যদি সমস্ত মান সমানভাবে ঘন ঘন ঘটে তবে কোনও মোড নেই (উদাহরণস্বরূপ, {1, 2, 3, 4, 5} - প্রতিটি মান ঠিক একবার প্রদর্শিত হয়) । একটি ডেটা সেট মাল্টিমোডালও হতে পারে - দ্বি-মোডাল (দুটি মোডঃ {1, 1, 3, 3, 5}) বা ত্রি-মোডাল। অনুশীলনে, একটি দ্বি-মোডাল বন্টন প্রায়শই আপনার ডেটাতে দুটি স্বতন্ত্র উপগোষ্ঠীর সংকেত দেয়, যা তদন্ত করার জন্য একটি গুরুত্বপূর্ণ প্যাটার্ন।
কিভাবে আমি সম সংখ্যক মানের মধ্যমা খুঁজে বের করব?
মানগুলিকে ক্রমবর্ধমান ক্রমে বাছাই করুন, তারপরে দুটি মধ্যবর্তী সংখ্যার গড় করুন। {2, 4, 6, 8} এর জন্যঃ দুটি মধ্যবর্তী মান 4 এবং 6, সুতরাং মিডিয়ান = (4+6) / 2 = 5। {1, 3, 5, 7, 9, 11} এর জন্যঃ মধ্যবর্তী মানগুলি 5 এবং 7, সুতরাং মিডিয়ান = (5+7) / 2 = 6। মিডিয়ানকে ডেটা সেটের একটি মান হতে হবে না।
মানে = মিডিয়ান = মোড মানে কি?
যখন তিনটি পরিমাপ সমান হয়, তখন বন্টনটি পুরোপুরি সিম্যাট্রিক এবং ইউনিমোডাল হয় - ক্লাসিক বেল কার্ভ (স্বাভাবিক বন্টন) । এর অর্থ হল ডেটাতে কোনও আউটলিয়ার নেই এবং তিনটি পরিমাপ কেন্দ্রের সমানভাবে বৈধ বর্ণনাকারী। অনুশীলনে, বাস্তব বিশ্বের ডেটা খুব কমই নিখুঁত সিম্যাট্রি অর্জন করে, তবে গড় এবং মধ্যমাটির ঘনিষ্ঠ সারিবদ্ধতা আনুমানিক সিম্যাট্রিটির পরামর্শ দেয়।
গড়, মধ্যম এবং তির্যকতার মধ্যে সম্পর্ক কি?
ডানদিকের (পজিটিভ স্কিউ) বিতরণেঃ গড় > মধ্যম > মোড। বামদিকের (নেতিবাচক স্কিউ) বিতরণেঃ গড় < মধ্যম < মোড। সিম্যাট্রিক বিতরণেঃ গড় = মধ্যম ~ মোড। এই সম্পর্কটি একটি দ্রুত ভিজ্যুয়াল চেক সরবরাহ করেঃ কোনও গ্রাফ না দেখে স্কিউয়ের দিকনির্দেশ নির্ধারণের জন্য গড় এবং মধ্যমা তুলনা করুন।
আপনি কিভাবে গোষ্ঠীভুক্ত তথ্যের জন্য গড় গণনা করবেন?
গোষ্ঠীভুক্ত ফ্রিকোয়েন্সি ডেটার জন্য, প্রতিটি শ্রেণীর ব্যবধানের মধ্যবিন্দু ব্যবহার করুনঃ গড় = Σ ((মধ্যবিন্দু x ফ্রিকোয়েন্সি) / n। উদাহরণঃ যদি 10 জন শিক্ষার্থী 50 - 60 (মধ্যবিন্দু 55), 15 জন 60 - 70 (মধ্যবিন্দু 65), এবং 5 জন 70 - 80 (মধ্যবিন্দু 75) স্কোর করেঃ গড় = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63.3.
জনসংখ্যার গড় এবং নমুনার গড়ের মধ্যে পার্থক্য কি?
জনসংখ্যার গড় (μ, "মু") সমগ্র জনসংখ্যার প্রতিটি সদস্য থেকে গণনা করা হয়। নমুনা গড় (x̄, "এক্স-বার") সেই জনসংখ্যা থেকে টানা একটি উপসেট (নমুনা) থেকে গণনা করা হয়। সূত্রটি একই, তবে প্রতীকগুলি আলাদা। অনুশীলনে, আমরা প্রায় সবসময় নমুনা গড়ের সাথে কাজ করি এবং জনসংখ্যা গড়ের অনুমান করতে তাদের ব্যবহার করি - যা নমুনা ত্রুটি প্রবর্তন করে এবং পরিসংখ্যানগত অনুমান কৌশলগুলির প্রয়োজন।
কিভাবে একটি বহিরাগত মান গড় বনাম মধ্যমা প্রভাবিত করে?
বহিরাগত মানগুলি গড়কে দৃ strongly়ভাবে প্রভাবিত করে তবে মধ্যবিত্তের উপর ন্যূনতম প্রভাব ফেলে। উদাহরণস্বরূপঃ ডেটা {1, 2, 3, 4, 5} এর গড় = 3 এবং মধ্যবিত্ত = 3। একটি বহিরাগত মান {1, 2, 3, 4, 5, 100} যুক্ত করাঃ গড় 19.2 এ ঝাঁপিয়ে পড়ে তবে মধ্যবিত্ত কেবলমাত্র (3+4) / 2 = 3.5 এ পরিবর্তিত হয়। এই দৃust়তা মধ্যবিত্তকে পছন্দসই পরিমাপ করে যখনই বহিরাগত মান উপস্থিত থাকে বা সন্দেহ করা হয়।
ট্রিমড গড় কত?
একটি ট্রিমড গড় (বা ট্রিঙ্কড গড়) গড় গণনা করার আগে চরম মানগুলির একটি নির্দিষ্ট শতাংশ সরিয়ে দেয়। উদাহরণস্বরূপ, {1, 2, 3, 4, 5, 6, 7, 8, 9, 100} এ 10% ট্রিমড গড়ঃ নীচের এবং শীর্ষ 10% (প্রতিটি প্রায় 1 মান) সরিয়ে ফেলুন, {2, 3, 4, 5, 6, 7, 8, 9} রেখে; গড় = 5.5। ট্রিমড গড়গুলি স্কোরিং সিস্টেমে (অলিম্পিক বিচার, ফিগার স্কেটিং) এবং অর্থনৈতিক পরিসংখ্যানগুলিতে ব্যবহৃত হয় যাতে মধ্যবিত্তের চেয়ে বেশি ডেটা ধরে রাখার সময় বহিরাগত প্রভাবকে হ্রাস করা যায়।
আমি কিভাবে ওজনযুক্ত গড় গণনা করব?
ওজনযুক্ত গড় = Σ ((ওজন x মান) / Σ ((ওজন) । উদাহরণ - জিপিএ গণনাঃ 3-ক্রেডিট কোর্সে গ্রেড এ (4.0); 4-ক্রেডিট কোর্সে গ্রেড বি (3.0); 2-ক্রেডিট কোর্সে গ্রেড সি (2.0): ওজনযুক্ত জিপিএ = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4) / 9 = 28/9 ~ 3.11। ওজন ছাড়া, সহজ গড় হবে (4+3+2) / 3 = 3.0 - 4-ক্রেডিট কোর্সের ভারী প্রভাব অনুপস্থিত।
বর্ণনামূলক পরিসংখ্যানের সংক্ষিপ্ত বিবরণঃ আপনার সর্বদা যা প্রয়োজন
যেকোন ডেটা সেটের জন্য একটি সম্পূর্ণ বর্ণনামূলক পরিসংখ্যানের সংক্ষিপ্তসার নিম্নলিখিত সমস্ত অন্তর্ভুক্ত করা উচিত। এটি আপনি একটি বৈজ্ঞানিক কাগজ, ব্যবসায়িক বিশ্লেষণ, বা একাডেমিক অ্যাসাইনমেন্টে রিপোর্ট করবেনঃ
| পরিসংখ্যানে | প্রতীক | উদাহরণ ({2,4,4,6,8,10}) | ব্যাখ্যা |
|---|---|---|---|
| গণনা | n | 6 | কত পর্যবেক্ষণ |
| গড় | x̄ | ৫.৬৭ | গড় মান |
| মধ্যম | M | ৫.০ | মধ্যম মান (৫০তম শতভাগ) |
| মোড | Mo | 4 | সর্বাধিক প্রচলিত মান |
| পরিসীমা | R | 8 | সর্বনিম্ন থেকে সর্বোচ্চ পর্যন্ত স্প্রেড |
| স্ট্যান্ডার্ড ডিভিয়েশন | σ বা s | ২.৫৮ | গড় থেকে আদর্শ বিচ্যুতি |
| বিভেদ | σ² | ৬.৬৭ | এসডি স্কোয়ার |
| ন্যূনতম / সর্বোচ্চ | — | ২ / ১০ | চরম মান |
একাডেমিক এবং বৈজ্ঞানিক কাজের ক্ষেত্রে, সর্বদা কেন্দ্রের পরিমাপ এবং বিস্তারের পরিমাপ উভয়ই প্রতিবেদন করুন। স্ট্যান্ডার্ড বিচ্যুতি (বা আইকিউআর) ছাড়াই কেবলমাত্র গড় (বা মিডিয়ান) প্রতিবেদন করা আপনার ডেটা সম্পর্কে একটি অসম্পূর্ণ চিত্র দেয়। একটি ক্লাস যেখানে শিক্ষার্থীরা এসডি = ৫% এর সাথে 75% গড় স্কোর করে তবে এসডি = ২৫% সহ একটি ক্লাস থেকে খুব আলাদা - প্রথমটি হ'ল বি গ্রেডের একটি ঘন ক্লাস্টার, দ্বিতীয়টি হ'ল ব্যর্থ থেকে প্রায় নিখুঁত পর্যন্ত একটি বুনো মিশ্র গ্রুপ।
শতাংশ, কোয়ার্টিল এবং বক্স প্লট
গড়, মধ্যমা এবং মোডের বাইরে, একটি সম্পূর্ণ পরিসংখ্যানগত সারসংক্ষেপ প্রায়শই শতাংশ বিশ্লেষণ অন্তর্ভুক্ত করে। শতাংশগুলি আপনাকে জানায় যে তথ্যের কোন ভগ্নাংশ একটি প্রদত্ত মানের নীচে পড়ে - আপেক্ষিক অবস্থান বোঝার জন্য অপরিহার্য, বহিরাগতদের সনাক্তকরণ এবং জনসংখ্যার মধ্যে তুলনা করা।
- মিডিয়ান = পঞ্চাশতম শতাংশঃঅর্ধেক তথ্য এই মানের নিচে
- Q1 (প্রথম কোয়ার্টাইল) = 25 তম শতাংশঃ25% তথ্য Q1 এর নিচে
- Q3 (তৃতীয় কোয়ার্টাইল) = 75 তম শতকরা হারঃ75% তথ্য Q3 এর নিচে
- IQR (ইন্টারকোয়ার্টিল রেঞ্জ) = Q3 - Q1:তথ্যের মধ্যবর্তী ৫০% ধারণ করে
- বহিরাগত নিয়ম:Q1- 1.5xIQR এর নিচে বা Q3 + 1.5xIQR এর উপরে পয়েন্টগুলিকে বহিরাগত হিসাবে বিবেচনা করা হয়
| শতকরা হার | অর্থ | উদাহরণ (পরীক্ষার স্কোর, n=100) |
|---|---|---|
| দশম | ১০% এর নিচে | স্কোর ৫২ -> ক্লাসের ১০% এর চেয়ে ভালো স্কোর করেছে |
| ২৫তম (Q1) | 25% এর নিচে স্কোর করেছে | স্কোর ৬৪ -> নিচের কোয়ার্টাইলের সীমানা |
| পঞ্চাশতম (মধ্যম) | 50% এর নিচে স্কোর করেছে | স্কোর ৭৫ -> বন্টনের মাঝখানে |
| ৭৫তম (Q3) | ৭৫% এর নিচে | স্কোর ৮৭ -> উপরের কোয়ার্টাইল সীমানা |
| নব্বই | 90% এর নিচে স্কোর | স্কোর ৯৩ -> ক্লাসের শীর্ষ ১০% |
| ৯৯তম | ৯৯% এর নিচে | স্কোর ৯৯ -> শীর্ষ ১% |
একটি বক্স প্লট (বক্স-এন্ড-উইস্টার প্লট) এই তথ্যটি ভিজ্যুয়ালাইজ করেঃ বক্সটি Q1 থেকে Q3 (আইকিউআর) পর্যন্ত বিস্তৃত, একটি লাইন মধ্যম চিহ্নিত করে এবং "উইস্টার" ক্ষুদ্রতম / বৃহত্তম নন-আউটলিয়ার মানগুলিতে প্রসারিত হয়। পৃথক আউটলিয়ার পয়েন্টগুলি বিন্দু হিসাবে প্লট করা হয়। বক্স প্লটগুলি একাধিক গোষ্ঠীর মধ্যে বিতরণকে তুলনা করার জন্য দুর্দান্ত, কেন্দ্র, বিস্তার এবং স্কিওনেসের পার্থক্য প্রকাশ করে যা একটি সাধারণ গড় তুলনা মিস করবে। উদাহরণস্বরূপ, তিনটি পাশের বক্স প্লট ব্যবহার করে তিনটি বিদ্যালয়ের পরীক্ষার স্কোরের তুলনা করা অবিলম্বে দেখায় যে কোন বিদ্যালয়ের উচ্চতর গড় পারফরম্যান্স রয়েছে, যা আরও বেশি ছড়িয়ে পড়েছে (অসঙ্গত শিক্ষার ইঙ্গিত দেয়) এবং কোনও বিদ্যালয়ে বহিরাগত শিক্ষার্থীদের একটি ক্লাস্টার রয়েছে যার সহায়তা প্রয়োজন। একটি কমপ্যাক্ট ডিসপ্লেতে পরিসংখ্যানগত তথ্যের এই ভিজ্যুয়াল ঘনত্ব বক্স প্লটকে ডেটা যোগাযোগের অন্যতম শক্তিশালী এবং অব্যবহৃত সরঞ্জাম করে তোলে।
ধাপে ধাপেঃ গড়, মধ্যম এবং মোডের গণনা করা
আসুন একটি বাস্তবসম্মত ডেটা সেট দিয়ে একটি সম্পূর্ণ উদাহরণ দিয়ে কাজ করিঃ একটি ছোট ব্যবসার জন্য 12 মাসের মাসিক বিক্রয় পরিসংখ্যান (হাজারে): {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.
ধাপ ১ঃ তথ্য সাজান
ক্রমানুসারে সাজানোঃ {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}
দ্বিতীয় ধাপঃ গড় হিসাব করুন
সমষ্টি = ৩৮+৩৮+৪২+৪৪+৪৮+৪৮+৫২+৫৫+৫৭+৬১+৬৩+৭৫ = ৬২১
n = 12, গড় = 621 / 12 =৫১.৭৫ (হাজার)
ধাপ ৩ঃ মধ্যমা খুঁজুন
n = 12 (এমনকি): গড় 6th এবং 7th মান = (48 + 52) / 2 =50
ধাপ ৪ঃ মোড চিহ্নিত করুন
৩৮ এবং ৪৮ উভয়ই দুবার প্রদর্শিত হয়। মোড ={ ৩৮ , ৪৮ }(বিমোডাল)
ধাপ ৫ঃ গণনা পরিসীমা এবং স্ট্যান্ডার্ড ডিভিয়েশন
পরিসীমা = 75 - 38 =37
গড় (51.75) থেকে বিচ্যুতিঃ (38-51.75) 2 = 189.06; (38-51.75) 2 = 189.06; (42-51.75) 2 = 95.06; (44-51.75) 2 = 60.06; (48-51.75) 2 = 14.06; (48-51.75) 2 = 14.06; (52-51.75) 2 = 0.06; (55-51.75) 2 = 10.56; (57-51.75) 2 = 27.56; (61-51.75) 2 = 85.56; (63-51.75) 2 = 126.56; (75-51.75) 2 = 540.56
বর্গক্ষেত্রের বিচ্যুতির যোগফল = 1,352.25; ভেরিয়েন্স = 1,352.25/12 = 112.69; SD = √112.69 ~১০.৬২
ব্যাখ্যা
এই ব্যবসায়ের গড় মাসিক বিক্রয় ৫১,৭৫০ ডলার এবং মধ্যম ৫০,০০০ ডলার। ~ ১০,৬২০ ডলার স্ট্যান্ডার্ড বিচ্যুতি মানে বেশিরভাগ মাস গড়ের মধ্যে +/- ১০,৬২০ ডলার এর মধ্যে পড়ে। দ্বি-মোডাল বন্টন (দুই মোড) মৌসুমী নিদর্শনগুলির পরামর্শ দিতে পারে - নির্দিষ্ট মাসে দুটি ৩৮ এবং দুটি ৪৮ এর ক্লাস্টার রয়েছে কিনা তা পরীক্ষা করুন। শীর্ষস্থানীয় আউটলিয়ার (এক মাসে $ 75,000) মধ্যমটির সামান্য উপরে গড়টি টানতে পারে, হালকা ইতিবাচক স্কিউ নির্দেশ করে - সম্ভবত এক ব্যতিক্রমী বিক্রয় মাস (ছুটির মরসুম, বড় চুক্তি ইত্যাদি) ।