স্ট্যান্ডার্ড ডিভিয়েশন ক্যালকুলেটর
যেকোন ডেটা সেটের জন্য স্ট্যান্ডার্ড ডিভিয়েশন, বৈসাদৃশ্য, গড় এবং আরও অনেক কিছু গণনা করুন। জনসংখ্যা এবং নমুনা উভয় গণনা সমর্থন করে। বিনামূল্যে ধাপে ধাপে সমাধান।
স্ট্যান্ডার্ড ডিভিয়েশন কি এবং কেন এটি গুরুত্বপূর্ণ?
স্ট্যান্ডার্ড বিচ্যুতি পরিমাপআপনার ডেটা কতটুকু ছড়িয়ে আছে তা গড়ের কাছাকাছি (গড়)একটি ছোট স্ট্যান্ডার্ড বিচ্যুতি মানে মানগুলি গড়ের চারপাশে ঘনিষ্ঠভাবে ক্লাস্টার করা হয়; একটি বড় স্ট্যান্ডার্ড বিচ্যুতি মানে মানগুলি ব্যাপকভাবে ছড়িয়ে পড়ে।
দুটি ডেটাসেটে একই গড় থাকতে পারে কিন্তু সম্পূর্ণ ভিন্ন বন্টন -- স্ট্যান্ডার্ড ডিভিয়েশন সেই পার্থক্যকে ধরতে পারে:
- ডেটাসেট A: {9, 10, 10, 11, 10} -- Mean = 10, SD ~ 0.63 (টাইট ক্লাস্টার)
- ডেটাসেট B: {2, 5, 10, 15, 18} -- Mean = 10, SD ~ 5.83 (বিস্তৃতভাবে ছড়িয়ে পড়ে)
উভয়টির গড় ১০, কিন্তু ডেটাসেট বি প্রায় ১০ গুণ বেশি পরিবর্তনশীল। স্ট্যান্ডার্ড ডিভিয়েশন এটিকে দৃশ্যমান করে তোলে।
স্ট্যান্ডার্ড বিচ্যুতি চিহ্নিত করা হয়σ (সিগমা)জনসংখ্যার জন্য এবংsএকটি নমুনার জন্য। এটি বৈসাদৃশ্যের বর্গমূল, যা মূল তথ্যের মতো একই এককগুলিতে প্রকাশ করা হয় -- যা এটিকে কেবলমাত্র বৈসাদৃশ্যের চেয়ে বেশি ব্যাখ্যাযোগ্য করে তোলে।
অ্যাপ্লিকেশন প্রায় প্রতিটি ক্ষেত্র জুড়েঃ মান নিয়ন্ত্রণ (উত্পাদিত অংশগুলি কি ধারাবাহিকভাবে সহনশীলতার মধ্যে রয়েছে?), অর্থ (বিনিয়োগ ঝুঁকি = রিটার্ন অস্থিরতা), ঔষধ (একজন রোগীর পড়া স্বাভাবিকের 2 এসডি এর মধ্যে রয়েছে?), শিক্ষা (পরীক্ষার স্কোরগুলি কীভাবে বিতরণ করা হয়?), এবং ক্রীড়া বিশ্লেষণ (একজন ক্রীড়াবিদের পারফরম্যান্স কতটা সামঞ্জস্যপূর্ণ?
জনসংখ্যা বনাম নমুনা স্ট্যান্ডার্ড ডিভিয়েশন
স্ট্যান্ডার্ড ডিভিয়েশন গণনা করার সময় সবচেয়ে গুরুত্বপূর্ণ পছন্দ হল আপনি কি একটিজনসংখ্যা(সম্ভাব্য সকল ডাটা পয়েন্ট) অথবানমুনাএটি কোন সূত্র ব্যবহার করতে হবে তা নির্ধারণ করে এবং ফলাফলকে প্রভাবিত করে।
জনসংখ্যার স্ট্যান্ডার্ড বিচ্যুতি (σ):আপনি যখন অধ্যয়নরত গোষ্ঠীটির জন্য ডেটা পান তখন ব্যবহার করুন। সূত্র: σ = √[Σ(xi - μ) 2 / N]
যেখানে: μ = জনসংখ্যার গড়, N = মানের সংখ্যা, Σ = সমস্ত মানের সমষ্টি।
নমুনা স্ট্যান্ডার্ড বিচ্যুতি (গুলি):যখন আপনার ডেটা একটি বৃহত্তর জনসংখ্যা থেকে নেওয়া একটি নমুনা হয় তখন ব্যবহার করুন। সূত্রঃ s = √[Σ(xi - x̄) 2 / (n-1) ]
যেখানে: x̄ = নমুনার গড়, n = নমুনার মানের সংখ্যা, (n-1) =বেসেলের সংশোধন.
বেসেলের সংশোধন n এর পরিবর্তে (n-1) দ্বারা বিভক্ত হয় কারণ নমুনাগুলি প্রকৃত জনসংখ্যার বৈচিত্র্যকে কম মূল্যায়ন করে - বিশেষত ছোট নমুনার জন্য। (n-1) ব্যবহার করে একটিনিরপেক্ষ মূল্যায়নকারীজনসংখ্যার বৈষম্য।
কোনটা ব্যবহার করবো?
- জনসংখ্যা এসডি:আপনার কাছে একটি নির্দিষ্ট শ্রেণীর সকল শিক্ষার্থীর তথ্য আছে; একটি নির্দিষ্ট পরীক্ষার সকল পরীক্ষার ফলাফল; একটি নির্দিষ্ট কোম্পানির সকল কর্মচারী।
- নমুনা এসডি:আপনি আয় সম্পর্কে 500 আমেরিকানদের জরিপ করেছেন (সমস্ত আমেরিকানদের জন্য); আপনি একটি উত্পাদন রান থেকে 30 উইজেট পরিমাপ করেছেন (সমস্ত উইজেটগুলির জন্য); একটি নমুনা সহ কোন বৈজ্ঞানিক গবেষণা।
ধাপে ধাপে স্ট্যান্ডার্ড বিচ্যুতি গণনা
আসুন বাস্তব সংখ্যার সাথে একটি সম্পূর্ণ উদাহরণ দিয়ে কাজ করি:
ডেটা সেট:৬ জন শিক্ষার্থীর পরীক্ষার স্কোর:
ধাপ ১ -- গড় খুঁজে বের করুন:(72 + 85 + 91 + 68 + 79 + 88) / 6 = 483 / 6 =৮০.৫
ধাপ ২ -- গড় থেকে প্রতিটি বিচ্যুতি খুঁজে বের করুন এবং এটিকে বর্গক্ষেত্র করুনঃ
| স্কোর (xi) | বিচ্যুতি (xi - x̄) | বর্গক্ষেত্র (xi - x̄) 2 |
|---|---|---|
| 72 | ৭২ - ৮০.৫ = -৮.৫ | ৭২.২৫ |
| 85 | 85 - 80.5 = +4.5 | ২০.২৫ |
| 91 | 91 - 80.5 = +10.5 | ১১০.২৫ |
| 68 | ৬৮ - ৮০.৫ = - ১২.৫ | ১৫৬.২৫ |
| 79 | ৭৯ - ৮০.৫ = -১.৫ | ২.২৫ |
| 88 | 88 - 80.5 = +7.5 | ৫৬.২৫ |
| সমষ্টি | 0 (সর্বদা) | ৪১৭.৫০ |
ধাপ ৩ -- বৈসাদৃশ্য গণনা করুন:নমুনা ভেরিয়েন্স (n-1) = 417.50 / 5 = 83.50
ধাপ ৪ -- মান বিচ্যুতির জন্য বর্গমূল নিন:s = √83.50 ~৯.১৪
ব্যাখ্যা:বেশিরভাগ স্কোর 80.5 এর গড়ের প্রায় 9.14 পয়েন্টের মধ্যে পড়ে। প্রায় 68% স্কোর 71.4 এবং 89.6 (গড় +/- 1 এসডি) এর মধ্যে প্রত্যাশিত হবে যদি এটি একটি স্বাভাবিকভাবে বিতরণ করা জনসংখ্যা হয়।
পরীক্ষামূলক নিয়ম এবং স্বাভাবিক বন্টন
তথ্যের জন্য যে একটি অনুসরণ করেস্বাভাবিক বন্টন (বেল বক্ররেখা), এম্পিরিকাল রুল (68-95-99.7 রুল) আপনাকে সঠিকভাবে বলে দেয় যে প্রতিটি স্ট্যান্ডার্ড ডিভিয়েশন পরিসরের মধ্যে কতগুলি মান রয়েছেঃ
| পরিসীমা | তথ্যের শতাংশ | উদাহরণ (গড়=100, SD=15) |
|---|---|---|
| গড় +/- 1 SD | ~ ৬৮.২৭% | ৮৫ থেকে ১১৫ |
| গড় +/- 2 SD | ~ ৯৫.৪৫% | ৭০ থেকে ১৩০ |
| গড় +/- 3 SD | ~৯৯.৭৩% | ৫৫ থেকে ১৪৫ |
| +/- 3 SD এর উপরে | ~ ০.২৭% | ৫৫ এর নিচে অথবা ১৪৫ এর উপরে |
ক্লাসিক অ্যাপ্লিকেশন হল আই কিউ স্কোর: গড় = 100, এস ডি = ১৫। ১৩০ এর আই কিউ গড়ের উপরে ২ এস ডি - মাত্র ২.৩% মানুষ এই উচ্চ স্কোর করে। ১৪৫ এর আই কিউ গড়ের উপরে ৩ এস ডি - প্রায় ০.১৩% মানুষ (প্রায় ৭৫০ জনের মধ্যে ১ জন) ।
গুণমান নিয়ন্ত্রণে,সিক্স সিগমাস্ট্যান্ডার্ডের জন্য প্রক্রিয়াগুলি প্রতি মিলিয়ন সুযোগের মধ্যে 3.4 টিরও কম ত্রুটি থাকতে হবে - লক্ষ্য থেকে +/-6 স্ট্যান্ডার্ড বিচ্যুতির মধ্যে বৈচিত্র্য বজায় রাখার সমতুল্য, কেবলমাত্র 0.00034% ত্রুটি হার রেখে। এটি ছয় সিগমা উত্পাদন মানের প্রোগ্রামগুলির পরিসংখ্যানগত ভিত্তি।
সমস্ত তথ্য স্বাভাবিকভাবে বিতরণ করা হয় না। আয়ের বন্টন ডানদিকে তির্যক করা হয় (কিছু খুব উচ্চ উপার্জনকারীরা ডান লেজ প্রসারিত করে) । এই ক্ষেত্রে, মধ্যবর্তী এবং আন্তঃকোয়ার্টিল ব্যাপ্তি গড় এবং স্ট্যান্ডার্ড বিচ্যুতির চেয়ে বেশি তথ্যবহুল হতে পারে।
অন্যান্য পরিসংখ্যানগত পরিমাপঃ গড়, মধ্যম, বৈষম্য, এবং আরো
অন্যান্য বর্ণনামূলক পরিসংখ্যানের সাথে স্ট্যান্ডার্ড ডিভিয়েশন সবচেয়ে অর্থপূর্ণ। তারা একসাথে কীভাবে কাজ করে তা এখানেঃ
- গড় (গণিতিক গড়):সকল মানের সমষ্টি ÷ গণনা. বহিরাগতদের প্রতি সংবেদনশীল -- একটি চরম মান গড়কে উল্লেখযোগ্যভাবে পরিবর্তন করতে পারে।
- মধ্যম:ডেটা বাছাই করার সময় মধ্যম মান। গড়ের চেয়ে বহিরাগতদের জন্য আরও শক্তিশালী। {1, 2, 3, 4, 100} এর জন্যঃ গড় = 22, মধ্যম = 3।
- মোড:সর্বাধিক ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন ঘন
- পরিসীমা:সর্বাধিক - সর্বনিম্ন। সহজ কিন্তু বহিরাগতদের প্রতি সংবেদনশীল; বন্টন আকৃতি বর্ণনা করে না।
- ভেরিয়েন্স (σ2 বা s2):স্ট্যান্ডার্ড ডিভিয়েশনের বর্গক্ষেত্র। এটি গাণিতিকভাবে উপযোগী কিন্তু ব্যাখ্যা করা কঠিন কারণ এটি বর্গক্ষেত্রের একক। উদাহরণঃ যদি উচ্চতা সেন্টিমিটারে হয়, বৈসাদৃশ্য সেন্টিমিটারে হয়-- যার কোন শারীরিক অর্থ নেই।
- ভেরিয়েশন কোয়ার্টার (সিভি):(স্ট্যান্ডার্ড ডিভিয়েশন / গড়) এক্স 100%. বিভিন্ন উপায়ে ডেটাসেট জুড়ে পরিবর্তনশীলতার তুলনা করার অনুমতি দেয়। 10% এর একটি সিভি মানে এসডি গড়ের 10% - অর্থ ও জীববিজ্ঞানে দরকারী।
- গড়ের স্ট্যান্ডার্ড ত্রুটি (এসইএম):SD ÷ √n. জনসংখ্যা গড়ের অনুমান হিসাবে নমুনা গড়ের যথার্থতা পরিমাপ করে। নমুনা আকার বাড়ার সাথে সাথে এসইএম সঙ্কুচিত হয় - বৃহত্তর নমুনাগুলি আরও সুনির্দিষ্ট অনুমান দেয়।
অর্থ, বিজ্ঞান ও ক্রীড়া ক্ষেত্রে স্ট্যান্ডার্ড ডিভিয়েশন
স্ট্যান্ডার্ড ডিভিয়েশনের বিভিন্ন ক্ষেত্রে নির্দিষ্ট, ব্যবহারিক ব্যাখ্যা রয়েছেঃ
ফাইন্যান্স -- বিনিয়োগের ঝুঁকি পরিমাপঃঅর্থনীতিতে, রিটার্নের স্ট্যান্ডার্ড ডিভিয়েশন = অস্থিরতা = ঝুঁকি। 15% এর এসডি সহ বার্ষিক 10% রিটার্নকারী একটি স্টক যে কোনও বছরে -5% এবং +25% এর মধ্যে 68% রিটার্নের সম্ভাবনা রয়েছে। এসএন্ডপি 500 এর ঐতিহাসিকভাবে প্রায় 15 - 20% এর বার্ষিক এসডি রয়েছে। বন্ড পোর্টফোলিওগুলির সাধারণত 3 - 7% এর এসডি থাকে। ঝুঁকি-সমন্বিত পারফরম্যান্স (শার্প অনুপাত) = (রিটার্ন - ঝুঁকি-মুক্ত হার) / এসডি - যত বেশি, তত ভাল।
বিজ্ঞান -- গুণমান নিয়ন্ত্রণ এবং পরিমাপঃল্যাবরেটরি যন্ত্রগুলি পরিমাপকে গড় +/- এসডি হিসাবে রিপোর্ট করে। থার্মোমিটারের পাঠ 37.2 +/- 0.3 ডিগ্রি সেলসিয়াস মানে যে পরিমাপটি 68% আত্মবিশ্বাসের সাথে সত্যিকারের মানের 0.3 ডিগ্রি সেলসিয়াসের মধ্যে রয়েছে। ক্লিনিকাল ট্রায়ালগুলিতে, পরিসংখ্যানগত তাত্পর্য সাধারণত চিকিত্সা প্রভাব হিসাবে সংজ্ঞায়িত করা হয় যা নিয়ন্ত্রণ গ্রুপের গড় থেকে 2 টিরও বেশি এসডি (পি < 0.05) ।
ক্রীড়া বিশ্লেষণঃখেলোয়াড়ের ধারাবাহিকতা এসডি দ্বারা পরিমাপ করা হয়। একটি বাস্কেটবল খেলোয়াড় প্রতি ম্যাচে গড় 25 পয়েন্টের সাথে এসডি 3 এর সাথে 10 এর সাথে 25 গড়ের চেয়ে বেশি নির্ভরযোগ্য। আবহাওয়ার পূর্বাভাস এন্সেম্বল মডেল ব্যবহার করে যেখানে তাপমাত্রার পূর্বাভাসের এসডি আস্থা নির্দেশ করে - একটি সংকীর্ণ এসডি মানে পূর্বাভাসকারীরা একমত; একটি প্রশস্ত এসডি মানে উচ্চ অনিশ্চয়তা।
শিক্ষা:জেড-স্কোরগুলি ক্লাসের গড় থেকে একজন শিক্ষার্থীর স্কোর কতগুলি স্ট্যান্ডার্ড বিচ্যুতি প্রকাশ করেঃ জেড = (স্কোর - গড়) / এসডি। +2 এর জেড-স্কোর মানে গড়ের উপরে 2 টি এসডি স্কোর করা - প্রায় 97.7% শিক্ষার্থীর চেয়ে ভাল। এসএটির মতো মানক পরীক্ষাগুলি এমনভাবে ডিজাইন করা হয়েছে যাতে স্কোরগুলি মোটামুটি স্বাভাবিক বন্টন অনুসরণ করে, এই শতাংশের তুলনাগুলি সক্ষম করে।
প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী
স্ট্যান্ডার্ড ডিভিয়েশন এবং ভেরিয়েন্সের মধ্যে পার্থক্য কি?
বৈকল্পিকতা হ'ল গড় থেকে বর্গক্ষেত্রের বিচ্যুতিগুলির গড়। স্ট্যান্ডার্ড বিচ্যুতি হ'ল বৈকল্পিকতার বর্গমূল। উভয় পরিমাপ ছড়িয়ে পড়ে, তবে স্ট্যান্ডার্ড বিচ্যুতি ডেটা হিসাবে একই ইউনিটগুলিতে থাকে (অনুবাদ করা সহজ), যখন বৈকল্পিকতা বর্গক্ষেত্রের ইউনিটগুলিতে থাকে। সেন্টিমিটারে উচ্চতার ডেটাসেটের সেন্টিমিটারে বৈকল্পিকতা থাকে - অর্থপূর্ণ নয়। সেন্টিমিটারে এসডি সরাসরি মূল পরিমাপের সাথে তুলনীয়।
কখন আমি জনসংখ্যা বনাম নমুনা স্ট্যান্ডার্ড বিচ্যুতি ব্যবহার করব?
জনসংখ্যা এসডি ব্যবহার করুন (σ, বিভাজন N দ্বারা) যখন আপনার কাছে পুরো জনসংখ্যার তথ্য থাকে যা আপনি বর্ণনা করছেন - একটি নির্দিষ্ট শ্রেণীর সকল ছাত্র, একটি কোম্পানির সকল কর্মচারী। নমুনা এসডি ব্যবহার করুন (s, বিভাজন n-1 দ্বারা) যখন আপনার তথ্য একটি বৃহত্তর জনসংখ্যার একটি উপসেট এবং আপনি জনসংখ্যার পরিবর্তনশীলতা অনুমান করছেন - একটি জরিপ নমুনা, ক্লিনিকাল ট্রায়াল অংশগ্রহণকারী, একটি উত্পাদন রান থেকে মান নিয়ন্ত্রণ নমুনা।
একটি উচ্চ বা নিম্ন স্ট্যান্ডার্ড বিচ্যুতি মানে কি?
একটি নিম্ন স্ট্যান্ডার্ড বিচ্যুতি মানে ডেটা পয়েন্টগুলি গড়ের কাছাকাছি ঘনিষ্ঠভাবে ক্লাস্টার করা হয় - সামঞ্জস্য, কম পরিবর্তনশীলতা। একটি উচ্চ মান বিচ্যুতি মানে ডেটা ব্যাপকভাবে ছড়িয়ে পড়ে - উচ্চ পরিবর্তনশীলতা। উভয়ই স্বতন্ত্রভাবে ভাল নয়; এটি প্রসঙ্গে নির্ভর করে। উত্পাদন ক্ষেত্রে, কম এসডি পছন্দসই (সামঞ্জস্য) । বিনিয়োগের রিটার্নগুলিতে, কিছু বিনিয়োগকারী উচ্চতর সম্ভাব্য রিটার্নের জন্য উচ্চতর এসডি গ্রহণ করে।
জেড-স্কোর কী এবং এটি স্ট্যান্ডার্ড ডিভিয়েশনের সাথে কীভাবে সম্পর্কিত?
একটি জেড-স্কোর পরিমাপ করে যে কোনও ডেটা পয়েন্ট গড় থেকে কতগুলি স্ট্যান্ডার্ড বিচ্যুতিঃ জেড = (মান - গড়) / এসডি। 0 এর একটি জেড-স্কোর = ঠিক গড়। জেড = +1 = 1 এসডি গড়ের উপরে (84 তম শতাংশ) । জেড = -2 = 2 এসডি গড়ের নীচে (2.3 তম শতাংশ) । জেড-স্কোরগুলি বিভিন্ন স্কেল সহ বিভিন্ন ডেটাসেটের মানগুলির তুলনা করতে দেয়।
স্ট্যান্ডার্ড ত্রুটি কী এবং এটি স্ট্যান্ডার্ড বিচ্যুতি থেকে কীভাবে আলাদা?
স্ট্যান্ডার্ড বিচ্যুতি পৃথক ডেটা পয়েন্টগুলির বিস্তার বর্ণনা করে। গড়ের স্ট্যান্ডার্ড ত্রুটি (এসইএম = এসডি / √ এন) প্রকৃত জনসংখ্যার গড়ের অনুমান হিসাবে নমুনার গড়ের নির্ভুলতা বর্ণনা করে। নমুনার আকার বাড়ার সাথে সাথে এসইএম হ্রাস পায় (আরও ডেটা = আরও সুনির্দিষ্ট অনুমান), তবে এসডি অগত্যা পরিবর্তিত হয় না। এসইএম আস্থা ব্যবধানে ব্যবহৃত হয়; এসডি ডেটা নিজেই বিতরণ বর্ণনা করে।
স্ট্যান্ডার্ড ডিভিয়েশন নেগেটিভ হতে পারে?
না. স্ট্যান্ডার্ড বিচ্যুতি সর্বদা শূন্য বা ধনাত্মক। এটি কেবল তখনই শূন্যের সমান হয় যখন সমস্ত ডেটা মান একই থাকে (কোনও পরিবর্তনশীলতা নেই) । যেহেতু এটি বর্গক্ষেত্রের যোগফলের বর্গমূল হিসাবে গণনা করা হয়, তাই এটি নেতিবাচক হতে পারে না। নেতিবাচক বৈচিত্র্য বা স্ট্যান্ডার্ড বিচ্যুতি গণনা ত্রুটি নির্দেশ করবে।
স্ট্যান্ডার্ড ডিভিয়েশনকে কীভাবে প্রভাবিত করে?
বহিরাগত মানগুলি স্ট্যান্ডার্ড বিচ্যুতিকে নাটকীয়ভাবে বাড়িয়ে তুলতে পারে কারণ বিচ্যুতিগুলি বর্গক্ষেত্রযুক্ত হয় - গড় থেকে বড় বিচ্যুতিগুলি অনুপাতহীনভাবে অবদান রাখে। উদাহরণস্বরূপ, {10, 11, 10, 12, 100}: বহিরাগত (100) অপসারণ করে এসডি ~ 38 থেকে ~ 0.9 এ নেমে আসে। যখন বহিরাগত মান উপস্থিত থাকে, তখন মধ্যবর্তী এবং আন্তঃকোয়ার্টিল পরিসীমা (আইকিউআর) কেন্দ্রীয় প্রবণতা এবং ছড়িয়ে পড়ার আরও শক্তিশালী পরিমাপ।
যদি স্ট্যান্ডার্ড ডিভিয়েশন শূন্য হয় তাহলে এর অর্থ কি?
শূন্যের একটি স্ট্যান্ডার্ড বিচ্যুতির অর্থ ডেটাসেটের সমস্ত মান একই রকম - কোনও পরিবর্তনশীলতা নেই। উদাহরণস্বরূপ, {5, 5, 5, 5, 5} এর গড় = 5 এবং এসডি = 0। এটি কৃত্রিম বা অত্যন্ত সীমাবদ্ধ ডেটাসেটে ঘটে। ব্যবহারিক ডেটাসেটে, এসডি = 0 প্রায়শই ডেটা সংগ্রহের ত্রুটি বা অভিন্ন পরিমাপ নির্দেশ করে।