ভেরিয়েন্স ক্যালকুলেটর - জনসংখ্যা ও নমুনা ভেরিয়েন্স
একটি ডেটা সেটের জন্য বৈষম্য এবং স্ট্যান্ডার্ড বিচ্যুতি গণনা করুন। জনসংখ্যা এবং নমুনা বৈষম্য সমর্থন করে। তাত্ক্ষণিক ফলাফলের জন্য বিনামূল্যে অনলাইন পরিসংখ্যান ক্যালকুলেটর।
বৈষম্য কি?
ভ্যারিয়েন্স পরিমাপ করেছড়িয়ে পড়াএকটি ডেটাসেট থেকে কতদূর মানগুলি গড় থেকে দূরে রয়েছে। একটি কম বৈসাদৃশ্য মানে ডেটা পয়েন্টগুলি গড়ের কাছাকাছি ক্লাস্টার; একটি উচ্চ বৈসাদৃশ্য মানে তারা ব্যাপকভাবে ছড়িয়ে পড়ে।
গড় থেকে বর্গক্ষেত্রের পার্থক্যের গড় হিসাবে ভেরিয়েন্স গণনা করা হয়ঃ
- জনসংখ্যার বৈকল্পিকতা (σ2):σ2 = Σ(xi - μ) 2 / N
- নমুনা ভেরিয়েন্স (s2):s2 = Σ(xi - x̄) 2 / (N-1)
যেখানে xi হল প্রতিটি ডাটা পয়েন্ট, μ (বা x̄) হল গড়, এবং N হল মানের সংখ্যা।স্ট্যান্ডার্ড বিচ্যুতিএটা মূল তথ্যের মতই একক, যা এটাকে আরো ব্যাখ্যাযোগ্য করে তোলে।
কেন আমরা পার্থক্যকে বর্গক্ষেত্র করি? দুটি কারণ: (1) বর্গক্ষেত্র নেতিবাচক মানগুলিকে সরিয়ে দেয় যাতে গড়ের উপরে এবং নীচের বিচ্যুতিগুলি বাতিল না হয়, এবং (2) বর্গক্ষেত্রটি বহিরাগতদের অপ্রতিরোধ্য ওজন দেয়, যা বৈচিত্র্যকে চরম মানের প্রতি সংবেদনশীল করে তোলে। এই সম্পত্তিটি একটি শক্তি (আউটলার সনাক্তকরণ) এবং একটি দুর্বলতা (আউটলার সংবেদনশীলতা) উভয়ই। চরম বহিরাগত মান সহ ডেটার জন্য,মধ্যম নিখুঁত বিচ্যুতি (এমএডি)আরো শক্তিশালী বিকল্প হিসেবে।
জনসংখ্যা বনাম নমুনা ভেরিয়েন্স
মূল পার্থক্য হচ্ছে নাম্বার -- N বনাম (N-1) -- যাকে বলা হয় বেসেলের সংশোধনঃ
| প্রকার | নাম্বার | কখন ব্যবহার করবেন | প্রতীক |
|---|---|---|---|
| জনসংখ্যার বৈচিত্র্য | N | আপনার কাছে পুরো জনসংখ্যার তথ্য আছে | σ² |
| নমুনা ভেরিয়েন্স | এন-১ | আপনি একটি বৃহত্তর জনসংখ্যা থেকে একটি নমুনা আছে | s² |
বাস্তবে, বেশিরভাগ বাস্তব-বিশ্বের তথ্য একটি নমুনা। N-1 (নমুনা বৈসাদৃশ্য) ব্যবহার করে একটিনিরপেক্ষ অনুমানএকটি নমুনায় N (জনসংখ্যা বৈষম্য) ব্যবহার করা পদ্ধতিগতভাবে প্রকৃত বৈষম্যকে কম মূল্যায়ন করে।
উদাহরণঃ ৫০ জন রোগীর উপর একটি নতুন ওষুধ পরীক্ষা করা মানে নমুনা বৈকল্পিকতা (এস২) ব্যবহার করা। একটি শ্রেণীকক্ষে সমস্ত শিক্ষার্থীদের বিশ্লেষণ করা মানে জনসংখ্যা বৈকল্পিকতা (এস২) ব্যবহার করা।
বেসেলের সংশোধন কেন কাজ করে?যখন আপনি নমুনা গড় গণনা করেন, আপনি একটি "স্বাধীনতার ডিগ্রি" ব্যবহার করেন - গড়টি নিজেই ডেটা থেকে গণনা করা হয়, সুতরাং গড় থেকে বিচ্যুতি সম্পূর্ণ স্বাধীন নয়। এন এর পরিবর্তে (এন -১) দ্বারা বিভক্ত করা এই এক ডিগ্রি স্বাধীনতা হ্রাসের জন্য ক্ষতিপূরণ দেয়, জনসংখ্যার বৈচিত্র্যের একটি নিরপেক্ষ অনুমানকারী উত্পাদন করে। এন বড় হওয়ার সাথে সাথে এন এবং এন -১ এর মধ্যে পার্থক্য তুচ্ছ হয়ে যায়।
ধাপে ধাপে ভ্যারিয়েন্স গণনা
ডেটা সেট দেওয়াঃ 4, 7, 13, 2, 8
- গড় গণনা করুনঃ(4+7+13+2+8) ÷ 5 = 34/5 =৬.৮
- গড় থেকে বিচ্যুতি খুঁজুনঃ(4-6.8) =-2.8; (7-6.8) =0.2; (13-6.8) =6.2; (2-6.8) =-4.8; (8-6.8) =1.2
- বিচ্ছিন্নতার বর্গক্ষেত্রঃ৭.৮৪; ০৪; ৩৮.৪৪; ২৩.০৪; ১.৪৪
- বর্গক্ষেত্রের যোগফল:7.84+0.04+38.44+23.04+1.44 =৭০.৮
- জনসংখ্যার বৈচিত্র্য:৭০.৮ ÷ ৫ =১৪.১৬
- নমুনার বৈষম্যঃ৭০.৮ ÷ ৪ =১৭.৭
- স্ট্যান্ডার্ড বিচ্যুতিঃ√14.16 =৩.৭৬(জনসংখ্যা) অথবা √17.7 =৪.২১(নমুনা)
ভ্যারিয়েন্সের শর্টকাট সূত্র
একটি সমতুল্য "গণনামূলক" সূত্র রয়েছে যা স্পষ্টভাবে বিচ্যুতি গণনা করা এড়ায়, হাত দিয়ে বা স্প্রেডশিটে গণনা করার সময় দরকারীঃ
σ2 = (Σxi2) / N - (Σxi/N) 2 = (Σxi2 - (Σxi) 2 / N) / N
নমুনার বৈপরীত্যের জন্যঃs2 = (Σxi2 - (Σxi)2/N) / (N-1)
আমাদের উদাহরণ ডেটা ব্যবহার করে (4, 7, 13, 2, 8):
- Σxi = 34, সুতরাং (Σxi) 2 = 1,156
- Σxi2 = 16 + 49 + 169 + 4 + 64 = 302
- জনসংখ্যার বৈচিত্র্য = (302 - 1156/5) / 5 = (302 - 231.2) / 5 = 70.8 / 5 =১৪.১৬ ✓
- নমুনার বৈসাদৃশ্য = 70.8 / 4 =১৭.৭ ✓
এই সূত্রটি সংখ্যাগতভাবে অভিন্ন তবে মানগুলি খুব বড় হলে ফ্লোটিং-পয়েন্ট যথার্থতার সমস্যায় ভুগতে পারে। কম্পিউটেশনাল স্থিতিশীলতার জন্য, ওয়েলফোর্ডের অনলাইন অ্যালগরিদম (যা একবারে একটি মান প্রক্রিয়া করে) সফ্টওয়্যার বাস্তবায়নে পছন্দ করা হয়।
সম্পর্কিত পরিসংখ্যানগত ব্যবস্থা
বৈকল্পিকতা ছড়িয়ে পড়ার বিভিন্ন পরিমাপের মধ্যে একটি। প্রত্যেকেরই বিভিন্ন শক্তি রয়েছে:
| ব্যবস্থা | সূত্র | ইউনিট | বহিরাগতদের প্রতি দৃঢ়তা | সেরা জন্য |
|---|---|---|---|---|
| ভেরিয়েন্স (σ2 বা s2) | গড় বর্গক্ষেত্রের বিচ্যুতি | স্কোয়ার ইউনিট | কম - খুব সংবেদনশীল | তাত্ত্বিক পরিসংখ্যান, ANOVA |
| স্ট্যান্ডার্ড ডিভিয়েশন (σ বা s) | √ভেরিয়েন্স | ডেটার মতই | কম | প্রাথমিক ইউনিটে রিপোর্টিং স্প্রেড |
| পরিসীমা | ম্যাক্স - মিনিট | ডেটার মতই | খুব কম | দ্রুত চেক, ছোট নমুনা |
| ইন্টারকোয়ার্টিল রেঞ্জ (আইকিউআর) | Q3 - Q1 | ডেটার মতই | উচ্চ | বিক্ষিপ্ত বন্টন, বক্স প্লট |
| গড় পরম বিচ্যুতি (এমএডি) | গড় আয়ু | ডেটার মতই | মধ্যপন্থী | স্প্রেডের স্বজ্ঞাত পরিমাপ |
| ভেরিয়েশন সহগ (সিভি) | (এসডি / গড়) এক্স 100% | শতাংশ | কম | বিভিন্ন স্কেল জুড়ে ছড়িয়ে পড়া তুলনা করা |
স্বাভাবিক (বেল-ক্রম) বন্টনের জন্য, স্ট্যান্ডার্ড বিচ্যুতির একটি বিশেষ ব্যাখ্যা রয়েছেঃ প্রায় 68% তথ্য গড়ের +/-1 SD এর মধ্যে পড়ে, 95% +/-2 SD এর মধ্যে এবং 99.7% +/-3 SD এর মধ্যে পড়ে।পরীক্ষামূলক নিয়ম(৬৮-৯৫-৯৯.৭ নিয়ম) ।
স্প্রেডশিট এবং প্রোগ্রামিং এর মধ্যে পার্থক্য
বেশিরভাগ সরঞ্জামগুলিতে অন্তর্নির্মিত বৈষম্য ফাংশন রয়েছে। নিশ্চিত করুন যে আপনি সঠিক সংস্করণটি বেছে নিয়েছেন (জনসংখ্যা বনাম নমুনা):
| সরঞ্জাম | নমুনা ভেরিয়েন্স | জনসংখ্যার বৈচিত্র্য |
|---|---|---|
| এক্সেল / গুগল শীট | VAR.S(range) or VAR(range) | VAR.P(range) or VARP(range) |
| পাইথন (NumPy) | np.var(data, ddof=1) | np.var(data) |
| পাইথন (পরিসংখ্যান) | statistics.variance(data) | statistics.pvariance(data) |
| R | var(x) | var(x) * (n-1)/n |
| জাভাস্ক্রিপ্ট | ম্যানুয়াল গণনা (নির্মিত নয়) | ম্যানুয়াল গণনা |
| SQL (পোস্টগ্রেএসকিউএল) | VAR_SAMP(column) | VAR_POP(column) |
| ম্যাটল্যাব | var(x) | var(x, 1) |
দ্রষ্টব্যঃ পাইথনের NumPy ডিফল্টরূপেজনসংখ্যা(ddof=0), যখন R এরvar()ডিফল্টনমুনাবিভিন্ন ভাষার ফলাফলের তুলনা করার সময় এটি বিভ্রান্তির একটি সাধারণ উৎস।
বৈচিত্রের ব্যবহারিক প্রয়োগ
| ক্ষেত্র | আবেদন | উদাহরণ |
|---|---|---|
| অর্থায়ন | বিনিয়োগের ঝুঁকি | উচ্চ বৈসাদৃশ্য = আরো অস্থির স্টক রিটার্ন |
| উত্পাদন | মান নিয়ন্ত্রণ | কম ভেরিয়েন্স = সামঞ্জস্যপূর্ণ পণ্যের মাত্রা |
| ওষুধ | ক্লিনিকাল ট্রায়াল | রোগীর প্রতিক্রিয়া পরিবর্তনশীলতা পরিমাপ |
| ক্রীড়া বিজ্ঞান | পারফরম্যান্স বিশ্লেষণ | মৌসুমে ক্রীড়াবিদদের পারফরম্যান্সের পরিবর্তনশীলতা |
| শিক্ষা | টেস্ট স্কোর বিশ্লেষণ | শিক্ষার্থীদের পারফরম্যান্সের বিস্তার বোঝা |
ফাইন্যান্সিয়াল ভেরিয়েন্স: পোর্টফোলিও ঝুঁকি
ফাইন্যান্সে, ভেরিয়েন্স এবং স্ট্যান্ডার্ড ডিভিয়েশন বিনিয়োগের ঝুঁকি পরিমাপ করে। উচ্চতর ভেরিয়েন্স মানে রিটার্ন বেশি ওঠানামা করে -- বিনিয়োগ বেশি ঝুঁকিপূর্ণ।আধুনিক পোর্টফোলিও তত্ত্ব(১৯৫২, নোবেল পুরস্কার ১৯৯০) কেন্দ্রীয় ঝুঁকি পরিমাপ হিসাবে বৈকল্পিক ব্যবহার করে।
দুটি সম্পদের একটি পোর্টফোলিওর জন্য, সমন্বিত বৈষম্য পৃথক বৈষম্যের উপর নির্ভর করেএবংসম্পদের মধ্যে সম্পর্কঃ
σ²পোর্টফোলিও= w12σ12 + w22σ22 + 2·w1·w2·σ1·σ2·ρ12
যেখানে w = ওজন, σ2 = বৈসাদৃশ্য, এবং ρ = সম্পর্ক। যখন ρ < 1 (সম্পদগুলি নিখুঁত লকস্টিপে চলাচল করে না), পোর্টফোলিও বৈসাদৃশ্য হয়কমএটি হচ্ছে বৈচিত্র্যের গাণিতিক ভিত্তি -- অসংযুক্ত সম্পদের সংমিশ্রণ প্রত্যাশিত রিটার্নকে সমানুপাতিকভাবে হ্রাস না করে সামগ্রিক ঝুঁকি হ্রাস করে।
| সম্পদ শ্রেণী (২০০০-২০২৩) | বার্ষিক রিটার্ন | বার্ষিক এসডি (ভোলটাইলিটি) |
|---|---|---|
| ইউএস লার্জ ক্যাপ (এস এন্ড পি ৫০০) | ~ ৭.৫% | ~১৫% |
| ইউএস স্মল ক্যাপ (রাসেল ২০০০) | ~ ৭.০% | ~ ২০% |
| আন্তর্জাতিক উন্নত (ইএএফই) | ~ ৪.৫% | ~ ১৭% |
| মার্কিন বন্ড (সমষ্টিগত) | ~ ৪.০% | ~ ৪% |
| স্বর্ণ | ~8.0% | ~ ১৬% |
একটি পোর্টফোলিও যা শেয়ার এবং বন্ডগুলিকে একত্রিত করে সাধারণত স্ট্যান্ডার্ড ডিভিয়েশনটি একা শেয়ারের তুলনায় উল্লেখযোগ্যভাবে কম থাকে, যখন এখনও ইক্যুইটি রিটার্ন প্রিমিয়ামের বেশিরভাগটি ক্যাপচার করে।
কোয়ালিটি কন্ট্রোলের পার্থক্য (সিক্স সিগমা)
উত্পাদন পণ্যের গুণমান নিয়ন্ত্রণ করতে বৈষম্য ব্যবহার করে।সিক্স সিগমা১৯৮০-এর দশকে মটোরোলা কর্তৃক উদ্ভাবিত এই পদ্ধতির লক্ষ্য হল প্রক্রিয়াটির বৈচিত্র্য হ্রাস করা, যতক্ষণ পর্যন্ত কার্যত কোন পণ্য নির্দিষ্টকরণের সীমার বাইরে না যায়।
| সিগমা স্তর | প্রতি মিলিয়নে ঘাটতি (ডিপিএমও) | ছাড় দেওয়া | প্রসেস ক্যাপাসিটি (সিপিকে) |
|---|---|---|---|
| 1σ | ৬৯১,৪৬২ | ৩০.৯% | ০.৩৩ |
| 2σ | ৩০৮,৫৩৮ | ৬৯.১% | ০.৬৭ |
| 3σ | ৬৬,৮০৭ | ৯৩.৩% | ১.০০ |
| 4σ | ৬,২১০ | ৯৯.৩৮% | ১.৩৩ |
| 5σ | ২৩৩ | ৯৯.৯৭৭% | ১.৬৭ |
| 6σ | ৩.৪ | ৯৯.৯৯৯৬৬% | ২.০০ |
6σ এ চলমান একটি প্রক্রিয়া প্রতি মিলিয়ন সুযোগে মাত্র 3.4 ত্রুটি উত্পাদন করে।সিপিকেসরাসরি বৈকল্পিকতার সাথে সম্পর্কিতঃ সিপিকে = (ইউএসএল - এমকিউ) / (3σ), যেখানে ইউএসএল হ'ল উচ্চতর স্পেসিফিকেশন সীমা। বৈকল্পিকতা হ্রাস করা (উন্নত মেশিন, প্রশিক্ষণ বা উপকরণগুলির মাধ্যমে) সিপিকে বৃদ্ধি করে এবং প্রক্রিয়াটিকে ছয় সিগমা মানের দিকে ঠেলে দেয়।
বিভিন্ন ক্ষেত্রে প্রয়োগকৃত উদাহরণ
এই বাস্তব-বিশ্বের উদাহরণগুলি দেখায় যে অনুশীলনে কীভাবে বৈষম্য গণনা করা হয় এবং ব্যাখ্যা করা হয়ঃ
উদাহরণ 1: স্টক রিটার্নের অস্থিরতা
৬ মাস ধরে একটি স্টক এর মাসিক রিটার্নঃ +৩.২%, -১.৫%, +৪.৮%, -০.৭%, +২.১%, +১.৬%
- গড় = (3.2-1.5+4.8-0.7+2.1+1.6) / 6 = 9.5/6 =১.৫৮৩%
- বিচ্যুতিঃ ১.৬১৭, -৩.০৮৩, ৩.২১৭, -২.২৮৩, ০.৫১৭, ০.১৭
- বর্গঃ ২.৬১৫, ৯.৫০৪, ১০.৩৪৯, ৫.২১২, ০.২৬৭, ০.০০০৩
- বর্গক্ষেত্রের যোগফল = ২৭,৯৪৭
- নমুনার বৈসাদৃশ্য = 27.947/5 =5.589 (%2)
- স্ট্যান্ডার্ড বিচ্যুতি = √5.589 =২.৩৬৪%প্রতি মাসে
- বার্ষিক অস্থিরতা ~ ২.৩৬৪% x √১২ =৮.১৯%
এই স্টকটির মাঝারি অস্থিরতা রয়েছে। এস অ্যান্ড পি ৫০০ এর ঐতিহাসিকভাবে ~ ১৫% বার্ষিক অস্থিরতা রয়েছে, তাই এই স্টকটি বিস্তৃত বাজারের তুলনায় প্রায় অর্ধেক অস্থির।
উদাহরণ ২ঃ উত্পাদন মান নিয়ন্ত্রণ
একটি কারখানা 50.00 মিমি লক্ষ্য দৈর্ঘ্যের বোল্ট উত্পাদন করে। 8 টি বোল্টের একটি নমুনা পরিমাপ করেঃ 50.02, 49.98, 50.05, 49.97, 50.01, 50.03, 49.99, 50.00 মিমি।
- গড় = 400.05/8 =50.00625 মিমি
- নমুনা বৈসাদৃশ্য =0.000655 মিমি2
- স্ট্যান্ডার্ড ডিভিয়েশন =0.0256 মিমি
- স্পেসিফিকেশন সীমা 50.00 +/- 0.10 মিমিঃ Cpk = (50.10 - 50.006) / (3 x 0.0256) =১.২২
১.২২ এর একটি সিপিকে মানে প্রক্রিয়াটি সক্ষম তবে এর সামান্য মার্জিন রয়েছে। শিল্পের স্ট্যান্ডার্ড লক্ষ্যটি সিপিকে >= ১.৩৩ (৪σ ক্ষমতা), সুতরাং এই স্তরটি অর্জনের জন্য এই প্রক্রিয়াটিকে আরও কঠোর নিয়ন্ত্রণের প্রয়োজন।
উদাহরণ ৩ঃ শিক্ষার্থীদের পরীক্ষার স্কোর
১০ জন ছাত্রের একটি ক্লাস পরীক্ষায় ৭২, ৮৫, ৯০, ৬৮, ৭৭, ৯৫, ৮৩, ৭৯, ৮৮, ৭৩ নম্বর পায়।
- গড় = 810/10 =৮১.০
- জনসংখ্যার বৈচিত্র্য (পুরো শ্রেণী) =৭২.২
- স্ট্যান্ডার্ড ডিভিয়েশন =৮.৫০
- পরিবর্তনের সহগ = 8.50/81.0 x 100% =১০.৫%
১০.৫% এর একটি সিভি মাঝারি বিস্তারকে নির্দেশ করে - বেশিরভাগ শিক্ষার্থী গড়ের যুক্তিসঙ্গত পরিসরের মধ্যে পারফর্ম করেছে। যদি সিভি ২৫% ছাড়িয়ে যায়, তবে প্রশিক্ষক তদন্ত করতে পারেন যে পরীক্ষায় এমন প্রশ্ন রয়েছে যা কিছু শিক্ষার্থীর পক্ষে খুব কঠিন ছিল বা সেখানে দ্বি-মোডাল বন্টন ছিল কিনা (দুটি পৃথক গ্রুপ) ।
বৈষম্য গণনা করার সময় সাধারণ ভুল
এই সাধারণ ভুলগুলো এড়িয়ে চলুন:
| ত্রুটি | কেন এটা ভুল | সংশোধন |
|---|---|---|
| নমুনার জন্য N-1 এর পরিবর্তে N ব্যবহার করা | প্রকৃত জনসংখ্যার বৈচিত্র্যকে কম মূল্যায়ন করে | যে কোন তথ্যের জন্য N-1 ব্যবহার করুন যা একটি বৃহত্তর জনসংখ্যার একটি নমুনা |
| বর্গক্ষেত্রের পরিবর্তে নিখুঁত বিচ্যুতি গড় করা | MAD দেয়, ভেরিয়েন্স দেয় না | প্রতিটি বিচ্যুতিকে স্কোয়ার করুন, তারপর গড়। স্ট্যান্ডার্ড ডিভিয়েশনের জন্য √ নিন |
| গড়ের আগে স্কোয়ার করতে ভুলে যাওয়া | ইতিবাচক এবং নেতিবাচক বিচ্যুতি বাতিল করে, ~ 0 প্রদান করে | সর্বদা প্রথম বর্গক্ষেত্র বিচ্যুতি |
| বিভিন্ন স্কেলের মধ্যে বৈসাদৃশ্যের তুলনা | ভেরিয়েন্স ইউনিট উপর নির্ভর করে; $2 ≠ kg2 | ক্রস-স্কেল তুলনা করার জন্য ভেরিয়েশন সহগ ব্যবহার করুন (সিভি) |
| ভ্যারিয়েন্স = স্ট্যান্ডার্ড ডিভিয়েশন ধরে নিলে | ভেরিয়েন্স হল SD2; ইউনিটগুলি বর্গক্ষেত্র হয় | এসডি পেতে বৈসাদৃশ্য এর বর্গমূল নিন |
ANOVA: বিভিন্ন গ্রুপের মধ্যে পার্থক্যের তুলনা
বৈকল্পিক বিশ্লেষণ (ANOVA)একটি পরিসংখ্যানগত পরীক্ষা যা বৈষম্য বিশ্লেষণ করে একাধিক গোষ্ঠীর গড়ের তুলনা করে। নাম সত্ত্বেও, এটি পরীক্ষা করে যে গ্রুপের গড়গুলি আলাদা কিনা, বৈষম্যগুলি আলাদা কিনা তা নয়।
ANOVA মোট বৈসাদৃশ্যকে দুটি ভাগে বিভক্ত করেঃ
- গ্রুপের মধ্যে পার্থক্যঃগোষ্ঠীর গড় কতটুকু সামগ্রিক গড় থেকে আলাদা
- গ্রুপের মধ্যে পার্থক্যঃপ্রতিটি গ্রুপের মধ্যে পৃথক মান কতটুকু পরিবর্তিত হয়
দ্যএফ-স্ট্যাটিস্টিক= গ্রুপের মধ্যে বৈষম্য / গ্রুপের মধ্যে বৈষম্য। একটি বড় F এর অর্থ হল গ্রুপগুলি একে অপরের থেকে দুর্ঘটনা দ্বারা প্রত্যাশার চেয়ে বেশি আলাদা। যদি F সমালোচনামূলক মান অতিক্রম করে (বা p < 0.05), কমপক্ষে একটি গ্রুপের গড় উল্লেখযোগ্যভাবে আলাদা।
উদাহরণ: তিনটি ভিন্ন পদ্ধতিতে শিক্ষিত শিক্ষার্থীদের পরীক্ষার স্কোরের তুলনা করা। ANOVA আপনাকে বলে দেয় যে শিক্ষার পদ্ধতিটি গুরুত্বপূর্ণ কিনা; পোস্ট-হোক পরীক্ষা (টুকি, বোনফেরোনি) আপনাকে বলেযাপদ্ধতি ভিন্ন।
তুমি কি জান?
- ১৯১৮ সালে রোনাল্ড ফিশার ভ্যারিয়েন্সের সূচনা করেন -- একই গবেষণাপত্রে তিনি "ভ্যারিয়েন্স" শব্দটি উদ্ভাবন করেন।
- অর্থনীতিতে, বৈষম্য আধুনিক পোর্টফোলিও তত্ত্বের ভিত্তি। একটি পোর্টফোলিওর বৈষম্য কেবলমাত্র স্বতন্ত্র সম্পদ বৈষম্যের উপর নির্ভর করে না বরং সম্পদগুলির মধ্যে সম্পর্কের উপর নির্ভর করে।
- পরিবর্তনের সহগ (সিভি = স্ট্যান্ডার্ড ডিভিয়েশন / গড় এক্স 100%) বিভিন্ন ইউনিট বা স্কেল সহ ডেটাসেট জুড়ে পরিবর্তনশীলতার তুলনা করতে দেয়।
- চেবিশেভের বৈষম্য নিশ্চিত করে যেযে কোন(শুধুমাত্র স্বাভাবিক নয়), কমপক্ষে 75% তথ্য +/-2 স্ট্যান্ডার্ড বিচ্যুতির মধ্যে পড়ে এবং কমপক্ষে 89% +/-3 স্ট্যান্ডার্ড বিচ্যুতির মধ্যে পড়ে। এটি অভিজ্ঞতার নিয়মের চেয়ে দুর্বল তবে সর্বজনীনভাবে প্রযোজ্য।
প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী
ভেরিয়েন্স এবং স্ট্যান্ডার্ড ডিভিয়েশনের মধ্যে পার্থক্য কি?
বৈকল্পিকতা হ'ল গড় থেকে বর্গক্ষেত্রের বিচ্যুতিগুলির গড়; স্ট্যান্ডার্ড বিচ্যুতি হ'ল এর বর্গমূল। স্ট্যান্ডার্ড বিচ্যুতি মূল তথ্য (যেমন, ডলার, কেজি, সেকেন্ড) হিসাবে একই ইউনিটগুলিতে রয়েছে, এটি আরও ব্যাখ্যাযোগ্য করে তোলে। বৈকল্পিকতা গাণিতিক ক্রিয়াকলাপে দরকারী (স্বাধীন ভেরিয়েবলের বৈকল্পিকতা সরাসরি যোগ করে), যখন স্ট্যান্ডার্ড বিচ্যুতি একটি অ-প্রযুক্তিগত শ্রোতাদের কাছে ছড়িয়ে পড়া বর্ণনা করার জন্য আরও ভাল।
কখন আমি নমুনা বনাম জনসংখ্যা বৈষম্য ব্যবহার করা উচিত?
জনসংখ্যা বৈষম্য ব্যবহার করুন যখন আপনার ডেটাতে আপনি বিশ্লেষণ করছেন এমন গোষ্ঠীর প্রতিটি সদস্য থাকে (উদাহরণস্বরূপ, একটি সংস্থার সমস্ত কর্মচারী) । যখন আপনার ডেটা বৃহত্তর গোষ্ঠীর একটি উপসেট হয় তখন নমুনা বৈষম্য ব্যবহার করুন (উদাহরণস্বরূপ, সমস্ত ভোটারদের মতামত অনুমান করার জন্য 500 ভোটারের একটি জরিপ) । বেশিরভাগ বাস্তব-বিশ্ব গবেষণা এবং পরিসংখ্যানগুলিতে, নমুনা বৈষম্য উপযুক্ত।
বৈসাদৃশ্য কি নেগেটিভ হতে পারে?
না. বৈকল্পিকতা সর্বদা শূন্য বা ধনাত্মক কারণ এটি বর্গক্ষেত্রের মান থেকে গণনা করা হয়। বৈকল্পিকতা = 0 শুধুমাত্র যখন সমস্ত ডেটা পয়েন্টগুলি একই থাকে (কোনও স্প্রেড নেই) । একটি নেতিবাচক বৈকল্পিকতা গাণিতিকভাবে অসম্ভব এবং একটি গণনা ত্রুটি নির্দেশ করে।
একটি "উচ্চ" বা "নিম্ন" বৈসাদৃশ্য কি?
উচ্চ এবং নিম্ন তথ্যের স্কেল এবং প্রসঙ্গের সাথে সম্পর্কিত। সেন্টিমিটারে মানুষের উচ্চতার জন্য 10 এর একটি বৈকল্পিক "নিম্ন" তবে মিটারে উচ্চতার জন্য "উচ্চ"। বৈকল্পিক সহগ (এসডি / গড় এক্স 100%) স্কেল-স্বাধীন এবং বিভিন্ন ডেটাসেটের মধ্যে তুলনা করার অনুমতি দেয়। গুণমান নিয়ন্ত্রণে, স্পেসিফিকেশনগুলি প্রতিটি পরিমাপের জন্য গ্রহণযোগ্য বৈকল্পিক পরিসীমা সংজ্ঞায়িত করে।
কিভাবে বৈসাদৃশ্য স্বাভাবিক বন্টনের সাথে সম্পর্কিত?
সাধারণ (গাউসিয়ান) বন্টন সম্পূর্ণরূপে মাত্র দুটি প্যারামিটার দ্বারা বর্ণনা করা হয়ঃ গড় (μ) এবং বৈকল্পিক (σ2) । পরিচিত বেল বক্ররেখা যখন বৈকল্পিক বড় হয় তখন আরও প্রশস্ত হয় এবং যখন বৈকল্পিক ছোট হয় তখন আরও সংকীর্ণ হয়। সাধারণ তথ্যের জন্য, অভিজ্ঞতার নিয়মটি ধরে রাখা হয়ঃ +/-1σ এর মধ্যে 68.3%, +/-2σ এর মধ্যে 95.4% এবং +/-3σ এর মধ্যে 99.7%। অনেক পরিসংখ্যানগত পরীক্ষা (টি-টেস্ট, এএনওভিএ, রিগ্রেশন) অনুমান করে যে ডেটা একটি স্বাভাবিক বন্টন অনুসরণ করে বা প্রায় নমুনা গড় স্বাভাবিক (সেন্ট্রাল লিমিট থিওরেমের মাধ্যমে) ।
পুলেড ভেরিয়েন্স কি?
পুলড ভেরিয়েন্স হল দুই বা ততোধিক গোষ্ঠীর নমুনা ভেরিয়েন্সের একটি ওজনের গড়, যা দুই-নমুনা টি-টেস্টে ব্যবহৃত হয় যখন আপনি গোষ্ঠী জুড়ে সমান ভেরিয়েন্স ধরে নেন। সূত্রটি হলঃ s2সমন্বিত= [(n1-1) s12 + (n2-1) s22] / (n1 + n2 - 2) এটি একটি একক বৈকল্পিক অনুমান উত্পন্ন করে যা উভয় নমুনার তথ্য অন্তর্ভুক্ত করে, যখন সমান-বৈকল্পিক অনুমানটি বৈধ হয় তখন পরিসংখ্যানগত শক্তি বৃদ্ধি করে।