Skip to main content
🔬 Advanced

ভেরিয়েন্স ক্যালকুলেটর - জনসংখ্যা ও নমুনা ভেরিয়েন্স

একটি ডেটা সেটের জন্য বৈষম্য এবং স্ট্যান্ডার্ড বিচ্যুতি গণনা করুন। জনসংখ্যা এবং নমুনা বৈষম্য সমর্থন করে। তাত্ক্ষণিক ফলাফলের জন্য বিনামূল্যে অনলাইন পরিসংখ্যান ক্যালকুলেটর।

বৈষম্য কি?

ভ্যারিয়েন্স পরিমাপ করেছড়িয়ে পড়াএকটি ডেটাসেট থেকে কতদূর মানগুলি গড় থেকে দূরে রয়েছে। একটি কম বৈসাদৃশ্য মানে ডেটা পয়েন্টগুলি গড়ের কাছাকাছি ক্লাস্টার; একটি উচ্চ বৈসাদৃশ্য মানে তারা ব্যাপকভাবে ছড়িয়ে পড়ে।

গড় থেকে বর্গক্ষেত্রের পার্থক্যের গড় হিসাবে ভেরিয়েন্স গণনা করা হয়ঃ

যেখানে xi হল প্রতিটি ডাটা পয়েন্ট, μ (বা x̄) হল গড়, এবং N হল মানের সংখ্যা।স্ট্যান্ডার্ড বিচ্যুতিএটা মূল তথ্যের মতই একক, যা এটাকে আরো ব্যাখ্যাযোগ্য করে তোলে।

কেন আমরা পার্থক্যকে বর্গক্ষেত্র করি? দুটি কারণ: (1) বর্গক্ষেত্র নেতিবাচক মানগুলিকে সরিয়ে দেয় যাতে গড়ের উপরে এবং নীচের বিচ্যুতিগুলি বাতিল না হয়, এবং (2) বর্গক্ষেত্রটি বহিরাগতদের অপ্রতিরোধ্য ওজন দেয়, যা বৈচিত্র্যকে চরম মানের প্রতি সংবেদনশীল করে তোলে। এই সম্পত্তিটি একটি শক্তি (আউটলার সনাক্তকরণ) এবং একটি দুর্বলতা (আউটলার সংবেদনশীলতা) উভয়ই। চরম বহিরাগত মান সহ ডেটার জন্য,মধ্যম নিখুঁত বিচ্যুতি (এমএডি)আরো শক্তিশালী বিকল্প হিসেবে।

জনসংখ্যা বনাম নমুনা ভেরিয়েন্স

মূল পার্থক্য হচ্ছে নাম্বার -- N বনাম (N-1) -- যাকে বলা হয় বেসেলের সংশোধনঃ

প্রকারনাম্বারকখন ব্যবহার করবেনপ্রতীক
জনসংখ্যার বৈচিত্র্যNআপনার কাছে পুরো জনসংখ্যার তথ্য আছেσ²
নমুনা ভেরিয়েন্সএন-১আপনি একটি বৃহত্তর জনসংখ্যা থেকে একটি নমুনা আছে

বাস্তবে, বেশিরভাগ বাস্তব-বিশ্বের তথ্য একটি নমুনা। N-1 (নমুনা বৈসাদৃশ্য) ব্যবহার করে একটিনিরপেক্ষ অনুমানএকটি নমুনায় N (জনসংখ্যা বৈষম্য) ব্যবহার করা পদ্ধতিগতভাবে প্রকৃত বৈষম্যকে কম মূল্যায়ন করে।

উদাহরণঃ ৫০ জন রোগীর উপর একটি নতুন ওষুধ পরীক্ষা করা মানে নমুনা বৈকল্পিকতা (এস২) ব্যবহার করা। একটি শ্রেণীকক্ষে সমস্ত শিক্ষার্থীদের বিশ্লেষণ করা মানে জনসংখ্যা বৈকল্পিকতা (এস২) ব্যবহার করা।

বেসেলের সংশোধন কেন কাজ করে?যখন আপনি নমুনা গড় গণনা করেন, আপনি একটি "স্বাধীনতার ডিগ্রি" ব্যবহার করেন - গড়টি নিজেই ডেটা থেকে গণনা করা হয়, সুতরাং গড় থেকে বিচ্যুতি সম্পূর্ণ স্বাধীন নয়। এন এর পরিবর্তে (এন -১) দ্বারা বিভক্ত করা এই এক ডিগ্রি স্বাধীনতা হ্রাসের জন্য ক্ষতিপূরণ দেয়, জনসংখ্যার বৈচিত্র্যের একটি নিরপেক্ষ অনুমানকারী উত্পাদন করে। এন বড় হওয়ার সাথে সাথে এন এবং এন -১ এর মধ্যে পার্থক্য তুচ্ছ হয়ে যায়।

ধাপে ধাপে ভ্যারিয়েন্স গণনা

ডেটা সেট দেওয়াঃ 4, 7, 13, 2, 8

  1. গড় গণনা করুনঃ(4+7+13+2+8) ÷ 5 = 34/5 =৬.৮
  2. গড় থেকে বিচ্যুতি খুঁজুনঃ(4-6.8) =-2.8; (7-6.8) =0.2; (13-6.8) =6.2; (2-6.8) =-4.8; (8-6.8) =1.2
  3. বিচ্ছিন্নতার বর্গক্ষেত্রঃ৭.৮৪; ০৪; ৩৮.৪৪; ২৩.০৪; ১.৪৪
  4. বর্গক্ষেত্রের যোগফল:7.84+0.04+38.44+23.04+1.44 =৭০.৮
  5. জনসংখ্যার বৈচিত্র্য:৭০.৮ ÷ ৫ =১৪.১৬
  6. নমুনার বৈষম্যঃ৭০.৮ ÷ ৪ =১৭.৭
  7. স্ট্যান্ডার্ড বিচ্যুতিঃ√14.16 =৩.৭৬(জনসংখ্যা) অথবা √17.7 =৪.২১(নমুনা)

ভ্যারিয়েন্সের শর্টকাট সূত্র

একটি সমতুল্য "গণনামূলক" সূত্র রয়েছে যা স্পষ্টভাবে বিচ্যুতি গণনা করা এড়ায়, হাত দিয়ে বা স্প্রেডশিটে গণনা করার সময় দরকারীঃ

σ2 = (Σxi2) / N - (Σxi/N) 2 = (Σxi2 - (Σxi) 2 / N) / N

নমুনার বৈপরীত্যের জন্যঃs2 = (Σxi2 - (Σxi)2/N) / (N-1)

আমাদের উদাহরণ ডেটা ব্যবহার করে (4, 7, 13, 2, 8):

  1. Σxi = 34, সুতরাং (Σxi) 2 = 1,156
  2. Σxi2 = 16 + 49 + 169 + 4 + 64 = 302
  3. জনসংখ্যার বৈচিত্র্য = (302 - 1156/5) / 5 = (302 - 231.2) / 5 = 70.8 / 5 =১৪.১৬
  4. নমুনার বৈসাদৃশ্য = 70.8 / 4 =১৭.৭

এই সূত্রটি সংখ্যাগতভাবে অভিন্ন তবে মানগুলি খুব বড় হলে ফ্লোটিং-পয়েন্ট যথার্থতার সমস্যায় ভুগতে পারে। কম্পিউটেশনাল স্থিতিশীলতার জন্য, ওয়েলফোর্ডের অনলাইন অ্যালগরিদম (যা একবারে একটি মান প্রক্রিয়া করে) সফ্টওয়্যার বাস্তবায়নে পছন্দ করা হয়।

সম্পর্কিত পরিসংখ্যানগত ব্যবস্থা

বৈকল্পিকতা ছড়িয়ে পড়ার বিভিন্ন পরিমাপের মধ্যে একটি। প্রত্যেকেরই বিভিন্ন শক্তি রয়েছে:

ব্যবস্থাসূত্রইউনিটবহিরাগতদের প্রতি দৃঢ়তাসেরা জন্য
ভেরিয়েন্স (σ2 বা s2)গড় বর্গক্ষেত্রের বিচ্যুতিস্কোয়ার ইউনিটকম - খুব সংবেদনশীলতাত্ত্বিক পরিসংখ্যান, ANOVA
স্ট্যান্ডার্ড ডিভিয়েশন (σ বা s)√ভেরিয়েন্সডেটার মতইকমপ্রাথমিক ইউনিটে রিপোর্টিং স্প্রেড
পরিসীমাম্যাক্স - মিনিটডেটার মতইখুব কমদ্রুত চেক, ছোট নমুনা
ইন্টারকোয়ার্টিল রেঞ্জ (আইকিউআর)Q3 - Q1ডেটার মতইউচ্চবিক্ষিপ্ত বন্টন, বক্স প্লট
গড় পরম বিচ্যুতি (এমএডি)গড় আয়ুডেটার মতইমধ্যপন্থীস্প্রেডের স্বজ্ঞাত পরিমাপ
ভেরিয়েশন সহগ (সিভি)(এসডি / গড়) এক্স 100%শতাংশকমবিভিন্ন স্কেল জুড়ে ছড়িয়ে পড়া তুলনা করা

স্বাভাবিক (বেল-ক্রম) বন্টনের জন্য, স্ট্যান্ডার্ড বিচ্যুতির একটি বিশেষ ব্যাখ্যা রয়েছেঃ প্রায় 68% তথ্য গড়ের +/-1 SD এর মধ্যে পড়ে, 95% +/-2 SD এর মধ্যে এবং 99.7% +/-3 SD এর মধ্যে পড়ে।পরীক্ষামূলক নিয়ম(৬৮-৯৫-৯৯.৭ নিয়ম) ।

স্প্রেডশিট এবং প্রোগ্রামিং এর মধ্যে পার্থক্য

বেশিরভাগ সরঞ্জামগুলিতে অন্তর্নির্মিত বৈষম্য ফাংশন রয়েছে। নিশ্চিত করুন যে আপনি সঠিক সংস্করণটি বেছে নিয়েছেন (জনসংখ্যা বনাম নমুনা):

সরঞ্জামনমুনা ভেরিয়েন্সজনসংখ্যার বৈচিত্র্য
এক্সেল / গুগল শীটVAR.S(range) or VAR(range)VAR.P(range) or VARP(range)
পাইথন (NumPy)np.var(data, ddof=1)np.var(data)
পাইথন (পরিসংখ্যান)statistics.variance(data)statistics.pvariance(data)
Rvar(x)var(x) * (n-1)/n
জাভাস্ক্রিপ্টম্যানুয়াল গণনা (নির্মিত নয়)ম্যানুয়াল গণনা
SQL (পোস্টগ্রেএসকিউএল)VAR_SAMP(column)VAR_POP(column)
ম্যাটল্যাবvar(x)var(x, 1)

দ্রষ্টব্যঃ পাইথনের NumPy ডিফল্টরূপেজনসংখ্যা(ddof=0), যখন R এরvar()ডিফল্টনমুনাবিভিন্ন ভাষার ফলাফলের তুলনা করার সময় এটি বিভ্রান্তির একটি সাধারণ উৎস।

বৈচিত্রের ব্যবহারিক প্রয়োগ

ক্ষেত্রআবেদনউদাহরণ
অর্থায়নবিনিয়োগের ঝুঁকিউচ্চ বৈসাদৃশ্য = আরো অস্থির স্টক রিটার্ন
উত্পাদনমান নিয়ন্ত্রণকম ভেরিয়েন্স = সামঞ্জস্যপূর্ণ পণ্যের মাত্রা
ওষুধক্লিনিকাল ট্রায়ালরোগীর প্রতিক্রিয়া পরিবর্তনশীলতা পরিমাপ
ক্রীড়া বিজ্ঞানপারফরম্যান্স বিশ্লেষণমৌসুমে ক্রীড়াবিদদের পারফরম্যান্সের পরিবর্তনশীলতা
শিক্ষাটেস্ট স্কোর বিশ্লেষণশিক্ষার্থীদের পারফরম্যান্সের বিস্তার বোঝা

ফাইন্যান্সিয়াল ভেরিয়েন্স: পোর্টফোলিও ঝুঁকি

ফাইন্যান্সে, ভেরিয়েন্স এবং স্ট্যান্ডার্ড ডিভিয়েশন বিনিয়োগের ঝুঁকি পরিমাপ করে। উচ্চতর ভেরিয়েন্স মানে রিটার্ন বেশি ওঠানামা করে -- বিনিয়োগ বেশি ঝুঁকিপূর্ণ।আধুনিক পোর্টফোলিও তত্ত্ব(১৯৫২, নোবেল পুরস্কার ১৯৯০) কেন্দ্রীয় ঝুঁকি পরিমাপ হিসাবে বৈকল্পিক ব্যবহার করে।

দুটি সম্পদের একটি পোর্টফোলিওর জন্য, সমন্বিত বৈষম্য পৃথক বৈষম্যের উপর নির্ভর করেএবংসম্পদের মধ্যে সম্পর্কঃ

σ²পোর্টফোলিও= w12σ12 + w22σ22 + 2·w1·w2·σ1·σ2·ρ12

যেখানে w = ওজন, σ2 = বৈসাদৃশ্য, এবং ρ = সম্পর্ক। যখন ρ < 1 (সম্পদগুলি নিখুঁত লকস্টিপে চলাচল করে না), পোর্টফোলিও বৈসাদৃশ্য হয়কমএটি হচ্ছে বৈচিত্র্যের গাণিতিক ভিত্তি -- অসংযুক্ত সম্পদের সংমিশ্রণ প্রত্যাশিত রিটার্নকে সমানুপাতিকভাবে হ্রাস না করে সামগ্রিক ঝুঁকি হ্রাস করে।

সম্পদ শ্রেণী (২০০০-২০২৩)বার্ষিক রিটার্নবার্ষিক এসডি (ভোলটাইলিটি)
ইউএস লার্জ ক্যাপ (এস এন্ড পি ৫০০)~ ৭.৫%~১৫%
ইউএস স্মল ক্যাপ (রাসেল ২০০০)~ ৭.০%~ ২০%
আন্তর্জাতিক উন্নত (ইএএফই)~ ৪.৫%~ ১৭%
মার্কিন বন্ড (সমষ্টিগত)~ ৪.০%~ ৪%
স্বর্ণ~8.0%~ ১৬%

একটি পোর্টফোলিও যা শেয়ার এবং বন্ডগুলিকে একত্রিত করে সাধারণত স্ট্যান্ডার্ড ডিভিয়েশনটি একা শেয়ারের তুলনায় উল্লেখযোগ্যভাবে কম থাকে, যখন এখনও ইক্যুইটি রিটার্ন প্রিমিয়ামের বেশিরভাগটি ক্যাপচার করে।

কোয়ালিটি কন্ট্রোলের পার্থক্য (সিক্স সিগমা)

উত্পাদন পণ্যের গুণমান নিয়ন্ত্রণ করতে বৈষম্য ব্যবহার করে।সিক্স সিগমা১৯৮০-এর দশকে মটোরোলা কর্তৃক উদ্ভাবিত এই পদ্ধতির লক্ষ্য হল প্রক্রিয়াটির বৈচিত্র্য হ্রাস করা, যতক্ষণ পর্যন্ত কার্যত কোন পণ্য নির্দিষ্টকরণের সীমার বাইরে না যায়।

সিগমা স্তরপ্রতি মিলিয়নে ঘাটতি (ডিপিএমও)ছাড় দেওয়াপ্রসেস ক্যাপাসিটি (সিপিকে)
৬৯১,৪৬২৩০.৯%০.৩৩
৩০৮,৫৩৮৬৯.১%০.৬৭
৬৬,৮০৭৯৩.৩%১.০০
৬,২১০৯৯.৩৮%১.৩৩
২৩৩৯৯.৯৭৭%১.৬৭
৩.৪৯৯.৯৯৯৬৬%২.০০

6σ এ চলমান একটি প্রক্রিয়া প্রতি মিলিয়ন সুযোগে মাত্র 3.4 ত্রুটি উত্পাদন করে।সিপিকেসরাসরি বৈকল্পিকতার সাথে সম্পর্কিতঃ সিপিকে = (ইউএসএল - এমকিউ) / (3σ), যেখানে ইউএসএল হ'ল উচ্চতর স্পেসিফিকেশন সীমা। বৈকল্পিকতা হ্রাস করা (উন্নত মেশিন, প্রশিক্ষণ বা উপকরণগুলির মাধ্যমে) সিপিকে বৃদ্ধি করে এবং প্রক্রিয়াটিকে ছয় সিগমা মানের দিকে ঠেলে দেয়।

বিভিন্ন ক্ষেত্রে প্রয়োগকৃত উদাহরণ

এই বাস্তব-বিশ্বের উদাহরণগুলি দেখায় যে অনুশীলনে কীভাবে বৈষম্য গণনা করা হয় এবং ব্যাখ্যা করা হয়ঃ

উদাহরণ 1: স্টক রিটার্নের অস্থিরতা

৬ মাস ধরে একটি স্টক এর মাসিক রিটার্নঃ +৩.২%, -১.৫%, +৪.৮%, -০.৭%, +২.১%, +১.৬%

  1. গড় = (3.2-1.5+4.8-0.7+2.1+1.6) / 6 = 9.5/6 =১.৫৮৩%
  2. বিচ্যুতিঃ ১.৬১৭, -৩.০৮৩, ৩.২১৭, -২.২৮৩, ০.৫১৭, ০.১৭
  3. বর্গঃ ২.৬১৫, ৯.৫০৪, ১০.৩৪৯, ৫.২১২, ০.২৬৭, ০.০০০৩
  4. বর্গক্ষেত্রের যোগফল = ২৭,৯৪৭
  5. নমুনার বৈসাদৃশ্য = 27.947/5 =5.589 (%2)
  6. স্ট্যান্ডার্ড বিচ্যুতি = √5.589 =২.৩৬৪%প্রতি মাসে
  7. বার্ষিক অস্থিরতা ~ ২.৩৬৪% x √১২ =৮.১৯%

এই স্টকটির মাঝারি অস্থিরতা রয়েছে। এস অ্যান্ড পি ৫০০ এর ঐতিহাসিকভাবে ~ ১৫% বার্ষিক অস্থিরতা রয়েছে, তাই এই স্টকটি বিস্তৃত বাজারের তুলনায় প্রায় অর্ধেক অস্থির।

উদাহরণ ২ঃ উত্পাদন মান নিয়ন্ত্রণ

একটি কারখানা 50.00 মিমি লক্ষ্য দৈর্ঘ্যের বোল্ট উত্পাদন করে। 8 টি বোল্টের একটি নমুনা পরিমাপ করেঃ 50.02, 49.98, 50.05, 49.97, 50.01, 50.03, 49.99, 50.00 মিমি।

  1. গড় = 400.05/8 =50.00625 মিমি
  2. নমুনা বৈসাদৃশ্য =0.000655 মিমি2
  3. স্ট্যান্ডার্ড ডিভিয়েশন =0.0256 মিমি
  4. স্পেসিফিকেশন সীমা 50.00 +/- 0.10 মিমিঃ Cpk = (50.10 - 50.006) / (3 x 0.0256) =১.২২

১.২২ এর একটি সিপিকে মানে প্রক্রিয়াটি সক্ষম তবে এর সামান্য মার্জিন রয়েছে। শিল্পের স্ট্যান্ডার্ড লক্ষ্যটি সিপিকে >= ১.৩৩ (৪σ ক্ষমতা), সুতরাং এই স্তরটি অর্জনের জন্য এই প্রক্রিয়াটিকে আরও কঠোর নিয়ন্ত্রণের প্রয়োজন।

উদাহরণ ৩ঃ শিক্ষার্থীদের পরীক্ষার স্কোর

১০ জন ছাত্রের একটি ক্লাস পরীক্ষায় ৭২, ৮৫, ৯০, ৬৮, ৭৭, ৯৫, ৮৩, ৭৯, ৮৮, ৭৩ নম্বর পায়।

  1. গড় = 810/10 =৮১.০
  2. জনসংখ্যার বৈচিত্র্য (পুরো শ্রেণী) =৭২.২
  3. স্ট্যান্ডার্ড ডিভিয়েশন =৮.৫০
  4. পরিবর্তনের সহগ = 8.50/81.0 x 100% =১০.৫%

১০.৫% এর একটি সিভি মাঝারি বিস্তারকে নির্দেশ করে - বেশিরভাগ শিক্ষার্থী গড়ের যুক্তিসঙ্গত পরিসরের মধ্যে পারফর্ম করেছে। যদি সিভি ২৫% ছাড়িয়ে যায়, তবে প্রশিক্ষক তদন্ত করতে পারেন যে পরীক্ষায় এমন প্রশ্ন রয়েছে যা কিছু শিক্ষার্থীর পক্ষে খুব কঠিন ছিল বা সেখানে দ্বি-মোডাল বন্টন ছিল কিনা (দুটি পৃথক গ্রুপ) ।

বৈষম্য গণনা করার সময় সাধারণ ভুল

এই সাধারণ ভুলগুলো এড়িয়ে চলুন:

ত্রুটিকেন এটা ভুলসংশোধন
নমুনার জন্য N-1 এর পরিবর্তে N ব্যবহার করাপ্রকৃত জনসংখ্যার বৈচিত্র্যকে কম মূল্যায়ন করেযে কোন তথ্যের জন্য N-1 ব্যবহার করুন যা একটি বৃহত্তর জনসংখ্যার একটি নমুনা
বর্গক্ষেত্রের পরিবর্তে নিখুঁত বিচ্যুতি গড় করাMAD দেয়, ভেরিয়েন্স দেয় নাপ্রতিটি বিচ্যুতিকে স্কোয়ার করুন, তারপর গড়। স্ট্যান্ডার্ড ডিভিয়েশনের জন্য √ নিন
গড়ের আগে স্কোয়ার করতে ভুলে যাওয়াইতিবাচক এবং নেতিবাচক বিচ্যুতি বাতিল করে, ~ 0 প্রদান করেসর্বদা প্রথম বর্গক্ষেত্র বিচ্যুতি
বিভিন্ন স্কেলের মধ্যে বৈসাদৃশ্যের তুলনাভেরিয়েন্স ইউনিট উপর নির্ভর করে; $2 ≠ kg2ক্রস-স্কেল তুলনা করার জন্য ভেরিয়েশন সহগ ব্যবহার করুন (সিভি)
ভ্যারিয়েন্স = স্ট্যান্ডার্ড ডিভিয়েশন ধরে নিলেভেরিয়েন্স হল SD2; ইউনিটগুলি বর্গক্ষেত্র হয়এসডি পেতে বৈসাদৃশ্য এর বর্গমূল নিন

ANOVA: বিভিন্ন গ্রুপের মধ্যে পার্থক্যের তুলনা

বৈকল্পিক বিশ্লেষণ (ANOVA)একটি পরিসংখ্যানগত পরীক্ষা যা বৈষম্য বিশ্লেষণ করে একাধিক গোষ্ঠীর গড়ের তুলনা করে। নাম সত্ত্বেও, এটি পরীক্ষা করে যে গ্রুপের গড়গুলি আলাদা কিনা, বৈষম্যগুলি আলাদা কিনা তা নয়।

ANOVA মোট বৈসাদৃশ্যকে দুটি ভাগে বিভক্ত করেঃ

দ্যএফ-স্ট্যাটিস্টিক= গ্রুপের মধ্যে বৈষম্য / গ্রুপের মধ্যে বৈষম্য। একটি বড় F এর অর্থ হল গ্রুপগুলি একে অপরের থেকে দুর্ঘটনা দ্বারা প্রত্যাশার চেয়ে বেশি আলাদা। যদি F সমালোচনামূলক মান অতিক্রম করে (বা p < 0.05), কমপক্ষে একটি গ্রুপের গড় উল্লেখযোগ্যভাবে আলাদা।

উদাহরণ: তিনটি ভিন্ন পদ্ধতিতে শিক্ষিত শিক্ষার্থীদের পরীক্ষার স্কোরের তুলনা করা। ANOVA আপনাকে বলে দেয় যে শিক্ষার পদ্ধতিটি গুরুত্বপূর্ণ কিনা; পোস্ট-হোক পরীক্ষা (টুকি, বোনফেরোনি) আপনাকে বলেযাপদ্ধতি ভিন্ন।

তুমি কি জান?

প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী

ভেরিয়েন্স এবং স্ট্যান্ডার্ড ডিভিয়েশনের মধ্যে পার্থক্য কি?

বৈকল্পিকতা হ'ল গড় থেকে বর্গক্ষেত্রের বিচ্যুতিগুলির গড়; স্ট্যান্ডার্ড বিচ্যুতি হ'ল এর বর্গমূল। স্ট্যান্ডার্ড বিচ্যুতি মূল তথ্য (যেমন, ডলার, কেজি, সেকেন্ড) হিসাবে একই ইউনিটগুলিতে রয়েছে, এটি আরও ব্যাখ্যাযোগ্য করে তোলে। বৈকল্পিকতা গাণিতিক ক্রিয়াকলাপে দরকারী (স্বাধীন ভেরিয়েবলের বৈকল্পিকতা সরাসরি যোগ করে), যখন স্ট্যান্ডার্ড বিচ্যুতি একটি অ-প্রযুক্তিগত শ্রোতাদের কাছে ছড়িয়ে পড়া বর্ণনা করার জন্য আরও ভাল।

কখন আমি নমুনা বনাম জনসংখ্যা বৈষম্য ব্যবহার করা উচিত?

জনসংখ্যা বৈষম্য ব্যবহার করুন যখন আপনার ডেটাতে আপনি বিশ্লেষণ করছেন এমন গোষ্ঠীর প্রতিটি সদস্য থাকে (উদাহরণস্বরূপ, একটি সংস্থার সমস্ত কর্মচারী) । যখন আপনার ডেটা বৃহত্তর গোষ্ঠীর একটি উপসেট হয় তখন নমুনা বৈষম্য ব্যবহার করুন (উদাহরণস্বরূপ, সমস্ত ভোটারদের মতামত অনুমান করার জন্য 500 ভোটারের একটি জরিপ) । বেশিরভাগ বাস্তব-বিশ্ব গবেষণা এবং পরিসংখ্যানগুলিতে, নমুনা বৈষম্য উপযুক্ত।

বৈসাদৃশ্য কি নেগেটিভ হতে পারে?

না. বৈকল্পিকতা সর্বদা শূন্য বা ধনাত্মক কারণ এটি বর্গক্ষেত্রের মান থেকে গণনা করা হয়। বৈকল্পিকতা = 0 শুধুমাত্র যখন সমস্ত ডেটা পয়েন্টগুলি একই থাকে (কোনও স্প্রেড নেই) । একটি নেতিবাচক বৈকল্পিকতা গাণিতিকভাবে অসম্ভব এবং একটি গণনা ত্রুটি নির্দেশ করে।

একটি "উচ্চ" বা "নিম্ন" বৈসাদৃশ্য কি?

উচ্চ এবং নিম্ন তথ্যের স্কেল এবং প্রসঙ্গের সাথে সম্পর্কিত। সেন্টিমিটারে মানুষের উচ্চতার জন্য 10 এর একটি বৈকল্পিক "নিম্ন" তবে মিটারে উচ্চতার জন্য "উচ্চ"। বৈকল্পিক সহগ (এসডি / গড় এক্স 100%) স্কেল-স্বাধীন এবং বিভিন্ন ডেটাসেটের মধ্যে তুলনা করার অনুমতি দেয়। গুণমান নিয়ন্ত্রণে, স্পেসিফিকেশনগুলি প্রতিটি পরিমাপের জন্য গ্রহণযোগ্য বৈকল্পিক পরিসীমা সংজ্ঞায়িত করে।

কিভাবে বৈসাদৃশ্য স্বাভাবিক বন্টনের সাথে সম্পর্কিত?

সাধারণ (গাউসিয়ান) বন্টন সম্পূর্ণরূপে মাত্র দুটি প্যারামিটার দ্বারা বর্ণনা করা হয়ঃ গড় (μ) এবং বৈকল্পিক (σ2) । পরিচিত বেল বক্ররেখা যখন বৈকল্পিক বড় হয় তখন আরও প্রশস্ত হয় এবং যখন বৈকল্পিক ছোট হয় তখন আরও সংকীর্ণ হয়। সাধারণ তথ্যের জন্য, অভিজ্ঞতার নিয়মটি ধরে রাখা হয়ঃ +/-1σ এর মধ্যে 68.3%, +/-2σ এর মধ্যে 95.4% এবং +/-3σ এর মধ্যে 99.7%। অনেক পরিসংখ্যানগত পরীক্ষা (টি-টেস্ট, এএনওভিএ, রিগ্রেশন) অনুমান করে যে ডেটা একটি স্বাভাবিক বন্টন অনুসরণ করে বা প্রায় নমুনা গড় স্বাভাবিক (সেন্ট্রাল লিমিট থিওরেমের মাধ্যমে) ।

পুলেড ভেরিয়েন্স কি?

পুলড ভেরিয়েন্স হল দুই বা ততোধিক গোষ্ঠীর নমুনা ভেরিয়েন্সের একটি ওজনের গড়, যা দুই-নমুনা টি-টেস্টে ব্যবহৃত হয় যখন আপনি গোষ্ঠী জুড়ে সমান ভেরিয়েন্স ধরে নেন। সূত্রটি হলঃ s2সমন্বিত= [(n1-1) s12 + (n2-1) s22] / (n1 + n2 - 2) এটি একটি একক বৈকল্পিক অনুমান উত্পন্ন করে যা উভয় নমুনার তথ্য অন্তর্ভুক্ত করে, যখন সমান-বৈকল্পিক অনুমানটি বৈধ হয় তখন পরিসংখ্যানগত শক্তি বৃদ্ধি করে।