Skip to main content
🔬 Advanced

Varyans Hesaplayıcı – Populasyon ve Örneklem Varyansı

Bir veri kümesi için varyans ve standart sapma hesaplayın. Populasyon ve örneklem varyansını destekler. Ücretsiz online istatistik hesaplayıcısı.

Varyans Nedir?

Varyans, bir verisetinin dağılımını ölçer — ortalama ile olan uzaklıkların ne kadarını gösterir. Düşük varyans, veri noktalarının ortalamaya yakın olduğunu gösterirken, yüksek varyans, onları geniş bir şekilde yayıldığını gösterir.

Varyans, ortalamadan kareler olarak hesaplanır:

Where xᵢ her veri noktasıdır, μ (veya x̄) ortalama ve N değer sayısını gösterir. Standart sapma, varyansın karesinin kareköküdür — orijinal verinin aynı birimleriyle ölçülür, daha anlaşılır hale getirir.

Neden kareler alınır? İki neden: (1) kareler negatif değerleri siler, böylece ortalama üzerinde ve altında olan sapmalar iptal olmaz ve (2) kareler aşırı değerlere aşırı ağırlık verir, varyansı aşırı değerlere duyarlı hale getirir. Bu özellik hem bir güç (aşırı değerlerin tespiti) hem de bir zayıflık (aşırı değer hassasiyeti) olarak görülür. Aşırı değerlere sahip veri setlerinde, daha dayanıklı bir alternatif olarak ortanca mutlak sapma (MAD) kullanılması önerilir.

Popülasyon vs. Örnek Varyansı

Ana fark, sıfırın altındaki terimdir — N vs. (N−1) — Bessel'in düzeltmesi:

TürAlınan DeğerKullanım DurumuSimge
Popülasyon VaryansıNTüm popülasyondaki verileri işliyorsanızσ²
Örnek VaryansıN−1Popülasyondan bir örnekle işliyorsanız

Pratikte, çoğu gerçek dünya verisi bir örnektir. N−1 (örnek varyansı) kullanarak, gerçek popülasyon varyansı için bir tarafsız tahmini elde edilir. N (popülasyon varyansı) bir örnekte sistematik olarak gerçek varyansı alt üst eder.

Örnek: Yeni bir ilacı 50 hasta üzerinde test ediyorsanız, örnek varyansı (s²) kullanın. Sınıfın tüm öğrencilerini analiz ediyorsanız, popülasyon varyansı (σ²) kullanın.

Neden Bessel'in düzeltmesi işe yarar? Varyansın hesaplanması sırasında, bir "derece özgürlüğü" kullanılır — ortalama, veriden hesaplanır, bu nedenle ortalama ile olan sapmalar tam olarak bağımsız değildir. N yerine N−1 kullanarak, bu kaybın telafi edilir, popülasyon varyansı için bir tarafsız tahmini sağlar. N büyük olduğunda, N ve N−1 arasındaki fark önemsiz hale gelir.

Varyans Hesaplamasının Adım Adım Yöntemi

Veri seti: 4, 7, 13, 2, 8

  1. Ortalamayı hesapla: (4+7+13+2+8) ÷ 5 = 34/5 = 6.8
  2. Ortalamadan sapmaları bul: (4−6.8)=−2.8; (7−6.8)=0.2; (13−6.8)=6.2; (2−6.8)=−4.8; (8−6.8)=1.2
  3. Sapmaları karele çevir: 7.84; 0.04; 38.44; 23.04; 1.44
  4. Karelerin toplamı: 7.84+0.04+38.44+23.04+1.44 = 70.8
  5. Popülasyon varyansı: 70.8 ÷ 5 = 14.16
  6. Örnek varyansı: 70.8 ÷ 4 = 17.7
  7. Standart sapma: √14.16 = 3.76 (popülasyon) veya √17.7 = 4.21 (örnek)

Varyans için Kısayol Formülü

Elbette, açıkça hesaplamak zorunda kalmadan varyansı hesaplamak için bir alternatif formül vardır, elbette elle hesaplamak veya spreadsheets'te kullanmak için faydalıdır:

σ² = (Σxᵢ²)/N − (Σxᵢ/N)² = (Σxᵢ² − (Σxᵢ)²/N) / N

Örnek varyansı için: s² = (Σxᵢ² − (Σxᵢ)²/N) / (N−1)

Örnek verimiz (4, 7, 13, 2, 8):

  1. Σxᵢ = 34, bu nedenle (Σxᵢ)² = 1,156
  2. Σxᵢ² = 16 + 49 + 169 + 4 + 64 = 302
  3. Popülasyon varyansı = (302 − 1156/5) / 5 = (302 − 231.2) / 5 = 70.8 / 5 = 14.16
  4. Örnek varyansı = 70.8 / 4 = 17.7

Bu formül, sayısal olarak aynıdır, ancak çok büyük değerlerdeki hatalarla karşılaşıldığında, Welford'un online algoritması (bir değerden bir değer işler) daha istikrarlıdır.