Калькулятор дисперсії – Генеральна та вибіркова дисперсія
Розрахуйте дисперсію та стандартне відхилення для набору даних. Підтримує генеральну та вибіркову дисперсію. Безкоштовний онлайн-калькулятор статистики з миттєвими результатами.
Що таке дисперсія?
Дисперсія вимірює розкид набору даних — наскільки далеко значення відстоять від середнього. Низька дисперсія означає, що значення згруповані поблизу середнього; висока дисперсія — що вони широко розкидані.
Дисперсія обчислюється як середнє квадратичних відхилень від середнього:
- Генеральна дисперсія (σ²): σ² = Σ(xᵢ − μ)² / N
- Вибіркова дисперсія (s²): s² = Σ(xᵢ − x̄)² / (N−1)
Де xᵢ — кожна точка даних, μ (або x̄) — середнє, N — кількість значень. Стандартне відхилення — це просто квадратний корінь із дисперсії; воно виражається в тих самих одиницях, що й вихідні дані, що робить його більш зрозумілим.
Генеральна vs. вибіркова дисперсія
Ключова відмінність полягає в знаменнику — N проти (N−1) — відомому як поправка Бесселя:
| Тип | Знаменник | Використовується коли | Символ |
|---|---|---|---|
| Генеральна дисперсія | N | У вас є дані всієї генеральної сукупності | σ² |
| Вибіркова дисперсія | N−1 | У вас є вибірка з більшої сукупності | s² |
На практиці більшість реальних даних є вибіркою. Використання N−1 (вибіркова дисперсія) дає незміщену оцінку справжньої генеральної дисперсії. Використання N (генеральна дисперсія) на вибірці систематично занижує справжню дисперсію.
Приклад: тестування нового препарату на 50 пацієнтах означає використання вибіркової дисперсії (s²). Аналіз всіх учнів у класі означає використання генеральної дисперсії (σ²).
Покрокове обчислення дисперсії
Даний набір даних: 4, 7, 13, 2, 8
- Обчисліть середнє: (4+7+13+2+8) ÷ 5 = 34/5 = 6,8
- Знайдіть відхилення від середнього: (4−6,8)=−2,8; (7−6,8)=0,2; (13−6,8)=6,2; (2−6,8)=−4,8; (8−6,8)=1,2
- Зведіть відхилення у квадрат: 7,84; 0,04; 38,44; 23,04; 1,44
- Сума квадратів: 7,84+0,04+38,44+23,04+1,44 = 70,8
- Генеральна дисперсія: 70,8 ÷ 5 = 14,16
- Вибіркова дисперсія: 70,8 ÷ 4 = 17,7
- Стандартне відхилення: √14,16 = 3,76 (генеральне) або √17,7 = 4,21 (вибіркове)
Практичне застосування дисперсії
| Галузь | Застосування | Приклад |
|---|---|---|
| Фінанси | Інвестиційний ризик | Висока дисперсія = більш волатильна прибутковість акцій |
| Виробництво | Контроль якості | Низька дисперсія = стабільні розміри продукції |
| Медицина | Клінічні випробування | Вимірювання варіабельності відповіді пацієнтів |
| Спортивна наука | Аналіз продуктивності | Варіабельність результатів спортсмена протягом сезону |
| Освіта | Аналіз результатів тестів | Розуміння розкиду успішності учнів |
💡 Чи знаєте ви?
- Дисперсію ввів Рональд Фішер у 1918 році — у тій самій статті, де він і запровадив цей термін.
- У фінансах дисперсія є основою сучасної теорії портфеля. Дисперсія портфеля залежить не лише від дисперсії окремих активів, але й від кореляцій між ними.
- Коефіцієнт варіації (КВ = стандартне відхилення / середнє × 100%) дозволяє порівнювати варіабельність між наборами даних з різними одиницями або масштабами.
Часті запитання
Яка різниця між дисперсією та стандартним відхиленням?
Дисперсія — це середнє квадратичних відхилень від середнього; стандартне відхилення — його квадратний корінь, виражений в тих самих одиницях, що й вихідні дані (наприклад, долари, кг, секунди), що робить його більш інтерпретованим. Дисперсія корисна в математичних операціях (дисперсії незалежних змінних додаються безпосередньо), тоді як стандартне відхилення краще підходить для опису розкиду нетехнічній аудиторії.
Коли слід використовувати вибіркову, а коли генеральну дисперсію?
Використовуйте генеральну дисперсію, коли ваші дані містять кожного члена аналізованої групи (наприклад, всі співробітники однієї компанії). Використовуйте вибіркову дисперсію, коли ваші дані є підмножиною більшої групи (наприклад, опитування 500 виборців для оцінки думки всіх виборців). У більшості реальних досліджень і статистиці вибіркова дисперсія є доречною.
Чи може дисперсія бути від'ємною?
Ні. Дисперсія завжди нульова або позитивна, оскільки обчислюється на основі квадратних значень. Дисперсія = 0 лише тоді, коли всі точки даних однакові (немає розкиду). Від'ємна дисперсія математично неможлива і вказує на помилку в обчисленні.
Що вважати «великою» або «малою» дисперсією?
Велика і мала — це відносні поняття щодо масштабу та контексту даних. Дисперсія 10 є «малою» для зросту людини в см, але «великою» для зросту в метрах. Коефіцієнт варіації (СВ / середнє × 100%) є незалежним від масштабу і дозволяє порівняння між різними наборами даних. У контролі якості специфікації визначають допустимі діапазони дисперсії для кожного виміру.