Калькулятор середнього, медіани та моди
Обчисліть середнє, медіану, моду, розмах та інші статистики для будь-якого набору даних. Безкоштовний онлайн-калькулятор для миттєвих точних результатів.
Розуміння мір центральної тенденції
У статистиці міри центральної тенденції — це окремі значення, що описують центр або типове значення набору даних. Три найважливіші — середнє, медіана та мода — кожна розповідає щось різне про дані і найкраще підходить для різних ситуацій.
Розглянемо цей набір даних: результати тестів {55, 60, 70, 75, 75, 80, 95}. Кожна міра дає різний погляд:
| Міра | Значення | Як обчислюється | Найкраще для |
|---|---|---|---|
| Середнє (average) | 72,9 | (55+60+70+75+75+80+95) / 7 | Симетричних розподілів |
| Медіана (середнє значення) | 75 | Середнє значення відсортованих даних | Скошених розподілів, викидів |
| Мода (найчастіше значення) | 75 | Найповторюваніше значення | Категоріальних даних, пошуку піків |
| Розмах | 40 | Макс − Мін = 95 − 55 | Вимірювання розкиду |
Жодна міра не є універсально «найкращою». Аналітик даних обирає відповідну міру залежно від форми розподілу, наявності викидів і питання, яке розглядається. Розуміння всіх трьох — разом із їх обмеженнями — є основою статистичної грамотності.
Середнє (арифметичне): як його обчислити
Арифметичне середнє — це сума всіх значень, поділена на їх кількість. Це найпоширеніша міра центральної тенденції, і саме її більшість людей мають на увазі, кажучи «середнє».
Формула: Середнє (x̄) = (Σxᵢ) / n
Де Σxᵢ — сума всіх значень, а n — їх кількість.
Приклад: Дані = {3, 7, 8, 5, 12, 4, 9, 6}
- Сума: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
- Кількість: 8 значень
- Середнє = 54 / 8 = 6,75
Середнє чутливе до викидів — екстремальні значення зміщують його у свій бік. Наприклад, якби одне значення в наведеному наборі було 100 замість 12, середнє стрибнуло б до (54 − 12 + 100) / 8 = 142 / 8 = 17,75, далеко від «типового» значення решти даних.
Інші типи середніх для спеціалізованого використання:
- Геометричне середнє: ⁿ√(x₁ × x₂ × … × xₙ) — для темпів зростання, прибутковості, відношень
- Гармонічне середнє: n / (1/x₁ + 1/x₂ + … + 1/xₙ) — для швидкостей, темпів, цін за одиницю
- Зважене середнє: Σ(wᵢxᵢ) / Σwᵢ — коли точки даних мають різну важливість (наприклад, GPA)
Медіана: середнє значення
Медіана — це середнє значення набору даних, відсортованого у порядку зростання. Вона ділить розподіл точно навпіл: 50% значень нижче медіани та 50% вище.
Для непарної кількості значень: Медіана = значення на позиції (n+1)/2.
Для парної кількості значень: Медіана = середнє значень на позиціях n/2 та (n/2 + 1).
| Набір даних | n | Відсортовано | Медіана |
|---|---|---|---|
| {4, 1, 9, 2, 6} | 5 (непарне) | {1, 2, 4, 6, 9} | 4 (3-тє значення) |
| {7, 3, 8, 5} | 4 (парне) | {3, 5, 7, 8} | (5+7)/2 = 6 |
| {10, 20, 30, 40} | 4 (парне) | {10, 20, 30, 40} | (20+30)/2 = 25 |
| {1, 1, 1, 1000} | 4 (парне) | {1, 1, 1, 1000} | (1+1)/2 = 1 |
Зверніть увагу на останній приклад: середнє {1, 1, 1, 1000} = 250,75, але медіана = 1. Це ідеально ілюструє, чому медіана є кращою за середнє для скошених розподілів із викидами — медіанний дохід, ціни на житло та тривалість перебування в лікарні завжди звітуються як медіани, бо кілька надвисоких значень роблять середнє нерепрезентативним для типового досвіду.
Мода: найчастіше значення
Мода — це значення, що зустрічається в наборі даних найчастіше. Набір даних може мати:
- Відсутність моди: всі значення зустрічаються однаково часто (наприклад, {1, 2, 3, 4, 5})
- Одна мода (унімодальний): одне значення зустрічається частіше за всі інші (наприклад, {1, 2, 2, 3, 4} → мода = 2)
- Дві моди (бімодальний): два значення однаково найчастіші (наприклад, {1, 1, 2, 3, 3} → моди = 1 та 3)
- Кілька мод (мультимодальний): три або більше значень однаково найчастіших
Мода особливо корисна для:
- Категоріальних даних: «Який розмір взуття найпопулярніший?»
- Дискретних даних: «Скільки дітей зазвичай у сім'ї?» (часто 2 — мода)
- Форми розподілу: Бімодальний розподіл (два піки) вказує на дві різні підгрупи у ваших даних
| Набір даних | Мода | Тип |
|---|---|---|
| {1, 2, 3, 4, 5} | Відсутня | Без моди |
| {2, 4, 4, 6, 8} | 4 | Унімодальний |
| {1, 1, 3, 5, 5} | 1 і 5 | Бімодальний |
| {a, b, b, c, c, d, d} | b, c, d | Тримодальний |
Розмах та інші міри розкиду
Тоді як середнє, медіана та мода описують центр розподілу, міри розкиду описують, наскільки дані варіюються. Вони не менш важливі для розуміння набору даних.
| Міра | Формула | Приклад ({2, 4, 4, 6, 8}) | Чутливість до викидів |
|---|---|---|---|
| Розмах | Макс − Мін | 8 − 2 = 6 | Дуже висока |
| Міжквартильний розмах (IQR) | Q3 − Q1 | 7 − 3 = 4 | Стійкий |
| Дисперсія (σ²) | Σ(xᵢ − x̄)² / n | 3,44 | Чутлива |
| Стандартне відхилення (σ) | √Дисперсія | 1,855 | Чутливе |
| Середнє абсолютне відхилення | Σ|xᵢ − x̄| / n | 1,6 | Помірна |
Стандартне відхилення є основним інструментом статистики — воно з'являється у перевірці гіпотез, довірчих інтервалах, розрахунках нормального розподілу та контролі процесів. Менше стандартне відхилення означає, що дані зосереджені біля середнього; більше — що дані більш розкидані.
Коли використовувати середнє, медіану чи моду
Вибір неправильної міри центральної тенденції може ввести в оману. Ось практичний довідник:
| Ситуація | Рекомендована міра | Чому |
|---|---|---|
| Симетричний розподіл, без викидів | Середнє | Математично оптимальне; використовує всі дані |
| Скошений розподіл | Медіана | Не зміщується від екстремальних значень |
| Дохід / ціни на житло | Медіана | Кілька мільйонерів завищують середнє |
| Категоріальні дані | Мода | Середнє/медіана не застосовні до категорій |
| Найпоширеніше значення | Мода | Пряма відповідь на «найпопулярніше» |
| Середні оцінки / GPA | Середнє (зважене) | Всі оцінки вносять пропорційний вклад |
| Прибутковість акцій / темпи зростання | Геометричне середнє | Враховує компаундування |
| Час виживання, перебування в лікарні | Медіана | Правостороннє скошення через довготривалі випадки |
Часті запитання
Що краще: середнє чи медіана?
Жодна з них не є універсально кращою — вони служать різним цілям. Медіана більш стійка до викидів і краще представляє «типове» у скошених розподілах (дохід, ціни на житло, час виживання). Середнє використовує всі точки даних, математично оптимальне для симетричних розподілів і необхідне для подальших статистичних розрахунків. Використовуйте обидва разом для повної картини.
Чи може набір даних не мати моди?
Так. Якщо всі значення зустрічаються однаково часто, моди немає (наприклад, {1, 2, 3, 4, 5} — кожне значення з'являється рівно один раз). Набір даних може бути і мультимодальним — бімодальним (дві моди: {1, 1, 3, 3, 5}) або тримодальним. На практиці бімодальний розподіл часто сигналізує про дві різні підгрупи у ваших даних.
Як знайти медіану для парної кількості значень?
Відсортуйте значення у порядку зростання, потім знайдіть середнє двох середніх чисел. Для {2, 4, 6, 8}: два середніх значення — 4 та 6, тож медіана = (4+6)/2 = 5. Медіана не обов'язково є значенням із набору даних.
Що означає, коли середнє = медіана = мода?
Коли всі три міри рівні, розподіл є ідеально симетричним та унімодальним — класична крива дзвона (нормальний розподіл). Це означає відсутність викидів, що зміщують дані, і всі три міри однаково добре описують центр. На практиці реальні дані рідко досягають ідеальної симетрії.
Який зв'язок між середнім, медіаною та скошеністю?
У правоскошеному (позитивне скошення) розподілі: Середнє > Медіана > Мода. У лівоскошеному (негативне скошення) розподілі: Середнє < Медіана < Мода. У симетричному розподілі: Середнє = Медіана ≈ Мода. Ця залежність дозволяє швидко визначити напрям скошення без побудови графіка.
Як обчислити середнє для згрупованих даних?
Для даних із частотними групами використовуйте середину кожного класового інтервалу: Середнє = Σ(середина × частота) / n. Приклад: якщо 10 учнів отримали 50–60 балів (середина 55), 15 отримали 60–70 (середина 65), і 5 отримали 70–80 (середина 75): Середнє = (10×55 + 15×65 + 5×75) / 30 = 1900/30 ≈ 63,3.
У чому різниця між середнім генеральної сукупності та вибірковим середнім?
Середнє генеральної сукупності (μ, «мю») обчислюється з усіх членів усієї сукупності. Вибіркове середнє (x̄, «х із рисочкою») обчислюється з підмножини (вибірки), взятої з цієї сукупності. Формула однакова, але символи різні. На практиці ми майже завжди працюємо з вибірковими середніми та використовуємо їх для оцінки середнього генеральної сукупності.
Як викид впливає на середнє проти медіани?
Викиди сильно впливають на середнє, але мало впливають на медіану. Приклад: дані {1, 2, 3, 4, 5} мають середнє = 3 та медіану = 3. Додавши викид {1, 2, 3, 4, 5, 100}: середнє стрибає до 19,2, але медіана змінюється лише до (3+4)/2 = 3,5. Ця стійкість робить медіану кращою мірою при наявності викидів.
Що таке усічене середнє?
Усічене середнє (trimmed mean) видаляє фіксований відсоток крайніх значень перед обчисленням середнього. Наприклад, 10% усічене середнє для {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: видалити нижні та верхні 10% (приблизно по 1 значенню), залишається {2, 3, 4, 5, 6, 7, 8, 9}; середнє = 5,5. Усічені середні використовуються в системах оцінювання (олімпійське суддівство) та економічній статистиці.
Як обчислити зважене середнє?
Зважене середнє = Σ(вага × значення) / Σ(ваги). Приклад — обчислення GPA: Оцінка A (4,0) у 3-кредитному курсі, Оцінка B (3,0) у 4-кредитному курсі, Оцінка C (2,0) у 2-кредитному курсі: Зважений GPA = (4,0×3 + 3,0×4 + 2,0×2) / (3+4+2) = 28/9 ≈ 3,11. Без зважування просте середнє було б (4+3+2)/3 = 3,0 — не враховуючи більший вплив 4-кредитного курсу.
Зведена таблиця описової статистики
Повний опис описової статистики для будь-якого набору даних повинен включати всі наведені нижче показники:
| Статистика | Символ | Приклад ({2,4,4,6,8,10}) | Інтерпретація |
|---|---|---|---|
| Кількість | n | 6 | Кількість спостережень |
| Середнє | x̄ | 5,67 | Середнє значення |
| Медіана | M | 5,0 | Середнє значення (50-й перцентиль) |
| Мода | Mo | 4 | Найчастіше значення |
| Розмах | R | 8 | Розкид від мінімуму до максимуму |
| Стандартне відхилення | σ або s | 2,58 | Типове відхилення від середнього |
| Дисперсія | σ² | 6,67 | Квадрат стандартного відхилення |
| Мін / Макс | — | 2 / 10 | Крайні значення |