Skip to main content
🟢 Beginner 🔥 Popular

Kalkulačka průměru, mediánu a režimu

Použijte tuto bezplatnou on-line matematickou kalkulačku pro okamžité, přesné výsledky.

Pochopení měření ústřední tendence

Ve statistice,měření ústředního trenduJsou to jednotlivé hodnoty, které popisují střední nebo typickou hodnotu datového souboru. Tři nejdůležitější jsou průměr, medián a režim - každý vám řekne něco jiného o datech a každý je nejvhodnější v různých situacích.

Vezměte si tento soubor údajů: výsledky zkoušek {55, 60, 70, 75, 75, 80, 95}.

OpatřeníHodnotaJak se počítáNejlepší pro
Průměrný72,9(55+60+70+75+75+80+95) / 7Symetrické rozdělení
Medián (střední hodnota)75Střední hodnota tříděných údajůZkreslené rozdělení, odchylky
Režim (nejčastější)75Nejčastěji opakovaná hodnotaKategorické údaje, nalezení vrcholů
Rozsah40Max - Min = 95 - 55Měření rozpětí

Žádná jednotná měřítka není univerzálně "nejlepší". Datový analytik vybírá vhodnou měřítku na základě tvaru distribuce, přítomnosti outlierů a kladené otázky. Pochopení všech tří - plus jejich omezení - je základem pro statistickou gramotnost.

Průměr (aritmetický průměr): Jak ho vypočítat

Výsledkyaritmetický průměrje součet všech hodnot dělený počtem hodnot. Je to nejčastěji používané měřítko centrální tendence a je to, co většina lidí myslí, když řekne "průměr".

Vzorec: průměr (x̄) = (Σxi) / n

kde Σxi je součet všech hodnot a n je počet.

Příklad:Údaje = {3, 7, 8, 5, 12, 4, 9, 6}

  1. Součet: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
  2. Počet: 8 hodnot
  3. Průměr = 54 / 8 =6,75

Průměr je citlivý navýjimečné hodnotyNapříklad, pokud by jedna hodnota v výše uvedeném souboru byla 100 namísto 12, průměr by skočil na (54 - 12 + 100) / 8 = 142 / 8 = 17,75, což je daleko od "typické" hodnoty zbývajících údajů.

Ostatní typy prostředků pro speciální použití:

Medián: střední hodnota

Výsledkymediánje střední hodnota souboru dat, která je tříděna ve vzestupném pořadí. Rozděluje rozdělení přesně napůl: 50% hodnot je pod mediánem a 50% nad ním.

Pro párný počet hodnot:Medián = hodnota (n+1) /2.

Pro párný počet hodnot:Medián = průměr hodnot n/2th a (n/2 + 1) th.

Soubor údajůnSortovanéMedián
{4, 1, 9, 2, 6}5 (odd){1, 2, 4, 6, 9}4 (třetí hodnota)
{7, 3, 8, 5}4 (rovnoměrně){3, 5, 7, 8}(5+7)/2 = 6
{10, 20, 30, 40}4 (rovnoměrně){10, 20, 30, 40}(20 + 30) / 2 = 25
{1, 1, 1, 1000}4 (rovnoměrně){1, 1, 1, 1000}(1+1)/2 = 1

Všimněte si posledního příkladu: průměr {1, 1, 1, 1000} = 250,75, ale medián = 1.medián je u křivých rozdělení upřednostňován před průměrems výjimečnými hodnotami - medián příjmu, ceny bydlení a délka pobytu v nemocnici jsou vykazovány jako mediány, protože několik extrémně vysokých hodnot by znamenalo, že průměr nebude reprezentovat typickou zkušenost.

Režim: Nejčastější hodnota

Výsledkyrežimje hodnota, která se v souboru údajů objevuje nejčastěji.

Režim je zvláště užitečný pro:

Soubor údajůZpůsobDruh
{1, 2, 3, 4, 5}ŽádnéŽádný režim
{2, 4, 4, 6, 8}4Unimodální
{1, 1, 3, 5, 5}1 a 5Bimodal
{a, b, b, c, c, d, d}b, c, dTrimodal

Rozsah a další měření šíření

Zatímco průměr, medián a režim popisují střed distribuce,měření šířeníJsou stejně důležité pro pochopení datového souboru.

OpatřeníVzorecPříklad {2, 4, 4, 6, 8}Citlivost na výjimečné hodnoty
RozsahMax - Min8 - 2 = 6Velmi citlivé
Interkvartilový rozsah (IQR)Q3 - Q17 - 3 = 4Odolné
Odchylka (σ2)Σ ((xi - x̄) 2 / n3.44Citlivé
Standardní odchylka (σ)√Variance1.855Citlivé
Absolutní průměrná odchylkaŠťastný den .1 .6Střední

Pro {2, 4, 4, 6, 8}: průměr = 4,8, takže odchylky jsou: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24.

Standardní odchylka je pracovním koněm statistiky - objevuje se při testování hypotéz, intervalech spolehlivosti, výpočtech normálního rozložení a řízení procesů. Nižší standardní odchylka znamená, že data jsou seskupená v blízkosti průměru; vyšší standardní odchylka znamená, že data jsou více rozložená.

Kdy použít režim průměr vs. medián vs.

Výběr nesprávného měřítka centrální tendence může být zavádějící.

SituaceDoporučené opatřeníProč ?
Symetrické, žádné odchylkyZlý .Nejvíce matematicky zvládnutelné; využívá všechna data
Šikmé rozděleníMediánNevytažené extrémními hodnotami
Příjmy / ceny bydleníMediánNěkolik milionářů překrucuje průměr nahoru.
Kategorické údajeZpůsobPrůměr/medián se nevztahují na kategorie
Nejčastější hodnotaZpůsobPřímá odpověď na "nejoblíbenější"
Průměrné známky / GPAPrůměrný (vážený)Všechny skóre přispívají poměrně
Výnosy ze zásob / míra růstuGeometrický průměrÚčty pro složení
Doba přežití, pobyt v nemocniciMediánPřesměrování doprava dlouhodobými případy

Velmi známá poznámka: "Průměrný Američan má jeden prs a jeden varlat" ilustruje, proč může být průměr zavádějící pro bimodální rozdělení.

Příklady z reálného světa: průměr, medián a režim v praxi

Pochopení toho, jak se tyto pojmy uplatňují v reálných situacích, buduje statistickou intuici:

Často kladené otázky

Co je lepší: průměr nebo medián?

Ani jedno není univerzálně lepší - slouží různým účelům. Medián je robustnější vůči výstředním hodnotám a lépe reprezentuje "typický" ve zkreslených distribucích (příjem, ceny bydlení, doby přežití). Průměr využívá všechny datové body, je matematicky optimální pro symetrické distribuce a je nezbytný pro další statistické výpočty, jako je standardní odchylka a testování hypotéz. Použijte obojí společně pro úplný obraz.

Může mít soubor dat žádný režim?

Ano. Pokud se všechny hodnoty vyskytují stejně často, neexistuje žádný režim (např. {1, 2, 3, 4, 5} - každá hodnota se objeví přesně jednou). Datový soubor může být také multimodální - bimodální (dva režimy: {1, 1, 3, 3, 5}) nebo trimodální. V praxi bimodální rozložení často signalizuje dvě odlišné podskupiny ve vašich datech, což je důležitý vzor pro zkoumání.

Jak najdu medián párného počtu hodnot?

Pro {2, 4, 6, 8}: dvě střední hodnoty jsou 4 a 6, takže medián = (4+6) / 2 = 5. Pro {1, 3, 5, 7, 9, 11}: střední hodnoty jsou 5 a 7, takže medián = (5+7) / 2 = 6. Medián nemusí být hodnotou v souboru dat.

Co to znamená, když průměr = medián = režim?

Když jsou všechna tři měření stejná, rozdělení je dokonale symetrické a unimodální - klasická zvonová křivka (normální rozdělení). To znamená, že neexistují žádné odchylky, které by zkreslovaly data, a všechny tři měření jsou stejně platnými popisníky středu. V praxi, reálné údaje zřídka dosahují dokonalé symetrie, ale úzké zarovnání průměru a mediánu naznačuje přibližnou symetrii.

Jaký je vztah mezi průměrem, mediánem a sklonem?

V pravosklonném (pozitivně nakloněném) rozložení: střední hodnota > střední hodnota > režim. V levosklonném (negativně nakloněném) rozložení: střední hodnota < střední hodnota < režim. V symetrickém rozložení: střední hodnota = střední hodnota ~ režim. Tento vztah poskytuje rychlou vizuální kontrolu: porovnejte střední hodnotu a střední hodnotu, abyste určili směr naklonění bez pohledu na graf.

Jak vypočítáte průměr pro seskupená data?

Příklad: pokud 10 žáků dosáhlo skóre 50 - 60 (střední bod 55), 15 dosáhlo skóre 60 - 70 (střední bod 65) a 5 dosáhlo skóre 70 - 80 (střední bod 75), průměr = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.

Jaký je rozdíl mezi průměrem populace a průměrem vzorku?

Populační průměr (μ, "mu") se vypočítá z každého člena celé populace. Vzorkový průměr (x̄, "x-bar") se vypočítá z podmnožiny (vzorku) vybrané z této populace. Vzorec je stejný, ale symboly se liší. V praxi téměř vždy pracujeme se vzorkovými prostředky a používáme je k odhadnutí populačního průměru - což zavádí chybu výběru vzorků a vyžaduje statistické inferenční techniky.

Jak výjimka ovlivňuje průměr vs. medián?

Extrémní hodnoty silně ovlivňují průměr, ale mají minimální vliv na mediánu. Příklad: údaje {1, 2, 3, 4, 5} mají průměr = 3 a medián = 3. Přidání extrémního hodnoty {1, 2, 3, 4, 5, 100}: průměr skočí na 19,2, ale medián se změní pouze na (3 + 4) / 2 = 3,5. Tato robustnost činí medián přednostním měřítkem, kdykoli jsou přítomny nebo podezřelé extrémní hodnoty.

Jaký je zkrácený průměr?

Trimovaný průměr (nebo zkrácený průměr) odstraňuje pevné procento extrémních hodnot před výpočtem průměru. Například 10% trimovaný průměr na {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: odstranit spodní a horní 10% (přibližně 1 hodnota každý), takže {2, 3, 4, 5, 6, 7, 8, 9}; průměr = 5,5. Trimované prostředky se používají v bodovacích systémech (olympijské hodnocení, krasobruslení) a ekonomické statistice ke snížení vlivu outlierů při zachování více údajů než medián.

Jak vypočítám vážený průměr?

Výpočet GPA: stupeň A (4.0) ve tříhodinovém kurzu, stupeň B (3.0) ve čtyřhodinovém kurzu, stupeň C (2.0) ve dvouhodinovém kurzu: vážený GPA = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4)/9 = 28/9 ~ 3.11. Bez váhání by jednoduchý průměr byl (4+3+2)/3 = 3,0 - chybí těžší vliv čtyřhodinového kurzu.

Shrnutí popisné statistiky: Co vždy potřebujete

Kompletní popisný souhrn statistiky pro jakýkoli datový soubor by měl obsahovat všechny následující prvky. Toto je to, co byste uvedli ve vědecké práci, obchodní analýze nebo akademickém úkolu:

StatistickáSymbolPříklad ({2,4,4,6,8,10})Výklad
Počítánín6Kolik pozorování
Zlý .5,67Průměrná hodnota
MediánM5,0Střední hodnota (50. percentil)
ZpůsobMo4Nejčastější hodnota
RozsahR8Rozpětí od min. do max.
Standardní odchylkaσ nebo s2,58Typická odchylka od průměru
Odchylkaσ²6,67SD na druhou
Min / Max2 / 10Extrémní hodnoty

V akademické a vědecké práci vždy uvádějte jak měřítko středu, tak měřítko šíření. Zpráva pouze o průměru (nebo mediánu) bez standardní odchylky (nebo IQR) dává neúplný obraz vašich dat. Třída, kde studenti získali průměr 75% s SD = 5%, se velmi liší od třídy s průměrem = 75%, ale SD = 25% - první je těsná skupina tříd B, druhá je divoká smíšená skupina od selhání až k téměř dokonalosti.

Percentily, kvartily a box ploty

Kromě průměru, mediánu a módu, kompletní statistické shrnutí často zahrnuje analýzu percentilu. Percentily vám řeknou, jaká část dat je pod danou hodnotou - což je nezbytné pro pochopení relativního postavení, identifikaci výstředních hodnot a porovnávání mezi populacemi.

PercentilVýznamPříklad (výsledky zkoušek, n=100)
Desáté.10% skóre nižšíHodnocení 52 -> lepší než 10% třídy
25. (Q1)25% skóre nižšíHodnocení 64 -> hranice dolního kvartilu
Padesátý (medián)50% skóre nižšíHodnocení 75 -> střed rozdělení
Číslo 75 (Q3)75% skóre nižšíHodnocení 87 -> hranice horního kvartilu
Číslo 9090% skóre nižšíHodnocení 93 -> 10% nejlepších ve třídě
Číslo 99 .99% skóre nižšíHodnocení 99 -> horní 1%

Box plot (box-and-whisker plot) vizualizuje tyto informace: box se rozprostírá od Q1 do Q3 (IQR), čára označuje medián a "whiskers" se vztahují k nejmenším/největším hodnotám, které nejsou outlier. Jednotlivé outlier body jsou nakresleny jako body. Box ploty jsou vynikající pro porovnávání distribucí napříč více skupinami vedle sebe, odhalují rozdíly v centru, šíření a sklon, které by jednoduché srovnání průměru vynechalo. Například porovnání výsledků zkoušek napříč třemi školami pomocí tří bočních grafů vedle sebe okamžitě ukazuje, která škola má vyšší medián výkonu, která má větší rozlohu (což naznačuje nekonzistentní výuku) a zda každá škola má skupinu výjimečných studentů, kteří potřebují podporu. Tato vizuální hustota statistických informací na kompaktním displeji činí z bočních grafů jeden z nejsilnějších a nedostatečně používaných nástrojů v datové komunikaci.

Krok za krokem: Vypočítání průměru, mediánu a režimu ručně

Prozkoumejme kompletní příklad s reálným souborem dat: měsíční tržby (v tisících) malého podniku za 12 měsíců: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.

Krok 1: Sortování dat

Sortované ve vzestupném pořadí: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}

Krok 2: Spočítejte průměr

Součet = 38+38+42+44+48+48+52+55+57+61+63+75 = 621

n = 12, průměr = 621 / 12 =51,75 (tisíce)

Krok 3: Najděte střední hodnotu

n = 12 (pár): průměr šesté a sedmé hodnoty = (48 + 52) / 2 =50

Krok 4: Identifikujte režim

Obě čísla 38 a 48 se objeví dvakrát.{38, 48}(biomodální)

Krok 5: Rozsah výpočtu a směrodatná odchylka

Rozsah = 75 - 38 =37

Odchylky od průměru (51,75): (38-51,75) 2 = 189,06; (38-51,75) 2 = 189,06; (42-51,75) 2 = 95,06; (44-51,75) 2 = 60,06; (48-51,75) 2 = 14,06; (52-51,75) 2 = 0,06; (55-51,75) 2 = 10,56; (57-51,75) 2 = 27,56; (61-51,75) 2 = 85,56; (63-51,75) 2 = 126,56; (75-51,75) 2 = 540,56

Součet čtvercových odchylek = 1,352,25; odchylka = 1,352,25/12 = 112,69; SD = √112,69 ~10.62

Výklad

Tento obchod má průměrný měsíční prodej 51 750 dolarů s mediánem 50 000 dolarů. Standardní odchylka ~ 10 620 dolarů znamená, že většina měsíců se pohybuje v rozmezí +/- 10 620 dolarů od průměru. Dvomodální rozložení (dva módy) může naznačovat sezónní vzorce - zkontrolujte, zda se dva 38s a dva 48s shlukují v konkrétních měsících. Nejvyšší výstřední hodnota (75 000 dolarů za jeden měsíc) vytáhne průměr mírně nad medián, což indikuje mírný pozitivní sklon - pravděpodobně jeden výjimečný prodejní měsíc ( prázdninová sezóna, velká smlouva atd.).