Kalkulačka průměru, mediánu a režimu
Použijte tuto bezplatnou on-line matematickou kalkulačku pro okamžité, přesné výsledky.
Pochopení měření ústřední tendence
Ve statistice,měření ústředního trenduJsou to jednotlivé hodnoty, které popisují střední nebo typickou hodnotu datového souboru. Tři nejdůležitější jsou průměr, medián a režim - každý vám řekne něco jiného o datech a každý je nejvhodnější v různých situacích.
Vezměte si tento soubor údajů: výsledky zkoušek {55, 60, 70, 75, 75, 80, 95}.
| Opatření | Hodnota | Jak se počítá | Nejlepší pro |
|---|---|---|---|
| Průměrný | 72,9 | (55+60+70+75+75+80+95) / 7 | Symetrické rozdělení |
| Medián (střední hodnota) | 75 | Střední hodnota tříděných údajů | Zkreslené rozdělení, odchylky |
| Režim (nejčastější) | 75 | Nejčastěji opakovaná hodnota | Kategorické údaje, nalezení vrcholů |
| Rozsah | 40 | Max - Min = 95 - 55 | Měření rozpětí |
Žádná jednotná měřítka není univerzálně "nejlepší". Datový analytik vybírá vhodnou měřítku na základě tvaru distribuce, přítomnosti outlierů a kladené otázky. Pochopení všech tří - plus jejich omezení - je základem pro statistickou gramotnost.
Průměr (aritmetický průměr): Jak ho vypočítat
Výsledkyaritmetický průměrje součet všech hodnot dělený počtem hodnot. Je to nejčastěji používané měřítko centrální tendence a je to, co většina lidí myslí, když řekne "průměr".
Vzorec: průměr (x̄) = (Σxi) / n
kde Σxi je součet všech hodnot a n je počet.
Příklad:Údaje = {3, 7, 8, 5, 12, 4, 9, 6}
- Součet: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
- Počet: 8 hodnot
- Průměr = 54 / 8 =6,75
Průměr je citlivý navýjimečné hodnotyNapříklad, pokud by jedna hodnota v výše uvedeném souboru byla 100 namísto 12, průměr by skočil na (54 - 12 + 100) / 8 = 142 / 8 = 17,75, což je daleko od "typické" hodnoty zbývajících údajů.
Ostatní typy prostředků pro speciální použití:
- geometrický průměr:n√(x1 x x2 x ... x xn) -- používá se pro růstové tempo, výnosy, poměry
- Harmonický průměr:n / (1/x1 + 1/x2 + ... + 1/xn) -- používá se pro rychlosti, rychlosti, ceny za jednotku
- Vážený průměr:Σ(wixi) / Σwi -- používá se, když mají údaje odlišný význam (např. GPA)
Medián: střední hodnota
Výsledkymediánje střední hodnota souboru dat, která je tříděna ve vzestupném pořadí. Rozděluje rozdělení přesně napůl: 50% hodnot je pod mediánem a 50% nad ním.
Pro párný počet hodnot:Medián = hodnota (n+1) /2.
Pro párný počet hodnot:Medián = průměr hodnot n/2th a (n/2 + 1) th.
| Soubor údajů | n | Sortované | Medián |
|---|---|---|---|
| {4, 1, 9, 2, 6} | 5 (odd) | {1, 2, 4, 6, 9} | 4 (třetí hodnota) |
| {7, 3, 8, 5} | 4 (rovnoměrně) | {3, 5, 7, 8} | (5+7)/2 = 6 |
| {10, 20, 30, 40} | 4 (rovnoměrně) | {10, 20, 30, 40} | (20 + 30) / 2 = 25 |
| {1, 1, 1, 1000} | 4 (rovnoměrně) | {1, 1, 1, 1000} | (1+1)/2 = 1 |
Všimněte si posledního příkladu: průměr {1, 1, 1, 1000} = 250,75, ale medián = 1.medián je u křivých rozdělení upřednostňován před průměrems výjimečnými hodnotami - medián příjmu, ceny bydlení a délka pobytu v nemocnici jsou vykazovány jako mediány, protože několik extrémně vysokých hodnot by znamenalo, že průměr nebude reprezentovat typickou zkušenost.
Režim: Nejčastější hodnota
Výsledkyrežimje hodnota, která se v souboru údajů objevuje nejčastěji.
- Žádný režim:všechny hodnoty se objevují stejně často (např. {1, 2, 3, 4, 5})
- Jeden režim (unimodální):jedna hodnota se objevuje častěji než všechny ostatní (např. {1, 2, 2, 3, 4} -> režim = 2)
- Dva režimy (bimodality):dvě hodnoty vázané pro nejčastější (např. {1, 1, 2, 3, 3} -> režimy = 1 a 3)
- Vícenásobné režimy (multimodální):tři nebo více hodnot vázaných pro nejčastější
Režim je zvláště užitečný pro:
- Kategorické údaje:"Jaká je nejoblíbenější velikost obuvi?" (například velikost 10 pro muže v USA)
- Diskrétní údaje:"Kolik dětí má rodina obvykle?" (obvykle 2 děti)
- Tvar rozložení:Dvomodální rozložení (dva vrcholy) naznačuje dvě odlišné podpopulace ve vašich datech - kriticky důležitý signál v průzkumné analýze
| Soubor údajů | Způsob | Druh |
|---|---|---|
| {1, 2, 3, 4, 5} | Žádné | Žádný režim |
| {2, 4, 4, 6, 8} | 4 | Unimodální |
| {1, 1, 3, 5, 5} | 1 a 5 | Bimodal |
| {a, b, b, c, c, d, d} | b, c, d | Trimodal |
Rozsah a další měření šíření
Zatímco průměr, medián a režim popisují střed distribuce,měření šířeníJsou stejně důležité pro pochopení datového souboru.
| Opatření | Vzorec | Příklad {2, 4, 4, 6, 8} | Citlivost na výjimečné hodnoty |
|---|---|---|---|
| Rozsah | Max - Min | 8 - 2 = 6 | Velmi citlivé |
| Interkvartilový rozsah (IQR) | Q3 - Q1 | 7 - 3 = 4 | Odolné |
| Odchylka (σ2) | Σ ((xi - x̄) 2 / n | 3.44 | Citlivé |
| Standardní odchylka (σ) | √Variance | 1.855 | Citlivé |
| Absolutní průměrná odchylka | Šťastný den . | 1 .6 | Střední |
Pro {2, 4, 4, 6, 8}: průměr = 4,8, takže odchylky jsou: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24.
Standardní odchylka je pracovním koněm statistiky - objevuje se při testování hypotéz, intervalech spolehlivosti, výpočtech normálního rozložení a řízení procesů. Nižší standardní odchylka znamená, že data jsou seskupená v blízkosti průměru; vyšší standardní odchylka znamená, že data jsou více rozložená.
Kdy použít režim průměr vs. medián vs.
Výběr nesprávného měřítka centrální tendence může být zavádějící.
| Situace | Doporučené opatření | Proč ? |
|---|---|---|
| Symetrické, žádné odchylky | Zlý . | Nejvíce matematicky zvládnutelné; využívá všechna data |
| Šikmé rozdělení | Medián | Nevytažené extrémními hodnotami |
| Příjmy / ceny bydlení | Medián | Několik milionářů překrucuje průměr nahoru. |
| Kategorické údaje | Způsob | Průměr/medián se nevztahují na kategorie |
| Nejčastější hodnota | Způsob | Přímá odpověď na "nejoblíbenější" |
| Průměrné známky / GPA | Průměrný (vážený) | Všechny skóre přispívají poměrně |
| Výnosy ze zásob / míra růstu | Geometrický průměr | Účty pro složení |
| Doba přežití, pobyt v nemocnici | Medián | Přesměrování doprava dlouhodobými případy |
Velmi známá poznámka: "Průměrný Američan má jeden prs a jeden varlat" ilustruje, proč může být průměr zavádějící pro bimodální rozdělení.
Příklady z reálného světa: průměr, medián a režim v praxi
Pochopení toho, jak se tyto pojmy uplatňují v reálných situacích, buduje statistickou intuici:
- Příjem domácností v USA (2023):Průměrný ~ $105,000; medián ~ $74,580. Rozdíl odráží sklon příjmů - malý počet velmi vysokých příjmů dramaticky přitáhne průměr nahoru. Politické diskuse používají medián příjmu, protože lépe reprezentuje "typickou" domácnost.
- Závodní časy:V závodě 10 km může být průměrný čas dojezdu vyšší než medián, protože pomalí chodci tvoří dlouhý pravý ocas.
- Hodnoty třídních zkoušek:Pokud jeden žák dosáhne skóre 5/100 a dvacet dalších dosáhne skóre 75 - 95/100, průměr se přetáhne směrem dolů pomocí odchylky.
- Velikost obuvi:Režim je nejvíce použitelná statistika - maloobchodníci mají nejvíce zásob v modal (nejběžnější) velikosti.
- Kontrola kvality:Ve výrobě standardní odchylka měření výrobku určuje schopnost procesu. Nízká standardní odchylka znamená konzistentní výrobu; vysoká standardní odchylka znamená vysokou míru vad.
Často kladené otázky
Co je lepší: průměr nebo medián?
Ani jedno není univerzálně lepší - slouží různým účelům. Medián je robustnější vůči výstředním hodnotám a lépe reprezentuje "typický" ve zkreslených distribucích (příjem, ceny bydlení, doby přežití). Průměr využívá všechny datové body, je matematicky optimální pro symetrické distribuce a je nezbytný pro další statistické výpočty, jako je standardní odchylka a testování hypotéz. Použijte obojí společně pro úplný obraz.
Může mít soubor dat žádný režim?
Ano. Pokud se všechny hodnoty vyskytují stejně často, neexistuje žádný režim (např. {1, 2, 3, 4, 5} - každá hodnota se objeví přesně jednou). Datový soubor může být také multimodální - bimodální (dva režimy: {1, 1, 3, 3, 5}) nebo trimodální. V praxi bimodální rozložení často signalizuje dvě odlišné podskupiny ve vašich datech, což je důležitý vzor pro zkoumání.
Jak najdu medián párného počtu hodnot?
Pro {2, 4, 6, 8}: dvě střední hodnoty jsou 4 a 6, takže medián = (4+6) / 2 = 5. Pro {1, 3, 5, 7, 9, 11}: střední hodnoty jsou 5 a 7, takže medián = (5+7) / 2 = 6. Medián nemusí být hodnotou v souboru dat.
Co to znamená, když průměr = medián = režim?
Když jsou všechna tři měření stejná, rozdělení je dokonale symetrické a unimodální - klasická zvonová křivka (normální rozdělení). To znamená, že neexistují žádné odchylky, které by zkreslovaly data, a všechny tři měření jsou stejně platnými popisníky středu. V praxi, reálné údaje zřídka dosahují dokonalé symetrie, ale úzké zarovnání průměru a mediánu naznačuje přibližnou symetrii.
Jaký je vztah mezi průměrem, mediánem a sklonem?
V pravosklonném (pozitivně nakloněném) rozložení: střední hodnota > střední hodnota > režim. V levosklonném (negativně nakloněném) rozložení: střední hodnota < střední hodnota < režim. V symetrickém rozložení: střední hodnota = střední hodnota ~ režim. Tento vztah poskytuje rychlou vizuální kontrolu: porovnejte střední hodnotu a střední hodnotu, abyste určili směr naklonění bez pohledu na graf.
Jak vypočítáte průměr pro seskupená data?
Příklad: pokud 10 žáků dosáhlo skóre 50 - 60 (střední bod 55), 15 dosáhlo skóre 60 - 70 (střední bod 65) a 5 dosáhlo skóre 70 - 80 (střední bod 75), průměr = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.
Jaký je rozdíl mezi průměrem populace a průměrem vzorku?
Populační průměr (μ, "mu") se vypočítá z každého člena celé populace. Vzorkový průměr (x̄, "x-bar") se vypočítá z podmnožiny (vzorku) vybrané z této populace. Vzorec je stejný, ale symboly se liší. V praxi téměř vždy pracujeme se vzorkovými prostředky a používáme je k odhadnutí populačního průměru - což zavádí chybu výběru vzorků a vyžaduje statistické inferenční techniky.
Jak výjimka ovlivňuje průměr vs. medián?
Extrémní hodnoty silně ovlivňují průměr, ale mají minimální vliv na mediánu. Příklad: údaje {1, 2, 3, 4, 5} mají průměr = 3 a medián = 3. Přidání extrémního hodnoty {1, 2, 3, 4, 5, 100}: průměr skočí na 19,2, ale medián se změní pouze na (3 + 4) / 2 = 3,5. Tato robustnost činí medián přednostním měřítkem, kdykoli jsou přítomny nebo podezřelé extrémní hodnoty.
Jaký je zkrácený průměr?
Trimovaný průměr (nebo zkrácený průměr) odstraňuje pevné procento extrémních hodnot před výpočtem průměru. Například 10% trimovaný průměr na {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: odstranit spodní a horní 10% (přibližně 1 hodnota každý), takže {2, 3, 4, 5, 6, 7, 8, 9}; průměr = 5,5. Trimované prostředky se používají v bodovacích systémech (olympijské hodnocení, krasobruslení) a ekonomické statistice ke snížení vlivu outlierů při zachování více údajů než medián.
Jak vypočítám vážený průměr?
Výpočet GPA: stupeň A (4.0) ve tříhodinovém kurzu, stupeň B (3.0) ve čtyřhodinovém kurzu, stupeň C (2.0) ve dvouhodinovém kurzu: vážený GPA = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4)/9 = 28/9 ~ 3.11. Bez váhání by jednoduchý průměr byl (4+3+2)/3 = 3,0 - chybí těžší vliv čtyřhodinového kurzu.
Shrnutí popisné statistiky: Co vždy potřebujete
Kompletní popisný souhrn statistiky pro jakýkoli datový soubor by měl obsahovat všechny následující prvky. Toto je to, co byste uvedli ve vědecké práci, obchodní analýze nebo akademickém úkolu:
| Statistická | Symbol | Příklad ({2,4,4,6,8,10}) | Výklad |
|---|---|---|---|
| Počítání | n | 6 | Kolik pozorování |
| Zlý . | x̄ | 5,67 | Průměrná hodnota |
| Medián | M | 5,0 | Střední hodnota (50. percentil) |
| Způsob | Mo | 4 | Nejčastější hodnota |
| Rozsah | R | 8 | Rozpětí od min. do max. |
| Standardní odchylka | σ nebo s | 2,58 | Typická odchylka od průměru |
| Odchylka | σ² | 6,67 | SD na druhou |
| Min / Max | — | 2 / 10 | Extrémní hodnoty |
V akademické a vědecké práci vždy uvádějte jak měřítko středu, tak měřítko šíření. Zpráva pouze o průměru (nebo mediánu) bez standardní odchylky (nebo IQR) dává neúplný obraz vašich dat. Třída, kde studenti získali průměr 75% s SD = 5%, se velmi liší od třídy s průměrem = 75%, ale SD = 25% - první je těsná skupina tříd B, druhá je divoká smíšená skupina od selhání až k téměř dokonalosti.
Percentily, kvartily a box ploty
Kromě průměru, mediánu a módu, kompletní statistické shrnutí často zahrnuje analýzu percentilu. Percentily vám řeknou, jaká část dat je pod danou hodnotou - což je nezbytné pro pochopení relativního postavení, identifikaci výstředních hodnot a porovnávání mezi populacemi.
- Medián = 50. percentil:Polovina údajů je pod touto hodnotou
- Q1 (první kvartil) = 25. percentil:25% údajů je nižších než Q1
- Q3 (třetí kvartil) = 75. percentil:75% údajů je pod Q3
- IQR (interkvartilový rozsah) = Q3 - Q1:Obsahuje střední 50% údajů
- Pravidlo výjimky:Hodnoty nižší než Q1 - 1,5xIQR nebo vyšší než Q3 + 1,5xIQR se považují za odstředivé hodnoty
| Percentil | Význam | Příklad (výsledky zkoušek, n=100) |
|---|---|---|
| Desáté. | 10% skóre nižší | Hodnocení 52 -> lepší než 10% třídy |
| 25. (Q1) | 25% skóre nižší | Hodnocení 64 -> hranice dolního kvartilu |
| Padesátý (medián) | 50% skóre nižší | Hodnocení 75 -> střed rozdělení |
| Číslo 75 (Q3) | 75% skóre nižší | Hodnocení 87 -> hranice horního kvartilu |
| Číslo 90 | 90% skóre nižší | Hodnocení 93 -> 10% nejlepších ve třídě |
| Číslo 99 . | 99% skóre nižší | Hodnocení 99 -> horní 1% |
Box plot (box-and-whisker plot) vizualizuje tyto informace: box se rozprostírá od Q1 do Q3 (IQR), čára označuje medián a "whiskers" se vztahují k nejmenším/největším hodnotám, které nejsou outlier. Jednotlivé outlier body jsou nakresleny jako body. Box ploty jsou vynikající pro porovnávání distribucí napříč více skupinami vedle sebe, odhalují rozdíly v centru, šíření a sklon, které by jednoduché srovnání průměru vynechalo. Například porovnání výsledků zkoušek napříč třemi školami pomocí tří bočních grafů vedle sebe okamžitě ukazuje, která škola má vyšší medián výkonu, která má větší rozlohu (což naznačuje nekonzistentní výuku) a zda každá škola má skupinu výjimečných studentů, kteří potřebují podporu. Tato vizuální hustota statistických informací na kompaktním displeji činí z bočních grafů jeden z nejsilnějších a nedostatečně používaných nástrojů v datové komunikaci.
Krok za krokem: Vypočítání průměru, mediánu a režimu ručně
Prozkoumejme kompletní příklad s reálným souborem dat: měsíční tržby (v tisících) malého podniku za 12 měsíců: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.
Krok 1: Sortování dat
Sortované ve vzestupném pořadí: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}
Krok 2: Spočítejte průměr
Součet = 38+38+42+44+48+48+52+55+57+61+63+75 = 621
n = 12, průměr = 621 / 12 =51,75 (tisíce)
Krok 3: Najděte střední hodnotu
n = 12 (pár): průměr šesté a sedmé hodnoty = (48 + 52) / 2 =50
Krok 4: Identifikujte režim
Obě čísla 38 a 48 se objeví dvakrát.{38, 48}(biomodální)
Krok 5: Rozsah výpočtu a směrodatná odchylka
Rozsah = 75 - 38 =37
Odchylky od průměru (51,75): (38-51,75) 2 = 189,06; (38-51,75) 2 = 189,06; (42-51,75) 2 = 95,06; (44-51,75) 2 = 60,06; (48-51,75) 2 = 14,06; (52-51,75) 2 = 0,06; (55-51,75) 2 = 10,56; (57-51,75) 2 = 27,56; (61-51,75) 2 = 85,56; (63-51,75) 2 = 126,56; (75-51,75) 2 = 540,56
Součet čtvercových odchylek = 1,352,25; odchylka = 1,352,25/12 = 112,69; SD = √112,69 ~10.62
Výklad
Tento obchod má průměrný měsíční prodej 51 750 dolarů s mediánem 50 000 dolarů. Standardní odchylka ~ 10 620 dolarů znamená, že většina měsíců se pohybuje v rozmezí +/- 10 620 dolarů od průměru. Dvomodální rozložení (dva módy) může naznačovat sezónní vzorce - zkontrolujte, zda se dva 38s a dva 48s shlukují v konkrétních měsících. Nejvyšší výstřední hodnota (75 000 dolarů za jeden měsíc) vytáhne průměr mírně nad medián, což indikuje mírný pozitivní sklon - pravděpodobně jeden výjimečný prodejní měsíc ( prázdninová sezóna, velká smlouva atd.).