Átlag, medián és mód számológép
Számolja ki az átlagot, a mediánt, a módot, a tartományt és más statisztikákat bármely adatkészlethez.
A központi tendencia méréseinek megértése
A statisztikában,központi tendencia mértékeA három legfontosabb az átlag, a medián és a mód -- mindegyik valami mást mond az adatról, és mindegyik a legmegfelelőbb a különböző helyzetekben.
Tekintse meg ezt az adatkészletet: a vizsgálati pontszámok {55, 60, 70, 75, 75, 80, 95}.
| Az intézkedés | Érték | Hogyan számítják ki | Legjobb |
|---|---|---|---|
| Átlag | 72,9 | (55+60+70+75+75+80+95) / 7 | Szimmetrikus eloszlások |
| Medián (középségi érték) | 75 | A rendezett adatok középső értéke | Kettős eloszlások, eltérő értékek |
| Mód (leggyakrabban előforduló) | 75 | Leggyakrabban ismételt érték | Kategorikus adatok, csúcsok megtalálása |
| Hatótávolság | 40 | Max - Min = 95 - 55 | A spread mérése |
Egyetlen mérőszám sem az egyetemes "legjobb". Az adatelemző kiválasztja a megfelelő mérőszámot az eloszlás formájának, az eltérő értékek jelenlétének és a feltett kérdésnek megfelelően. Mindhárom mérőszám megértése - plusz azok korlátai - alapvető a statisztikai műveltséghez.
Átlag (aritmetikai átlag): Hogyan számoljuk ki?
Aaritmetikai átlagEz a leggyakrabban használt mértéke a központi tendenciának, és ez az, amit a legtöbb ember úgy ért, amikor azt mondja, hogy "átlag".
Formula: Átlag (x̄) = (Σxi) / n
ahol Σxi az összes érték összege és n a szám.
Példa:Adat = {3, 7, 8, 5, 12, 4, 9, 6}
- Összesen: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
- Szám: 8 érték
- Átlag = 54 / 8 =6,75
Az átlag érzékeny aeltérő értékekPéldául, ha a fenti halmaz egyik értéke 12 helyett 100 lenne, akkor az átlag (54 - 12 + 100) / 8 = 142 / 8 = 17,75 lenne, ami messze a többi adat "tipikus" értékétől.
Más típusú, speciális felhasználásra szánt eszközök:
- A geometriai átlag:n√(x1 x x2 x ... x xn) -- a növekedési ráták, a hozamok, az arányok
- Harmónikus átlag:n / (1/x1 + 1/x2 + ... + 1/xn) - a sebességek, az árak és az egységenkénti árak esetében
- Súlyosított átlag:Σ(wixi) / Σwi -- akkor használják, ha az adatpontok különböző fontosságúak (pl. GPA)
Medián: A középső érték
Amediána növekvő sorrendben rendezett adathalmaz középső értéke, amely pontosan a felére osztja az eloszlást: az értékek 50%-a a medián alatt, 50%-a pedig felett van.
A páratlan számú érték esetében:Medián = (n+1) /2-es érték.
Páros számú érték esetén:Medián = az n/2 és (n/2 + 1) th értékek átlaga.
| Adatkészlet | n | Sortált | Medián |
|---|---|---|---|
| {4, 1, 9, 2, 6} | 5 (szokatlan) | {1, 2, 4, 6, 9} | 4 (harmadik érték) |
| {7, 3, 8, 5} | 4 (egyenes) | {3, 5, 7, 8} | (5+7)/2 = 6 |
| {10, 20, 30, 40} | 4 (egyenes) | {10, 20, 30, 40} | (20 + 30) / 2 = 25 |
| {1, 1, 1, 1000} | 4 (egyenes) | {1, 1, 1, 1000} | (1+1)/2 = 1 |
Figyeld meg az utolsó példát: a {1, 1, 1, 1000} átlaga = 250,75, de a medián = 1. Ez tökéletesen illusztrálja, hogy miértA medián előnyösebb az átlagnál az eltorzított eloszlásoknála medián jövedelem, a lakásárak és a kórházi tartózkodás időtartama mediánként jelentettek, mert néhány rendkívül magas érték miatt az átlag nem képviseli a tipikus tapasztalatokat.
Mód: A leggyakoribb érték
Amódaz adatkészletben leggyakrabban megjelenő érték.
- Nincs mód:minden érték azonos gyakorisággal jelenik meg (pl. {1, 2, 3, 4, 5})
- Egy üzemmódú (unimodális):egy érték többször jelenik meg, mint az összes többi (pl. {1, 2, 2, 3, 4} -> mód = 2)
- Két üzemmód (bimodális):a leggyakrabban előforduló két érték (pl. {1, 1, 2, 3, 3} -> mód = 1 és 3)
- Többféle üzemmód (multimodális):három vagy több azonos érték a leggyakoribb
A mód különösen hasznos:
- Kategorikus adatok:"Melyik a legnépszerűbb cipőméret?" (például 10 méret amerikai férfiak számára)
- Diszkrét adatok:"Hány gyerekük van egy családban?" (gyakran kettő)
- Eloszlás alakja:A bimodális eloszlás (két csúcs) azt sugallja, két különböző alpopulációk az adatok - egy kritikus fontosságú jel a vizsgálati elemzés
| Adatkészlet | Mód | A típus |
|---|---|---|
| {1, 2, 3, 4, 5} | Nincs | Nincs mód |
| {2, 4, 4, 6, 8} | 4 | Unimodális |
| {1, 1, 3, 5, 5} | 1 és 5 | Bimodal |
| {a, b, b, c, c, d, d} | b, c, d | Trimodal |
Távolság és más elterjedési mérések
Míg a középérték, a medián és a mód leírja a eloszlás központját,a terjedés mértékeAz adatok változatosságának leírása az adatkészlet megértéséhez ugyanolyan fontos.
| Az intézkedés | A képlet | Példa ({2, 4, 4, 6, 8}) | Az eltérő értékekre való érzékenység |
|---|---|---|---|
| Hatótávolság | Max - Min | 8 - 2 = 6 | Nagyon érzékeny |
| Interkwartilis tartomány (IQR) | Q3 - Q1 | 7 - 3 = 4 | Ellenálló |
| Variancia (σ2) | Σ(xi - x̄) 2 / n | 3.44 | Érzékeny |
| Standard eltérés (σ) | √Variánsz | 1.855 | Érzékeny |
| Átlagos abszolút eltérés | Szép munka. | Az Európai Unió | Mérsékelt |
A {2, 4, 4, 6, 8} esetében: az átlag = 4,8, tehát az eltérések: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24. A variancia = (7.84+0.64+0.64+1.44+10.24)/5 = 20.8/5 = 4.16. SD = √4.16 ~ 2.04.
A standard eltérés a statisztika munkahelyét jelenti - hipotézisvizsgálatban, bizalmi intervallumokban, normál eloszlási számításokban és folyamatellenőrzésben jelenik meg. Egy alacsonyabb standard eltérés azt jelenti, hogy az adatok a középérték közelében vannak csoportosítva; egy magasabb standard eltérés azt jelenti, hogy az adatok szélesebb körben vannak elterjedve.
Mikor kell használni az átlagot a mediánhoz képest?
A rossz központi tendencia mérőszám kiválasztása félrevezető lehet.
| A helyzet | Ajánlott intézkedés | Miért? |
|---|---|---|
| Szimmetrikus, nincsenek eltérő értékek | Gonosz | Legmagasabb matematikai kezelhetőség; minden adatot használ |
| Eltorzított eloszlás | Medián | Nem vonja a szélsőséges értékek |
| Bevételek / lakásárak | Medián | Néhány milliomos felfelé torzítja az átlagot. |
| Kategorikus adatok | Mód | Átlag/medián nem vonatkozik a kategóriákra |
| Leggyakoribb érték | Mód | Közvetlen válasz a "legnépszerűbb" kérdésre |
| Érettségi átlag / GPA | Átlag (súlyosított) | Minden pontszám arányosan járul hozzá |
| Részvényhozam / növekedési ráta | Geometriai átlag | Összesített számlák |
| Túlélési idő, kórházi tartózkodás | Medián | Hosszú időtartamú ügyek |
A jól ismert megfigyelés: "Az átlagos amerikai embernek egy melle és egy heréje van" illusztrálja, hogy az átlag miért lehet félrevezető a bimodális eloszlásokban.
Valódi példák: a gyakorlatban az átlag, a medián és a mód
A statisztikai intuíciót a tényleges helyzetekben való alkalmazás megértése segíti:
- Az amerikai háztartások jövedelme (2023):A szakadék a jövedelmi torzságot tükrözi - egy kis számú nagyon magas jövedelmű drámaian felfelé húzza az átlagot. A politikai viták a medián jövedelmet használják, mert jobban képviseli a "tipikus" háztartást.
- A futóverseny befejezési ideje:Egy 10 km-es versenyen az átlagos befejezési idő magasabb lehet, mint a medián, mert a lassú járók hosszú jobb farkot alkotnak.
- Osztályvizsgálati pontszám:Ha egy tanuló 5/100 pontot szerzett, és húsz másik tanuló 75 - 95/100 pontot szerzett, az átlagot az eltérő érték húzza le. A tanár jelentheti a mediánt, hogy jobban ábrázolja az osztály teljesítményét.
- Cipőméret:A mód a legmegfelelőbb statisztika - a kiskereskedők a legtöbb készletet a modal (leggyakoribb) méretben tartalmazzák.
- Minőségellenőrzés:A gyártásban a termék méréseinek standard eltérése határozza meg a folyamat képességét.
Gyakran feltett kérdések
Melyik a jobb: az átlagos vagy a medián?
Egyik sem jobb az egész világon - különböző célokat szolgálnak. A medián robusztusabb az eltérő értékekkel szemben, és jobban képviseli a "tipikusat" a torz eloszlásokban (jövedelem, lakásárak, túlélési idők). Az átlag minden adatpontot használ, matematikai szempontból optimális a szimmetrikus eloszlásokhoz, és szükséges a további statisztikai számításokhoz, mint például a standard eltérés és a hipotézis tesztelés. Használja mindkettőt együtt a teljes képhez.
Lehet, hogy egy adatkészletnek nincs módja?
Igen. Ha minden érték egyformán gyakori, akkor nincs mód (pl. {1, 2, 3, 4, 5} - minden érték pontosan egyszer jelenik meg). Az adatkészlet multimodális is lehet - bimodális (két mód: {1, 1, 3, 3, 5}) vagy trimodális. A gyakorlatban a bimodális eloszlás gyakran két különböző alcsoportot jelez az adataidban, ami fontos vizsgálandó minta.
Hogyan találom meg a páros értékek mediánját?
Az értékeket emelkedő sorrendben rendezzük, majd a két középső számot átlagoljuk. {2, 4, 6, 8}: a két középső érték 4 és 6, tehát medián = (4+6) / 2 = 5. {1, 3, 5, 7, 9, 11}: középső értékek 5 és 7, tehát medián = (5+7) / 2 = 6. A medián nem kell az adatkészlet értéke legyen.
Mit jelent, ha az átlag = medián = mód?
Amikor mindhárom mérés egyenlő, az eloszlás tökéletesen szimmetrikus és unimodális - a klasszikus csengő görbe (normális eloszlás). Ez azt jelenti, hogy nincsenek eltérő értékek, amelyek torzítják az adatokat, és mindhárom mérés egyformán érvényes leírói a középpontnak. A gyakorlatban a valós adatok ritkán érik el a tökéletes szimmetriát, de az átlag és a medián szoros összhangja megközelítő szimmetriát sugall.
Mi a kapcsolat az átlag, a medián és a torzítás között?
Egy jobb oldali (pozitív elhajlás) eloszlásban: átlag > medián > mód. Egy bal oldali (negatív elhajlás) eloszlásban: átlag < medián < mód. Egy szimmetrikus eloszlásban: átlag = medián ~ mód. Ez a kapcsolat gyors vizuális ellenőrzést biztosít: hasonlítsa össze az átlagot és a mediánt, hogy meghatározza az elhajlás irányát anélkül, hogy egy grafikont nézne.
Hogyan számítjuk ki a csoportosított adatok átlagát?
A csoportosított gyakorisági adatokhoz használja az egyes osztályintervallumok középső pontját: Átlag = Σ(középpont x gyakoriság) / n. Például: ha 10 tanuló 50-60 pontot kapott (55-ös középső pont), 15-en 60-70 pontot kaptak (65-ös középső pont), és 5-en 70-80 pontot kaptak (75-ös középső pont): Átlag = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.
Mi a különbség a populáció és a minta átlagja között?
A populációs átlagot (μ, "mu") az egész populáció minden tagjától számítják ki. A minta átlagát (x̄, "x-bar") az adott populációból levont alcsoportból (mintából) számítják ki. A képlet azonos, de a szimbólumok eltérnek. A gyakorlatban szinte mindig a minta átlagokkal dolgozunk, és azokat a populációs átlag becsléséhez használjuk - ami mintavételi hibát vezet be, és statisztikai következtetési technikákat igényel.
Hogyan befolyásolja egy eltérő érték az átlagot a mediánhoz képest?
A kiugró értékek erősen befolyásolják az átlagot, de minimális hatással vannak a mediánra. Például: az {1, 2, 3, 4, 5} adatnak közepe = 3 és mediánja = 3. Egy kiugró érték {1, 2, 3, 4, 5, 100} hozzáadása: az átlag 19,2-re ugrik, de a medián csak a (3 + 4) / 2 = 3,5-re változik. Ez a robustság teszi a mediánt az előnyben részesített mértékévé, amikor a kiugró értékek jelen vannak vagy gyaníthatóak.
Mekkora az átlag?
A vágott átlag (vagy a levágott átlag) eltávolítja a szélsőséges értékek rögzített százalékát az átlag kiszámítása előtt. Például egy 10%-os vágott átlag {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: eltávolítja az alsó és a felső 10%-ot (mintegy 1 érték), így {2, 3, 4, 5, 6, 7, 8, 9}; átlag = 5,5. A vágott középértékeket pontszámolási rendszerekben (Olympiás ítélkezés, műkorcsolyázás) és gazdasági statisztikákban használják, hogy csökkentsék a szélsőséges hatást, miközben több adatot tartanak fenn, mint a medián.
Hogyan számoljuk ki a súlyozott átlagot?
A súlyozott átlag = Σ(súly x érték) / Σ(súlyok). Példaként -- GPA számítás: A fokozat (4.0) egy 3 kredites tanfolyamon, B fokozat (3.0) egy 4 kredites tanfolyamon, C fokozat (2.0) egy 2 kredites tanfolyamon: Súlyozott GPA = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4)/9 = 28/9 ~ 3.11. Súlyozás nélkül az egyszerű átlag lenne (4+3+2)/3 = 3.0 -- hiányzik a 4 kredites tanfolyam nehezebb hatása.
Összefoglaló leíró statisztikák: amire mindig szükséged van
Egy teljes, leíró statisztikai összefoglalónak minden adatkészlethez a következőket kell tartalmaznia. Ez az, amit egy tudományos tanulmányban, üzleti elemzésben vagy tudományos megbízásban jelentene:
| Statisztikai | Szimbólum | Példa ({2,4,4,6,8,10}) | Értelmezés |
|---|---|---|---|
| Számolás | n | 6 | Hány megfigyelés |
| Gonosz | x̄ | 5.67 | Átlagos érték |
| Medián | M | 5.0 | Középső érték (50. percentile) |
| Mód | Mo | 4 | Leggyakoribb érték |
| Hatótávolság | R | 8 | A minimumból a maximumba terjedő spread |
| Standard eltérés | σ vagy s | 2,58 | Tipikus eltérés az átlagtól |
| Változás | σ² | 6. 67 | SD négyzet |
| Min. / Max. | — | 2 / 10 | Extrém értékek |
Egy olyan osztály, ahol a diákok átlagosan 75%-ot értek el SD = 5%-kal, nagyon különbözik egy olyan osztálytól, ahol átlagosan = 75%, de SD = 25% - az első egy szoros B osztályú klaszter, a második egy vad vegyes csoport a kudarctól a közel tökéletesig.
Percentilek, kvartilek és box plotok
A középérték, a medián és a mód mellett a teljes statisztikai összefoglaló gyakran tartalmaz percentil elemzést. A percentilek megmondják, hogy az adatok hányada esik le egy adott érték alatt - ami elengedhetetlen a relatív helyzet megértéséhez, az eltérő értékek azonosításához és a populációk közötti összehasonlításhoz.
- Medián = 50. percentile:Az adatok fele ezen érték alatt van.
- Q1 (első kvartil) = 25. percentil:Az adatok 25%-a Q1 alatt van
- Q3 (harmadik kvartil) = 75. percentil:Az adatok 75%-a Q3-nál alacsonyabb
- IQR (interkwartilis tartomány) = Q3 - Q1:Az adatok középső 50%-át tartalmazza
- A kiemelkedő szabály:A Q1 - 1,5xIQR alatti vagy a Q3 + 1,5xIQR feletti pontokat eltérő értékeknek tekintik
| Percentile | Jelentése | Példa (vizsgálati pontszám, n=100) |
|---|---|---|
| 10. | 10%-nál alacsonyabb pontszám | 52-es pontszám -> az osztály 10%-ánál jobb pontszám |
| 25. (Q1) | 25%-nál alacsonyabb pontszám | 64 pontszám -> az alsó kvartil határánál |
| 50. (médián) | 50%-nál alacsonyabb pontszám | 75-ös pontszám -> az eloszlás közepe |
| 75. (Q3) | 75%-nál alacsonyabb pontszám | 87 pontszám -> a felső kvartil határánál |
| A 90. | 90% alatti pontszám | 93 pont -> az osztály legjobb 10%-a |
| 99-es | 99%-nál alacsonyabb pontszám | 99 pontszám -> a legmagasabb 1% |
A box plot (box-and-whisker plot) vizualizálja ezt az információt: a box Q1-től Q3-ig terjed (az IQR), egy vonal jelöli a mediánot, és a "whiskers" a legkisebb / legnagyobb nem-kihagyó értékekre terjed ki. Az egyes kihagyó pontokat pontokként ábrázolják. A box plotok kiválóan alkalmasak a több csoport közötti eloszlások egymás mellett történő összehasonlítására, a középpont, a terjedés és a torzulás közötti különbségek feltárására, amelyeket egy egyszerű átlagos összehasonlítás kihagyna. Például, ha összehasonlítjuk a három iskola vizsgálati eredményeit három egymás mellett elhelyezett dobozos diagrammal, azonnal kiderül, hogy melyik iskolának van magasabb átlagos teljesítménye, melyiknek nagyobb a terjedelme (az összeegyeztethetetlen tanításra utalva), és hogy bármelyik iskolában van-e támogatásra szoruló, eltérő diákok csoportja.
Lépésről-lépésre: A középérték, a medián és a mód kézzel történő kiszámítása
Tegyünk egy teljes példát egy reális adatkészlettel: egy kisvállalkozás havi értékesítési adatai (ezrekben) 12 hónap alatt: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.
1. lépés: Sorolja az adatokat
Felemelkedő sorrendben: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}
2. lépés: Számolja ki az átlagot
Összesen: 38+38+42+44+48+48+52+55+57+61+63+75 = 621
n = 12, átlag = 621 / 12 =51.75 (ezer)
3. lépés: Keressük meg a medián értéket
n = 12 (egyenes): a hatodik és hetedik értékek átlaga = (48 + 52) / 2 =50
4. lépés: A mód meghatározása
Mind a 38-as, mind a 48-as szám kétszer jelenik meg.{38, 48}(bi-modális)
5. lépés: Számítási tartomány és szabványelhajlás
Tartomány = 75 - 38 =37
Az átlagtól való eltérés (51.75): (38-51.75) 2 = 189.06; (38-51.75) 2 = 189.06; (42-51.75) 2 = 95.06; (44-51.75) 2 = 60.06; (48-51.75) 2 = 14.06; (52-51.75) 2 = 0.06; (55-51.75) 2 = 10.56; (57-51.75) 2 = 27.56; (61-51.75) 2 = 85.56; (63-51.75) 2 = 126.56; (75-51.75) 2 = 540.56
Az eltérések négyzetének összege = 1,352.25; Variance = 1,352.25/12 = 112.69; SD = √112.69 ~10.62
Értelmezés
A bi-modális eloszlás (két mód) szezonális mintákat sugallhat - ellenőrizze, hogy a két 38-as és két 48-as csoportosul-e bizonyos hónapokban. A legfelső kitérő érték (75.000 dollár egy hónapban) a medián felett húzza az átlagot, ami enyhe pozitív torzulást jelez - valószínűleg egy kivételes értékesítési hónap (ünnepi időszak, nagy szerződés stb.).