Skip to main content
🟢 Beginner 🔥 Popular

Átlag, medián és mód számológép

Számolja ki az átlagot, a mediánt, a módot, a tartományt és más statisztikákat bármely adatkészlethez.

A központi tendencia méréseinek megértése

A statisztikában,központi tendencia mértékeA három legfontosabb az átlag, a medián és a mód -- mindegyik valami mást mond az adatról, és mindegyik a legmegfelelőbb a különböző helyzetekben.

Tekintse meg ezt az adatkészletet: a vizsgálati pontszámok {55, 60, 70, 75, 75, 80, 95}.

Az intézkedésÉrtékHogyan számítják kiLegjobb
Átlag72,9(55+60+70+75+75+80+95) / 7Szimmetrikus eloszlások
Medián (középségi érték)75A rendezett adatok középső értékeKettős eloszlások, eltérő értékek
Mód (leggyakrabban előforduló)75Leggyakrabban ismételt értékKategorikus adatok, csúcsok megtalálása
Hatótávolság40Max - Min = 95 - 55A spread mérése

Egyetlen mérőszám sem az egyetemes "legjobb". Az adatelemző kiválasztja a megfelelő mérőszámot az eloszlás formájának, az eltérő értékek jelenlétének és a feltett kérdésnek megfelelően. Mindhárom mérőszám megértése - plusz azok korlátai - alapvető a statisztikai műveltséghez.

Átlag (aritmetikai átlag): Hogyan számoljuk ki?

Aaritmetikai átlagEz a leggyakrabban használt mértéke a központi tendenciának, és ez az, amit a legtöbb ember úgy ért, amikor azt mondja, hogy "átlag".

Formula: Átlag (x̄) = (Σxi) / n

ahol Σxi az összes érték összege és n a szám.

Példa:Adat = {3, 7, 8, 5, 12, 4, 9, 6}

  1. Összesen: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
  2. Szám: 8 érték
  3. Átlag = 54 / 8 =6,75

Az átlag érzékeny aeltérő értékekPéldául, ha a fenti halmaz egyik értéke 12 helyett 100 lenne, akkor az átlag (54 - 12 + 100) / 8 = 142 / 8 = 17,75 lenne, ami messze a többi adat "tipikus" értékétől.

Más típusú, speciális felhasználásra szánt eszközök:

Medián: A középső érték

Amediána növekvő sorrendben rendezett adathalmaz középső értéke, amely pontosan a felére osztja az eloszlást: az értékek 50%-a a medián alatt, 50%-a pedig felett van.

A páratlan számú érték esetében:Medián = (n+1) /2-es érték.

Páros számú érték esetén:Medián = az n/2 és (n/2 + 1) th értékek átlaga.

AdatkészletnSortáltMedián
{4, 1, 9, 2, 6}5 (szokatlan){1, 2, 4, 6, 9}4 (harmadik érték)
{7, 3, 8, 5}4 (egyenes){3, 5, 7, 8}(5+7)/2 = 6
{10, 20, 30, 40}4 (egyenes){10, 20, 30, 40}(20 + 30) / 2 = 25
{1, 1, 1, 1000}4 (egyenes){1, 1, 1, 1000}(1+1)/2 = 1

Figyeld meg az utolsó példát: a {1, 1, 1, 1000} átlaga = 250,75, de a medián = 1. Ez tökéletesen illusztrálja, hogy miértA medián előnyösebb az átlagnál az eltorzított eloszlásoknála medián jövedelem, a lakásárak és a kórházi tartózkodás időtartama mediánként jelentettek, mert néhány rendkívül magas érték miatt az átlag nem képviseli a tipikus tapasztalatokat.

Mód: A leggyakoribb érték

Amódaz adatkészletben leggyakrabban megjelenő érték.

A mód különösen hasznos:

AdatkészletMódA típus
{1, 2, 3, 4, 5}NincsNincs mód
{2, 4, 4, 6, 8}4Unimodális
{1, 1, 3, 5, 5}1 és 5Bimodal
{a, b, b, c, c, d, d}b, c, dTrimodal

Távolság és más elterjedési mérések

Míg a középérték, a medián és a mód leírja a eloszlás központját,a terjedés mértékeAz adatok változatosságának leírása az adatkészlet megértéséhez ugyanolyan fontos.

Az intézkedésA képletPélda ({2, 4, 4, 6, 8})Az eltérő értékekre való érzékenység
HatótávolságMax - Min8 - 2 = 6Nagyon érzékeny
Interkwartilis tartomány (IQR)Q3 - Q17 - 3 = 4Ellenálló
Variancia (σ2)Σ(xi - x̄) 2 / n3.44Érzékeny
Standard eltérés (σ)√Variánsz1.855Érzékeny
Átlagos abszolút eltérésSzép munka.Az Európai UnióMérsékelt

A {2, 4, 4, 6, 8} esetében: az átlag = 4,8, tehát az eltérések: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24. A variancia = (7.84+0.64+0.64+1.44+10.24)/5 = 20.8/5 = 4.16. SD = √4.16 ~ 2.04.

A standard eltérés a statisztika munkahelyét jelenti - hipotézisvizsgálatban, bizalmi intervallumokban, normál eloszlási számításokban és folyamatellenőrzésben jelenik meg. Egy alacsonyabb standard eltérés azt jelenti, hogy az adatok a középérték közelében vannak csoportosítva; egy magasabb standard eltérés azt jelenti, hogy az adatok szélesebb körben vannak elterjedve.

Mikor kell használni az átlagot a mediánhoz képest?

A rossz központi tendencia mérőszám kiválasztása félrevezető lehet.

A helyzetAjánlott intézkedésMiért?
Szimmetrikus, nincsenek eltérő értékekGonoszLegmagasabb matematikai kezelhetőség; minden adatot használ
Eltorzított eloszlásMediánNem vonja a szélsőséges értékek
Bevételek / lakásárakMediánNéhány milliomos felfelé torzítja az átlagot.
Kategorikus adatokMódÁtlag/medián nem vonatkozik a kategóriákra
Leggyakoribb értékMódKözvetlen válasz a "legnépszerűbb" kérdésre
Érettségi átlag / GPAÁtlag (súlyosított)Minden pontszám arányosan járul hozzá
Részvényhozam / növekedési rátaGeometriai átlagÖsszesített számlák
Túlélési idő, kórházi tartózkodásMediánHosszú időtartamú ügyek

A jól ismert megfigyelés: "Az átlagos amerikai embernek egy melle és egy heréje van" illusztrálja, hogy az átlag miért lehet félrevezető a bimodális eloszlásokban.

Valódi példák: a gyakorlatban az átlag, a medián és a mód

A statisztikai intuíciót a tényleges helyzetekben való alkalmazás megértése segíti:

Gyakran feltett kérdések

Melyik a jobb: az átlagos vagy a medián?

Egyik sem jobb az egész világon - különböző célokat szolgálnak. A medián robusztusabb az eltérő értékekkel szemben, és jobban képviseli a "tipikusat" a torz eloszlásokban (jövedelem, lakásárak, túlélési idők). Az átlag minden adatpontot használ, matematikai szempontból optimális a szimmetrikus eloszlásokhoz, és szükséges a további statisztikai számításokhoz, mint például a standard eltérés és a hipotézis tesztelés. Használja mindkettőt együtt a teljes képhez.

Lehet, hogy egy adatkészletnek nincs módja?

Igen. Ha minden érték egyformán gyakori, akkor nincs mód (pl. {1, 2, 3, 4, 5} - minden érték pontosan egyszer jelenik meg). Az adatkészlet multimodális is lehet - bimodális (két mód: {1, 1, 3, 3, 5}) vagy trimodális. A gyakorlatban a bimodális eloszlás gyakran két különböző alcsoportot jelez az adataidban, ami fontos vizsgálandó minta.

Hogyan találom meg a páros értékek mediánját?

Az értékeket emelkedő sorrendben rendezzük, majd a két középső számot átlagoljuk. {2, 4, 6, 8}: a két középső érték 4 és 6, tehát medián = (4+6) / 2 = 5. {1, 3, 5, 7, 9, 11}: középső értékek 5 és 7, tehát medián = (5+7) / 2 = 6. A medián nem kell az adatkészlet értéke legyen.

Mit jelent, ha az átlag = medián = mód?

Amikor mindhárom mérés egyenlő, az eloszlás tökéletesen szimmetrikus és unimodális - a klasszikus csengő görbe (normális eloszlás). Ez azt jelenti, hogy nincsenek eltérő értékek, amelyek torzítják az adatokat, és mindhárom mérés egyformán érvényes leírói a középpontnak. A gyakorlatban a valós adatok ritkán érik el a tökéletes szimmetriát, de az átlag és a medián szoros összhangja megközelítő szimmetriát sugall.

Mi a kapcsolat az átlag, a medián és a torzítás között?

Egy jobb oldali (pozitív elhajlás) eloszlásban: átlag > medián > mód. Egy bal oldali (negatív elhajlás) eloszlásban: átlag < medián < mód. Egy szimmetrikus eloszlásban: átlag = medián ~ mód. Ez a kapcsolat gyors vizuális ellenőrzést biztosít: hasonlítsa össze az átlagot és a mediánt, hogy meghatározza az elhajlás irányát anélkül, hogy egy grafikont nézne.

Hogyan számítjuk ki a csoportosított adatok átlagát?

A csoportosított gyakorisági adatokhoz használja az egyes osztályintervallumok középső pontját: Átlag = Σ(középpont x gyakoriság) / n. Például: ha 10 tanuló 50-60 pontot kapott (55-ös középső pont), 15-en 60-70 pontot kaptak (65-ös középső pont), és 5-en 70-80 pontot kaptak (75-ös középső pont): Átlag = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.

Mi a különbség a populáció és a minta átlagja között?

A populációs átlagot (μ, "mu") az egész populáció minden tagjától számítják ki. A minta átlagát (x̄, "x-bar") az adott populációból levont alcsoportból (mintából) számítják ki. A képlet azonos, de a szimbólumok eltérnek. A gyakorlatban szinte mindig a minta átlagokkal dolgozunk, és azokat a populációs átlag becsléséhez használjuk - ami mintavételi hibát vezet be, és statisztikai következtetési technikákat igényel.

Hogyan befolyásolja egy eltérő érték az átlagot a mediánhoz képest?

A kiugró értékek erősen befolyásolják az átlagot, de minimális hatással vannak a mediánra. Például: az {1, 2, 3, 4, 5} adatnak közepe = 3 és mediánja = 3. Egy kiugró érték {1, 2, 3, 4, 5, 100} hozzáadása: az átlag 19,2-re ugrik, de a medián csak a (3 + 4) / 2 = 3,5-re változik. Ez a robustság teszi a mediánt az előnyben részesített mértékévé, amikor a kiugró értékek jelen vannak vagy gyaníthatóak.

Mekkora az átlag?

A vágott átlag (vagy a levágott átlag) eltávolítja a szélsőséges értékek rögzített százalékát az átlag kiszámítása előtt. Például egy 10%-os vágott átlag {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: eltávolítja az alsó és a felső 10%-ot (mintegy 1 érték), így {2, 3, 4, 5, 6, 7, 8, 9}; átlag = 5,5. A vágott középértékeket pontszámolási rendszerekben (Olympiás ítélkezés, műkorcsolyázás) és gazdasági statisztikákban használják, hogy csökkentsék a szélsőséges hatást, miközben több adatot tartanak fenn, mint a medián.

Hogyan számoljuk ki a súlyozott átlagot?

A súlyozott átlag = Σ(súly x érték) / Σ(súlyok). Példaként -- GPA számítás: A fokozat (4.0) egy 3 kredites tanfolyamon, B fokozat (3.0) egy 4 kredites tanfolyamon, C fokozat (2.0) egy 2 kredites tanfolyamon: Súlyozott GPA = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4)/9 = 28/9 ~ 3.11. Súlyozás nélkül az egyszerű átlag lenne (4+3+2)/3 = 3.0 -- hiányzik a 4 kredites tanfolyam nehezebb hatása.

Összefoglaló leíró statisztikák: amire mindig szükséged van

Egy teljes, leíró statisztikai összefoglalónak minden adatkészlethez a következőket kell tartalmaznia. Ez az, amit egy tudományos tanulmányban, üzleti elemzésben vagy tudományos megbízásban jelentene:

StatisztikaiSzimbólumPélda ({2,4,4,6,8,10})Értelmezés
Számolásn6Hány megfigyelés
Gonosz5.67Átlagos érték
MediánM5.0Középső érték (50. percentile)
MódMo4Leggyakoribb érték
HatótávolságR8A minimumból a maximumba terjedő spread
Standard eltérésσ vagy s2,58Tipikus eltérés az átlagtól
Változásσ²6. 67SD négyzet
Min. / Max.2 / 10Extrém értékek

Egy olyan osztály, ahol a diákok átlagosan 75%-ot értek el SD = 5%-kal, nagyon különbözik egy olyan osztálytól, ahol átlagosan = 75%, de SD = 25% - az első egy szoros B osztályú klaszter, a második egy vad vegyes csoport a kudarctól a közel tökéletesig.

Percentilek, kvartilek és box plotok

A középérték, a medián és a mód mellett a teljes statisztikai összefoglaló gyakran tartalmaz percentil elemzést. A percentilek megmondják, hogy az adatok hányada esik le egy adott érték alatt - ami elengedhetetlen a relatív helyzet megértéséhez, az eltérő értékek azonosításához és a populációk közötti összehasonlításhoz.

PercentileJelentésePélda (vizsgálati pontszám, n=100)
10.10%-nál alacsonyabb pontszám52-es pontszám -> az osztály 10%-ánál jobb pontszám
25. (Q1)25%-nál alacsonyabb pontszám64 pontszám -> az alsó kvartil határánál
50. (médián)50%-nál alacsonyabb pontszám75-ös pontszám -> az eloszlás közepe
75. (Q3)75%-nál alacsonyabb pontszám87 pontszám -> a felső kvartil határánál
A 90.90% alatti pontszám93 pont -> az osztály legjobb 10%-a
99-es99%-nál alacsonyabb pontszám99 pontszám -> a legmagasabb 1%

A box plot (box-and-whisker plot) vizualizálja ezt az információt: a box Q1-től Q3-ig terjed (az IQR), egy vonal jelöli a mediánot, és a "whiskers" a legkisebb / legnagyobb nem-kihagyó értékekre terjed ki. Az egyes kihagyó pontokat pontokként ábrázolják. A box plotok kiválóan alkalmasak a több csoport közötti eloszlások egymás mellett történő összehasonlítására, a középpont, a terjedés és a torzulás közötti különbségek feltárására, amelyeket egy egyszerű átlagos összehasonlítás kihagyna. Például, ha összehasonlítjuk a három iskola vizsgálati eredményeit három egymás mellett elhelyezett dobozos diagrammal, azonnal kiderül, hogy melyik iskolának van magasabb átlagos teljesítménye, melyiknek nagyobb a terjedelme (az összeegyeztethetetlen tanításra utalva), és hogy bármelyik iskolában van-e támogatásra szoruló, eltérő diákok csoportja.

Lépésről-lépésre: A középérték, a medián és a mód kézzel történő kiszámítása

Tegyünk egy teljes példát egy reális adatkészlettel: egy kisvállalkozás havi értékesítési adatai (ezrekben) 12 hónap alatt: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.

1. lépés: Sorolja az adatokat

Felemelkedő sorrendben: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}

2. lépés: Számolja ki az átlagot

Összesen: 38+38+42+44+48+48+52+55+57+61+63+75 = 621

n = 12, átlag = 621 / 12 =51.75 (ezer)

3. lépés: Keressük meg a medián értéket

n = 12 (egyenes): a hatodik és hetedik értékek átlaga = (48 + 52) / 2 =50

4. lépés: A mód meghatározása

Mind a 38-as, mind a 48-as szám kétszer jelenik meg.{38, 48}(bi-modális)

5. lépés: Számítási tartomány és szabványelhajlás

Tartomány = 75 - 38 =37

Az átlagtól való eltérés (51.75): (38-51.75) 2 = 189.06; (38-51.75) 2 = 189.06; (42-51.75) 2 = 95.06; (44-51.75) 2 = 60.06; (48-51.75) 2 = 14.06; (52-51.75) 2 = 0.06; (55-51.75) 2 = 10.56; (57-51.75) 2 = 27.56; (61-51.75) 2 = 85.56; (63-51.75) 2 = 126.56; (75-51.75) 2 = 540.56

Az eltérések négyzetének összege = 1,352.25; Variance = 1,352.25/12 = 112.69; SD = √112.69 ~10.62

Értelmezés

A bi-modális eloszlás (két mód) szezonális mintákat sugallhat - ellenőrizze, hogy a két 38-as és két 48-as csoportosul-e bizonyos hónapokban. A legfelső kitérő érték (75.000 dollár egy hónapban) a medián felett húzza az átlagot, ami enyhe pozitív torzulást jelez - valószínűleg egy kivételes értékesítési hónap (ünnepi időszak, nagy szerződés stb.).