Gjennomsnittlig, median og modus kalkulator
Beregne gjennomsnitt, median, modus, rekkevidde og andre statistikker for et hvilket som helst datasett.
Forstå målinger av sentral tendens
I statistikk,målinger av sentral tendensDe tre viktigste er gjennomsnittet, medianen, og modus - hver forteller deg noe annerledes om dataene, og hver er mest hensiktsmessig i forskjellige situasjoner.
Tenk på dette datasettet: testresultater {55, 60, 70, 75, 75, 80, 95}.
| Foranstaltning | Verdi | Hvordan beregnes | Best for |
|---|---|---|---|
| Gjennomsnittlig | 72,9 | (55+60+70+75+75+80+95) / 7 | Symmetriske fordelinger |
| Median (middelverdi) | 75 | Middelverdi for sorterte data | Skjev fordeling, avvikende verdier |
| Modus (mest vanlig) | 75 | Mest gjentatte verdier | Kategoriske data, finne toppene |
| Avstand | 40 | Max - Min = 95 - 55 | Måling av spredning |
Ingen enkelt målestokk er universelt "best". En dataanalytiker velger passende målestokk basert på fordelingsformen, tilstedeværelsen av avvikende verdier, og spørsmålet som blir stilt. Å forstå alle tre - pluss deres begrensninger - er grunnleggende for statistisk leseferdighet.
Gjennomsnitt (aritmetisk gjennomsnitt): Hvordan beregnes det
Denaritmetisk gjennomsnitter summen av alle verdier dividert med antall verdier. Det er det mest brukte målet for sentral tendens og er hva de fleste mener når de sier "gjennomsnitt".
Formel: Gjennomsnitt (x̄) = (Σxi) / n
Der Σxi er summen av alle verdier og n er antall.
Eksempel:Data = {3, 7, 8, 5, 12, 4, 9, 6}
- Sum: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
- Antall: 8 verdier
- Gjennomsnitt = 54 / 8 =6,75
Gjennomsnittet er følsomt foravvikende verdier-- ekstreme verdier trekker gjennomsnittet mot dem. For eksempel, hvis en verdi i ovennevnte sett var 100 i stedet for 12, ville gjennomsnittet hoppe til (54 - 12 + 100) / 8 = 142 / 8 = 17,75, langt fra den "typiske" verdien av de resterende dataene.
Andre typer spesialutstyr:
- Geometrisk gjennomsnitt:n√(x1 x x2 x ... x xn) -- brukes for vekstrater, avkastning, forhold
- Harmonisk gjennomsnitt:n / (1/x1 + 1/x2 + ... + 1/xn) -- brukes for hastigheter, priser, priser per enhet
- Vektet gjennomsnitt:Σ(wixi) / Σwi -- brukes når datapunkter har forskjellig betydning (f.eks. GPA)
Median: Den midterste verdien
Denmedianer den midterste verdien av et datasett når det er sortert i stigende rekkefølge. Den deler fordelingen nøyaktig i halvparten: 50% av verdiene faller under medianen og 50% over.
For et ulige antall verdier:Median = (n+1) / 2. verdi.
For et jevnt antall verdier:Median = gjennomsnittet av n / 2 th og (n / 2 + 1) th verdier.
| Datasett | n | Sortert | Median |
|---|---|---|---|
| {4, 1, 9, 2, 6} | 5 (odd) | {1, 2, 4, 6, 9} | 4 (tredje verdi) |
| {7, 3, 8, 5} | 4 (til og med) | {3, 5, 7, 8} | (5+7)/2 = 6 |
| {10, 20, 30, 40} | 4 (til og med) | {10, 20, 30, 40} | (20 + 30) / 2 = 25 |
| {1, 1, 1, 1000} | 4 (til og med) | {1, 1, 1, 1000} | (1+1)/2 = 1 |
Legg merke til det siste eksempelet: gjennomsnittet av {1, 1, 1, 1000} = 250,75, men medianen = 1.median er å foretrekke fremfor gjennomsnittet for skjev fordelingermed avvigende verdier - medianinntekter, boligpriser og sykehusopphold er alle rapportert som medianer fordi noen få ekstremt høye verdier ville gjøre gjennomsnittet ikke representativt for typisk erfaring.
Modus: Den hyppigste verdien
Denmoduser den verdi som forekommer oftest i et datasett.
- Ingen modus:alle verdier vises like ofte (f.eks. {1, 2, 3, 4, 5})
- En modus (unimodal):en verdi vises mer enn alle andre (f.eks. {1, 2, 2, 3, 4} -> modus = 2)
- To moduser (bimodale):to verdier bundet for hyppigst (f.eks. {1, 1, 2, 3, 3} -> moduser = 1 og 3)
- Multi-modus (multimodal):tre eller flere verdier bundet for hyppigste
Modus er spesielt nyttig for:
- Kategoriopplysninger:"Hva er den mest populære skostørrelsen?" (Størrelse 10 for amerikanske menn, for eksempel)
- Diskrete data:"Hvor mange barn har familier vanligvis?" (ofte 2, modus)
- Fordelingsform:En bimodal fordeling (to topper) antyder to forskjellige underpopulasjoner i dataene dine - et kritisk viktig signal i utforskende analyse
| Datasett | Modus | Typ |
|---|---|---|
| {1, 2, 3, 4, 5} | Ingen | Ingen modus |
| {2, 4, 4, 6, 8} | 4 | Unimodal |
| {1, 1, 3, 5, 5} | 1 og 5 | Bimodal |
| {a, b, b, c, c, d, d} | b, c, d | Trimodal |
Område og andre målinger av spredning
Mens gjennomsnitt, median og modus beskriver sentrum av en fordeling,tiltak for spredningDe er like viktige for å forstå et datasett.
| Foranstaltning | Formel | Eksempel {2, 4, 4, 6, 8} | Følsomhet for avvikende verdier |
|---|---|---|---|
| Avstand | Maks - Min | 8 - 2 = 6 | Svært følsom |
| Interkvartilområde (IQR) | Q3 - Q1 | 7 - 3 = 4 | Motstandsdygtig |
| Variasjon (σ2) | Σ ((xi - x̄) 2 / n | 3.44 | Følsomme |
| Standardavvik (σ) | √Varians | 1.855 | Følsomme |
| Gjennomsnittlig absolutt avvik | Jeg har ikke tid til meg selv. | 1.6 Utviklingen | Moderat |
For {2, 4, 4, 6, 8}: gjennomsnitt = 4,8, så avvikene er: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24. Varians = (7.84+0.64+0.64+1.44+10.24)/5 = 20.8/5 = 4.16.
Standardavvik er statistikkens arbeidshest - det vises i hypotese testing, konfidensintervaller, beregninger av normalfordeling og prosesskontroll. Et lavere standardavvik betyr at data er klynget nær gjennomsnittet; et høyere standardavvik betyr at data er mer spredt ut.
Når du skal bruke gjennomsnittlig vs median vs modus
Å velge feil målestok for sentral tendens kan være misvisende.
| Situasjon | Anbefalt tiltak | Hvorfor? |
|---|---|---|
| Symmetrisk, ingen avvigende verdier | Gjennomsnittlig | Mest matematisk håndterbar; bruker alle data |
| Skjev fordeling | Median | Ikke trukket av ekstreme verdier |
| Inntekt / boligpriser | Median | Et par millionærer skjevt gjennomsnittet oppover |
| Kategoriopplysninger | Modus | Gjennomsnitt/median gjelder ikke for kategorier |
| Vanligste verdi | Modus | Direkte svar på "mest populære" |
| Gjennomsnittlige karakterer / GPA | Gjennomsnitt (vektet) | Alle poeng bidra proporsjonalt |
| Avkastning / vekst | Geometrisk gjennomsnitt | Regnskap for sammensatte inntekter |
| Overlevelsestider, sykehusopphold | Median | Til høyre av langvarige saker |
Den velkjente observasjonen: "Den gjennomsnittlige amerikaneren har ett bryst og en testikkel" illustrerer hvorfor gjennomsnittet kan være misvisende for bimodal fordelinger. I dette tilfellet er modus (separert etter kjønn) og medianen mer informative beskrivere enn det totale gjennomsnittet.
Eksempler fra virkeligheten: Gjennomsnitt, median og modus i praksis
Å forstå hvordan disse begrepene gjelder i virkelige situasjoner bygger statistisk intuisjon:
- Husholdningenes inntekt i USA (2023):Gjennomsnittlig ~ $ 105.000; Median ~ $ 74.580. Gapet gjenspeiler inntektsskjevhet - et lite antall svært høye inntekter trekker dramatisk gjennomsnittet oppover.
- Kjørende løp avsluttende tider:I et 10K-løp kan den gjennomsnittlige slutttiden være høyere enn medianen fordi langsomme vandrere danner en lang høyre hale.
- Klassens testpoeng:Hvis en elev scorer 5/100 og tjue andre scorer 75 - 95/100, blir gjennomsnittet trukket ned av avvikeren. Læreren kan rapportere medianen for å bedre representere klassens ytelse.
- Skostørrelser:Modus er den mest handlingsmessige statistikken - detaljister lager mest lager i modal (mest vanlig) størrelse.
- Kvalitetskontroll:I produksjon bestemmer standardavviket av produktmålinger prosesskapasiteten.
Ofte stilte spørsmål
Hva er bedre: gjennomsnittlig eller median?
Medianen er mer robust mot avvikende verdier og bedre representerer "typisk" i skjev fordelinger (inntekter, boligpriser, overlevelsestider).
Kan et datasett ikke ha noen modus?
Ja. Hvis alle verdier forekommer like ofte, er det ingen modus (f.eks. {1, 2, 3, 4, 5} - hver verdi vises nøyaktig en gang). Et datasett kan også være multimodal - bimodal (to moduser: {1, 1, 3, 3, 5}) eller trimodal. I praksis signaliserer en bimodal fordeling ofte to distinkte undergrupper i dataene dine, noe som er et viktig mønster å undersøke.
Hvordan finner jeg medianen av et jevnt antall verdier?
Ordne verdiene i stigende rekkefølge, og deretter gjennomsnittlig de to midterste tallene. For {2, 4, 6, 8}: de to midterste verdiene er 4 og 6, så median = (4 + 6) / 2 = 5. For {1, 3, 5, 7, 9, 11}: midterste verdier er 5 og 7, så median = (5 + 7) / 2 = 6. Medianen trenger ikke å være en verdi i datasettet.
Hva betyr det hvis gjennomsnitt = median = modus?
Når alle tre målingene er like, er distribusjonen perfekt symmetrisk og unimodal - den klassiske klokkekurven (normal distribusjon). Dette betyr at det ikke er noen avvigere som skjevner dataene, og alle tre målingene er like gyldige beskrivere av sentrum. I praksis oppnår virkelige data sjelden perfekt symmetri, men tett justering av gjennomsnitt og median antyder tilnærmet symmetri.
Hva er forholdet mellom gjennomsnitt, median og skjevhet?
I en høyre skjev (positiv skjevhet) fordeling: Mean > Median > Mode. I en venstre skjev (negativ skjevhet) fordeling: Mean < Median < Mode. I en symmetrisk fordeling: Mean = Median ~ Mode. Dette forholdet gir en rask visuell sjekk: sammenligne gjennomsnittet og medianen for å bestemme skjevhetens retning uten å se på en graf.
Hvordan beregner du gjennomsnittet for grupperte data?
For grupperte frekvensdata, bruk midtpunktet i hvert klassintervall: Gjennomsnitt = Σ(midpunkt x frekvens) / n. Eksempel: hvis 10 studenter fikk 50 - 60 (midpunkt 55), 15 fikk 60 - 70 (midpunkt 65), og 5 fikk 70 - 80 (midpunkt 75): Gjennomsnitt = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.
Hva er forskjellen mellom populasjonsmiddelverdien og prøvemiddelverdien?
Populasjonsmiddelverdien (μ, "mu") beregnes fra hvert medlem av hele populasjonen. Prøvemiddelverdien (x̄, "x-bar") beregnes fra en undergruppe (prøve) trukket fra den populasjonen. Formelen er identisk, men symbolene er forskjellige. I praksis jobber vi nesten alltid med prøvemiddelverdier og bruker dem til å estimere populasjonsmiddelverdien - som introduserer prøvetakingsfeil og krever statistiske inferensteknikker.
Hvordan påvirker en avvikende verdi gjennomsnittet vs medianen?
Outliers sterkt påvirke gjennomsnittet, men har minimal effekt på medianen. Eksempel: data {1, 2, 3, 4, 5} har gjennomsnitt = 3 og medianen = 3. Legge til en outlier {1, 2, 3, 4, 5, 100}: gjennomsnittet hopper til 19,2 men medianen endrer bare til (3 + 4) / 2 = 3.5.
Hva er trimmet gjennomsnittet?
Et trimmet gjennomsnitt (eller trunkert gjennomsnitt) fjerner en fast prosentandel av de ekstreme verdiene før beregning av gjennomsnittet. For eksempel, et 10% trimmet gjennomsnitt på {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: fjerner nederste og øverste 10% (omtrent 1 verdi hver), og etterlater {2, 3, 4, 5, 6, 7, 8, 9}; gjennomsnitt = 5,5. Trimmet gjennomsnitt brukes i poengsystem (Olympisk dømmekraft, kunstskøyte) og økonomisk statistikk for å redusere outlier påvirkning mens du beholder mer data enn medianen.
Hvordan beregner jeg vektet gjennomsnitt?
Vektet gjennomsnitt = Σ ((vekt x verdi) / Σ ((vekt). Eksempel - GPA beregning: Grade A (4.0) i en 3-kreditt kurs, Grade B (3.0) i en 4-kreditt kurs, Grade C (2.0) i en 2-kreditt kurs: Vektet GPA = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4) / 9 = 28/9 ~ 3.11. Uten vekting, ville det enkle gjennomsnittet være (4+3+2) / 3 = 3,0 - savner den tyngre innflytelsen av 4-kreditt kurset.
Sammendrag av beskrivende statistikk: Det du alltid trenger
En fullstendig beskrivende statistikk oppsummering for alle datasett bør inneholde alt av følgende. Dette er hva du ville rapportere i en vitenskapelig papir, forretningsanalyse, eller akademisk oppgave:
| Statistisk | Symboler | Eksempel ({2,4,4,6,8,10}) | Tolkning |
|---|---|---|---|
| Telling | n | 6 | Hvor mange observasjoner |
| Gjennomsnittlig | x̄ | 5,67 | Gjennomsnittlig verdi |
| Median | M | 5,0 | Middelverdi (50-prosentil) |
| Modus | Mo | 4 | Vanligste verdi |
| Avstand | R | 8 | Spread fra min til max |
| Standardavvik | σ eller s | 2,58 | Typisk avvik fra gjennomsnittet |
| Variasjon | σ² | 6,67 | SD i andre |
| Min / Maks | — | 2 / 10 | Ekstreme verdier |
I akademisk og vitenskapelig arbeid, alltid rapportere både en måling av sentrum og en måling av spredning. Rapportere bare gjennomsnittet (eller medianen) uten standardavviket (eller IQR) gir et ufullstendig bilde av dataene dine. En klasse hvor elevene scoret et gjennomsnitt på 75% med SD = 5% er svært forskjellig fra en med gjennomsnitt = 75% men SD = 25% - den første er en tett klynge av B karakterer, den andre er en vilt blandet gruppe fra å feile til nesten perfekt.
Percentiler, kvartiler og boksplotter
Utover gjennomsnittet, medianen og modus, inkluderer et komplett statistisk sammendrag ofte persentilanalyse. Persentiler forteller deg hvilken brøkdel av data som faller under en gitt verdi - viktig for å forstå relativ stilling, identifisere outliers, og sammenligne på tvers av populasjoner.
- Median = 50 prosentil:Halvparten av dataene er under denne verdien
- Q1 (første kvartil) = 25. percentil:25% av dataene er under Q1
- Q3 (tredje kvartil) = 75. percentil:75% av dataene er under Q3
- IQR (Interquartile Range) = Q3 - Q1:Inneholder den midterste 50% av dataene
- Utestående regel:Punkter under Q1 - 1,5xIQR eller over Q3 + 1,5xIQR anses som avvikende verdier
| Persentell | Betydning | Eksempel (eksamenspoeng, n=100) |
|---|---|---|
| Tiende | 10% scoret under | Score av 52 -> scoret bedre enn 10% av klassen |
| 25. (Q1) | 25% scoret under | Score på 64 -> bunnkvartilgrensen |
| 50 (median) | 50% scoret under | Poengsum 75 -> midten av fordelingen |
| 75 (Q3) | 75% scoret under | Score på 87 -> øverste kvartilgrens |
| Nettiende | 90% scoret under | Score på 93 -> topp 10% av klassen |
| Den 99. | 99% scoret under | Score på 99 -> topp 1% |
En boks plot (boks-og-whisker plot) visualiserer denne informasjonen: boksen spenner Q1 til Q3 (IQR), en linje markerer medianen, og "whiskers" strekker seg til de minste/største ikke-outlier verdier. For eksempel, sammenligner testpoeng på tvers av tre skoler ved hjelp av tre side-by-side boks plotter umiddelbart viser hvilken skole har høyere median ytelse, som har mer spredning (indikerer inkonsekvent undervisning), og om noen skole har en klynge av outlier studenter som trenger støtte.
Trinn for trinn: Beregne gjennomsnitt, median og modus for hånd
La oss jobbe gjennom et komplett eksempel med et realistisk datasett: Månedlig salgstall (i tusen) for en liten bedrift over 12 måneder: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.
Trinn 1: Sortere dataene
Sortert oppover: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}
Trinn 2: Beregn gjennomsnittet
Sum = 38+38+42+44+48+48+52+55+57+61+63+75 = 621
n = 12, gjennomsnitt = 621 / 12 =51,75 (tusen)
Trinn 3: Finn medianen
n = 12 (også): gjennomsnittlig sjette og syvende verdi = (48 + 52) / 2 =50
Trinn 4: Identifiser modusen
Både 38 og 48 vises to ganger.{38, 48}(bimodale)
Trinn 5: Beregning av rekkevidde og standardavvik
Avstand = 75 - 38 =37
Avvik fra gjennomsnittet (51.75): (38-51.75) 2 = 189.06; (38-51.75) 2 = 189.06; (42-51.75) 2 = 95.06; (44-51.75) 2 = 60.06; (48-51.75) 2 = 14.06; (52-51.75) 2 = 0.06; (55-51.75) 2 = 10.56; (57-51.75) 2 = 27.56; (61-51.75) 2 = 85.56; (63-51.75) 2 = 126.56; (75-51.75) 2 = 540.56
Summen av kvadrert avvik = 1,352.25; Varians = 1,352.25/12 = 112.69; SD = √112.69 ~10.62
Tolkning
Denne virksomheten har gjennomsnittlig månedlig omsetning på $ 51,750 med en median på $ 50,000. Standardavviket på ~ $ 10,620 betyr at de fleste måneder faller innenfor +/- $ 10,620 av gjennomsnittet. Den bimodal distribusjon (to moduser) kan foreslå sesongmessige mønstre - sjekk om de to 38s og to 48s klynge i bestemte måneder. Den øverste outlier ($ 75,000 i en måned) trekker gjennomsnittet litt over medianen, noe som indikerer mild positiv skjevhet - sannsynligvis en eksepsjonell salgsmåned (ferie sesong, stor kontrakt, etc.).