Skip to main content
🟢 Beginner 🔥 Popular

Gjennomsnittlig, median og modus kalkulator

Beregne gjennomsnitt, median, modus, rekkevidde og andre statistikker for et hvilket som helst datasett.

Forstå målinger av sentral tendens

I statistikk,målinger av sentral tendensDe tre viktigste er gjennomsnittet, medianen, og modus - hver forteller deg noe annerledes om dataene, og hver er mest hensiktsmessig i forskjellige situasjoner.

Tenk på dette datasettet: testresultater {55, 60, 70, 75, 75, 80, 95}.

ForanstaltningVerdiHvordan beregnesBest for
Gjennomsnittlig72,9(55+60+70+75+75+80+95) / 7Symmetriske fordelinger
Median (middelverdi)75Middelverdi for sorterte dataSkjev fordeling, avvikende verdier
Modus (mest vanlig)75Mest gjentatte verdierKategoriske data, finne toppene
Avstand40Max - Min = 95 - 55Måling av spredning

Ingen enkelt målestokk er universelt "best". En dataanalytiker velger passende målestokk basert på fordelingsformen, tilstedeværelsen av avvikende verdier, og spørsmålet som blir stilt. Å forstå alle tre - pluss deres begrensninger - er grunnleggende for statistisk leseferdighet.

Gjennomsnitt (aritmetisk gjennomsnitt): Hvordan beregnes det

Denaritmetisk gjennomsnitter summen av alle verdier dividert med antall verdier. Det er det mest brukte målet for sentral tendens og er hva de fleste mener når de sier "gjennomsnitt".

Formel: Gjennomsnitt (x̄) = (Σxi) / n

Der Σxi er summen av alle verdier og n er antall.

Eksempel:Data = {3, 7, 8, 5, 12, 4, 9, 6}

  1. Sum: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
  2. Antall: 8 verdier
  3. Gjennomsnitt = 54 / 8 =6,75

Gjennomsnittet er følsomt foravvikende verdier-- ekstreme verdier trekker gjennomsnittet mot dem. For eksempel, hvis en verdi i ovennevnte sett var 100 i stedet for 12, ville gjennomsnittet hoppe til (54 - 12 + 100) / 8 = 142 / 8 = 17,75, langt fra den "typiske" verdien av de resterende dataene.

Andre typer spesialutstyr:

Median: Den midterste verdien

Denmedianer den midterste verdien av et datasett når det er sortert i stigende rekkefølge. Den deler fordelingen nøyaktig i halvparten: 50% av verdiene faller under medianen og 50% over.

For et ulige antall verdier:Median = (n+1) / 2. verdi.

For et jevnt antall verdier:Median = gjennomsnittet av n / 2 th og (n / 2 + 1) th verdier.

DatasettnSortertMedian
{4, 1, 9, 2, 6}5 (odd){1, 2, 4, 6, 9}4 (tredje verdi)
{7, 3, 8, 5}4 (til og med){3, 5, 7, 8}(5+7)/2 = 6
{10, 20, 30, 40}4 (til og med){10, 20, 30, 40}(20 + 30) / 2 = 25
{1, 1, 1, 1000}4 (til og med){1, 1, 1, 1000}(1+1)/2 = 1

Legg merke til det siste eksempelet: gjennomsnittet av {1, 1, 1, 1000} = 250,75, men medianen = 1.median er å foretrekke fremfor gjennomsnittet for skjev fordelingermed avvigende verdier - medianinntekter, boligpriser og sykehusopphold er alle rapportert som medianer fordi noen få ekstremt høye verdier ville gjøre gjennomsnittet ikke representativt for typisk erfaring.

Modus: Den hyppigste verdien

Denmoduser den verdi som forekommer oftest i et datasett.

Modus er spesielt nyttig for:

DatasettModusTyp
{1, 2, 3, 4, 5}IngenIngen modus
{2, 4, 4, 6, 8}4Unimodal
{1, 1, 3, 5, 5}1 og 5Bimodal
{a, b, b, c, c, d, d}b, c, dTrimodal

Område og andre målinger av spredning

Mens gjennomsnitt, median og modus beskriver sentrum av en fordeling,tiltak for spredningDe er like viktige for å forstå et datasett.

ForanstaltningFormelEksempel {2, 4, 4, 6, 8}Følsomhet for avvikende verdier
AvstandMaks - Min8 - 2 = 6Svært følsom
Interkvartilområde (IQR)Q3 - Q17 - 3 = 4Motstandsdygtig
Variasjon (σ2)Σ ((xi - x̄) 2 / n3.44Følsomme
Standardavvik (σ)√Varians1.855Følsomme
Gjennomsnittlig absolutt avvikJeg har ikke tid til meg selv.1.6 UtviklingenModerat

For {2, 4, 4, 6, 8}: gjennomsnitt = 4,8, så avvikene er: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24. Varians = (7.84+0.64+0.64+1.44+10.24)/5 = 20.8/5 = 4.16.

Standardavvik er statistikkens arbeidshest - det vises i hypotese testing, konfidensintervaller, beregninger av normalfordeling og prosesskontroll. Et lavere standardavvik betyr at data er klynget nær gjennomsnittet; et høyere standardavvik betyr at data er mer spredt ut.

Når du skal bruke gjennomsnittlig vs median vs modus

Å velge feil målestok for sentral tendens kan være misvisende.

SituasjonAnbefalt tiltakHvorfor?
Symmetrisk, ingen avvigende verdierGjennomsnittligMest matematisk håndterbar; bruker alle data
Skjev fordelingMedianIkke trukket av ekstreme verdier
Inntekt / boligpriserMedianEt par millionærer skjevt gjennomsnittet oppover
KategoriopplysningerModusGjennomsnitt/median gjelder ikke for kategorier
Vanligste verdiModusDirekte svar på "mest populære"
Gjennomsnittlige karakterer / GPAGjennomsnitt (vektet)Alle poeng bidra proporsjonalt
Avkastning / vekstGeometrisk gjennomsnittRegnskap for sammensatte inntekter
Overlevelsestider, sykehusoppholdMedianTil høyre av langvarige saker

Den velkjente observasjonen: "Den gjennomsnittlige amerikaneren har ett bryst og en testikkel" illustrerer hvorfor gjennomsnittet kan være misvisende for bimodal fordelinger. I dette tilfellet er modus (separert etter kjønn) og medianen mer informative beskrivere enn det totale gjennomsnittet.

Eksempler fra virkeligheten: Gjennomsnitt, median og modus i praksis

Å forstå hvordan disse begrepene gjelder i virkelige situasjoner bygger statistisk intuisjon:

Ofte stilte spørsmål

Hva er bedre: gjennomsnittlig eller median?

Medianen er mer robust mot avvikende verdier og bedre representerer "typisk" i skjev fordelinger (inntekter, boligpriser, overlevelsestider).

Kan et datasett ikke ha noen modus?

Ja. Hvis alle verdier forekommer like ofte, er det ingen modus (f.eks. {1, 2, 3, 4, 5} - hver verdi vises nøyaktig en gang). Et datasett kan også være multimodal - bimodal (to moduser: {1, 1, 3, 3, 5}) eller trimodal. I praksis signaliserer en bimodal fordeling ofte to distinkte undergrupper i dataene dine, noe som er et viktig mønster å undersøke.

Hvordan finner jeg medianen av et jevnt antall verdier?

Ordne verdiene i stigende rekkefølge, og deretter gjennomsnittlig de to midterste tallene. For {2, 4, 6, 8}: de to midterste verdiene er 4 og 6, så median = (4 + 6) / 2 = 5. For {1, 3, 5, 7, 9, 11}: midterste verdier er 5 og 7, så median = (5 + 7) / 2 = 6. Medianen trenger ikke å være en verdi i datasettet.

Hva betyr det hvis gjennomsnitt = median = modus?

Når alle tre målingene er like, er distribusjonen perfekt symmetrisk og unimodal - den klassiske klokkekurven (normal distribusjon). Dette betyr at det ikke er noen avvigere som skjevner dataene, og alle tre målingene er like gyldige beskrivere av sentrum. I praksis oppnår virkelige data sjelden perfekt symmetri, men tett justering av gjennomsnitt og median antyder tilnærmet symmetri.

Hva er forholdet mellom gjennomsnitt, median og skjevhet?

I en høyre skjev (positiv skjevhet) fordeling: Mean > Median > Mode. I en venstre skjev (negativ skjevhet) fordeling: Mean < Median < Mode. I en symmetrisk fordeling: Mean = Median ~ Mode. Dette forholdet gir en rask visuell sjekk: sammenligne gjennomsnittet og medianen for å bestemme skjevhetens retning uten å se på en graf.

Hvordan beregner du gjennomsnittet for grupperte data?

For grupperte frekvensdata, bruk midtpunktet i hvert klassintervall: Gjennomsnitt = Σ(midpunkt x frekvens) / n. Eksempel: hvis 10 studenter fikk 50 - 60 (midpunkt 55), 15 fikk 60 - 70 (midpunkt 65), og 5 fikk 70 - 80 (midpunkt 75): Gjennomsnitt = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.

Hva er forskjellen mellom populasjonsmiddelverdien og prøvemiddelverdien?

Populasjonsmiddelverdien (μ, "mu") beregnes fra hvert medlem av hele populasjonen. Prøvemiddelverdien (x̄, "x-bar") beregnes fra en undergruppe (prøve) trukket fra den populasjonen. Formelen er identisk, men symbolene er forskjellige. I praksis jobber vi nesten alltid med prøvemiddelverdier og bruker dem til å estimere populasjonsmiddelverdien - som introduserer prøvetakingsfeil og krever statistiske inferensteknikker.

Hvordan påvirker en avvikende verdi gjennomsnittet vs medianen?

Outliers sterkt påvirke gjennomsnittet, men har minimal effekt på medianen. Eksempel: data {1, 2, 3, 4, 5} har gjennomsnitt = 3 og medianen = 3. Legge til en outlier {1, 2, 3, 4, 5, 100}: gjennomsnittet hopper til 19,2 men medianen endrer bare til (3 + 4) / 2 = 3.5.

Hva er trimmet gjennomsnittet?

Et trimmet gjennomsnitt (eller trunkert gjennomsnitt) fjerner en fast prosentandel av de ekstreme verdiene før beregning av gjennomsnittet. For eksempel, et 10% trimmet gjennomsnitt på {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: fjerner nederste og øverste 10% (omtrent 1 verdi hver), og etterlater {2, 3, 4, 5, 6, 7, 8, 9}; gjennomsnitt = 5,5. Trimmet gjennomsnitt brukes i poengsystem (Olympisk dømmekraft, kunstskøyte) og økonomisk statistikk for å redusere outlier påvirkning mens du beholder mer data enn medianen.

Hvordan beregner jeg vektet gjennomsnitt?

Vektet gjennomsnitt = Σ ((vekt x verdi) / Σ ((vekt). Eksempel - GPA beregning: Grade A (4.0) i en 3-kreditt kurs, Grade B (3.0) i en 4-kreditt kurs, Grade C (2.0) i en 2-kreditt kurs: Vektet GPA = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4) / 9 = 28/9 ~ 3.11. Uten vekting, ville det enkle gjennomsnittet være (4+3+2) / 3 = 3,0 - savner den tyngre innflytelsen av 4-kreditt kurset.

Sammendrag av beskrivende statistikk: Det du alltid trenger

En fullstendig beskrivende statistikk oppsummering for alle datasett bør inneholde alt av følgende. Dette er hva du ville rapportere i en vitenskapelig papir, forretningsanalyse, eller akademisk oppgave:

StatistiskSymbolerEksempel ({2,4,4,6,8,10})Tolkning
Tellingn6Hvor mange observasjoner
Gjennomsnittlig5,67Gjennomsnittlig verdi
MedianM5,0Middelverdi (50-prosentil)
ModusMo4Vanligste verdi
AvstandR8Spread fra min til max
Standardavvikσ eller s2,58Typisk avvik fra gjennomsnittet
Variasjonσ²6,67SD i andre
Min / Maks2 / 10Ekstreme verdier

I akademisk og vitenskapelig arbeid, alltid rapportere både en måling av sentrum og en måling av spredning. Rapportere bare gjennomsnittet (eller medianen) uten standardavviket (eller IQR) gir et ufullstendig bilde av dataene dine. En klasse hvor elevene scoret et gjennomsnitt på 75% med SD = 5% er svært forskjellig fra en med gjennomsnitt = 75% men SD = 25% - den første er en tett klynge av B karakterer, den andre er en vilt blandet gruppe fra å feile til nesten perfekt.

Percentiler, kvartiler og boksplotter

Utover gjennomsnittet, medianen og modus, inkluderer et komplett statistisk sammendrag ofte persentilanalyse. Persentiler forteller deg hvilken brøkdel av data som faller under en gitt verdi - viktig for å forstå relativ stilling, identifisere outliers, og sammenligne på tvers av populasjoner.

PersentellBetydningEksempel (eksamenspoeng, n=100)
Tiende10% scoret underScore av 52 -> scoret bedre enn 10% av klassen
25. (Q1)25% scoret underScore på 64 -> bunnkvartilgrensen
50 (median)50% scoret underPoengsum 75 -> midten av fordelingen
75 (Q3)75% scoret underScore på 87 -> øverste kvartilgrens
Nettiende90% scoret underScore på 93 -> topp 10% av klassen
Den 99.99% scoret underScore på 99 -> topp 1%

En boks plot (boks-og-whisker plot) visualiserer denne informasjonen: boksen spenner Q1 til Q3 (IQR), en linje markerer medianen, og "whiskers" strekker seg til de minste/største ikke-outlier verdier. For eksempel, sammenligner testpoeng på tvers av tre skoler ved hjelp av tre side-by-side boks plotter umiddelbart viser hvilken skole har høyere median ytelse, som har mer spredning (indikerer inkonsekvent undervisning), og om noen skole har en klynge av outlier studenter som trenger støtte.

Trinn for trinn: Beregne gjennomsnitt, median og modus for hånd

La oss jobbe gjennom et komplett eksempel med et realistisk datasett: Månedlig salgstall (i tusen) for en liten bedrift over 12 måneder: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.

Trinn 1: Sortere dataene

Sortert oppover: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}

Trinn 2: Beregn gjennomsnittet

Sum = 38+38+42+44+48+48+52+55+57+61+63+75 = 621

n = 12, gjennomsnitt = 621 / 12 =51,75 (tusen)

Trinn 3: Finn medianen

n = 12 (også): gjennomsnittlig sjette og syvende verdi = (48 + 52) / 2 =50

Trinn 4: Identifiser modusen

Både 38 og 48 vises to ganger.{38, 48}(bimodale)

Trinn 5: Beregning av rekkevidde og standardavvik

Avstand = 75 - 38 =37

Avvik fra gjennomsnittet (51.75): (38-51.75) 2 = 189.06; (38-51.75) 2 = 189.06; (42-51.75) 2 = 95.06; (44-51.75) 2 = 60.06; (48-51.75) 2 = 14.06; (52-51.75) 2 = 0.06; (55-51.75) 2 = 10.56; (57-51.75) 2 = 27.56; (61-51.75) 2 = 85.56; (63-51.75) 2 = 126.56; (75-51.75) 2 = 540.56

Summen av kvadrert avvik = 1,352.25; Varians = 1,352.25/12 = 112.69; SD = √112.69 ~10.62

Tolkning

Denne virksomheten har gjennomsnittlig månedlig omsetning på $ 51,750 med en median på $ 50,000. Standardavviket på ~ $ 10,620 betyr at de fleste måneder faller innenfor +/- $ 10,620 av gjennomsnittet. Den bimodal distribusjon (to moduser) kan foreslå sesongmessige mønstre - sjekk om de to 38s og to 48s klynge i bestemte måneder. Den øverste outlier ($ 75,000 i en måned) trekker gjennomsnittet litt over medianen, noe som indikerer mild positiv skjevhet - sannsynligvis en eksepsjonell salgsmåned (ferie sesong, stor kontrakt, etc.).