Skip to main content
🟢 Beginner 🔥 Popular

Gennemsnit, median og modusberegner

Brug denne gratis online matematiske lommeregner til øjeblikkelige, nøjagtige resultater.

Forstå centraltendensmålinger

I statistikken,målinger af central tendensDe tre vigtigste er gennemsnittet, medianen og modus -- hver fortæller dig noget anderledes om dataene, og hver er mest passende i forskellige situationer.

Tænk på dette datasæt: testresultater {55, 60, 70, 75, 75, 80, 95}.

ForanstaltningVærdiHvordan beregnesBedst til
Gennemsnitlig72,9(55+60+70+75+75+80+95) / 7Symmetriske fordelinger
Median (middelværdi)75Middelværdi af sorterede dataSkæv fordeling, outliers
Modus (mest almindelig)75Mest gentagne værdiKategoriske data, opsporing af toppe
Udstrækning40Max - Min = 95 - 55Måling af spredning

Ingen enkelt målestok er universelt "bedst". En dataanalytiker vælger den passende målestok baseret på fordelingsformen, tilstedeværelsen af outliers, og det spørgsmål, der bliver stillet. Forståelse af alle tre - plus deres begrænsninger - er grundlæggende for statistisk læsefærdighed.

Gennemsnit: Hvordan beregnes det?

Denaritmetisk middelværdier summen af alle værdier divideret med antallet af værdier. Det er det mest almindeligt anvendte mål for central tendens, og det er, hvad de fleste mennesker mener, når de siger "gennemsnit".

Formel: Mean (x̄) = (Σxi) / n

Hvor Σxi er summen af alle værdier, og n er antallet.

Eksempel:Data = {3, 7, 8, 5, 12, 4, 9, 6}

  1. Summe: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
  2. Antal: 8 værdier
  3. Mean = 54 / 8 =6,75

Gennemsnittet er følsomt forOutliersEksempelvis, hvis en værdi i ovenstående sæt var 100 i stedet for 12, ville middelværdien hoppe til (54 - 12 + 100) / 8 = 142 / 8 = 17,75, langt fra den "typiske" værdi af de resterende data.

Andre typer udstyr til særlige formål:

Median: Den midterste værdi

Denmedianer den midterste værdi af et datasæt, når det sorteres i stigende rækkefølge. Den deler fordelingen nøjagtigt i to: 50% af værdierne ligger under medianen og 50% over.

For et ulige antal værdier:Median = (n+1) / 2. værdi.

For et lige antal værdier:Median = gennemsnittet af værdierne for n/2 og (n/2 + 1) th.

DatasætnSorteretMedian
{4, 1, 9, 2, 6}5 (odd){1, 2, 4, 6, 9}4 (tredje værdi)
{7, 3, 8, 5}4 (også){3, 5, 7, 8}(5+7)/2 = 6
{10, 20, 30, 40}4 (også){10, 20, 30, 40}(20 + 30) / 2 = 25
{1, 1, 1, 1000}4 (også){1, 1, 1, 1000}(1+1)/2 = 1

Bemærk det sidste eksempel: gennemsnittet af {1, 1, 1, 1000} = 250,75, men medianen = 1.medianen foretrækkes frem for gennemsnittet for skæve fordelingermed udestående værdier - medianindkomst, boligpriser og hospitalsophold er alle rapporteret som medianer, fordi nogle få ekstremt høje værdier ville gøre gennemsnittet ikke repræsentativt for typisk erfaring.

Modus: Den hyppigste værdi

Denmoduser den værdi, der forekommer hyppigst i et datasæt.

Mode er særligt nyttigt for:

DatasætModusTyp
{1, 2, 3, 4, 5}IngenIngen tilstand
{2, 4, 4, 6, 8}4Unimodal
{1, 1, 3, 5, 5}1 og 5Bimodal
{a, b, b, c, c, d, d}b, c, dTrimodal

Område og andre målinger af spredning

Medens middelværdi, median og modus beskriver centrum af en fordeling,målinger af spredningDe er lige så vigtige for forståelsen af et datasæt.

ForanstaltningFormelEksempel {2, 4, 4, 6, 8}Følsomhed over for udestående værdier
UdstrækningMax - Min8 - 2 = 6Meget følsom
Interquartile Range (IQR)Q3 - Q17 - 3 = 4Resistente
Varians (σ2)Σ ((xi - x̄) 2 / n3.44Følsomme
Standardafvigelse (σ)√Varians1.855Følsomme
Gennemsnitlig absolut afvigelse- Jeg har ikke tid til det.1 .6Moderat

For {2, 4, 4, 6, 8}: gennemsnit = 4,8, så afvigelser er: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24.

En lavere standardafvigelse betyder, at data er grupperet tæt på gennemsnittet; en højere standardafvigelse betyder, at data er mere spredt ud.

Hvornår skal man bruge middelværdi vs. median vs.

Det kan være vildledende at vælge den forkerte målestok for den centrale tendens.

SituationenAnbefalet foranstaltningHvorfor?
Symmetrisk, ingen udestående værdierUheldigMest matematisk håndterbar; bruger alle data
Skæv fordelingMedianIkke trukket af ekstreme værdier
Indkomst / boligpriserMedianEt par millionærer skæv gennemsnittet opad
KategorioplysningerModusGennemsnit/median gælder ikke for kategorier
Mest almindelige værdierModusDirekte svar på "mest populære"
Gennemsnitlige karaktererGennemsnit (vægtet)Alle point bidrager proportionelt
Aktiernes afkast / vækstraterGeometrisk gennemsnitKonti for sammensat regnskab
Overlevelsestider, hospitalsopholdMedianTil højre for langvarige sager

Den velkendte observation: "Den gennemsnitlige amerikaner har et bryst og en testikel" illustrerer, hvorfor middelværdien kan være vildledende for bimodalfordelinger. I dette tilfælde er modus (adskilt efter køn) og medianen mere oplysende beskrivere end det samlede gennemsnit.

Eksempler fra virkeligheden: Gennemsnit, median og modus i praksis

Forståelsen af, hvordan disse begreber anvendes i virkelige situationer, bygger statistisk intuition:

Ofte stillede spørgsmål

Hvad er bedre: middel eller median?

Hverken er universelt bedre - de tjener forskellige formål. Medianen er mere robust mod outliers og bedre repræsenterer "typisk" i skæve fordelinger (indkomst, boligpriser, overlevelsestider).

Kan et datasæt ikke have nogen tilstand?

Ja. Hvis alle værdier forekommer lige ofte, er der ingen tilstand (f.eks. {1, 2, 3, 4, 5} - hver værdi vises præcis én gang). Et datasæt kan også være multimodal - bimodal (to tilstander: {1, 1, 3, 3, 5}) eller trimodal. I praksis signalerer en bimodal fordeling ofte to forskellige undergrupper i dine data, hvilket er et vigtigt mønster at undersøge.

Hvordan finder jeg medianen af et lige antal værdier?

For {2, 4, 6, 8}: de to midterste værdier er 4 og 6, så median = (4+6) / 2 = 5. For {1, 3, 5, 7, 9, 11}: midterste værdier er 5 og 7, så median = (5+7) / 2 = 6. Medianen behøver ikke være en værdi i datasættet.

Hvad betyder det, hvis gennemsnit = median = modus?

Når alle tre målinger er lige, er fordelingen perfekt symmetrisk og unimodal - den klassiske klokkekurve (normalfordeling). Dette betyder, at der ikke er nogen udstødende værdier, der skævner dataene, og alle tre målinger er lige gyldige beskrivere af centrum. I praksis opnår virkelige data sjældent perfekt symmetri, men tæt justering af middelværdi og median tyder på tilnærmet symmetri.

Hvad er forholdet mellem gennemsnit, median og skævhed?

I en højre skæv (positiv skæv) fordeling: Mean > Median > Mode. I en venstre skæv (negativ skæv) fordeling: Mean < Median < Mode. I en symmetrisk fordeling: Mean = Median ~ Mode. Dette forhold giver en hurtig visuel kontrol: sammenligne gennemsnit og median for at bestemme skævhedens retning uden at kigge på en graf.

Hvordan beregner man gennemsnittet for grupperede data?

Eksempel: Hvis 10 elever scorede 50 - 60 (midtpunkt 55), 15 scorede 60 - 70 (midtpunkt 65), og 5 scorede 70 - 80 (midtpunkt 75), er Mean = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.

Hvad er forskellen mellem befolknings- og stikprøvemiddelværdien?

Populationsgennemsnittet (μ, "mu") beregnes fra hvert medlem af hele populationen. Prøvegennemsnittet (x̄, "x-bar") beregnes fra en delmængde (prøve) trukket fra den pågældende population. Formlen er identisk, men symbolerne er forskellige. I praksis arbejder vi næsten altid med stikprøvegennemsnit og bruger dem til at estimere befolkningsgennemsnittet - hvilket introducerer stikprøvefejl og kræver statistiske inferensteknikker.

Hvordan påvirker en outlier gennemsnittet vs medianen?

Outliers påvirker stærkt middelværdien, men har minimal effekt på medianen. Eksempel: data {1, 2, 3, 4, 5} har middelværdien = 3 og medianen = 3. Tilføjelse af en outlier {1, 2, 3, 4, 5, 100}: middelværdien hopper til 19,2, men medianen ændrer sig kun til (3+4) / 2 = 3,5. Denne robusthed gør medianen til det foretrukne mål, når der er tilstede eller mistænkt for outliers.

Hvad er trimmet gennemsnit?

Et trimmet gennemsnit (eller trunceret gennemsnit) fjerner en fast procentdel af de ekstreme værdier før beregning af gennemsnittet. For eksempel, et 10% trimmet gennemsnit på {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: fjerner den nederste og øverste 10% (ca. 1 værdi hver), og efterlader {2, 3, 4, 5, 6, 7, 8, 9}; gennemsnit = 5,5. Trimmet middel bruges i scoring systemer (Olympisk dømmekraft, skøjteløb) og økonomisk statistik til at reducere outlier indflydelse, mens beholde flere data end medianen.

Hvordan beregner jeg det vægtede gennemsnit?

Vægtet gennemsnit = Σ ((vægt x værdi) / Σ ((vægt). Eksempel: GPA-beregning: Grade A (4.0) i et 3-kredit kursus, Grade B (3.0) i et 4-kredit kursus, Grade C (2.0) i et 2-kredit kursus: Vægtet GPA = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4)/9 = 28/9 ~ 3.11. Uden vægtning ville det enkle gennemsnit være (4+3+2)/3 = 3.0 - mangler den tungere indflydelse af 4-kredit kurset.

Resumé af beskrivende statistikker: Hvad du altid har brug for

En komplet beskrivende statistisk oversigt for ethvert datasæt bør indeholde alt det følgende. Dette er, hvad du ville rapportere i et videnskabeligt papir, forretningsanalyse eller akademisk opgave:

StatistiskSymbolEksempel {2,4,4,6,8,10}Tolkning
Antaln6Hvor mange observationer
Uheldig5.67Gennemsnitlig værdi
MedianM5,0Middelværdi (50:e percentil)
ModusMo4Ofte forekommende værdi
UdstrækningR8Udbredelse fra min til max
Standardafvigelseσ eller s2,58Typisk afvigelse fra gennemsnittet
Afvigelseσ²6,67SD i anden
Min / Max2 / 10Ekstreme værdier

En klasse, hvor eleverne scorede et gennemsnit på 75% med SD = 5% er meget forskellig fra en med gennemsnit = 75%, men SD = 25% - den første er en tæt klynge af B karakterer, den anden er en vildt blandet gruppe fra at fejle til næsten perfekt.

Percentiler, kvartiler og boxplotter

Ud over middelværdi, median og modus, indeholder et komplet statistisk resumé ofte percentilanalyse. Percentiler fortæller dig, hvilken brøkdel af data, der falder under en given værdi - essentiel for at forstå relativ stilling, identificere outliers, og sammenligne på tværs af populationer.

PercentilBetydningEksempel (eksamensresultater, n=100)
Tiende10% scorede underScore på 52 -> scorede bedre end 10% af klassen
25. (Q1)25% scorede underScore på 64 -> bundkvartilgrænse
50 (median)50% scorede underScore på 75 -> midten af fordelingen
75. (Q3)75% scorede underScore på 87 -> den øverste kvartilgrænse
90'ende90% scoret underScore på 93 -> top 10% af klassen
Den 99.99% scorede underScore på 99 -> top 1%

En kasse plot (kasse-og-whisker plot) visualiserer denne information: kassen spænder Q1 til Q3 (IQR), en linje markerer medianen, og "whiskers" strækker sig til de mindste/største ikke-outlier værdier. For eksempel viser sammenligning af testresultater på tværs af tre skoler ved hjælp af tre side-by-side-boksplotter straks, hvilken skole der har højere median ydeevne, som har mere spredning (hvilket indikerer inkonsekvent undervisning), og om nogen skole har en klynge af outlier-elever, der har brug for støtte.

Trin for trin: Beregning af middelværdi, median og modus i hånden

Lad os gennemgå et komplet eksempel med et realistisk datasæt: Månedlige salgstal (i tusinder) for en lille virksomhed over 12 måneder: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.

Trin 1: Sortere dataene

Sorteret i opadgående rækkefølge: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}

Trin 2: Beregn gennemsnittet

Summe = 38+38+42+44+48+48+52+55+57+61+63+75 = 621

n = 12, gennemsnit = 621 / 12 =51,75 (tusind)

Trin 3: Find medianen

n = 12 (lige): gennemsnit af 6. og 7. værdi = (48 + 52) / 2 =50

Trin 4: Identificer modus

Både 38 og 48 vises to gange.{38, 48}(bimodale)

Trin 5: Beregning af rækkevidde og standardafvigelse

Område = 75 - 38 =37

Afvigelser fra gennemsnittet (51,75): (38-51,75) 2 = 189,06; (38-51,75) 2 = 189,06; (42-51,75) 2 = 95,06; (44-51,75) 2 = 60,06; (48-51,75) 2 = 14,06; (52-51,75) 2 = 0,06; (55-51,75) 2 = 10,56; (57-51,75) 2 = 27,56; (61-51,75) 2 = 85,56; (63-51,75) 2 = 126,56; (75-51,75) 2 = 540,56

Summen af kvadratiske afvigelser = 1.352,25; Varians = 1.352,25/12 = 112,69; SD = √112,69 ~10.62

Tolkning

Denne forretning har et gennemsnitligt månedligt salg på $ 51.750 med en median på $ 50.000. Standardafvigelsen på ~ $ 10.620 betyder, at de fleste måneder falder inden for +/- $ 10.620 af gennemsnittet. Den bimodale fordeling (to måder) kan foreslå sæsonmæssige mønstre - tjek, om de to 38'ere og to 48'ere klynger sig i bestemte måneder. Den øverste outlier ($ 75.000 i en måned) trækker gennemsnittet lidt over medianen, hvilket indikerer mild positiv skævhed - sandsynligvis en ekstraordinær salgsmåned (ferie sæson, stor kontrakt osv.).

},{"@type":"Spørgsmål","navn":"Kan et datasæt ikke have en modus?","acceptedAnswer":{"@type":"Answer","text":"Ja. Hvis alle værdier forekommer lige ofte, er der ingen modus. Et datasæt kan også være multimodalt - med to tilstande (bimodal) eller mere. Eksempel: {1, 1, 2, 3, 3} er bimodal med tilstande 1 og 3."}},{"@type":"Spørgsmål","navn":"Hvordan finder jeg medianen af et lige antal værdier?","acceptedAnswer":{"@type:"Answer","text":"Sort værdierne, og gennemsnit derefter de to mellemliggende tal. For {2, 4, 6, 8}: mellemværdier er 4 og 6, så medianen = (4/26) = 5."}}}]