Calculator voor gemiddelde, mediaan en modus
Gebruik deze gratis online wiskundecalculator voor onmiddellijke, nauwkeurige resultaten.
Inzicht in de maatstaven van de centrale tendens
In de statistiek,maatstaven van centrale tendensDe drie belangrijkste zijn het gemiddelde, de mediaan en de modus -- elk vertelt je iets anders over de gegevens, en elk is het meest geschikt in verschillende situaties.
Beschouw deze dataset: testscores {55, 60, 70, 75, 75, 80, 95}. Elke maat geeft een ander perspectief:
| Maatregel | Waarde | Hoe berekend | Het beste voor |
|---|---|---|---|
| Gemiddelde | 72,9 | (55+60+70+75+75+80+95) / 7 | Symmetrische verdelingen |
| Mediane (middenwaarde) | 75 | Middelwaarde van gesorteerde gegevens | Verkeerde verdelingen, uitschieters |
| Modus (meest frequent) | 75 | Meest herhaalde waarde | Categorische gegevens, het vinden van pieken |
| Afstand | 40 | Max - Min = 95 - 55 | Meting van de spreiding |
Geen enkele maatstaf is universeel "beste". Een data-analist kiest de juiste maatstaf op basis van de vorm van de verdeling, de aanwezigheid van uitschieters en de vraag die wordt gesteld. Alle drie begrijpen - plus hun beperkingen - is fundamenteel voor statistische geletterdheid.
Het gemiddelde (arithmetisch gemiddelde): hoe berekent men het?
Derekenkundig gemiddeldeis de som van alle waarden gedeeld door het aantal waarden. Het is de meest gebruikte maatstaf van de centrale tendens en is wat de meeste mensen bedoelen als ze zeggen "gemiddelde".
Formule: gemiddeld (x̄) = (Σxi) / n
Waar Σxi de som van alle waarden is en n het aantal.
Voorbeeld:Gegevens = {3, 7, 8, 5, 12, 4, 9, 6}
- Som: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
- Aantal: 8 waarden
- Gemiddeld = 54 / 8 =6,75
Het gemiddelde is gevoelig voorbuitensporige waarden- extreme waarden trekken het gemiddelde naar zich toe. Als bijvoorbeeld één waarde in de bovenstaande verzameling 100 is in plaats van 12, zou het gemiddelde naar (54 - 12 + 100) / 8 = 142 / 8 = 17,75 springen, ver van de "typische" waarde van de resterende gegevens.
Andere soorten hulpmiddelen voor speciale doeleinden:
- Geometrisch gemiddelde:n√(x1 x x2 x ... x xn) -- gebruikt voor groeipercentages, rendementen, ratio's
- Harmonisch gemiddelde:n / (1/x1 + 1/x2 + ... + 1/xn) -- gebruikt voor snelheden, tarieven, prijzen per eenheid
- Gewichted gemiddelde:Σ(wixi) / Σwi -- gebruikt wanneer gegevenspunten van verschillend belang zijn (bv. GPA)
Mediane: de gemiddelde waarde
Demediaanis de middelste waarde van een gegevensverzameling, gesorteerd in oplopende volgorde, die de verdeling precies in tweeën verdeelt: 50% van de waarden ligt onder de mediaan en 50% boven.
Voor een oneven aantal waarden:Mediane = de (n+1) / 2e waarde.
Voor een even aantal waarden:Mediane = gemiddelde van de n/2 en (n/2 + 1) th waarden.
| Gegevensset | n | Gesorteerd | Mediane waarde |
|---|---|---|---|
| {4, 1, 9, 2, 6} | 5 (ongewoon) | {1, 2, 4, 6, 9} | 4 (3e waarde) |
| {7, 3, 8, 5} | 4 (even) | {3, 5, 7, 8} | (5+7)/2 = 6 |
| {10, 20, 30, 40} | 4 (even) | {10, 20, 30, 40} | (20+30)/2 = 25 |
| {1, 1, 1, 1000} | 4 (even) | {1, 1, 1, 1000} | (1+1)/2 = 1 |
Let op het laatste voorbeeld: het gemiddelde van {1, 1, 1, 1000} = 250,75, maar de mediaan = 1.mediane voorkeur boven gemiddelde voor scheve verdelingenmet buitensporige waarden - mediane inkomen, huizenprijzen en ziekenhuisverblijfsduur worden allemaal gerapporteerd als medianen omdat een paar extreem hoge waarden het gemiddelde niet representatief zouden maken voor de typische ervaring.
Modus: De meest voorkomende waarde
Demodusis de waarde die het meest voorkomt in een gegevensset.
- Geen modus:alle waarden worden even vaak weergegeven (bv. {1, 2, 3, 4, 5})
- Een modus (unimodal):één waarde verschijnt vaker dan alle andere (bijvoorbeeld {1, 2, 2, 3, 4} -> modus = 2)
- Twee modi (bimodaal):twee waarden gebonden voor de meest voorkomende (bijvoorbeeld {1, 1, 2, 3, 3} -> modi = 1 en 3)
- Meervoudige modus (multimodal):drie of meer waarden gebonden voor de meest voorkomende
De modus is in het bijzonder nuttig voor:
- Categorische gegevens:"Wat is de meest populaire schoenmaat?" (grootte 10 voor Amerikaanse mannen, bijvoorbeeld)
- Discrete gegevens:"Hoeveel kinderen hebben gezinnen doorgaans?" (vaak 2, de modus)
- Distributievorm:Een bimodale verdeling (twee pieken) suggereert twee verschillende subpopulaties in uw gegevens - een kritisch belangrijk signaal in exploratieve analyse
| Gegevensset | Modus | Soort |
|---|---|---|
| {1, 2, 3, 4, 5} | Geen | Geen modus |
| {2, 4, 4, 6, 8} | 4 | Unimodaal |
| {1, 1, 3, 5, 5} | 1 en 5 | Bimodal |
| {a, b, b, c, c, d, d} | b, c, d | Trimodal |
Verspreidingsgebied en andere maatstaven
Terwijl gemiddelde, mediaan en modus het centrum van een verdeling beschrijven,spreidingsmaatregelenZe zijn even belangrijk voor het begrijpen van een dataset.
| Maatregel | Formule | Voorbeeld {2, 4, 4, 6, 8} | Gevoeligheid voor buitensporige waarden |
|---|---|---|---|
| Afstand | Max - Min | 8 - 2 = 6 | Zeer gevoelig |
| Interkwartielbereik (IQR) | Q3 - Q1 | 7 - 3 = 4 | Resistent |
| Afwijking (σ2) | Σ ((xi - x̄) 2 / n | 3.44 | Gevoelig |
| Standaarddeviatie (σ) | √Variance | 1.855 | Gevoelig |
| Gemiddelde absolute afwijking | - Ik weet het niet . | 1 .6 | Gematigd |
Voor {2, 4, 4, 6, 8}: gemiddelde = 4.8, dus afwijkingen zijn: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24. variantie = (7.84+0.64+0.64+1.44+10.24)/5 = 20.8/5 = 4.16.
Standaarddeviatie is het werkpaard van de statistiek - het verschijnt in hypothese testen, betrouwbaarheidsintervallen, normale distributie berekeningen en procescontrole. Een lagere standaarddeviatie betekent dat gegevens worden geclusterd in de buurt van het gemiddelde; een hogere standaarddeviatie betekent dat gegevens meer verspreid zijn.
Wanneer de gemiddelde versus mediaan versus modus moet worden gebruikt
Het kiezen van de verkeerde maatstaf voor de centrale tendens kan misleidend zijn.
| Situatie | Aanbevolen maatregel | Waarom ? |
|---|---|---|
| Symmetrisch, geen uitschieters | Gemiddeld | Meest wiskundig bruikbaar; gebruikt alle gegevens |
| Verkeerde verdeling | Mediane waarde | Niet getrokken door extreme waarden |
| Inkomens / woningprijzen | Mediane waarde | Een paar miljonairs verdraaien het gemiddelde naar boven. |
| Categorische gegevens | Modus | Gemiddelde/mediane niet van toepassing op categorieën |
| Meest voorkomende waarde | Modus | Direct antwoord op "meest populair" |
| Gemiddelde cijfers / GPA | Gemiddelde (gewogen) | Alle scores dragen evenredig bij |
| Aandelenrendementen / groeipercentages | Geometrisch gemiddelde | Rekeningen voor compositie |
| Overlevingstijden, ziekenhuisopnames | Mediane waarde | Verkeerd naar rechts door langdurige gevallen |
De bekende opmerking: "De gemiddelde Amerikaan heeft één borst en één testikel" illustreert waarom het gemiddelde misleidend kan zijn voor bimodale distributies.
Voorbeelden uit de praktijk: gemiddelde, mediaan en modus in de praktijk
Inzicht in de toepassing van deze begrippen in reële situaties bouwt statistische intuïtie op:
- US huishoudelijk inkomen (2023):Het verschil weerspiegelt inkomensverschillen - een klein aantal zeer hoge verdieners trekt het gemiddelde dramatisch omhoog. Beleidsdiscussies gebruiken het mediane inkomen omdat het beter het "typische" huishouden vertegenwoordigt.
- De eindtijden van de lopende race:In een 10K-race kan de gemiddelde eindtijd hoger zijn dan de mediaan omdat langzame lopers een lange rechterstaart vormen.
- Klasse test scores:Als één leerling 5/100 scoort en twintig anderen 75 - 95/100, wordt het gemiddelde naar beneden getrokken door de buitensporige waarde.
- Schoenmaat:De modus is de meest bruikbare statistiek - detailhandelaren hebben de meeste voorraad in de modale (meest voorkomende) grootte.
- Kwaliteitscontrole:In de productie bepaalt de standaardafwijking van de productmetingen de procescapaciteit.
Vaak gestelde vragen
Wat is beter: gemiddeld of mediaan?
Geen van beide is universeel beter - ze dienen verschillende doeleinden. De mediaan is robuuster tegen buitensporige waarden en vertegenwoordigt beter "typisch" in scheve distributies (inkomen, huizenprijzen, overlevingstijden). Het gemiddelde gebruikt alle gegevenspunten, is wiskundig optimaal voor symmetrische distributies en is noodzakelijk voor verdere statistische berekeningen zoals standaardafwijking en hypothese-testing. Gebruik beide samen voor een compleet beeld.
Kan een dataset geen modus hebben?
Ja. Als alle waarden even vaak voorkomen, is er geen modus (bijvoorbeeld {1, 2, 3, 4, 5} - elke waarde verschijnt precies één keer). Een gegevensset kan ook multimodaal zijn - bimodaal (twee modi: {1, 1, 3, 3, 5}) of trimodaal. In de praktijk signaleert een bimodale verdeling vaak twee verschillende subgroepen in uw gegevens, wat een belangrijk patroon is om te onderzoeken.
Hoe vind ik de mediaan van een even aantal waarden?
Voor {2, 4, 6, 8}: de twee middelste waarden zijn 4 en 6, dus median = (4 + 6) / 2 = 5. Voor {1, 3, 5, 7, 9, 11}: de middelste waarden zijn 5 en 7, dus median = (5 + 7) / 2 = 6. De median hoeft geen waarde in de gegevensset te zijn.
Wat betekent het als gemiddelde = mediaan = modus?
Wanneer alle drie de metingen gelijk zijn, is de verdeling perfect symmetrisch en unimodaal - de klassieke klokkromme (normale verdeling). Dit betekent dat er geen uitschieters zijn die de gegevens skeeftrekken, en alle drie de metingen zijn even geldige beschrijvers van het centrum.
Wat is de relatie tussen gemiddelde, mediaan en scheefheid?
In een rechts gekantelde (positieve skew) verdeling: Mean > Median > Mode. In een links gekantelde (negatieve skew) verdeling: Mean < Median < Mode. In een symmetrische verdeling: Mean = Median ~ Mode. Deze relatie biedt een snelle visuele controle: vergelijk gemiddelde en median om de richting van de skew te bepalen zonder naar een grafiek te kijken.
Hoe berekent u het gemiddelde voor gegroepeerde gegevens?
Voor gegroepeerde frequentiegegevens wordt het middenpunt van elk klassinterval gebruikt: gemiddelde = Σ(middenpunt x frequentie) / n. Voorbeeld: als 10 studenten 50 - 60 scoorden (middenpunt 55), 15 scoorden 60 - 70 (middenpunt 65) en 5 scoorden 70 - 80 (middenpunt 75): gemiddelde = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.
Wat is het verschil tussen het populatiegemiddelde en het steekproefgemiddelde?
Het populatiegemiddelde (μ, "mu") wordt berekend van elk lid van de gehele populatie. Het steekproefgemiddelde (x̄, "x-bar") wordt berekend van een subset (sample) getrokken uit die populatie. De formule is identiek, maar de symbolen verschillen. In de praktijk werken we bijna altijd met steekproefgemiddelden en gebruiken ze om het populatiegemiddelde te schatten - wat steekproeffout introduceert en statistische inferentietechnieken vereist.
Hoe beïnvloedt een buitensporige waarde het gemiddelde versus de mediaan?
Bijvoorbeeld: gegevens {1, 2, 3, 4, 5} hebben een gemiddelde = 3 en een mediaan = 3. Het toevoegen van een buitensporige waarde {1, 2, 3, 4, 5, 100}: het gemiddelde springt naar 19,2 maar de mediaan verandert alleen naar (3 + 4) / 2 = 3,5. Deze robuustheid maakt de mediaan de voorkeursmaatregel wanneer buitensporige waarden aanwezig zijn of vermoed worden.
Wat is het gemiddeld?
Een trimmed mean verwijdert een vast percentage van de extreme waarden voordat het gemiddelde wordt berekend. Bijvoorbeeld een 10% trimmed mean op {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: verwijder de onderste en bovenste 10% (ongeveer 1 waarde elk), waardoor {2, 3, 4, 5, 6, 7, 8, 9} overblijft; mean = 5.5.
Hoe bereken ik het gewogen gemiddelde?
Voorbeeld - GPA berekening: Grade A (4.0) in een 3-credit cursus, Grade B (3.0) in een 4-credit cursus, Grade C (2.0) in een 2-credit cursus: GPA = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4)/9 = 28/9 ~ 3.11.
Samenvatting van beschrijvende statistieken: Wat u altijd nodig hebt
Een volledige beschrijvende statistische samenvatting voor elke gegevensset moet al het volgende bevatten. Dit is wat je zou rapporteren in een wetenschappelijk artikel, een zakelijke analyse of een academische opdracht:
| Statistiek | Symbool | Voorbeeld ({2,4,4,6,8,10}) | Interpretatie |
|---|---|---|---|
| Aantal | n | 6 | Hoeveel waarnemingen |
| Gemiddeld | x̄ | 5,67 jaar | Gemiddelde waarde |
| Mediane waarde | M | 5,0 | Middenwaarde (50e percentiel) |
| Modus | Mo | 4 | Meest voorkomende waarde |
| Afstand | R | 8 | Spread van min tot max |
| Standaarddeviatie | σ of s | 2,58 | Typische afwijking van het gemiddelde |
| Afwijkingen | σ² | 6,67 | SD kwadraat |
| Min / Max | — | 2 / 10 | Extreme waarden |
In academisch en wetenschappelijk werk, rapporteer altijd zowel een maat van centrum EN een maat van verspreiding. Het rapporteren van alleen het gemiddelde (of mediaan) zonder de standaardafwijking (of IQR) geeft een onvolledig beeld van uw gegevens. Een klas waar studenten een gemiddelde van 75% scoorden met SD = 5% is heel anders dan een met gemiddelde = 75% maar SD = 25% - de eerste is een strak cluster van B-graden, de tweede is een wild gemengde groep van falen tot bijna perfect.
Percentielen, kwartielen en boxplots
Naast gemiddelde, mediaan en modus, bevat een volledige statistische samenvatting vaak een percentielanalyse. Percentielen vertellen je welk deel van de gegevens onder een bepaalde waarde valt - essentieel voor het begrijpen van relatieve status, het identificeren van uitschieters en het vergelijken tussen populaties.
- Mediane = 50e percentiel:De helft van de gegevens ligt onder deze waarde.
- Q1 (Eerste kwartiel) = 25e percentiel:25% van de gegevens is lager dan Q1
- Q3 (derde kwartiel) = 75e percentiel:75% van de gegevens is lager dan Q3
- IQR (interkwartielbereik) = Q3 - Q1:Bevat de middelste 50% van de gegevens
- Outlier regel:Punten onder Q1 - 1,5xIQR of boven Q3 + 1,5xIQR worden als uitschieters beschouwd
| Percentiel | Betekenis | Voorbeeld (examenscores, n=100) |
|---|---|---|
| 10e | 10% met een score lager | Score van 52 -> scoorde beter dan 10% van de klas |
| 25e (Q1) | 25% scoorde lager | Score van 64 -> grens van het onderste kwartiel |
| 50e (median) | 50% met een score lager | Score van 75 -> midden van de verdeling |
| 75e (Q3) | 75% met een score lager | Score van 87 -> bovenste kwartielgrens |
| 90e | Minder dan 90% | Score van 93 -> top 10% van de klas |
| 99ste . | 99% scoorde beneden | Score van 99 -> top 1% |
Een box plot (box-and-whisker plot) visualiseert deze informatie: de box strekt zich uit over Q1 tot Q3 (de IQR), een lijn markeert de mediaan, en "whiskers" strekken zich uit tot de kleinste/grootste niet-afwijkende waarden. Bijvoorbeeld, het vergelijken van testscores over drie scholen met behulp van drie side-by-side boxplots laat onmiddellijk zien welke school een hogere mediaanprestatie heeft, welke meer verspreid is (indicatie van inconsistent onderwijs), en of een school een cluster van buitensporige studenten heeft die ondersteuning nodig hebben. Deze visuele dichtheid van statistische informatie in een compact display maakt boxplots een van de meest krachtige en onderbenutte hulpmiddelen in gegevenscommunicatie.
Stap voor stap: Gemiddelde, mediaan en modus met de hand berekenen
Laten we een volledig voorbeeld met een realistische dataset bekijken: maandelijkse verkoopcijfers (in duizenden) voor een klein bedrijf over 12 maanden: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.
Stap 1: Sorteren van de gegevens
Gesorteerd naar boven: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}
Stap 2: Bereken het gemiddelde
Som = 38+38+42+44+48+48+52+55+57+61+63+75 = 621
n = 12, gemiddelde = 621 / 12 =51,75 (duizend)
Stap 3: Zoek de mediaan
n = 12 (even): gemiddelde van de 6e en 7e waarden = (48 + 52) / 2 =50
Stap 4: Identificeer de modus
Zowel 38 als 48 verschijnen tweemaal.{38, 48}(bimodaal)
Stap 5: Berekeningsbereik en standaardafwijking
Range = 75 - 38 =37
Afwijkingen van het gemiddelde (51,75): (38-51,75) 2 = 189,06; (38-51,75) 2 = 189,06; (42-51,75) 2 = 95,06; (44-51,75) 2 = 60,06; (48-51,75) 2 = 14,06; (52-51,75) 2 = 0,06; (55-51,75) 2 = 10,56; (57-51,75) 2 = 27,56; (61-51,75) 2 = 85,56; (63-51,75) 2 = 126,56; (75-51,75) 2 = 540,56
Som van de kwadraat van de afwijkingen = 1.352,25; variantie = 1.352,25/12 = 112,69; SD = √112,69 ~10,62
Interpretatie
De standaardafwijking van ~ $ 10.620 betekent dat de meeste maanden binnen +/- $ 10.620 van het gemiddelde vallen. De bimodale verdeling (twee modi) kan seizoenspatronen suggereren - controleer of de twee 38's en twee 48's in specifieke maanden samenkomen. De hoogste uitschieter ($ 75.000 in een maand) trekt het gemiddelde iets boven de mediaan, wat wijst op een lichte positieve scheefheid - waarschijnlijk een uitzonderlijke verkoopmaand (vakantie, groot contract, enz.).