Skip to main content
🟢 Beginner 🔥 Popular

Calculator voor gemiddelde, mediaan en modus

Gebruik deze gratis online wiskundecalculator voor onmiddellijke, nauwkeurige resultaten.

Inzicht in de maatstaven van de centrale tendens

In de statistiek,maatstaven van centrale tendensDe drie belangrijkste zijn het gemiddelde, de mediaan en de modus -- elk vertelt je iets anders over de gegevens, en elk is het meest geschikt in verschillende situaties.

Beschouw deze dataset: testscores {55, 60, 70, 75, 75, 80, 95}. Elke maat geeft een ander perspectief:

MaatregelWaardeHoe berekendHet beste voor
Gemiddelde72,9(55+60+70+75+75+80+95) / 7Symmetrische verdelingen
Mediane (middenwaarde)75Middelwaarde van gesorteerde gegevensVerkeerde verdelingen, uitschieters
Modus (meest frequent)75Meest herhaalde waardeCategorische gegevens, het vinden van pieken
Afstand40Max - Min = 95 - 55Meting van de spreiding

Geen enkele maatstaf is universeel "beste". Een data-analist kiest de juiste maatstaf op basis van de vorm van de verdeling, de aanwezigheid van uitschieters en de vraag die wordt gesteld. Alle drie begrijpen - plus hun beperkingen - is fundamenteel voor statistische geletterdheid.

Het gemiddelde (arithmetisch gemiddelde): hoe berekent men het?

Derekenkundig gemiddeldeis de som van alle waarden gedeeld door het aantal waarden. Het is de meest gebruikte maatstaf van de centrale tendens en is wat de meeste mensen bedoelen als ze zeggen "gemiddelde".

Formule: gemiddeld (x̄) = (Σxi) / n

Waar Σxi de som van alle waarden is en n het aantal.

Voorbeeld:Gegevens = {3, 7, 8, 5, 12, 4, 9, 6}

  1. Som: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
  2. Aantal: 8 waarden
  3. Gemiddeld = 54 / 8 =6,75

Het gemiddelde is gevoelig voorbuitensporige waarden- extreme waarden trekken het gemiddelde naar zich toe. Als bijvoorbeeld één waarde in de bovenstaande verzameling 100 is in plaats van 12, zou het gemiddelde naar (54 - 12 + 100) / 8 = 142 / 8 = 17,75 springen, ver van de "typische" waarde van de resterende gegevens.

Andere soorten hulpmiddelen voor speciale doeleinden:

Mediane: de gemiddelde waarde

Demediaanis de middelste waarde van een gegevensverzameling, gesorteerd in oplopende volgorde, die de verdeling precies in tweeën verdeelt: 50% van de waarden ligt onder de mediaan en 50% boven.

Voor een oneven aantal waarden:Mediane = de (n+1) / 2e waarde.

Voor een even aantal waarden:Mediane = gemiddelde van de n/2 en (n/2 + 1) th waarden.

GegevenssetnGesorteerdMediane waarde
{4, 1, 9, 2, 6}5 (ongewoon){1, 2, 4, 6, 9}4 (3e waarde)
{7, 3, 8, 5}4 (even){3, 5, 7, 8}(5+7)/2 = 6
{10, 20, 30, 40}4 (even){10, 20, 30, 40}(20+30)/2 = 25
{1, 1, 1, 1000}4 (even){1, 1, 1, 1000}(1+1)/2 = 1

Let op het laatste voorbeeld: het gemiddelde van {1, 1, 1, 1000} = 250,75, maar de mediaan = 1.mediane voorkeur boven gemiddelde voor scheve verdelingenmet buitensporige waarden - mediane inkomen, huizenprijzen en ziekenhuisverblijfsduur worden allemaal gerapporteerd als medianen omdat een paar extreem hoge waarden het gemiddelde niet representatief zouden maken voor de typische ervaring.

Modus: De meest voorkomende waarde

Demodusis de waarde die het meest voorkomt in een gegevensset.

De modus is in het bijzonder nuttig voor:

GegevenssetModusSoort
{1, 2, 3, 4, 5}GeenGeen modus
{2, 4, 4, 6, 8}4Unimodaal
{1, 1, 3, 5, 5}1 en 5Bimodal
{a, b, b, c, c, d, d}b, c, dTrimodal

Verspreidingsgebied en andere maatstaven

Terwijl gemiddelde, mediaan en modus het centrum van een verdeling beschrijven,spreidingsmaatregelenZe zijn even belangrijk voor het begrijpen van een dataset.

MaatregelFormuleVoorbeeld {2, 4, 4, 6, 8}Gevoeligheid voor buitensporige waarden
AfstandMax - Min8 - 2 = 6Zeer gevoelig
Interkwartielbereik (IQR)Q3 - Q17 - 3 = 4Resistent
Afwijking (σ2)Σ ((xi - x̄) 2 / n3.44Gevoelig
Standaarddeviatie (σ)√Variance1.855Gevoelig
Gemiddelde absolute afwijking- Ik weet het niet .1 .6Gematigd

Voor {2, 4, 4, 6, 8}: gemiddelde = 4.8, dus afwijkingen zijn: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24. variantie = (7.84+0.64+0.64+1.44+10.24)/5 = 20.8/5 = 4.16.

Standaarddeviatie is het werkpaard van de statistiek - het verschijnt in hypothese testen, betrouwbaarheidsintervallen, normale distributie berekeningen en procescontrole. Een lagere standaarddeviatie betekent dat gegevens worden geclusterd in de buurt van het gemiddelde; een hogere standaarddeviatie betekent dat gegevens meer verspreid zijn.

Wanneer de gemiddelde versus mediaan versus modus moet worden gebruikt

Het kiezen van de verkeerde maatstaf voor de centrale tendens kan misleidend zijn.

SituatieAanbevolen maatregelWaarom ?
Symmetrisch, geen uitschietersGemiddeldMeest wiskundig bruikbaar; gebruikt alle gegevens
Verkeerde verdelingMediane waardeNiet getrokken door extreme waarden
Inkomens / woningprijzenMediane waardeEen paar miljonairs verdraaien het gemiddelde naar boven.
Categorische gegevensModusGemiddelde/mediane niet van toepassing op categorieën
Meest voorkomende waardeModusDirect antwoord op "meest populair"
Gemiddelde cijfers / GPAGemiddelde (gewogen)Alle scores dragen evenredig bij
Aandelenrendementen / groeipercentagesGeometrisch gemiddeldeRekeningen voor compositie
Overlevingstijden, ziekenhuisopnamesMediane waardeVerkeerd naar rechts door langdurige gevallen

De bekende opmerking: "De gemiddelde Amerikaan heeft één borst en één testikel" illustreert waarom het gemiddelde misleidend kan zijn voor bimodale distributies.

Voorbeelden uit de praktijk: gemiddelde, mediaan en modus in de praktijk

Inzicht in de toepassing van deze begrippen in reële situaties bouwt statistische intuïtie op:

Vaak gestelde vragen

Wat is beter: gemiddeld of mediaan?

Geen van beide is universeel beter - ze dienen verschillende doeleinden. De mediaan is robuuster tegen buitensporige waarden en vertegenwoordigt beter "typisch" in scheve distributies (inkomen, huizenprijzen, overlevingstijden). Het gemiddelde gebruikt alle gegevenspunten, is wiskundig optimaal voor symmetrische distributies en is noodzakelijk voor verdere statistische berekeningen zoals standaardafwijking en hypothese-testing. Gebruik beide samen voor een compleet beeld.

Kan een dataset geen modus hebben?

Ja. Als alle waarden even vaak voorkomen, is er geen modus (bijvoorbeeld {1, 2, 3, 4, 5} - elke waarde verschijnt precies één keer). Een gegevensset kan ook multimodaal zijn - bimodaal (twee modi: {1, 1, 3, 3, 5}) of trimodaal. In de praktijk signaleert een bimodale verdeling vaak twee verschillende subgroepen in uw gegevens, wat een belangrijk patroon is om te onderzoeken.

Hoe vind ik de mediaan van een even aantal waarden?

Voor {2, 4, 6, 8}: de twee middelste waarden zijn 4 en 6, dus median = (4 + 6) / 2 = 5. Voor {1, 3, 5, 7, 9, 11}: de middelste waarden zijn 5 en 7, dus median = (5 + 7) / 2 = 6. De median hoeft geen waarde in de gegevensset te zijn.

Wat betekent het als gemiddelde = mediaan = modus?

Wanneer alle drie de metingen gelijk zijn, is de verdeling perfect symmetrisch en unimodaal - de klassieke klokkromme (normale verdeling). Dit betekent dat er geen uitschieters zijn die de gegevens skeeftrekken, en alle drie de metingen zijn even geldige beschrijvers van het centrum.

Wat is de relatie tussen gemiddelde, mediaan en scheefheid?

In een rechts gekantelde (positieve skew) verdeling: Mean > Median > Mode. In een links gekantelde (negatieve skew) verdeling: Mean < Median < Mode. In een symmetrische verdeling: Mean = Median ~ Mode. Deze relatie biedt een snelle visuele controle: vergelijk gemiddelde en median om de richting van de skew te bepalen zonder naar een grafiek te kijken.

Hoe berekent u het gemiddelde voor gegroepeerde gegevens?

Voor gegroepeerde frequentiegegevens wordt het middenpunt van elk klassinterval gebruikt: gemiddelde = Σ(middenpunt x frequentie) / n. Voorbeeld: als 10 studenten 50 - 60 scoorden (middenpunt 55), 15 scoorden 60 - 70 (middenpunt 65) en 5 scoorden 70 - 80 (middenpunt 75): gemiddelde = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.

Wat is het verschil tussen het populatiegemiddelde en het steekproefgemiddelde?

Het populatiegemiddelde (μ, "mu") wordt berekend van elk lid van de gehele populatie. Het steekproefgemiddelde (x̄, "x-bar") wordt berekend van een subset (sample) getrokken uit die populatie. De formule is identiek, maar de symbolen verschillen. In de praktijk werken we bijna altijd met steekproefgemiddelden en gebruiken ze om het populatiegemiddelde te schatten - wat steekproeffout introduceert en statistische inferentietechnieken vereist.

Hoe beïnvloedt een buitensporige waarde het gemiddelde versus de mediaan?

Bijvoorbeeld: gegevens {1, 2, 3, 4, 5} hebben een gemiddelde = 3 en een mediaan = 3. Het toevoegen van een buitensporige waarde {1, 2, 3, 4, 5, 100}: het gemiddelde springt naar 19,2 maar de mediaan verandert alleen naar (3 + 4) / 2 = 3,5. Deze robuustheid maakt de mediaan de voorkeursmaatregel wanneer buitensporige waarden aanwezig zijn of vermoed worden.

Wat is het gemiddeld?

Een trimmed mean verwijdert een vast percentage van de extreme waarden voordat het gemiddelde wordt berekend. Bijvoorbeeld een 10% trimmed mean op {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: verwijder de onderste en bovenste 10% (ongeveer 1 waarde elk), waardoor {2, 3, 4, 5, 6, 7, 8, 9} overblijft; mean = 5.5.

Hoe bereken ik het gewogen gemiddelde?

Voorbeeld - GPA berekening: Grade A (4.0) in een 3-credit cursus, Grade B (3.0) in een 4-credit cursus, Grade C (2.0) in een 2-credit cursus: GPA = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4)/9 = 28/9 ~ 3.11.

Samenvatting van beschrijvende statistieken: Wat u altijd nodig hebt

Een volledige beschrijvende statistische samenvatting voor elke gegevensset moet al het volgende bevatten. Dit is wat je zou rapporteren in een wetenschappelijk artikel, een zakelijke analyse of een academische opdracht:

StatistiekSymboolVoorbeeld ({2,4,4,6,8,10})Interpretatie
Aantaln6Hoeveel waarnemingen
Gemiddeld5,67 jaarGemiddelde waarde
Mediane waardeM5,0Middenwaarde (50e percentiel)
ModusMo4Meest voorkomende waarde
AfstandR8Spread van min tot max
Standaarddeviatieσ of s2,58Typische afwijking van het gemiddelde
Afwijkingenσ²6,67SD kwadraat
Min / Max2 / 10Extreme waarden

In academisch en wetenschappelijk werk, rapporteer altijd zowel een maat van centrum EN een maat van verspreiding. Het rapporteren van alleen het gemiddelde (of mediaan) zonder de standaardafwijking (of IQR) geeft een onvolledig beeld van uw gegevens. Een klas waar studenten een gemiddelde van 75% scoorden met SD = 5% is heel anders dan een met gemiddelde = 75% maar SD = 25% - de eerste is een strak cluster van B-graden, de tweede is een wild gemengde groep van falen tot bijna perfect.

Percentielen, kwartielen en boxplots

Naast gemiddelde, mediaan en modus, bevat een volledige statistische samenvatting vaak een percentielanalyse. Percentielen vertellen je welk deel van de gegevens onder een bepaalde waarde valt - essentieel voor het begrijpen van relatieve status, het identificeren van uitschieters en het vergelijken tussen populaties.

PercentielBetekenisVoorbeeld (examenscores, n=100)
10e10% met een score lagerScore van 52 -> scoorde beter dan 10% van de klas
25e (Q1)25% scoorde lagerScore van 64 -> grens van het onderste kwartiel
50e (median)50% met een score lagerScore van 75 -> midden van de verdeling
75e (Q3)75% met een score lagerScore van 87 -> bovenste kwartielgrens
90eMinder dan 90%Score van 93 -> top 10% van de klas
99ste .99% scoorde benedenScore van 99 -> top 1%

Een box plot (box-and-whisker plot) visualiseert deze informatie: de box strekt zich uit over Q1 tot Q3 (de IQR), een lijn markeert de mediaan, en "whiskers" strekken zich uit tot de kleinste/grootste niet-afwijkende waarden. Bijvoorbeeld, het vergelijken van testscores over drie scholen met behulp van drie side-by-side boxplots laat onmiddellijk zien welke school een hogere mediaanprestatie heeft, welke meer verspreid is (indicatie van inconsistent onderwijs), en of een school een cluster van buitensporige studenten heeft die ondersteuning nodig hebben. Deze visuele dichtheid van statistische informatie in een compact display maakt boxplots een van de meest krachtige en onderbenutte hulpmiddelen in gegevenscommunicatie.

Stap voor stap: Gemiddelde, mediaan en modus met de hand berekenen

Laten we een volledig voorbeeld met een realistische dataset bekijken: maandelijkse verkoopcijfers (in duizenden) voor een klein bedrijf over 12 maanden: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.

Stap 1: Sorteren van de gegevens

Gesorteerd naar boven: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}

Stap 2: Bereken het gemiddelde

Som = 38+38+42+44+48+48+52+55+57+61+63+75 = 621

n = 12, gemiddelde = 621 / 12 =51,75 (duizend)

Stap 3: Zoek de mediaan

n = 12 (even): gemiddelde van de 6e en 7e waarden = (48 + 52) / 2 =50

Stap 4: Identificeer de modus

Zowel 38 als 48 verschijnen tweemaal.{38, 48}(bimodaal)

Stap 5: Berekeningsbereik en standaardafwijking

Range = 75 - 38 =37

Afwijkingen van het gemiddelde (51,75): (38-51,75) 2 = 189,06; (38-51,75) 2 = 189,06; (42-51,75) 2 = 95,06; (44-51,75) 2 = 60,06; (48-51,75) 2 = 14,06; (52-51,75) 2 = 0,06; (55-51,75) 2 = 10,56; (57-51,75) 2 = 27,56; (61-51,75) 2 = 85,56; (63-51,75) 2 = 126,56; (75-51,75) 2 = 540,56

Som van de kwadraat van de afwijkingen = 1.352,25; variantie = 1.352,25/12 = 112,69; SD = √112,69 ~10,62

Interpretatie

De standaardafwijking van ~ $ 10.620 betekent dat de meeste maanden binnen +/- $ 10.620 van het gemiddelde vallen. De bimodale verdeling (twee modi) kan seizoenspatronen suggereren - controleer of de twee 38's en twee 48's in specifieke maanden samenkomen. De hoogste uitschieter ($ 75.000 in een maand) trekt het gemiddelde iets boven de mediaan, wat wijst op een lichte positieve scheefheid - waarschijnlijk een uitzonderlijke verkoopmaand (vakantie, groot contract, enz.).