Z-Score Calculator – Standard Score, Percentile & Probability
Calculate z-scores and convert to percentiles using the standard normal distribution. Try this free online math calculator for instant, accurate results.
Wat is een Z-score?
Een z-score (ook wel een standaard score genoemd) vertelt je precies hoeveel standaardafwijkingen een bepaalde waarde boven of onder de gemiddelde van zijn dataset ligt. De formule is eenvoudig: z = (x − μ) / σ, waarbij x de waargenomen waarde is, μ (mu) de populatiegemiddelde is en σ (sigma) de populatie-standaardafwijking is.
De kracht van z-scores ligt in de standaardisatie: door de raw-waarden om te zetten naar z-scores kun je metingen van volledig verschillende schalen vergelijken. Een student die 78 scoort op een biologie-examen (gemiddelde 70, SD 10) heeft een z = +0,8. Dezelfde student scoort 85 op een geschiedenis-examen (gemiddelde 80, SD 3,33) en heeft een z = +1,5. Hoewel de raw-score-onderscheid is, presteerde de student relatief beter in geschiedenis — een feit dat onzichtbaar is zonder z-score-conversie.
Z-scores zijn fundamenteel in statistiek, psychologie, onderwijs, geneeskunde en kwaliteitscontrole. Ze zijn rechtstreeks verbonden aan de waarschijnlijkheid onder de normale verdeling, waarmee je de percentage van een populatie boven, onder of tussen twee waarden kunt berekenen.
De standaardnormale verdeling en percentielen
Wanneer z-scores worden weergegeven, volgen ze de standaardnormale verdeling — een belvormige curve met gemiddelde = 0 en standaardafwijking = 1. De oppervlakte onder deze curve vertegenwoordigt de waarschijnlijkheid: de oppervlakte links van een z-score is gelijk aan het percentiel rang (het percentage van waarden dat onder die z-score ligt).
| Z-score | Percentiel | % Boven | Interpretatie |
|---|---|---|---|
| −3,0 | 0,13% | 99,87% | Extreem onder het gemiddelde |
| −2,0 | 2,28% | 97,72% | Goed onder het gemiddelde |
| −1,5 | 6,68% | 93,32% | Onder het gemiddelde |
| −1,0 | 15,87% | 84,13% | Slechts licht onder het gemiddelde |
| −0,5 | 30,85% | 69,15% | Laag gemiddelde |
| 0,0 | 50,00% | 50,00% | Exact op het gemiddelde |
| +0,5 | 69,15% | 30,85% | Hoog gemiddelde |
| +1,0 | 84,13% | 15,87% | Slechts licht boven het gemiddelde |
| +1,5 | 93,32% | 6,68% | Boven het gemiddelde |
| +2,0 | 97,72% | 2,28% | Goed boven het gemiddelde |
| +3,0 | 99,87% | 0,13% | Extreem boven het gemiddelde |
Deze percentielen komen van de cumulatieve verdelingsfunctie (CDF) van de normale verdeling. In de praktijk vind je ze op in een z-tabel of bereken je ze met software (Excel's NORM.S.DIST, Python's scipy.stats.norm.cdf of deze calculator).
De 68-95-99,7-regel (Empirische regel)
Een van de meest geciteerde feiten in statistiek, de empirische regel beschrijft het percentage van gegevens dat binnen 1, 2 en 3 standaardafwijkingen van het gemiddelde ligt in een normale verdeling:
- ±1σ (z tussen −1 en +1): 68,27% van de gegevens
- ±2σ (z tussen −2 en +2): 95,45% van de gegevens
- ±3σ (z tussen −3 en +3): 99,73% van de gegevens
Equivalent is slechts 5% van de normaal verdeelde gegevens meer dan 2 standaardafwijkingen van het gemiddelde, en slechts 0,27% (ongeveer 1 op 370) ligt meer dan 3 standaardafwijkingen. Dit is waarom ±2σ een gebruikelijke drempel is voor "significante afwijking van het gemiddelde" en ±3σ vlagt extreme uitschieters aan.
| Range | Gegevens Inclusief | Gegevens Uitgesloten | 1-op-N-rariteit |
|---|---|---|---|
| ±1σ | 68,27% | 31,73% | ~1 op 3 |
| ±2σ | 95,45% | 4,55% | ~1 op 22 |
| ±3σ | 99,73% | 0,27% | ~1 op 370 |
| ±4σ | 99,9937% | 0,0063% | ~1 op 15.787 |
| ±6σ | 99,9999998% | 0,0000002% | ~1 op 506.842.372 |
De zes Sigma-kwaliteitsbeheer streeft ernaar de productiefouten te verminderen tot minder dan 3,4 per miljoen kansen — een niveau dat aannemt dat 1,5σ procesverschuiving over tijd, waardoor het ongeveer gelijk is aan ±4,5σ. De aspiratie van "zes sigma" prestaties is om fouten statistisch onbeduidend te maken.
Z-Scores in Standardised Testen
Standardised tests — SAT, ACT, IQ-tests, GRE, GMAT — zijn ontworpen om scores te produceren die normaal verdeeld zijn en die kunnen worden omgezet in percentielen met behulp van z-scores. Dit maakt het mogelijk om te vergelijken over verschillende testvormen (die lichtelijk in moeilijkheidsgraad kunnen verschillen) en over jaren.
IQ-scores: Ontworpen met gemiddelde = 100 en standaarddeviatie = 15. Een IQ van 130 heeft z = (130−100)/15 = +2.0, wat de persoon plaatst op de 97,7ste percentiel. Een IQ van 145 heeft z = +3.0, wat hen plaatst op het 99,87ste percentiel (ongeveer 1 op 740 mensen).
SAT-scores: Elke sectie (Evidence-Based Reading/Writing en Math) heeft gemiddelde ~500 en SD ~100. Een wiskunde score van 680 heeft z = (680−500)/100 = +1.8, ongeveer het 96ste percentiel. Een gecombineerde score van 1400 (z ≈ +1.8–2.0) plaatst een student in ongeveer de top 5% van de testnemers.
| Test | Gemiddelde | SD | Score van 1σ boven gemiddelde | Percentiel |
|---|---|---|---|---|
| IQ | 100 | 15 | 115 | 84ste |
| SAT (elke sectie) | 500 | 100 | 600 | 84ste |
| ACT | 21 | 5 | 26 | 84ste |
| GRE Verbal | 150 | 8,5 | 158,5 | 84ste |
Z-Scores in Kwaliteitscontrole en Six Sigma
In de productie en kwaliteitscontrole worden z-scores gebruikt om de procescapaciteit te meten — hoe goed een productieproces voldoet aan specificaties. De procescapaciteit-index Cp en Cpk worden afgeleid van z-score-concepten.
Procescapaciteit: Als een procesgemiddelde is μ en de standaarddeviatie is σ, en specificaties vereisen dat de uitvoer tussen de onderste specificatiegrens (LSL) en de bovenste specificatiegrens (USL) valt, dan:
- zboven = (USL − μ) / σ
- zonder = (μ − LSL) / σ
- Cp = (USL − LSL) / (6σ) — meet de spreiding ten opzichte van de breedte van de specificatie
- Cpk = min(zboven, zonder) / 3 — rekent rekening met de procescentring
Een Cpk ≥ 1,33 is typisch vereist in de automobiel- en luchtvaartindustrie (equivalent aan ±4σ procescapaciteit). De medische apparatuurproductie vereist vaak Cpk ≥ 1,67 (±5σ). Het doel van "Six Sigma"-processen is Cpk = 2,0.
Z-Scores in Medische Referentieranges
Medische laboratoria rapporteren testresultaten ten opzichte van referentieranges, die typisch zijn gedefinieerd als de centrale 95% van een gezonde populatie — corresponderend met z-scores tussen −1,96 en +1,96. Een resultaat buiten deze range wordt als "anormaal" gemarkeerd, hoewel dit simpelweg betekent dat het statistisch ongewoon is, niet noodzakelijkerwijs klinisch bezorgd.
Botten dichtheid (DEXA-scan): Resultaten worden gerapporteerd als T-scores (vergelijking met jongvolwassen norm) en Z-scores (vergelijking met leeftijdsgematchte norm):
- T-score ≥ −1,0: Normaal
- T-score −1,0 tot −2,5: Osteopenie
- T-score < −2,5: Osteoporose
Groei-kaartjes: Kinderen's lengte, gewicht en hoofdomtrek worden weergegeven als z-scores ten opzichte van leeftijd- en geslachtsnormen. Een kind op de 50ste percentiel heeft z = 0; op de 97ste percentiel z = +1,88; op de 3de percentiel z = −1,88. Paediatrische z-score-cutoffs leiden tot voeding- en ontwikkelingsbeoordelingen.
Haematologie: Bloedtellingen (hemoglobine, witte cellen, bloedplaatjes) hebben referentieranges uitgedrukt als gemiddelde ± 2SD. Waarden buiten deze ranges activeren een klinische beoordeling, hoewel individuele variatie en laboratoriumverschillen betekenen dat klinisch context essentieel is.
Hypothese Testen en Z-Tests
Z-scores vormen de basis van het z-test, een van de meest gebruikte hypothese tests in de statistiek. Wanneer je test of een steekproefgemiddelde significant verschilt van een bekende populatiegemiddelde, bereken je:
z = (x̄ − μ₀) / (σ / √n)
waar x̄ het steekproefgemiddelde is, μ₀ het veronderstelde populatiegemiddelde is, σ de bekende populatiedeviatie is en n de steekproefgrootte is.
Als |z| > 1,96, is het resultaat statistisch significant op het niveau α = 0,05 (twee-taillen). Als |z| > 2,576, is het significant op α = 0,01. Deze kritische waarden komen rechtstreeks uit de normale verdeling: 95% van de verdeling valt binnen ±1,96 SD, en 99% binnen ±2,576 SD.
| Significatieniveau (α) | Kritische z-waarde (twee-taillen) | Interpretatie |
|---|---|---|
| 0,10 (10%) | ±1,645 | 90% vertrouwen |
| 0,05 (5%) | ±1,960 | 95% vertrouwen (standaard) |
| 0,01 (1%) | ±2,576 | 99% vertrouwen |
| 0,001 (0,1%) | ±3,291 | 99,9% vertrouwen |
Beperkingen van Z-Scores en Wanneer Ze Niet Te Gebruiken
Z-scores en percentielberekeningen die afgeleid zijn van ze, gaan ervan uit dat de onderliggende gegevens volgen een normale (Gaussische) verdeling. Veel reële datasets schenden deze aanname:
- Inkomsten en vermogen: Heel erg rechts onevenwichtig — het gemiddelde is veel hoger dan het mediane, en z-scores onderschatten dramatisch hoe zeldzaam extreem vermogen is.
- Financiële terugkeer: Heeft "dikke staarten" — extreme gebeurtenissen (marktcrashes, windfalls) voorkomen veel vaker dan een normale verdeling voorspelt. Modellen die z-scores gebruiken onderschatten de kans op de financiële crisis van 2008.
- Sociale media-metriek: Follower, likes en views volgen power-law-verdelingen, niet normale verdelingen. Z-scores zijn hier niet relevant.
- Kleine steekproeven: Met minder dan ~30 waarnemingen is de t-verdeling (met zwaardere staarten) meer geschikt dan de z-verdeling.
Voordat je z-score-analyse toepast, controleer altijd of je gegevens ongeveer normaal verdeeld zijn met behulp van histogrammen, Q-Q-plots of formele normaliteitsproeven (Shapiro-Wilk, Anderson-Darling). Als de gegevens niet normaal verdeeld zijn, overweeg transformaties (log, vierkantswortel) of niet-parametrische alternatieven.
Veelgestelde Vragen
Wat betekent een z-score van 1,5?
Een z-score van 1,5 betekent dat de waarde 1,5 standaardafwijkingen boven het gemiddelde ligt, wat ongeveer op de 93e percentiel staat. Ongeveer 93,3% van de waarden in een normale verdeling liggen onder deze punt, en 6,7% liggen erboven.
Wat is een goed z-score?
"Goed" hangt af van de context. Voor testresultaten of prestatie-indicatoren zijn hogere z-scores beter. Voor risicoindicator (cholesterol, bloeddruk) zijn z-scores dicht bij 0 gezond. In kwaliteitscontrole vlaggen z-scores buiten ±3 afwijkingen of uitschieters. Er is geen universeel "goed" z-score — het hangt af van wat wordt gemeten.
Hoe bereken ik een z-score?
Subtraheer het gemiddelde van uw waarde, en deel vervolgens door de standaardafwijking: z = (x − μ) / σ. Voorbeeld: score van 85, gemiddelde 70, SD 10 → z = (85−70)/10 = 1,5. Dit betekent dat de score 1,5 standaardafwijkingen boven het klasgemiddelde ligt.
Wat is de z-score voor het 95e percentiel?
De z-score die correspondeert met het 95e percentiel is ongeveer +1,645 (een-taillen). Dit is ook het kritieke waarde voor een een-taillen significatietest bij α = 0,05. Voor de twee-taillen 95% bereik (d.w.z. centrale 95% van de verdeling), zijn de grenzen ±1,96.
Kan een z-score negatief zijn?
Ja. Een negatieve z-score betekent dat de waarde onder het gemiddelde ligt. Een z-score van −1,0 betekent dat de waarde één standaardafwijking onder het gemiddelde ligt, op het 15,87e percentiel. Z-scores lopen op van −∞ tot +∞, hoewel waarden buiten ±4 zeer zeldzaam zijn in normaal verdeelde gegevens.
Wat is de verschillen tussen een z-score en een t-score?
Zowel z-score als t-score normaliseren gegevens ten opzichte van het gemiddelde en standaardafwijking. Een z-score veronderstelt dat de populatie-standaardafwijking (σ) bekend is. Een t-score (of t-statistiek) gebruikt de steekproef-standaardafwijking (s) als schatting wanneer σ onbekend is, en volgt de zwaardere-tailed t-verdeling. Voor grote steekproeven (n > 30) zijn t en z bijna identiek.
Hoe wordt z-score gebruikt in de financiën?
De Altman Z-score voorspelt de risico van faillissement van een onderneming met behulp van een gewogen combinatie van financiële verhoudingen. In risicomanagement meet z-scores hoeveel standaardafwijkingen een portefeuille-terugkeer is van nul (Value at Risk). In algoritme-trading identificeert z-scores van prijsverschillen kansen voor herstel (pairs trading).
Wat percentage van de gegevens valt binnen 2 standaardafwijkingen?
Ongeveer 95,45% van de gegevens valt binnen ±2σ van het gemiddelde in een normale verdeling (de empirische regel). De exacte waarde is 95,449%. Het complementaire 4,551% ligt buiten ±2σ — 2,275% in elke staart. Dit is de reden waarom ±2σ de standaarddrempel is voor "statistisch significant" in veel gebieden (α = 0,05, twee-taillen).
Hoe kan ik een z-score omzetten naar een percentiel?
Zoek de z-score op in een standaardnormale tabel (z-tabel), die de cumulatieve kans geeft. Vermenigvuldig met 100 voor het percentiel. Voorbeeld: z = 1,0 → 0,8413 → 84e percentiel. Alternatief, gebruik de formule: percentiel = Φ(z) × 100, waar Φ de standaardnormale CDF is. Excel: =NORM.S.DIST(z,WAAR)×100.
Wat wordt de z-score gebruikt voor in kwaliteitscontrole?
In Six Sigma kwaliteitsbeheer meet z-scores de procescapaciteit. Een proces dat loopt op ±3σ (z = 3) produceert 2.700 fouten per miljoen. Op ±6σ (z = 6) produceert het slechts 3,4 fouten per miljoen (rekening houdend met typische procesdrift). Cp- en Cpk-indices gebruiken direct z-score-concepten om te quantificeren hoe goed een proces aan specificaties voldoet.
Uitwijkdetectie met behulp van Z-scores
Een van de meest gangbare praktische toepassingen van z-scores is uitwijkdetectie — het identificeren van gegevenspunten die ongewoon ver van het gemiddelde liggen en mogelijk fouten, uitzonderlijke gebeurtenissen of echt uitzonderlijke waarnemingen vereisen die onderzocht moeten worden.
De standaarddrempel voor het markeren van uitwijken is |z| > 3. Waarden die meer dan 3 standaardafwijkingen van het gemiddelde liggen, worden in slechts 0,27% van de waarnemingen onder een normale verdeling verwacht — ongeveer 1 op de 370 gegevenspunten. In een dataset van 1.000 metingen zou je slechts ~3 waarden buiten ±3σ verwachten door toeval. Als je 20 dergelijke waarden vindt, gebeurt er iets ongewoons — apparatuur storing, invoerfouten of echt extreme waarnemingen.
Stricter criteria worden gebruikt in specifieke sectoren:
- Medische apparaten: Alarmdrempels bij ±2σ (5% alarmfrequentie) tot ±3σ (0,27% alarmfrequentie) afhankelijk van de klinische urgentie
- Financiële markten: "Dikke staart" gebeurtenissen buiten ±4σ voorkomen veel vaker dan een normale verdeling voorspelt — de financiële crisis van 2008 betrof bewegingen van 5-7σ die theoretisch "onmogelijk" waren onder normale verdeling aanname
- Kwaliteitscontrole: Waarden buiten ±3σ (fouten in het Six Sigma-framework) vereisen procesonderzoek en oorzakelijk onderzoek
- Wetenschappelijk onderzoek: De 5σ drempel (|z| > 5) is vereist voor het claimen van een deeltjesfysieke ontdekking (zoals de aankondiging van het Higgs-boson in 2012 bij CERN)
| Z-Score Drempel | % Gemarkeerd (normaal) | Gebruikt in |
|---|---|---|
| |z| > 2,0 | 4,55% | Initiële gegevenscontrole |
| |z| > 2,5 | 1,24% | Medische referentieniveaus |
| |z| > 3,0 | 0,27% | Kwaliteitscontrole, uitwijkdetectie |
| |z| > 4,0 | 0,0063% | Procesfoutanalyse |
| |z| > 5,0 | 0,00006% | Claim van deeltjesfysieke ontdekking |
Belangrijke opmerking: reële gegevens hebben vaak zwaardere staarten dan de normale verdeling voorspelt (leptokurtische verdelingen). Controleer uitwijken altijd handmatig — een z-score van 4 kan een invoerfout (48 geregistreerd als 4,8) of een echt uitzonderlijke waarde met belangrijke betekenis zijn. Verwijder uitwijken nooit automatisch zonder onderzoek.
Z-Scores in Finance en Risicomanagement
In de financiën heeft de z-score meerdere kritische toepassingen verdergaande de academische statistiek. De meest beroemde is de Altman Z-Score (1968), een faillissement voorspellende model dat vijf financiële verhoudingen combineert in een enkele discriminante score:
Z = 1,2×(Werking Kapitaal/Totaal Activa) + 1,4×(Behouden Winst/Totaal Activa) + 3,3×(EBIT/Totaal Activa) + 0,6×(Marktwaarde/Totaal Verplichtingen) + 1,0×(Omzet/Totaal Activa)
Altman Z-Score interpretatie: Z > 2,99 = Veilig gebied; 1,81–2,99 = Grijs gebied; Z < 1,81 = Distress gebied (hoog faillissement risico). Het model voorspelde faillissement correct in 94% van de gevallen in de oorspronkelijke studies en wordt breed gebruikt door kredietanalisten en beleggers vandaag de dag.
Waarde bij Risico (VaR): In portefeuille risicomanagement gebruikt VaR z-scores om potentiële verliezen te kwantificeren. De 1-daagse 95% VaR voor een portefeuille met dagelijkse terugkeer μ en standaarddeviatie σ is: VaR = −(μ + z × σ) waarbij z = −1,645 (de 5e percentiel). Als een $1M portefeuille heeft dagelijkse μ = 0% en σ = 1%, VaR bij 95% vertrouwen = 1,645% × $1M = $16.450. Dit betekent dat er een 5% kans is om meer dan $16.450 te verliezen in een enkele dag.
| Vertrouwensniveau | Z-Score Gebruikt | Interpretatie |
|---|---|---|
| 90% | −1,282 | Verlies overschreden 10% van de handelsdagen |
| 95% | −1,645 | Verlies overschreden 5% van de handelsdagen |
| 99% | −2,326 | Verlies overschreden 1% van de handelsdagen |
| 99,9% | −3,090 | Verlies overschreden 0,1% van de handelsdagen |
<h2>Z-Scores berekenen met monstergegevens</h2>
<p>Wanneer je werkt met een monster (in plaats van een bekende populatie), schat je de populatieparameters vanuit het monster. De monsterwaarde (x̄) schat μ, en de monsterspreiding (s) schat σ. De z-score formule blijft hetzelfde: z = (x − x̄) / s.</p>
<p>Met kleine monsters volgen de resulterende z-scores de t-verdeling (niet de normverdeling) vanwege de toegevoegde onzekerheid bij het schatten van σ. De t-verdeling heeft zwaardere staarten, weerspiegelt deze grotere onzekerheid. Voor monsters van 30 of meer zijn de t-verdeling en normverdeling bijna identiek, en z-scores van beide berekeningen zijn ongeveer gelijkwaardig.</p>
<p>Wanneer je een dataset hebt en je wilt alle waarden standaardiseren (de hele dataset omzetten in z-scores), heet dit <strong>feature scaling</strong> of <strong>standardisatie</strong> in machine learning. Het is een voorverwerkingsstap die alle kenmerken op dezelfde schaal zet (gemiddelde = 0, SD = 1), zodat kenmerken met grotere absolute waarden geen dominantie hebben over afstandsbasede algoritmen (KNN, SVM, neurale netwerken). Na standaardisatie zijn de z-scores van elk kenmerk direct vergelijkbaar ongeacht de oorspronkelijke eenheden of schaal.</p>
<p>Om een dataset te standaardiseren in Python: <code>from sklearn.preprocessing import StandardScaler; scaler = StandardScaler(); X_scaled = scaler.fit_transform(X)</code>. In Excel: voor elk waarde in een kolom, bereken <code>=STANDARDIZE(waarde, AVERAGE(range), STDEV(range))</code>.</p>