Standaardafwijkingscalculator
Bereken standaarddeviatie, variantie, gemiddelde en meer voor elke gegevensset. Ondersteunt zowel populatie- als steekproefberekeningen. Gratis stapsgewijze oplossing.
Wat is standaarddeviatie en waarom is het belangrijk?
Maatregelen voor standaardafwijkingenhoe verspreid uw gegevens zijn rond het gemiddelde (gemiddeld)Een kleine standaardafwijking betekent dat de waarden dicht bij het gemiddelde liggen; een grote standaardafwijking betekent dat de waarden wijd verspreid zijn.
Twee datasets kunnen hetzelfde gemiddelde hebben, maar compleet verschillende verdelingen -- de standaardafwijking vangt dat verschil op:
- Dataset A: {9, 10, 10, 11, 10} -- Gemiddeld = 10, SD ~ 0,63 (dichte cluster)
- Dataset B: {2, 5, 10, 15, 18} -- Gemiddeld = 10, SD ~ 5,83 (breed verspreid)
Beide hebben een gemiddelde van 10, maar Dataset B is bijna 10x meer variabel.
De standaardafwijking wordt aangeduid alsσ (sigma)voor een populatie ensHet is de vierkantswortel van variantie, uitgedrukt in dezelfde eenheden als de oorspronkelijke gegevens, waardoor het interpretatiever is dan variantie alleen.
Toepassingen omvatten bijna elk gebied: kwaliteitscontrole (worden onderdelen consistent binnen de tolerantie geproduceerd?), financiën (investeringsrisico = rendementsvolatiliteit), geneeskunde (is het lezen van een patiënt binnen 2 SD van normaal?), onderwijs (hoe worden testscores verdeeld?), en sportanalyse (hoe consistent is de prestatie van een atleet?).
Populatie versus steekproefstandaardafwijking
De belangrijkste keuze bij het berekenen van de standaardafwijking is of je werkt met eenbevolking(alle mogelijke gegevenspunten) of eensteekproefDit bepaalt welke formule moet worden gebruikt en beïnvloedt het resultaat.
Standaarddeviatie van de populatie (σ):Gebruik deze formule als je gegevens hebt voor de hele groep die je bestudeert.
Waar: μ = populatiegemiddelde, N = aantal waarden, Σ = som van alle waarden.
Standaarddeviatie (s) van het monster:Formule: s = √[Σ(xi - x̄) 2 / (n-1) ]
Waar: x̄ = steekproefgemiddelde, n = aantal waarden in steekproef, (n-1) =Correctie van Bessel.
De correctie van Bessel wordt gedeeld door (n-1) in plaats van n, omdat steekproeven de neiging hebben om de werkelijke variantie van de populatie te onderschatten - vooral voor kleine steekproeven.onbevooroordeelde schatervan de populatievariantie.
Welke te gebruiken?
- Bevolking SD:Je hebt gegevens voor alle studenten in een specifieke klas, alle testscores van een specifiek examen, alle werknemers van één bedrijf.
- Voorbeeld SD:Je onderzocht 500 Amerikanen over inkomen (afgeleid van alle Amerikanen); je meette 30 widgets van een productie run (afgeleid van alle widgets); elke wetenschappelijke studie met een steekproef.
Stap voor stap berekening van de standaardafwijking
Laten we een compleet voorbeeld met reële getallen bekijken:
Dataset:Resultaten van 6 studenten: {72, 85, 91, 68, 79, 88}
Stap 1 - Bepaal het gemiddelde:(72 + 85 + 91 + 68 + 79 + 88) / 6 = 483 / 6 =80,5
Stap 2 - Zoek elke afwijking van het gemiddelde en kwadraat het:
| Score (xi) | Afwijking (xi - x̄) | Vierkant (xi - x̄) 2 |
|---|---|---|
| 72 | 72 - 80,5 = -8,5 | 72,25 |
| 85 | 85 - 80,5 = +4,5 | 20,25 jaar |
| 91 | 91 - 80,5 = +10,5 | 110,25 |
| 68 | 68 - 80,5 = - 12,5 | 156,25 |
| 79 | 79 - 80,5 = -1,5 | 2,25 miljoen |
| 88 | 88 - 80,5 = +7,5 | 56,25 |
| Totaal | 0 (altijd) | 417,50 miljoen |
Stap 3 - Bereken variantie:De steekproefvariantie (n-1) = 417,50 / 5 = 83,50
Stap 4 -- Neem de wortel van de standaardafwijking:s = √83,50 ~9,14 jaar
Interpretatie:De meeste scores vallen binnen ongeveer 9,14 punten van het gemiddelde van 80,5. Ongeveer 68% van de scores zou tussen 71,4 en 89,6 (gemiddelde +/- 1 SD) worden verwacht als dit een normaal verdeelde populatie was.
De empirische regel en normale verdeling
Voor gegevens na eennormale verdeling (klokkencurve), de empirische regel (68-95-99,7) vertelt u precies hoeveel waarden binnen elk standaardafwijkingsbereik vallen:
| Afstand | Percentage van de gegevens | Voorbeeld (gemiddelde=100, SD=15) |
|---|---|---|
| Gemiddelde +/- 1 SD | ~68,27% | 85 tot en met 115 |
| Gemiddelde +/- 2 SD | ~ 95,45% | 70 tot 130 |
| Gemiddelde +/- 3 SD | ~99,73% | 55 tot en met 145 |
| Meer dan +/- 3 SD | - 0,27% | Onder 55 of boven 145 |
De klassieke toepassing is IQ-scores: gemiddelde = 100, SD = 15. Een IQ van 130 is 2 SD's boven het gemiddelde - slechts ongeveer 2,3% van de mensen scoort zo hoog. Een IQ van 145 is 3 SD's boven het gemiddelde - ongeveer 0,13% van de mensen (ongeveer 1 op 750).
In het kader van de kwaliteitscontroleZes SigmaDe standaard vereist dat processen minder dan 3,4 defecten per miljoen mogelijkheden hebben, wat overeenkomt met het houden van variatie binnen +/- 6 standaardafwijkingen van het doel, waardoor slechts 0,00034% defectratio overblijft.
Niet alle gegevens zijn normaal verdeeld. De inkomensverdelingen zijn rechtsgeschikt (een paar zeer hoge verdieners strekken de rechterstaart uit). In dergelijke gevallen kan het mediaan- en interquartilbereik informatiever zijn dan het gemiddelde en de standaardafwijking.
Andere statistische maatstaven: gemiddelde, mediaan, variantie en meer
Standaarddeviatie is het meest betekenisvol naast andere beschrijvende statistieken.
- Gemiddelde (arithmetisch gemiddelde):Gevoelig voor uitschieters - één extreme waarde kan het gemiddelde aanzienlijk verschuiven.
- Mediane:Voor {1, 2, 3, 4, 100}: gemiddelde = 22, mediane = 3.
- Modus:De meest voorkomende waarde: nuttig voor categorische gegevens; een dataset kan meerdere modi hebben of geen enkele.
- Afstand:Maximaal - minimaal. Eenvoudig maar gevoelig voor buitensporige waarden; beschrijft de distributievorm niet.
- Variantie (σ2 of s2):Het vierkant van de standaardafwijking. Wiskundig handig, maar moeilijker te interpreteren omdat het in vierkante eenheden is. Voorbeeld: als hoogtes in centimeters zijn, is variantie in cm2 - wat geen fysieke betekenis heeft.
- Variatiecoëfficiënt (CV):Een CV van 10% betekent dat de SD 10% van het gemiddelde is - nuttig in financiën en biologie.
- Standaardfout van het gemiddelde (SEM):SD ÷ √n. Meet de nauwkeurigheid van het steekproefgemiddelde als een schatting van het populatiegemiddelde. Naarmate de steekproefgrootte groeit, krimpt SEM - grotere steekproeven geven nauwkeuriger schattingen.
Standaarddeviatie in financiën, wetenschap en sport
Standaarddeviatie heeft specifieke, praktische interpretaties op verschillende gebieden:
Financiën - Investeringsrisico meten:In financiën is standaarddeviatie van rendement = volatiliteit = risico. Een aandeel met een rendement van 10% per jaar met een SD van 15% heeft een 68% kans op een rendement tussen -5% en +25% in een bepaald jaar. De S&P 500 heeft historisch een jaarlijkse SD van ongeveer 15 - 20%.
Wetenschap -- Kwaliteitscontrole en -meting:Laboratoriuminstrumenten rapporteren metingen als gemiddeld +/- SD. Een thermometer met een weergave van 37,2 +/- 0,3 graden C betekent dat de meting binnen 0,3 graden C ligt van de werkelijke waarde met een betrouwbaarheid van 68%. In klinische studies wordt statistische significantie meestal gedefinieerd als het behandelingseffect meer dan 2 SD's is van het gemiddelde van de controlegroep (p < 0,05).
Sportanalyse:Een basketbalspeler met een gemiddelde van 25 punten per wedstrijd met een SD van 3 is betrouwbaarder dan een basketbalspeler met een gemiddelde van 25 met een SD van 10.
Onderwijs:Z-scores geven aan hoeveel standaardafwijkingen de score van een student is van het klasgemiddelde: Z = (score - gemiddelde) / SD. Een Z-score van +2 betekent het scoren van 2 SD's boven het gemiddelde - beter dan ongeveer 97,7% van de studenten. Standaard tests zoals de SAT zijn zo ontworpen dat scores een ruwweg normale verdeling volgen, waardoor deze percentielvergelijkingen mogelijk zijn.
Vaak gestelde vragen
Wat is het verschil tussen standaardafwijking en variantie?
De variantie is het gemiddelde van de vierkante afwijkingen van het gemiddelde. De standaarddeviatie is de vierkantswortel van de variantie. Beide metingen zijn verspreid, maar de standaarddeviatie is in dezelfde eenheden als de gegevens (gemakkelijker te interpreteren), terwijl de variantie in vierkante eenheden is. Een hoogte-dataset in cm heeft variantie in cm2 - niet betekenisvol. De SD in cm is rechtstreeks vergelijkbaar met de oorspronkelijke metingen.
Wanneer moet ik populatie versus steekproef standaardafwijking gebruiken?
Gebruik populatie SD (σ, gedeeld door N) als je gegevens hebt voor de hele populatie die je beschrijft -- alle studenten in één specifieke klas, alle medewerkers in één bedrijf. Gebruik steekproef SD (s, gedeeld door n-1) als je gegevens een deelverzameling zijn van een grotere populatie en je de variabiliteit van de populatie inschat -- een enquête steekproef, deelnemers aan een klinische studie, kwaliteitscontrole monsters van een productie run.
Wat betekent een hoge of lage standaardafwijking?
Een lage standaardafwijking betekent dat gegevenspunten dicht bij het gemiddelde zijn geclusterd - consistentie, lage variabiliteit. Een hoge standaardafwijking betekent dat gegevens breed verspreid zijn - hoge variabiliteit. Geen van beide is inherent beter; het hangt af van de context.
Wat is een Z-score en hoe is het gerelateerd aan standaardafwijking?
Een Z-score meet hoeveel standaardafwijkingen een gegevenspunt heeft van het gemiddelde: Z = (waarde - gemiddelde) / SD. Een Z-score van 0 = precies het gemiddelde. Z = +1 = 1 SD boven het gemiddelde (84e percentiel). Z = -2 = 2 SD onder het gemiddelde (2,3e percentiel). Z-scores maken het mogelijk om waarden van verschillende datasets met verschillende schalen te vergelijken.
Wat is de standaardfout en wat is het verschil met standaarddeviatie?
De standaardafwijking beschrijft de verspreiding van individuele gegevenspunten. De standaardafwijking van het gemiddelde (SEM = SD/√n) beschrijft de nauwkeurigheid van het steekproefgemiddelde als een schatting van het werkelijke gemiddelde van de populatie. Naarmate de steekproefgrootte toeneemt, neemt SEM af (meer gegevens = nauwkeuriger schatting), maar SD verandert niet noodzakelijkerwijs. SEM wordt gebruikt in betrouwbaarheidsintervallen; SD beschrijft de verdeling van de gegevens zelf.
Kan de standaardafwijking negatief zijn?
Nee. Standaarddeviatie is altijd nul of positief. Het is alleen gelijk aan nul als alle gegevenswaarden identiek zijn (geen variabiliteit). Aangezien het wordt berekend als een vierkantswortel van een som van kwadraten, kan het niet negatief zijn. Negatieve variantie of standaarddeviatie zou een berekeningsfout aangeven.
Hoe beïnvloeden uitschieters de standaardafwijking?
Bijvoorbeeld in {10, 11, 10, 12, 100}: het verwijderen van de buitensporige waarde (100) verlaagt SD van ~38 tot ~0,9. Wanneer buitensporige waarden aanwezig zijn, zijn het mediane en interquartile bereik (IQR) robuustere maatstaven van centrale tendens en spread.
Wat betekent het als de standaardafwijking gelijk is aan nul?
Een standaardafwijking van nul betekent dat alle waarden in de dataset identiek zijn - er is helemaal geen variabiliteit. Bijvoorbeeld, {5, 5, 5, 5, 5} heeft gemiddelde = 5 en SD = 0. Dit komt voor in kunstmatige of sterk beperkte datasets. In praktische datasets geeft SD = 0 vaak een gegevensverzamelfout of identieke metingen aan.