Standardabweichungs-Rechner
Berechne Standardabweichung, Varianz, Mittelwert und mehr für jeden Datensatz. Unterstützt Grundgesamtheit und Stichprobenberechnungen. Kostenlos, Schritt-für-Schritt.
Was ist der Standardabweichung und warum ist sie wichtig?
Die Standardabweichung misst , wie weit Ihre Daten um die Mittelwert (Durchschnitt) herum verteilt sind. Eine kleine Standardabweichung bedeutet, dass die Werte eng um den Mittelwert herumclusteren; eine große Standardabweichung bedeutet, dass die Werte weit auseinander liegen.
Zwei Datensätze können denselben Mittelwert haben, aber völlig unterschiedliche Verteilungen – die Standardabweichung fängt diese Unterschiede ein:
- Dataset A: {9, 10, 10, 11, 10} – Mittelwert = 10, SD ≈ 0,63 (enge Cluster)
- Dataset B: {2, 5, 10, 15, 18} – Mittelwert = 10, SD ≈ 5,83 (weit auseinander liegend)
Beide haben einen Mittelwert von 10, aber Dataset B ist fast 10-mal variabler. Die Standardabweichung macht dies sichtbar.
Die Standardabweichung wird mit σ (sigma) für eine Population und s für eine Stichprobe angegeben. Sie ist die Quadratwurzel der Varianz, ausgedrückt in den gleichen Einheiten wie die ursprünglichen Daten – was sie interpretierbarer macht als die Varianz allein.
Die Anwendungen reichen fast über alle Bereiche: Qualitätskontrolle (sind hergestellte Teile innerhalb der Toleranzgrenzen?), Finanzen (Investitionsrisiko = Renditevolatilität), Medizin (liegt ein Patientenwert innerhalb von 2 SD des Normalwertes?), Bildung (wie sind die Testergebnisse verteilt?) und Sportanalyse (wie konsistent ist die Leistung eines Athleten?).
Population vs Stichprobe-Standardabweichung
Die wichtigste Entscheidung bei der Berechnung der Standardabweichung ist, ob Sie mit einer Population (allen möglichen Datenpunkten) oder einer Stichprobe (einer Teilmenge) arbeiten. Dies bestimmt, welche Formel verwendet werden soll und beeinflusst das Ergebnis.
Population-Standardabweichung (σ): Verwenden Sie, wenn Sie Daten für die gesamte Gruppe haben, die Sie untersuchen. Formel: σ = √[Σ(xᵢ − μ)² / N]
Wo: μ = Mittelwert der Population, N = Anzahl der Werte, Σ = Summe aller Werte.
Stichprobe-Standardabweichung (s): Verwenden Sie, wenn Ihre Daten eine Stichprobe aus einer größeren Population sind. Formel: s = √[Σ(xᵢ − x̄)² / (n−1)]
Wo: x̄ = Stichmengenmittel, n = Anzahl der Werte in der Stichprobe, (n−1) = Bessels Korrektur.
Bessels Korrektur teilt durch (n−1) anstelle von n, weil Stichproben tendenziell die wahre Populationenvarianz unterschätzen – insbesondere bei kleinen Stichproben. Die Verwendung von (n−1) liefert einen unvoreingenommenen Schätzer der Populationenvarianz.
Welche verwenden?
- Population-SD: Sie haben Daten für alle Schüler in einer bestimmten Klasse; alle Testergebnisse von einem bestimmten Prüfungstermin; alle Mitarbeiter in einem bestimmten Unternehmen.
- Stichprobe-SD: Sie haben 500 Amerikaner befragt, um Einkommen (auf alle Amerikaner abzustimmen); Sie haben 30 Widgets aus einer Produktionslaufserie gemessen (auf alle Widgets abzustimmen); jede wissenschaftliche Studie mit einer Stichprobe.
Schritt-für-Schritt-Berechnung der Standardabweichung
Wir gehen durch ein vollständiges Beispiel mit realen Zahlen:
Dataset: Testergebnisse von 6 Schülern: {72, 85, 91, 68, 79, 88}
Schritt 1 – Finden Sie den Mittelwert: (72 + 85 + 91 + 68 + 79 + 88) / 6 = 483 / 6 = 80,5
Schritt 2 – Finden Sie jeden Abweichung vom Mittelwert und quadrieren Sie sie:
| Score (xᵢ) | Abweichung (xᵢ − x̄) | Quadriert (xᵢ − x̄)² |
|---|---|---|
| 72 | 72 − 80,5 = −8,5 | 72,25 |
| 85 | 85 − 80,5 = +4,5 | 20,25 |
| 91 | 91 − 80,5 = +10,5 | 110,25 |
| 68 | 68 − 80,5 = −12,5 | 156,25 |
| 79 | 79 − 80,5 = −1,5 | 2,25 |
| 88 | 88 − 80,5 = +7,5 | 56,25 |
| Summe | 0 (immer) | 417,50 |
Schritt 3 – Berechnen Sie die Varianz: Stichprobenvarianz (n−1) = 417,50 / 5 = 83,50
Schritt 4 – Nehmen Sie die Quadratwurzel für die Standardabweichung: s = √83,50 ≈ 9,14
Interpretation: Die meisten Werte fallen innerhalb von etwa 9,14 Punkten vom Mittelwert 80,5 ab. Etwa 68 % der Werte würden zwischen 71,4 und 89,6 (Mittelwert ± 1 SD) erwartet werden, wenn dies eine normalverteilte Population wäre.
Die empirische Regel und die Normalverteilung
Bei Daten, die einer Normalverteilung (Balkenkurve) folgen, sagt die empirische Regel (68-95-99,7-Regel) genau, wie viele Werte in jedem Standardabweichungsintervall liegen:
| Intervall | Prozent der Daten | Beispiel (Mittelwert=100, SD=15) |
|---|---|---|
| Mittelwert ± 1 SD | ~68,27% | 85 bis 115 |
| Mittelwert ± 2 SD | ~95,45% | 70 bis 130 |
| Mittelwert ± 3 SD | ~99,73% | 55 bis 145 |
| Beyond ± 3 SD | ~0,27% | Unter 55 oder über 145 |
Die klassische Anwendung ist IQ-Scores: Mittelwert = 100, SD = 15. Ein IQ von 130 liegt 2 SD über dem Mittelwert – nur etwa 2,3% der Menschen erzielen so hohe Werte. Ein IQ von 145 liegt 3 SD über dem Mittelwert – etwa 0,13% der Menschen (ungefähr 1 in 750).
Bei der Qualitätssicherung erfordert der Six Sigma-Standard, dass Prozesse weniger als 3,4 Mängel pro Million Möglichkeiten haben – äquivalent dazu, die Variation innerhalb von ±6 Standardabweichungen vom Ziel zu halten, was nur 0,00034% Mängelrate ergibt. Dies ist die statistische Grundlage von Six-Sigma-Qualitätsprogrammen.
Alle Daten sind nicht normal verteilt. Einkommensverteilungen sind rechts-skew (einige sehr hohe Einkommensbezieher strecken den rechten Schwanz). In solchen Fällen können Median und Interquartilsrange informativer sein als Mittelwert und Standardabweichung.
Weitere statistische Maße: Mittelwert, Median, Variabilität und mehr
Standardabweichung ist am bedeutendsten neben anderen deskriptiven Statistiken. Hier ist, wie sie zusammenarbeiten:
- Mittelwert (arithmetischer Durchschnitt): Summe aller Werte ÷ Anzahl. Empfindlich gegen Ausreißer – ein einzelner extrem hoher Wert kann den Mittelwert erheblich verschieben.
- Median: Der mittlere Wert, wenn die Daten sortiert sind. Robust gegen Ausreißer als der Mittelwert. Für {1, 2, 3, 4, 100}: Mittelwert = 22, Median = 3.
- Modus: Der am häufigsten auftretende Wert. Nützlich für kategoriale Daten; ein Datensatz kann mehrere Modi oder keinen haben.
- Range: Maximum – Minimum. Einfach, aber empfindlich gegen Ausreißer; beschreibt nicht die Verteilungsform.
- Variabilität (σ² oder s²): Die Quadratwurzel der Standardabweichung. Nützlich mathematisch, aber schwerer zu interpretieren, da es in quadrierten Einheiten ist. Beispiel: Wenn die Höhen in Zentimetern angegeben sind, ist die Variabilität in cm² – was keinen physischen Sinn ergibt.
- Koeffizient der Variation (CV): (Standardabweichung / Mittelwert) × 100%. Er ermöglicht das Vergleichen der Variabilität zwischen Datensätzen mit unterschiedlichen Mittelwerten. Ein CV von 10% bedeutet, dass die SD 10% des Mittelwerts beträgt – nützlich in der Finanzwirtschaft und Biologie.
- Standardfehler der Mittelwert (SEM): SD ÷ √n. Misst die Genauigkeit des Stichprobenmittels als Schätzung des Populationsmittels. Je größer die Stichprobe, desto kleiner der SEM – größere Stichproben liefern genauere Schätzungen.
Standardabweichung in Finanzen, Wissenschaft und Sport
Die Standardabweichung hat spezifische, praktische Interpretationen in verschiedenen Bereichen:
Finanzen — Messung von Investitionsrisiken: In der Finanzwelt ist die Standardabweichung der Renditen = Volatilität = Risiko. Ein Akt, der jährlich 10 % zurückgibt, mit einer SD von 15 % hat eine 68 % Wahrscheinlichkeit, zwischen −5 % und +25 % in einem bestimmten Jahr zurückzugeben. Der S&P 500 hat historisch einen jährlichen SD von etwa 15–20 %. Anlageportfolios haben typischerweise SD von 3–7 %. Risikoadjustierte Leistung (Sharpe-Verhältnis) = (Rendite − risikofreie Rendite) / SD — desto höher, desto besser.
Wissenschaft — Qualitätskontrolle und Messung: Laborgeräte berichten Messungen als Mittel ± SD. Ein Thermometer mit 37,2 ± 0,3 °C bedeutet, dass die Messung 0,3 °C von der wahren Werte entfernt ist mit 68 % Vertrauen. In klinischen Studien wird die statistische Signifikanz typischerweise als der Behandlungseffekt, der mehr als 2 SDs vom Mittelwert der Kontrollgruppe entfernt ist (p < 0,05), definiert.
Sportanalyse: Die Konsistenz eines Spielers wird mit SD quantifiziert. Ein Basketballspieler, der durchschnittlich 25 Punkte pro Spiel mit einer SD von 3 erzielt, ist zuverlässiger als einer, der durchschnittlich 25 Punkte mit einer SD von 10 erzielt. Wettervorhersagen verwenden Ensemblemodelle, bei denen die SD der Temperaturvorhersagen die Zuverlässigkeit anzeigt — eine enge SD bedeutet, dass die Vorhersager sich einig sind; eine breite SD bedeutet hohe Unsicherheit.
Bildung: Z-Scores drücken aus, wie viele Standardabweichungen ein Schülerescore vom Klassenmittel entfernt ist: Z = (Score − Mittelwert) / SD. Ein Z-Score von +2 bedeutet, dass der Schüler 2 SDs über dem Mittelwert liegt — besser als etwa 97,7 % der Schüler. Standardisierte Tests wie der SAT sind so konzipiert, dass die Ergebnisse eine etwa normalverteilte Verteilung haben, was diese Prozentsatzvergleiche ermöglicht.
Häufig gestellte Fragen
Was ist der Unterschied zwischen Standardabweichung und Varianz?
Die Varianz ist das Mittel der quadrierten Abweichungen vom Mittelwert. Die Standardabweichung ist die Quadratwurzel der Varianz. Beide messen die Streuung, aber die Standardabweichung ist in den gleichen Einheiten wie die Daten (leichter zu interpretieren), während die Varianz in quadrierten Einheiten ist. Ein Höhen-Datensatz in cm hat eine Varianz in cm² – nicht sinnvoll. Die SD in cm ist direkt mit den ursprünglichen Messungen vergleichbar.
Wann sollte ich die Populations- bzw. die Stichproben-Standardabweichung verwenden?
Verwende die Populations-SD (σ, teile durch N) wenn du Daten für die gesamte Population hast, die du beschreibst – alle Schüler in einer bestimmten Klasse, alle Mitarbeiter in einem Unternehmen. Verwende die Stichproben-SD (s, teile durch n-1) wenn deine Daten ein Teil einer größeren Population sind und du die Variabilität der Population schätzen möchtest – eine Umfrage-Stichprobe, Teilnehmer an einer klinischen Studie, Qualitätssicherungsproben aus einer Produktionslauf.
Was bedeutet eine hohe oder niedrige Standardabweichung?
Eine niedrige Standardabweichung bedeutet, dass die Datenpunkte eng um den Mittelwert herum konzentriert sind – Konsistenz, geringe Variabilität. Eine hohe Standardabweichung bedeutet, dass die Daten weit auseinander liegen – hohe Variabilität. Weder ist besser als das andere; es hängt vom Kontext ab. In der Fertigung ist eine niedrige SD erwünscht (Konsistenz). Bei Investitionserträgen akzeptieren einige Investoren höhere SD für höhere potenzielle Renditen.
Was ist ein Z-Score und wie steht es zur Standardabweichung in Beziehung?
Ein Z-Score misst, wie viele Standardabweichungen ein Datenpunkt vom Mittelwert entfernt ist: Z = (Wert – Mittelwert) / SD. Ein Z-Score von 0 = genau durchschnittlich. Z = +1 = 1 SD über Mittelwert (84. Perzentil). Z = -2 = 2 SD unter Mittelwert (2,3. Perzentil). Z-Scores ermöglichen es, Werte aus verschiedenen Datensätzen mit unterschiedlichen Skalen zu vergleichen.
Was ist der Standardfehler und wie unterscheidet er sich von der Standardabweichung?
Die Standardabweichung beschreibt die Streuung der einzelnen Datenpunkte. Der Standardfehler der Mittelwert (SEM = SD/√n) beschreibt die Genauigkeit des Stichprobenmittels als Schätzung des wahren Populationsmittels. Mit zunehmender Stichprobengröße verringert sich der SEM (mehr Daten = genauer Schätzwert), aber die SD ändert sich nicht unbedingt. Der SEM wird in Konfidenzintervallen verwendet; die SD beschreibt die Verteilung der Daten selbst.
Kann die Standardabweichung negativ sein?
Nein. Die Standardabweichung ist immer Null oder positiv. Sie ist Null nur dann, wenn alle Datenwerte identisch sind (keine Variabilität überhaupt). Da sie als Quadratwurzel eines Summen von Quadrate berechnet wird, kann sie nicht negativ sein. Eine negative Varianz oder Standardabweichung würde eine Berechnungsfehler anzeigen.
Wie beeinflusst ein Außenseiter die Standardabweichung?
Außenseiter können die Standardabweichung stark erhöhen, weil Abweichungen quadriert werden – große Abweichungen vom Mittelwert tragen unverhältnismäßig viel dazu bei. Zum Beispiel: {10, 11, 10, 12, 100}: Entfernen des Außenseiters (100) verringert die SD von ~38 auf ~0,9. Wenn Außenseiter vorhanden sind, sind Median und Interquartilsrange (IQR) robuster Maße für Mittelwert und Streuung.
Was bedeutet es, wenn die Standardabweichung Null ist?
Eine Standardabweichung von Null bedeutet, dass alle Werte im Datensatz identisch sind – es gibt keine Variabilität überhaupt. Zum Beispiel: {5, 5, 5, 5, 5} hat Mittelwert = 5 und SD = 0. Dies tritt in künstlichen oder stark eingeschränkten Datensätzen auf. In praktischen Datensätzen bedeutet SD = 0 oft einen Dateninkonsistenzfehler oder identische Messungen.
{"@context":“https://schema.org”,"@type":“FAQ-Seite”,“mainEntity”:[{"@type":“Frage”,“name”:“Was ist der Unterschied zwischen Standardabweichung und Varianz?”,“acceptedAnswer”:{"@type":“Antwort”,“text”:“Die Varianz ist das Durchschnitt der quadrierten Abweichungen vom Mittelwert. Die Standardabweichung ist die Quadratwurzel der Varianz. Beide messen die Streuung, aber die Standardabweichung ist in den gleichen Einheiten wie die Daten (leichter zu interpretieren), während die Varianz in quadrierten Einheiten ist. Ein Höhen-Datensatz in cm hat eine Varianz in cm² — nicht bedeutend. Die SD in cm ist direkt mit den ursprünglichen Messungen vergleichbar.”}},{"@type":“Frage”,“name”:“Wann sollte ich Population-SD gegenüber Sample-SD verwenden?”,“acceptedAnswer”:{"@type":“Antwort”,“text”:“Verwende Population-SD (σ, teile durch N) wenn du Daten für die gesamte Population hast, die du beschreibst — alle Schüler in einer bestimmten Klasse, alle Mitarbeiter in einem Unternehmen. Verwende Sample-SD (s, teile durch n-1) wenn deine Daten ein Teil einer größeren Population sind und du die Variabilität der Population schätzen möchtest — eine Umfrage-Stichprobe, Teilnehmer an einer klinischen Studie, Qualitätskontrollproben aus einer Produktionslauf.”}},{"@type":“Frage”,“name”:“Was bedeutet eine hohe oder niedrige Standardabweichung?”,“acceptedAnswer”:{"@type":“Antwort”,“text”:“Eine niedrige Standardabweichung bedeutet, dass die Datenpunkte eng um den Mittelwert herum liegen — Konsistenz, geringe Variabilität. Eine hohe Standardabweichung bedeutet, dass die Daten weit verbreitet sind — hohe Variabilität. Weder ist besser als das andere; es hängt vom Kontext ab. In der Fertigung ist eine niedrige SD erwünscht (Konsistenz). In den Anlageerträgen akzeptieren einige Investoren höhere SD für höhere potenzielle Renditen.”}},{"@type":“Frage”,“name”:“Was ist ein Z-Score und wie steht es zur Standardabweichung in Beziehung?”,“acceptedAnswer”:{"@type":“Antwort”,“text”:“Ein Z-Score misst, wie viele Standardabweichungen ein Datenpunkt vom Mittelwert entfernt ist: Z = (Wert − Mittelwert) / SD. Ein Z-Score von 0 = genau durchschnittlich. Z = +1 = 1 SD über Mittelwert (84. Perzentil). Z = −2 = 2 SD unter Mittelwert (2,3. Perzentil). Z-Scores ermöglichen es, Werte aus verschiedenen Datensätzen mit unterschiedlichen Skalen zu vergleichen.”}},{"@type":“Frage”,“name”:“Was ist der Standardfehler und wie unterscheidet er sich von der Standardabweichung?”,“acceptedAnswer”:{"@type":“Antwort”,“text”:“Die Standardabweichung beschreibt die Streuung der einzelnen Datenpunkte. Der Standardfehler der Mittelwert (SEM = SD/√n) beschreibt die Genauigkeit der Stichprobenmittelwert als Schätzung des wahren Populationsmittels. Mit zunehmender Stichprobengröße verringert sich der SEM (mehr Daten = genauer Schätzwert), aber die SD ändert sich nicht unbedingt. Der SEM wird in Konfidenzintervallen verwendet; die SD beschreibt die Verteilung der Daten selbst.”}},{"@type":“Frage”,“name”:“Kann die Standardabweichung negativ sein?”,“acceptedAnswer”:{"@type":“Antwort”,“text”:“Nein. Die Standardabweichung ist immer Null oder positiv. Sie ist Null nur dann, wenn alle Datenwerte identisch sind (keine Variabilität überhaupt). Da sie als Quadratwurzel einer Summe von Quadrate berechnet wird, kann sie nicht negativ sein. Eine negative Varianz oder Standardabweichung würde eine Berechnungsfehler anzeigen.”}},{"@type":“Frage”,“name”:“Wie beeinflusst ein Außenseiter die Standardabweichung?”,“acceptedAnswer”:{"@type":“Antwort”,“text”:“Außenseiter können die Standardabweichung dramatisch erhöhen, weil Abweichungen quadriert werden — große Abweichungen vom Mittelwert tragen unverhältnismäßig viel dazu bei. Zum Beispiel in {10, 11, 10, 12, 100}: Entfernen Sie den Außenseiter (100), dann fällt die SD von ~38 auf ~0,9. Wenn Außenseiter vorhanden sind, sind Median und Interquartilsrange (IQR) robuster Maße für Mittelwert und Streuung.”}},{"@type":“Frage”,“name”:“Was bedeutet es, wenn die Standardabweichung Null ist?”,“acceptedAnswer”:{"@type":“Antwort”,“text”:“Eine Standardabweichung von Null bedeutet, dass alle Werte im Datensatz identisch sind — es gibt keine Variabilität überhaupt. Zum Beispiel {5, 5, 5, 5, 5} hat Mittelwert = 5 und SD = 0. Dies tritt in künstlichen oder stark eingeschränkten Datensätzen auf. In praktischen Datensätzen deutet SD = 0 oft auf eine Datenbeschaffungsfehler oder identische Messungen hin.”}}}