標準偏差計算器
標準偏差,分散,平均,その他を任意のデータセットで計算します. 集団とサンプル計算の両方をサポートします. 無料のステップ・バイ・ステップ・ソリューション.
標準偏差とは何で なぜ重要なのか
標準偏差の測定値平均値 (平均値) の周りに分布しています.標準偏差が小さいとすると,値が平均値の周りに緊密に集まっている.標準偏差が大きいとすると,値が広く分散している.
標準偏差は,その差を捉えます. 標準偏差は,その差を捉えます.
- データセット A: {9, 10, 10, 11, 10} -- 平均値 = 10, SD ~ 0.63 (緊密なクラスター)
- データセット B: {2, 5, 10, 15, 18} -- 平均 = 10, SD ~ 5.83 (広く広がっている)
両方の平均値は10ですが,データセットBはほぼ10倍の変数です.標準偏差はこれを可視化します.
標準偏差はσ (シグマ)人口とs元のデータと同じ単位で表され 単なる変数よりも 解釈しやすいのです
品質管理 (部品の製造は一貫して許容範囲内ですか?),金融 (投資リスク=リターンの変動性),医学 (患者の読書値は正常値の2SD以内ですか?),教育 (テストスコアはどのように分配されますか?),スポーツ分析 (アスリートのパフォーマンスはどの程度一貫していますか?)
人口対サンプルの標準偏差
標準偏差を計算する際に最も重要な選択は, 標準偏差を計算する際に最も重要な選択は,人口(すべての可能なデータポイント) またはサンプルこれは,どの式を使用するか決定し,結果に影響します.
集団標準偏差 (σ):グループ全体に関するデータがある場合に用いる.式: σ = √[Σ(xi - μ) 2 / N]
ここで: μ = 集団平均, N = 値の数, Σ = すべての値の合計.
サンプル標準偏差:データがより大きな集団から抽出されたサンプルである場合を使用する.式: s = √[Σ(xi - x̄) 2 / (n-1) ]
ここで:x̄ = サンプル平均,n = サンプル内の値数, (n-1) =ベッセルの修正.
ベッセルの補正は n ではなく (n-1) で除算される. サンプルは,特に小さなサンプルの場合,実際の集団の多様性を過小評価する傾向があるからです. (n-1) を使用すると,偏りのない評価者集団の多様性についてです
どちらを使うのか?
- 人口 SD:特定のクラスの全ての生徒 特定の試験の全てのテストスコア 特定の会社の全ての従業員のデータがあります
- サンプルSD:500人のアメリカ人を調査して 収入について調べました (これは全アメリカ人を指します) 30個の小道具を 量りました (これは全小道具を指します)
ステップ・バイ・ステップ 標準偏差計算
実数を使った完全な例を見てみましょう.
データセット:6人の生徒のテストスコア: {72, 85, 91, 68, 79, 88}
ステップ1 -- 平均値を見つける:(72 + 85 + 91 + 68 + 79 + 88) / 6 = 483 / 6 =80. 5
平均からの偏差を2乗します.
| スコア (xi) | 偏差 (xi - x̄) | 平方 (xi - x̄) 2 |
|---|---|---|
| 72 | 72 - 80.5 = - 8.5 | 72. 25 |
| 85 | 85 - 80.5 = +4.5 | 20・25歳 |
| 91 | 91 - 80.5 = +10.5 | 110. 25 について |
| 68 | 68 - 80.5 = -12.5 となる | 156. 25 |
| 79 | 79 - 80.5 = -1.5 とする. | 2.25 について |
| 88 | 88 - 80.5 = +7.5 となる | 56.25 について |
| 合計 | 0 (常に) | 417. 50 歳 |
ステップ3 -- 偏差を計算するサンプル分散 (n-1) = 417.50 / 5 = 83.50
標準偏差の平方根を取ります.s = √83.50 ~9.14 について
解釈:ほとんどのスコアは,平均 80.5 の約 9.14 ポイントの範囲内にある.この集団が正常に分布している場合,約 68% のスコアは 71.4 から 89.6 (平均 +/- 1 SD) の間で予想される.
経験法と正規分布
後に続くデータについて正常分布 (ベル曲線)標準偏差の範囲にどれだけの値が含まれるかを正確に示します.
| 範囲 | データの割合 | 例 (平均=100,SD=15) |
|---|---|---|
| 平均 +/- 1 SD | ~68.27% | 85から115 |
| 平均 +/- 2 SD | ~95.45% | 70から130 |
| 平均 +/- 3 SD | ~99.73% | 55から145 |
| +/- 3 SDを超えて | ~0.27% | 55歳未満または145歳以上 |
クラシックな応用はIQスコアです 平均=100 SD=15 130のIQは平均より2SD高いです 平均より高いのは約2.3%の人だけです 145のIQは平均より3SD高いです 約0.13%の人です (約750人に1人)
品質管理において,シックス・シグマ標準は,プロセスが百万の機会に3.4の欠陥未満であることを要求します.これは,目標から+/-6の標準偏差の範囲内で変動を維持し,0.00034%の欠陥率のみを残します.これはシックス・シグマの製造品質プログラムの統計的基盤です.
すべてのデータが正常に分布しているわけではない.所得分布は右傾いている (ごく少数の非常に高い所得者は右の尾を伸ばしている).このような場合,中位数と四分位間の範囲は,平均値と標準偏差よりも有益である可能性があります.
その他の統計指標: 平均値,中位数,偏差値,その他
標準偏差は他の記述的統計と並行して 最も有意義なものです.その組み合わせは次のとおりです.
- 平均 (算術平均):すべての値の合計 ÷ 数値. 偏差値に敏感である - 一つの極端な値は平均値を大きく変化させることができます.
- 中央値:データが並べられたときの中間値. 平均値よりも偏差値に強い. {1, 2, 3, 4, 100} の場合:平均値 = 22,中位値 = 3.
- モード:最も頻繁に発生する値.カテゴリデータに有用である.データセットは複数のモードまたは何も持たないことができます.
- 範囲:マキシマム - ミニマム. シンプルですが,異常値に敏感です.分布の形を記述していません.
- 偏差 (σ2またはs2):標準偏差の正方形は 数学的に便利ですが 平方単位で表すので 解釈するのが難しいです 例えば 高さはセンチメートルで 偏差はcm2で これは物理的に意味がありません
- 変数係数 (CV):(標準偏差 / 平均) x 100%. 異なる平均値を持つデータセット間の変動性を比較することができます. 10%のCVは,SDが平均値の10%であることを意味します. これは金融や生物学で有用です.
- 平均値の標準誤差 (SEM):SD ÷ √n. 集団平均の推定値としてサンプル平均の精度を測定する. サンプルサイズが大きくなるにつれて,SEMは縮小する - より大きなサンプルはより正確な推定値を与える.
金融,科学,スポーツにおける標準偏差
標準偏差は様々な分野において 具体的で実用的な解釈があります
投資リスクの測定:金融では,リターンの標準偏差=ボラティリティ=リスク.毎年10%のリターンを15%のSDで得ている株は,特定の年に-68%の確率で -5%から+25%のリターンを得ます.S&P500は歴史的に年間SDは約15-20%です.債券ポートフォリオは通常SDは3-7%です.リスク調整パフォーマンス (シャープ比率) = (リターン - リスクフリーレート) / SD - より高いほど良い.
科学 - 品質管理と測定:実験器具は測定値を平均+/- SDとして報告する.温度計の測定値37.2+/- 0.3°Cは,測定値が68%の信頼性で実際の値から0.3°C以内であることを意味する.臨床試験では,統計的有意性は,通常,治療効果が対照群の平均から2 SD以上 (p <0.05) で定義される.
スポーツ分析:選手の一貫性はSDで定量化される.SD3の試合平均25ポイントのバスケットボール選手は,SD10の試合平均25ポイントの選手よりも信頼性が高い.気象予報は,温度予測のSDが信頼性を示すアンサンブルモデルを使用する.狭いSDは予報者が同意することを意味する.広いSDは高い不確実性を意味する.
教育:Zスコアは,クラスの平均から生徒のスコアがどのくらい標準偏差しているかを表します. Z = (スコア - 平均) / SD. +2のZスコアは,平均より2SDのスコアを表示します.これは約97.7%の学生よりも優れています.SATのような標準化されたテストは,スコアがほぼ正常分布に従うように設計されており,これらの百分比比較を可能にします.
よく 聞かれる 質問
標準偏差と分散の違いは何ですか?
偏差は平均から二乗の偏差の平均である. 標準偏差は偏差の平方根である. 両方とも分散を測定するが,標準偏差はデータと同じ単位で (解釈しやすい),一方偏差は二乗単位で表される. センチメートルの高さのデータセットにはcm2の偏差がある - 意味がない. センチメートルのSDは,元の測定値と直接比較できる.
人口対サンプル標準偏差はいつ使うべきですか?
集団SD (σ,Nで割る) を使うのは 記述する集団全体― 特定のクラスの全ての生徒や 会社の全ての従業員のデータがある場合です サンプルSD (s,n-1で割る) を使うのは データがより大きな集団のサブセットで 集団の変動性を推定している場合です 調査のサンプル 臨床試験の参加者 製造の品質管理のサンプルです
高いか低い標準偏差とはどういう意味ですか?
低標準偏差は,データポイントが平均の周りに密接に集まっていることを意味します.一貫性,低変動性.高標準偏差は,データが広く広がっていることを意味します.高変動性.いずれも本質的に優れているわけではありません.それは文脈に依存します.製造業では,低SDが望ましい (一貫性).投資収益において,一部の投資家は,より高い潜在的な収益のためにより高いSDを受け入れます.
標準偏差とどのように関係しているのでしょうか?
Zスコアは,データポイントが平均からどれだけの標準偏差があるかを測定する.Z = (値 - 平均) / SD.Zスコア0 = 正確な平均.Z = +1 = 平均より1 SD (84th percentile).Z = -2 = 平均より2 SD (2.3rd percentile).Zスコアは,異なるスケールの異なるデータセットの値を比較することを可能にします.
標準誤差とは何か? 標準偏差とはどう違いますか?
標準偏差は,個々のデータポイントの分布を記述する.平均値の標準誤差 (SEM = SD/√n) は,サンプルの平均値の精度を実際の集団平均値の推定値として記述する.サンプルのサイズが増加するにつれて,SEMは減少する (より多くのデータ = より正確な推定値),しかしSDは必ずしも変化しない.SEMは信頼区間で使用され,SDはデータの分布を記述する.
標準偏差は負の値でもあり得ますか?
標準偏差は常に0または正である.すべてのデータ値が同一である場合にのみ0に等しい (全く変動性がない).平方和の平方根として計算されるので,負の値にはならない.負の差数または標準偏差は計算エラーを示します.
偏差値が標準偏差にどう影響するか?
偏差値が標準偏差を劇的に膨らませることができるのは,偏差値が二乗されているため,平均からの大きな偏差が不均衡に寄与するからです.例えば,{10, 11, 10, 12, 100}: 偏差値 (100) を削除すると,SDは~38から~0.9に低下します. 偏差値が存在する場合,中央値と四半期間範囲 (IQR) は,中央傾向と拡散のより堅固な測定値です.
標準偏差が 0 だったら?
0の標準偏差は,データセットのすべての値が同一であることを意味します.例えば,{5, 5, 5, 5, 5}は平均値=5でSD=0です.これは人工的または高度に制限されたデータセットで発生します.実用的なデータセットでは,SD=0はしばしばデータ収集エラーまたは同一の測定を示します.