Kalkulator Sisihan Piawai
Kira sisihan piawai, varians, min, dan lagi untuk mana-mana set data. Menyokong pengiraan populasi dan sampel. Penyelesaian langkah demi langkah percuma.
<bahagian kandungan
Apakah Piawaian Deviasi dan Mengapa Ia Penting?
Deviasi piawaian mengukur bagaimana luas data anda di sekitar purata (mean) . Deviasi kecil bermaksud nilai-nilai berkumpul rapat di sekitar purata; deviasi besar bermaksud nilai-nilai tersebar luas.
Dua set data boleh mempunyai purata yang sama tetapi distribusi yang berbeza sepenuhnya — deviasi piawaian menangkap perbezaan itu:
- Set A: {9, 10, 10, 11, 10} — Purata = 10, SD ≈ 0.63 (kumpulan rapat)
- Set B: {2, 5, 10, 15, 18} — Purata = 10, SD ≈ 5.83 (luas tersebar)
Set B mempunyai purata 10, tetapi Set B hampir 10× lebih berubah. Deviasi piawaian menjadikan ini kelihatan.
Deviasi piawaian dinyatakan σ (sigma) untuk populasi dan s untuk sampel. Ia adalah akar kuadrat variasi, dinyatakan dalam unit yang sama dengan data asal — menjadikannya lebih mudah difahami daripada variasi sahaja.
Applikasi meliputi hampir setiap bidang: kawalan kualiti (adakah bahagian-bahagian yang diproses konsisten dalam toleransi?), kewangan (risiko pelaburan = volatiliti pulangan), perubatan (adakah bacaan pesakit dalam 2 SD daripada normal?), pendidikan (bagaimana skor ujian terdistribusi?), dan analisis sukan (bagaimana konsisten prestasi atlet?).
<bahagian kandunganDeviasi Piawaian Populasi vs Sampel
Pilihan yang paling penting apabila mengira deviasi piawaian ialah sama ada anda bekerja dengan populasi (semua titik data) atau sampel (sebuah subset). Ini menentukan formula untuk digunakan dan mempengaruhi hasil.
Deviasi piawaian populasi (σ): Gunakan apabila anda mempunyai data untuk keseluruhan kumpulan yang sedang dipelajari. Formula: σ = √[Σ(xᵢ − μ)² / N]
Di mana: μ = purata populasi, N = nombor nilai, Σ = jumla semua nilai.
Deviasi piawaian sampel (s): Gunakan apabila data anda adalah sampel yang diambil dari populasi yang lebih besar. Formula: s = √[Σ(xᵢ − x̄)² / (n−1)]
Di mana: x̄ = purata sampel, n = nombor nilai dalam sampel, (n−1) = penyinaran Bessel.
Penyinaran Bessel membagi (n−1) daripada n kerana sampel cenderung menghampirkan variasi populasi yang sebenar — terutama untuk sampel kecil. Menggunakan (n−1) memberikan penganggaran tidak berpihak bagi variasi populasi.
Mana untuk digunakan?
- SD Populasi: Anda mempunyai data untuk semua pelajar dalam kelas tertentu; semua skor ujian dari satu ujian tertentu; semua pekerja di syarikat tertentu.
- SD Sampel: Anda menyelidiki 500 orang Amerika tentang pendapatan (menghampirkan kepada semua orang Amerika); anda mengukur 30 widget dari pengeluaran (menghampirkan kepada semua widget); mana-mana kajian saintifik dengan sampel.
Langkah demi Langkah Pengiraan Deviasi Piawaian
Marilah kita bekerja melalui contoh lengkap dengan nombor-nombor sebenar:
Set Data: Skor ujian 6 pelajar: {72, 85, 91, 68, 79, 88}
Langkah 1 — Cari purata: (72 + 85 + 91 + 68 + 79 + 88) / 6 = 483 / 6 = 80.5
Langkah 2 — Cari setiap deviasi dari purata dan kuadratkan:
Langkah 3 — Kira variasi: Variasi sampel (n−1) = 417.50 / 5 = 83.50
Langkah 4 — Ambil akar kuadrat untuk deviasi piawaian: s = √83.50 ≈ 9.14
Interpretasi: Skor kebanyakan jatuh dalam kira-kira 9.14 mata dari purata 80.5. Sekitar 68% skor dijangka diharapkan antara 71.4 dan 89.6 (purata ± 1 SD) jika ini adalah populasi yang normal.
Aturan Empirikal dan Distribusi Normal
Untuk data yang mengikuti distribusi normal (graf kurva), Aturan Empirikal (68-95-99.7 rule) memberitahu anda secara tepat berapa banyak nilai yang jatuh dalam setiap rentang deviasi piawai:
| Range | Peratusan Data | Contoh (mean=100, SD=15) |
|---|---|---|
| Mean ± 1 SD | ~68.27% | 85 hingga 115 |
| Mean ± 2 SD | ~95.45% | 70 hingga 130 |
| Mean ± 3 SD | ~99.73% | 55 hingga 145 |
| Beyond ± 3 SD | ~0.27% | Di bawah 55 atau di atas 145 |
Penggunaan klasik ialah skor IQ: mean = 100, SD = 15. Skor IQ 130 adalah 2 SD di atas mean — hanya sekitar 2.3% orang yang mencapai skor itu tinggi. Skor IQ 145 adalah 3 SD di atas mean — sekitar 0.13% orang (kira-kira 1 dalam 750).
Dalam kawalan kualiti, piawai Enam Sigma memerlukan proses untuk mempunyai kurang daripada 3.4 kecacatan setiap juta peluang — setara dengan menjaga variasi dalam ±6 deviasi piawai dari sasaran, meninggalkan hanya 0.00034% kadar kecacatan. Ini adalah asas statistik bagi program kualiti pengeluaran Enam Sigma.
Tidak semua data adalah terdistribusi normal. Distribusi pendapatan adalah terpaksalah (beberapa pendapatan tinggi yang memanjangkan ekor kanan). Dalam kes seperti ini, median dan rentang kuartil mungkin lebih bermanfaat daripada mean dan deviasi piawai.
Indeks Statistik Lain: Mean, Median, Varians, dan Lebih
Deviasi piawai paling bermakna bersama-sama dengan statistik deskriptif lainnya. Berikut adalah bagaimana mereka berfungsi bersama:
- Mean (purata aritmetik): Jumlah semua nilai ÷ bilangan. Peka terhadap nilai luar biasa — satu nilai ekstrem boleh menjejaskan mean secara signifikan.
- Median: Nilai tengah apabila data disusun. Lebih tahan terhadap nilai luar biasa daripada mean. Untuk {1, 2, 3, 4, 100}: mean = 22, median = 3.
- Mode: Nilai yang paling kerap berlaku. Berguna untuk data kategori; satu set data boleh memiliki beberapa modus atau tiada.
- Range: Maksimum − minimum. Mudah tetapi peka terhadap nilai luar biasa; tidak menggambarkan bentuk distribusi.
- Varians (σ² atau s²): Kuadrat deviasi piawai. Berguna matematik tetapi lebih sukar difahami sejak ia dalam unit kuadrat. Contoh: jika ketinggian dalam sentimeter, varians adalah dalam cm² — yang tidak mempunyai makna fizikal.
- Peratusan Kekeliruan (CV): (Deviasi piawai / mean) × 100%. Meninggalkan membandingkan kepelbagaian antara set data dengan mean yang berbeza. Sebuah CV 10% bermakna SD adalah 10% daripada mean — berguna dalam kewangan dan biologi.
- Standard Error of the Mean (SEM): SD ÷ √n. Membuat kiraan ketepatan mean sampel sebagai anggaran mean populasi. Apabila saiz sampel bertambah, SEM mengecil — sampel yang lebih besar memberikan kiraan yang lebih tepat.
Standard Deviasi dalam Kewangan, Sains, dan Sukan
Standard deviasi mempunyai tafsiran khusus, praktikal di dalam bidang yang berbeza:
Kewangan — Membaca risiko pelaburan: Dalam kewangan, standard deviasi pulangan = ketidakpastian = risiko. Saham pulangan 10% setahun dengan SD 15% mempunyai 68% kemungkinan pulangan antara -5% dan +25% dalam mana-mana tahun. S&P 500 secara bersejarah mempunyai SD tahunan kira-kira 15-20%. Portfolion bond biasanya mempunyai SD 3-7%. Prestasi yang disesuaikan dengan risiko (Rasio Sharpe) = (pulangan - kadar bebas risiko) / SD — semakin tinggi, semakin baik.
Sains — Kawalan kualiti dan pengukuran: Alat-alat makmal melaporkan pengukuran sebagai purata ± SD. Bacaan termometer 37.2 ± 0.3°C bermaksud pengukuran itu dalam 0.3°C dari nilai sebenar dengan 68% kepercayaan. Dalam ujian klinikal, signifikan statistik biasanya ditakrifkan sebagai kesan rawatan lebih daripada 2 SD dari purata kumpulan kawalan (p < 0.05).
Sukan analitik: Ketepatan pemain diukur dengan SD. Pemain bola basket purata 25 mata per perlawanan dengan SD 3 lebih boleh dipercayai daripada yang purata 25 dengan SD 10. Cuaca meramal menggunakan model ensemble di mana SD ramalan suhu menunjukkan kepercayaan — SD sempit bermaksud ramalan itu bersetuju; SD luas bermaksud ketidakpastian tinggi.
Pendidikan: Skor Z mengungkapkan berapa banyak standard deviasi skor pelajar dari purata kelas: Z = (skor - purata) / SD. Skor Z +2 bermaksud skor 2 SD di atas purata — lebih baik daripada kira-kira 97.7% pelajar. Ujian standard seperti SAT direka supaya skor mengikuti distribusi normal, membenarkan perbandingan persentil ini.
Berapa Pertanyaan yang Sering Ditanyakan
Apakah perbedaan antara deviasi standar dan varian?
Varian adalah rata-rata deviasi kuadrat dari nilai mean. Deviasi standar adalah akar kuadrat dari varian. Kedua-duanya mengukur sebaran, tetapi deviasi standar dalam unit yang sama dengan data (lebih mudah diinterpretasikan), sedangkan varian dalam unit kuadrat. Sebuah dataset tinggi dalam cm memiliki varian dalam cm² — tidak bermakna. SD dalam cm dapat dibandingkan secara langsung dengan pengukuran asli.
Apabila saya harus menggunakan deviasi standar populasi vs sampel?
Gunakan deviasi standar populasi (σ, membagi dengan N) ketika Anda memiliki data untuk seluruh populasi yang Anda deskripsikan — semua siswa dalam satu kelas tertentu, semua karyawan dalam satu perusahaan. Gunakan deviasi standar sampel (s, membagi dengan n−1) ketika data Anda adalah sub-sampel dari populasi yang lebih besar dan Anda ingin mengestimasi variabilitas populasi — survei sampel, partisipan uji klinis, sampel kontrol kualitas dari produksi.
Apakah artinya jika deviasi standar tinggi atau rendah?
Deviasi standar rendah berarti data titik-titiknya berkumpul erat di sekitar nilai mean — konsistensi, rendah variabilitas. Deviasi standar tinggi berarti data tersebar luas — tinggi variabilitas. Tidak ada yang lebih baik secara inheren; tergantung pada konteks. Dalam manufaktur, SD rendah diinginkan (konsistensi). Dalam pengembalian investasi, beberapa investor menerima SD yang lebih tinggi untuk potensi pengembalian yang lebih tinggi.
Apakah skor Z dan bagaimana hubungannya dengan deviasi standar?
Skor Z mengukur berapa banyak deviasi standar data titik dari nilai mean: Z = (nilai − mean) / SD. Skor Z = 0 = tepat rata-rata. Z = +1 = 1 SD di atas mean (84th persentil). Z = −2 = 2 SD di bawah mean (2.3rd persentil). Skor Z memungkinkan membandingkan nilai dari dataset yang berbeda dengan skala yang berbeda.
Apakah kesalahan standar dan bagaimana perbedaannya dengan deviasi standar?
Deviasi standar menggambarkan sebaran data titik individu. Kesalahan standar dari mean (SEM = SD/√n) menggambarkan ketepatan sampel mean sebagai perkiraan mean populasi yang sebenarnya. Semakin besar ukuran sampel, SEM menurun (data yang lebih banyak = perkiraan yang lebih akurat), tetapi SD tidak perlu berubah. SEM digunakan dalam jangkauan kepercayaan; SD menggambarkan distribusi data itu sendiri.
Apakah deviasi standar dapat negatif?
Tidak. Deviasi standar selalu nol atau positif. Ia sama dengan nol hanya ketika semua nilai data sama (tidak ada variabilitas sama sekali). Karena itu dihitung sebagai akar kuadrat dari jumlah kuadrat, tidak dapat negatif. Variansi atau deviasi standar negatif akan menunjukkan kesalahan perhitungan.
Bagaimana outlier mempengaruhi deviasi standar?
Outlier dapat memperbesar deviasi standar karena deviasi dihitung kuadrat — deviasi besar dari mean berkontribusi tidak seimbang. Misalnya, dalam {10, 11, 10, 12, 100}: menghilangkan outlier (100) mengurangi SD dari ~38 menjadi ~0,9. Ketika outlier ada, median dan rentang kuartil (IQR) adalah ukuran sentralitas dan sebaran yang lebih tahan lama.
Apakah artinya jika deviasi standar sama dengan nol?
Deviasi standar nol berarti semua nilai dalam dataset sama — tidak ada variabilitas sama sekali. Misalnya, {5, 5, 5, 5, 5} memiliki mean = 5 dan SD = 0. Ini terjadi dalam dataset buatan atau sangat terikat. Dalam dataset nyata, SD = 0 sering menunjukkan kesalahan pengumpulan data atau pengukuran identik.