Kalkulator Z-Score - Skor Standar, Persentil & Probabilitas
Hitung skor z dan ubah menjadi persentil menggunakan distribusi normal standar. Cobalah kalkulator matematika online gratis ini untuk hasil instan dan akurat.
Apa Itu Skor Z?
Sebuah z-skor (juga disebut skor standar) memberitahu Anda persis berapa banyakdeviasi standarsuatu nilai tertentu berada di atas atau di bawah rata-rata datasetnya. Rumusnya sederhana sekali:z = (x - μ) / σ, di mana x adalah nilai yang diamati, μ (mu) adalah rata-rata populasi, dan σ (sigma) adalah penyimpangan standar populasi.
Kekuatan z-score terletak pada standarisasi: dengan mengkonversi nilai mentah menjadi z-score, Anda dapat membandingkan pengukuran dari skala yang sama sekali berbeda. Seorang siswa yang mencetak 78 pada tes biologi (rata-rata 70, SD 10) memiliki z = +0,8. Siswa yang sama yang mencetak 85 pada tes sejarah (rata-rata 80, SD 3,33) memiliki z = +1,5. Meskipun perbedaan skor mentah, siswa berkinerja relatif lebih baik dalam sejarah - fakta yang tidak terlihat tanpa konversi skor z.
Skor Z adalah dasar dalam statistik, psikologi, pendidikan, kedokteran, dan kontrol kualitas. Mereka terhubung langsung dengan probabilitas di bawah distribusi normal, memungkinkan Anda untuk menghitung persentase populasi di atas, di bawah, atau di antara dua nilai.
Distribusi Normal Standar dan Persentil
Ketika z-skor digambarkan, mereka mengikutidistribusi normal standar-- kurva berbentuk lonceng dengan mean = 0 dan standar deviasi = 1. Daerah di bawah kurva ini mewakili probabilitas: daerah ke kiri dari z-skor sama dengan pangkat persentil (persentase nilai yang jatuh di bawah bahwa z-skor).
| Z-Score | Persentil | % Di atas | Interpretasi |
|---|---|---|---|
| -3,0 | 0,13% | 99,87% | Sangat di bawah rata-rata |
| -2.0 | 2,28% | 97,72% | Jauh di bawah rata-rata |
| -1,5 | 6,68% | 93,32% | Di bawah rata-rata |
| -1,0 | 15,87% | 84,13% | Sedikit di bawah rata-rata |
| -0,5 | 30,85% | 69,15% | Rata-rata rendah |
| 0.0 | 50,00% | 50,00% | Tepat pada rata-rata |
| +0,5 | 69,15% | 30,85% | Rata-rata tinggi |
| +1,0 | 84,13% | 15,87% | Sedikit di atas rata-rata |
| +1,5 | 93,32% | 6,68% | Di atas rata-rata |
| +2.0 | 97,72% | 2,28% | Jauh di atas rata-rata |
| +3,0 | 99,87% | 0,13% | Sangat di atas rata-rata |
Persentil ini berasal dari fungsi distribusi kumulatif (CDF) dari distribusi normal. Dalam prakteknya, Anda mencarinya di tabel z atau menghitungnya menggunakan perangkat lunak (Excel's NORM.S.DIST, Python's scipy.stats.norm.cdf, atau kalkulator ini).
Aturan 68-95-99.7 (Aturan Empiris)
Salah satu fakta yang paling banyak dikutip dalam statistik,aturan empirismenggambarkan persentase data yang berada dalam 1, 2, dan 3 standar deviasi dari rata-rata dalam distribusi normal:
- +/-1σ (z antara -1 dan +1):68.27% dari data
- +/-2σ (z antara -2 dan +2):95,45% dari data
- +/-3σ (z antara -3 dan +3):99,73% dari data
Sama halnya, hanya 5% dari data yang didistribusikan secara normal jatuh lebih dari 2 standar deviasi dari rata-rata, dan hanya 0,27% (sekitar 1 dari 370) jatuh lebih dari 3 standar deviasi.
| Jangkauan | Data Termasuk | Data yang Dieksklusi | 1-in-N langka |
|---|---|---|---|
| +/-1σ | 68,27% | 31,73% | ~ 1 dari 3 |
| +/-2σ | 95,45% | 4,55% | ~ 1 dari 22 |
| +/-3σ | 99,73% | 0,27% | ~ 1 dari 370 |
| +/-4σ | 99,9937% | 0,0063% | ~ 1 dari 15.787 |
| +/-6σ | 99,9999998% | 0,0000002% | ~1 dari 506.842.372 |
Manajemen kualitas Six Sigma bertujuan untuk mengurangi cacat manufaktur menjadi kurang dari 3,4 per juta peluang - tingkat yang mengasumsikan 1,5σ pergeseran proses dari waktu ke waktu, membuatnya kira-kira setara dengan +/-4,5σ. Aspirasi kinerja "six sigma" adalah untuk membuat cacat tidak signifikan secara statistik.
Z-Score dalam Tes Standarisasi
Tes standar - SAT, ACT, tes IQ, GRE, GMAT - dirancang untuk menghasilkan skor terdistribusi normal yang dapat secara bermakna dikonversi menjadi persentil menggunakan skor z. Ini memungkinkan perbandingan di berbagai bentuk tes (yang mungkin sedikit berbeda dalam kesulitan) dan di berbagai tahun.
Skor IQ:Dirancang dengan mean = 100 dan standar deviasi = 15. IQ 130 memiliki z = (130-100) / 15 = +2.0, menempatkan orang di percentil ke-97.7. IQ 145 memiliki z = +3.0, menempatkan mereka di percentil ke-99.87 (sekitar 1 dari 740 orang).
Skor SAT:Setiap bagian (Evidence-Based Reading/Writing and Math) memiliki mean ~500 dan SD ~100. Skor matematika 680 memiliki z = (680-500)/100 = +1.8, kira-kira persentil ke-96. Skor gabungan 1400 (z ~ +1.8 - 2.0) menempatkan siswa di sekitar 5% teratas dari peserta tes.
| Uji coba | Kejam | SD | Skor 1σ di atas rata-rata | Persentil |
|---|---|---|---|---|
| IQ | 100 tahun | 15 | 115 yang | Ke-84 |
| SAT (setiap bagian) | 500 kali | 100 tahun | 600 tahun | Ke-84 |
| ACT | 21 | 5 | 26 | Ke-84 |
| GRE Verbal | 150 tahun | 8,5 | 158,5 | Ke-84 |
Z-Score dalam Kontrol Kualitas dan Six Sigma
Dalam manufaktur dan pengendalian kualitas proses, z-score digunakan untuk mengukur kemampuan proses - seberapa baik proses produksi berada dalam batas spesifikasi. Indeks kemampuan proses Cp dan Cpk berasal dari konsep z-score.
Kemampuan proses:Jika rata-rata proses adalah μ dan standar deviasi adalah σ, dan spesifikasi mengharuskan output berada di antara Lower Spec Limit (LSL) dan Upper Spec Limit (USL), maka:
- zbagian atas= (USL - μ) / σ
- zlebih rendah= (μ - LSL) / σ
- Cp = (USL - LSL) / (6σ) -- ukuran spread relatif terhadap lebar spesifikasi
- Cpk = min{z}bagian atas, zlebih rendah) / 3 -- akun untuk proses sentralisasi
Cpk >= 1.33 biasanya diperlukan dalam manufaktur otomotif dan aerospace (setara dengan +/-4σ kemampuan proses). manufaktur perangkat medis sering membutuhkan Cpk >= 1.67 (+/-5σ). target dari "Six Sigma" proses adalah Cpk = 2.0.
Z-Score dalam Rentang Referensi Medis
Laboratorium medis melaporkan hasil tes relatif terhadap rentang referensi, yang biasanya didefinisikan sebagai 95% sentral dari populasi yang sehat - sesuai dengan skor z antara -1,96 dan +1,96. Hasil di luar rentang ini ditandai sebagai "abnormal", meskipun ini hanya berarti secara statistik tidak biasa, tidak selalu berkaitan secara klinis.
Kepadatan tulang (DEXA scan):Hasilnya dilaporkan sebagai T-score (perbandingan dengan norma dewasa muda) dan Z-score (perbandingan dengan norma sesuai usia):
- T-score >= -1,0: Normal
- T-score -1,0 sampai -2,5: Osteopenia
- T-score < -2,5: Osteoporosis
Grafik pertumbuhan:Tinggi, berat badan, dan lingkar kepala anak-anak digambarkan sebagai skor z relatif terhadap norma usia-seks. Anak pada persentil ke-50 memiliki z = 0; pada persentil ke-97 z = +1.88; pada persentil ke-3 z = -1.88.
Hematologi:Jumlah darah (hemoglobin, sel putih, trombosit) memiliki kisaran referensi yang dinyatakan sebagai rata-rata +/- 2SD. Nilai di luar kisaran ini memicu tinjauan klinis, meskipun variasi individu dan perbedaan laboratorium berarti konteks klinis sangat penting.
Pengujian Hipotesis dan Z-Test
Z-score membentuk dasar dari z-test, salah satu tes hipotesis yang paling umum digunakan dalam statistik. Saat menguji apakah rata-rata sampel berbeda secara signifikan dari rata-rata populasi yang diketahui, Anda menghitung:
z = (x̄ - μ0) / (σ / √n)
di mana x̄ adalah rata-rata sampel, μ0 adalah rata-rata populasi hipotesis, σ adalah penyimpangan standar populasi yang diketahui, dan n adalah ukuran sampel.
Jika z adalah > 1,96, hasilnya signifikan secara statistik pada tingkat α = 0,05 (dua ekor). Jika z adalah > 2,576, maka signifikan pada α = 0,01. Nilai-nilai kritis ini berasal langsung dari distribusi normal: 95% dari distribusi jatuh dalam +/-1,96 SD, dan 99% dalam +/-2,576 SD.
| Tingkat signifikansi (α) | Nilai z kritis (dua ekor) | Interpretasi |
|---|---|---|
| 0,10 (10%) | +/-1.645 | Keandalan 90% |
| 0,05 (5%) | +/-1.960 | 95% kepercayaan (standar) |
| 0,01 (1%) | +/-2.576 | Keandalan 99% |
| 0,001 (0,1%) | +/-3.291 | Keyakinan 99,9% |
Keterbatasan Z-Score dan Kapan Tidak Menggunakannya
Z-score dan perhitungan persentil yang berasal dari mereka mengasumsikan data yang mendasari mengikutidistribusi normal (Gaussian)Banyak dataset dunia nyata melanggar asumsi ini:
- Pendapatan dan kekayaan:Sangat miring ke kanan -- rata-rata jauh lebih tinggi dari median, dan skor z secara dramatis meremehkan betapa jarangnya kekayaan ekstrim.
- Hasil keuangan:Memiliki "ekor gemuk" - peristiwa ekstrim (kecelakaan pasar, kejutan) terjadi jauh lebih sering daripada perkiraan distribusi normal. Model yang menggunakan skor z meremehkan probabilitas krisis keuangan 2008.
- Metrik media sosial:Pengikut, suka, dan pandangan mengikuti distribusi hukum kekuasaan, bukan distribusi normal.
- Sampel kecil:Dengan kurang dari ~ 30 pengamatan, distribusi t (dengan ekor yang lebih berat) lebih tepat daripada distribusi z.
Sebelum menerapkan analisis skor z, selalu periksa bahwa data Anda didistribusikan secara normal menggunakan histogram, plot Q-Q, atau tes normalitas formal (Shapiro-Wilk, Anderson-Darling). Jika data tidak normal, pertimbangkan transformasi (logaritma, akar kuadrat) atau alternatif non-parametrik.
Pertanyaan yang Sering Diajukan
Apa artinya skor z 1,5?
Nilai z-score 1,5 berarti nilai 1,5 standar deviasi di atas rata-rata, menempatkannya sekitar persentil ke-93. Sekitar 93,3% nilai dalam distribusi normal berada di bawah titik ini, dan 6,7% berada di atasnya.
Apa nilai z yang baik?
"Baik" tergantung pada konteks. Untuk skor tes atau metrik kinerja, skor z yang lebih tinggi lebih baik. Untuk indikator risiko (kolesterol, tekanan darah), skor z dekat 0 adalah yang paling sehat. Dalam kontrol kualitas, skor z di luar +/-3 cacat bendera atau outlier. Tidak ada skor z yang "baik" secara universal - itu tergantung pada apa yang sedang diukur.
Bagaimana cara menghitung skor z?
Potong nilai rata-rata dari nilai Anda, lalu bagi dengan standar deviasi: z = (x - μ) / σ. Contoh: skor 85, rata-rata 70, SD 10 -> z = (85-70) / 10 = 1.5. Ini berarti skornya 1,5 standar deviasi di atas rata-rata kelas.
Apa skor z untuk persentil ke-95?
Nilai z yang sesuai dengan persentil ke-95 adalah sekitar +1.645 (satu ekor). Ini juga merupakan nilai kritis untuk tes signifikansi satu ekor pada α = 0.05. Untuk kisaran 95% dua ekor (yaitu, 95% pusat distribusi), cutoff adalah +/-1.96.
Bisakah skor z negatif?
Ya. Skor z negatif berarti nilai di bawah rata-rata. Skor z -1,0 berarti nilai adalah satu standar deviasi di bawah rata-rata, pada persentil ke-15,87. Skor Z berkisar dari -∞ hingga +∞, meskipun nilai di atas +/-4 sangat jarang terjadi pada data berdistribusi normal.
Apa perbedaan antara skor z dan skor t?
Keduanya menstandarisasi data relatif terhadap rata-rata dan standar deviasi. Skor z mengasumsikan standar deviasi populasi (σ) diketahui. Skor t (atau t-statistik) menggunakan standar deviasi sampel sebagai perkiraan ketika σ tidak diketahui, dan mengikuti distribusi t yang lebih berat. Untuk sampel besar (n > 30), t dan z hampir identik.
Bagaimana z-score digunakan dalam keuangan?
Altman Z-score memprediksi risiko kebangkrutan perusahaan menggunakan kombinasi rasio keuangan tertimbang. Dalam manajemen risiko, z-score mengukur berapa banyak standar deviasi laba portofolio dari nol (Value at Risk). Dalam perdagangan algoritmik, z-score spread harga mengidentifikasi peluang reversi rata-rata (pairs trading).
Berapa persentase data yang berada dalam 2 standar deviasi?
Sekitar 95,45% dari data jatuh dalam +/-2σ dari rata-rata dalam distribusi normal (aturan empiris). Angka yang tepat adalah 95,449%. Komplementer 4,551% terletak di luar +/-2σ - 2,275% di setiap ekor. Inilah sebabnya mengapa +/-2σ adalah ambang standar untuk "signifikan secara statistik" di banyak bidang (α = 0,05, dua ekor).
Bagaimana saya mengubah skor z menjadi persentil?
Carilah nilai z dalam tabel normal standar (z-table), yang memberikan probabilitas kumulatif. Kalikan dengan 100 untuk persentil. Misalnya, z = 1,0 -> 0,8413 -> persentil ke-84. Sebagai alternatif, gunakan rumus: persentil = Φ ((z) x 100, di mana Φ adalah CDF normal standar. Excel: = NORM.S.DIST ((z,TRUE) x100.
Apa nilai z yang digunakan dalam pengendalian kualitas?
Dalam manajemen kualitas Six Sigma, z-score mengukur kemampuan proses. Proses yang berjalan pada +/-3σ (z = 3) menghasilkan 2.700 cacat per juta. Pada +/-6σ (z = 6) menghasilkan hanya 3,4 cacat per juta (menghitung drift proses yang khas). Indeks Cp dan Cpk secara langsung menggunakan konsep z-score untuk mengukur seberapa baik proses memenuhi spesifikasi.
Deteksi Outlier Menggunakan Z-Score
Salah satu aplikasi praktis yang paling umum dari skor z adalah deteksi outlier -- mengidentifikasi titik data yang sangat jauh dari rata-rata dan mungkin mewakili kesalahan, peristiwa luar biasa, atau pengamatan yang benar-benar tidak biasa yang memerlukan penyelidikan.
Nilai lebih dari 3 standar deviasi dari rata-rata diharapkan hanya dalam 0,27% pengamatan di bawah distribusi normal - kira-kira 1 dari 370 titik data. Dalam dataset 1.000 pengukuran, Anda akan mengharapkan hanya ~ 3 nilai di luar +/-3σ secara kebetulan. Jika Anda menemukan 20 nilai seperti itu, sesuatu yang tidak biasa terjadi - kerusakan peralatan, kesalahan entri data, atau pengamatan ekstrim yang asli.
Kriteria yang lebih ketat digunakan dalam bidang-bidang tertentu:
- Perangkat medis:Ambang alarm pada +/-2σ (5% tingkat alarm) hingga +/-3σ (0,27% tingkat alarm) tergantung pada urgensi klinis
- Pasar keuangan:Peristiwa "ekor gemuk" di luar +/-4σ terjadi jauh lebih sering daripada perkiraan distribusi normal - krisis keuangan 2008 melibatkan pergerakan 5 - 7σ yang secara teoritis "tidak mungkin" di bawah asumsi distribusi normal
- Kontrol kualitas:Nilai di atas +/-3σ (kekurangan dalam kerangka kerja Six Sigma) memerlukan penyelidikan proses dan analisis akar penyebab
- Penelitian ilmiah:5σ ambang batas diperlukan untuk mengklaim penemuan fisika partikel (seperti di 2012 Higgs boson pengumuman di CERN)
| Ambang Z-Score | % Ditandai (normal) | Digunakan Dalam |
|---|---|---|
| Apa yang kau lakukan? | 4,55% | Penyaringan data awal |
| "Z" = 2,5 | 1,24% | Rentang referensi medis |
| Apa yang kau lakukan? | 0,27% | Kontrol kualitas, deteksi outlier |
| "Z" = 4,0 | 0,0063% | Analisis cacat proses |
| Apa yang kau lakukan? | 0,00006% | Klaim penemuan fisika partikel |
Peringatan penting: data dunia nyata sering memiliki ekor yang lebih berat daripada prediksi distribusi normal (distribusi leptokurtik). Selalu periksa outlier secara manual - skor z 4 mungkin merupakan kesalahan entri data (48 dicatat sebagai 4,8) atau nilai ekstrem asli dengan makna penting. Jangan pernah menghapus outlier secara otomatis tanpa penyelidikan.
Z-Score di bidang Keuangan dan Manajemen Risiko
Dalam bidang keuangan, skor z memiliki beberapa aplikasi penting di luar statistik akademik.Altman Z-Score(1968), sebuah model prediksi kebangkrutan yang menggabungkan lima rasio keuangan menjadi satu skor diskriminatif:
Z = 1,2x ((Working Capital/Total Aset) + 1,4x ((Retained Earnings/Total Aset) + 3,3x ((EBIT/Total Aset) + 0,6x ((Market Cap/Total Liabilities) + 1,0x ((Revenue/Total Aset)
Interpretasi Altman Z-Score: Z > 2,99 = zona aman; 1,81 - 2,99 = zona abu-abu; Z < 1,81 = zona kesusahan (risiko kebangkrutan tinggi).
Nilai Berisiko (VaR):Dalam manajemen risiko portofolio, VaR menggunakan nilai z untuk mengukur potensi kerugian. 1 hari 95% VaR untuk portofolio dengan rata-rata pengembalian harian μ dan standar deviasi σ adalah: VaR = -(μ + z x σ) di mana z = -1.645 (persentil ke-5). Jika portofolio $ 1M memiliki harian μ = 0% dan σ = 1%, VaR pada 95% kepercayaan = 1.645% x $ 1M = $ 16.450. Ini berarti ada 5% kemungkinan kehilangan lebih dari $ 16.450 dalam satu hari.
| Tingkat kepercayaan | Z-Score yang Digunakan | Interpretasi |
|---|---|---|
| 90% | -1.282 | Kerugian melebihi 10% dari hari perdagangan |
| 95% | -1.645 | Kerugian melebihi 5% dari hari perdagangan |
| 99 persen | -2.326 | Kerugian melebihi 1% dari hari perdagangan |
| 99,9% | -3.090 | Kerugian melebihi 0,1% dari hari perdagangan |
Menghitung Z-Score dengan Data Sampel
Ketika bekerja dengan sampel (bukan populasi yang diketahui), Anda memperkirakan parameter populasi dari sampel. Rata-rata sampel (x̄) memperkirakan μ, dan standar deviasi sampel (s) memperkirakan σ. Rumus z-skor tetap sama: z = (x - x̄) / s.
Namun, dengan sampel kecil, skor z yang dihasilkan mengikuti distribusi t (bukan distribusi normal) karena ketidakpastian tambahan dalam memperkirakan σ. Distribusi t memiliki ekor yang lebih berat, mencerminkan ketidakpastian yang lebih besar ini.
Ketika Anda memiliki dataset dan ingin menstandarisasi semua nilai (mengkonversi seluruh dataset ke z-skor), ini disebutpengukuran fitur or Standarisasidalam pembelajaran mesin. Ini adalah langkah pra-pemrosesan yang menempatkan semua fitur pada skala yang sama (mean = 0, SD = 1), mencegah fitur dengan nilai absolut yang lebih besar mendominasi algoritma berbasis jarak (KNN, SVM, jaringan saraf). Setelah standardisasi, masing-masing fitur z-score secara langsung dapat dibandingkan terlepas dari unit atau skala asli.
Untuk menstandarisasi dataset di Python:from sklearn.preprocessing import StandardScaler; scaler = StandardScaler(); X_scaled = scaler.fit_transform(X)Dalam Excel: untuk setiap nilai dalam kolom, menghitung=STANDARDIZE(value, AVERAGE(range), STDEV(range)).