Kalkulator Skor-Z – Skor Standard, Persentil & Kebarangkalian
Kira skor-z dan tukar ke persentil menggunakan taburan normal standard. Kalkulator matematik dalam talian percuma untuk keputusan tepat dan segera.
Apakah Z-Skor?
Skor z (juga dipanggil skor piawai) memberitahu anda berapa banyak deviasi piawai nilai tertentu terletak di atas atau di bawah purata datasetnya. Formula adalah mudah: z = (x − μ) / σ, di mana x ialah nilai yang diamati, μ (mu) ialah purata populasi, dan σ (sigma) ialah deviasi piawai populasi.
Kekuatan skor z terletak pada standardisasi: dengan mengubah nilai mentah kepada skor z, anda boleh membandingkan pengukuran dari skala yang berbeza. Pelajar yang mencapai 78 dalam ujian biologi (purata 70, SD 10) mempunyai z = +0.8. Pelajar yang sama mencapai 85 dalam ujian sejarah (purata 80, SD 3.33) mempunyai z = +1.5. Walaupun perbezaan skor mentah, pelajar itu bermain lebih baik dalam sejarah - fakta yang tidak dapat dilihat tanpa konversi skor z.
Skor z adalah asas dalam statistik, psikologi, pendidikan, perubatan, dan kawalan kualiti. Mereka terhubung langsung kepada kemungkinan-kemungkinan di bawah distribusi normal, membenarkan anda mengira peratusan populasi di atas, di bawah, atau di antara dua nilai mana-mana.
Distribusi Normal Piawai dan Percentil
Apabila skor z digambarkan, mereka mengikuti distribusi normal piawai - kurva berbentuk lonjakan dengan purata = 0 dan deviasi piawai = 1. Kawasan di bawah kurva ini mewakili kemungkinan: kawasan di sebelah kiri skor z sama dengan peratusan rank (peratusan nilai yang jatuh di bawah skor z tersebut).
| Skor Z | Percentil | % Di Atas | Interpretasi |
|---|---|---|---|
| −3.0 | 0.13% | 99.87% | Terlampau di bawah purata |
| −2.0 | 2.28% | 97.72% | Terlampau di bawah purata |
| −1.5 | 6.68% | 93.32% | Di bawah purata |
| −1.0 | 15.87% | 84.13% | Lebih rendah daripada purata |
| −0.5 | 30.85% | 69.15% | Purata rendah |
| 0.0 | 50.00% | 50.00% | Di atas purata |
| +0.5 | 69.15% | 30.85% | Purata tinggi |
| +1.0 | 84.13% | 15.87% | Lebih tinggi daripada purata |
| +1.5 | 93.32% | 6.68% | Di atas purata |
| +2.0 | 97.72% | 2.28% | Terlampau di atas purata |
| +3.0 | 99.87% | 0.13% | Terlampau di atas purata |
Peratus-peratus ini datang dari fungsi pengagihan kumulatif (CDF) distribusi normal. Dalam amalan, anda cari mereka dalam jadual z atau mengira mereka menggunakan perisian (Excel's NORM.S.DIST, Python's scipy.stats.norm.cdf, atau kalkulator ini).
Peraturan 68-95-99.7 (Peraturan Empirik)
Salah satu fakta yang paling banyak disebut dalam statistik, peraturan empirik menerangkan peratusan data yang jatuh dalam 1, 2, dan 3 deviasi piawai dari purata dalam distribusi normal:
- ±1σ (z antara −1 dan +1): 68.27% data
- ±2σ (z antara −2 dan +2): 95.45% data
- ±3σ (z antara −3 dan +3): 99.73% data
Setara, hanya 5% data yang terdistribusi secara normal jatuh lebih dari 2 deviasi piawai dari purata, dan hanya 0.27% (kira-kira 1 dalam 370) jatuh di luar 3 deviasi piawai. Ini adalah mengapa ±2σ adalah had yang biasa untuk "berbeza secara signifikan dari purata" dan ±3σ menandakan pelanggaran ekstrem.
| Range | Data Termasuk | Data Dikecualikan | 1-dalam-N Langka |
|---|---|---|---|
| ±1σ | 68.27% | 31.73% | ~1 dalam 3 |
| ±2σ | 95.45% | 4.55% | ~1 dalam 22 |
| ±3σ | 99.73% | 0.27% | ~1 dalam 370 |
| ±4σ | 99.9937% | 0.0063% | ~1 dalam 15,787 |
| ±6σ | 99.9999998% | 0.0000002% | ~1 dalam 506,842,372 |
Kualiti enam sigma bertujuan untuk mengurangkan kecacatan pengeluaran kepada kurang dari 3.4 per juta peluang - tahap yang menganggap perubahan proses 1.5σ dalam masa, menjadikannya kira-kira setara dengan ±4.5σ. Aspirasi "enam sigma" adalah untuk membuat kecacatan statistik tidak signifikan.
Nilai Z dalam Ujian Standard
Ujian standard — SAT, ACT, IQ, GRE, GMAT — direka untuk menghasilkan skor yang berdistribusi secara normal yang boleh diubah menjadi persentil yang bermakna menggunakan nilai Z. Ini memudahkan perbandingan di antara bentuk ujian yang berbeza (yang mungkin berbeza sedikit dalam kesukaran) dan di antara tahun.
Skor IQ: Direka dengan mean = 100 dan standard deviasi = 15. Skor IQ 130 mempunyai z = (130−100)/15 = +2.0, meletakkan orang itu di peratus ke-97.7. Skor IQ 145 mempunyai z = +3.0, meletakkan mereka di peratus ke-99.87 (sekitar 1 dalam 740 orang).
Skor SAT: Setiap bahagian (Bacaan/Bahasa dan Matematik) mempunyai mean ~500 dan SD ~100. Skor matematik 680 mempunyai z = (680−500)/100 = +1.8, kira-kira peratus ke-96. Skor gabungan 1400 (z ≈ +1.8–2.0) meletakkan pelajar di kira-kira 5% teratas daripada penerima ujian.
| Ujian | Mean | SD | Skor 1σ di atas mean | Peratus |
|---|---|---|---|---|
| IQ | 100 | 15 | 115 | 84th |
| SAT (setiap bahagian) | 500 | 100 | 600 | 84th |
| ACT | 21 | 5 | 26 | 84th |
| GRE Verbal | 150 | 8.5 | 158.5 | 84th |
Nilai Z dalam Kawalan Kualiti dan Six Sigma
Dalam pengeluaran dan kawalan kualiti proses, nilai Z digunakan untuk mengukur kemampuan proses — sejauh mana proses pengeluaran jatuh dalam had spesifikasi. Indeks kemampuan proses Cp dan Cpk diperoleh dari konsep nilai Z.
Kemampuan proses: Jika mean proses adalah μ dan standard deviasi adalah σ, dan spesifikasi memerlukan output untuk jatuh antara Had Spesifikasi Bawah (LSL) dan Had Spesifikasi Atas (USL), maka:
- zupper = (USL − μ) / σ
- zlower = (μ − LSL) / σ
- Cp = (USL − LSL) / (6σ) — mengukur taburan relatif terhadap lebar spesifikasi
- Cpk = min(zupper, zlower) / 3 — mengambil kira pusat proses
Cpk ≥ 1.33 biasanya diperlukan dalam pengeluaran kereta dan aeroangkasa (setara dengan kemampuan proses ±4σ). Pengeluaran peralatan perubatan sering memerlukan Cpk ≥ 1.67 (±5σ). Sasaran "Six Sigma" ialah Cpk = 2.0.
Nilai Z dalam Rangka Rujukan Perubatan
Perubatan makmal melaporkan hasil ujian berbanding dengan rangka rujukan, yang biasanya ditakrifkan sebagai 95% tengah-tengah populasi sihat — yang berkaitan dengan nilai Z antara −1.96 dan +1.96. Hasil di luar lingkungan ini diberi tanda "abnormal," walaupun ini bermakna hanya bahawa ia adalah tidak biasa secara statistik, bukanlah bermakna klinikal.
Kepadatan tulang (scan DEXA): Hasil dilaporkan sebagai T-scores (perbandingan dengan norma dewasa muda) dan Z-scores (perbandingan dengan norma berumur):
- T-score ≥ −1.0: Normal
- T-score −1.0 hingga −2.5: Osteopenia
- T-score < −2.5: Osteoporosis
Carta pertumbuhan: Ketinggian, berat badan, dan lingkar kepala kanak-kanak dicatat sebagai nilai Z berbanding dengan norma umur-jantina. Kanak-kanak di peratus ke-50 mempunyai z = 0; di peratus ke-97 mempunyai z = +1.88; di peratus ke-3 mempunyai z = −1.88. Nilai Z kanak-kanak memandu penilaian pemakanan dan perkembangan.
Haematologi: Bilangan darah (hemoglobin, sel darah putih, platelet) mempunyai lingkungan rujukan yang dinyatakan sebagai mean ± 2SD. Nilai di luar lingkungan ini memerlukan pemeriksaan klinikal, walaupun perbezaan individu dan perbezaan makmal bermakna konteks klinikal penting.
Uji Hipotesis dan Ujian Z
Skor Z membentuk asas ujian Z, salah satu ujian hipotesis yang paling kerap digunakan dalam statistik. Apabila menguji sama ada purata sampel berbeza secara signifikan dari purata populasi yang diketahui, anda mengira:
z = (x̄ − μ₀) / (σ / √n)
di mana x̄ ialah purata sampel, μ₀ ialah purata populasi yang dipercayai, σ ialah keteguhan piawai populasi yang diketahui, dan n ialah saiz sampel.
Jika |z| > 1.96, hasilnya signifikan secara statistik pada tahap α = 0.05 (dua hala). Jika |z| > 2.576, ia signifikan pada α = 0.01. Nilai kritikal ini datang secara langsung dari distribusi normal: 95% daripada distribusi jatuh dalam ±1.96 SD, dan 99% dalam ±2.576 SD.
| Tingkat Signifikansi (α) | Nilai Z Kritikal (dua hala) | Interpretasi |
|---|---|---|
| 0.10 (10%) | ±1.645 | 90% kepercayaan |
| 0.05 (5%) | ±1.960 | 95% kepercayaan (standard) |
| 0.01 (1%) | ±2.576 | 99% kepercayaan |
| 0.001 (0.1%) | ±3.291 | 99.9% kepercayaan |
Had dan Keterbatasan Skor Z dan Bila Tidak Menggunakannya
Skor Z dan pengiraan persentil yang diperoleh daripada mereka menganggap data asas mengikuti distribusi normal (Gaussian). Banyak dataset dunia nyata melanggar asumsi ini:
- Keuntungan dan Harta: Berbentuk sangat tidak simetri — purata adalah lebih tinggi daripada median, dan skor Z secara dramatik menghampirkan betapa jarang kekayaan ekstrem.
- Hasil kewangan: Memiliki "leher lebar" — kejadian ekstrem (krisis kewangan, keuntungan angin) berlaku dengan lebih kerap daripada distribusi normal memprediksi. Model menggunakan skor Z menghampirkan kebarangkalian krisis kewangan 2008.
- Metri media sosial: Pengikut, suka, dan tontonan mengikut distribusi kuasa, bukan distribusi normal. Skor Z tidak bermakna di sini.
- Contoh kecil: Dengan kurang dari ~30 pengamatan, distribusi t (dengan ekor yang lebih berat) lebih sesuai daripada distribusi z.
Silakan semak data anda secara kira-kira normal menggunakan histogram, Q-Q plot, atau ujian formal normaliti (Shapiro-Wilk, Anderson-Darling). Jika data tidak normal, pertimbangkan transformasi (log, akar kuadrat) atau alternatif bukan-parametrik.
Soalan Lazim
Apakah maksud z-score 1.5?
Z-score 1.5 bermaksud nilai tersebut 1.5 standard deviasi di atas purata, menempatkan ia pada kira-kira 93% peratus. Sekitar 93.3% daripada nilai dalam taburan normal jatuh di bawah titik ini, dan 6.7% jatuh di atasnya.
Apakah z-score yang baik?
"Baik" bergantung pada konteks. Untuk markah ujian atau metrik prestasi, z-scores yang lebih tinggi lebih baik. Untuk indikator risiko (kolesterol, tekanan darah), z-scores yang hampir 0 adalah yang paling sihat. Dalam kawalan kualiti, z-scores di luar ±3 menandakan kecacatan atau kelainan. Tiada z-score yang "baik" secara universal - ia bergantung pada apa yang diukur.
Bagaimana saya boleh mengira z-score?
Subtrakh purata dari nilai, kemudian bahagikan oleh piawai deviasi: z = (x − μ) / σ. Contoh: skor 85, purata 70, SD 10 → z = (85−70)/10 = 1.5. Ini bermaksud skor tersebut 1.5 piawai deviasi di atas purata kelas.
Apakah z-score untuk 95% peratus?
Z-score yang berkaitan dengan 95% peratus adalah kira-kira +1.645 (satu hala). Ini juga nilai kritikal untuk ujian signifikan satu hala pada α = 0.05. Untuk julat 95% dua hala (i.e., 95% tengah taburan), hadnya adalah ±1.96.
Adakah z-score boleh negatif?
Ya. Z-score negatif bermaksud nilai tersebut di bawah purata. Z-score -1.0 bermaksud nilai tersebut 1 piawai deviasi di bawah purata, di 15.87% peratus. Z-scores berbeza dari -∞ ke +∞, walaupun nilai di luar ±4 sangat jarang berlaku dalam data yang terdistribusi normal.
Apakah perbezaan antara z-score dan t-score?
Both standardise data relative to mean and standard deviation. A z-score assumes the population standard deviation (σ) is known. A t-score (or t-statistic) uses the sample standard deviation (s) as an estimate when σ is unknown, and follows the heavier-tailed t-distribution. For large samples (n > 30), t and z are nearly identical.
Bagaimana z-score digunakan dalam kewangan?
The Altman Z-score predicts corporate bankruptcy risk using a weighted combination of financial ratios. In risk management, z-scores measure how many standard deviations a portfolio return is from zero (Value at Risk). In algorithmic trading, z-scores of price spreads identify mean-reversion opportunities (pairs trading).
Apakah peratusan data yang jatuh dalam 2 piawai deviasi?
Sebanyak 95.45% data jatuh dalam ±2σ dari purata dalam taburan normal (empirical rule). Angka tepatnya 95.449%. Angka komplementari 4.551% terletak di luar ±2σ - 2.275% di setiap ekor. Ini adalah mengapa ±2σ adalah had yang standard untuk "statistik signifikan" dalam banyak bidang (α = 0.05, dua hala).
Bagaimana saya boleh mengubah z-score kepada peratus?
Carilah z-score dalam jadual normal piawai (z-table), yang memberikan probabiliti kumulatif. Kali dengan 100 untuk peratus. Contoh: z = 1.0 → 0.8413 → 84% peratus. Atau, gunakan formula: peratus = Φ(z) × 100, di mana Φ adalah CDF piawai normal. Excel: =NORM.S.DIST(z,TRUE)×100.
Apakah z-score digunakan untuk dalam kawalan kualiti?
Dalam pengurusan kualiti Six Sigma, z-scores mengukur kemampuan proses. Proses yang berjalan pada ±3σ (z = 3) menghasilkan 2,700 kecacatan setiap juta. Pada ±6σ (z = 6) ia menghasilkan hanya 3.4 kecacatan setiap juta (mengambil kira pergeseran proses yang biasa). Indeks Cp dan Cpk menggunakan langsung konsep z-score untuk mengukur sejauh mana proses memenuhi spesifikasi.
Deteksi Outlier Menggunakan Z-Skor
Salah satu aplikasi praktis yang paling umum dari z-skor adalah deteksi outlier — mengidentifikasi titik data yang sangat jauh dari rata-rata dan mungkin mewakili kesalahan, peristiwa luar biasa, atau pengamatan yang sangat tidak biasa yang memerlukan investigasi.
Lintasan standar untuk mengidentifikasi outlier adalah |z| > 3. Nilai yang lebih dari 3 deviasi standar dari rata-rata diharapkan hanya 0,27% dalam pengamatan di bawah distribusi normal — sekitar 1 dalam 370 titik data. Dalam dataset 1.000 pengukuran, Anda akan mengharapkan hanya ~3 nilai di luar ±3σ secara kebetulan. Jika Anda menemukan 20 nilai seperti itu, sesuatu yang tidak biasa terjadi — gangguan peralatan, kesalahan input data, atau pengamatan ekstrem yang autentik.
Kriteria yang lebih ketat digunakan dalam bidang tertentu:
- Perangkat medis: Ambang alarm pada ±2σ (5% tingkat alarm) hingga ±3σ (0,27% tingkat alarm) tergantung pada kebutuhan klinis
- Pasaran keuangan: "Ekor lemak" (fat tail) yang melebihi ±4σ terjadi jauh lebih sering daripada distribusi normal memprediksi — krisis keuangan 2008 melibatkan gerakan 5–7σ yang teori "mustahil" di bawah asumsi distribusi normal
- Kontrol kualitas: Nilai di luar ±3σ (defek dalam kerangka enam sigma) memerlukan investigasi proses dan analisis penyebab
- Penelitian ilmiah: Ambang 5σ (|z| > 5) diperlukan untuk mengklaim penemuan fisika partikel (seperti pengumuman boson Higgs pada tahun 2012 di CERN)
| Lintasan Z-Skor | % Teridentifikasi (normal) | Digunakan Dalam |
|---|---|---|
| |z| > 2.0 | 4,55% | Skoring data awal |
| |z| > 2,5 | 1,24% | Referensi rentang medis |
| |z| > 3,0 | 0,27% | Kontrol kualitas, deteksi outlier |
| |z| > 4,0 | 0,0063% | Analisis defek proses |
| |z| > 5,0 | 0,00006% | Klaim penemuan fisika partikel |
Catatan penting: data nyata sering memiliki ekor yang lebih berat daripada distribusi normal memprediksi (distribusi leptokurtik). Selalu inspeksi outlier secara manual — skor z-4 mungkin merupakan kesalahan input data (48 direkam sebagai 4,8) atau nilai ekstrem yang autentik dengan makna penting. Tidak pernah menghapus outlier secara otomatis tanpa investigasi.
Skor Z dalam Kewangan dan Pengurusan Risiko
Dalam kewangan, skor z mempunyai pelbagai aplikasi kritikal yang penting di luar statistik akademik. Yang paling terkenal ialah Skor Z Altman (1968), model prediksi kebankrapan yang menggabungkan lima nisbah kewangan ke dalam skor diskriminan tunggal:
Z = 1.2×(Kewangan Kerja/Aset Jumlah) + 1.4×(Pendapatan Semula/Asas Jumlah) + 3.3×(EBIT/Asas Jumlah) + 0.6×(Kapital Pasaran/Utang Jumlah) + 1.0×(Pendapatan/Asas Jumlah)
Interpretasi Skor Z Altman: Z > 2.99 = Zon Selamat; 1.81–2.99 = Zon Abang; Z < 1.81 = Zon Kesulitan (risiko kebankrapan tinggi). Model ini dapat memprediksi kebankrapan dengan betul dalam 94% kes dalam kajian asal dan masih digunakan secara meluas oleh analisis kredit dan pelabur hari ini.
Nilai di Bawah Risiko (VaR): Dalam pengurusan risiko portfolio, VaR menggunakan skor z untuk mengukur potensi kehilangan. 1-hari 95% VaR untuk portfolio dengan purata harian μ dan piawai harian σ ialah: VaR = -(μ + z × σ) di mana z = -1.645 (peratus ke-5). Jika portfolio $1M mempunyai harian μ = 0% dan σ = 1%, VaR pada kepercayaan 95% = 1.645% × $1M = $16,450. Ini bermaksud terdapat 5% kemungkinan kehilangan lebih daripada $16,450 dalam satu hari.
| Tingkat Kepercayaan | Skor Z Digunakan | Interpretasi |
|---|---|---|
| 90% | -1.282 | Kehilangan melebihi 10% hari dagangan |
| 95% | -1.645 | Kehilangan melebihi 5% hari dagangan |
| 99% | -2.326 | Kehilangan melebihi 1% hari dagangan |
| 99.9% | -3.090 | Kehilangan melebihi 0.1% hari dagangan |
<h2>Mengira Skor Z dengan Data Sampel</h2>
<p>Apabila bekerja dengan sampel (bukan populasi yang diketahui), anda menganggarkan parameter populasi dari sampel. Purata sampel (x̄) menganggarkan μ, dan piawai sampel (s) menganggarkan σ. Formula skor z tetap sama: z = (x - x̄) / s.</p>
<p>Bagaimanapun, dengan sampel kecil, skor z yang dihasilkan mengikut distribusi t (bukan distribusi normal) disebabkan oleh ketidakpastian tambahan dalam menganggarkan σ. Distribusi t mempunyai ekor yang lebih tebal, mewakili ketidakpastian yang lebih besar. Bagi sampel 30 atau lebih, distribusi t dan distribusi normal hampir sama, dan skor z dari kedua pengiraan hampir sama.</p>
<p>Apabila anda mempunyai dataset dan mahu standardisasi semua nilai (mengubah keseluruhan dataset ke skor z), ini dipanggil <strong>standardisasi ciri</strong> atau <strong>standardisasi</strong> dalam pembelajaran mesin. Ia adalah langkah pra-proses yang meletakkan semua ciri pada skala yang sama (purata = 0, piawai = 1), mencegah ciri dengan nilai mutlak yang lebih besar daripada menguasai algoritma jarak (KNN, SVM, rangkaian saraf). Setelah standardisasi, setiap ciri skor z boleh dibandingkan secara langsung tanpa kira unit asal atau skala.</p>
<p>Untuk standardisasi dataset dalam Python: <code>from sklearn.preprocessing import StandardScaler; scaler = StandardScaler(); X_scaled = scaler.fit_transform(X)</code>. Dalam Excel: untuk setiap nilai dalam satu kolum, komput <code>=STANDARDIZE(value, AVERAGE(range), STDEV(range))</code>.</p>