Máy Tính Độ Lệch Chuẩn
Tính độ lệch chuẩn, phương sai, trung bình và nhiều hơn nữa cho bất kỳ tập dữ liệu nào. Hỗ trợ cả tính toán tổng thể và mẫu. Giải pháp từng bước miễn phí.
Độ Lệch Chuẩn Là Gì và Tại Sao Nó Quan Trọng?
Độ lệch chuẩn đo mức độ phân tán của dữ liệu xung quanh trung bình (giá trị trung bình). Độ lệch chuẩn nhỏ có nghĩa là các giá trị tập trung chặt chẽ quanh trung bình; độ lệch chuẩn lớn có nghĩa là các giá trị phân tán rộng.
Hai tập dữ liệu có thể có cùng trung bình nhưng phân phối hoàn toàn khác nhau — độ lệch chuẩn nắm bắt sự khác biệt đó:
- Tập dữ liệu A: {9, 10, 10, 11, 10} — Trung bình = 10, SD ≈ 0,63 (cụm chặt)
- Tập dữ liệu B: {2, 5, 10, 15, 18} — Trung bình = 10, SD ≈ 5,83 (phân tán rộng)
Cả hai có trung bình bằng 10, nhưng Tập dữ liệu B biến thiên gần 10× nhiều hơn. Độ lệch chuẩn làm rõ điều này.
Độ Lệch Chuẩn Tổng Thể vs Mẫu
Lựa chọn quan trọng nhất khi tính độ lệch chuẩn là bạn đang làm việc với tổng thể (tất cả các điểm dữ liệu có thể) hay mẫu (một tập con):
Độ lệch chuẩn tổng thể (σ): Dùng khi có dữ liệu cho toàn bộ nhóm. Công thức: σ = √[Σ(xᵢ − μ)² / N]
Độ lệch chuẩn mẫu (s): Dùng khi dữ liệu là mẫu từ tổng thể lớn hơn. Công thức: s = √[Σ(xᵢ − x̄)² / (n−1)]
Hiệu chỉnh Bessel (n−1 thay vì n) vì các mẫu có xu hướng ước tính thấp phương sai tổng thể thực — đặc biệt với mẫu nhỏ.
Quy Tắc Thực Nghiệm và Phân Phối Chuẩn
Đối với dữ liệu theo phân phối chuẩn (đường cong hình chuông), Quy tắc Thực nghiệm (quy tắc 68-95-99,7) cho bạn biết chính xác bao nhiêu giá trị nằm trong mỗi phạm vi độ lệch chuẩn:
| Phạm vi | Tỷ lệ dữ liệu | Ví dụ (trung bình=100, SD=15) |
|---|---|---|
| Trung bình ± 1 SD | ~68,27% | 85 đến 115 |
| Trung bình ± 2 SD | ~95,45% | 70 đến 130 |
| Trung bình ± 3 SD | ~99,73% | 55 đến 145 |
| Ngoài ± 3 SD | ~0,27% | Dưới 55 hoặc trên 145 |
Ứng dụng cổ điển là điểm IQ: trung bình = 100, SD = 15. IQ 130 cao hơn trung bình 2 SD — chỉ khoảng 2,3% người đạt được điểm cao như vậy.
Câu Hỏi Thường Gặp
Khi nào tôi sử dụng độ lệch chuẩn tổng thể vs mẫu?
Dùng độ lệch chuẩn tổng thể (σ, chia cho N) khi bạn có dữ liệu cho toàn bộ tổng thể bạn quan tâm. Dùng độ lệch chuẩn mẫu (s, chia cho n−1) khi dữ liệu của bạn là mẫu để suy luận về tổng thể lớn hơn. Trong thực tế, đây là lựa chọn mặc định của hầu hết công việc thống kê vì chúng ta hiếm khi có dữ liệu cho toàn bộ tổng thể.
Độ lệch chuẩn cao hay thấp tốt hơn?
Phụ thuộc vào bối cảnh. Trong kiểm soát chất lượng sản xuất, SD thấp tốt hơn (các bộ phận nhất quán). Trong đầu tư, SD thấp hơn (ít biến động hơn) được ưa thích nếu mục tiêu là bảo toàn vốn. Nhưng trong nghiên cứu sinh học học, SD cao có thể phản ánh sự đa dạng tự nhiên thực sự. SD là thước đo biến thiên — nó không tự tốt hay xấu.
Độ lệch chuẩn và phương sai khác nhau như thế nào?
Phương sai = SD². Phương sai được biểu thị bằng đơn vị bình phương (ví dụ: điểm² hoặc kg²), khó diễn giải trực tiếp. Độ lệch chuẩn là căn bậc hai của phương sai, được biểu thị bằng cùng đơn vị với dữ liệu gốc — làm cho nó dễ hiểu hơn. Cả hai đo lường sự phân tán; SD thực tế hơn cho báo cáo; phương sai hữu ích hơn trong các phương trình thống kê.