Máy Tính Trung Bình, Trung Vị và Yếu Vị
Tính trung bình cộng, trung vị, yếu vị, khoảng dao động và các thống kê khác cho bất kỳ tập dữ liệu nào. Miễn phí, kết quả tức thì.
Hiểu Về Các Thước Đo Xu Hướng Trung Tâm
Trong thống kê, thước đo xu hướng trung tâm là các giá trị đơn mô tả trung tâm hoặc giá trị điển hình của một tập dữ liệu. Ba thước đo quan trọng nhất là trung bình cộng, trung vị và yếu vị — mỗi thước đo cho bạn biết điều gì đó khác nhau về dữ liệu.
Xét tập dữ liệu điểm thi: {55, 60, 70, 75, 75, 80, 95}. Mỗi thước đo cho một góc nhìn khác:
| Thước đo | Giá trị | Cách tính | Phù hợp nhất cho |
|---|---|---|---|
| Trung bình cộng | 72,9 | (55+60+70+75+75+80+95) / 7 | Phân phối đối xứng |
| Trung vị (giá trị giữa) | 75 | Giá trị giữa sau khi sắp xếp | Phân phối lệch, ngoại lệ |
| Yếu vị (thường gặp nhất) | 75 | Giá trị lặp lại nhiều nhất | Dữ liệu phân loại |
| Khoảng dao động | 40 | Max − Min = 95 − 55 | Đo mức phân tán |
Trung Bình Cộng: Cách Tính
Trung bình cộng là tổng tất cả các giá trị chia cho số lượng giá trị. Đây là thước đo xu hướng trung tâm phổ biến nhất.
Công thức: Trung bình (x̄) = (Σxᵢ) / n
Ví dụ: Dữ liệu = {3, 7, 8, 5, 12, 4, 9, 6}
- Tổng: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
- Số lượng: 8 giá trị
- Trung bình = 54 / 8 = 6,75
Trung bình cộng nhạy cảm với giá trị ngoại lệ — các giá trị cực đoan kéo trung bình về phía chúng. Trung bình nên được dùng cho các phân phối đối xứng không có ngoại lệ rõ ràng.
Trung Vị: Giá Trị Ở Giữa
Trung vị là giá trị ở giữa của tập dữ liệu sau khi sắp xếp theo thứ tự tăng dần. Nó chia đôi phân phối: 50% giá trị nằm dưới và 50% nằm trên trung vị.
Số lẻ giá trị: Trung vị = giá trị thứ (n+1)/2.
Số chẵn giá trị: Trung vị = trung bình của giá trị thứ n/2 và (n/2 + 1).
| Tập dữ liệu | n | Đã sắp xếp | Trung vị |
|---|---|---|---|
| {4, 1, 9, 2, 6} | 5 (lẻ) | {1, 2, 4, 6, 9} | 4 (giá trị thứ 3) |
| {7, 3, 8, 5} | 4 (chẵn) | {3, 5, 7, 8} | (5+7)/2 = 6 |
| {1, 1, 1, 1000} | 4 (chẵn) | {1, 1, 1, 1000} | (1+1)/2 = 1 |
Trung vị ít bị ảnh hưởng bởi ngoại lệ hơn trung bình cộng — vì vậy thu nhập và giá nhà thường được báo cáo theo trung vị.
Yếu Vị: Giá Trị Phổ Biến Nhất
Yếu vị là giá trị xuất hiện thường xuyên nhất trong tập dữ liệu.
- Không có yếu vị: mọi giá trị xuất hiện như nhau (ví dụ: {1, 2, 3, 4, 5})
- Một yếu vị (đơn đỉnh): một giá trị xuất hiện nhiều hơn tất cả (ví dụ: {1, 2, 2, 3, 4} → yếu vị = 2)
- Hai yếu vị (lưỡng đỉnh): hai giá trị cùng xuất hiện nhiều nhất (ví dụ: {1, 1, 2, 3, 3} → yếu vị = 1 và 3)
Câu Hỏi Thường Gặp
Nên dùng trung bình hay trung vị?
Không có câu trả lời nào tốt hơn một cách chung chung. Trung vị bền vững hơn trước ngoại lệ và phù hợp hơn cho phân phối lệch (thu nhập, giá nhà). Trung bình cộng sử dụng tất cả điểm dữ liệu và tốt hơn cho phân phối đối xứng. Nên dùng cả hai để có cái nhìn toàn diện.
Tập dữ liệu có thể không có yếu vị không?
Có. Nếu tất cả giá trị xuất hiện như nhau, không có yếu vị (ví dụ: {1, 2, 3, 4, 5}). Tập dữ liệu cũng có thể có nhiều yếu vị (đa đỉnh).
Làm thế nào để tìm trung vị của số chẵn giá trị?
Sắp xếp các giá trị, sau đó lấy trung bình của hai số ở giữa. Ví dụ: {2, 4, 6, 8}: hai giá trị giữa là 4 và 6, trung vị = (4+6)/2 = 5.
Ngoại lệ ảnh hưởng thế nào đến trung bình so với trung vị?
Ngoại lệ ảnh hưởng mạnh đến trung bình nhưng tác động tối thiểu đến trung vị. Ví dụ: {1, 2, 3, 4, 5} có trung bình = 3 và trung vị = 3. Thêm ngoại lệ {1, 2, 3, 4, 5, 100}: trung bình nhảy lên 19,2 nhưng trung vị chỉ đổi thành 3,5.