Kalkulator rata-rata, median & mode
Menghitung rata-rata, median, mode, rentang, dan statistik lainnya untuk setiap set data. Gunakan kalkulator matematika online gratis ini untuk hasil instan dan akurat.
Memahami Ukuran Kecenderungan Pusat
Dalam statistik,ukuran kecenderungan sentraladalah nilai tunggal yang menggambarkan pusat atau nilai khas dari satu set data. tiga yang paling penting adalah rata-rata, median, dan modus - masing-masing memberitahu Anda sesuatu yang berbeda tentang data, dan masing-masing yang paling sesuai dalam situasi yang berbeda.
Pertimbangkan kumpulan data ini: nilai tes {55, 60, 70, 75, 75, 80, 95}.
| Tindakan | Nilai | Cara Menghitung | Terbaik Untuk |
|---|---|---|---|
| Rata-rata (rata) | 72,9 | (55 + 60 + 70 + 75 + 75 + 80 + 95) / 7 | Distribusi simetris |
| Median (nilai tengah) | 75 | Nilai rata-rata data yang diurutkan | Distribusi miring, outlier |
| Mode (paling sering) | 75 | Nilai yang paling sering diulang | Data kategoris, menemukan puncak |
| Jangkauan | 40 | Max - Min = 95 - 55 | Pengukuran spread |
Tidak ada satu ukuran yang secara universal "terbaik". Seorang analis data memilih ukuran yang tepat berdasarkan bentuk distribusi, keberadaan outlier, dan pertanyaan yang diajukan. Memahami ketiganya - ditambah keterbatasan mereka - adalah dasar untuk literasi statistik.
Rata-rata (Rata-rata Aritmatika): Cara Menghitungnya
Iturata-rata aritmatikaadalah jumlah dari semua nilai dibagi dengan jumlah nilai. Ini adalah ukuran yang paling umum digunakan dari kecenderungan pusat dan apa yang kebanyakan orang maksud ketika mereka mengatakan "rata-rata".
Rumus: Mean (x̄) = (Σxi) / n
Dimana Σxi adalah jumlah dari semua nilai dan n adalah jumlah.
Contoh:Data = {3, 7, 8, 5, 12, 4, 9, 6}
- Jumlah: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
- Jumlah: 8 nilai
- Rata-rata = 54 / 8 =6,75
Rata-rata sensitif terhadapangka luar biasa-- nilai ekstrim menarik nilai rata-rata ke arah mereka. Misalnya, jika satu nilai dalam set di atas adalah 100 bukan 12, rata-rata akan melompat ke (54 - 12 + 100) / 8 = 142 / 8 = 17,75, jauh dari nilai "tipikal" dari data yang tersisa.
Jenis lain dari alat untuk penggunaan khusus:
- Geometri rata-rata:n√(x1 x x2 x ... x xn) -- digunakan untuk tingkat pertumbuhan, pengembalian, rasio
- Rata-rata harmonik:n / (1/x1 + 1/x2 + ... + 1/xn) -- digunakan untuk kecepatan, tarif, harga per unit
- Rata-rata tertimbang:Σ(wixi) / Σwi -- digunakan ketika poin data memiliki kepentingan yang berbeda (misalnya, GPA)
Median: Nilai tengah
Iturata-rataadalah nilai tengah dari satu set data ketika disortir dalam urutan naik. Hal ini membagi distribusi tepat di setengah: 50% dari nilai jatuh di bawah median dan 50% di atas.
Untuk angka ganjil:Median = nilai (n+1) /2.
Untuk jumlah nilai genap:Median = rata-rata nilai n/2 th dan (n/2 + 1) th.
| Data Set | n | Diurutkan | Median |
|---|---|---|---|
| {4, 1, 9, 2, 6} | 5 (aneh) | {1, 2, 4, 6, 9} | 4 (nilai ke-3) |
| {7, 3, 8, 5} | 4 (bahkan) | {3, 5, 7, 8} | (5+7)/2 = 6 |
| {10, 20, 30, 40} | 4 (bahkan) | {10, 20, 30, 40} | (20 + 30) / 2 = 25 |
| {1, 1, 1, 1000} | 4 (bahkan) | {1, 1, 1, 1000} | (1+1)/2 = 1 |
Perhatikan contoh terakhir: rata-rata {1, 1, 1, 1000} = 250,75, tetapi median = 1.median lebih disukai daripada rata-rata untuk distribusi miringdengan outlier -- pendapatan median, harga perumahan, dan durasi tinggal di rumah sakit semuanya dilaporkan sebagai median karena beberapa nilai yang sangat tinggi akan membuat rata-rata tidak mewakili pengalaman khas.
Mode: Nilai Paling Sering
Itumodusadalah nilai yang paling sering muncul dalam satu set data.
- Tidak ada mode:semua nilai muncul dengan frekuensi yang sama (misalnya, {1, 2, 3, 4, 5})
- Satu modus (unimodal):satu nilai muncul lebih dari yang lain (misalnya, {1, 2, 2, 3, 4} -> mode = 2)
- Dua mode (bimodal):dua nilai terikat untuk yang paling sering (misalnya, {1, 1, 2, 3, 3} -> mode = 1 dan 3)
- Multiple mode (multimodal):tiga atau lebih nilai terikat untuk yang paling sering
Mode ini sangat berguna untuk:
- Data kategori:"Apa ukuran sepatu yang paling populer?" (ukuran 10 untuk pria AS, misalnya)
- Data diskrit:"Berapa banyak anak yang biasanya dimiliki keluarga?" (seringkali 2, mode)
- Bentuk distribusi:Sebuah distribusi bimodal (dua puncak) menunjukkan dua subpopulasi yang berbeda dalam data Anda - sinyal sangat penting dalam analisis eksplorasi
| Data Set | Modus | Jenis |
|---|---|---|
| {1, 2, 3, 4, 5} | Tidak ada | Tidak ada modus |
| {2, 4, 4, 6, 8} | 4 | Unimodal |
| {1, 1, 3, 5, 5} | 1 dan 5 | Bimodal |
| {a, b, b, c, c, d, d} | b, c, d | Trimodal |
Jangkauan dan Ukuran Penyebaran Lainnya
Sementara rata-rata, median, dan mode menggambarkan pusat distribusi,ukuran penyebaranMereka sama pentingnya untuk memahami satu set data.
| Tindakan | Rumus | Contoh ({2, 4, 4, 6, 8}) | Sensitivitas terhadap Outlier |
|---|---|---|---|
| Jangkauan | Max - Min | 8 - 2 = 6 | Sangat sensitif |
| Interquartile Range (IQR) | Q3 - Q1 | 7 - 3 = 4 | Tahan |
| Varians (σ2) | Σ ((xi - x̄) 2 / n | 3.44 | Sensitif |
| Deviasi Standar (σ) | √Variansi | 1.855 | Sensitif |
| Rata-rata Penyimpangan Absolut | Aku tidak tahu apa-apa. | 1.6 Pengertian | Sedang |
Untuk {2, 4, 4, 6, 8}: mean = 4,8, sehingga penyimpangan adalah: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24. Varians = (7.84+0.64+0.64+1.44+10.24)/5 = 20.8/5 = 4.16. SD = √4.16 ~ 2.04.
Standar deviasi adalah workhorse dari statistik - muncul dalam pengujian hipotesis, interval kepercayaan, perhitungan distribusi normal, dan kontrol proses. deviasi standar yang lebih rendah berarti data dikelompokkan dekat dengan rata-rata; deviasi standar yang lebih tinggi berarti data lebih tersebar.
Kapan Menggunakan Mean vs Median vs Mode
Memilih ukuran kecenderungan sentral yang salah bisa menyesatkan.
| Situasi | Tindakan yang direkomendasikan | Kenapa? |
|---|---|---|
| Simetris, tidak ada outlier | Kejam | Paling mudah ditangani secara matematis; menggunakan semua data |
| Distribusi miring | Median | Tidak ditarik oleh nilai ekstrim |
| Pendapatan / harga perumahan | Median | Beberapa jutawan menyimpang rata-rata ke atas |
| Data kategori | Modus | Rata-rata/median tidak berlaku untuk kategori |
| Nilai yang paling umum | Modus | Jawaban langsung untuk "yang paling populer" |
| Nilai rata-rata / GPA | Rata-rata (berat) | Semua skor berkontribusi secara proporsional |
| Pengembalian saham / tingkat pertumbuhan | Geometri rata-rata | Rekening untuk penggabungan |
| Waktu bertahan hidup, tinggal di rumah sakit | Median | Skewed kanan oleh kasus-kasus durasi panjang |
Pengamatan terkenal: "Rata-rata orang Amerika memiliki satu payudara dan satu testis" menggambarkan mengapa rata-rata dapat menyesatkan untuk distribusi bimodal. Dalam hal ini, mode (dipisahkan oleh jenis kelamin) dan median adalah deskriptor yang lebih informatif daripada rata-rata keseluruhan.
Contoh Dunia Nyata: Rata-rata, Median, dan Mode dalam Praktik
Memahami bagaimana konsep-konsep ini diterapkan dalam situasi nyata membangun intuisi statistik:
- Pendapatan Rumah Tangga AS (2023):Rata-rata ~ $ 105.000; Median ~ $ 74.580. kesenjangan mencerminkan kesenjangan pendapatan - sejumlah kecil berpenghasilan sangat tinggi secara dramatis menarik rata-rata ke atas. Diskusi kebijakan menggunakan pendapatan median karena lebih mewakili rumah tangga "tipikal".
- Waktu akhir balapan berjalan:Dalam perlombaan 10K, rata-rata waktu finishing mungkin lebih tinggi dari median karena pejalan lambat membentuk ekor kanan yang panjang.
- Skor tes kelas:Jika satu siswa mendapat nilai 5/100 dan dua puluh siswa lainnya mendapat nilai 75 - 95/100, rata-rata ditarik ke bawah oleh outlier. Guru mungkin melaporkan median untuk lebih mewakili kinerja kelas.
- Ukuran sepatu:Mode adalah statistik yang paling dapat ditindaklanjuti - pengecer menyimpan persediaan paling banyak dalam ukuran modal (paling umum).
- Kontrol kualitas:Dalam manufaktur, standar deviasi dari pengukuran produk menentukan kemampuan proses. SD rendah berarti produksi yang konsisten; SD tinggi berarti tingkat cacat yang tinggi.
Pertanyaan yang Sering Diajukan
Mana yang lebih baik: rata-rata atau median?
Tidak ada yang lebih baik secara universal - mereka melayani tujuan yang berbeda. Median lebih kuat terhadap outlier dan lebih baik mewakili "tipikal" dalam distribusi miring (pendapatan, harga perumahan, waktu kelangsungan hidup). Rata-rata menggunakan semua titik data, secara matematis optimal untuk distribusi simetris, dan diperlukan untuk perhitungan statistik lebih lanjut seperti penyimpangan standar dan pengujian hipotesis. Gunakan keduanya bersama-sama untuk gambaran lengkap.
Bisakah sebuah dataset tidak memiliki mode?
Ya. Jika semua nilai terjadi dengan frekuensi yang sama, tidak ada modus (misalnya, {1, 2, 3, 4, 5} - setiap nilai muncul persis sekali). Satu set data juga bisa multimodal - bimodal (dua mode: {1, 1, 3, 3, 5}) atau trimodal. Dalam prakteknya, distribusi bimodal sering memberi sinyal dua subkelompok yang berbeda dalam data Anda, yang merupakan pola penting untuk diselidiki.
Bagaimana saya menemukan median dari jumlah nilai genap?
Sort nilai-nilai dalam urutan naik, kemudian rata-rata dua angka tengah. untuk {2, 4, 6, 8}: dua nilai tengah adalah 4 dan 6, jadi median = (4 + 6) / 2 = 5. untuk {1, 3, 5, 7, 9, 11}: nilai tengah adalah 5 dan 7, jadi median = (5 + 7) / 2 = 6. median tidak harus menjadi nilai dalam set data.
Apa artinya jika mean = median = mode?
Ketika ketiga ukuran sama, distribusi sempurna simetris dan unimodal - kurva lonceng klasik (distribusi normal). Ini berarti tidak ada outlier yang menyimpang dari data, dan ketiga ukuran sama-sama merupakan deskriptor yang valid dari pusat. Dalam prakteknya, data dunia nyata jarang mencapai simetri sempurna, tetapi keselarasan dekat rata-rata dan median menunjukkan simetri perkiraan.
Apa hubungan antara mean, median, dan skewness?
Dalam distribusi miring ke kanan (positif miring) distribusi: Mean > Median > Mode. Dalam distribusi miring ke kiri (negatif miring) distribusi: Mean < Median < Mode. Dalam distribusi simetris: Mean = Median ~ Mode. Hubungan ini memberikan cek visual cepat: bandingkan rata-rata dan median untuk menentukan arah miring tanpa melihat grafik.
Bagaimana Anda menghitung rata-rata untuk data dikelompokkan?
Untuk data frekuensi yang dikelompokkan, gunakan titik tengah setiap interval kelas: Mean = Σ ((titik tengah x frekuensi) / n. Contoh: jika 10 siswa mendapat skor 50 - 60 (titik tengah 55), 15 mendapat skor 60 - 70 (titik tengah 65), dan 5 mendapat skor 70 - 80 (titik tengah 75): Mean = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.
Apa perbedaan antara rata-rata populasi dan rata-rata sampel?
Rata-rata populasi (μ, "mu") dihitung dari setiap anggota seluruh populasi. Rata-rata sampel (x̄, "x-bar") dihitung dari subset (sampel) yang diambil dari populasi itu. Rumusnya identik, tetapi simbolnya berbeda. Dalam praktiknya, kita hampir selalu bekerja dengan rata-rata sampel dan menggunakannya untuk memperkirakan rata-rata populasi - yang memperkenalkan kesalahan sampling dan memerlukan teknik inferensi statistik.
Bagaimana outlier mempengaruhi rata-rata vs median?
Outlier sangat mempengaruhi rata-rata tetapi memiliki efek minimal pada median. Contoh: data {1, 2, 3, 4, 5} memiliki mean = 3 dan median = 3. Menambahkan outlier {1, 2, 3, 4, 5, 100}: mean melompat ke 19.2 tetapi perubahan median hanya ke (3+4) / 2 = 3.5.
Apa itu trimmed mean?
Trimmed mean (atau truncated mean) menghapus persentase tetap dari nilai-nilai ekstrem sebelum menghitung rata-rata. Misalnya, 10% trimmed mean pada {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: menghapus bagian bawah dan atas 10% (kira-kira 1 nilai masing-masing), meninggalkan {2, 3, 4, 5, 6, 7, 8, 9}; mean = 5.5. Trimmed means digunakan dalam sistem penilaian (penghakiman Olimpiade, figure skating) dan statistik ekonomi untuk mengurangi pengaruh outlier sambil mempertahankan lebih banyak data daripada median.
Bagaimana saya menghitung rata-rata tertimbang?
Rata-rata tertimbang = Σ ((berat x nilai) / Σ ((berat). Contoh - Perhitungan GPA: Kelas A (4.0) dalam kursus 3-kredit, Kelas B (3.0) dalam kursus 4-kredit, Kelas C (2.0) dalam kursus 2-kredit: GPA tertimbang = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4) / 9 = 28/9 ~ 3.11. Tanpa penimbangan, rata-rata sederhana akan menjadi (4+3+2) / 3 = 3.0 - kehilangan pengaruh yang lebih berat dari kursus 4-kredit.
Ringkasan Statistik Deskriptif: Apa yang Selalu Anda Butuhkan
Ringkasan statistik deskriptif yang lengkap untuk setiap kumpulan data harus mencakup semua hal berikut. Ini adalah apa yang akan Anda laporkan dalam makalah ilmiah, analisis bisnis, atau tugas akademik:
| Statistik | Simbol | Contoh ({2,4,4,6,8,10}) | Interpretasi |
|---|---|---|---|
| Menghitung | n | 6 | Berapa banyak pengamatan |
| Kejam | x̄ | 5,67 | Nilai rata-rata |
| Median | M | 5,0 | Nilai tengah (persentil ke-50) |
| Modus | Mo | 4 | Nilai yang paling sering |
| Jangkauan | R | 8 | Spread dari min ke max |
| Deviasi Standar | σ atau s | 2,58 | Penyimpangan khas dari rata-rata |
| Variasi | σ² | 6,67 | SD kuadrat |
| Min / Maks | — | 2 / 10 | Nilai ekstrim |
Dalam pekerjaan akademik dan ilmiah, selalu melaporkan baik ukuran pusat dan ukuran penyebaran. Laporan hanya rata-rata (atau median) tanpa standar deviasi (atau IQR) memberikan gambaran yang tidak lengkap dari data Anda. Sebuah kelas di mana siswa mencetak rata-rata 75% dengan SD = 5% sangat berbeda dari satu dengan rata-rata = 75% tetapi SD = 25% - yang pertama adalah cluster yang ketat dari nilai B, yang kedua adalah kelompok campuran liar dari gagal hingga hampir sempurna.
Persentil, Kwartil, dan Plot Kotak
Di luar rata-rata, median, dan modus, ringkasan statistik yang lengkap seringkali mencakup analisis persentil. Persentil memberi tahu Anda fraksi data mana yang berada di bawah nilai tertentu - penting untuk memahami posisi relatif, mengidentifikasi outlier, dan membandingkan populasi.
- Median = persentil ke-50:Setengah data di bawah nilai ini
- Q1 (kuartil pertama) = persentil ke-25:25% dari data di bawah Q1
- Q3 (Kuartil ketiga) = persentil ke-75:75% dari data di bawah Q3
- IQR (Interquartile Range) = Q3 - Q1:Mengandung 50% data tengah
- Aturan luar biasa:Poin di bawah Q1 - 1,5xIQR atau di atas Q3 + 1,5xIQR dianggap outlier
| Persentil | Makna | Contoh (skor ujian, n=100) |
|---|---|---|
| Ke sepuluh. | 10% skor di bawah | Skor 52 -> Skor lebih baik dari 10% kelas |
| 25 (Q1) | 25% skor di bawah | Skor 64 -> batas kuartil bawah |
| 50 (Median) | 50% skor di bawah | Skor 75 -> tengah distribusi |
| 75 (Q3) | 75% skor di bawah | Skor 87 -> batas kuartil atas |
| Ke-90 | 90% skor di bawah | Skor 93 -> 10% teratas kelas |
| Ke-99 | 99% skor di bawah | Skor 99 -> 1% teratas |
Plot kotak (plot kotak dan kumis) memvisualisasikan informasi ini: kotak mencakup Q1 sampai Q3 (IQR), garis menandai median, dan "kumis" meluas ke nilai non-outlier terkecil/terbesar. Sebagai contoh, membandingkan nilai tes di tiga sekolah menggunakan tiga plot kotak side-by-side segera menunjukkan sekolah mana yang memiliki kinerja median yang lebih tinggi, yang memiliki lebih banyak penyebaran (menunjukkan pengajaran yang tidak konsisten), dan apakah sekolah mana pun memiliki sekelompok siswa outlier yang membutuhkan dukungan.
Langkah demi Langkah: Menghitung Rata-Rata, Median, dan Mode dengan Tangan
Mari kita bekerja melalui contoh lengkap dengan set data yang realistis: angka penjualan bulanan (dalam ribuan) untuk bisnis kecil selama 12 bulan: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.
Langkah 1: Mengurutkan Data
Diurutkan naik: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}
Langkah 2: Hitunglah Rata-rata
Jumlah = 38+38+42+44+48+48+52+55+57+61+63+75 = 621
n = 12, rata-rata = 621 / 12 =51.75 (ribu)
Langkah 3: Temukan Median
n = 12 (bahkan): rata-rata nilai ke-6 dan ke-7 = (48 + 52) / 2 =50
Langkah 4: Identifikasi Mode
Kedua 38 dan 48 muncul dua kali.{38, 48}(Bimodal)
Langkah 5: Perhitungan Rentang dan Deviasi Standar
Rentang = 75 - 38 =37
Penyimpangan dari rata-rata (51.75): (38-51.75) 2 = 189.06; (38-51.75) 2 = 189.06; (42-51.75) 2 = 95.06; (44-51.75) 2 = 60.06; (48-51.75) 2 = 14.06; (52-51.75) 2 = 0.06; (55-51.75) 2 = 10.56; (57-51.75) 2 = 27.56; (61-51.75) 2 = 85.56; (63-51.75) 2 = 126.56; (75-51.75) 2 = 540.56
Jumlah deviasi kuadrat = 1,352.25; Varians = 1,352.25/12 = 112.69; SD = √112.69 ~10.62
Interpretasi
Bisnis ini memiliki rata-rata penjualan bulanan sebesar $ 51.750 dengan median $ 50.000. Penyimpangan standar ~ $ 10.620 berarti sebagian besar bulan berada dalam +/- $ 10.620 dari rata-rata. Distribusi bimodal (dua mode) mungkin menunjukkan pola musiman - periksa apakah dua 38 dan dua 48 berkelompok dalam bulan tertentu. Outlier teratas ($ 75.000 dalam satu bulan) menarik rata-rata sedikit di atas median, menunjukkan skew positif ringan - kemungkinan satu bulan penjualan yang luar biasa (musim liburan, kontrak besar, dll.).