Kalkulator purata, median & mod
Hitung purata, median, mod, julat, dan statistik lain untuk mana-mana set data. Gunakan kalkulator matematik dalam talian percuma ini untuk hasil segera dan tepat.
Memahami ukuran kecenderungan pusat
Dalam statistik,ukuran kecenderungan pusatadalah nilai tunggal yang menggambarkan pusat atau nilai tipikal set data. tiga yang paling penting adalah purata, median, dan mod - masing-masing memberitahu anda sesuatu yang berbeza tentang data, dan masing-masing adalah yang paling sesuai dalam situasi yang berbeza.
Pertimbangkan set data ini: skor ujian {55, 60, 70, 75, 75, 80, 95}. Setiap ukuran memberikan perspektif yang berbeza:
| Langkah | Nilai | Cara Mengira | Terbaik Untuk |
|---|---|---|---|
| Purata (purata) | 72.9 | (55 + 60 + 70 + 75 + 75 + 80 + 95) / 7 | Sebaran simetri |
| Median (nilai tengah) | 75 | Nilai purata data yang disusun | Sebaran sesat, nilai luar biasa |
| Mod (paling kerap) | 75 | Nilai yang paling berulang | Data kategori, mencari puncak |
| Julat | 40 | Maks - Min = 95 - 55 | Pengukuran penyebaran |
Tidak ada satu ukuran yang secara universal "terbaik". Seorang penganalisis data memilih ukuran yang sesuai berdasarkan bentuk pengedaran, kehadiran outlier, dan soalan yang ditanya. Memahami ketiga-tiga - ditambah batasan mereka - adalah asas untuk literasi statistik.
Rata-rata (Rata-rata Aritmetik): Cara Mengira
Perkhidmatanpurata aritmetikadalah jumlah semua nilai dibahagikan dengan jumlah nilai. Ia adalah ukuran yang paling biasa digunakan kecenderungan pusat dan apa yang kebanyakan orang maksudkan apabila mereka mengatakan "rata-rata".
Rumus: Mean (x̄) = (Σxi) / n
Di mana Σxi adalah jumlah semua nilai dan n adalah kiraan.
Contoh:Data = {3, 7, 8, 5, 12, 4, 9, 6}
- Jumlah: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
- Bilangan: 8 nilai
- Mean = 54 / 8 =6.75
Purata adalah sensitif kepadanilai luar biasaSebagai contoh, jika satu nilai dalam set di atas adalah 100 dan bukannya 12, rata-rata akan melompat ke (54 - 12 + 100) / 8 = 142 / 8 = 17.75, jauh dari nilai "tipik" data yang tersisa.
Jenis lain alat untuk kegunaan khusus:
- Rata-rata geometri:n√(x1 x x2 x ... x xn) -- digunakan untuk kadar pertumbuhan, pulangan, nisbah
- Harmoni rata-rata:n / (1/x1 + 1/x2 + ... + 1/xn) -- digunakan untuk kelajuan, kadar, harga per unit
- Purata tertimbang:Σ(wixi) / Σwi -- digunakan apabila titik data mempunyai kepentingan yang berbeza (contohnya, GPA)
Median: Nilai pertengahan
Perkhidmatanmedianadalah nilai tengah set data apabila disusun dalam susunan menaik. Ia membahagikan pengedaran tepat di separuh: 50% nilai jatuh di bawah median dan 50% di atasnya.
Untuk bilangan ganjil nilai:Median = nilai (n + 1) / 2 th.
Untuk bilangan genap nilai:Median = purata n/2 th dan (n/2 + 1) th nilai.
| Set Data | n | Dipecahkan | Median |
|---|---|---|---|
| {4, 1, 9, 2, 6} | 5 (ganjil) | {1, 2, 4, 6, 9} | 4 (nilai ke-3) |
| {7, 3, 8, 5} | 4 (bahkan) | {3, 5, 7, 8} | (5+7)/2 = 6 |
| {10, 20, 30, 40} | 4 (bahkan) | {10, 20, 30, 40} | (20 + 30) / 2 = 25 |
| {1, 1, 1, 1000} | 4 (bahkan) | {1, 1, 1, 1000} | (1+1)/2 = 1 |
Perhatikan contoh terakhir: purata {1, 1, 1, 1000} = 250.75, tetapi median = 1.median lebih disukai daripada purata untuk pengedaran sesatdengan nilai luar biasa - pendapatan median, harga perumahan, dan tempoh tinggal di hospital semua dilaporkan sebagai median kerana beberapa nilai yang sangat tinggi akan menjadikan purata tidak mewakili pengalaman tipikal.
Mod: Nilai yang paling kerap
Perkhidmatanmodadalah nilai yang paling kerap muncul dalam set data. Set data boleh mempunyai:
- Tiada mod:semua nilai muncul dengan kerap yang sama (contohnya, {1, 2, 3, 4, 5})
- Satu mod (unimodal):satu nilai muncul lebih banyak daripada yang lain (contohnya, {1, 2, 2, 3, 4} -> mod = 2)
- Dua mod (bimodal):dua nilai terikat untuk yang paling kerap (contohnya, {1, 1, 2, 3, 3} -> mod = 1 dan 3)
- Mod berbilang (multimodal):tiga atau lebih nilai terikat untuk yang paling kerap
Mod ini amat berguna untuk:
- Data kategori:"Apa saiz kasut yang paling popular?" (ukuran 10 untuk lelaki AS, sebagai contoh)
- Data berasingan:"Berapa banyak kanak-kanak yang biasanya keluarga mempunyai?" (sering 2, mod)
- Bentuk pengedaran:Sebaran bimodal (dua puncak) mencadangkan dua subpopulasi yang berbeza dalam data anda - isyarat penting dalam analisis eksplorasi
| Set Data | Mod | Jenis |
|---|---|---|
| {1, 2, 3, 4, 5} | Tiada | Tiada mod |
| {2, 4, 4, 6, 8} | 4 | Unimodal |
| {1, 1, 3, 5, 5} | 1 dan 5 | Bimodal |
| {a, b, b, c, c, d, d} | b, c, d | Trimodal |
Julat dan Pengukuran Penyebaran Lain
Walaupun purata, median, dan mod menggambarkan pusat pengedaran,ukuran penyebaranMereka sama pentingnya untuk memahami set data.
| Langkah | Formula | Contoh ({2, 4, 4, 6, 8}) | Sensitiviti kepada Outliers |
|---|---|---|---|
| Julat | Maks - Min | 8 - 2 = 6 | Sangat sensitif |
| Julat Interquartile (IQR) | Q3 - Q1 | 7 - 3 = 4 | Bertahan |
| Varians (σ2) | Σ ((xi - x̄) 2 / n | 3.44 | Sensitif |
| Penyimpangan standard (σ) | √Varians | 1.855 | Sensitif |
| Rata-rata Penyimpangan mutlak | Σ|xᵢ − x̄| / n | 1.6 Kesedaran | Sedang |
Untuk {2, 4, 4, 6, 8}: mean = 4.8, jadi penyimpangan adalah: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24. Varians = (7.84+0.64+0.64+1.44+10.24)/5 = 20.8/5 = 4.16. SD = √4.16 ~ 2.04.
Penyimpangan piawai adalah kerja statistik - ia muncul dalam ujian hipotesis, selang keyakinan, pengiraan pengedaran normal, dan kawalan proses. Penyimpangan piawai yang lebih rendah bermakna data dikelompokkan berhampiran dengan purata; penyimpangan piawai yang lebih tinggi bermakna data lebih tersebar.
Bilakah Menggunakan Mod Mean vs Median vs
Memilih ukuran kecenderungan pusat yang salah boleh mengelirukan.
| Keadaan | Tindakan yang Disyorkan | Kenapa? |
|---|---|---|
| Simetri, tiada outlier | Kejam | Paling mudah ditangani secara matematik; menggunakan semua data |
| Sebaran sesat | Median | Tidak ditarik oleh nilai melampau |
| Pendapatan / harga perumahan | Median | Beberapa jutawan memutar rata-rata ke atas |
| Data kategori | Mod | Mean/median tidak terpakai kepada kategori |
| Nilai yang paling biasa | Mod | Jawapan langsung kepada "yang paling popular" |
| Purata gred / GPA | Rata-rata (bertimbangan) | Semua skor menyumbang secara perkadaran |
| Hasil saham / kadar pertumbuhan | Rata-rata geometri | Akaun untuk kompaun |
| Masa hidup, tinggal di hospital | Median | Skewed kanan oleh kes-kes jangka panjang |
Pemerhatian yang terkenal: "Rata-rata orang Amerika mempunyai satu payudara dan satu testis" menggambarkan mengapa rata-rata boleh menyesatkan untuk pengedaran bimodal. Dalam kes ini, mod (dipisahkan oleh jantina) dan median adalah deskriptor yang lebih bermaklumat daripada rata-rata keseluruhan.
Contoh Dunia Nyata: Rata-rata, Median, dan Mod dalam Amalan
Memahami bagaimana konsep-konsep ini digunakan dalam situasi sebenar membina intuisi statistik:
- Pendapatan isi rumah AS (2023):Purata ~ $ 105,000; Median ~ $ 74,580. jurang ini mencerminkan kemerosotan pendapatan - sebilangan kecil berpendapatan yang sangat tinggi secara dramatik menarik purata ke atas. Perbincangan dasar menggunakan pendapatan median kerana ia lebih mewakili isi rumah "tipikal".
- Masa penamat perlumbaan berjalan:Dalam perlumbaan 10K, purata masa penamat mungkin lebih tinggi daripada median kerana pejalan perlahan membentuk ekor kanan yang panjang. Penamat median lebih mewakili pelari tengah pek.
- Skor ujian kelas:Jika seorang pelajar mendapat 5/100 dan dua puluh lagi mendapat 75 - 95/100, purata ditarik ke bawah oleh nilai luar biasa. Guru mungkin melaporkan median untuk mewakili prestasi kelas dengan lebih baik.
- Saiz kasut:Mod adalah statistik yang paling boleh dilaksanakan - peruncit menyimpan inventori paling banyak dalam saiz modal (paling biasa).
- Kawalan kualiti:Dalam pembuatan, penyimpangan piawai pengukuran produk menentukan keupayaan proses. SD rendah bermaksud pengeluaran yang konsisten; SD tinggi bermaksud kadar kecacatan yang tinggi.
Soalan yang Sering Diajukan
Mana yang lebih baik: rata-rata atau median?
Tidak ada yang lebih baik secara universal - mereka berkhidmat untuk tujuan yang berbeza. Median lebih kukuh terhadap outlier dan lebih baik mewakili "tipikal" dalam pengedaran sesat (pendapatan, harga perumahan, masa kelangsungan hidup). Rata-rata menggunakan semua titik data, secara matematik optimum untuk pengedaran simetri, dan diperlukan untuk pengiraan statistik lanjut seperti penyimpangan standard dan pengujian hipotesis. Gunakan kedua-duanya bersama untuk gambaran lengkap.
Bolehkah set data tidak mempunyai mod?
Ya. Jika semua nilai berlaku dengan kerap yang sama, tidak ada mod (contohnya, {1, 2, 3, 4, 5} - setiap nilai muncul tepat sekali). Satu set data juga boleh menjadi multimodal - bimodal (dua mod: {1, 1, 3, 3, 5}) atau trimodal. Dalam praktiknya, pengedaran bimodal sering memberi isyarat dua subkumpulan yang berbeza dalam data anda, yang merupakan corak penting untuk disiasat.
Bagaimana saya mencari median daripada bilangan genap nilai?
Urut nilai-nilai dalam susunan menaik, kemudian rata-rata dua nombor tengah. Untuk {2, 4, 6, 8}: dua nilai tengah adalah 4 dan 6, jadi median = (4 + 6) / 2 = 5. Untuk {1, 3, 5, 7, 9, 11}: nilai tengah adalah 5 dan 7, jadi median = (5 + 7) / 2 = 6. Median tidak perlu menjadi nilai dalam set data.
Apa maksudnya jika purata = median = mod?
Apabila ketiga-tiga ukuran adalah sama, pembahagian adalah sempurna simetri dan unimodal - lengkung loceng klasik (pembagian normal). Ini bermakna tidak ada outlier yang memalingkan data, dan ketiga-tiga ukuran adalah deskriptor yang sama sah dari pusat. Dalam amalan, data dunia nyata jarang mencapai simetri sempurna, tetapi keselarasan yang rapat antara purata dan median menunjukkan simetri perkiraan.
Apakah hubungan antara purata, median, dan skewness?
Dalam pengedaran skew kanan (positif skew): Mean > Median > Mode. Dalam pengedaran skew kiri (negatif skew): Mean < Median < Mode. Dalam pengedaran simetri: Mean = Median ~ Mode. Hubungan ini menyediakan pemeriksaan visual yang cepat: bandingkan mean dan median untuk menentukan arah skew tanpa melihat grafik.
Bagaimana anda mengira purata untuk data dikelompokkan?
Untuk data kekerapan yang dikelompokkan, gunakan titik tengah setiap selang kelas: Mean = Σ ((titik tengah x kekerapan) / n. Contoh: jika 10 pelajar mendapat skor 50 - 60 (titik tengah 55), 15 mendapat skor 60 - 70 (titik tengah 65), dan 5 mendapat skor 70 - 80 (titik tengah 75): Mean = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63.3.
Apakah perbezaan antara purata populasi dan purata sampel?
Rata-rata populasi (μ, "mu") dikira dari setiap ahli seluruh populasi. Rata-rata sampel (x̄, "x-bar") dikira dari subset (contoh) yang diambil dari populasi itu. Rumusnya sama, tetapi simbolnya berbeza. Dalam praktiknya, kita hampir selalu bekerja dengan rata-rata sampel dan menggunakannya untuk menganggarkan rata-rata populasi - yang memperkenalkan ralat pengambilan sampel dan memerlukan teknik kesimpulan statistik.
Bagaimana outlier mempengaruhi purata vs median?
Outlier sangat mempengaruhi purata tetapi mempunyai kesan minimum pada median. Contoh: data {1, 2, 3, 4, 5} mempunyai mean = 3 dan median = 3. Menambah outlier {1, 2, 3, 4, 5, 100}: mean melompat ke 19.2 tetapi perubahan median hanya kepada (3 + 4) / 2 = 3.5. Kekuatan ini menjadikan median ukuran pilihan apabila outlier hadir atau disyaki.
Apakah purata trim?
Purata yang dipotong (atau purata yang dipotong) menghilangkan peratusan tetap nilai melampau sebelum mengira purata. Sebagai contoh, purata yang dipotong 10% pada {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: membuang 10% bawah dan atas (kira-kira 1 nilai masing-masing), meninggalkan {2, 3, 4, 5, 6, 7, 8, 9}; purata = 5.5. Purata yang dipotong digunakan dalam sistem penilaian (penghakiman Olimpik, skating seni) dan statistik ekonomi untuk mengurangkan pengaruh outlier sambil mengekalkan lebih banyak data daripada median.
Bagaimana saya mengira purata tertimbang?
Contoh - Pengiraan GPA: Grade A (4.0) dalam kursus 3-kredit, Grade B (3.0) dalam kursus 4-kredit, Grade C (2.0) dalam kursus 2-kredit: GPA tertimbang = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4)/9 = 28/9 ~ 3.11. Tanpa penimbang, purata mudah akan menjadi (4+3+2) / 3 = 3.0 - kehilangan pengaruh yang lebih berat dari kursus 4-kredit.
Ringkasan Statistik Deskriptif: Apa yang Anda Sentiasa Perlu
Ringkasan statistik deskriptif yang lengkap untuk mana-mana set data harus merangkumi semua perkara berikut. Ini adalah apa yang anda laporkan dalam kertas saintifik, analisis perniagaan, atau tugasan akademik:
| Statistik | Simbol | Contoh ({2,4,4,6,8,10}) | Tafsiran |
|---|---|---|---|
| Berbilang | n | 6 | Berapa banyak pemerhatian |
| Kejam | x̄ | 5.67 | Nilai purata |
| Median | M | 5.0 | Nilai tengah (persentil ke-50) |
| Mod | Mo | 4 | Nilai yang paling kerap |
| Julat | R | 8 | Sebarkan dari min ke max |
| Penyimpangan Standard | σ atau s | 2.58 | Penyimpangan tipikal dari purata |
| Perbezaan | σ² | 6.67 | SD kuasa dua |
| Min / Maks | — | 2 / 10 | Nilai melampau |
Dalam kerja akademik dan saintifik, selalu melaporkan kedua-dua ukuran pusat DAN ukuran penyebaran. Melaporkan hanya purata (atau median) tanpa penyimpangan standard (atau IQR) memberikan gambaran yang tidak lengkap mengenai data anda. Kelas di mana pelajar menjaringkan purata 75% dengan SD = 5% sangat berbeza dari satu dengan rata-rata = 75% tetapi SD = 25% - yang pertama adalah kumpulan gred B yang ketat, yang kedua adalah kumpulan campuran liar dari gagal hingga hampir sempurna.
Persentil, Kuartiel, dan Plot Kotak
Di luar purata, median, dan mod, ringkasan statistik lengkap sering termasuk analisis persentil. Persentil memberitahu anda apa pecahan data jatuh di bawah nilai yang diberikan - penting untuk memahami kedudukan relatif, mengenal pasti outlier, dan membandingkan di seluruh populasi.
- Median = persentil ke-50:Separuh data adalah di bawah nilai ini
- Q1 (Kuartil Pertama) = Persentil ke-25:25% data adalah di bawah Q1
- Q3 (Kuartil ketiga) = Persentil ke-75:75% data adalah di bawah Q3
- IQR (Interquartile Range) = Q3 - Q1:Mengandungi 50% data tengah
- Peraturan luar biasa:Titik di bawah Q1 - 1.5xIQR atau di atas Q3 + 1.5xIQR dianggap outlier
| Persentil | Makna | Contoh (skor peperiksaan, n=100) |
|---|---|---|
| Hari ke-10 | 10% mendapat markah di bawah | Skor 52 -> mendapat skor lebih baik daripada 10% daripada kelas |
| 25 (Q1) | 25% mendapat markah di bawah | Skor 64 -> sempadan kuartil bawah |
| 50 (Median) | 50% mendapat markah di bawah | Skor 75 -> bahagian tengah pengedaran |
| 75 (Q3) | 75% mendapat markah di bawah | Skor 87 -> sempadan kuartil atas |
| Ke-90 | 90% skor di bawah | Skor 93 -> 10% teratas kelas |
| Peringkat ke-99 | 99% mendapat skor di bawah | Skor 99 -> 1% teratas |
Plot kotak (plot kotak dan kumis) memvisualisasikan maklumat ini: kotak merangkumi Q1 hingga Q3 (IQR), garis menandakan median, dan "kumis" meluas ke nilai non-outlier terkecil / terbesar. Sebagai contoh, membandingkan skor ujian di tiga sekolah menggunakan tiga plot kotak bersebelahan dengan segera menunjukkan sekolah mana yang mempunyai prestasi median yang lebih tinggi, yang lebih meluas (menunjukkan pengajaran yang tidak konsisten), dan sama ada mana-mana sekolah mempunyai kluster pelajar luar yang memerlukan sokongan. Ketumpatan visual maklumat statistik dalam paparan padat menjadikan plot kotak salah satu alat yang paling kuat dan kurang digunakan dalam komunikasi data.
Langkah demi langkah: Mengira purata, median, dan mod dengan tangan
Mari kita bekerja melalui contoh lengkap dengan set data yang realistik: angka jualan bulanan (dalam ribuan) untuk perniagaan kecil selama 12 bulan: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.
Langkah 1: Urut Data
Diurutkan menaik: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}
Langkah 2: Mengira Purata
Jumlah = 38+38+42+44+48+48+52+55+57+61+63+75 = 621
n = 12, purata = 621 / 12 =51.75 (ribu)
Langkah 3: Cari Median
n = 12 (bahkan): purata nilai ke-6 dan ke-7 = (48 + 52) / 2 =50
Langkah 4: Tentukan Mod
Kedua-dua 38 dan 48 muncul dua kali.{38, 48}(Bimodal)
Langkah 5: Pengiraan Julat dan Penyimpangan Standard
Julat = 75 - 38 =37
Penyimpangan daripada purata (51.75): (38-51.75) 2 = 189.06; (38-51.75) 2 = 189.06; (42-51.75) 2 = 95.06; (44-51.75) 2 = 60.06; (48-51.75) 2 = 14.06; (52-51.75) 2 = 0.06; (55-51.75) 2 = 10.56; (57-51.75) 2 = 27.56; (61-51.75) 2 = 85.56; (63-51.75) 2 = 126.56; (75-51.75) 2 = 540.56
Jumlah penyimpangan kuadrat = 1,352.25; Varians = 1,352.25/12 = 112.69; SD = √112.69 ~10.62
Tafsiran
Perniagaan ini mempunyai purata jualan bulanan $ 51,750 dengan purata $ 50,000. Penyimpangan standard ~ $ 10,620 bermakna kebanyakan bulan berada dalam +/- $ 10,620 daripada purata. Penyebaran bimodal (dua mod) mungkin mencadangkan corak bermusim - periksa sama ada dua 38s dan dua 48s berkumpulan dalam bulan tertentu. Outlier teratas ($ 75,000 dalam satu bulan) menarik purata sedikit di atas median, menunjukkan skew positif ringan - mungkin satu bulan jualan luar biasa (musim cuti, kontrak besar, dll.).