Skip to main content
🟢 Beginner 🔥 Popular

Calculator de medie, mediană și mod

Calculaţi media, mediana, modul, intervalul şi alte statistici pentru orice set de date.

Înțelegerea măsurilor tendinței centrale

În statistici,măsuri ale tendinței centralesunt valori unice care descriu valoarea centrală sau tipică a unui set de date. Cele trei cele mai importante sunt media, mediana și modul - fiecare vă spune ceva diferit despre date, și fiecare este cel mai potrivit în diferite situații.

Fiecare măsură oferă o perspectivă diferită:

MăsuraValoareCum se calculeazăCel mai bun pentru
Media (medie)72,9(55 + 60 + 70 + 75 + 75 + 80 + 95) / 7Distribuții simetrice
Mediana (valoare medie)75Valoarea medie a datelor sortateDistribuții înclinate, valori anormale
Mod (cel mai frecvent)75Cea mai repetată valoareDatele categorice, găsirea vârfurilor
Distanță40Max - Min = 95 - 55Măsurarea diferenței

Nu există o singură măsură universală "cea mai bună". Un analist de date alege măsura adecvată bazată pe forma distribuției, prezența valorilor anormale și întrebarea pusă. Înțelegerea tuturor celor trei - plus limitările lor - este fundamentală pentru alfabetizarea statistică.

Media aritmetică: cum se calculează

Proiectulmedia aritmeticăEste cea mai frecvent folosită măsură a tendinței centrale și este ceea ce majoritatea oamenilor înțeleg atunci când spun "medie".

Formula: medie (x̄) = (Σxi) / n

În cazul în care Σxi este suma tuturor valorilor și n este numărul.

Exemplu:Data = {3, 7, 8, 5, 12, 4, 9, 6}

  1. Suma: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
  2. Număr: 8 valori
  3. Media = 54 / 8 =6,75

Media este sensibilă lavalori anormaleDe exemplu, dacă o valoare din setul de mai sus ar fi 100 în loc de 12, media ar sări la (54 - 12 + 100) / 8 = 142 / 8 = 17,75, departe de valoarea "tipică" a celorlalte date.

Alte tipuri de mijloace pentru utilizări specializate:

Media: valoarea medie

Proiectulmedianăeste valoarea medie a unui set de date, sortată în ordine ascendentă, care împarte distribuția exact în două: 50% din valori se situează sub mediană și 50% peste aceasta.

Pentru un număr impar de valori:Mediana = valoarea (n+1) /2.

Pentru un număr par de valori:Mediana = media valorilor n/2 și (n/2 + 1)

Set de datenSortateMediana
{4, 1, 9, 2, 6}5 (par){1, 2, 4, 6, 9}4 (a treia valoare)
{7, 3, 8, 5}4 (par){3, 5, 7, 8}(5+7)/2 = 6
{10, 20, 30, 40}4 (par){10, 20, 30, 40}(20 + 30) / 2 = 25
{1, 1, 1, 1000}4 (par){1, 1, 1, 1000}(1+1)/2 = 1

Observați ultimul exemplu: media de {1, 1, 1, 1000} = 250,75, dar mediana = 1.mediana este preferată față de medie pentru distribuțiile înclinatecu valori anormale - venitul median, prețurile locuințelor și durata șederii în spital sunt toate raportate ca mediane deoarece câteva valori extrem de mari ar face ca media să nu reprezinte experiența tipică.

Mod: Valoarea cea mai frecventă

Proiectulmod de operareeste valoarea care apare cel mai frecvent într-un set de date.

Modul este deosebit de util pentru:

Set de dateModulTipul
{1, 2, 3, 4, 5}Nu existăFără mod
{2, 4, 4, 6, 8}4Unimodal
{1, 1, 3, 5, 5}1 și 5Bimodal
{a, b, b, c, c, d, d}b, c, dTrimodal

Distribuția și alte măsuri ale răspândirii

În timp ce media, mediana și modul descriu centrul unei distribuții,măsuri de răspândireAcestea sunt la fel de importante pentru înțelegerea unui set de date.

MăsuraFormuleExemplu ({2, 4, 4, 6, 8})Sensibilitatea la valorile anormale
DistanțăMax - Min8 - 2 = 6Foarte sensibil
Intervalul interquartil (IQR)Q3 - Q17 - 3 = 4Rezistentă
Varianța (σ2)Σ ((xi - x̄) 2 / n3.44Sensibil
Deviația standard (σ)√Varianta1.855Sensibil
Deviația absolută medie- Nu-i aşa ?1.6 Procesul deModerată

Pentru {2, 4, 4, 6, 8}: media = 4,8, deci deviațiile sunt: (2-4.8) 2=7.84, (4-4.8) 2=0.64, (4-4.8) 2=0.64, (6-4.8) 2=1.44, (8-4.8) 2=10.24.

Deviația standard este calul de lucru al statisticilor - apare în testarea ipotezelor, intervalele de încredere, calculele distribuției normale și controlul proceselor. O deviație standard mai mică înseamnă că datele sunt grupate aproape de medie; o deviație standard mai mare înseamnă că datele sunt mai răspândite.

Când se utilizează modul medie vs mediană vs

Alegerea unei măsuri greșite a tendinței centrale poate fi înșelătoare.

SituațieMăsura recomandatăDe ce ?
Simetrică, fără valori anormaleRău .Cea mai ușor de tratat din punct de vedere matematic; utilizează toate datele
Distribuție înclinatăMedianaNu tras de valori extreme
Venituri / prețurile locuințelorMedianaCâţiva milionari înclină media în sus.
Datele categoriceModulMedia/mediana nu se aplică categoriilor
Cea mai frecventă valoareModulRăspuns direct la "cel mai popular"
Media notelor / GPAMedia (ponderată)Toate punctele contribuie proporţional
Rentabilitatea stocurilor / ratele de creștereMedia geometricăConturi pentru compoziție
Timp de supraviețuire, spitalizareMedianaScutit la dreapta de cazuri de lungă durată

Observația binecunoscută: "Americanul mediu are un sân și un testicul" ilustrează de ce media poate fi înșelătoare pentru distribuțiile bimodale.

Exemple din lumea reală: media, mediana și modul în practică

Înțelegerea modului în care aceste concepte se aplică în situații reale construiește intuiția statistică:

Întrebări frecvente

Care este mai bun: medie sau mediana?

Mediana este mai robustă față de valorile anormale și reprezintă mai bine "tipic" în distribuții înclinate (venituri, prețuri la locuințe, timp de supraviețuire). Media utilizează toate punctele de date, este optimă din punct de vedere matematic pentru distribuții simetrice și este necesară pentru calcule statistice suplimentare, cum ar fi deviația standard și testarea ipotezelor. Utilizați ambele împreună pentru o imagine completă.

Poate un set de date să nu aibă nici un mod?

Da. Dacă toate valorile apar la fel de des, nu există un mod (de exemplu, {1, 2, 3, 4, 5} - fiecare valoare apare exact o dată). Un set de date poate fi, de asemenea, multimodal - bimodal (două moduri: {1, 1, 3, 3, 5}) sau trimodal. În practică, o distribuție bimodală semnalează adesea două subgrupuri distincte în datele dvs., ceea ce este un model important de investigat.

Cum găsesc mediana unui număr par de valori?

Pentru {2, 4, 6, 8}: cele două valori medii sunt 4 și 6, deci mediana = (4 + 6) / 2 = 5. Pentru {1, 3, 5, 7, 9, 11}: valorile medii sunt 5 și 7, deci mediana = (5 + 7) / 2 = 6. Mediana nu trebuie să fie o valoare din setul de date.

Ce înseamnă dacă media = mediana = modul?

Când toate cele trei măsuri sunt egale, distribuția este perfect simetrică și unimodală - curba clopoțelului clasică (distribuție normală). Aceasta înseamnă că nu există valori anormale care să distorsioneze datele și toate cele trei măsuri sunt descriptori la fel de valabili ai centrului. În practică, datele din lumea reală rareori realizează o simetrie perfectă, dar alinierea strânsă a mediei și medianei sugerează o simetrie aproximativă.

Care este relația dintre medie, mediană și asimetrie?

Într-o distribuție înclinată spre dreapta (inclinare pozitivă): Mean > Median > Mode. Într-o distribuție înclinată spre stânga (inclinare negativă): Mean < Median < Mode. Într-o distribuție simetrică: Mean = Median ~ Mode. Această relație oferă o verificare vizuală rapidă: comparați media și mediana pentru a determina direcția înclinării fără a privi un grafic.

Cum calculezi media pentru datele grupate?

Pentru datele de frecvență grupate, utilizați punctul de mijloc al fiecărui interval de clasă: medie = Σ ((punctul de mijloc x frecvență) / n. Exemplu: dacă 10 elevi au obținut 50 - 60 (punctul de mijloc 55), 15 au obținut 60 - 70 (punctul de mijloc 65), iar 5 au obținut 70 - 80 (punctul de mijloc 75): medie = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.

Care este diferența dintre media populației și media eșantionului?

Media populației (μ, "mu") este calculată din fiecare membru al întregii populații. Media eșantionului (x̄, "x-bar") este calculată dintr-un subset (eșantion) tras din acea populație. Formula este identică, dar simbolurile diferă. În practică, aproape întotdeauna lucrăm cu mijloace de eșantion și le folosim pentru a estima media populației - ceea ce introduce eroare de eșantionare și necesită tehnici de inferență statistică.

Cum afectează un outlier media vs mediana?

Exemplu: datele {1, 2, 3, 4, 5} au medie = 3 și mediana = 3. Adăugând un valorizator {1, 2, 3, 4, 5, 100}: media sare la 19,2 dar mediana se modifică numai la (3 + 4) / 2 = 3.5. Această robustețe face mediana măsura preferată ori de câte ori sunt prezente sau suspectate valorile anormale.

Care este media redusă?

O medie redusă (sau medie truncată) elimină un procent fix din valorile extreme înainte de a calcula media. De exemplu, o medie redusă de 10% pe {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: elimină 10% din partea de jos și de sus (aproximativ 1 valoare fiecare), lăsând {2, 3, 4, 5, 6, 7, 8, 9}; media = 5,5.

Cum calculez media ponderată?

Media ponderată = Σ(greutate x valoare) / Σ(greutăți). Exemplu - calculul GPA: Gradul A (4.0) într-un curs de 3 credite, Gradul B (3.0) într-un curs de 4 credite, Gradul C (2.0) într-un curs de 2 credite: GPA ponderată = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4)/9 = 28/9 ~ 3.11. Fără ponderare, media simplă ar fi (4+3+2)/3 = 3.0 - lipsind influența mai grea a cursului de 4 credite.

Rezumatul statisticii descriptive: Ceea ce ai nevoie întotdeauna

Un rezumat complet al statisticilor descriptive pentru orice set de date ar trebui să includă toate următoarele.

StatisticiSimbolulExemplu ({2,4,4,6,8,10})Interpretarea
Număruln6Câte observaţii
Rău .5.67Valoare medie
MedianaM5,0Valoare medie (percentilul 50)
ModulMo4Cea mai frecventă valoare
DistanțăR8Spread de la min la max
Deviația standardσ sau s2,58Deviație tipică de la medie
Varianțăσ²6,67SD la pătrat
Min / Max2 / 10Valoare extreme

În munca academică și științifică, raportați întotdeauna atât o măsură a centrului, cât și o măsură a răspândirii. Raportarea doar a mediei (sau medianei) fără deviația standard (sau IQR) oferă o imagine incompletă a datelor dvs. O clasă în care elevii au obținut o medie de 75% cu SD = 5% este foarte diferită de una cu medie = 75%, dar SD = 25% - primul este un grup strâns de note B, al doilea este un grup foarte amestecat de la eșec până la aproape perfect.

Percentile, quartile și box plots

Dincolo de medie, mediană și mod, un rezumat statistic complet include adesea analiza percentilelor. Percentilele vă spun ce fracțiune de date se încadrează sub o valoare dată - esențială pentru înțelegerea poziției relative, identificarea valorilor anormale și compararea între populații.

PercentilSemnificațieExemplu (punctele obținute la examen, n=100)
A zecea.10% scorul mai micScorul de 52 -> a obţinut mai bine de 10% din clasă
25 (Q1)25% punctează mai josScorul de 64 -> limita quartilului inferior
50 (mediana)50% puncte mai miciPunct de 75 -> mijlocul distribuției
75 (Q3)75% scorat mai josScorul de 87 -> limita de la cvartalul superior
90 de ani90% punctaj subScore de 93 -> top 10% din clasă
Al 99-lea99% punctaj mai micScore de 99 -> top 1%

Un grafic cu cutie (grafic cu cutie și mustață) vizualizează aceste informații: cutia se întinde de la Q1 la Q3 (IQR), o linie marchează mediana, iar "mustațele" se extind până la cele mai mici / cele mai mari valori non-excepționale. Punctele individuale extreme sunt trase ca puncte. Grafice cu cutie sunt excelente pentru compararea distribuțiilor în mai multe grupuri unul lângă altul, dezvăluind diferențe în centru, răspândire și înclinare pe care o simplă comparație medie le-ar pierde. De exemplu, compararea scorurilor de testare din trei școli folosind trei grafice de cutie alături arată imediat care școală are o performanță mediană mai mare, care are mai multă răspândire (indicând o predare incoerentă) și dacă orice școală are un grup de elevi outlier care au nevoie de sprijin. Această densitate vizuală a informațiilor statistice într-un afișaj compact face ca graficele de cutie să fie unul dintre cele mai puternice și mai puțin utilizate instrumente în comunicarea datelor.

Pas cu pas: Calcularea medie, mediană şi a modului manual

Să analizăm un exemplu complet cu un set de date realiste: cifrele de vânzări lunare (în mii) pentru o mică întreprindere pe o perioadă de 12 luni: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.

Pasul 1: Sortarea datelor

Sortate în ordine ascendentă: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}

Pasul 2: Calculaţi media

Suma = 38+38+42+44+48+48+52+55+57+61+63+75 = 621

n = 12, medie = 621 / 12 =51.75 (mii)

Pasul 3: Găsiţi mediana

n = 12 (par): media valorii a șasea și a șaptea = (48 + 52) / 2 =50

Pasul 4: Identificaţi modul

Atât 38 cât și 48 apar de două ori.{38, 48}(bi-modal)

Etapa 5: Calcularea intervalului și a deviației standard

Domeniul = 75 - 38 =37

Deviații de la media (51,75): (38-51,75) 2 = 189,06; (38-51,75) 2 = 189,06; (42-51,75) 2 = 95,06; (44-51,75) 2 = 60,06; (48-51,75) 2 = 14,06; (52-51,75) 2 = 0,06; (55-51,75) 2 = 10,56; (57-51,75) 2 = 27,56; (61-51,75) 2 = 85,56; (63-51,75) 2 = 126,56; (75-51,75) 2 = 540,56

Suma devianțelor la pătrat = 1,352.25; Varianța = 1,352.25/12 = 112.69; SD = √112.69 ~10.62

Interpretarea

Această afacere are vânzări medii lunare de 51.750 de dolari cu o mediană de 50.000 de dolari. Deviația standard de ~ 10.620 de dolari înseamnă că majoritatea lunilor se încadrează în +/- 10.620 de dolari din medie. Distribuția bimodală (două moduri) ar putea sugera modele sezoniere - verificați dacă cele două 38 și două 48 se adună în anumite luni. Valoarea maximă (75.000 de dolari într-o lună) trage media ușor peste mediană, indicând o înclinare pozitivă ușoară - probabil o lună de vânzări excepționale (sezonul de sărbători, contractul mare etc.).