Calculateur de moyenne, de médiane et de mode
Calculez la moyenne, la médiane, le mode, la plage et d'autres statistiques pour n'importe quel ensemble de données. Utilisez cette calculatrice mathématique en ligne gratuite pour des résultats instantanés et précis.
Comprendre les mesures de la tendance centrale
Dans les statistiques,mesures de tendance centralesont des valeurs simples qui décrivent le centre ou la valeur typique d'un ensemble de données. Les trois plus importants sont la moyenne, la médiane et le mode -- chacun vous dit quelque chose de différent sur les données, et chacun est le plus approprié dans différentes situations.
Considérons cet ensemble de données: les résultats des tests {55, 60, 70, 75, 75, 80, 95}. Chaque mesure donne une perspective différente:
| Mesure à prendre | Valeur | Comment est calculé | Le meilleur pour |
|---|---|---|---|
| Moyenne (moyenne) | 72,9 à | (55 plus 60 plus 70 plus 75 plus 75 plus 80 plus 95) / 7 | Distributions symétriques |
| Médiane (valeur moyenne) | 75 | Valeur moyenne des données triées | Distributions déviées, valeurs aberrantes |
| Mode (le plus fréquent) | 75 | Valeur la plus répétée | Données catégoriques, localisation des pics |
| Portée | 40 | Max - Min est égal à 95 - 55 | Mesure de l'écart |
Aucune mesure n'est universellement "meilleure". Un analyste de données choisit la mesure appropriée en fonction de la forme de distribution, de la présence de valeurs aberrantes et de la question posée. Comprendre les trois - plus leurs limites - est fondamental pour la littératie statistique.
La moyenne (moyenne arithmétique): comment la calculer
Lemoyenne arithmétiqueest la somme de toutes les valeurs divisée par le nombre de valeurs. C'est la mesure la plus couramment utilisée de la tendance centrale et c'est ce que la plupart des gens entendent par "moyenne".
Formule: moyenne (x̄) = (Σxi) / n
où Σxi est la somme de toutes les valeurs et n est le nombre.
Exemple suivant:Les données sont les suivantes: {3, 7, 8, 5, 12, 4, 9, 6
- La somme: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
- Nombre: 8 valeurs
- Moyenne = 54 / 8 =6 à 75
La moyenne est sensible àvaleurs aberrantesPar exemple, si une valeur dans l'ensemble ci-dessus était 100 au lieu de 12, la moyenne sauterait à (54 - 12 + 100) / 8 = 142 / 8 = 17,75, loin de la valeur "typique" des données restantes.
Autres types de dispositifs à usage spécialisé:
- Moyenne géométrique:n√(x1 x x2 x ... x xn) -- utilisé pour les taux de croissance, les rendements, les ratios
- Moyenne harmonique:n / (1/x1 + 1/x2 + ... + 1/xn) -- utilisé pour les vitesses, les taux, les prix unitaires
- Moyenne pondérée:Σ(wixi) / Σwi -- utilisé lorsque les points de données ont une importance différente (par exemple, GPA)
Médiane: valeur moyenne
Lemédianeest la valeur moyenne d'un ensemble de données triées par ordre croissant. Elle divise la distribution exactement en deux: 50% des valeurs sont inférieures à la médiane et 50% supérieures.
Pour un nombre impair de valeurs:La médiane est égale à la valeur de (n+1) /2.
Pour un nombre pair de valeurs:La médiane est la moyenne des valeurs n/2 et (n/2 + 1).
| Ensemble de données | n | Sortis | Médiane |
|---|---|---|---|
| {4, 1, 9, 2, 6} Je suis désolé. | 5 (parfois) | {1, 2, 4, 6, 9} Je suis désolé. | 4 (3ème valeur) |
| {7, 3, 8, 5} Je suis désolé. | 4 (également) | {3, 5, 7, 8} Je suis désolé. | (5+7)/2 est égal à 6 |
| {10, 20, 30, 40} Je suis désolé. | 4 (également) | {10, 20, 30, 40} Je suis désolé. | (20 + 30) / 2 = 25 |
| {1, 1, 1, 1000} Je suis désolé. | 4 (également) | {1, 1, 1, 1000} Je suis désolé. | (1+1)/2 est égal à 1 |
Notez le dernier exemple: la moyenne de {1, 1, 1, 1000} = 250,75, mais la médiane = 1.la médiane est préférée à la moyenne pour les distributions biaiséesavec des valeurs aberrantes - le revenu médian, les prix du logement et la durée des séjours à l'hôpital sont tous déclarés comme médians parce que quelques valeurs extrêmement élevées rendraient la moyenne non représentative de l'expérience typique.
Mode: valeur la plus fréquente
Lele modeest la valeur qui apparaît le plus fréquemment dans un ensemble de données.
- Aucun mode:toutes les valeurs apparaissent avec la même fréquence (par exemple, {1, 2, 3, 4, 5})
- Un seul mode (unimodal):une valeur apparaît plus souvent que toutes les autres (par exemple, {1, 2, 2, 3, 4} -> mode = 2)
- deux modes (bimodal):deux valeurs liées pour les plus fréquentes (par exemple, {1, 1, 2, 3, 3} -> modes = 1 et 3)
- Mode multiple (multi-modalité):trois valeurs ou plus liées pour les plus fréquentes
Le mode est particulièrement utile pour:
- Données catégoriques:"Quelle est la taille de chaussure la plus populaire?" (taille 10 pour les hommes américains, par exemple)
- Données discrètes:"Combien d'enfants ont généralement les familles?" (souvent 2, le mode)
- Forme de répartition:Une distribution bimodal (deux pics) suggère deux sous-populations distinctes dans vos données - un signal essentiel dans l'analyse exploratoire
| Ensemble de données | Mode de fonctionnement | Type de produit |
|---|---|---|
| {1, 2, 3, 4, 5} Je suis désolé. | Aucune | Aucun mode |
| {2, 4, 4, 6, 8} Je suis désolé. | 4 | Unimodal |
| {1, 1, 3, 5, 5} Je suis désolé. | 1 et 5 | Bimodal |
| {a, b, b, c, c, c, d, d} Je suis désolé. | b, c, d | Le trimodal |
Distribution et autres mesures de répartition
Alors que la moyenne, la médiane et le mode décrivent le centre d'une distribution,Mesures de la propagationIls sont tout aussi importants pour la compréhension d'un ensemble de données.
| Mesure à prendre | Formule | Exemple ({2, 4, 4, 6, 8}) | Sensibilité aux valeurs aberrantes |
|---|---|---|---|
| Portée | Max - Min | 8 - 2 est égal à 6 | Très sensible |
| Région interquartile (RIQ) | Q3 - Q1 | 7 - 3 est égal à 4 | Résistant |
| Variance (σ2) | Le nombre d'étoiles est égal au nombre d'étoiles. | Les résultats | Sensitifs |
| Déviation type (σ) | √Variance | 1 855 personnes | Sensitifs |
| Déviation moyenne absolue | - Je ne sais pas . | 1 à 6 | Modérée |
Pour {2, 4, 4, 6, 8}: la moyenne est de 4,8, donc les écarts sont: (2-4,8) 2 = 7,84, (4-4,8) 2 = 0,64, (4-4,8) 2 = 0,64, (6-4,8) 2 = 1,44, (8-4,8) 2 = 10,24. la variance est de (7,84 + 0,64 + 0,64 + 1,44 + 10,24) / 5 = 20,8 / 5 = 4,16.
L'écart-type est le cheval de bataille de la statistique - il apparaît dans les tests d'hypothèses, les intervalles de confiance, les calculs de distribution normale et le contrôle des processus.
Quand utiliser la moyenne par rapport à la médiane par rapport au mode
Choisir la mauvaise mesure de la tendance centrale peut être trompeur.
| Situation actuelle | Mesure recommandée | Pourquoi ? |
|---|---|---|
| Symétrique, pas de valeurs aberrantes | Le méchant | Le plus mathématiquement traitable; utilise toutes les données |
| Distribution déformée | Médiane | Pas tiré par des valeurs extrêmes |
| Revenu / prix du logement | Médiane | Quelques millionnaires faussent la moyenne vers le haut. |
| Données catégoriques | Mode de fonctionnement | Moyenne/médiane ne s'applique pas aux catégories |
| Valeur la plus courante | Mode de fonctionnement | Réponse directe à "les plus populaires" |
| Moyenne des notes / moyenne moyenne | Moyenne (pondérée) | Tous les scores contribuent proportionnellement |
| Rendement des actions / taux de croissance | Moyenne géométrique | Comptes de composition |
| Temps de survie, séjours hospitaliers | Médiane | Dévié vers la droite par des cas de longue durée |
L'observation bien connue: "L'Américain moyen a un sein et un testicule" illustre pourquoi la moyenne peut être trompeuse pour les distributions bimodales. Dans ce cas, le mode (séparé par sexe) et la médiane sont des descripteurs plus informatifs que la moyenne globale.
Exemples du monde réel: moyenne, médiane et mode en pratique
La compréhension de la façon dont ces concepts s'appliquent dans des situations réelles renforce l'intuition statistique:
- Revenu des ménages américains (2023):L'écart reflète l'asymétrie des revenus - un petit nombre de très hauts salaires poussent considérablement la moyenne vers le haut. Les discussions politiques utilisent le revenu médian parce qu'il représente mieux le ménage "typique".
- Temps de fin de course:Dans une course de 10 km, le temps moyen d'arrivée peut être plus élevé que la médiane parce que les marcheurs lents forment une longue queue droite.
- Les résultats des épreuves de classe:Si un élève obtient un score de 5/100 et que vingt autres élèves obtiennent un score de 75 à 95/100, la moyenne est tirée vers le bas par la valeur aberrante.
- Taille des chaussures:Le mode est la statistique la plus exploitable - les détaillants stockent le plus d'inventaire dans la taille modale (la plus courante).
- Contrôle de qualité:Dans la fabrication, l'écart type des mesures du produit détermine la capacité du processus.
Questions fréquemment posées
Qu'est-ce qui est mieux: la moyenne ou la médiane ?
La moyenne utilise tous les points de données, est mathématiquement optimale pour les distributions symétriques et est nécessaire pour d'autres calculs statistiques comme l'écart-type et les tests d'hypothèses.
Un ensemble de données peut-il n'avoir aucun mode ?
Oui. Si toutes les valeurs se produisent également souvent, il n'y a pas de mode (par exemple, {1, 2, 3, 4, 5} - chaque valeur apparaît exactement une fois). Un ensemble de données peut également être multimodal - bimodal (deux modes: {1, 1, 3, 3, 5}) ou trimodal. En pratique, une distribution bimodal signale souvent deux sous-groupes distincts dans vos données, ce qui est un modèle important à étudier.
Comment trouver la médiane d'un nombre pair de valeurs ?
Pour {2, 4, 6, 8}: les deux valeurs moyennes sont 4 et 6, donc la médiane = (4+6) /2 = 5. Pour {1, 3, 5, 7, 9, 11}: les valeurs moyennes sont 5 et 7, donc la médiane = (5+7) /2 = 6. La médiane n'a pas besoin d'être une valeur dans l'ensemble de données.
Qu'est-ce que cela signifie si moyenne = médiane = mode?
Lorsque les trois mesures sont égales, la distribution est parfaitement symétrique et unimodal - la courbe de cloche classique (distribution normale). Cela signifie qu'il n'y a pas de valeurs aberrantes qui faussent les données, et les trois mesures sont des descripteurs tout aussi valables du centre. En pratique, les données du monde réel atteignent rarement une symétrie parfaite, mais un alignement étroit de la moyenne et de la médiane suggère une symétrie approximative.
Quelle est la relation entre la moyenne, la médiane et l'asymétrie ?
Dans une distribution à inclinaison droite (inclinaison positive): Moyenne > Médiane > Mode. Dans une distribution à inclinaison gauche (inclinaison négative): Moyenne < Médiane < Mode. Dans une distribution symétrique: Moyenne = Médiane ~ Mode. Cette relation fournit un contrôle visuel rapide: comparez la moyenne et la médiane pour déterminer la direction de l'inclinaison sans regarder un graphique.
Comment calculer la moyenne pour les données regroupées ?
Pour les données de fréquence groupées, utilisez le point médian de chaque intervalle de classe: Moyenne = Σ(point médian x fréquence) / n. Exemple: si 10 élèves ont obtenu 50 - 60 (point médian 55), 15 ont obtenu 60 - 70 (point médian 65), et 5 ont obtenu 70 - 80 (point médian 75): Moyenne = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63,3.
Quelle est la différence entre la moyenne de population et la moyenne d'échantillon?
La moyenne de population (μ, " mu ") est calculée à partir de chaque membre de la population entière. La moyenne d'échantillon (x̄, " x-bar ") est calculée à partir d'un sous-ensemble (échantillon) tiré de cette population. La formule est identique, mais les symboles diffèrent. En pratique, nous travaillons presque toujours avec des moyennes d'échantillon et les utilisons pour estimer la moyenne de population - ce qui introduit une erreur d'échantillonnage et nécessite des techniques d'inférence statistique.
Comment une valeur aberrante affecte-t-elle la moyenne par rapport à la médiane ?
Les valeurs aberrantes influencent fortement la moyenne mais ont un effet minimal sur la médiane. Exemple: les données {1, 2, 3, 4, 5} ont une moyenne = 3 et une médiane = 3.
Quelle est la moyenne réduite ?
Une moyenne découpée (ou moyenne tronquée) supprime un pourcentage fixe des valeurs extrêmes avant de calculer la moyenne. Par exemple, une moyenne découpée de 10% sur {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: supprime les 10% inférieurs et supérieurs (environ 1 valeur chacun), laissant {2, 3, 4, 5, 6, 7, 8, 9}; moyenne = 5,5. Les moyennes découpées sont utilisées dans les systèmes de notation (jugement olympique, patinage artistique) et les statistiques économiques pour réduire l'influence des variables aberrantes tout en conservant plus de données que la médiane.
Comment calculer la moyenne pondérée ?
Exemple - calcul de la moyenne pondérée: note A (4.0) dans un cours de 3 crédits, note B (3.0) dans un cours de 4 crédits, note C (2.0) dans un cours de 2 crédits: moyenne pondérée = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4)/9 = 28/9 ~ 3.11. Sans pondération, la moyenne simple serait (4+3+2)/3 = 3.0 - manquant l'influence plus lourde du cours de 4 crédits.
Résumé des statistiques descriptives: ce dont vous avez toujours besoin
Un résumé complet des statistiques descriptives pour n'importe quel ensemble de données devrait inclure tout ce qui suit. C'est ce que vous rapporteriez dans un article scientifique, une analyse commerciale ou une tâche académique:
| Statistique | Le symbole | Exemple ({2,4,4,6,8,10}) | Interprétation |
|---|---|---|---|
| Compteur | n | 6 | Combien d'observations |
| Le méchant | x̄ | 5 à 6 | Valeur moyenne |
| Médiane | M | 5,0 à | Valeur moyenne (50e centile) |
| Mode de fonctionnement | Mo | 4 | Valeur la plus fréquente |
| Portée | R | 8 | Différence de min à max |
| Déviation type | σ ou s | 2,58 pour le | Déviation typique de la moyenne |
| Variance | σ² | 6 à 7 | SD au carré |
| Min / Max | — | 2 / 10 | Les valeurs extrêmes |
Dans le travail académique et scientifique, rapportez toujours à la fois une mesure du centre ET une mesure de l'écart. Rapporter uniquement la moyenne (ou la médiane) sans l'écart-type (ou QI) donne une image incomplète de vos données. Une classe où les élèves ont obtenu une moyenne de 75% avec SD = 5% est très différente d'une classe avec moyenne = 75% mais SD = 25% - la première est un groupe serré de notes B, la seconde est un groupe extrêmement mélangé d'échec à presque parfait.
Pourcentages, quartiles et boîtiers
Au-delà de la moyenne, de la médiane et du mode, un résumé statistique complet comprend souvent une analyse percentile. Les percentiles vous indiquent quelle fraction des données est inférieure à une valeur donnée - essentielle pour comprendre la position relative, identifier les valeurs aberrantes et comparer les populations.
- Médiane = 50e centile:La moitié des données est inférieure à cette valeur
- Q1 (premier quartile) = 25e centile:25% des données sont inférieures au premier trimestre
- Q3 (troisième quartile) = 75e centile:75% des données sont inférieures au troisième trimestre
- RQI (range interquartile) = Q3 - Q1:Contient le milieu 50% des données
- Règle de l' écart:Les points inférieurs à Q1 - 1,5xIQR ou supérieurs à Q3 + 1,5xIQR sont considérés comme des valeurs aberrantes
| Pourcentage | Signification | Exemple (résultats des examens, n=100) |
|---|---|---|
| Dixième | 10% avec un score inférieur | Score de 52 -> obtenu un meilleur score que 10% de la classe |
| 25ème (Q1) | 25% ont obtenu un score inférieur | Score de 64 -> limite du quartile inférieur |
| 50e (médiane) | 50% obtenu en dessous | Score de 75 -> milieu de la répartition |
| 75ème (Q3) | 75% obtenu en dessous | Score de 87 -> limite du quartile supérieur |
| 90ème | 90% obtenu en dessous | Score de 93 -> 10% des meilleurs de la classe |
| Le 99e | 99% obtenu en dessous | Score de 99 -> le 1% le plus élevé |
Un diagramme de boîte (diagramme de boîte et de moustache) visualise cette information: la boîte s'étend de Q1 à Q3 (le QIR), une ligne marque la médiane et les "moustaches" s'étendent aux plus petites / plus grandes valeurs non aberrantes. Par exemple, la comparaison des résultats des tests dans trois écoles à l'aide de trois graphiques de boîtes côte à côte montre immédiatement quelle école a une performance médiane plus élevée, qui a plus de propagation (indiquant un enseignement incohérent) et si une école a un groupe d'élèves outliers ayant besoin de soutien.
Étape par étape: calculer la moyenne, la médiane et le mode à la main
Examinons un exemple complet avec un ensemble de données réalistes: chiffres des ventes mensuelles (en milliers) d'une petite entreprise sur 12 mois: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.
Étape 1: trier les données
Sortis par ordre croissant:
Étape 2: Calculez la moyenne
La somme est égale à 38 + 38 + 42 + 44 + 48 + 48 + 52 + 55 + 57 + 61 + 63 + 75 = 621
n = 12, moyenne = 621 / 12 =51,75 (milliers de livres)
Étape 3: Trouvez la médiane
n = 12 (par): moyenne des 6e et 7e valeurs = (48 + 52) / 2 =50
Étape 4: Identifier le mode
Les numéros 38 et 48 apparaissent deux fois.{38, 48} Je vous en prie.(bi-modalité)
Étape 5: Calcul de la portée et de l'écart type
La portée = 75 - 38 =37
Les écarts par rapport à la moyenne (51,75): (38-51,75) 2 = 189,06; (38-51,75) 2 = 189,06; (42-51,75) 2 = 95,06; (44-51,75) 2 = 60,06; (48-51,75) 2 = 14,06; (52-51,75) 2 = 0,06; (55-51,75) 2 = 10,56; (57-51,75) 2 = 27,56; (61-51,75) 2 = 85,56; (63-51,75) 2 = 126,56; (75-51,75) 2 = 540,56
La somme des écarts au carré est égale à 1 352,25; la variance est égale à 1 352,25/12 = 112,69; SD = √112,69 ~10 à 62
Interprétation
Cette entreprise a un chiffre d'affaires mensuel moyen de 51 750 $ avec une médiane de 50 000 $. L'écart-type de ~ 10 620 $ signifie que la plupart des mois se situent à +/- 10 620 $ de la moyenne. La distribution bimodal (deux modes) pourrait suggérer des modèles saisonniers - vérifier si les deux 38s et deux 48s se regroupent dans des mois spécifiques. L'exception supérieure (75 000 $ en un mois) tire la moyenne légèrement au-dessus de la médiane, indiquant une légère inclinaison positive - probablement un mois de ventes exceptionnel (saison des vacances, gros contrat, etc.).