Calculadora de Media, Mediana y Moda
Calcula la media, mediana, moda, rango y otras estadísticas para cualquier conjunto de datos. Usa esta calculadora matemática gratuita para resultados instantáneos y precisos. Sin registro.
Comprensión de las Medidas de Tendencia Central
En estadística, las medidas de tendencia central son valores singulares que describen el centro o el valor típico de un conjunto de datos. Las tres más importantes son la media, la mediana y la moda —cada una da una perspectiva diferente sobre los datos, y cada una es más apropiada en diferentes situaciones.
Considere este conjunto de datos: puntuaciones de prueba {55, 60, 70, 75, 75, 80, 95}. Cada medida da una perspectiva diferente:
| Medida | Valor | Cómo se Calcula | Más Apropiado Para |
|---|---|---|---|
| Media (promedio) | 72.9 | (55+60+70+75+75+80+95) / 7 | Distribuciones simétricas |
| Mediana (valor central) | 75 | Valor central del conjunto de datos ordenado | Distribuciones sesgadas, valores atípicos |
| Moda (más frecuente) | 75 | Valor más repetido | Datos categóricos, encontrar picos |
| Rango | 40 | Max − Min = 95 − 55 | Medir dispersión |
Ninguna medida es universalmente "mejor." Un analista de datos elige la medida apropiada basándose en la forma de la distribución, la presencia de valores atípicos y la pregunta que se está haciendo. Entender todas las tres —y sus limitaciones— es fundamental para la alfabetización estadística.
Media (Promedio Aritmético): Cómo Calcularlo
La media aritmética es la suma de todos los valores dividida por el número de valores. Es la medida de tendencia central más comúnmente utilizada y es lo que la mayoría de las personas significan cuando dicen "promedio".
Fórmula: Media (x̄) = (Σxᵢ) / n
Donde Σxᵢ es la suma de todos los valores y n es el número de valores.
Ejemplo: Datos = {3, 7, 8, 5, 12, 4, 9, 6}
- Suma: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
- Cantidad: 8 valores
- Promedio = 54 / 8 = 6.75
La media es sensible a los outliers — valores extremos que atraen la media hacia ellos. Por ejemplo, si uno de los valores en el conjunto anterior fuera 100 en lugar de 12, la media saltaría a (54 − 12 + 100) / 8 = 142 / 8 = 17.75, muy lejos del "valor típico" de los datos restantes.
Otras tipos de medias para usos especializados:
- Media geométrica: ⁿ√(x₁ × x₂ × … × xₙ) — utilizada para tasas de crecimiento, retornos, razones
- Media armónica: n / (1/x₁ + 1/x₂ + … + 1/xₙ) — utilizada para velocidades, tasas, precios por unidad
- Promedio ponderado: Σ(wᵢxᵢ) / Σwᵢ — utilizado cuando los datos tienen diferentes importancia (por ejemplo, PIB)
Mediana: El Valor Medio
La mediana es el valor medio de un conjunto de datos cuando se ordenan en orden ascendente. Divide la distribución exactamente en dos: el 50% de los valores cae por debajo de la mediana y el 50% por encima.
Para un número impar de valores: Mediana = el (n+1)/2 valor.
Para un número par de valores: Mediana = promedio del n/2 valor y el (n/2 + 1) valor.
| Conjunto de Datos | n | Ordenados | Mediana |
|---|---|---|---|
| {4, 1, 9, 2, 6} | 5 (impar) | {1, 2, 4, 6, 9} | 4 (3er valor) |
| {7, 3, 8, 5} | 4 (par) | {3, 5, 7, 8} | (5+7)/2 = 6 |
| {10, 20, 30, 40} | 4 (par) | {10, 20, 30, 40} | (20+30)/2 = 25 |
| {1, 1, 1, 1000} | 4 (par) | {1, 1, 1, 1000} | (1+1)/2 = 1 |
Nota el último ejemplo: la media de {1, 1, 1, 1000} = 250.75, pero la mediana = 1. Esto ilustra perfectamente por qué la mediana es preferible a la media para distribuciones sesgadas con valores atípicos — la mediana de ingresos, precios de viviendas y duración de hospitalizaciones se reportan como medias porque unos cuantos valores extremadamente altos harían que la media no representara la experiencia típica.
Modo: El Valor Más Frecuente
El modo es el valor que aparece con mayor frecuencia en un conjunto de datos. Un conjunto de datos puede tener:
- Sin modo: todos los valores aparecen con la misma frecuencia (e.g., {1, 2, 3, 4, 5})
- Un modo (unimodal): un valor aparece más veces que todos los demás (e.g., {1, 2, 2, 3, 4} → modo = 2)
- Dos modos (bimodal): dos valores empatados en la frecuencia más alta (e.g., {1, 1, 2, 3, 3} → modos = 1 y 3)
- Varios modos (multimodal): tres o más valores empatados en la frecuencia más alta
El modo es particularmente útil para:
- Datos categóricos: "¿Cuál es el tamaño de zapato más popular?" (tamaño 10 para hombres estadounidenses, por ejemplo)
- Datos discretos: "¿Cuántos niños tienen las familias típicamente?" (a menudo 2, el modo)
- Forma de distribución: Una distribución bimodal (dos picos) sugiere dos subpoblaciones distintas en tus datos —una señal críticamente importante en el análisis exploratorio
| Conjunto de Datos | Modo | Tipo |
|---|---|---|
| {1, 2, 3, 4, 5} | Ninguno | Sin modo |
| {2, 4, 4, 6, 8} | 4 | Unimodal |
| {1, 1, 3, 5, 5} | 1 y 5 | Bimodal |
| {a, b, b, c, c, d, d} | b, c, d | Trimodal |
Rango y Otros Medios de Expansión
Mientras que la media, la mediana y la moda describen el centro de una distribución, medios de expansión describen cómo mucho la data varía. Son igualmente importantes para entender un conjunto de datos.
| Mide | Fórmula | Ejemplo ({2, 4, 4, 6, 8}) | Sensibilidad a Outliers |
|---|---|---|---|
| Rango | Máx − Mín | 8 − 2 = 6 | Muy sensible |
| Rango Intercuartílico (IQR) | Q3 − Q1 | 7 − 3 = 4 | Inerte |
| Variancia (σ²) | Σ(xᵢ − x̄)² / n | 3.44 | Muy sensible |
| Desviación Estándar (σ) | √Variancia | 1.855 | Muy sensible |
| Desviación Absoluta Media | Σ|xᵢ − x̄| / n | 1.6 | Moderada |
Para {2, 4, 4, 6, 8}: media = 4.8, por lo que las desviaciones son: (2−4.8)²=7.84, (4−4.8)²=0.64, (4−4.8)²=0.64, (6−4.8)²=1.44, (8−4.8)²=10.24. Variancia = (7.84+0.64+0.64+1.44+10.24)/5 = 20.8/5 = 4.16. SD = √4.16 ≈ 2.04.
La desviación estándar es la caballería de la estadística —aparece en pruebas de hipótesis, intervalos de confianza, cálculos de distribución normal y control de procesos. Una desviación estándar más baja significa que los datos están agrupados cerca de la media; una desviación estándar más alta significa que los datos están más dispersos.
Cuándo Usar Media vs Mediana vs Moda
Elegir la medida de tendencia central incorrecta puede ser engañoso. Aquí tienes un guía práctica:
| Situación | Mide recomendada | Por qué |
|---|---|---|
| Simétrica, sin valores atípicos | Media | Más matemáticamente manejable; usa todos los datos |
| Distribución sesgada | Mediana | No influenciada por valores extremos |
| Ingresos / precios de vivienda | Mediana | Pocos millonarios influyen en la media |
| Datos categóricos | Moda | Media y mediana no aplican a categorías |
| Valor más común | Moda | Respuesta directa a "más popular" |
| Medias de calificaciones / PIB | Media (ponderada) | Todos los puntajes contribuyen proporcionalmente |
| Retornos de acciones / tasas de crecimiento | Media geométrica | Cuenta con el efecto del compounding |
| Tiempo de supervivencia, estancias en el hospital | Mediana | Sesgada a la derecha por casos de larga duración |
La conocida observación: "La media estadounidense tiene un pecho y un testículo" ilustra por qué la media puede ser engañosamente para distribuciones bimodales. En este caso, la moda (separada por género) y la mediana son descripciones más informativas que la media general.
Ejemplos del Mundo Real: Media, Mediana y Moda en la Práctica
Entender cómo se aplican estos conceptos en situaciones reales construye la intuición estadística:
- Ingresos de Hogares en los Estados Unidos (2023): Media ≈ $105,000; Mediana ≈ $74,580. La diferencia refleja la asimetría de los ingresos — una pequeña cantidad de altos ganadores drásticamente eleva la media. Las discusiones políticas utilizan la mediana del ingreso porque mejor representa el hogar "típico".
- tiempos de llegada en carreras de correr: En una carrera de 10K, el tiempo medio de llegada puede ser mayor que la mediana porque los caminantes lentos forman una larga cola a la derecha. El corredor que termina en la mediana es más representativo del corredor en el medio de la carrera.
- notas de los exámenes de clase: Si un estudiante obtiene 5/100 y veinte otros obtienen entre 75-95/100, la media es arrastrada por la outlier. El maestro podría informar la mediana para representar mejor el desempeño de la clase.
- tamaños de zapatos: La moda es la estadística más práctica — los comerciantes almacenan la mayor cantidad de inventario en el tamaño modal (más común).
- control de calidad: En la fabricación, la desviación estándar de las mediciones del producto determina la capacidad del proceso. Una baja SD significa producción consistente; una alta SD significa altas tasas de defectos.
Preguntas Frecuentes
¿Cuál es mejor: media o mediana?
Ni una ni otra es universalmente mejor — sirven para diferentes propósitos. La mediana es más robusta contra valores atípicos y mejor representa "típico" en distribuciones sesgadas (ingresos, precios de vivienda, tiempos de supervivencia). La media utiliza todos los puntos de datos, es matemáticamente óptima para distribuciones simétricas y es necesaria para cálculos estadísticos adicionales como la desviación estándar y las pruebas de hipótesis. Utilice ambas juntas para una imagen completa.
¿Un conjunto de datos puede tener ningún modo?
Sí. Si todos los valores ocurren con la misma frecuencia, no hay modo (por ejemplo, {1, 2, 3, 4, 5} — cada valor aparece exactamente una vez). Un conjunto de datos también puede ser multimodal — bimodal (dos modos: {1, 1, 3, 3, 5}) o trimodal. En la práctica, una distribución bimodal a menudo indica dos subgrupos distintos en sus datos, lo cual es un patrón importante que se debe investigar.
¿Cómo encuentro la mediana de un número par de valores?
Ordena los valores en orden ascendente, luego promedia los dos valores centrales. Para {2, 4, 6, 8}: los dos valores centrales son 4 y 6, así que la mediana = (4+6)/2 = 5. Para {1, 3, 5, 7, 9, 11}: los valores centrales son 5 y 7, así que la mediana = (5+7)/2 = 6. La mediana no tiene por qué ser un valor en el conjunto de datos.
¿Qué significa que la media = mediana = moda?
Cuando las tres medidas son iguales, la distribución es perfectamente simétrica y unimodal — la clásica curva de campana (distribución normal). Esto significa que no hay valores atípicos distorsionando los datos y que todas las tres medidas son igualmente válidas para describir el centro. En la práctica, los datos del mundo real raramente alcanzan la simetría perfecta, pero una alineación cercana de la media y la mediana sugiere una simetría aproximada.
¿Cuál es la relación entre media, mediana y sesgo?
En una distribución sesgada hacia la derecha (sesgo positivo): Media > Mediana > Moda. En una distribución sesgada hacia la izquierda (sesgo negativo): Media < Mediana < Moda. En una distribución simétrica: Media = Mediana ≈ Moda. Esta relación proporciona una verificación visual rápida: compara la media y la mediana para determinar la dirección del sesgo sin mirar un gráfico.
¿Cómo se calcula la media para datos agrupados?
Para datos de frecuencia agrupados, use el punto medio de cada intervalo de clase: Media = Σ(punto medio × frecuencia) / n. Ejemplo: si 10 estudiantes obtuvieron 50–60 (punto medio 55), 15 obtuvieron 60–70 (punto medio 65) y 5 obtuvieron 70–80 (punto medio 75): Media = (10×55 + 15×65 + 5×75) / 30 = (550+975+375)/30 = 1900/30 ≈ 63.3.
¿Cuál es la diferencia entre la media poblacional y la media muestral?
La media poblacional (μ, "mu") se calcula a partir de todos los miembros de la población entera. La media muestral (x̄, "x-bar") se calcula a partir de una subpoblación (muestra) extraída de esa población. La fórmula es idéntica, pero los símbolos son diferentes. En la práctica, casi siempre trabajamos con medias muestrales y las usamos para estimar la media poblacional — lo que introduce un error de muestreo y requiere técnicas de inferencia estadística.
¿Cómo afecta un valor atípico la media vs mediana?
Los valores atípicos influyen fuertemente en la media pero tienen un efecto mínimo en la mediana. Ejemplo: datos {1, 2, 3, 4, 5} tienen media = 3 y mediana = 3. Agregando un valor atípico {1, 2, 3, 4, 5, 100}: la media salta a 19.2 pero la mediana cambia solo a (3+4)/2 = 3.5. Esta robustez hace que la mediana sea la medida preferida cuando están presentes o sospechados valores atípicos.
¿Qué es la media trunca?
Una media trunca (o media truncada) elimina un porcentaje fijo de los valores extremos antes de calcular la media. Por ejemplo, una media trunca del 10% en {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: elimina los valores más bajos y más altos del 10% (aproximadamente 1 valor cada uno), dejando {2, 3, 4, 5, 6, 7, 8, 9}; media = 5.5. Las medias trunca se usan en sistemas de puntuación (juzgamiento olímpico, patinaje artístico) y estadísticas económicas para reducir el efecto de los valores atípicos mientras se retiene más datos que la mediana.
¿Cómo se calcula la media ponderada?
Media ponderada = Σ(peso × valor) / Σ(pesos). Ejemplo — cálculo del PIB: Nota A (4.0) en un curso de 3 créditos, Nota B (3.0) en un curso de 4 créditos, Nota C (2.0) en un curso de 2 créditos: PIB ponderado = (4.0×3 + 3.0×4 + 2.0×2) / (3+4+2) = (12+12+4)/9 = 28/9 ≈ 3.11. Sin ponderación, la media simple sería (4+3+2)/3 = 3.0 — omitiendo el mayor peso del curso de 4 créditos.
Resumen de Estadísticas Descriptivas: Lo Que Siempre Necesitas
Un resumen completo de estadísticas descriptivas para cualquier conjunto de datos debe incluir todo lo siguiente. Esto es lo que reportarías en un artículo científico, análisis empresarial o tarea académica:
| Estadística | Símbolo | Ejemplo ({2,4,4,6,8,10}) | Interpretación |
|---|---|---|---|
| Cuenta | n | 6 | Cantidad de observaciones |
| Promedio | x̄ | 5.67 | Valor promedio |
| Mediana | M | 5.0 | Valor central (percentil 50) |
| Moda | Mo | 4 | Valor más frecuente |
| Rango | R | 8 | Extensión desde mínimo hasta máximo |
| Desviación Estándar | σ o s | 2.58 | Desviación típica desde el promedio |
| Variancia | σ² | 6.67 | Desviación estándar al cuadrado |
| Mínimo / Máximo | — | 2 / 10 | Valores extremos |
En el trabajo académico y científico, siempre reporta tanto una medida de centro como una medida de dispersión. Reportar solo la media (o mediana) sin la desviación estándar (o IQR) da una imagen incompleta de tus datos. Una clase donde los estudiantes obtuvieron una media del 75% con desviación estándar = 5% es muy diferente a una donde la media es 75% pero la desviación estándar es 25% — en la primera es un grupo estrecho de notas B, en la segunda es un grupo muy variado desde reprobados hasta notas cercanas al perfecto.
Percentiles, Cuartiles y Diagramas de Caja
Más allá de la media, la mediana y la moda, una resumen estadístico completo a menudo incluye el análisis de percentiles. Los percentiles te dicen qué fracción de datos cae por debajo de un valor dado — esencial para entender la posición relativa, identificar los valores atípicos y comparar entre poblaciones.
- Mediana = 50º percentil: La mitad de los datos es menor que este valor
- Cuartil 1 (Primer cuartil) = 25º percentil: 25% de los datos es menor que el Cuartil 1
- Cuartil 3 (Tercer cuartil) = 75º percentil: 75% de los datos es menor que el Cuartil 3
- Rango Interquartil (RI) = Cuartil 3 − Cuartil 1: Contiene el 50% central de los datos
- Regla de valores atípicos: Los puntos por debajo de Cuartil 1 − 1.5×RI o por encima de Cuartil 3 + 1.5×RI se consideran valores atípicos
| Percentil | Significado | Ejemplo (notas de examen, n=100) |
|---|---|---|
| 10º | 10% de los estudiantes obtuvieron notas por debajo | Nota de 52 → mejoró la posición de más del 10% de la clase |
| 25º (Cuartil 1) | 25% de los estudiantes obtuvieron notas por debajo | Nota de 64 → límite del cuartil inferior |
| 50º (Mediana) | 50% de los estudiantes obtuvieron notas por debajo | Nota de 75 → mitad de la distribución |
| 75º (Cuartil 3) | 75% de los estudiantes obtuvieron notas por debajo | Nota de 87 → límite del cuartil superior |
| 90º | 90% de los estudiantes obtuvieron notas por debajo | Nota de 93 → top 10% de la clase |
| 99º | 99% de los estudiantes obtuvieron notas por debajo | Nota de 99 → top 1% de la clase |
Un diagrama de caja (diagrama de caja y bigotes) visualiza esta información: la caja abarca del Cuartil 1 al Cuartil 3 (el RI), una línea marca la mediana y "bigotes" extienden hasta los valores más pequeños/más grandes que no sean valores atípicos. Los puntos individuales atípicos se representan como puntos. Los diagramas de caja son excelentes para comparar distribuciones entre múltiples grupos en paralelo, revelando diferencias en el centro, la dispersión y la simetría que una simple comparación de la media pasaría por alto. Por ejemplo, comparando las notas de los exámenes en tres escuelas utilizando tres diagramas de caja en paralelo inmediatamente muestra cuál escuela tiene una mediana de rendimiento más alta, cuál tiene más dispersión (indicando una enseñanza inconsistente) y si alguna escuela tiene un grupo de estudiantes atípicos que necesitan apoyo. Esta densidad visual de información estadística en una representación compacta hace que los diagramas de caja sean una de las herramientas más poderosas y subutilizadas en la comunicación de datos.
Paso a Paso: Calculando Media, Mediana y Moda a Mano
Vamos a trabajar con un ejemplo completo con un conjunto de datos realista: las cifras mensuales de ventas (en miles) para una pequeña empresa durante 12 meses: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.
Paso 1: Ordenar los Datos
Ordenados ascendente: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}
Paso 2: Calcular la Media
Suma = 38+38+42+44+48+48+52+55+57+61+63+75 = 621
n = 12, Media = 621 / 12 = 51.75 (mil)
Paso 3: Encontrar la Mediana
n = 12 (par): promedio de los valores 6º y 7º = (48 + 52) / 2 = 50
Paso 4: Identificar la Moda
Los 38 y 48 aparecen dos veces. Moda = {38, 48} (bimodal)
Paso 5: Calcular Rango y Desviación Estándar
Rango = 75 − 38 = 37
Desviaciones del promedio (51.75): (38−51.75)² = 189.06; (38−51.75)² = 189.06; (42−51.75)² = 95.06; (44−51.75)² = 60.06; (48−51.75)² = 14.06; (48−51.75)² = 14.06; (52−51.75)² = 0.06; (55−51.75)² = 10.56; (57−51.75)² = 27.56; (61−51.75)² = 85.56; (63−51.75)² = 126.56; (75−51.75)² = 540.56
Suma de las desviaciones cuadradas = 1,352.25; Varianza = 1,352.25/12 = 112.69; SD = √112.69 ≈ 10.62
Interpretación
Esta empresa tiene ventas promedio mensuales de $51,750 con una mediana de $50,000. La desviación estándar de ~$10,620 significa que la mayoría de los meses caen dentro de ±$10,620 del promedio. La distribución bimodal (dos modas) puede sugerir patrones estacionales — verifique si los dos 38 y los dos 48 se agrupan en meses específicos. El outlier superior ($75,000 en un mes) arrastra ligeramente la media por encima de la mediana, indicando un leve sesgo positivo — probablemente un mes de ventas excepcional (temporada festiva, gran contrato, etc.).