Calculadora de Desviación Típica y Media
Calcula la media, la varianza y la desviación típica (poblacional y muestral) de un conjunto de datos. Calculadora estadística gratuita con resultados instantáneos.
¿Cuál es la desviación estándar y por qué importa?
La desviación estándar mide cómo se dispersan tus datos alrededor de la media (promedio). Una pequeña desviación estándar significa que los valores se agrupan estrechamente alrededor de la media; una gran desviación estándar significa que los valores se dispersan ampliamente.
Dos conjuntos de datos pueden tener el mismo promedio pero distribuciones completamente diferentes — la desviación estándar captura esa diferencia:
- Conjunto de datos A: {9, 10, 10, 11, 10} — Media = 10, SD ≈ 0,63 (agrupación estrecha)
- Conjunto de datos B: {2, 5, 10, 15, 18} — Media = 10, SD ≈ 5,83 (dispersión amplia)
Ambos tienen un promedio de 10, pero el conjunto B es casi 10 veces más variable. La desviación estándar hace esto visible.
La desviación estándar se denota σ (sigma) para una población y s para una muestra. Es la raíz cuadrada de la varianza, expresada en las mismas unidades que los datos originales — lo que la hace más interpretable que la varianza sola.
Las aplicaciones abarcan casi todos los campos: control de calidad (¿son las piezas fabricadas consistentes dentro de la tolerancia?), finanzas (riesgo de inversión = volatilidad de retorno), medicina (¿la lectura de un paciente está dentro de 2 DE?), educación (¿cómo se distribuyen las calificaciones de los exámenes?) y análisis de deportes (¿cuán consistente es el rendimiento de un atleta?).
Población vs Muestra Desviación estándar
La elección más importante al calcular la desviación estándar es si estás trabajando con una población (todos los puntos de datos posibles) o una muestra (un subconjunto). Esto determina qué fórmula usar y afecta el resultado.
Desviación estándar de la población (σ): Utiliza cuando tienes datos para el grupo completo que estás estudiando. Fórmula: σ = √[Σ(xᵢ − μ)² / N]
Donde: μ = media de la población, N = número de valores, Σ = suma de todos los valores.
Desviación estándar de la muestra (s): Utiliza cuando tus datos son una muestra tomada de una población más grande. Fórmula: s = √[Σ(xᵢ − x̄)² / (n−1)]
Donde: x̄ = media de la muestra, n = número de valores en la muestra, (n−1) = corrección de Bessel.
La corrección de Bessel divide por (n−1) en lugar de n porque las muestras tienden a subestimar la varianza verdadera de la población — particularmente para pequeñas muestras. Usar (n−1) proporciona un estimador no sesgado de la varianza de la población.
¿Cuál usar?
- SD de la población: Tienes datos para todos los estudiantes de una clase específica; todos los puntajes de un examen específico; todos los empleados de una empresa única.
- SD de la muestra: Realizaste una encuesta a 500 estadounidenses sobre ingresos (inferir a todos los estadounidenses); mediste 30 widgets de una producción (inferir a todos los widgets); cualquier estudio científico con una muestra.
Calculo paso a paso de la desviación estándar
Trabajemos a través de un ejemplo completo con números reales:
Conjunto de datos: Puntajes de exámenes de 6 estudiantes: {72, 85, 91, 68, 79, 88}
Paso 1 — Encuentra la media: (72 + 85 + 91 + 68 + 79 + 88) / 6 = 483 / 6 = 80,5
Paso 2 — Encuentra cada desviación de la media y cuadrática:
| Puntaje (xᵢ) | Desviación (xᵢ − x̄) | Cuadrática (xᵢ − x̄)² |
|---|---|---|
| 72 | 72 − 80,5 = −8,5 | 72,25 |
| 85 | 85 − 80,5 = +4,5 | 20,25 |
| 91 | 91 − 80,5 = +10,5 | 110,25 |
| 68 | 68 − 80,5 = −12,5 | 156,25 |
| 79 | 79 − 80,5 = −1,5 | 2,25 |
| 88 | 88 − 80,5 = +7,5 | 56,25 |
| Suma | 0 (siempre) | 417,50 |
Paso 3 — Calcular varianza: Varianza de la muestra (n−1) = 417,50 / 5 = 83,50
Paso 4 — Tomar la raíz cuadrada para la desviación estándar: s = √83,50 ≈ 9,14
Interpretación: La mayoría de los puntajes caen dentro de unos 9,14 puntos de la media de 80,5. Aproximadamente el 68% de los puntajes se esperaría entre 71,4 y 89,6 (media ± 1 DE) si este fuera una población normal distribuida.
La Regla Empírica y la Distribución Normal
Para los datos que siguen una distribución normal (curva de campana), la Regla Empírica (68-95-99.7) te dice exactamente cuántos valores caen dentro de cada rango de desviación estándar:
| Rango | Porcentaje de datos | Ejemplo (media=100, DE=15) |
|---|---|---|
| Media ± 1 DE | ~68.27% | 85 a 115 |
| Media ± 2 DE | ~95.45% | 70 a 130 |
| Media ± 3 DE | ~99.73% | 55 a 145 |
| Más allá de ± 3 DE | ~0.27% | A continuación de 55 o por encima de 145 |
La aplicación clásica es las puntuaciones de IQ: media = 100, DE = 15. Un IQ de 130 es 2 DEs por encima de la media — solo alrededor del 2,3% de las personas obtienen ese puntaje. Un IQ de 145 es 3 DEs por encima de la media — alrededor del 0,13% de las personas (aproximadamente 1 de cada 750).
En la calidad, el estándar Six Sigma requiere que los procesos tengan menos de 3,4 defectos por millón de oportunidades — equivalente a mantener la variación dentro de ±6 desviaciones estándar de la meta, dejando solo un 0,00034% de tasa de defectos. Esta es la base estadística de los programas de calidad de manufactura Six Sigma.
No todos los datos están distribuidos normalmente. Las distribuciones de ingresos están desplazadas hacia la derecha (unos pocos ganadores muy altos estiran la cola derecha). En tales casos, la mediana y el rango intercuartil pueden ser más informativos que la media y la desviación estándar.
Otras Medidas Estadísticas: Media, Mediana, Varianza y Más
La desviación estándar es más significativa junto con otras estadísticas descriptivas. Aquí's cómo funcionan juntas:
- Media (promedio aritmético): Suma de todos los valores ÷ recuento. Sensible a los valores extremos — un valor extremo puede desplazar significativamente la media.
- Mediana: El valor medio cuando los datos están ordenados. Más robusto a los valores extremos que la media. Para {1, 2, 3, 4, 100}: media = 22, mediana = 3.
- Moda: El valor que ocurre con mayor frecuencia. Útil para datos categóricos; un conjunto de datos puede tener múltiples modas o ninguna.
- Rango: Máximo − mínimo. Simple pero sensible a los valores extremos; no describe la forma de la distribución.
- Varianza (σ² o s²): El cuadrado de la desviación estándar. Útil matemáticamente pero más difícil de interpretar ya que está en unidades cuadradas. Ejemplo: si las alturas están en centímetros, la varianza es en cm² — que no tiene significado físico.
- Coefficiente de Variación (CV): (Desviación estándar / media) × 100%. Permite comparar la variabilidad entre conjuntos de datos con diferentes medias. Un CV del 10% significa que la DE es el 10% de la media — útil en finanzas y biología.
- Error Estándar de la Media (SEM): DE ÷ √n. Mide la precisión de la media de la muestra como una estimación de la media de la población. A medida que el tamaño de la muestra crece, el SEM disminuye — las muestras más grandes dan estimaciones más precisas.
Desviación estándar en finanzas, ciencia y deportes
La desviación estándar tiene interpretaciones prácticas específicas en diferentes campos:
Finanzas — Medición del riesgo de la inversión: En finanzas, la desviación estándar de las ganancias = volatilidad = riesgo. Una acción que devuelve un 10% anual con una SD de 15% tiene una probabilidad del 68% de devolver entre −5% y +25% en cualquier año determinado. El S&P 500 históricamente tiene una SD anual de aproximadamente 15-20%. Los portafolios de bonos suelen tener una SD de 3-7%. El rendimiento ajustado por riesgo (Ratio de Sharpe) = (retorno - tasa libre de riesgo) / SD — mayor, mejor.
Ciencia — Control de calidad y medición: Los instrumentos de laboratorio informan mediciones como media ± SD. Una lectura de termómetro de 37,2 ± 0,3 °C significa que la medición está dentro de 0,3 °C del valor verdadero con un 68% de confianza. En ensayos clínicos, la significación estadística se define típicamente como el efecto del tratamiento que es más de 2 SDs de la media del grupo de control (p < 0,05).
Análisis deportivo: La consistencia de los jugadores se cuantifica con SD. Un jugador de baloncesto que promedia 25 puntos por partido con una SD de 3 es más confiable que uno que promedia 25 con una SD de 10. La predicción del tiempo utiliza modelos de ensembles donde la SD de las predicciones de temperatura indica la confianza — una SD estrecha significa que los pronosticadores están de acuerdo; una SD ancha significa alta incertidumbre.
Educación: Las puntuaciones Z expresan cuántas desviaciones estándar un puntaje de un estudiante está desde la media de la clase: Z = (puntuación - media) / SD. Una puntuación Z de +2 significa que el puntaje es 2 SDs por encima de la media — mejor que aproximadamente el 97,7% de los estudiantes. Los exámenes estandarizados como el SAT están diseñados para que las puntuaciones sigan una distribución normal aproximada, lo que permite estas comparaciones por centésimos.
Preguntas Frecuentes
¿Cuál es la diferencia entre desviación estándar y varianza?
La varianza es el promedio de las desviaciones al cuadrado desde la media. La desviación estándar es la raíz cuadrada de la varianza. Ambas miden la dispersión, pero la desviación estándar está en las mismas unidades que los datos (más fácil de interpretar), mientras que la varianza está en unidades al cuadrado. Un conjunto de datos de altura en cm tiene varianza en cm² — no es significativo. La DE en cm es directamente comparable con las mediciones originales.
¿Cuándo debo usar la desviación estándar de la población vs la muestra?
Use la desviación estándar de la población (σ, divide por N) cuando tiene datos para toda la población que está describiendo — todos los estudiantes de una clase específica, todos los empleados de una empresa. Use la desviación estándar de la muestra (s, divide por n-1) cuando sus datos son un subconjunto de una población más grande y está estimando la variabilidad de la población — una encuesta de muestra, participantes de un ensayo clínico, muestras de control de calidad de una producción.
¿Qué significa una alta o baja desviación estándar?
Una baja desviación estándar significa que los puntos de datos están agrupados estrechamente alrededor de la media — consistencia, baja variabilidad. Una alta desviación estándar significa que los datos están dispersos ampliamente — alta variabilidad. Ninguna es mejor en sí misma; depende del contexto. En la fabricación, una baja DE es deseada (consistencia). En las inversiones, algunos inversores aceptan una DE más alta por mayores posibles ganancias.
¿Qué es un puntaje Z y cómo se relaciona con la desviación estándar?
Un puntaje Z mide cuántas desviaciones estándar un punto de datos está desde la media: Z = (valor − media) / DE. Un puntaje Z de 0 = exactamente promedio. Z = +1 = 1 DE por encima de la media (84 por cientoil). Z = −2 = 2 DEs por debajo de la media (2,3 por cientoil). Los puntajes Z permiten comparar valores de diferentes conjuntos de datos con diferentes escalas.
¿Qué es el error estándar y cómo es diferente de la desviación estándar?
La desviación estándar describe la dispersión de los puntos de datos individuales. El error estándar de la media (SEM = DE/√n) describe la precisión de la media de la muestra como una estimación de la media verdadera de la población. A medida que aumenta el tamaño de la muestra, el SEM disminuye (más datos = una estimación más precisa), pero la DE no cambia necesariamente. El SEM se utiliza en intervalos de confianza; la DE describe la distribución de los datos en sí.
¿Puede la desviación estándar ser negativa?
No. La desviación estándar siempre es cero o positiva. Igual a cero solo cuando todos los valores de datos son idénticos (sin variabilidad alguna). Dado que se calcula como la raíz cuadrada de una suma de cuadrados, no puede ser negativa. Una varianza o desviación estándar negativa indicaría un error de cálculo.
¿Cómo afectan los valores atípicos a la desviación estándar?
Los valores atípicos pueden inflar dramáticamente la desviación estándar porque las desviaciones se cuadratan — las grandes desviaciones de la media contribuyen desproporcionadamente. Por ejemplo, en {10, 11, 10, 12, 100}: eliminar el valor atípico (100) reduce la DE de ~38 a ~0,9. Cuando están presentes los valores atípicos, la mediana y el rango intercuartil (IQR) son medidas más robustas de la tendencia central y la dispersión.
¿Qué significa si la desviación estándar es cero?
Una desviación estándar de cero significa que todos los valores en el conjunto de datos son idénticos — no hay variabilidad alguna. Por ejemplo, {5, 5, 5, 5, 5} tiene media = 5 y DE = 0. Esto ocurre en conjuntos de datos artificiales o altamente restringidos. En conjuntos de datos prácticos, DE = 0 a menudo indica un error de recopilación de datos o mediciones idénticas.