Medidas de Dispersión
Medidas de Dispersión
Medidas de Dispersión
NOTA IMPORTANTE: La Guía anterior (“Medidas de Tendencia Central”), también debía desarrollarse
en el cuaderno y será considerada como nota de proceso.
Medidas de Dispersión
A diferencia de las medidas de tendencia central, las medidas de dispersión no son datos de la muestra,
más bien, corresponden a parámetros estadísticos que indican que tan cerca o lejos, se encuentran los
datos respecto se la media, por lo mismo siempre van a depender de ella. En general, las medidas de
dispersión sirven como indicadores de la variabilidad de los datos.
1. Rango
Ejemplo: Las edades de los estudiantes de un curso fluctúan entre los 15 y los 17 años. Luego el rango es
de 2 años (17 − 15), por lo que se estima que los datos están concentrados.
2. Error muestral
El error se entenderá como la distancia o diferencia (en valor absoluto) entre un dato específico y la
media o promedio. El error es la base para el cálculo de las medidas de dispersión, por ello, es vital para
concluir la variabilidad de los datos.
Ejemplo: Las notas de Andrés en la asignatura de matemática fueron de un 62, 64, 65 y 65. Obteniendo
un promedio de 64. Así el error de la primero nota es de 2 puntos |64 − 62| = 2, la segunda nota no
posee error |64 − 64| = 0 y las dos últimas tienen un error de un punto |65 − 64| = 1.
3. Desviación Media
La desviación media es un parámetro de dispersión que presenta el promedio de los errores muestrales.
Si bien es un parámetro considerable, es la menos robusta de las medidas de dispersión.
Ejemplo: Las edades de un grupo de cuatro mamás que participan en un baile para bebé, son 28, 31, 34 y
35. Su desviación media depende del promedio que es 32:
La desviación típica (también conocida como desviación estándar) es una medida que se usa para
cuantificar la variación o dispersión de un conjunto de datos numéricos. Presentando un número cual al
ser interpretado expondrá que tan cercanos o lejanos están los datos.
Una desviación estándar baja indica que la mayor parte de los datos de una muestra tienden a estar
agrupados cerca de su promedio, mientras que una desviación estándar alta indica que los datos se
extienden sobre un rango de valores más amplio. El concepto de alta o baja varía según cada muestra.
Si los datos son 700, 701, 701 y 702 su desviación estándar (𝜎) será 0,7 𝑎𝑝𝑟𝑜𝑥. Mientras que si los datos
son 0,1, 0,4, 0,6 y 1,1 su desviación es de 0,46 𝑎𝑝𝑟𝑜𝑥 y es “más alta” que la anterior. Por lo mismo los
valores siempre deben quedar sujeto a interpretación.
∑𝑁(𝑋𝑖 − 𝑋̅)2
𝜎=√ 𝑖
𝑁
Donde
Ejemplo: Se tiene la muestra con los datos 700, 701, 701 y 702. Así como su 𝑋̅ = 701, su desviación será:
12 + 02 + 02 + 12 2 1
=√ = √ = √ ≈ 0,707..
4 4 2
5. Varianza
La varianza corresponde a la media de las desviaciones cuadráticas de una variable de carácter aleatorio,
y representa la variabilidad de una serie de datos respecto a su media. La varianza corresponde al
cuadrado de la desviación estándar, sin embargo, y a diferencia de ella, queda expresada en unidades
cuadráticas, por lo cual no siempre es interpretable.
∑𝑁 ̅ 2
𝑖 (𝑋𝑖 − 𝑋)
𝑉𝐴𝑅(𝑋) = 𝜎 2 =
𝑁
Para el estudio de distribuciones normales, la varianza corresponde a uno de los parámetros más
relevantes, por lo cual, a pesar de no ser tan útil como medida de dispersión, si lo es en el estudio de tipos
de distribuciones. Estos contenidos serán trabajados más adelante en el curso.
Ejemplo: Calcular la varianza de las alturas en 𝑐𝑚 de tres personas que miden: 165 𝑐𝑚, 172 𝑐𝑚 y 176 𝑐𝑚.
Sabiendo que la media entre las alturas es de 171 𝑐𝑚, se tiene que:
Luego la varianza corresponde a 20,66 𝑐𝑚2 . Lo cual no posee una interpretación relacionada con el
ejercicio, esto por la cuadratura de las unidades de medidas.
6. Coeficiente de Variación
El coeficiente de variación es la relación entre desviación estándar de una muestra con su respectiva
media aritmética (promedio), y permite principalmente comparar la homogeneidad de dos muestras
diferentes que poseen la misma variable, pero en diferentes unidades. A menor coeficiente de variación,
más homogénea será la muestra (los datos tienden a acercarse a la media).
Sigue la fórmula:
𝜎
𝑐. 𝑣. =
𝑋̅
Ejemplo: Se comparan dos muestras, una con los valores 700, 701, 701 y 702. Mientras que la segunda
muestra tiene valores 0,1, 0,4, 0,6 y 1,1. Así:
Muestra 𝑋1 𝑋2 𝑋3 𝑋4 𝑋̅ 𝜎 𝑐. 𝑣.
El coeficiente de variación explicita que, aunque la desviación es mucho mayor en la muestra 1, los datos
son mucho más homogéneos que en la muestra 2.
7. Ejercicios
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
Media Desviación E.
Con los datos presentados, exprese opinión respecto a la comparación entre los
sueldos pagados por la misma empresa en ambos países.