Medidas de Dispersión
Medidas de Dispersión
Medidas de Dispersión
RANGO
DESVIACIÓN MEDIA
VA R I A N Z A
DESVIACIÓN ESTÁNDAR
COEFICIENTE DE
VA R I A C I Ó N
Resultado de aprendizaje
Realiza cálculo del rango, varianza, desviación estándar y coeficiente de
variación a partir de datos cuantitativos no agrupados.
Aplica las medidas dispersión para resolver problemas de la vida
cotidiana
Medidas de dispersión
Las medidas de posición central tenían como objetivo el resumir los datos en un valor
representativo, las medidas de dispersión nos dirán hasta que punto estas medidas de posición
central son representativas como resumen de la información. Las medidas de dispersión
cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto
a un valor central.
Distinguiremos entre medidas de dispersión absolutas, que no son comparables entre diferentes
muestras y las relativas que nos permitirán comparar varias muestras.
La dispersión es importante porque:
Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia
central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa
de los datos.
Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de
distinguir que presentan esa dispersión antes de abordar esos problemas.
Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia
dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables,
necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones
más grandes.
Rango
La medida más simple de dispersión es el rango. Representa la diferencia entre los valores
máximo y mínimo de un conjunto de datos. En forma de ecuación:
Ejemplo anterior
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una
distribución estadística.
Varianza de la población Las fórmulas de la varianza poblacional y la varianza de la muestra son
ligeramente diferentes. La varianza de la población se estudia primero. (Recuerde que una
población es la totalidad de las observaciones estudiadas.)
La varianza de la población se determina de la siguiente manera:
2
𝜎 =
∑ ( 𝑋 − 𝜇)
𝑁
Varianza
Varianza de una muestra
La varianza de una muestra se determina con:
Varianza
1) Considere a los siguientes seis valores como una población: 13, 3, 8, 10, 8 y 6.
a) Determine la media de la población.
b) Determine la varianza.
2) Los salarios por hora de una muestra de empleados de medio tiempo de Home Depot
son: $12, $20, $16, $18 y $19. ¿Cuál es la varianza de la muestra?
Desviación estándar
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los
datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor será la dispersión
de los datos.
El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una
población, mientras que S se utiliza para representar la desviación estándar de una muestra. La
variación que es aleatoria o natural de un proceso se conoce comúnmente como ruido.
La desviación estándar se puede utilizar para establecer un valor de referencia para estimar la
variación general de un proceso.
Desviación estándar
La desviación típica o desviación estándar(denotada con el símbolo σ o s,
dependiendo de la procedencia del conjunto de datos) es una medida de
dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la
variable.
Varianza y desviación estándar para datos
agrupado
La varianza para datos agrupados de una muestra.
n n
2
f(X i -X ) 2
f(X -X )
i
2
s = i=1
s= i=1
n-1 n-1
Ejemplo 2
Resultado estándar la población y muestra
La desviación estándar es útil también para describir cuánto se apartan las observaciones individuales de una
distribución de la media de la misma. Una medida que se conoce como resultado estándar nos da el número
de desviaciones estándar que una observación en particular ocupa por debajo o por encima de la media.
Si x simboliza la observación, entonces el resultado estándar calculado a partir de los datos de la población es:
Ejemplos.
Suponga que observamos un frasco de compuesto que tiene 0.108% de impureza. Como nuestra
población tiene una media de 0.166% y una desviación estándar de 0.058%. ¿Cuál es el resultado
estándar de la población?
Se observa que una calificación tiene 62 puntos. Si la media de la muestra es de 76 puntos con
una desviación estándar de 4.2. ¿Cuál es el resultado estándar de la muestra?
Coeficiente de variación
Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en
las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de
Pearson que se define como el cociente entre la desviación estándar y el valor absoluto de la
media aritmética, o sea:
Los momentos respecto al origen suministran entonces medidas de tendencia central. Es fácil
ver que los primeros momentos respecto al origen son