Jhonatan Pinto
Jhonatan Pinto
Jhonatan Pinto
TUTOR:
KENNY ARTEVALO
ESTUDANTE:
JHONATAN PINTO
ADMINISTRACION DE EMPRESA
UNIPAMPLONA
SEMESTRE III
MEDIDAS DE DISPERSIÓN
También llamadas medidas de variabilidad, muestran la variabilidad de una distribución,
indicando por medio de un número si las diferentes puntuaciones de una variable están muy
alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto
menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o
varían mucho entre ellos. Las medidas de dispersión nos informan sobre cuánto se alejan
del centro los valores de la distribución.
Ejemplo
Donde
X: Variable sobre la que se pretende calcular la varianza.
x i: Observación número i de la variable Xi puede tomar valores entre 1 y n.
n: Numero de observaciones.
x̄: Es la media de la variable X
Características de la Varianza
Es siempre un valor no negativo, que puede ser igual o distinta de 0.
La varianza es la medida de dispersión cuadrática optima por ser la menor
de todas.
Si a todos los valores de la variable se le suma una constante la varianza no
se modifica
Si todos los valores de la variable se multiplican por una constante la
varianza queda multiplicada por el cuadrado de dicha constante.
Ejemplo
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con
un salario diferente: Juan: 1.300 euros, Pepe: 1.500 euros, José: 1.700 euros, Miguel: 1.500
euros, Mateo: 2.000 euros
La media del salario, la cual necesitamos para nuestro cálculo, es de
(1300+1500+1700+1500+2000
5 )
=1600 euros.
Reemplazamos
Donde:
X: Variable sobre la que se pretende calcular la varianza.
x i: Observación numero i de la variable Xi puede tomar valores entre 1 y n.
N: Numero de observaciones.
x̄: Es la media de la variable X.
D x̄=|10−15|+|12−15|+|15−15|+|18−15|+¿ 20−15∨ ¿ ¿
5
5+ 3+0+3+5
D x̄=
5
68
D x̄= =3.2
5
COEFICIENTE DE VARIACION
También denominado como coeficiente de variación de Pearson, es una medida
estadística que nos informa acerca de la dispersión relativa de un conjunto de datos.
Donde:
X: Variable sobre la que se pretende calcular la varianza.
S x: Desviación típica de la variable x
|x̄|: Es la media de la variable x en valor absoluto diferente a 0
Ejemplo
Pensemos en una población de elefantes y otra de ratones. La población de elefantes tiene
un peso medio de 6.000 kilogramos y una desviación típica de 800 kilogramos. La
población de ratones tiene un peso medio de 20 gramos y una desviación típica de 4
gramos.
Elefantes: 800/6000=0.13
Ratones: 4/200=0.2
Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación para los
elefantes es de apenas un 13%, mientras que el de los ratones es de un 20%. Como
consecuencia de la diferencia entre las poblaciones y su peso medio, vemos que la
población con mayor dispersión, no es la que tiene una mayor desviación típica.
DECILES
Dividen la distribución de datos en 10 partes iguales, correspondiendo cada uno al
10% de los datos. Tendríamos, por tanto, nueve deciles que denotamos por D1, D2,
D3, ..., D9. El quinto decil coincide con la mediana.
PERCENTILES
Tenemos 99 percentiles que dividirían a la población en 100 partes iguales,
denotados por P1, P2, ..., P98, P99. Tiene, a su vez, una equivalencia con los deciles
y cuartiles. Los percentiles 25, 50 y 75 coinciden con los cuartiles.
DIAGRAMA DE CAJAS
Es un gráfico utilizado para representar una variable cuantitativa (variable
numérica). El gráfico es una herramienta que permite visualizar, a través de los
cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos, la
posición de la mediana, etc. Se compone de:
4. Se calculan los límites admisibles inferior y superior (LI y LS) para identificar los
valores extremos.
Los límites marcarán los datos atípicos de la variable. Todos aquellos puntos que sean
menores que LI (x < LI) o mayores que LS (x > LS) son valores extremos. Es decir, son
todos aquellos valores que no están en el intervalo [LI,LS].
5. El mínimo es el menor valor del conjunto que sea mayor o igual que LI. El máximo
es el mayor valor del conjunto que es menor o igual que LS. Dibujamos los dos
brazos. El primero va desde el primer cuartil hasta el mínimo. El segundo, desde el
tercer cuartil hasta el máximo.
6. Se dibujan los valores extremos, representados por puntos o círculos pequeños.