Tema 5-Medidas de Variabilidad y Asimetría
Tema 5-Medidas de Variabilidad y Asimetría
Tema 5-Medidas de Variabilidad y Asimetría
EMPRESARIALES Y ECONÓMICAS
Medidas Estadísticas
de Variabilidad o Dispersión
Emp. A
Emp. B
MEDIDAS DE VARIABILIDAD O DE DISPERSION
Son aquellas que miden el grado de variabilidad de un conjunto de
datos con respecto a una medida de posición, con la que se
complementan para proporcionar una mejor interpretación de la
información. Existen dos tipos de medidas de dispersión:
• Rango (R)
Rango o recorrido de la variable, es la diferencia entre el valor
máximo y el valor mínimo de los datos.
R = XMáximo – XMínimo
Amplitud o Rango
La diferencia ó distancia entre las observaciones
extremas
R = XMáx – XMín
El rango es 100 – 40 = 60
Es muy sensible a los valores extremos.
Rango intercuartílico
= 80 – 60 = 20
Es la distancia entre el primer y tercer cuartil. 25
%
25
% 5% 5%
2 2
Rango intercuartílico =Q – Q =P – P
3 1 75 25
Parecida al rango, pero eliminando el 25% de las
observaciones más extremas inferiores y superiores.
No es afectada por los valores extremos.
este indicador informa sobre de la dispersión que
hay en el 50% central de la distribución.
Medidas de dispersión absoluta
• Varianza S 2 = V (X)
Es el promedio de las desviaciones (distancias) cuadráticas de un
conjunto de datos de una variable, con respecto a su media aritmética.
Por dicha razón la varianza se expresa en unidades de medida al
cuadrado (soles2, mts.2, años2, etc.)
Varianza Poblacional
Varianza Muestral
∑ ( 𝑿𝒊− 𝑿
¯ ) 𝟐
∑ 𝑿𝟐 ¯𝟐
𝒊 −𝒏 𝑿
𝒔 𝟐 = 𝒊=𝟏 = 𝒊=𝟏
𝒏 −𝟏 𝒏 −𝟏
Medidas de dispersión absoluta
• Desviación estándar (S)
La desviación estándar es la raíz cuadrada de la varianza, y se
expresa en las mismas unidades de medida de los datos, por lo que
es mucho más fácil de interpretar.
La desviación estándar es una medida del grado de dispersión o
variación de los datos con respecto a su media.
𝑖 =1
x5 45 2,025 𝑠2 = =11011 − 8 ¿ ¿
𝑛 −1
x6 56 3,136
De ambas expresiones se obtiene:
x7 34 1,156
𝟐 𝟐
𝒔 =𝟏𝟐𝟐 . 𝟓𝟓𝟑𝟔 𝒂 ñ 𝒐𝒔
x8 22 484
Suma 285 11,011 𝐬 =√ 122.5536 a ñ os 2=𝟏𝟏. 𝟎𝟕𝟎𝟒 𝐚 ñ 𝐨𝐬
8
∑ 𝑥𝑖 285
𝑥= 𝑖=1 = =35,625 𝑎 ñ 𝑜𝑠
𝑛 8
Medidas de dispersión absoluta
b) Datos en una tabla o agrupados
𝒌
𝑺 𝟐
=∑ ¿ ¿ ¿
𝒋 =𝟏
donde:
soles
2
2628000− 80∗ 175. 5 163980
2
𝑆= = =𝟐𝟎𝟕𝟓 .𝟔𝟗𝟔𝟐 𝒔𝒐𝒍𝒆𝒔𝟐
79 79
S=√ 2075.6962 𝑠𝑜𝑙𝑒𝑠2=𝟒𝟓 .𝟓𝟓𝟗𝟖 𝒔𝒐𝒍𝒆𝒔
Medidas de dispersión relativa
• Coeficiente de Variación (c.v)
Es una medida de dispersión relativa, representada por un índice o
numero abstracto (no tiene unidad de medida), que permite
comparar variabilidad de dos o más conjuntos de observaciones,
por lo que se usa como alternativa a la varianza. Esta medida se
expresa generalmente en porcentaje (%), y mientras menor es el
c.v de una variable, menor es la dispersión de los datos, es decir, es
más homogénea. Se define por:
𝒔
𝑪𝑽 ( 𝑿 )= . 𝟏𝟎𝟎 %
¯
| 𝑿|
Medidas de dispersión relativa
Lo que quiere decir, que en la empresa ABC, los sueldos de los gerentes
son mas homogéneos que los de los empleados, ya que su variación o
variabilidad es menor.
Ejemplo.
Las remuneraciones de los empleados de los hoteles LUX y ASTORIA que
pertenecen a la empresa hotelera HOTESA se presentan en las tablas de
frecuencia siguientes:
Hotel LUX Hotel ASTORIA
Número de Número de
Sueldo (soles) Sueldo (soles)
Empleados Empleados
[ 400 - 800 ) 60 [ 500 - 1000 ) 10
[ 800 - 1200 ) 35 [ 1000 - 1500 ) 30
[ 1200 - 1600 ) 5 [ 1500 - 2000 ) 10
Total 100 Total 50
Observación:
o La distribución de las remuneraciones de los trabajadores del Hotel Astoria son mas
homogéneos que la de los trabajadores del Hotel Lux (después del aumento) .
o En cuanto a la distribución de las remuneraciones del Hotel Lux, la homogeneidad después
del aumento es menor que antes de ello (las remuneraciones son más Justas); mientras que
en el caso del hotel Astoria, la distribución de las remuneraciones no sufrió variación alguna.
Medidas de Asimetría
¯ − 𝑴 𝒐 𝟑( 𝑿
𝑿 ¯ − 𝑴 𝒆)
𝑪 𝑨= =
𝑺 𝑺
Observación:
i. Si ….. distribución simétrica
ii. Si ….. distribución asimétrica negativa
iii. Si ….. distribución asimétrica positiva
Medidas de Asimetría
• Distribución simétrica. Cuando su curva de frecuencia es simétrica
con respecto al centro de los datos, en este caso
X = Me = Mo.
Distribucion simetrica
9
8
7
6
Frequency
5
4
3
2
1
0
1 2 3 4 5 6 7
X
8
Sesgo positivo
7
6
Frequency
1 2 3 4 5 6
X
7
Sesgo negativo
6
Frequency
1 2 3 4 5 6
X
Diagrama de cajas
(Box Plot)
2900
Atípico
EJEMPLO
2835
*
LS
Se tienen los salarios mensuales (en dólares) de 12
profesionales independientes.
2700
2210, 2255, 2350, 2380, 2380, 2390
2420, 2440, 2450, 2550, 2630, 2835 2630
Q3
Donde: Q1 = 2357.5 Q2 = 2405 (Mediana) Q3 = 2525
2500
RI =167.5 , LI = Q1 - 1.5(RI) = 2106.25
Mediana
LS = Q3 + 1.5(RI) = 2776.25
Q1
2300
2210
LI
2100
Ejemplo
El diagrama de caja muestra:
La puntuación mediana es de
12,95.
* (23.0) El rango intercuartílico esta entre
Q1 = 10,575 a Q3 = 17,24.
Se muestra un valor atípico.
El rango de los datos están entre
el valor Mínimo = 7,03 y el valor
atípico = 23.0.
El hecho de que el área mas
grande de la caja esté por
encima de la Mediana indica que
los datos tienen un sesgo
ligeramente positivo. Esto es, la
cola derecha de la distribución es
más larga que la cola izquierda.
Ejemplo de comparación