Semana 6 - Medidas de Dispersión 2022
Semana 6 - Medidas de Dispersión 2022
Semana 6 - Medidas de Dispersión 2022
PROBABILIDADES
Semana 6 :
Medidas de Dispersión
1
Unidad de aprendizaje 2: Medidas en
estadística
Resultado
de Aplica los conceptos, técnicas e interpreta
las medidas de dispersión.
Aprendizaje
2
Dispersión
Si nos limitáramos solamente a observar las medidas de tendencia central,
no tendríamos una idea acabada de como se distribuyen los datos.
3
Dispersión
Otro ejemplo, Banco Santander está comparando la cantidad de
llamadas atendidas por dos call centers, uno en Piura y otro en
Arequipa en el año 2020:
TRIMESTRE AREQUIPA PIURA
1 1200 1070
2 1500 2694
3 1220 6
4 1350 1500
Media 1317.5 1317.5
Mediana 1285 1285
Moda No tiene No tiene
Observamos que tanto la media como la mediana son iguales y ambas distribuciones
no tienen moda. ¿Esto significa que las distribuciones de datos son iguales?
4
Dispersión
Representación gráfica de los datos de la cantidad de llamadas atendidas por
los dos call centers
Una comparación simple, nos permite apreciar que aunque los datos tienen media y
mediana iguales, no se ven similares. Es necesario tener otras medidas para el análisis.
5
Dispersión
7
El Concepto de Variabilidad
Para la medición, se aprovecha el hecho de que si los datos se
parecen mucho entre sí, se aproximan más al valor de la media y si
por el contrario, son muy diferentes entre sí, se alejan más del valor
de la media.
8
Homogeneidad y Heterogeneidad
de los Datos
Homogeneidad de los datos: El grado en que los datos son
parecidos entre sí y al valor de la media. (Más homogéneos
entonces menos variabilidad)
9
Medidas de Variabilidad o Dispersión
Son aquellas que miden el grado de separación de los datos respecto
a un valor central. Las medidas más usadas son:
• Rango (R)
• Rango intercuartílico (RIQ)
• Rango interpercentílico (RIP80 o RIP90)
• Varianza
• Desviación estándar
• Coeficiente de variación
10
Analice la dispersión de dos muestras de datos
MUESTRA A:
PROMEDIO : 1000 DÓLARES
VARIANZA : 400 DOLARES AL CUADRADO
DESVIACIÓN ESTANDAR : 20 DOLARES
MUESTRA B:
PROMEDIO: 5000 DOLARES
VARIANZA : 1600 DOLARES AL CUADRADO
DESVIACIÓN ESTANDAR : 40 DOLARES
HALLAMOS EL CV
CV A = SA / PROM A X 100 = 20/1000 X 100 = 2%
CV B = SB /PROM B X 100 = 40/5000 X 100 = 0.8%
LA DISPERSIÓN RELATIVA DE LA MUESTRA B ES MENOR
QUE LA DISPERSIÓN RELATIVA DE LA MUESTRA A
AMBAS MUESTRAS PRESENTAN DISPERSIÓN BAJA.
11
01 Rango
02 Rango Intercuartílico
03 Rango Interpercentílico
Agenda
04 Varianza
05 Desviación Estándar
06 Coeficiente de Variación
12
01
Rango
13
01 Rango
Rango
El Rango de variación se representa por la diferencia entre sus valores
máximo y mínimo, resultando ser la medida de variabilidad más
sencilla, pero es la menos confiable, ya que sólo usa dos datos para su
cálculo.
R = Xmáx - Xmín
Xmín Xmáx
14
01 Rango
Ejemplo
𝑹=𝟑𝟗𝟐𝟓 −𝟑𝟑𝟏𝟎=𝟔𝟏𝟓
15
01 Rango
Rango
16
02
Rango
Intercuartílico
17
02 Rango Intercuartílico
RIQ = Q3 - Q1
RIQ= P75-P25
Es el rango en el que se encuentra el 50% central de los datos.
50%
25% 25%
Q1 Q2 Q3
18
02 Rango Intercuartílico
Ejemplo
7 9 9 9 12 12 13 14 17 21 22
20
03
Rango
Interpercentilico
21
03 Rango Interpercentilico
RIP90 = P95-P5
Es el rango en el que se encuentra concentra al 90% de los datos
centrales.
22
03 Rango Interpercentilico
23
04
Varianza
24
04 Varianza
25
04 Varianza
Propiedades de la Varianza
26
04 Varianza
Propiedades de la Varianza
27
04 Varianza
28
04 Varianza
Ejemplo
Datos X1 X2 X3 X4 Promedio
(edades en
años)
Grupo 1 8 2 10 20 10
Grupo 2 11 8 11 10 10
Grupo 3 10 10 10 10 10
Estos tres grupos de datos tienen igual promedio, aunque claramente son
diferentes: El grupo 3 es el más homogéneo, mientras que el grupo 1 es el más
heterogéneo.
¿Qué medida podrá determinar esta
diferencia?
29
04 Varianza
Ejemplo
Calcularemos para cada grupo:
Grupo 1
Dato Promedio Diferencia Desviación al
(desviación) cuadrado
8 10 -2 4
2 10 -8 64
10 10 0 0
20 10 10 100
Total (suma) 168
Ejemplo
Calcularemos para cada grupo:
Grupo 2
Dato Promedio Diferencia Desviación al
(desviación) cuadrado
11 10 1 1
8 10 -2 4
11 10 1 1
10 10 0 0
Total (suma) 6
Ejemplo
Calcularemos para cada grupo:
Grupo 3
Dato Promedio Diferencia Desviación al
(desviación) cuadrado
10 10 0 0
10 10 0 0
10 10 0 0
10 10 0 0
Total (suma) 0
Ejemplo
Comparemos los resultados:
Ejemplo
Comparemos los resultados:
34
05
Desviación
Estándar
35
05 Desviación Estándar
Ejemplo
La desviación estándar no puede ser nunca un valor negativo
Grupo Promedio Varianza Desviación
estándar
1 10 42 años2 6.48 años
3 10 0 años2 0 años
37
05 Desviación Estándar
38
05 Desviación Estándar
Interpretación
39
06
Coeficiente de
Variación
40
06 Coeficiente de Variación
Coeficiente de Variación
Es medida de dispersión RELATIVA, es muy útil cuando se quiere
comparar el grado de dispersión en dos o más conjuntos de datos que
tienen un promedio diferente y/o tienen diferentes unidades de medida.
Se calcula como el cociente entre la desviación estándar y la media para
una distribución de datos, expresado en porcentaje.
Ejemplo
Ahora con los datos anteriores calculamos el CV:
42
06 Coeficiente de Variación
Ejemplo 5: Jornal
43
06 Coeficiente de Variación
Ejemplo
Ahora con los datos anteriores calculamos el CV:
44
Unidad de aprendizaje 1: Conceptos
básicos para el análisis de los datos
Lectura Cap. 3
Referencias Estadística para Administración y
Economía, Anderson D. Sweeney, D.
45