Semana 6 - Medidas de Dispersión 2022

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 45

ESTADÍSTICA Y

PROBABILIDADES

Semana 6 :
Medidas de Dispersión

1
Unidad de aprendizaje 2: Medidas en
estadística

Resultado
de Aplica los conceptos, técnicas e interpreta
las medidas de dispersión.
Aprendizaje

2
Dispersión
Si nos limitáramos solamente a observar las medidas de tendencia central,
no tendríamos una idea acabada de como se distribuyen los datos.

Porejemplo, las siguientes series de sueldos en Lima tienen igual


promedio:
Serie A: 2500, 2800, 3000, 3300, 3500 Media =3020
Serie B: 1000, 1500, 1600,4000, 7000 Media = 3020

Sin embargo las series son distintas.

3
Dispersión
Otro ejemplo, Banco Santander está comparando la cantidad de
llamadas atendidas por dos call centers, uno en Piura y otro en
Arequipa en el año 2020:
TRIMESTRE AREQUIPA PIURA
1 1200 1070
2 1500 2694
3 1220 6
4 1350 1500
Media 1317.5 1317.5
Mediana 1285 1285
Moda No tiene No tiene

Observamos que tanto la media como la mediana son iguales y ambas distribuciones
no tienen moda. ¿Esto significa que las distribuciones de datos son iguales?
4
Dispersión
Representación gráfica de los datos de la cantidad de llamadas atendidas por
los dos call centers

Una comparación simple, nos permite apreciar que aunque los datos tienen media y
mediana iguales, no se ven similares. Es necesario tener otras medidas para el análisis.

5
Dispersión

¿Cuán representativa es una medida de


tendencia central?
¿Cuál de dos o más distribuciones de datos
de una misma variable es más o menos
dispersa respecto a una medida de tendencia
central?
6
El Concepto de Variabilidad
Es el grado en que los datos son diferentes entre sí o la medida de
las diferencias de los datos entre sí.

7
El Concepto de Variabilidad
Para la medición, se aprovecha el hecho de que si los datos se
parecen mucho entre sí, se aproximan más al valor de la media y si
por el contrario, son muy diferentes entre sí, se alejan más del valor
de la media.

8
Homogeneidad y Heterogeneidad
de los Datos
Homogeneidad de los datos: El grado en que los datos son
parecidos entre sí y al valor de la media. (Más homogéneos
entonces menos variabilidad)

Heterogeneidad de los datos: El grado en que los datos son


diferentes entre sí y del valor de la media. (Más heterogéneos
entonces más variabilidad)
Es preferible que los datos sean homogéneos o poco variables.

9
Medidas de Variabilidad o Dispersión
Son aquellas que miden el grado de separación de los datos respecto
a un valor central. Las medidas más usadas son:

• Rango (R)
• Rango intercuartílico (RIQ)
• Rango interpercentílico (RIP80 o RIP90)
• Varianza
• Desviación estándar
• Coeficiente de variación

10
Analice la dispersión de dos muestras de datos
MUESTRA A:
PROMEDIO : 1000 DÓLARES
VARIANZA : 400 DOLARES AL CUADRADO
DESVIACIÓN ESTANDAR : 20 DOLARES

MUESTRA B:
PROMEDIO: 5000 DOLARES
VARIANZA : 1600 DOLARES AL CUADRADO
DESVIACIÓN ESTANDAR : 40 DOLARES

HALLAMOS EL CV
CV A = SA / PROM A X 100 = 20/1000 X 100 = 2%
CV B = SB /PROM B X 100 = 40/5000 X 100 = 0.8%
LA DISPERSIÓN RELATIVA DE LA MUESTRA B ES MENOR
QUE LA DISPERSIÓN RELATIVA DE LA MUESTRA A
AMBAS MUESTRAS PRESENTAN DISPERSIÓN BAJA.

11
01 Rango

02 Rango Intercuartílico

03 Rango Interpercentílico
Agenda
04 Varianza

05 Desviación Estándar

06 Coeficiente de Variación
12
01
Rango

13
01 Rango

Rango
El Rango de variación se representa por la diferencia entre sus valores
máximo y mínimo, resultando ser la medida de variabilidad más
sencilla, pero es la menos confiable, ya que sólo usa dos datos para su
cálculo.

R = Xmáx - Xmín

Xmín Xmáx

14
01 Rango

Ejemplo

𝑹=𝟑𝟗𝟐𝟓 −𝟑𝟑𝟏𝟎=𝟔𝟏𝟓

15
01 Rango

Rango

Aunque es la medida más fácil de calcular, rara vez se usa como


única medida, porque se afecta mucho por los valores extremos.

• A mayor Rango, mayor dispersión


• A menor Rango, menor dispersión
• A mayor Rango, mayor heterogeneidad, menor homogeneidad
de los datos.
• A menor Rango, menor heterogeneidad, mayor homogeneidad
de los datos.

16
02
Rango
Intercuartílico

17
02 Rango Intercuartílico

Rango Intercuartílico (RIQ)


Es la diferencia entre el primer y último cuartil

RIQ = Q3 - Q1
RIQ= P75-P25
Es el rango en el que se encuentra el 50% central de los datos.

50%
25% 25%

Q1 Q2 Q3

18
02 Rango Intercuartílico

Ejemplo

En la distribución de las edades (años) de estudiantes de una


escuela de danzas peruanas, se encuentra:
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11

7 9 9 9 12 12 13 14 17 21 22

Q1 Posición: 1(11+1) = 3 Q3 Posición: 3(11+1) = 9


4 4
Q1  9 Q3  17
𝑹𝑰𝑸=𝑸 𝟑− 𝑸 𝟏
𝑹𝑰𝑸=𝟏𝟕 − 𝟗=𝟖
El 50% central de los estudiantes tiene edades entre 9 y 17 años.
19
02 Rango Intercuartílico

Rango Intercuartílico (RIQ)

El RIQ elimina el 25% de los datos mas bajos y el 25% de los


más altos por lo que elimina el efecto de los valores extremos.
Por eso es una medida más precisa.

• A mayor RIQ, mayor dispersión


• A menor RIQ, menor dispersión
• A mayor RIQ, mayor heterogeneidad, menor homogeneidad de
los datos.
• A menor RIQ, menor heterogeneidad, mayor homogeneidad de
los datos.

20
03
Rango
Interpercentilico

21
03 Rango Interpercentilico

Rango Interpercentilico (RIP)


Podemos calcular además, el rango entre valores de percentiles

RID = RIP80= P90-P10 = D9 – D1


Es el rango en el que se encuentra concentra al 80% de los datos
centrales. También llamado Rango interdecílico.
O también:

RIP90 = P95-P5
Es el rango en el que se encuentra concentra al 90% de los datos
centrales.

22
03 Rango Interpercentilico

Rango Interpercentilico (RIP)

El RIP80 o RIP90 emplea el 80% o 90% de los datos centrales,


así que al considerar más datos en su cálculo, es una medida un
poco más precisa.

• A mayor RIP, mayor dispersión


• A menor RIP, menor dispersión
• A mayor RIP, mayor heterogeneidad, menor homogeneidad de
los datos.
• A menor RIP, menor heterogeneidad, mayor homogeneidad de
los datos.

23
04
Varianza

24
04 Varianza

Varianza (V, S2)


La varianza o variancia es una medida de variabilidad absoluta, se
expresa en unidades al cuadrado y utiliza todos los datos para su
cálculo, el cual se basa en las diferencias entre el valor de las
observaciones y su media.

Se define como el promedio de las desviaciones, elevadas al


cuadrado, de cada uno de los datos con respecto a la media.

25
04 Varianza

Propiedades de la Varianza

26
04 Varianza

Propiedades de la Varianza

27
04 Varianza

Fórmulas para la Varianza

28
04 Varianza

Ejemplo
Datos X1 X2 X3 X4 Promedio
(edades en
años)
Grupo 1 8 2 10 20 10
Grupo 2 11 8 11 10 10
Grupo 3 10 10 10 10 10

Estos tres grupos de datos tienen igual promedio, aunque claramente son
diferentes: El grupo 3 es el más homogéneo, mientras que el grupo 1 es el más
heterogéneo.
¿Qué medida podrá determinar esta
diferencia?
29
04 Varianza

Ejemplo
Calcularemos para cada grupo:
Grupo 1
Dato Promedio Diferencia Desviación al
(desviación) cuadrado
8 10 -2 4
2 10 -8 64
10 10 0 0
20 10 10 100
Total (suma) 168

Varianza : 168/4 = 42 años al cuadrado


30
04 Varianza

Ejemplo
Calcularemos para cada grupo:
Grupo 2
Dato Promedio Diferencia Desviación al
(desviación) cuadrado
11 10 1 1
8 10 -2 4
11 10 1 1
10 10 0 0
Total (suma) 6

Varianza : 6/4 = 1.5 años al cuadrado


31
04 Varianza

Ejemplo
Calcularemos para cada grupo:
Grupo 3
Dato Promedio Diferencia Desviación al
(desviación) cuadrado
10 10 0 0
10 10 0 0
10 10 0 0
10 10 0 0
Total (suma) 0

Varianza : 0/4 = 0 años al cuadrado


32
04 Varianza

Ejemplo
Comparemos los resultados:

Grupo Promedio Varianza


1 10 42 años2
2 10 1.5 años2
3 10 0 años2

• A mayor varianza, mayor dispersión


• A menor varianza, menor dispersión
• Si la varianza es cero, significa que no hay dispersión de los
datos (cuando todos los datos son iguales entre sí).
33
04 Varianza

Ejemplo
Comparemos los resultados:

Grupo Promedio Varianza


1 10 42 años2
2 10 1.5 años2
3 10 0 años2

Si bien la varianza es una medida de dispersión, es difícil de interpretar dado


que sus unidades quedan elevadas AL CUADRADO
Para ello se trabajará con el concepto de DESVIACIÓN ESTÁNDAR, la raíz
cuadrada positiva de la varianza.

34
05
Desviación
Estándar

35
05 Desviación Estándar

Ejemplo
La desviación estándar no puede ser nunca un valor negativo
Grupo Promedio Varianza Desviación
estándar
1 10 42 años2 6.48 años

2 10 1.5 años2 1.22 años

3 10 0 años2 0 años

• A mayor desviación estándar, mayor dispersión


• A menor desviación estándar, menor dispersión
• Si la desviación estándar, significa que no hay dispersión de
los datos (cuando todos los datos son iguales entre sí).
36
05 Desviación Estándar

Desviación Estándar (S)


Como la varianza es una medida que resulta en unidades al
cuadrado, esto trae dificultades para su interpretación, es por ello
que surge la necesidad de una medida que tenga unidades de menor
complejidad.

La Desviación Estándar se define como la raíz cuadrada (positiva)


de la varianza.

37
05 Desviación Estándar

Varianza y Desviación Estándar

• A mayor V, S, mayor dispersión


• A menor V, S, menor dispersión
• A mayor V, S, mayor heterogeneidad, menor homogeneidad
de los datos.
• A menor V, S, menor heterogeneidad, mayor homogeneidad
de los datos.

38
05 Desviación Estándar

Interpretación

39
06
Coeficiente de
Variación

40
06 Coeficiente de Variación

Coeficiente de Variación
Es medida de dispersión RELATIVA, es muy útil cuando se quiere
comparar el grado de dispersión en dos o más conjuntos de datos que
tienen un promedio diferente y/o tienen diferentes unidades de medida.
Se calcula como el cociente entre la desviación estándar y la media para
una distribución de datos, expresado en porcentaje.

En general consideraremos lo siguiente:


• Si CV < 25% implica baja dispersión
• Si CV >50%implica alta dispersión
• En otro caso se tiene dispersión moderada
41
06 Coeficiente de Variación

Ejemplo
Ahora con los datos anteriores calculamos el CV:

Grupo Promedio Varianza Desviación Coeficiente de


estándar variación CV
1 10 42 años2 6.48 años 6.48/10 = 64.8%
2 10 1.5 años2 1.22 años 1.22/10 = 12.22%
3 10 0 años2 0 años 0/10= 0%

• Como observamos, el grupo 1 tiene una alta dispersión (CV>50%)


• Además el grupo2 tiene dispersión baja (CV < 25%) y el grupo 3
tiene dispersión nula (ya que todos los datos son iguales)

42
06 Coeficiente de Variación

Ejemplo 5: Jornal

43
06 Coeficiente de Variación

Ejemplo
Ahora con los datos anteriores calculamos el CV:

Compañía Promedio Desviación Coeficiente de variación


estándar CV
A 50 12 12/50x100=24%
B 37.5 5.63 5.63/37.5x100=15.01%

• Como observamos, los salarios de los obreros son más


homogéneos (menor dispersión) en la empresa B, aunque ambas
compañías presentan dispersión relativa baja.

44
Unidad de aprendizaje 1: Conceptos
básicos para el análisis de los datos

Lectura Cap. 3
Referencias Estadística para Administración y
Economía, Anderson D. Sweeney, D.

45

También podría gustarte