Dispersión y Asimetría

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 38

DIPLOMADO DE POSTGRADO

DE ESPECIALIZACION
EN ASESORIA DE TESIS

MEDIDAS DE
DISPERSIÓN Y
ASIMETRÍA
OBJETIVOS
Al finalizar el Tema 6, el participante será capaz de:
1. Calcular e interpretar las principales medidas de
dispersión:
A) Rango
B) Rango intercuartílico
C) Varianza
D) Desviación estándar
E) Coeficiente de variabilidad
2. Calcular e interpretar las principales medidas de
la forma de la distribución.
A) Coeficiente de asimetría
B) Coeficiente de curtosis
CONTENIDO

1. MEDIDAS DE DISPERSIÓN
1.1 Rango
1.2 Rango intercuartílico
1.3 Varianza
1.4 Desviación estándar
1.5 Coeficiente de variabilidad
2. MEDIDAS DE LA FORMA DE LA DISTRIBUCIÓN
2.1 Asimetría
2.2 Curtosis
6.1 Las medidas de dispersión

Llamadas también medidas de variabilidad


Son útiles porque:
1. Permiten juzgar la confiabilidad de la medida
de tendencia central.
2. Los datos demasiados dispersos tienen un
comportamiento especial.
3. Es posible comparar dispersión de diversas
muestras.
6.1.1 El rango (R)

Llamado también recorrido, amplitud total o


alcance.

a) Obtención: se obtiene de la influencia entre


el dato mayor y el dato menor más una
unidad significativa, a fin de incluir ambos
valores extremos.
Ejemplo:

Los siguientes datos representan el peso de 10 niños


al nacer, (en Kg.). Calcule e interprete el rango.
2,860 3,150 3,450 2,950 3,780
4,170 3,920 3,280 4,050 3,120

Rango = (4,170 - 2,860) + 0.001


Rango = 1,311 Kg.
b) Interpretación
La diferencia entre el bebe de mayor peso y el
bebe menor peso es 1,311 Kg.

c) Cálculo a partir de datos agrupados, se utiliza


la siguiente fórmula:
R= (Ls - Li ) + 1
donde: L : Limite superior de la
s
última clase
L : Limite inferior de la
i
primera clase
Ejemplo:
La distribución de frecuencias siguiente representa el
tiempo que espera un paciente para ser atendido, en un
consultorio externo. Calcule e interprete el rango
Tiempo Nº de Pacientes
(minutos) (por día)
12 - 16 4 Rango = (36-12) + 1
17 - 21 8
22 - 26 15 R = 25 minutos
27 - 31 23
32 - 36 10
Total 60
Interpretación: la diferencia de tiempo entre el paciente
que más espera y el que menos espera para ser atendido
es 25 minutos.
f) Ventajas y desventajas del rango
Ventajas
fácil de calcular
fácil de entender e interpretar

Desventajas
sólo considera los valores extremos
no toma en cuenta ni el número de
datos ni el valor de estos
no es posible calcular en tablas con
extremos abiertos.
6.1.2 El rango intercuartílico
Permite ubicar el
50% de los datos
que se encuentran
en el centro de la
distribución, es
decir, el 25% de los
datos son menores
al primer cuartil y
también 25% de los
datos son mayores
al tercer cuartil.
Ejemplo:
La tabla muestra la experiencia (en años) del
personal que labora en el Hospital Central.

Experiencia
Trabajadores A)¿Entre qué valores
(años)
0-3 18 se encuentra el
4-7 42 50% intermedio de
8 - 11 68 estos datos?
12 - 15 120
16 - 19 40
20 - 23 34 B)¿Cuál es el rango
24 - 27 12 intercuartílico?
Total 334
50 %
25 % 25 %

Q1 Q3

Rango
Intercuartílico
25(334)
Lugar Q1  P25   83.5o se ubica en la 3ra clase
100

 25(334)  60  1


 100  Q  8.82 años
Q  7.5  4
1  68  1
 
75(334)
Lugar Q 3  P75   250.5o se ubica en la 5ta clase
100

 75(334)  248  1


 100 
Q  15.5 
3  40 4 Q  15.65 años
3
 

A. El 50% de los trabajadores con experiencia


intermedia se encuentran entre 8,82 y 15,65
años.

B. El rango intercuartílico es 6 años 10 meses


aproximadamente
6.1.3 La desviación cuartílica
Es una medida de variabilidad fácil de
calcular. Es la mitad del rango intercuartil.
Mide la dispersión del 50% central de las
observaciones respecto a la mediana.
Es imposible tener una DC negativa. Es raro,
pero podría tener un valor igual a 0, en el
caso que los percentiles sean iguales (P75 =
P25). Cuando mayor sea la diferencia entre
los percentiles, mayor será el valor de la DC.
P75  P25
DC 
2
Ejemplo:
Si P25 = 7,2 13,4  7,2
DC   3,1
P75 = 13,4 2

Interpretación:
50% central de las observaciones varía en 3,1 con
respecto a la mediana.
6.1.3 La varianza

Es una medida de desviación promedio con


respecto a la media aritmética

a) Cálculos a partir de datos no agrupados.


n 2
 (X  x )
para una muestra 2
 i 1
i

S n 1
N 2

2
 (X   )
i
para un población   i 1

N
Ejemplo:
La siguiente información se refiere al número de
radiografías reprocesadas durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma siguiente:

x Xi  x Xi  x  2

8 8 - 10 = 2 4
60
10 10 - 10 = 0 0 x
5 5 - 10 = 5 25 6
12 12 - 10 = 2 4
10 10 - 10 = 0 0
15 15 - 10 = 5 25 x  10
 X  60  Xi  x   0  Xi  x  2
 58
 X i  x   58
2

 (X i  x )
2

2
S  n 1

2 58
S  6  1  11 .6
6.1.4 La desviación estándar
Llamada también desviación típica representa la
variabilidad (o desviaciones) promedio de los datos
con respecto a la media aritmética. Es la raíz cuadrada
de la varianza, sea poblacional o muestral.
a) Cálculos a partir de datos no agrupados
n

 (X i  x )
2

2
para la muestra S s  i 1
n 1

N
 (X i   )
2

para la población   2  i 1
N
Ejemplo:
La siguiente información se refiere al número de
radiografías reprocesadas durante una semana.
Calcule la desviación estándar.
8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 = 11,6
Entonces 2
S s
S  11,6

S  3,4 radiografias
6.1.5 El coeficiente de variación
Es una medida relativa de variabilidad de los datos.
Permite comparar la variabilidad de dos o más
conjuntos de datos expresados en unidades
diferentes (peso: Kg. y libras).

a) Cálculos a partir de datos no agrupados

para la muestra: s
CV   100
x

para la población: 
CV   100

Ejemplo:
A continuación se presentan las tarifas (en
unidades monetarias) de dos laboratorios de
análisis clínicos. El laboratorio I tiene sus tarifas en
soles y el laboratorio II en dólares ¿Cuál de ellos
tiene un plan tarifario más homogéneo o estable?.

Laboratorio I (soles) Laboratorio II (dólares)


40,70,60,48,52,65,58
70,35,150,140,82,110,140,120

Calculamos la media y desviación estándar por


cada una de los laboratorios
Laboratorio I
n
 Xi 393
x  i 1

n

7
 56.14

x Xi  x Xi  x  2

40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46
 X  393  Xi  x   0  Xi  x 
2
 632,86
Si  X i  x   632.86
2

n
 i
( X  x )
2
632.86
S i 1
  10.27
n 1 7 1

S
CV   100
x

10.27
CV   100  18.29
56.14
Laboratorio II n

 Xi 847
x  i 1   105.87
n 8
x Xi  x Xi  x  2

70 -35.87 1286.6569
35 -70.87 5022.5569
150 44.13 1947.4569
140 34.13 1164.8569
82 -23.87 569.7769
110 4.13 17.0569
140 34.13 1164.8569
120 14.13 199.6569
 X  847  Xi  x   0,04  Xi  x 
2
 11372,88

n
Si  X i  x 
2
 11372 .88
i 1

n
x)
2
 (X i 11372,88
S i 1
  40.30
n 1 8 1

S 40,30
CV   100 CV   100  30,06
x 105,87

El Laboratorio II presenta una mayor variabilidad


en el plan tarifario.
6.2 MEDIDAS DE ASIMETRIA O SESGO
6.2.1 Coeficiente de Asimetría
Es un indicador del grado de asimetría que presenta
una distribución.

3( X  Md )
S kp 
S

Valores posibles
 3 asimetría negativa
S kp  
 3 asimetría positiva
Si Skp tiende a 3 la distribución es asimétrica hacia la
derecha o asimetría positiva.

Si Skp tiende a -3 la distribución es asimétrica a la


izquierda o asimetría negativa.

En distribuciones simétricas, no existe sesgo, es


decir Skp = 0.

En la práctica, el coeficiente de Asimetría de Pearson


varía entre -1 y +1
6.2.2 Coeficiente de Curtósis

Es una medida del grado de apuntalamiento,


generalmente comparada con el apuntalamiento
de la distribución normal.

0,5( P0 , 75  P0 , 25 )
Ku 
P0 , 9  P0 ,1
Valores posibles
a) Leptocúrtica (concentración al centro): Si el grado de
apuntalamiento de una distribución es mayor que el de la
distribución normal. Kμ  0,5
b) Mesocúrtica (distribuidos simétricamente): Si el grado de
apuntalamiento de una distribución es igual que el de la
distribución normal. Kμ  0,25
c) Platicúrtica (aplanada).Si el grado de apuntalamiento de
una distribución es menor que el de la distribución
normal. 0 ≤ Kμ ≤ 0,25
Platicurtica Mesocurtica Leptocúrtica
0,0 0,25 0,50
Ejemplo:
La tabla muestra la edad (en años) de 70 pacientes
atendidos en el servicio de emergencia de un hospital
local.
4 67 18 15 11 3 24
3 85 15 15 14 5 26
5 6 16 15 13 7 21
6 7 17 16 10 8 22
7 7 15 17 6 12 17
25 10 13 17 4 15 16
13 12 13 13 8 17 9
2 15 14 14 14 18 9
4 16 20 16 18 20 15
5 17 14 17 20 21 12
A) Calcular e interpretar la asimetría de la distribución
B) Calcular e interpretar la curtosis de la distribución.
Los resultados han sido obtenidos usando Microsoft
Excel
Media aritmetica 14.27 3(14,27  13,50)
S kp   0,202
Desviacion estandar 11.42 11,42
Mediana 13.50
Cuartil 1 7.00 0,5(17,00  7,00 )
Ku   0,263
Cuartil 3 17.00 23,00  4,00
Percentil 90 23.00
Percentil10 4.00
Hoja de Comprobación

1. El valor de cada observación del conjunto de datos se toma en cuenta


cuando calculamos su mediana
2. Cuando la población esta sesgada positiva o negativamente, a menudo es
preferible utilizar la mediana como mejor medida de posición, debido a
que siempre cae entre la media y la moda
3. Las medidas de tendencia central de un conjunto de datos se refieren al
grado en que las observaciones están dispersas

4. Una medida de la agudeza de una curva de distribución es el sesgo

5. Con un conjunto de datos no agrupados, la moda se utiliza con mas


frecuencia como medida de tendencia central
6. Si organizamos las observaciones de un conjunto de datos en orden
descendente, el punto de datos que se encuentra en medio es la mediana
del conjunto de datos
7. Cuando se trabaja con datos agrupados, podemos calcular una media
aproximada si suponemos que cada valor de una clase dada es igual a su
punto medio

8. El valor que más se repite en un conjunto de datos se conoce como media


aritmética

9.Para un arreglo de datos con 50 observaciones, la mediana será el valor de


la observación numero 25 del arreglo

10.La desviación estándar se mide en las mismas unidades que las


observaciones del conjunto de datos
11. Si la curva de una cierta distribución tiene el extremo mas largo
hacia la izquierda de la escala de medición del eje horizontal, se dice que
la distribución esta negativamente sesgada
12.Después de agrupar un conjuntos de datos en un cierto numero de clases,
podemos identificar la clase mediana como la que tiene el mayor numero
de observaciones

13.Una media calculada a partir de un conjunto de datos agrupados siempre


da una buena estimación del valor real, aunque rara vez es exacto

14..Podemos calcular una media para cualquier conjunto de datos, si se nos


da su distribución de frecuencias

15..La moda siempre se encuentra en el punto mas alto de una gráfica de un


arreglo de datos

16. El numero de elementos de una población se denota con n


17.Los valores extremos de un conjunto de datos tienen un fuerte efecto
sobre la mediana

18.La diferencia entre las observaciones mas alta y mas baja de un conjunto
de datos se conoce como media geométrica

19.La dispersión de un conjunto de datos da una cierta visión de la


confiabilidad de la medida de tendencia central

20.La desviación estándar es igual a la raíz cuadrada de la varianza

21. .La diferencia entre las observaciones mas alta y mas baja de un
conjunto de datos se conoce como el alcance cuartil

22. El alcance intercuartil esta basado solamente en dos valores tomados del
conjunto de datos
23.Un fractil es una posición en una distribución de frecuencias
en la que una determinada fracción (o porción) de los datos esta
situada en ella o por encima
24.La varianza, al igual que la desviación estándar, toma en cuenta cada una
de las observaciones del conjunto de datos

25. .El coeficiente de variación es una medida absoluta de la dispersión

26. La medida de dispersión que con mas frecuencia utilizan los


especialistas en estadística es la desviación estándar

27.Una de las ventajas de las medidas de dispersión es que cualquier


estadística que mide variación absoluta, también mide variación relativa
28. Una desventajas de utilizar el alcance para medir la dispersión es que no
toma en cuenta la naturaleza de las variaciones entre la mayoría de las
observaciones
29.La varianza indica la distancia promedio de cualquier
observación del conjunto de datos con respecto a la media

30. Cada población tiene una varianza que se simboliza con S2

31.De acuerdo con el teorema de Chebyshev, no mas de 11% de las


observaciones de una población puede tener resultados estándar de la
población mayores que 3 o menores que -3

32.El alcance intercuartil es un ejemplo especifico de un alcance interfractil

33.Es posible medir el alcance de una distribución de extremo abierto

34.El alcance intercuartil mide el alcance promedio de la cuarta parte más


baja de una distribución.

También podría gustarte