Dispersión y Asimetría

DIPLOMADO DE POSTGRADO
DE ESPECIALIZACION
EN ASESORIA DE TESIS
MEDIDAS DE
DISPERSIÓN Y
ASIMETRÍA
OBJETIVOS
Al finalizar el Tema 6, el participante será capaz de:
1. Calcular e interpretar las principales medidas de
dispersión:
A) Rango
B) Rango intercuartílico
C) Varianza
D) Desviación estándar
E) Coeficiente de variabilidad
2. Calcular e interpretar las principales medidas de
la forma de la distribución.
A) Coeficiente de asimetría
B) Coeficiente de curtosis
CONTENIDO
1. MEDIDAS DE DISPERSIÓN
1.1 Rango
1.2 Rango intercuartílico
1.3 Varianza
1.4 Desviación estándar
1.5 Coeficiente de variabilidad
2. MEDIDAS DE LA FORMA DE LA DISTRIBUCIÓN
2.1 Asimetría
2.2 Curtosis
6.1 Las medidas de dispersión
Llamadas también medidas de variabilidad

Son útiles porque:
1. Permiten juzgar la confiabilidad de la medida
de tendencia central.
2. Los datos demasiados dispersos tienen un
comportamiento especial.
3. Es posible comparar dispersión de diversas
muestras.
6.1.1 El rango (R)
Llamado también recorrido, amplitud total o

alcance.
a) Obtención: se obtiene de la influencia entre

el dato mayor y el dato menor más una
unidad significativa, a fin de incluir ambos
valores extremos.
Ejemplo:
Los siguientes datos representan el peso de 10 niños

al nacer, (en Kg.). Calcule e interprete el rango.
2,860 3,150 3,450 2,950 3,780
4,170 3,920 3,280 4,050 3,120
Rango = (4,170 - 2,860) + 0.001

Rango = 1,311 Kg.
b) Interpretación
La diferencia entre el bebe de mayor peso y el
bebe menor peso es 1,311 Kg.
c) Cálculo a partir de datos agrupados, se utiliza

la siguiente fórmula:
R= (Ls - Li ) + 1
donde: L : Limite superior de la
s
última clase
L : Limite inferior de la
i
primera clase
Ejemplo:
La distribución de frecuencias siguiente representa el
tiempo que espera un paciente para ser atendido, en un
consultorio externo. Calcule e interprete el rango
Tiempo Nº de Pacientes
(minutos) (por día)
12 - 16 4 Rango = (36-12) + 1
17 - 21 8
22 - 26 15 R = 25 minutos
27 - 31 23
32 - 36 10
Total 60
Interpretación: la diferencia de tiempo entre el paciente
que más espera y el que menos espera para ser atendido
es 25 minutos.
f) Ventajas y desventajas del rango
Ventajas
fácil de calcular
fácil de entender e interpretar
Desventajas
sólo considera los valores extremos
no toma en cuenta ni el número de
datos ni el valor de estos
no es posible calcular en tablas con
extremos abiertos.
6.1.2 El rango intercuartílico
Permite ubicar el
50% de los datos
que se encuentran
en el centro de la
distribución, es
decir, el 25% de los
datos son menores
al primer cuartil y
también 25% de los
datos son mayores
al tercer cuartil.
Ejemplo:
La tabla muestra la experiencia (en años) del
personal que labora en el Hospital Central.
Experiencia
Trabajadores A)¿Entre qué valores
(años)
0-3 18 se encuentra el
4-7 42 50% intermedio de
8 - 11 68 estos datos?
12 - 15 120
16 - 19 40
20 - 23 34 B)¿Cuál es el rango
24 - 27 12 intercuartílico?
Total 334
50 %
25 % 25 %
Q1 Q3
Rango
Intercuartílico
25(334)
Lugar Q1  P25   83.5o se ubica en la 3ra clase
100
 25(334)  60  1

 100  Q  8.82 años
Q  7.5  4
1  68  1
 
75(334)
Lugar Q 3  P75   250.5o se ubica en la 5ta clase
100
 75(334)  248  1

 100 
Q  15.5 
3  40 4 Q  15.65 años
3
 
A. El 50% de los trabajadores con experiencia

intermedia se encuentran entre 8,82 y 15,65
años.
B. El rango intercuartílico es 6 años 10 meses

aproximadamente
6.1.3 La desviación cuartílica
Es una medida de variabilidad fácil de
calcular. Es la mitad del rango intercuartil.
Mide la dispersión del 50% central de las
observaciones respecto a la mediana.
Es imposible tener una DC negativa. Es raro,
pero podría tener un valor igual a 0, en el
caso que los percentiles sean iguales (P75 =
P25). Cuando mayor sea la diferencia entre
los percentiles, mayor será el valor de la DC.
P75  P25
DC 
2
Ejemplo:
Si P25 = 7,2 13,4  7,2
DC   3,1
P75 = 13,4 2
Interpretación:
50% central de las observaciones varía en 3,1 con
respecto a la mediana.
6.1.3 La varianza
Es una medida de desviación promedio con

respecto a la media aritmética
a) Cálculos a partir de datos no agrupados.

n 2
 (X  x )
para una muestra 2
 i 1
i
S n 1
N 2
2
 (X   )
i
para un población   i 1
N
Ejemplo:
La siguiente información se refiere al número de
radiografías reprocesadas durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma siguiente:
x Xi  x Xi  x  2
8 8 - 10 = 2 4
60
10 10 - 10 = 0 0 x
5 5 - 10 = 5 25 6
12 12 - 10 = 2 4
10 10 - 10 = 0 0
15 15 - 10 = 5 25 x  10
 X  60  Xi  x   0  Xi  x  2
 58
 X i  x   58
2
 (X i  x )
2
2
S  n 1
2 58
S  6  1  11 .6
6.1.4 La desviación estándar
Llamada también desviación típica representa la
variabilidad (o desviaciones) promedio de los datos
con respecto a la media aritmética. Es la raíz cuadrada
de la varianza, sea poblacional o muestral.
a) Cálculos a partir de datos no agrupados
n
 (X i  x )
2
2
para la muestra S s  i 1
n 1
N
 (X i   )
2
para la población   2  i 1
N
Ejemplo:
La siguiente información se refiere al número de
radiografías reprocesadas durante una semana.
Calcule la desviación estándar.
8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 = 11,6
Entonces 2
S s
S  11,6
S  3,4 radiografias
6.1.5 El coeficiente de variación
Es una medida relativa de variabilidad de los datos.
Permite comparar la variabilidad de dos o más
conjuntos de datos expresados en unidades
diferentes (peso: Kg. y libras).
a) Cálculos a partir de datos no agrupados
para la muestra: s
CV   100
x
para la población: 
CV   100

Ejemplo:
A continuación se presentan las tarifas (en
unidades monetarias) de dos laboratorios de
análisis clínicos. El laboratorio I tiene sus tarifas en
soles y el laboratorio II en dólares ¿Cuál de ellos
tiene un plan tarifario más homogéneo o estable?.
Laboratorio I (soles) Laboratorio II (dólares)

40,70,60,48,52,65,58
70,35,150,140,82,110,140,120
Calculamos la media y desviación estándar por

cada una de los laboratorios
Laboratorio I
n
 Xi 393
x  i 1
n

7
 56.14
x Xi  x Xi  x  2
40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46
 X  393  Xi  x   0  Xi  x 
2
 632,86
Si  X i  x   632.86
2
n
 i
( X  x )
2
632.86
S i 1
  10.27
n 1 7 1
S
CV   100
x
10.27
CV   100  18.29
56.14
Laboratorio II n
 Xi 847
x  i 1   105.87
n 8
x Xi  x Xi  x  2
70 -35.87 1286.6569
35 -70.87 5022.5569
150 44.13 1947.4569
140 34.13 1164.8569
82 -23.87 569.7769
110 4.13 17.0569
140 34.13 1164.8569
120 14.13 199.6569
 X  847  Xi  x   0,04  Xi  x 
2
 11372,88

n
Si  X i  x 
2
 11372 .88
i 1
n
x)
2
 (X i 11372,88
S i 1
  40.30
n 1 8 1
S 40,30
CV   100 CV   100  30,06
x 105,87
El Laboratorio II presenta una mayor variabilidad

en el plan tarifario.
6.2 MEDIDAS DE ASIMETRIA O SESGO
6.2.1 Coeficiente de Asimetría
Es un indicador del grado de asimetría que presenta
una distribución.
3( X  Md )
S kp 
S
Valores posibles
 3 asimetría negativa
S kp  
 3 asimetría positiva
Si Skp tiende a 3 la distribución es asimétrica hacia la
derecha o asimetría positiva.
Si Skp tiende a -3 la distribución es asimétrica a la

izquierda o asimetría negativa.
En distribuciones simétricas, no existe sesgo, es

decir Skp = 0.
En la práctica, el coeficiente de Asimetría de Pearson

varía entre -1 y +1
6.2.2 Coeficiente de Curtósis
Es una medida del grado de apuntalamiento,

generalmente comparada con el apuntalamiento
de la distribución normal.
0,5( P0 , 75  P0 , 25 )
Ku 
P0 , 9  P0 ,1
Valores posibles
a) Leptocúrtica (concentración al centro): Si el grado de
apuntalamiento de una distribución es mayor que el de la
distribución normal. Kμ  0,5
b) Mesocúrtica (distribuidos simétricamente): Si el grado de
apuntalamiento de una distribución es igual que el de la
distribución normal. Kμ  0,25
c) Platicúrtica (aplanada).Si el grado de apuntalamiento de
una distribución es menor que el de la distribución
normal. 0 ≤ Kμ ≤ 0,25
Platicurtica Mesocurtica Leptocúrtica
0,0 0,25 0,50
Ejemplo:
La tabla muestra la edad (en años) de 70 pacientes
atendidos en el servicio de emergencia de un hospital
local.
4 67 18 15 11 3 24
3 85 15 15 14 5 26
5 6 16 15 13 7 21
6 7 17 16 10 8 22
7 7 15 17 6 12 17
25 10 13 17 4 15 16
13 12 13 13 8 17 9
2 15 14 14 14 18 9
4 16 20 16 18 20 15
5 17 14 17 20 21 12
A) Calcular e interpretar la asimetría de la distribución
B) Calcular e interpretar la curtosis de la distribución.
Los resultados han sido obtenidos usando Microsoft
Excel
Media aritmetica 14.27 3(14,27  13,50)
S kp   0,202
Desviacion estandar 11.42 11,42
Mediana 13.50
Cuartil 1 7.00 0,5(17,00  7,00 )
Ku   0,263
Cuartil 3 17.00 23,00  4,00
Percentil 90 23.00
Percentil10 4.00
Hoja de Comprobación
1. El valor de cada observación del conjunto de datos se toma en cuenta

cuando calculamos su mediana
2. Cuando la población esta sesgada positiva o negativamente, a menudo es
preferible utilizar la mediana como mejor medida de posición, debido a
que siempre cae entre la media y la moda
3. Las medidas de tendencia central de un conjunto de datos se refieren al
grado en que las observaciones están dispersas
4. Una medida de la agudeza de una curva de distribución es el sesgo
5. Con un conjunto de datos no agrupados, la moda se utiliza con mas

frecuencia como medida de tendencia central
6. Si organizamos las observaciones de un conjunto de datos en orden
descendente, el punto de datos que se encuentra en medio es la mediana
del conjunto de datos
7. Cuando se trabaja con datos agrupados, podemos calcular una media
aproximada si suponemos que cada valor de una clase dada es igual a su
punto medio
8. El valor que más se repite en un conjunto de datos se conoce como media

aritmética
9.Para un arreglo de datos con 50 observaciones, la mediana será el valor de

la observación numero 25 del arreglo
10.La desviación estándar se mide en las mismas unidades que las

observaciones del conjunto de datos
11. Si la curva de una cierta distribución tiene el extremo mas largo
hacia la izquierda de la escala de medición del eje horizontal, se dice que
la distribución esta negativamente sesgada
12.Después de agrupar un conjuntos de datos en un cierto numero de clases,
podemos identificar la clase mediana como la que tiene el mayor numero
de observaciones
13.Una media calculada a partir de un conjunto de datos agrupados siempre

da una buena estimación del valor real, aunque rara vez es exacto
14..Podemos calcular una media para cualquier conjunto de datos, si se nos

da su distribución de frecuencias
15..La moda siempre se encuentra en el punto mas alto de una gráfica de un

arreglo de datos
16. El numero de elementos de una población se denota con n

17.Los valores extremos de un conjunto de datos tienen un fuerte efecto
sobre la mediana
18.La diferencia entre las observaciones mas alta y mas baja de un conjunto
de datos se conoce como media geométrica
19.La dispersión de un conjunto de datos da una cierta visión de la

confiabilidad de la medida de tendencia central
20.La desviación estándar es igual a la raíz cuadrada de la varianza
21. .La diferencia entre las observaciones mas alta y mas baja de un
conjunto de datos se conoce como el alcance cuartil
22. El alcance intercuartil esta basado solamente en dos valores tomados del
conjunto de datos
23.Un fractil es una posición en una distribución de frecuencias
en la que una determinada fracción (o porción) de los datos esta
situada en ella o por encima
24.La varianza, al igual que la desviación estándar, toma en cuenta cada una
de las observaciones del conjunto de datos
25. .El coeficiente de variación es una medida absoluta de la dispersión
26. La medida de dispersión que con mas frecuencia utilizan los

especialistas en estadística es la desviación estándar
27.Una de las ventajas de las medidas de dispersión es que cualquier

estadística que mide variación absoluta, también mide variación relativa
28. Una desventajas de utilizar el alcance para medir la dispersión es que no
toma en cuenta la naturaleza de las variaciones entre la mayoría de las
observaciones
29.La varianza indica la distancia promedio de cualquier
observación del conjunto de datos con respecto a la media
30. Cada población tiene una varianza que se simboliza con S2
31.De acuerdo con el teorema de Chebyshev, no mas de 11% de las

observaciones de una población puede tener resultados estándar de la
población mayores que 3 o menores que -3
32.El alcance intercuartil es un ejemplo especifico de un alcance interfractil
33.Es posible medir el alcance de una distribución de extremo abierto
34.El alcance intercuartil mide el alcance promedio de la cuarta parte más

baja de una distribución.

Dispersión y Asimetría

Cargado por

Copyright:

Formatos disponibles

Dispersión y Asimetría

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Dispersión y Asimetría

Cargado por

Copyright:

Formatos disponibles

DIPLOMADO DE POSTGRADO

Llamadas también medidas de variabilidad

Llamado también recorrido, amplitud total o

a) Obtención: se obtiene de la influencia entre

Los siguientes datos representan el peso de 10 niños

Rango = (4,170 - 2,860) + 0.001

c) Cálculo a partir de datos agrupados, se utiliza

 25(334)  60  1

 75(334)  248  1

A. El 50% de los trabajadores con experiencia

B. El rango intercuartílico es 6 años 10 meses

Es una medida de desviación promedio con

a) Cálculos a partir de datos no agrupados.

a) Cálculos a partir de datos no agrupados

Laboratorio I (soles) Laboratorio II (dólares)

Calculamos la media y desviación estándar por

El Laboratorio II presenta una mayor variabilidad

Si Skp tiende a -3 la distribución es asimétrica a la

En distribuciones simétricas, no existe sesgo, es

En la práctica, el coeficiente de Asimetría de Pearson

Es una medida del grado de apuntalamiento,

1. El valor de cada observación del conjunto de datos se toma en cuenta

4. Una medida de la agudeza de una curva de distribución es el sesgo

5. Con un conjunto de datos no agrupados, la moda se utiliza con mas

8. El valor que más se repite en un conjunto de datos se conoce como media

9.Para un arreglo de datos con 50 observaciones, la mediana será el valor de

10.La desviación estándar se mide en las mismas unidades que las

13.Una media calculada a partir de un conjunto de datos agrupados siempre

14..Podemos calcular una media para cualquier conjunto de datos, si se nos

15..La moda siempre se encuentra en el punto mas alto de una gráfica de un

16. El numero de elementos de una población se denota con n

19.La dispersión de un conjunto de datos da una cierta visión de la

20.La desviación estándar es igual a la raíz cuadrada de la varianza

25. .El coeficiente de variación es una medida absoluta de la dispersión

26. La medida de dispersión que con mas frecuencia utilizan los

27.Una de las ventajas de las medidas de dispersión es que cualquier

30. Cada población tiene una varianza que se simboliza con S2

31.De acuerdo con el teorema de Chebyshev, no mas de 11% de las

32.El alcance intercuartil es un ejemplo especifico de un alcance interfractil

33.Es posible medir el alcance de una distribución de extremo abierto

34.El alcance intercuartil mide el alcance promedio de la cuarta parte más

También podría gustarte