Estadistica de Resumen de Datos
Estadistica de Resumen de Datos
Estadistica de Resumen de Datos
Las curvas simtricas, tienen una forma tal que con una
lnea vertical que pase por el punto ms alto de la curva,
dividir el rea de esta en dos partes iguales.
Las curvas sesgadas son aquellas cuyos valores estn
concentrados en el extremo inferior o superior de la
escala de medicin del eje horizontal. La cola indica el
tipo de sesgo.
Cuando medimos la kurtsis nos referimos al grado de
agudeza. Pueden ser: leptocrtica (concentracin al
centro) mesocrtica distribuidos simtricamente) o
platicrtica (aplanada).
Las medidas de tendencia central
1. En general se denominan promedios.
2. Los ms importantes son la media, la mediana y la moda.
Aritmtica
Media Geomtrica
Medidas de Mediana Armnica
tendencia central Moda
= 10 reclamos
b) Interpretacin: Si elige al azar un da de la
semana, se espera que los alumnos del servicio de
Bienestar realicen 10 reclamos en ese da.
c) Simbologa:
: Media aritmtica
=1 : Sumatoria del producto de la marca
de clase por las frecuencias de cada
intervalo
=1 =n : El tamao de la muestra.
Ejemplo:
La distribucin de frecuencias siguiente, representa los
puntajes obtenidos en una evaluacin del desempeo,
aplicado al personal tcnico de un Municipio local. El
puntaje mximo en la prueba es 50. Calcule e interprete la
media.
Desempeo Nmero de
(puntos) tcnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Primero se calcularn las marcas de clase ( );
es decir, el valor intermedio de cada clase
Donde:
:Factor de ponderacin
:Datos
Ejemplo: Una empresa comercializadora de Seguros
Mdicos dispone de 3 representantes para la zona de
Amarilis, cada uno de los cuales cobra diferente comisin
por pliza vendida, y realiza diferente nmero de contratos.
Calcule e interprete el valor medio de la comisin
Interpretacin:
Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no estn
agrupados, su clculo es tedioso
Si los datos estn agrupados en clases con
extremos abiertos, no es posible calcular la
media.
(B) La media geomtrica ( x )
g
Se utiliza para calcular tasas medias de variacin, como la
tasa media de crecimiento poblacional, la tasa media de
inflacin mensual, la tasa media de mortalidad, entre
otros.
xg n X1 X2 X3 .........Xn
Ejemplo:
La siguiente tabla muestra la tasa de aumento en las quejas
durante los ltimos meses. Calcule e interprete la tasa
media mensual.
xg n x1, x 2, x3,......x
x g 5 (1.026) (1.054) (1.038) (1.005)(1.014)
x g 5 1.143903377
xg 1,0272540 ( Factorde crecim iento m edio)
TASA MEDIA DE VARIACION=( -1)X100
T. MEDIA DE VARIACION=(1,0272540-1)X100
=2,72%
c) Interpretacin
mediana
Interpretacin: Durante 5 das llegaron menos de 11
clientes tarde a plataforma y durante 5 das, ms de 11
clientes llegaron tarde.
Reglas
18 23
mediana 20.5
2
0;3 04 4
4; 7 12 16
8; 11 24 40
12; 15 16 56
16; 19 10 66
21; 24 03 69
69
e) Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la mediana como en el caso de la
media aritmtica.
Es fcil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos, registrados bajo una
escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero la serie de datos.
Para una serie amplia de datos no agrupados, el proceso de
ordenamiento de los datos demanda tiempo y usualmente provoca
equivocaciones.
LA MODA
La moda es el valor que ms se repite dentro de un
conjunto de datos.
se obtiene organizando la serie de datos y seleccionando el
o los datos que ms se repiten.
Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15
Mo : Moda
1 : Diferencia entre la clase modal y la pre-modal
2 : Diferencia entre la clase modal y post-modal
LRi: Limite real inferior de la clase modal.
A : Amplitud
e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o ms
clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribucin amodal).
En otros casos la distribucin tiene varias modas, lo que
dificulta su interpretacin.
MEDIDAS DE DISPERSION
1. MEDIDAS DE DISPERSIN
1.1 Rango
1.2 Rango intercuartlico
1.3 Varianza
1.4 Desviacin estndar
1.5 Coeficiente de variabilidad
2. MEDIDAS DE LA FORMA DE LA DISTRIBUCIN
2.1 Asimetra
2.2 Curtosis
Las medidas de dispersin llamadas tambin
medidas de variabilidad
Son tiles porque:
1. Permiten juzgar la confiabilidad de la medida
de tendencia central.
2. Los datos demasiados dispersos tienen un
comportamiento especial.
3. Es posible comparar dispersin de diversas
muestras.
El rango llamado tambin recorrido, amplitud
total o alcance.
Desventajas
slo considera los valores extremos
no toma en cuenta ni el nmero de datos ni el
valor de estos
no es posible calcular en tablas con extremos
abiertos.
EL RANGO INTERCUARTILICO
Permite ubicar el 50% de los datos
que se encuentran en el centro de la
distribucin, es decir, el 25% de los
datos son menores al primer cuartil y
tambin 25% de los datos son mayores
al tercer cuartil.
Ejemplo:
La tabla muestra la experiencia (en aos) del
personal que labora en el Hospital Central
Experiencia
Trabajadores
(aos)
0-3 18
4-7 42
A)Entre qu valores se
8 - 11 68 encuentra el 50%
12 - 15 120 intermedio de estos
16 - 19 40
20 - 23 34 datos?
24 - 27 12
Total 334
B)Cul es el rango
intercuartlico?
50 %
25 % 25 %
Q1 Q3
Rango
Intercuartlico
25(334)
Lugar Q1 P25 83.5o se ubica en la 3ra clase
100
25(334) 60 1
100 Q 8.82 aos
Q 7.5 4
1 68 1
75(334)
Lugar Q3 P75 250.5o se ubica en la 5ta clase
100
75(334) 248 1
100
Q 15 .5 4
3 40 Q 15 .65 aos
3
(X i x )
2
(X i )
2
para un poblacin
2 i 1
N
Ejemplo:
La siguiente informacin se refiere al nmero de
radiografas reprocesadas durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma
siguiente:
x Xi x Xi x 2
8 8 - 10 = 2 4 60
10 10 - 10 = 0 0 x
5 5 - 10 = 5 25 6
12 12 - 10 = 2 4
10 10 - 10 = 0 0
15 15 - 10 = 5 25 x 10
Xi x 58
2
(X i x )
2
S
2
n 1
58
S 6 1 11.6
2
La desviacin estndar
Llamada tambin desviacin tpica representa la
variabilidad (o desviaciones) promedio de los datos con
respecto a la media aritmtica. Es la raz cuadrada de la
varianza, sea poblacional o muestral.
a) Clculos a partir de datos no agrupados
Muestra poblacin
n
(X i x )
2 N
(Xi )
2
S
2
i 1 2 i 1
s n 1 N
Ejemplo:
La siguiente informacin se refiere al nmero de
cuestionarios reprocesados durante una semana.
Calcule la desviacin estndar.
8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 = 11,6
Entonces
S
2
s
S 11,6
S 3,4 cuestionarios
El coeficiente de variacin
Es una medida relativa de variabilidad de los
datos. Permite comparar la variabilidad de dos o
ms conjuntos de datos expresados en unidades
diferentes (peso: Kg. y libras).
40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46
Si Xi x 632.86
2
n
i
( X x )
2
632.86
S i 1
10.27
n 1 7 1
S
CV 100
x
10.27
CV 100 18.29
56.14
Laboratorio II n
Xi 847
x i 1 105.87
n 8
70 -35.87 1286.6569
35 -70.87 5022.5569
150 44.13 1947.4569
140 34.13 1164.8569
82 -23.87 569.7769
110 4.13 17.0569
140 34.13 1164.8569
120 14.13 199.6569
n
Si X i x
2
11372.88
i 1
n
(X i x )
2
11372,88
S i 1
40.30
n 1 8 1
S 40,30
CV 100 CV 100 30,06
x 105,87
El Laboratorio II presenta una mayor
variabilidad en el plan tarifario.
MEDIDAS DE ASIMETRIA O SESGO
Coeficiente de Asimetra
Es un indicador del grado de asimetra
que presenta una distribucin.
3( X Md )
S kp
S
Valores posibles
3 asimetra negativa
S kp
3 asimetra positiva
Si Skp tiende a 3 la distribucin es asimtrica hacia
la derecha o asimetra positiva.