Estadistica de Resumen de Datos

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 62

LA ESTADISTICA DE RESUMEN

Despus de construir tablas y grficos, a partir de una


coleccin de datos, se requieren medidas ms exactas.
La estadstica de resumen, proporciona medidas para
describir un conjunto de datos.
Existen tres tipos de medidas de resumen:
De tendencia central.
De dispersin.
De la forma de la distribucin.
(A) Las medidas de tendencia central
Se refieren al punto medio de una distribucin
Se conocen como medidas de posicin
Ejemplo: A partir del grfico siguiente, se observa que la
posicin central de la curva B est a la derecha de la
posicin central de las curvas A y C. Obsrvese que la
posicin central de la curva A es la misma que la curva C.
(B) Las medidas de dispersin
1.Se refieren a la extensin o amplitud de los datos de
una distribucin
2.Representan el grado de variabilidad de los datos.
Ejemplo: Observe que la curva A en el siguiente
grfico tiene una mayor dispersin que la curva B, a
pesar que la posicin central es la misma.
(C) Las medidas de la forma de la curva
Las curvas que representan a un conjunto de datos,
pueden ser analizadas de acuerdo a su:
a) Simetra b) Kurtsis

Las curvas simtricas, tienen una forma tal que con una
lnea vertical que pase por el punto ms alto de la curva,
dividir el rea de esta en dos partes iguales.
Las curvas sesgadas son aquellas cuyos valores estn
concentrados en el extremo inferior o superior de la
escala de medicin del eje horizontal. La cola indica el
tipo de sesgo.
Cuando medimos la kurtsis nos referimos al grado de
agudeza. Pueden ser: leptocrtica (concentracin al
centro) mesocrtica distribuidos simtricamente) o
platicrtica (aplanada).
Las medidas de tendencia central
1. En general se denominan promedios.
2. Los ms importantes son la media, la mediana y la moda.
Aritmtica
Media Geomtrica
Medidas de Mediana Armnica
tendencia central Moda

3. Tambin es til conocer los percentiles (o fractiles).


POR QU SON IMPORTANTES LAS MEDIDAS
DE TENDENCIA CENTRAL?
Porque la mayor parte de los conjuntos de datos
muestran una tendencia a agruparse alrededor de
un dato central.
Las medidas de tendencia central son puntos en
una distribucin, los valores medios o centrales de
sta nos ayudan a ubicarla dentro de la escala de
medicin.
LA MEDIA ARITMETICA
La media aritmtica se obtiene sumando los valores
registrados y dividindolos entre el numero total de
datos:
Ejemplo: La siguiente tabla muestra el numero de
reclamos presentados por los estudiantes en el servicio
de comedor universitario a lo largo de una semana.
Calcule e interprete la media.
Da/Semana Lun Mar Mier Jue Vier Sab
Reclamos/da 8 10 5 12 10 15
8 10 5 12 10 15 60
Media aritmtica =
6 6

= 10 reclamos
b) Interpretacin: Si elige al azar un da de la
semana, se espera que los alumnos del servicio de
Bienestar realicen 10 reclamos en ese da.
c) Simbologa:

Tamao Media aritmtica


Muestra n x (equis barra)
d) Clculos a partir de datos no agrupados, se
utiliza la siguiente formula:
n
Xi
x i 1
n
donde: x : media muestral
n
Xi
i 1 : suma de todos los datos

n : nmero de datos (muestra


e) Clculo a partir de datos agrupados.
El calculo de la media aritmtica, cuando los
datos se encuentran en tablas de distribucin
de frecuencias, se realiza usando la formula
siguiente:

=1
= , donde:

=1

: Media aritmtica
=1 : Sumatoria del producto de la marca
de clase por las frecuencias de cada
intervalo
=1 =n : El tamao de la muestra.
Ejemplo:
La distribucin de frecuencias siguiente, representa los
puntajes obtenidos en una evaluacin del desempeo,
aplicado al personal tcnico de un Municipio local. El
puntaje mximo en la prueba es 50. Calcule e interprete la
media.
Desempeo Nmero de
(puntos) tcnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Primero se calcularn las marcas de clase ( );
es decir, el valor intermedio de cada clase

INTERVALOS MARCA DE CLASE Frecuencias


absolutas
12;16 14 4
17; 21 19 8
22; 26 24 15
27; 31 29 23
32; 36 34 10
TOTAL 60
1575
=
60
=26,25

Interpretacin: Si se elige al azar a un trabajador
tcnico de al Municipalidad local, se espera que
tenga un puntaje de 26,25 en su evaluacin de
desempeo.
f) La media aritmtica ponderada ( )
donde:

=1
=
=1

Donde:

:Factor de ponderacin
:Datos
Ejemplo: Una empresa comercializadora de Seguros
Mdicos dispone de 3 representantes para la zona de
Amarilis, cada uno de los cuales cobra diferente comisin
por pliza vendida, y realiza diferente nmero de contratos.
Calcule e interprete el valor medio de la comisin

VENDEDOR NUMERO DE POLIZAS DE COMISION POR


SEGURO MEDICO VENTA $ Xi
PEDRO 30 30
JUAN 25 40
PABBLO 20 50
30(30) 25(40) 20(50) 2900
xp $38.67
30 25 20 75

Interpretacin:

Si se elige al azar un representante se


espera que cobre una comisin de
$38.67 por pliza vendida.
g)Ventajas y desventajas de la media aritmtica

Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no estn
agrupados, su clculo es tedioso
Si los datos estn agrupados en clases con
extremos abiertos, no es posible calcular la
media.
(B) La media geomtrica ( x )
g
Se utiliza para calcular tasas medias de variacin, como la
tasa media de crecimiento poblacional, la tasa media de
inflacin mensual, la tasa media de mortalidad, entre
otros.

a) Obtencin Se obtiene extrayendo la raz ensima


del producto de los n valores de una serie.

xg n X1 X2 X3 .........Xn
Ejemplo:
La siguiente tabla muestra la tasa de aumento en las quejas
durante los ltimos meses. Calcule e interprete la tasa
media mensual.

MESES ENERO FEBRERO MARZO ABRIL MAYO

AUMENTO 2,6% 5,4% 3,8% 0,5% 1,4%


DE QUEJAS

La tasa 2,6% tambin se puede expresar como


0,026 , y puesto que se refiere a un aumento a
partir de una base de 100%, el factor de
variacin ser 1,026. Para los otros datos se
opera igual.
b) Clculos
Por lo tanto, la media geomtrica se calcula:

xg n x1, x 2, x3,......x
x g 5 (1.026) (1.054) (1.038) (1.005)(1.014)

x g 5 1.143903377
xg 1,0272540 ( Factorde crecim iento m edio)
TASA MEDIA DE VARIACION=( -1)X100
T. MEDIA DE VARIACION=(1,0272540-1)X100
=2,72%
c) Interpretacin

Si se selecciona al azar un mes entre enero y


mayo, se espera que las ventas se hayan
incrementado 2.72% con respecto al mes
anterior.
LA MEDIANA

Es la medida que divide una distribucin en dos


subconjuntos iguales, de tal manera que 50% de los datos
es menor a la mediana y el otro 50% es mayor a la mediana.

Se obtiene ordenando la serie de datos (en forma


ascendente o descendente) y ubicando el dato central.
Ejemplo:
Los siguientes datos se refieren al nmero de clientes que
llegaron al banco despus de la hora programada durante
los ltimos 11 das en el Servicio de Plataforma. Calcule e
interprete la mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16
Primero se ordenan lo datos:
5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
5 datos menores 5 datos mayores

mediana
Interpretacin: Durante 5 das llegaron menos de 11
clientes tarde a plataforma y durante 5 das, ms de 11
clientes llegaron tarde.
Reglas

1 Si la serie es impar, la mediana ocupa el lugar central


de la serie previamente ordenada.

Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24

2 Si la serie es par, la mediana se obtiene de


la semisuma de los dos valores centrales
de la serie previamente ordenada.
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34

18 23
mediana 20.5
2

3 Sea la serie par o impar, la mediana ocupa el lugar de


la serie n 1 , de la serie previamente ordenada.
2
CALCULO A PARTIR DE DATOS AGRUPADOS

1
2
Me=LRi + A( ) donde:

Me : Mediana
LRi :Limite real inferior
n : Numero total de datos
1 :Frecuencia absoluta acumulada anterior a
la clase mediana.
: Frecuencia absoluta simple de la clase
mediana.
A: Amplitud.
Ejemplo: La tabla siguiente muestra la
experiencia laboral (aos) del personal de
seguridad que labora en la UNHEVAL. Calcule e
interprete la mediana.
EXPERIENCIA LABORAL NUMERO DE TRABAJADORES DE
EN AOS SEGURIDAD

0;3 04 4
4; 7 12 16
8; 11 24 40
12; 15 16 56
16; 19 10 66
21; 24 03 69
69
e) Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la mediana como en el caso de la
media aritmtica.
Es fcil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos, registrados bajo una
escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero la serie de datos.
Para una serie amplia de datos no agrupados, el proceso de
ordenamiento de los datos demanda tiempo y usualmente provoca
equivocaciones.
LA MODA
La moda es el valor que ms se repite dentro de un
conjunto de datos.
se obtiene organizando la serie de datos y seleccionando el
o los datos que ms se repiten.
Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38


b) Clculo a partir de datos agrupados:
1
Mo=LRi + A( ) donde:
1+ 2

Mo : Moda
1 : Diferencia entre la clase modal y la pre-modal
2 : Diferencia entre la clase modal y post-modal
LRi: Limite real inferior de la clase modal.
A : Amplitud
e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o ms
clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribucin amodal).
En otros casos la distribucin tiene varias modas, lo que
dificulta su interpretacin.
MEDIDAS DE DISPERSION
1. MEDIDAS DE DISPERSIN
1.1 Rango
1.2 Rango intercuartlico
1.3 Varianza
1.4 Desviacin estndar
1.5 Coeficiente de variabilidad
2. MEDIDAS DE LA FORMA DE LA DISTRIBUCIN
2.1 Asimetra
2.2 Curtosis
Las medidas de dispersin llamadas tambin
medidas de variabilidad
Son tiles porque:
1. Permiten juzgar la confiabilidad de la medida
de tendencia central.
2. Los datos demasiados dispersos tienen un
comportamiento especial.
3. Es posible comparar dispersin de diversas
muestras.
El rango llamado tambin recorrido, amplitud
total o alcance.

a) Obtencin: se obtiene de la diferencia entre


el dato mayor y el dato menor de un conjunto
de datos ms una unidad significativa, a fin
de incluir ambos valores extremos.
Ejemplo:

Los siguientes datos representan el peso de 10


nios al nacer, (en Kg.). Calcule e interprete el
rango.
2,860 3,150 3,450 2,950 3,780
4,170 3,920 3,280 4,050 3,120

Rango = (4,170 - 2,860) + 0.001


Rango = 1,311 Kg.
b) Interpretacin
La diferencia entre el bebe de mayor peso y el
bebe menor peso es 1,311 Kg.

c) Clculo a partir de datos agrupados, se utiliza


la siguiente frmula:
R= (Ls - Li ) + 1
donde: : Limite superior de la
ltima clase
: Limite inferior de la
primera clase
b) Interpretacin
La diferencia entre el bebe de mayor peso y el bebe
menor peso es 1,311 Kg.
Tiempo N de Pacientes
(minutos) (por da)
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
Total 60

c) Clculo a partir de datos agrupados, se utiliza la


siguiente frmula:
R= (Ls - Li ) + 1
f) Ventajas y desventajas del rango
Ventajas
fcil de calcular
fcil de entender e interpretar

Desventajas
slo considera los valores extremos
no toma en cuenta ni el nmero de datos ni el
valor de estos
no es posible calcular en tablas con extremos
abiertos.
EL RANGO INTERCUARTILICO
Permite ubicar el 50% de los datos
que se encuentran en el centro de la
distribucin, es decir, el 25% de los
datos son menores al primer cuartil y
tambin 25% de los datos son mayores
al tercer cuartil.
Ejemplo:
La tabla muestra la experiencia (en aos) del
personal que labora en el Hospital Central

Experiencia
Trabajadores
(aos)
0-3 18
4-7 42
A)Entre qu valores se
8 - 11 68 encuentra el 50%
12 - 15 120 intermedio de estos
16 - 19 40
20 - 23 34 datos?
24 - 27 12
Total 334
B)Cul es el rango
intercuartlico?
50 %
25 % 25 %

Q1 Q3

Rango
Intercuartlico
25(334)
Lugar Q1 P25 83.5o se ubica en la 3ra clase
100

25(334) 60 1
100 Q 8.82 aos
Q 7.5 4
1 68 1

75(334)
Lugar Q3 P75 250.5o se ubica en la 5ta clase
100

75(334) 248 1
100
Q 15 .5 4
3 40 Q 15 .65 aos
3

A. El 50% de los trabajadores con


experiencia intermedia se encuentran
entre 8,82 y 15,65 aos.

B. El rango intercuartlico es 6 aos 08


meses aproximadamente
LA VARIANZA
Es una medida de desviacin promedio con
respecto a la media aritmtica

a) Clculos a partir de datos no agrupados.


n

(X i x )
2

para una muestra



2 i 1
S n 1

(X i )
2

para un poblacin

2 i 1

N
Ejemplo:
La siguiente informacin se refiere al nmero de
radiografas reprocesadas durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma
siguiente:
x Xi x Xi x 2

8 8 - 10 = 2 4 60
10 10 - 10 = 0 0 x
5 5 - 10 = 5 25 6
12 12 - 10 = 2 4
10 10 - 10 = 0 0
15 15 - 10 = 5 25 x 10
Xi x 58
2

(X i x )
2

S
2

n 1

58
S 6 1 11.6
2
La desviacin estndar
Llamada tambin desviacin tpica representa la
variabilidad (o desviaciones) promedio de los datos con
respecto a la media aritmtica. Es la raz cuadrada de la
varianza, sea poblacional o muestral.
a) Clculos a partir de datos no agrupados

Muestra poblacin
n

(X i x )
2 N
(Xi )
2

S
2
i 1 2 i 1
s n 1 N
Ejemplo:
La siguiente informacin se refiere al nmero de
cuestionarios reprocesados durante una semana.
Calcule la desviacin estndar.
8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 = 11,6
Entonces
S
2
s
S 11,6

S 3,4 cuestionarios
El coeficiente de variacin
Es una medida relativa de variabilidad de los
datos. Permite comparar la variabilidad de dos o
ms conjuntos de datos expresados en unidades
diferentes (peso: Kg. y libras).

a)Clculos a partir de datos no agrupados


Muestra Poblacin
s
CV 100 CV 100
x
Ejemplo:
A continuacin se presentan las tarifas (en
unidades monetarias) de dos laboratorios de
anlisis clnicos. El laboratorio I tiene sus tarifas
en soles y el laboratorio II en dlares Cul de
ellos tiene un plan tarifario ms homogneo o
estable?.
Laboratorio I (soles) Laboratorio II (dlares)
40,70,60,48,52,65,58
70,35,150,140,82,110,140,120

Calculamos la media y desviacin estndar por


cada una de los laboratorios
Laboratorio I n
Xi 393
x i 1
56.14
n 7
x Xi x Xi x
2

40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46
Si Xi x 632.86
2

n
i
( X x )
2
632.86
S i 1
10.27
n 1 7 1

S
CV 100
x
10.27
CV 100 18.29
56.14
Laboratorio II n

Xi 847
x i 1 105.87
n 8

70 -35.87 1286.6569
35 -70.87 5022.5569
150 44.13 1947.4569
140 34.13 1164.8569
82 -23.87 569.7769
110 4.13 17.0569
140 34.13 1164.8569
120 14.13 199.6569
n

Si X i x
2
11372.88
i 1

n
(X i x )
2
11372,88
S i 1
40.30
n 1 8 1

S 40,30
CV 100 CV 100 30,06
x 105,87
El Laboratorio II presenta una mayor
variabilidad en el plan tarifario.
MEDIDAS DE ASIMETRIA O SESGO
Coeficiente de Asimetra
Es un indicador del grado de asimetra
que presenta una distribucin.
3( X Md )
S kp
S

Valores posibles

3 asimetra negativa
S kp
3 asimetra positiva
Si Skp tiende a 3 la distribucin es asimtrica hacia
la derecha o asimetra positiva.

Si Skp tiende a -3 la distribucin es asimtrica a la


izquierda o asimetra negativa.

En distribuciones simtricas, no existe sesgo, es


decir Skp = 0.

En la prctica, el coeficiente de Asimetra de


Pearson vara entre -1 y +1
Coeficiente de Curtsis
Es una medida del grado de apuntamiento,
generalmente comparada con el apuntalamiento
de la distribucin normal.

0,5( P0, 75 P0, 25 )


K
P0,9 P0,1
Valores posibles
a) Leptocrtica (concentracin al centro): Si el grado
de apuntalamiento de una distribucin es mayor
que el de la distribucin normal. K 0,5
b) Mesocrtica (distribuidos simtricamente): Si el
grado de apuntalamiento de una distribucin es
igual que el de la distribucin normal. K 0,25
c) Platicrtica (aplanada).Si el grado de
apuntalamiento de una distribucin es menor que el
de la distribucin normal. 0 K<25

Leptocrtica Mesocurtica Platicurtica


0,50 0,25 0,0
Ejemplo:
La tabla muestra la edad (en aos) de 70 pacientes
atendidos en el servicio de emergencia de un hospital
local. 4 67 18 15 11 3 24
3 85 15 15 14 5 26
5 6 16 15 13 7 21
6 7 17 16 10 8 22
7 7 15 17 6 12 17
25 10 13 17 4 15 16
13 12 13 13 8 17 9
2 15 14 14 14 18 9
4 16 20 16 18 20 15
5 17 14 17 20 21 12
A) Calcular e interpretar la asimetra de la
distribucin
B) Calcular e interpretar la curtosis de la
distribucin
Los resultados han sido obtenidos usando
Microsoft Excel
3(14,27 13,50)
Media aritmetica 14.27 S kp 0,202
11,42
Desviacion estandar 11.42
Mediana 13.50
0,5(17,00 7,00)
Cuartil 1 7.00 K 0,263
Cuartil 3 17.00 23,00 4,00
Percentil 90 23.00
Percentil10 4.00

También podría gustarte