Estadistica Guia 3
Estadistica Guia 3
Estadistica Guia 3
road
Gua Matemtica
Medidas de Tendencia Central
tutora: Jacky Moreno
.cl
open green
road
1.
En Chile existen numerosas instituciones que realizan investigaciones estadsticas sobre diferentes temas, tales como la salud p
ublica, la educacion, la cultura, la locomocion colectiva, entre otros.
En tu caso cuando en el colegio te entregan una nota 5,0 en una prueba, tiendes a preguntar c
omo les
fue a tus amigos para as saber que tan variadas fueron las notas del curso, esto te permite saber que tan
buena o mala fue tu nota 5,0 ya que la nota por si sola tiende a carecer de significado. En situaciones como
estas, de forma intuitiva, tiendes a realizar un estudio sobre las notas de tu curso de forma tal que puedas
decir frases como me fue s
uper bien en la prueba, estuve por sobre el promedio de mi curso, la prueba estuvo difcil, fui la nota m
as baja o soy del monton, la mayora de mis compa
neros obtuvo nota 5,0.
De acuerdo a lo planteado anteriormente, es que nos damos cuenta que no basta con recolectar,
organizar y presentar la informaci
on en una tabla estadstica o en un grafico, sino que debemos contar
con otros elementos de referencia que nos permitan analizar la informacion desde otra perspectiva. En
este caso acudiremos a las medidas de tendencia central para interpretar el comportamiento de los datos.
Las medidas de tendencia central son valores
numericos que expresan el grado de centralizacion de
los datos que representan.
Las medidas de tendencia central m
as utilizadas son:
1.1.
Media Aritm
etica (X)
La media aritmetica, tambien denominada promedio, es una medida de tendencia central que s
olo se
puede aplicar en variables cuantitativas.
La media se define como la suma de los valores de
todas las observaciones divididos por el n
umero total
de datos.
Algunas ideas sobre esta medida de tendencia central son:
No es necesario que los datos esten ordenados para calcular la media aritmetica.
Todos los datos son incluidos en el calculo de la media aritmetica.
Un conjunto de datos solo tiene una media aritmetica.
El valor numerico puede o no coincidir con algunos de los datos del conjunto.
Se utiliza generalmente para comparar dos o mas conjuntos de datos.
Es sensible a una distribuci
on muy asimetrica de los datos, es decir, pierde precision cuando hay
valores extremos, muy grandes o muy peque
nos, en comparacion con el general de la muestra.
Cuando se aplica en datos agrupados en intervalos, la medida pierde precision debido a que existe
una perdida de informaci
on al agrupar los datos en clases.
A continuaci
on mostraremos como calcular la media aritmetica en distintas situaciones de acuerdo a
como se nos presentan los datos:
open green
road
1. Con miras a las compras previas a las fiestas de fin de a
no, el Servicio Nacional del Consumidor
(SERNAC) decide realizar un sondeo para conocer el costo de una cena familiar. La muestra se
tomo entre el 11 y 13 de Diciembre del 2012 y los resultados que arrojo en cuanto al precio del
producto Duraznos mitades, grado 2, Dos Caballos en diferentes sectores de Santiago se muestran
a continuaci
on:
$849 $856 $889 $854 $907
En esta situaci
on se nos presentan los datos por extension, por lo tanto, basta con sumar cada dato
y dividirlo por el total de estos para obtener la media aritmetica.
849 + 856 + 889 + 854 + 907
5
X = 871
X=
En base al desarrollo anterior, podemos decir que el valor promedio del producto Duraznos mitades, grado 2, Dos Caballos es de $871.
De forma general, cuando se nos presentan los datos por extensi
on, el metodo para encontrar la
media aritmetica consiste en:
a) Sumar todos los datos (xi ).
b) Dividir el resultado de la suma en el total de datos (n).
De esta forma la media aritmetica es:
X=
x1 + x2 + x3 + . . . + xk
n
2. Una organizaci
on que promueve la vida saludable decide estudiar los kilogramos de fruta que compran 120 familias. Durante una semana se registraron los kilogramos de fruta que compraron cada
familia, obteniendose los siguientes datos tabulados:
Kilos
1
2
3
4
5
6
7
Familias
5
18
26
17
12
34
8
En esta situaci
on nos entregan los datos tabulados con su respectiva frecuencia, por lo tanto en vez
de sumar 5 veces el n
umero uno, acudiremos a la multiplicacion, de esta forma en vez de operar
1 + 1 + 1 + 1 + 1 reduciremos la expresion a 1 5. Al realizar lo mismo con todos los datos de la
tabla obtenemos la media aritmetica de la siguiente forma:
open green
road
1 5 + 2 18 + 3 26 + 4 17 + 5 12 + 6 34 + 7 8
5 + 18 + 26 + 17 + 12 + 34 + 8
507
X=
120
X = 4, 225
X=
A partir del resultado anterior podemos decir que las familias consumen 4, 225 kilogramos de fruta
en promedio a la semana.
De forma general, en una tabla de distribuci
on de frecuencia, el metodo para encontrar la
media aritmetica consiste en:
a) Multiplicar cada dato (xi ) por su frecuencia(fi ).
b) Sumar todos los resultados anteriores.
c) Dividir el resultado de la suma en el total de datos (n).
De esta forma la media aritmetica es:
X=
x1 f1 + x2 f2 + . . . + xk fk
n
3. Para que un estudiante pueda entrar a la Universidad de Chile a estudiar Ingeniera y Ciencias-Plan
Com
un, debe postular con un puntaje PSU que se obtiene de acuerdo al valor que tiene cada puntaje
para la carrera. A continuaci
on se muestran los puntajes obtenidos por un estudiante en el proceso
de admisi
on 2013:
Requisitos
Notas ense
nanza media
Ranking
Prueba Lenguaje
Prueba Matematica
Prueba Ciencias
Puntaje
723
770
655
746
708
Ponderaci
on [ %]
10
10
10
50
20
En este caso para obtener el puntaje con el cual el estudiante postula a la carrera universitaria se
debe calcular la media aritmetica ponderara ya que no todos los datos tienen igual valor.
X=
open green
road
En base a lo anterior, el estudiante postula con 729,4 puntos al Plan Com
un de Ingeniera y Ciencias
de la Universidad de Chile.
De forma general, en una tabla con datos ponderados, el metodo para encontrar la media
aritmetica consiste en:
a) Multiplicar la ponderaci
on (pi ) por su dato(xi ).
b) Sumar todos los resultados anteriores.
c) Dividir el resultado de la suma total de las ponderaciones (P ).
De esta forma la media aritmetica es:
X=
x1 p1 + x2 p2 + . . . + xk pk
P
4. En un hospital p
ublico se desea estudiar el tiempo de espera de los pacientes entre las 22:00 horas
y las 00:00 horas. Durante un da viernes se registraron los tiempos de espera de los pacientes,
obteniendose los siguientes datos tabulados:
Tiempo [min]
[0-30[
[30-60[
[60-90[
[90-120[
[120-150[
[150-180[
[180-210[
[210-240[
[240-270[
[270-300[
Pacientes
5
8
6
15
35
12
20
24
50
40
Marca de clase
15
45
75
105
135
165
195
225
255
285
En esta situaci
on no conocemos los datos recolectados por el hospital sino que solo conocemos los
intervalos en los que estos est
an agrupados, por lo tanto, para calcular la media aritmetica haremos
uso de la marca de clase1 debido a que este es un valor representativo de cada intervalo.
X=
(1)
1
Recordar que la marca de clase corresponde al promedio entre los lmites de la clase o intervalo.
open green
road
De acuerdo al c
alculo anterior, el tiempo de espera promedio por los pacientes del hospital p
ublico
fue de 198,21 minutos.
De forma general, en una tabla de frecuencia con datos agrupados en intervalos, el metodo
para encontrar la media aritmetica consiste en:
a) Multiplicar la marca de clase (mi ) de cada intervalo por su frecuencia(fi ).
b) Sumar todos los resultados anteriores.
c) Dividir el resultado de la suma en el total de datos (n).
De esta forma la media aritmetica es:
X=
m1 f1 + m2 f2 + + mk fk
n
- Ejercicios
1.2.
Mediana (Me )
La mediana es una medida de tendencia central que es aplicada solo en variables cuantitativas.
La mediana se define como el valor numerico que
divide a un conjunto de datos, ordenados de manera
creciente o decreciente, en dos partes iguales, es decir,
deja por debajo y por encima de s el 50 % de la
distribuci
on de datos.
open green
road
Algunas ideas sobre esta medida de tendencia central son:
Es necesario que los datos esten ordenados para calcular la mediana.
Un conjunto de datos s
olo tiene una mediana.
El valor numerico puede o no coincidir con algunos de los datos del conjunto.
Es estable a los valores extremos de un conjunto de datos.
A continuaci
on mostraremos como calcular la mediana en distintas situaciones de acuerdo a como se
nos presentan los datos:
1. El Servicio Nacional del Consumidor (SERNAC) decide realizar un sondeo para conocer el precio
del combustible lquido seg
un sector de la Region Metropolitana. El estudio se llevo a cabo el da
31 de Diciembre del 2012 y los resultados registrados sobre el precio promedio de la gasolina de 97
octanos se presentan a continuaci
on:
$780 $774 $792 $771 $776
En este caso el n
umero de datos es impar, por lo tanto, para calcular la mediana basta con ordenar
los datos de forma creciente o decreciente y determinar el valor central.
$771 $774 $776 $780 $792
De acuerdo al desarrollo anterior, la mediana del precio de la gasolina de 97 octanos es $776, valor
que corresponde al tercer lugar (X3 ) de la distribucion ordenada de datos.
De forma general, cuando se nos presenta un conjunto impar de datos discretos por extensi
on,
el metodo para encontrar la mediana consiste en:
a) Ordenar los datos de forma creciente o decreciente.
b) Localizar el valor que divide en dos partes iguales al total de datos (n).
De esta forma la mediana es el dato que ocupa el lugar:
Me = X (n+1)
2
2. El Servicio Nacional del Consumidor (SERNAC) realizo un sondeo sobre el precio del pan durante
el a
no 2012 en la Regi
on Metropolitana. Los registros tomados en el mes de Septiembre para 6 tipos
de panes se muestran a continuaci
on:
$962 $912 $1.239 $1.174 $1.342 $1.325
En esta situaci
on el n
umero de datos es par, por lo tanto, para calcular la mediana tendremos que
calcular el promedio entre los dos datos centrales que tengamos luego de ordenar nuestra informaci
on
de forma creciente o decreciente.
$912 $962 $1.174 $1.239 $1.325 $1.342
open green
road
1.174 + 1.239
2
2.413
Me =
2
Me = 1.206, 5
Me =
De acuerdo al desarrollo anterior, la mediana del precio del pan en la Region Metropolitana es de
$1.206, 5.
De forma general, cuando se nos presenta un conjunto par de datos discretos por extensi
on,
el metodo para encontrar la mediana consiste en:
a) Ordenar los datos de forma creciente o decreciente.
b) Localizar los dos valores centrales (Xn/2 y X(n/2)+1 ) de la distribucion total de datos (n).
c) Calcular el promedio entre los dos valores encontrados anteriormente.
De esta forma la mediana es:
Me =
Xn/2 +X(n/2)+1
2
3. El 15 de Diciembre se realiz
o la corrida Nike We run Santiago 10K 2012. El tiempo que se
demoraron en recorrer los primeros 5 kilometros 72 mujeres entre 16 a
nos y 19 a
nos se encuentra
registrado en la siguiente tabla:
Tiempo [min]
[20-25[
[25-30[
[30-35[
[35-40[
[40-45[
[45-50[
Mujeres
1
8
23
30
6
4
En una tabla de frecuencia con datos agrupados en intervalos, el metodo para encontrar la
mediana consiste en:
a) Determinar el valor numerico de la mitad de los datos (n/2)
b) Localizar el intervalo en el cu
al esta contenido ese valor.
c) Sustituir los siguientes valores:
-
n =N
umero de observaciones.
a =Amplitud del intervalo seleccionado.
Li =Lmite inferior del intervalo seleccionado.
fi =Frecuencia absoluta del intervalo seleccionado.
open green
road
- Fi =Frecuencia absoluta acumulada del intervalo anterior a la clase que contiene a la
mediana.
En la expresi
on:
n
Me = Li + a 2
Fi
fi
En esta situaci
on tenemos un total de 72 mujeres. Para saber en que intervalo esta nuestra mediana
dividimos el total de datos en 2:
72
= 36
2
De acuerdo a lo anterior, nuestra mediana corresponde al dato n
umero 36, que esta ubicado de la
clase [35 40[.
Luego de tener nuestro intervalo identificado, determinamos los valores numericos de los datos
necesarios para obtener la mediana:
- n = 72
- a = 40 35 = 5
- Li = 35
- fi = 30
- Fi = 1 + 8 + 23 = 32
Finalmente sustituimos en la expresion:
n
M e = Li + a 2
Fi
fi
72
32
2
Me = 35 + 5
30
Me = 35 + 5
Me = 35 +
4
30
2
3
107
3
Me 35, 67
Me =
La mediana de las mujeres que corrieron el evento We run Santiago 10K 2012 es de 35,67 minutos.
open green
road
1.3.
Moda (Mo )
La moda es una medida de tendencia central que es aplicada en variables cuantitativas y variables
cualitativas.
La moda se define como el dato que posee mayor
frecuencia absoluta, es decir, el valor que mas se repite.
Algunas ideas sobre esta medida de tendencia central son:
No es necesario que los datos esten ordenados para calcular la moda.
Un conjunto de datos puede tener mas de una moda o puede que este presente.
El valor numerico coincide con alg
un dato del conjunto.
A continuaci
on mostraremos como calcular la moda en distintas situaciones de acuerdo a como se nos
presentan los datos:
1. El Servicio Nacional del Consumidor (SERNAC) decide realizar el sondeo mensual de precios de
los medicamentos en farmacias del area metropolitana correspondiente a Noviembre del 2012. Los
precios del medicamento Clorfenamina Maleato, 4 mg de 20 Grageas, Laboratorio Chile registrados
en distintas farmacias se muestran a continuacion:
$190 $195 $290 $290 $350 $240
En este caso para encontrar la moda debemos determinar el valor que mas se repite dentro de los
datos.
$190 $195 $290 $290 $350 $240
En este caso la moda es $290 con una frecuencia de 2.
2. El 15 de Diciembre se realiz
o la corrida Nike We run Santiago 10K 2012. El tiempo que se
demoraron en realizar la corrida los 30 participantes hombres entre 60 a
nos y 64 a
nos se encuentran
registrados en la siguiente tabla:
Tiempo [min]
[40-50[
[50-60[
[60-70[
[70-80[
[80-90[
Hombres
2
10
13
4
1
Al presentarnos la informaci
on a traves de una tabla de frecuencia con datos agrupados en intervalos,
se acepta como v
alido que la moda corresponda a la marca de clase del intervalo que posea mayor
frecuencia absoluta.
10
open green
road
En esta situaci
on, el intervalo que tiene mayor frecuencia absoluta corresponde a [60, 70[ con 13
adultos que realizaron la carrera dentro de ese tiempo. De acuerdo a lo descrito arriba la moda
sera:
60 + 70
2
130
Mo =
2
Mo = 65
Mo =
En este caso la moda es de 65 minutos. Sin embargo, cuando se desea mayor precision se puede
trabajar de la siguiente forma:
a) Localizar el intervalo que posee mayor frecuencia absoluta.
b) Sustituir los siguientes valores:
- a =Amplitud del intervalo seleccionado.
- Li =Lmite inferior del intervalo seleccionado.
- fi =Frecuencia absoluta del intervalo seleccionado.
- fi+1 =Frecuencia absoluta de la clase siguiente al intervalo seleccionado.
- fi1 =Frecuencia absoluta de la clase anterior al intervalo seleccionado.
En la expresi
on:
fi fi1
Mo = L i + a
(fi fi1 ) + (fi fi+1 )
En esta situaci
on el intervalo con mayor frecuencia es [60 70[, por lo tanto, los datos seran:
-
a = 70 60 = 10
Li = 60
fi = 13
fi+1 = 4
fi1 = 10
Al sustituir en la expresi
on antes mencionada tenemos:
Mo
Mo
Mo
Mo
Mo
Mo
Mo
fi fi1
= Li + a
(fi fi1 ) + (fi fi+1 )
13 10
= 60 + 10
(13 10) + (13 4)
1
= 60 + 10
4
5
= 60 +
2
5
= 60 +
2
125
=
2
= 62, 5
11
open green
road
Por lo tanto, si queremos ser m
as precisos con el valor de la moda, esta sera de 62,5 minutos.
Desafo 1
Escribir dos muestra de datos con 12 elementos cada una. La primera debe cumplir
con que todas las medidas de tendencia central deben estar dentro de los valores de
la muestra y la segunda debe cumplir con que todas las medidas de tendencia central
no deben estar dentro de los valores de la muestra. Respuesta
- Ejercicios
1. El Instituto Nacional de Estadstica (INE) presento los resultaods del censo desde al a
no 2003 al
a
no 2010 sobre las actividades que realizaban los chilenos en su tiempo libre:
A
nos
2003
2004
2005
2006
2007
2008
2009
2010
Asistentes al cine
11.444.907
13.301.754
10.722.860
10.763.165
11.455.550
11.886.801
14.442.596
14.714.031
Espect
aculos musicales y danza
3.802.105
4.312.663
4.780.771
5.505.433
6.198.478
5.915.303
5.634.726
5.614.614
Espect
aculos deportivos
9.632.742
9.025.897
9.227.115
10.202.285
11.250.969
8.873.371
8.850.243
7.796.126
a) Calcular las tres medidas de tendencia central para cada serie de datos.
b) Que comparaciones puedes obtener a partir de los resultados?
12
open green
road
2. Una nutricionista decide estudiar el efecto que tienen dos tipos de dietas para bajar de peso durante
1 mes en sus pacientes. A continuacion se muestran los resultados de los kilogramos bajados por
dos grupos de pacientes sometidos unos a la dieta A y otros a la dieta B:
Dieta A
0,5
1,6
3,4
1,8
2,2
4,0
0,8
3,6
2,0
2,7
1,3
3,4
4,1
3,0
3,8
2,4
0,9
2,6
Dieta B
5,0
2,5
3,5
1,5
3,0
0,7
0,4
0,4
, 1,3
2,8
0,5
3,3
0,8
3,9
1,4
1,2
1,6
0,4
a) Calcular las tres medidas de tendencia central para cada serie de datos.
b) Ordenar la informaci
on en dos tabla de frecuencia con datos agrupados en clases o intervalos.
c) Calcular a partir de las tablas las medidas de tendencia central para cada serie de datos.
d ) Que conclusiones puedes obtener a partir de los resultados del punto a) y c)?
13
open green
road
Desafos resueltos
3 Desafo I:
1. Muestra I:
45,2
50,2
45,5
59
45,2
65,5
47,4
65,5
48,3
92,4
50,2
93,9
2
8
3
9
4
10
5
11
6
12
Bibliografa
n PSU Matema
tica, Quinta Edici
[1 ] Manual de preparacio
on,
Oscar Tapa Rojas, Miguel Ormaz
abal Daz-Mu
noz, David L
opez, Jorge Olivares Sep
ulveda.
tico, Introduccio
n a la Estadstica, No 17,
[2 ] Desarrollo del pensamiento matema
Junio 2007,
Martn Andonegui Zabala.
n a la Estadstica, Segunda Edici
[3 ] Introduccio
on, 2007,
Sheldom M.Ross.
14