Tema 12 Estimación de Parametros
Tema 12 Estimación de Parametros
Tema 12 Estimación de Parametros
ESTIMACIN DE PARAMETROS
Por ejemplo, supongamos que los puntajes de ingreso de este ao a la Escuela de Ing. de
Sistemas siguen una distribucin normal con media desconocida y con varianza 2 conocida.
Deseamos estimar la media . Para ello, utilizamos como estimador la media muestral. Si elegimos
una muestra aleatoria de 30 ingresantes y observamos sus puntajes, el valor observado de la media
muestral ser una estimacin puntual de . Si se prefiere acompaar la estimacin puntual con
alguna medida de la dispersin de la misma, se estar haciendo una estimacin por intervalo. En este
ejemplo, un intervalo de confianza para se consigue sumando y restando al estimador puntual X el
producto del error de la media por un cierto factor, que en muchos casos es 1.96.
Los mejores estimadores puntuales para la media poblacional, la varianza poblacional y la
proporcin poblacional son, respectivamente, la media muestral, la varianza muestral y la proporcin
muestral, porque gozan de ciertas propiedades.
ESTIMADOR INSESGADO
Se dice que es un estimador insesgado del parmetro si E( ) =
Significado :
Si calculamos el valor de para cada muestra y repetimos el experimento un gran nmero de veces,
el promedio de todas estas estimaciones ser igual a . Por tanto, los estimadores insesgados
proporcionan resultados perfectos en promedio.
parmetros , 2 y .
ESTIMADOR CONSISTENTE
Se dice que es un estimador consistente del parmetro si
lim E()
i)
n
lim Var () 0
ii)
n
Significado :
Si al incrementar el tamao de la muestra se produce a la vez un menor sesgo y la varianza tiende a cero,
entonces se tendr un estimador consistente.
, 2 y .
ESTIMADOR EFICIENTE
Sean 1 y 2 dos estimadores insesgados del mismo parmetro . Se dice que el estimador 1 es ms
eficiente que 2 si y solo si
Var ( 1 ) < Var ( 2 )
Se llama error estndar del estimador a la desviacin estndar del estimador. Una manera de
medir la precisin de un estimador es utilizando su error estndar. El error estndar es inversamente
proporcional a la precisin del estimador; a menor error estndar, mayor ser la precisin del estimador.
EJEMPLO:
El error estndar de la media muestral basada en una muestra de tamao n es .
n
El error estndar de la proporcin muestral es p(1 p) / n .
Estas frmulas son vlidas cuando las muestras se toman de poblaciones infinitas o cuando se toman con
reemplazo de poblaciones finitas.
Es una forma de hacer inferencia, que consiste en dar una conjunto de valores dentro de los
cuales estar el verdadero valor del parmetro, con una probabilidad prefijada igual a (1- ), conocida
como nivel de confianza.
Generalmente, un intervalo de confianza se obtiene sumando y restando al estimador puntual del
parmetro, el producto del error estndar del estimador por un cierto factor.
Para obtener el intervalo de confianza para un parmetro, se toma en cuenta la distribucin
muestral del estimador correspondiente al parmetro.
P( q1 Q q 2 ) 1
donde ( 1 ) generalmente toma los valores 0.90, 0.95, 0.99 y q1 y q2 son los cuantiles de la distribucin
muestral del estimador.
40 Despejar de la proposicin anterior hasta obtener
y entonces el intervalo [q1(X), q2 (X)] ser el intervalo que cubre a con un nivel de confianza igual a
1 .
Sea por ejemplo 1 = 0.95. Significa que, si en un muestreo repetido se calculara con cada muestra
un intervalo de confianza para , entonces en el 95% de las muestras los intervalos construidos
incluiran a .
A continuacin, se muestra un procedimiento para construir intervalos de confianza para algunos
parmetros de inters.
Ejemplo 1:
Una mquina de empaquetar bolsas de caf est regulada para embalar bolsas cuyos pesos se distribuyen
normalmente con media 500 gr. y desviacin estndar 10 gr. Supongamos que la mquina est
desregulada y deseamos conocer el nuevo promedio . Una muestra aleatoria de 25 bolsas arroja una
media igual a 485 gr. Hallar un intervalo de confianza de 95% para .
Solucin:
Datos: n = 25, X = 485, = 10, 1 = 0.95, z /2 = 1.96. Como se conoce la varianza poblacional, se
usar el intervalo del caso 1. Reemplazando los datos se obtiene el siguiente I.C. para con un nivel
de confianza de 95%:
[481.08 , 488.92]
x
s n
la cual tiene distribucin t con n-1 grados de libertad.
Usando esta distribucin, procedemos como en el caso anterior, planteando una proposicin
probabilstica y despejando .
Luego, el intervalo para estimar a un nivel de confianza de 1 es
s s
[X - t , X t ]
n n
Ejemplo 2:
Una mquina produce varillas de metal utilizadas en el sistema de suspensin de un automvil. Se toma
una muestra aleatoria de 15 varillas y se mide su dimetro. Los datos obtenidos son: 8.24 8.21
8.23 8.25 8.26 8.23 8.20 8.26 8.19 8.23 8.20 8. 28 8.25 8.24 8.24
Suponiendo que los dimetros de las varillas siguen una ley normal, construir un intervalo de confianza
del 95% para el dimetro promedio por varilla.
Solucin:
Con los datos se obtiene: n=15, X = 8.234 y S 2 = (0.0244)2. Siendo la varianza poblacional
desconocida, usaremos la distribucin t para construir el I.C. Para 1 = 0.95 y por la simetra de la
distribucin t, el cuantil que deja a su izquierda un rea igual a 0.975 es t / 2 = 2.145. Reemplazando los
datos en el ltimo intervalo se obtiene el siguiente intervalo que cubre a con una confianza igual a
95%: [8.22 , 8.247].
Ejemplo 3:
Se desea conocer la permanencia media de pacientes en cierto hospital, con el fin de poner en prctica
un proyecto de ampliacin del local. Con datos referentes a das de permanencia, de una muestra de 600
pacientes se obtuvieron los siguientes resultados: X = 12.3 das y S = 8 das.
Hallar un intervalo de confianza del 95% para la permanencia media.
Solucin:
Como no se conoce la varianza poblacional, deberamos usar la distribucin t para obtener el I.C. Pero,
siendo la muestra n=600 grande, por el TCL se sabe que X tiene distribucin normal con media y
varianza desconocidas. La varianza se estima con la varianza muestral. Luego, usaremos el intervalo del
caso 1. Por la simetra de la curva normal, para 1 = 0.95 se tiene z /2 =1.96
Reemplazando datos se obtiene que, el tiempo promedio de permanencia de los pacientes en el hospital
vara en el intervalo (11.66, 12.94), expresado en das, con una seguridad de 95%.
Observaciones:
1. La longitud del intervalo de confianza para es L = 2 z / 2 .
n
Como el tamao de la muestra aparece en el denominador, entonces, muestras grandes darn intervalos
de confianza de longitud ms cortos, por lo tanto ms precisos. Si se conociera la longitud del intervalo,
entonces el tamao de la muestra ser igual a
2z
2
n /2
L
Por ejemplo, suponga que el nmero de onzas de cerveza que una mquina vierte en una botella es una
variable aleatoria distribuida normalmente con media desconocida y desviacin estndar conocida
igual a 0.5 onzas. De qu tamao debe ser n para que la longitud del intervalo de 90% de confianza sea
de media onza?
Reemplazando los datos en la relacin anterior se tiene:
2
2 x1645
. x 0.5
n = 11
0.5
Si la longitud del intervalo fuese un cuarto de onza, entonces sera n = 44.
n /2
E
As por ejemplo, si en el problema 1 el mximo error permitido se reduce a la mitad, cul ser el
tamao de muestra requerido?
Siendo z / 2 = (1.96 x 10)/5 = 3.92, la mitad del error es 1.96. Reemplazando este valor en la frmula
n
de n se obtiene n 100.
N n N n
X z / 2 , X - z /2
n N 1 n N 1
s N n s N n
X t / 2 , X - t /2
n N 1 n N 1
s N n s N n
X z / 2 , X - z /2
n N 1 n N 1
Ejercicio 1:
Un fabricante de fibras sintticas desea estimar la tensin de ruptura media de una fibra. Disea un
experimento en el que se observan las tensiones de ruptura, en libras, de 16 hilos del proceso
seleccionados aleatoriamente. Las tensiones son: 20.8 20.6 21.0 20.9 19.9 20.2 19.8 19.6 20.9 21.1
20.4 20.6 19.7 19.6 20.3 20.7. Supngase que la tensin de ruptura de una fibra se encuentra
modelada por una distribucin normal, con =0.45 libras
Construir un intervalo de confianza estimado del 98% para el valor real de la tensin de ruptura
promedio de la fibra.
Construir otro intervalo de confianza suponiendo que no se conoce . Compare los dos intervalos.
Ejercicio 2:
Tres estudiantes desean construir intervalos de confianza para la media de una poblacin normal con
varianza conocida igual a 9 y con coeficiente de confianza de 90%. Cada uno de ellos dispone de la
informacin siguiente:
ESTUDIANTE TAMAO DE MUESTRA VALOR OBSERVADO
a 1 8
b 3 6 5 4
c 6 10 0 4 2 9 5
a) Qu intervalo construira cada estudiante?. Compare la precisin de los intervalos y haga algn
comentario.
b) Qu tamao de muestra se necesitara si deseamos un intervalo de 90% de confianza y una precisin
de 0.4?
Siguiendo el mtodo anterior, despus de obtener una muestra aleatoria de tamao n de la poblacin
normal con varianza desconocida, se usa como funcin pivote la variable aleatoria
(n-1) S 2 / 2
(n 1) S 2
P( 2 / 2 12 / 2 ) 1
2
y despejando 2 dentro del parntesis se obtiene el siguiente intervalo estimador que cubre a 2 , con
un nivel de confianza igual a ( 1 )100%:
(n 1) S 2 (n-1)S 2
2 ,
1 / 2 2 /2
Ejemplo:
Se realizaron 15 mediciones del largo de una barra. Los resultados fueron: 42.7, 43.48, 43.63, 42.78,
43.18, 42.756, 42.76, 42.87, 42.95, 43.39, 43.01, 43.06, 41.60, 43.20, 43.10.
Suponiendo que la variable aleatoria X que representa a las mediciones es normal, hallar el intervalo de
estimacin para las varianzas de las medidas, al nivel de confianza del 95%.
Solucin:
El tamao de la muestra es 15. Los valores de la media y varianza muestrales son, respectivamente, X =
42.95 y S 2 = 0.2284. Para el nivel 1 = 0.95, los cuantiles correspondientes de la distribucin chi
cuadrado con 14 grados de libertad son 20.025 =5.63 y 20.975 = 26.1
Reemplazando todos estos valores en el intervalo para la varianza se tiene que:
[0.1224 , 0.5679] cubren a 2 con una confianza de 95%.
Se sabe que, cuando se extrae una muestra grande de una poblacin de Bernoulli con parmetro , la
proporcin muestral, que tiene las mismas caractersticas de la media muestral, tiene una distribucin
muestral que se comporta como una distribucin normal.
Utilizando este modelo se construye el intervalo de confianza para siguiendo el mtodo antes descrito.
p
En este caso, la funcin pivote que se usa es la variable aleatoria Z =
(1 )
n
la cual tiene distribucin normal estndar .
El valor de que aparece en el error estndar se estima con la proporcin muestral.
Luego, el intervalo que cubre a con una confianza de 1 es
p(1 p) p (1 p)
[ p z / 2 , p z //2 ]
n n
Ejemplo:
Con motivo de las elecciones presidenciales, en una encuesta de opinin pblica, de un total de 400
persona entrevistadas, 320 mostraron su preferencia por determinado candidato.
a) Construir un intervalo de confianza del 95% para estimar la proporcin del total de personas que estn
a favor de dicho candidato.
b) Con un nivel de confianza de 99%, cambia el error de estimacin de a)?
Solucin:
a) La proporcin muestral es igual a p = 320/400 = 0.80. Para 1 = 0.95 el valor de z /2 es 1.96.
Luego, reemplazando estos valores en el intervalo antes formulado se obtiene el siguiente intervalo que
cubre a con una confianza de 95%:
0.8 0.0392
Ntese que el valor 0.0392 es el mximo error de estimacin. Entonces decimos que, el 80% del
electorado estar a favor del candidato, con un error de estimacin de 3.92% y con una confianza de
95%.
b) Si fuese 1 = 0.99, entonces el mximo error permitido sera
z /2 p = 2.58 x 0.02 = 0.0516. Vemos que el error de estimacin se vuelve ms grande y por tanto el
intervalo es menos preciso.
Del mismo modo, siguiendo el mtodo antes descrito, se puede construir intervalos de confianza para los
parmetros que son combinaciones de los parmetros ya vistos, como son la diferencia de medias y la
razn de varianzas en poblaciones normales y la diferencia de proporciones en poblaciones de Bernoulli.
En todos estos casos se deber tomar en cuenta la distribucin muestral del estimador correspondiente
al parmetro en cuestin. El intervalo que se obtenga en cada caso ser el resultado de seguir el mtodo
de la cantidad pivotal, con un nivel de confianza de ( 1 )100% .
p1 1 p1 p 2 1 p 2
p1 p 2 Z1/2
n1 n2
Analizando los signos de los lmites de este intervalo podemos concluir que:
Si el intervalo es (- , +), entonces 1 = 2.
Si el intervalo es (- , -), entonces 1 < 2.
Si el intervalo es (+, +), entonces 1 > 2.
S12 S12
Fn 2 1,n1 1;/2 2 ; Fn 2 1,n1 1;1/2 2
S2 S2
Interpretacin:
Si el intervalo anterior contiene al uno, entonces se puede considerar que las varianzas son
iguales, con el nivel de confianza dado.
En cambio, si el intervalo no contiene al uno, se puede considerar que las varianzas son
diferentes.
12 22
X1 X 2 z1/2
n1 n2
1 1
X1 X2 t n n 2 2;1 /2
S2p
1
n n 2
1
S12 S22
X1 X 2 t V;1/2
n1 n 2
Interpretacin:
Para los tres casos de estimacin de la diferencia de medias, la interpretacin se hace a partir de
los signos de los lmites del intervalo:
Si el intervalo es (- , -), entonces 1< 2.
Si el intervalo es (- , +), entonces 1= 2.
Si el intervalo es (+ , +), entonces 1> 2.