Tema 10 Estimación de Parámetros Poblacionales (25!03!15)
Tema 10 Estimación de Parámetros Poblacionales (25!03!15)
Tema 10 Estimación de Parámetros Poblacionales (25!03!15)
25/03/15
Para ello antes de explicar cmo se construyen vamos a volver a ver el esquema general de
inferencia estadstica. En el observamos la poblacin objetivo que tiene unos parmetros
(mu, sigma, p...), sus variables de inters, su tamao y escogemos la muestra. Una muestra la
cual consta de varios individuos y cada uno de estos individuos tiene una variable y esa tiene la
misma distribucin que tenga X en la poblacin objetivo (como ya dijimos anteriormente).
Ahora calculamos los estadsticos la media muestral, la proporcin muestral, la desviacin
estndar y el resto de estadsticos que se pueden calcular. Tras esto vamos a hacer inferencia,
es decir, dar el salto de la muestra a la poblacin objetivo, para ello crearemos intervalos de
confianza.
Se trata de a partir de los resultados de la muestra construir un intervalo de confianza para el
parmetro con una confianza de que contenga el parmetro que yo quiero estimar.
Si yo calculo la media muestral la calcular para estimar que es la media de la poblacin
objetivo. Por lo tanto quiero hacer un intervalo de confianza basado en esta media muestral
que contenga al parmetro .
Por otro lado, si yo calculo la proporcin muestral es porque quiero acercarme al verdadero
valor de la proporcin en la poblacin objetivo, as que al igual que con la media muestral pero
en este caso con la proporcin muestral establecer un intervalo de confianza para que
contenga al verdadero valor p de la poblacin objetivo.
Conclusin: Un intervalo de confianza es aquel que se construye a partir de la media o
proporcin muestral, de manera que posea una probabilidad importante de contener el
verdadero valor que quiero estimar ( o p de la poblacin objetivo).
EJEMPLO
Imaginad que tengo un individuo determinado con una media mu desconocida para
estimarla se toman n medidas independientes sobre dicha presin arterial. Resultando
una media muestral de 121,5 mmHg. Sigma es conocida y se tratara de 10 mmHg.
Lo que se nos pide es estimar mu mediante un intervalo de confianza al 95%.
2
1. Si n es 100:
Tenemos una muestra de un nico individuo, pero ese individuo puede tener
distintos valores de presin arterial y yo quiero saber cul es la media de su
presin arterial, entonces cojo una serie de medidas independientes de dicha
presin arterial (nos dice que son independientes, ya que si no nosotros
supondramos la existencia de correlacin debido a que al individuo le
hacemos distintas medidas). Las medidas que hemos hecho sobre este
individuo se encuentran lo suficientemente separadas en el tiempo como para
que sean independientes. Vamos a tomar primero 100 medidas de presin
arterial de este individuo suficientemente separadas y lo que me va a dar de
media en esta muestra es 121,5. As que ahora yo tengo una poblacin
objetivo, en la cual existe un individuo que tiene una variable X que es la
presin arterial, la cual posee una media y una desviacin estndar que en
este caso conocemos, de hecho es de 10 mmHg. La distribucin (a veces) y la
media de la poblacin objetivo son desconocidas, por el contrario sabemos
que sigma tiene un valor de 10 mmHg. La poblacin es inabarcable as que
tomar una muestra de esta que sea representativa y con un tamao
muestral de n medidas o individuos (dependiendo de cmo sea la poblacin).
Entonces vamos a tener las distintas medidas, a partir de ellas calculamos la
media muestral (la media muestral hay que tener en cuenta que tomara
diferentes valores en cada posible muestra de n medidas). Nos interesa saber
cul es la distribucin de la media muestral:
a) Si X sigue una distribucin normal de media y de desviacin
estndar 10 mmHg entonces la media muestral sigue esta distribucin.
Es como esta pero ahora desviacin estndar de la media muestral
sera 10 partido de la raz cuadrada de n. La raz de 100 que es el
tamao de la muestra nos da un valor de 10. Por lo tanto 10/10=1, con
lo que desciframos que la desviacin estndar de la media muestral es
1.
b) Si X sigue una distribucin desconocida en la poblacin objetivo la
distribucin sera desconocida con la misma media y con la desviacin
estndar de 10. Si sigma es conocida (como en este caso) y n (el
tamao muestral) es grande podemos decir que la media muestral
sigue una distribucin aproximadamente normal de media y de
desviacin estndar sigma partido de la raz cuadrada de n.
Si ahora hacemos la estandarizacin y la asignacin del nivel de confianza del 95%
estaramos haciendo esto: Yo quera que mi estimacin X raya se separara del
verdadero valor menos de ms psilon y menos psilon, es decir, que estuviera entre
menos psilon y ms psilon. Lo que hago es dividir toda esa expresin entre el error
estndar de la media muestral, si hago esto esta variable es la variable normal
estndar y estoy diciendo que quiero que mi media se separe del verdadero valor mu
menos de psilon con una probabilidad del 0,95. Esto es a lo que se le llama hacer
inferencia mediante intervalos de confianza.
Los niveles de confianza que yo puedo fijar para un intervalo de confianza (que son bastante
estndares) son:
I.
II.
III.
Ejemplo: Si quiero saber cuntas personas han votado a partido poltico y quiero estar
seguro de que el valor se encuentre en mi intervalo lo que hare ser hacer un intervalo
del 99% lo que pasa es que ser muy amplio, puedo hacer uno del 90% que ser ms
estrecho si pero no me aseguro de que ese intervalo contenga el valor que yo deseo
saber. Siempre es un balance.
Luego esto es simplemente decirla a STATA que quiero un intervalo de dicho
porcentaje, pero conviene saber que estamos haciendo.
Si yo quiero controlar el error aleatorio (psilon):
En el caso de que coja un intervalo de confianza al 95% este valor es de 1,96 (como ya
hemos dicho), si sabemos ese dato, conocemos sigma (10 mmHg en este caso) y
conocemos el tamao muestral (100) entonces podemos calcular el error aleatorio
(despejando en la siguiente formula):
En el caso de las proporciones ocurre lo mismo, si queremos un nivel de confianza del 90%
habra que fijar los valores de 1,64-1,96-2,58 respectivamente (son los mismos valores que en
las medias).
Para construir el intervalo de confianza:
Para variables continuas se coge la media muestral y se le suma o resta el error aleatorio (el
cual debemos despejar, para ello multiplicamos al error estndar (sigma partido de la raz
cuadrada de n) por el nmero que corresponda al porcentaje del intervalo de confianza que
deseamos (Z), si se trata de una distribucin normal cogemos uno de estos puntos 1,96, lo
mencionado anteriormente). Para sacar el error estndar si sigma es conocido simplemente se
calcula sustituyendo los valores, en el caso de que sigma sea un valor desconocido tendr que
estimarla en la muestra y multiplicarlo por Z. Si tenemos menos de 30 individuos en la
muestra tendremos que coger esos valores de la t de student.
RESUMEN:
media (
ATENTOS A LAS DIAPOSITIVAS DEL POWER POINT DE ESTE TEMA, EL CUAL EN EGELA ES
NUMERADO COMO TEMA 9 PERO CONTIENE EL MISMO TTULO QUE ESTE ARCHIVO. DEBIDO
A QUE ALGUNAS NO LAS HA EXPLICADO EN CLASE.