Tema 10 Estimación de Parámetros Poblacionales (25!03!15)

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

Grupo 38: Natalia Montero, Amaia Longo y Yanire Rojo.

25/03/15

TEMA 10 ESTIMACIN DE PARMETROS POBLACIONALES


Tras haber visto lo que es el error aleatorio (en el tema anterior) vamos a ver como se
construye un intervalo de confianza.

Para ello antes de explicar cmo se construyen vamos a volver a ver el esquema general de
inferencia estadstica. En el observamos la poblacin objetivo que tiene unos parmetros
(mu, sigma, p...), sus variables de inters, su tamao y escogemos la muestra. Una muestra la
cual consta de varios individuos y cada uno de estos individuos tiene una variable y esa tiene la
misma distribucin que tenga X en la poblacin objetivo (como ya dijimos anteriormente).
Ahora calculamos los estadsticos la media muestral, la proporcin muestral, la desviacin
estndar y el resto de estadsticos que se pueden calcular. Tras esto vamos a hacer inferencia,
es decir, dar el salto de la muestra a la poblacin objetivo, para ello crearemos intervalos de
confianza.
Se trata de a partir de los resultados de la muestra construir un intervalo de confianza para el
parmetro con una confianza de que contenga el parmetro que yo quiero estimar.
Si yo calculo la media muestral la calcular para estimar que es la media de la poblacin
objetivo. Por lo tanto quiero hacer un intervalo de confianza basado en esta media muestral
que contenga al parmetro .
Por otro lado, si yo calculo la proporcin muestral es porque quiero acercarme al verdadero
valor de la proporcin en la poblacin objetivo, as que al igual que con la media muestral pero
en este caso con la proporcin muestral establecer un intervalo de confianza para que
contenga al verdadero valor p de la poblacin objetivo.
Conclusin: Un intervalo de confianza es aquel que se construye a partir de la media o
proporcin muestral, de manera que posea una probabilidad importante de contener el
verdadero valor que quiero estimar ( o p de la poblacin objetivo).

Vamos a ver de qu forma podemos hacer eso:


Hacemos una estimacin de la media en la poblacin objetivo, esta se puede llevar a cabo
de dos formas:

Si es conocida (poco frecuente), recordamos que es la desviacin estandar


(tambin conocido como error estandar). Yo en la poblacin objetivo tengo una
variable X (en la poblacin objetivo) que sigue una distribucin normal de media de
X y de desviacin estndar de X. En este caso supongo que conozco la distribucin
que es normal pero desconozco el valor de la media. De esta poblacin objetivo
seleccionamos una muestra y vamos a tener la variable X en cada uno de los
individuos. De cada una de estas variables solamente obtengo una medida x1, x2 xn
y construyo la media muestral (la suma de todas las x dividido entre n).
Cul es la distribucin de la media muestral? No hace falta aplicar el teorema del
lmite central porque en este caso ya sabemos que X es normal, por lo tanto la media
de la muestra es tambin normal. Sabemos que tiene la
misma media que X en la poblacin objetivo ( de X) y la
desviacin estndar de la media muestral ser la desviacin
estndar de la poblacin objetivo partido de la raz de n (siendo n el tamao muestral).
Para construir el intervalo de confianza yo quiero que mi estimacin (x raya) se separe
del verdadero valor ( de X) menos de un valor concreto
de error aleatorio.
Quiero que esta diferencia de mi estimador frente al parmetro que quiero estimar
sea menos de psilon o menos psilon (ya que las diferencias pueden ser positivas o
negativas). Pero yo quiero conseguir que ocurra esto con una determinada
probabilidad, esa probabilidad es denominada alfa. Es la probabilidad de que mi
estimador se separe menos del parmetro y que
esa separacin este entre menos psilon y mas
psilon.
Adems si cambiamos los signos entonces tendramos la otra probabilidad 1-alfa, la
cual es la probabilidad de que la media
muestral (X raya) se separe del verdadero
valor ( de x) menos de psilon o menos psilon.
Al final lo que yo voy a decir es que quiero un valor de la media muestral menos
psilon y otro valor de la media muestral mas psilon que entre ambos se encuentre el
verdadero valor de x y quiero que ocurra
con una determinada probabilidad que ser
1- alfa.
Nivel de confianza del intervalo: Es 1-alfa.
NOTA: Yo voy a utilizar la distribucin de la media muestral para aproximarme a .

EJEMPLO
Imaginad que tengo un individuo determinado con una media mu desconocida para
estimarla se toman n medidas independientes sobre dicha presin arterial. Resultando
una media muestral de 121,5 mmHg. Sigma es conocida y se tratara de 10 mmHg.
Lo que se nos pide es estimar mu mediante un intervalo de confianza al 95%.
2

1. Si n es 100:
Tenemos una muestra de un nico individuo, pero ese individuo puede tener
distintos valores de presin arterial y yo quiero saber cul es la media de su
presin arterial, entonces cojo una serie de medidas independientes de dicha
presin arterial (nos dice que son independientes, ya que si no nosotros
supondramos la existencia de correlacin debido a que al individuo le
hacemos distintas medidas). Las medidas que hemos hecho sobre este
individuo se encuentran lo suficientemente separadas en el tiempo como para
que sean independientes. Vamos a tomar primero 100 medidas de presin
arterial de este individuo suficientemente separadas y lo que me va a dar de
media en esta muestra es 121,5. As que ahora yo tengo una poblacin
objetivo, en la cual existe un individuo que tiene una variable X que es la
presin arterial, la cual posee una media y una desviacin estndar que en
este caso conocemos, de hecho es de 10 mmHg. La distribucin (a veces) y la
media de la poblacin objetivo son desconocidas, por el contrario sabemos
que sigma tiene un valor de 10 mmHg. La poblacin es inabarcable as que
tomar una muestra de esta que sea representativa y con un tamao
muestral de n medidas o individuos (dependiendo de cmo sea la poblacin).
Entonces vamos a tener las distintas medidas, a partir de ellas calculamos la
media muestral (la media muestral hay que tener en cuenta que tomara
diferentes valores en cada posible muestra de n medidas). Nos interesa saber
cul es la distribucin de la media muestral:
a) Si X sigue una distribucin normal de media y de desviacin
estndar 10 mmHg entonces la media muestral sigue esta distribucin.
Es como esta pero ahora desviacin estndar de la media muestral
sera 10 partido de la raz cuadrada de n. La raz de 100 que es el
tamao de la muestra nos da un valor de 10. Por lo tanto 10/10=1, con
lo que desciframos que la desviacin estndar de la media muestral es
1.
b) Si X sigue una distribucin desconocida en la poblacin objetivo la
distribucin sera desconocida con la misma media y con la desviacin
estndar de 10. Si sigma es conocida (como en este caso) y n (el
tamao muestral) es grande podemos decir que la media muestral
sigue una distribucin aproximadamente normal de media y de
desviacin estndar sigma partido de la raz cuadrada de n.
Si ahora hacemos la estandarizacin y la asignacin del nivel de confianza del 95%
estaramos haciendo esto: Yo quera que mi estimacin X raya se separara del
verdadero valor menos de ms psilon y menos psilon, es decir, que estuviera entre
menos psilon y ms psilon. Lo que hago es dividir toda esa expresin entre el error
estndar de la media muestral, si hago esto esta variable es la variable normal
estndar y estoy diciendo que quiero que mi media se separe del verdadero valor mu
menos de psilon con una probabilidad del 0,95. Esto es a lo que se le llama hacer
inferencia mediante intervalos de confianza.

Nota: psilon es el error aleatorio.


Vamos a ver como trabajamos con las distribuciones:
Tenemos la media de X y sigma conocida.
La distribucin X en la poblacin objetivo sera normal de x y sigma de x, siendo
sigma de x conocida (10mmHg), la distribucin de la media muestral va a tener la
misma media de X pero la desviacin estndar ser sigma de x partido de la raz
cuadrada de n, su campana ser ms afilada ye en conjunto esta ltima
distribucin de la media muestral ser ms estrecha, debido a que la desviacin
estndar se encuentra partida por la raz cuadrada de n.
Quiero que X raya se separe del verdadero valor de x menos ms psilon o menos
psilon, y la probabilidad con la que lo quiero conseguir es de uno menos alfa.
La diferencia (entre X raya y de X) es el error aleatorio, por lo tanto esta variable es
el error aleatorio, marco dos puntos y entre ellos quiero abarcar una probabilidad 1
menos alfa. Si quiero hacer esto en la
distribucin normal estndar (este
punto y este otro) estn fijos y son
conocidos es lo que yo voy a utilizar
me voy a ir a la distribucin
normal estndar y voy a decir quiero
un nivel de confianza de 1- alfa por lo
tanto (por el lado izquierdo) en violeta voy a tener alfa medios y por el lado derecho
otros alfa medios.
En conclusin yo tengo aqu un intervalo de confianza, quiero que la probabilidad de
que mi estimacin se separe del verdadero valor de la poblacin objetivo entre ms
psilon y menos psilon sea 1-alfa (luego
lo estandarizo). Quiero que 1- alfa quede
dentro del intervalo, se trata entonces de
conocer cules son los intervalos de
confianza y los 1-alfa que puedo utilizar.

Los niveles de confianza que yo puedo fijar para un intervalo de confianza (que son bastante
estndares) son:
I.

II.

III.

Al 90%, entonces el valor fijo de la izquierda ser -1,64 porque en el


centro quiero dejar el 90%, para que sea as el valor de la izquierda
tiene que ser -1,64 y el de la derecha +1,64.
Al 95% quiere decir que queremos dejar en el centro el 95% de la
probabilidad entonces entre las dos olas dejars el 5% (0,025 por un
lado y 0,025 por el otro). Entonces los valores fijos en este caso sern
a la izquierda -1,96 y a la derecha +1,96.
Si lo quieres al 99% la probabilidad es del 0,99 los valores de los lados
sern en este caso a la izquierda -2,58 y a la derecha +2,58.

Ejemplo: Si quiero saber cuntas personas han votado a partido poltico y quiero estar
seguro de que el valor se encuentre en mi intervalo lo que hare ser hacer un intervalo
del 99% lo que pasa es que ser muy amplio, puedo hacer uno del 90% que ser ms
estrecho si pero no me aseguro de que ese intervalo contenga el valor que yo deseo
saber. Siempre es un balance.
Luego esto es simplemente decirla a STATA que quiero un intervalo de dicho
porcentaje, pero conviene saber que estamos haciendo.
Si yo quiero controlar el error aleatorio (psilon):
En el caso de que coja un intervalo de confianza al 95% este valor es de 1,96 (como ya
hemos dicho), si sabemos ese dato, conocemos sigma (10 mmHg en este caso) y
conocemos el tamao muestral (100) entonces podemos calcular el error aleatorio
(despejando en la siguiente formula):

Importante: Si queremos disminuir el error aleatorio, es decir, si quiero acercarme al


parmetro con mucha precisin (la precisin implica ausencia de error aleatorio, es
decir, que sean pequeos) tendremos que incrementar n. Cuanto ms incrementemos
n el error estndar de la media muestral va a disminuir y tambin el error aleatorio.
Recordatorio: la validez implica ausencia de error sistemtico, es decir, que sean
pequeos.

Tpica pregunta de MIR: Qu podemos hacer para disminuir el error aleatorio de un


estudio? El error aleatorio est relacionado con la precisin, y esta aumenta cuando
disminuimos el error aleatorio y para disminuir a este ltimo debemos incrementar el
tamao de la muestra. Por lo que cuanto ms grande sea el tamao de la muestra ms
preciso es el estudio ya que menor error aleatorio y esto tiene que ver con la calidad
de los estudios.

Si es desconocida que es lo ms frecuente (esto no lo vamos a dar).

En el caso de las proporciones ocurre lo mismo, si queremos un nivel de confianza del 90%
habra que fijar los valores de 1,64-1,96-2,58 respectivamente (son los mismos valores que en
las medias).
Para construir el intervalo de confianza:
Para variables continuas se coge la media muestral y se le suma o resta el error aleatorio (el
cual debemos despejar, para ello multiplicamos al error estndar (sigma partido de la raz
cuadrada de n) por el nmero que corresponda al porcentaje del intervalo de confianza que
deseamos (Z), si se trata de una distribucin normal cogemos uno de estos puntos 1,96, lo
mencionado anteriormente). Para sacar el error estndar si sigma es conocido simplemente se
calcula sustituyendo los valores, en el caso de que sigma sea un valor desconocido tendr que
estimarla en la muestra y multiplicarlo por Z. Si tenemos menos de 30 individuos en la
muestra tendremos que coger esos valores de la t de student.

RESUMEN:
media (

) +/- el error estndar = intervalo de confianza

proporcin muestral +/- el error estndar = intervalo de confianza para la proporcin.

ATENTOS A LAS DIAPOSITIVAS DEL POWER POINT DE ESTE TEMA, EL CUAL EN EGELA ES
NUMERADO COMO TEMA 9 PERO CONTIENE EL MISMO TTULO QUE ESTE ARCHIVO. DEBIDO
A QUE ALGUNAS NO LAS HA EXPLICADO EN CLASE.

También podría gustarte