ESTIMACION
ESTIMACION
ESTIMACION
Conceptos claves de muestra frente a poblacin Una muestra aleatoria es un subconjunto de la poblacin Las probabilidades Pr (X = xi ) se Las frecuencias relativas ni / n se utilizan para calcular: y S2 Que son ejemplos de estadsticas aleatorias o estimadores utilizan para calcular: y 2
Para un solo parmetro de la poblacin, hay muchos posibles estimadores. Por lo que hay que tener criterios expresados en trminos de propiedades deseables para decidir en cada situacin, cul estimador es el ms conveniente: el mejor
Por ejemplo.- Un estimador de la media poblacional puede ser la media de la muestra, la mediana o la moda Estimadores y sus parmetros poblacionales correspondiente.
Estimador S2 S P
Parmetro 2 P
La Estimacin por Intervalos (o intervalos de confianza como tambin se conocen) utiliza el estimador puntual para dar un intervalo con un lmite inferior y otro superior. Una estimacin por intervalos es mucho ms til que una estimacin puntual, ya que posee ms informacin: no slo da el valor estimado, sino tambin la precisin y el nivel de confianza con el cual se asegura que el parmetro por estimar est contenido en el intervalo. El trabajo fundamental consiste en la construccin de intervalos de confianza para los diferentes parmetros poblacionales y el estudio de las interrelaciones de los conceptos involucrados tales como precisin, confianza y tamao de muestra.
Gracias a la teora del muestro se sabe que, a menos de que seamos muy afortunados el valor del estimador no estar totalmente ajustado, sino que ms bien ser un poco alto o un poco bajo ( est distribuida en torno a )
xi
Su primer valor estimado de intervalo Su segundo Su tercero Y as sucesivamente (hasta aqu todos abarcan ) Su primer yerro Estos son los valores estimados de Intervalo del estadgrafo
Su vigsimo
= error de muestreo
El problema fundamental es: Qu amplitud debe tener la tolerancia del error de muestreo? Primero hay que especificar el nivel de confianza que se deposita en la ecuacin anterior. Si fijamos este nivel en 95%, estamos indicando que a la larga se espera que se encuentre en el intervalo:
La distribucin x
Pr = 2.5%
= / n
Pr = 2.5%
- 1.96 / n
+ 1.96 / n
La distribucin normal de la media muestral alrededor del parmetro (fijo pero desconocido) Aqu el factor 1.96 viene de las tablas de la distribucin normal, ya que hemos dejado 2.5% de probabilidad en cada cola de la figura, es decir que:
Pr ( - 1.96 / n
+ 1.96 / n ) = 0.95
Ahora se despeja la en las desigualdades para obtener la ecuacin equivalente Pr ( 0.95 - 1.96 / n + 1.96 / n ) =
x2 es la varianza de la poblacin
La varianza y el error mximo permisible dependen de cada problema en particular. Sin embargo, el parmetro x2 que es la varianza poblacional regularmente no se conoce, entonces existen dos opciones frente a esta falta de informacin. 1.- Basndose en experimentos previos con poblaciones similares, o en otros resultados de otros investigadores, o en consideraciones tericas, se pueden estimar 2 o por lo menos dar una cota superior para ella. 2.- Si no hay experiencias previas se puede efectuar un pequeo muestreo piloto y en base a este calcular S2 para sustituirlo por 2
7
Resumiendo: Se tienen dos formas equivalentes de expresar los intervalos de confianza Pr ( - Z0.025 x / n O ms brevemente como: Intervalo de confianza de 95% = Z0.025 x / n + Z0.025 x / n ) = 0.95
Hay que entender bien que lo que vara en las ecuaciones anteriores no es (que es un parmetro fijo aunque desconocido) sino el intervalo centrado en la variable aleatoria se puede ver geomtricamente que lo que vara es la posicin de los intervalos, no el parmetro . Pero una vez que se toma la muestra y se determina el valor de , y por lo tanto el intervalo, entonces est contenida o no lo est. Si el tamao de la muestra n es fijo, un aumento cualquiera en la confianza se consigue a costa de una disminucin en precisin y viceversa. Esto se interpreta en el sentido de que la cantidad de la informacin disponible (n) es fija y no se puede obtener ms confianza sin ceder en la precisin. Si se especifican los niveles de confianza y precisin deseados, stos sern alcanzables siempre y cuando la muestra sea suficientemente grande (es decir, que haya suficiente informacin). Considrese que el tamao necesario de la muestra est determinado por:
n = Z 0 2 x 2 / e2
Por ltimo se debe notar que desde la primera aplicacin de la frmula (la que expresa los intervalos de confianza), se ha sustituido la desviacin estndar de la muestra s en lugar del parmetro de poblacin correspondiente. Esto intuitivamente parece razonable ya que s es un
8
buen estimador de , solamente debe recordarse que acarrea muy poco error si el tamao de muestra n es del orden de 30 o ms INTERVALOS DE CONFIANZA PARA LA MEDIA (Muestras Pequeas) La estimacin de los intervalos de confianza donde se utilizan muestran grandes permiten hacer dos cosas 1. Suponer que la tena la distribucin normal sin importar la
poblacin original (en virtud del teorema de lmite central). 2. Sustituir s en el lugar de sin ninguna modificacin de la frmula para el intervalo de confianza (el error acarreado fue muy pequeo). Cuando se trabaja con muestras pequeas (del orden de 30 o menos), para seguir garantizando la normalidad de la distribucin de basta pedir que la distribucin de la poblacin se aproxime a la normal. As aunque n sea muy pequeo, ser normal. El nico problema que queda por resolver, en estos casos de muestras pequeas, es que el error cometido al aproximar por medio de s, ya no es necesariamente pequeo. Esto provoca que la expresin para calcular los intervalos de confianza se modifique. Para poder entender la modificacin, conviene recordar que el teorema de lmite central indica que la media de la muestra estandarizada se distribuye aproximadamente como una variable normal estndar, que se denota como Z: Z = - / ( /n )
9
Ahora se requiere algo anlogo a la expresin anterior con s en lugar de . Esta variable se conoce como la variable t de Student t = - / ( s /n ) Si comparamos ambas expresiones notaremos que el nico cambio est en el denominar donde se sustituye sen lugar de . Sera natural que la distribucin t fuera parecida a la normal pero ms ancha que sta, ya que si s subestimara a , el cociente resultara grande. No hay una sola distribucin para la t de Student, sino una familia de distribuciones. Esto ocurre debido al efecto del tamao de muestra: si n es pequea, la t de Student correspondiente es muy ancha, pero si n es de 30 o ms, la distribucin t y la normal Z son casi indistinguibles (s y son casi iguales).
10
PROPIEDADES DE LOS ESTIMADORES Un estimador es el valor del estadgrafo de una muestra que permite inferir algo respecto del parmetro de la poblacin No tendenciosidad (estimador insesgado) Se dice de un estimador que no es tendencioso o insesgado si la media de la distribucin de medias muestras es igual al valor del parmetro estimado. Por ejemplo, independientemente de la naturaleza de la poblacin, la media X, es un estimador insesgado de TENDENCIOSIDAD Y NO TENDENCIOSIDAD DE DIVERSOS ESTIMADORES DE PARMETROS DE VARIAS POBLACIONES Parmetro 2 xy Naturaleza de la Poblacin Cualquier poblacin Simtrico Simtrico y unimodal Asimtrico Asimtrico Cualquier poblacin Normal Normal bivariado Estimador X Mediana Moda Mediana Moda S2x Sx rxy Evaluacin del estimador Insesgado Insesgado Insesgado Sesgado Sesgado Insesgado Negativamente asimtrico Negativamente asimtrico
11
Consistencia Aunque sesgado un estimador consistente tiende a aproximarse al valor del parmetro estimado a medida que la muestra aumenta de tamao, tal es el caso de la desviacin tpica de s en tanto estimacin de . Si se selecciona una muestra muy grande, ms cercanos sern ambos valores. Eficiencia Relativa La eficiencia se refiere la la precisin con la cual tales medidas pueden estimar un parmetro, es decir, la variabilidad que pueden tomar en muestras sucesivas. El error de la media expresado en trminos de varianza es una medida de eficiencia de X; como estimador de y del error de coeficiente de correlacin, expresado en trminos de varianza, es asimismo una media de la eficiencia de r, en tanto que medida de estimacin de El error de una medida de estimacin expresado en trminos de su varianza es una de las propiedades ms importantes de sta y se refiere a la varianza de las distribuciones de las muestras del estadgrafo.
12
DOS MUESTRAS: ESTIMACIN DE LA DIFERENCIA ENTRE DOS MEDIAS Intervalo de confianza para 1 - 2 con 12 y 22 conocidas Si X1 y X2 son las medias de muestras aleatorias independientes de tamao n1 y n2 de poblaciones con varianzas conocidas 12 y 22, respectivamente, un intervalo de confianza de (1 ) 100% para 1 - 2 est dado por:
13
Intervalo de confianza para 1 - 2 con 12 = 22 pero desconocidas Si X1 y X2 son las medias de muestras aleatorias independientes de tamao n1 y n2 respectivamente, de poblaciones aproximadamente normales con varianzas iguales pero desconocidas, un intervalo de confianza de (1-) 100% para 1 - 2 est dado por:
Donde Sp es la estimacin de unin de la desviacin estndar poblacional y t/2 es el valor t con v = n1 + n2 - 2 grados de libertad, que deja un rea de /2 a la derecha. La varianza unida Sp2 se calcula de la forma:
14
Intervalo de confianza para 1 - 2 con 12 22 y desconocidas Si X1 y S12 , y X2 y S22 son las medias y varianzas de muestras pequeas independientes de tamao n1 y n2 respectivamente, de distribuciones aproximadamente normales con varianzas desconocidas y diferentes, un intervalo de confianza del (1-) 100% para 1 - 2 est dado por:
(S22/n2)
V =[(S12/n1 + S22/n2)2] / [[(S12/n1)2/(n1 1)]+[(S22/n2)2/(n2 1)]] grados de libertad, que deja un rea de /2 a la derecha
15
16
171717171717171717
17
17
17
171
717 17171717171717171717171717171717171717l1717 171717 171717 17 1 71717 171717 171717 17 1717171717 717171 171717 171717 17817 1717 17 17 717171 1717 171717 17"17 171717 171717 171717 171717 171717 171717 1717 171717 171717 171717 171717 171717 17$17 1717 1717 17171717171717171717 171717 1717171717171717171717 1717 171717 171717 171717 1717p n < D = 1 - 2 < d + t/2 Sp n
Donde t/2 es el valor t con v = n1 - 1 grados de libertad, que deja un rea de /2 a la derecha.
17
aproximadamente normal con media. p = E ( P ) = E [X/n] = np/n = P y varianza p2 = X/n2 = x2/n2 = npq/n2 = pq/n
18
Por tanto, podemos asegurar que Pr ( - Z /2 < Z < Z /2 ) = 1 - donde Z = P p / pq/n y Z /2 es el valor de la curva normal estndar sobre la cual encontramos un rea de /2
Para una muestra aleatoria particular de tamao n (grande), se calcula la proporcin muestral p = x/n y se obtiene el siguiente intervalo de confianza de (1- )100% aproximado para p. Si p es la proporcin de xitos en una muestra aleatoria de tamao n, y q = 1 p, un intervalo de confianza aproximado de (1- )100% para el parmetro binomial p est dado por:
Donde Z /2 el valor Z que deja un rea de /2 a la derecha Cuando n es pequea y la proporcin desconocida p se considera cercano a 0 o a 1, el procedimiento del intervalo de confianza que se establece aqu no es confiable y, por tanto, no se debe utilizar Si p se utiliza como una medida de estimacin de p, podemos tener una confianza de (1- )100% de que el error no exceder Z /2 pq/n
19
Si p se utiliza como una estimacin de p, podemos tener una confianza de (1- )100% de que el error ser menor que una cantidad especfica e cuando el tamao de muestra es aproximadamente n = Z2/2 pq/e2 Si p se utiliza como una estimacin de p, podemos tener una confianza de al menos (1- )100% de que el error no exceder una cantidad especfica e cuando el tamao de muestra sea n = Z2/2 /4e2
20
intervalo de confianza aproximado de (1- )100% para la diferencia de dos parmetros binomiales P1 - P2 est dado por:
(p1 - p2)-Z /2P1q1/n1 + P2 q2/n2 <P1-P2 <(p1 - p2)+Z /2P1q1/n1 + P2 q2/n2 Donde Z /2 el valor Z que deja un rea de /2 a la derecha Estimacin de la varianza Una sola muestra Si se extrae una muestra de tamao n de una poblacin normal con varianza 2 y se calcula s2 obtenemos un valor de la estadstica S2. Esta varianza muestral calculada se usar como estimacin puntual de 2. Por ello la estadstica S2 se llama estimador de 2 Se puede establecer una estimacin por intervalos de 2 mediante el uso de la estadstica X2 = (n-1) S2 / 2 La estadstica X2 tiene una distribucin ji cuadrada con n-1 grados de libertad. Cuando las muestras se eligen de una poblacin normal podemos escribir Pr ( - X21-/2 < Z < X2/2 ) = 1 - Donde X2 la derecha. Intervalo de confianza para 2
1-/2
y X2
/2
21
Si
(n-1)s2 / X2/2 < 2 < (n-1)s2 / X21-/2 Donde X2 y X2 son valores de X2 con v = n-1 grados de libertad,
1-/2
/2
que dejan reas de /2 y 1 - /2 respectivamente, a la derecha. Estimacin de la razn de dos varianzas Dos muestras Una estimacin puntual de la razn de dos varianzas poblacionales 12/22 est dada por la razn s12/s22 de las varianzas muestrales. De aqu que la estadstica s12/s22 se denomina estimador de 12/22 Si 12 y 22 son las varianzas de poblaciones normales, podemos establecer una estimacin por intervalos de 12/22 mediante el uso de la estadstica F = 22 s12/ 12 s22 La variable aleatoria F tiene una distribucin F con v1=n1-1 y
v2=n2-1
grados de libertad. Para cualesquiera dos muestras aleatorias independientes de tamao n1 y n2 que se selecciones de dos poblaciones normales, la razn de las varianzas muestrales s12/s22 se calcula y se obtiene el siguiente intervalo de confianza de (1- )100% para 12/22 Intervalos de confianza para 12/22
22
Si s12 y s22 son las varianzas de las muestras independientes de tamao n1 y n2 respectivamente, de poblaciones normales, entonces un intervalo de confianza de (1- )100% para 12/22 es (s12/s22)(1/f/2 (v1,v2)) < 12/22 < (s12/s22)( f/2 (v1,v2)) Donde f/2 (v1,v2) es un valor f con v1=n1-1 y v2=n2-1 grados de libertad que deja un rea de /2 a la derecha f/2 (v1,v2) es un valor f similar con v1=n1-1 y v2=n2-1 grados de libertad
23