Estimaciones Final

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 56

Teoría del muestreo

Dra. Gabriela Rodríguez Fuentes


Parámetros poblacionales
• Una población se considera conocida cuando se sabe cuál es la
distribución de probabilidad f(x) función de probabilidad o función de
densidad de la correspondiente variable aleatroria X.
• Cuando la distribución de probabilidad f(x) no se conoce con
precisión, aunque se pueda tener alguna idea de ella o por lo menos
se puedan hacer algunas hipótesis en relación con el comportamiento
general de f(x), surge un problema importante. Se puede suponer
normal, pero no se conoce µ o σ. Y que se necesite obtener
inferencias estadísticas acerca de ellas.
Estadísticos muestrales
• Una muestra de tamaño n se describe mediante los valores x1,x2,..,xn
de las variables X1,X2,…Xn. En el caso de un muestreo con reemplazo
X1,X2,…Xn serán variables aleatorias independientes idénticamente
distribuidas, con distribución f(x). En consecuencia, su distribución
conjunta será:
P(X1=x1,X2=x2…Xn=xn)=f(x1)f(x2)…f(xn)

• Toda cantidad que se obtiene de un muestreo con el propósito de


estimar un parámetro poblacional se llama estadístico muestral o solo
estadístico.
• En general, a cada parámetro poblacional corresponde un estadístico que
se calcula a partir de la muestra. El método para obtener este estadístico a
partir de la muestra es similar al método para obtener el parámetro a
partir de la población finita, ya que una muestra consta de un número
finito de valores, pero no siempre se obtiene la mejor estimación.
• Un problema importante de la teoría del muestreo es decidir como formar
el estadístico muestral adecuado que estime mejor el parámetro
poblacional dado.
• Se usan letras griegas para los parámetros poblacionales y letras romanas,
para los valores correspondientes de los estadísticos muestrales.
Distribuciones muestrales
• A la distribución de probabilidad de un estadístico muestral suele
llamársele distribución muestral del estadístico.
• Alternativamete se pueden considerar todas las muestras posibles de
tamaño n que pueden obtenerse de una población, y de cada
muestra calcular el estadístico. De esta manera se obtiene una
distribución del estadístico, que es la distribución muestral.
• Para una distribución muestral puede calcularse, la media, la varianza,
la desviación estándar, etc. A la desviación estándar algunas veces
también se le suele llamar error estándar.
Media muestral
• Sean X1,X2…Xn variables aleatorias independientes, idénticamente
distribuidas, obtenidas de una muestra de tamaño n. Entonces la
media o media muestral es una variable aleatoria definida por:

• En analogía si x1,x2,…xn son los valores que se obtuvieron de una


determinada muestra de tamaño n, la media de estas muestras
representa:
Ejemplo
• Si en una muestra de tamaño 5 se obtienen los valores muestrales
7,9,1,6,2, la media muestral es:
Distribución muestral de medias
• Sea f(x) la distribución de probabilidad de alguna población dada, de
la que se toma una muestra de tamaño n. Entonces, es natural
preguntarse por la distribución de probabilidad del estadístico
muestral X(rayita) que se conoce como distribución muestral de la
media muestral o distribución muestral de medias.
Teoremas
Teoremas
Distribución muestral de proporciones
Distribución muestral de diferencias y sumas
Varianza muestral
Distribución muestral de varianzas
Caso en que no se conoce la varianza
poblacional
Distribución muestral de razones de varianzas
Otros estadísticos
Problemas
• Una población consta de cinco números : 2,3,6,8 y 11 . Considerar
todas las muestras posibles de tamaño dos que pueden extraerse con
reemplazo de esta población. Encontrar a) La media de la población
b) la desviación estándar de la población, c) la media de la
distribución muestral de medias, d) la desviación estándar de la
distribución muestral de medias, es decir el error estándar de medias.
Solución
Problema 2
• Resolver el problema anterior en caso que el muestreo sea sin
reemplazo
Problema 3
Problema 4
Problema 5
Estimadores
Teoría de la estimación
Dra. Gabriela Rodríguez Fuentes
Estimación insesgada
• Es un estimador insesgado de un parámetro poblacional, si la media o
la esperanza del estadístico es igual al parámetro.
• La media 𝑦 𝑙𝑎 𝑣𝑎rianza S2 , son estimadores insesgados de la
media poblacional µ y la varianza σ2 .
• Si las distribuciones muestrales de dos estadísticos tienen la misma
media, el estadístico con un una varianza más pequeña se denomina
estimador más eficient0e de la media. El valor correspondiente del
estadístico eficiente se llama estimador eficiente de la media.
• En la practica se prefiere tener estimaciones que sean eficientes e
insesgadas. Pero a veces no es posible
Ejemplo
• En el caso de una población normal, la distribución muestral de la
media y de la mediana tienen la misma media, es decir la media
poblacional. Sin embargo, la varianza de la distribución muestral de la
media es más pequeña que la que corresponde a la distribución
muestral de las medianas. Por tanto la media poblacional proporciona
una estimación más eficiente que la mediana.
• En la práctica se suelen usar las estimaciones ineficientes debido a la
relativa facilidad con que se pueden obtener algunas de ellas.
Estimaciones puntuales y por intervalos :
Confiabilidad
• La estimación de un parámetro poblacional dada por un solo número
se llama la estimación puntual del parámetro. Una estimación del
parámetro poblacional dada por dos números, entre los cuales está el
parámetro , se denomina intervalo de estimación del parámetro.
• Las estimaciones por intervalo indican la precisión (o exactitud) de la
estimación, y por eso se prefieren sobre las estimaciones puntuales.
Ejemplo
• Si decimos que en la medición de una distancia se obtuvo como
resultado 5.28 metros (m), damos una estimación puntual. En
cambio, si decimos que la distancia es 5.28 ± 0.03 m (es decir, que la
distancia está entre 5.25 y 5.31 m), damos una estimación por
intervalo.
• A una declaración sobre el error (o precisión) de una estimación se le
suele llamar su confiabilidad.
Estimaciones de parámetros poblacionales
con intervalos de confianza
• Sean µS y σS la media y la desviación estándar (error estándar),
respectivamente, de la distribución muestral de un estadístico S.
Entonces, si la distribución muestral de S es aproximadamente normal
(lo que sabemos que es así para muchos estadísticos si el tamaño de
la muestra es N ≥ 30), podemos esperar que haya un estadístico
muestral S que se encuentre en los intervalos de :

O de alrededor de 68.27%, 95.45% y 99.73% de las veces


respectivamente
Estimaciones de parámetros poblacionales
con intervalos de confianza
• De igual manera, esperamos encontrar µS en el intervalo

• Aproximadamente 68.27 %, 95.45% y 99.73% de las veces


respectivamente. Por eso a estos intervalos se les llama intervalos de
confianza para estimar µS, los números de los extremos se llaman límites
de confianza o límites fiduciales.
• De igual manera S ± 1.96 σ y S ± 2.58 σ son los límites de confianza de 95%
y de 99% para S. A los números 1.96 y 2,58 que aparecen en los límites de
confianza se les llama coeficientes de confianza o valores críticos y se les
denota por zc .
Valores zc a mantener a mano

Si el estadístico tiene una distribución muestral diferente a la distribución normal (como chi‐cuadrada, t o F) se tienen que
Hacer las modificaciones adecuadas para obtener los intervalos de confianza.
Intervalos de confianza para medias
• Muestras grandes (n≥30) Si el estadístico S es la media muestral 𝑥̅ , entonces los
límites de confianza del 95% y 99% para la estimación de la media poblacional µ
está dada por 𝑥̅ ± 1.96σ𝑥 ̅ y 𝑥̅ ±2.58 𝑥 ̅ respectivamente. En general, si la muestra es
de una población infinita, o con reposición o devolución en una población finita

• Y si la muestra es sin reposición en una población finita de tamaño N

• En general si no se conoce la desviación estándar poblacional σ por lo cual para obtener


los límites de confianza anteriores se usa el estimador S
Muestras pequeñas (n<30) y distribución
normal
• En este caso se usa la distribución t para obtener los niveles de
confianza. Por ejempo si –t0.975 y t0.975 son valores de T para los
cuales 2.5% del área se encuentra en la cola de la distribución t,
entonces el intervalo de confianza de 95% de T está dado por:

• Por lo que se puede estimar que µ está en el intervalo

• Con una confianza del 95%. Los límites de confianza de las medias
poblacionales están dados por:
Intervalo de confianza para proporciones
Intervalos de confianza para diferencias y
sumas
Intervalos de confianza para la varianza de
una distribución normal
Intervalos de confianza para razones, o
cocientes de varianzas
Problemas
Problema
Problema
Problema
Problema
Problemas (muestra pequeña)
Problema
Problema
Problema (Intervalo de confianza para proporciones)
Problema
Problemas intervalo de confianza para
diferencias y sumas
Problema
Problema Intervalo de confianza para varianzas
Problema
Problema (limites de desviación estándar)
Problema
Problema Intervalos de confianza para Razón
o Cocientes de varianza

También podría gustarte