Tema 3.3 Estimacion
Tema 3.3 Estimacion
Tema 3.3 Estimacion
Segundo añ o (MIC).
-Wilmaris
-Fabian Patriz.
INTRODUCCIÓN
La estimación de parámetros
Las pruebas de hipótesis.
Es importante tener en cuenta que los estadígrafos son solo una representación resumida
de los datos, y que diferentes estadígrafos pueden proporcionar información diferente
sobre el mismo conjunto de datos.
Parámetro: hace referencia a las medidas que se tienen en cuenta en una población.
Como sabemos una variable aleatoria en la población se distribuye con arreglo a cierta
función (Modelo teórico de distribución o ley de una variable aleatoria) que depende de
cierto número de valores.
La siguiente tabla nos muestra la relación entre algunos estadígrafos y los parámetros
poblacionales correspondientes.
Población Muestra
Media de la población: µ X̄
Media de la muestra:
Desviación estándar: σ
Desviación estándar: s
Consideremos todas las posibles muestras de tamaño n de una variable aleatoria en una
población. Para cada muestra podemos calcular un estadígrafo (media, desviación
estándar, proporción, .etc.) que variará de una a otra.
Un ejemplo: supongamos que tenemos una población de niños menores de un año y
comenzamos a sacar muestras de tamaño 10 y calculamos el peso promedio de los niños
para cada muestra (Media muestral) ( X̄ ). Debemos aclarar que se trata de un muestreo
con reemplazo, o sea, cada vez que saco al azar una muestra de 10 niños y le calculo su
peso promedio, esos niños los devuelvo a la población antes de obtener las otras
muestras.
De tal suerte que tendremos un listado de pesos promedios, tantos como muestras
hayamos obtenido.
Esas medias podemos tratarlas como si fueran valores de una variable, podemos
ordenarlas, calcular su distribución de frecuencias absolutas y relativas, calcular la media
de esas medias y una medida de dispersión, digamos la desviación estándar.
queremos estimar la talla media X̄ y la desviación estándar s. Denotemos por x 1, x2,..., x90
los valores correspondientes a la talla en centímetros de cada una de las 90 niñas de la
muestra, de estadística descriptiva conocemos que las fórmulas:
n n
∑ xi ∑ ( x i −x )
i=1
s=
x= i=1 y n−1
n
se utilizan para calcular la media y la varianza muestral. Estos son precisamente los
Debe notarse que la utilidad práctica del estadígrafo, radica en que por medio de un
proceder de cálculo se obtiene un valor único. En este sentido, tanto la media X̄ como la
desviación estándar s constituyen valores puntuales. Constituye, en este esquema, un
aspecto esencial la selección de muestra, con la que, por sustitución de los valores
observados en la expresión del estimador, hallamos un valor numérico (una estimación)
que debe corresponder a un parámetro poblacional bajo estudio, descriptor de una
propiedad de interés.
Lo que tenemos son estimaciones puntuales.
Este hecho, unido a lo que conocemos acerca de la incertidumbre que se produce en el
proceso de selección de muestras aleatorias, deja en dudas la utilidad de la estimación
puntual, ya que continuamos sin ninguna información en relación con cuán cerca está el
valor encontrado del verdadero valor desconocido del parámetro poblacional. Es decir,
sabemos que va a existir una diferencia entre la cifra estimada y la verdadera, pero no
conocemos todavía si tal diferencia es admisible o no.
(La probabilidad de que los valores de esta variable se encuentren en este intervalo es de
0.9773)
Ahora bien, la distribución de las medias muestrales sigue una distribución normal con
media µ y desviación estándar , (Teorema del Límite Central), es decir, que el intervalo
para el 95 % es:
σ σ
Pr( x − z √n << x +z √n ) = 1−α
Que es exactamente lo que necesitábamos; una estimación para , que ya no es un valor
único, donde incorporamos finalmente, al utilizar la probabilidad, una medida de
confiabilidad o confianza. Este es el intervalo para la estimación de la media poblacional
(). Observe que la media poblacional () está entre dos límites, cuyos valores dependen
de la media muestral ( x ).
σ σ
(x –z √n , x +z √n )
donde:
z: percentil de orden 1−α/2 de la distribución normal estándar.
del conocimiento que teníamos acerca del estadígrafo ( x − µ ) / (σ/ √ n ) = Z, ¿qué sucede
con esta expresión cuando se sustituye σ por su estimador s?
Se conoce que en este caso Z ya no tiene una distribución normal con parámetros 0 y 1,
( x – z s/ √ n ; x + z s/ √ n )
Ahora restando y sumando 1.215 al valor de x , obtenemos los límites del intervalo de
confianza. Estos son: (120.84, 123.27).
La afirmación que podemos hacer en este caso es la misma que para σ conocida: para un
nivel de confianza del 95 % la media poblacional de la talla de niñas cubanas de 7 años
fluctúa, aproximadamente, entre 120.8cm y 123.2cm,
Similarmente, si extrajéramos m muestras de tamaño 200 es de esperar que
aproximadamente 0.95 · m de ellas (es decir, el 95 % de m), produzcan intervalos de
confianza que contengan el valor de µ, mientras que aproximadamente el 0.05 · m no
producirán intervalos con tal propiedad.
( x – t n−1,1−α/2 s / √ n ), x + t n−1,1−α/2 s / √n )
donde:
t n−1,1−α/2 : percentil de orden 1−α/2 de la t de Student con n−1 grados de libertad y
s: estimador de σ,
es un intervalo de confianza para µ con nivel de confiabilidad (1 ) · 100 %.
Es decir que para todo caso en que, n, no sobrepase la cifra de 30, tendremos que utilizar
la tabla de la distribución t de Student para calcular los límites del intervalo de confianza.
Construya un intervalo del 95 % de confianza para la media poblacional de la talla de
niñas de 7 años, asumiendo que se seleccionó una muestra de tamaño 20, con una media
y varianza muestral de 121.93cm y 24.95 cm2, respectivamente.
Solución:
Los datos que tenemos son:
(p - z √ p(1− p)/n )
√ p(1− p)/n ≤ P ≤ p+z
Como 1.96 · 0.07 = 0.14, los límites de confianza para P, o proporción de enfermos de
estomatitis subprótesis en la población, son (0.36, 0.64).
Como sabemos el error estándar de la proporción muestral es: √ p(1− p)/n . En este
ejemplo es: 0.07
Al igual que cuando construimos los diferentes intervalos de confianza para la media de
una población normal, es de esperar que si se seleccionan un número suficientemente
grande de muestras de tamaño n, aproximadamente el (1−α)·100 % de las muestras
produzcan intervalos de confianza que contengan el verdadero valor del parámetro P.
^p : Porcentaje de la Muestra
Como estudiamos en estadística descriptiva el porcentaje no es más que la proporción
multiplicada por 100.
Luego ^p = p * 100
^
La estimación puntual del porcentaje poblacional ( P ) se realiza a través del porcentaje de
la muestra ( ^p ).
Igualmente podemos obtener un intervalo de confianza para la estimación del porcentaje
^
poblacional ( P ).
El intervalo, que planteamos anteriormente, para la estimación de la proporción
( ^p -z √ ^p q^ /n ≤ P^ ≤ ^p +z √ ^p q^ /n)