03 Estimacion
03 Estimacion
03 Estimacion
BIOESTADÍSTICA
Estimación y pruebas de hipótesis
Estimación
Cualquier inferencia que se haga sobre la población tendrá que basarse
necesariamente en estadísticos muestrales, es decir en función de la información
muestral.- La elección apropiada de estos estadísticos dependerá de cual sea el
parámetro de interés de la población.- El verdadero parámetro será desconocido y un
objetivo será estimar su valor.-
Estimación de Parámetros
«En estadística se refiere a los valores o medidas que caracterizan a una población como,
¿Qué son los por ejemplo, la media y la desviación típica de una población (…) Son cantidades
parámetros? indeterminadas, constantes o fijas respecto a una condición o situación, que caracterizan
a un fenómeno en un momento dado que ocurre en una población» (Sierra Bravo, 1991).
¿Qué son los Se contrapone al parámetro porque es un valor que se obtiene a partir de los
Estadísticos? valores muéstrales. Se pueden obtener media y varianzas muéstrales.
Estadístico Parámetro
Estimación
Estimaciones Estimaciones de
puntuales Intervalo
ESTIMACIÓN PUNTUAL
Estimación.
Población
μ, σ, …
Muestra
Parámetro poblacional Estimador
Media x X
Desviación estándar x sx
Proporción P p
Veamos un ejemplo.-
10 16 5 10 12 8 4 6 5 4
x² - n X² 782 - 10 * 64
S² = ---------------------------- = --------------------------- = 15.7
n - 1 9
Para la desviación estándar la estimación puntual será
Sx = S² = 15,78 = 3.97
Finalmente, en la muestra, el número de valores para los
cuales la ganancia por acción es mayor que 8,5 son
cuatro.- Por lo tanto nuestra estimación puntual de la
proporción poblacional es:
x 4
p = = = 0.40
n 10
Número de personas que entraron a salud digna a realizarse análisis de sangre de 7-8 hrs.
en los últimos cuatro meses.
Encontrar las estimaciones puntuales de la media y la desviación estandar de la población.
De igual manera encontrar la proporción cuando el número de personas fue mayor a 325.
X ത
(X-𝑋) ത2
(X-𝑋)
242 -54.81 3004.136
𝑛 = 16 245 -51.81 2684.276 N
- Constituye la inferencia más simple que se puede realizar: asignar al parámetro el valor del
estadístico que mejor sirva para estimarlo.
Si los intervalos de confianza mostrados son del 95% significa que si se construye un
gran número de ellos, el 95% de ellos contendrá a la media
Mayor confianza requiere IC más anchos
Un tamaño de muestra más grande resulta en un IC más angosto (Se necesita
aumentar la muestra 4 veces para reducir la longitud del IC a la mitad)
En muestras grandes, la media muestral tiene aproximadamente una
distribución normal con media y error estándar
Estimación de Intervalos
Se toma una muestra aleatoria (X1,X2,...,XN). Con esta muestra se calcula el estadístico
el cual es un estimador puntual insesgado para la media m desconocida. Se puede
obtener un intervalo de confianza del 100(1-) % para m si consideramos los
siguientes hechos acerca de la distribución de :
Intervalo para la media
Intervalo para la Media (Varianza conocida)
1. Si la población es Normal, la distribución de es Normal
3. La media de es m ( es insesgado)
4. La varianza de es s2/n
___
Z X μ
Tiene una distribución N(0,1) σ/ N
/2 /2
-z/2 z/2 Z
__ __
19408.437
𝜎= = 35.97
15
𝛼
90% 𝑍 = = 1.65 296.81 − 𝑍𝛼 𝜎ൗ ≤ 𝑋ത ≤ 296.81 + 𝑍𝛼 𝜎ൗ 296.81 − (1.65)(
35.97
) ≤ ≤ 296.81 + (1.65)(
35.97
)
2 2 𝑛 2 𝑛 4 4
IC=95.8-96.6
INTERVALO DE PREDICCIÓN-Para una media con varianza poblacional desconocida
1 1
96.2 − (2.756)(0.8) 1 + ≤ 𝑥0 ≤ 96.2 + (2.756)(0.8) 1 +
30 30
𝐼𝐶 = 0.68 ± 0.021
IC= 0.6891-0.7209
Método 2.
0.08 0.09
0.01 0.0007
0.0001
Z= 1.8814
0.9699 0.9706
DOS MUESTRAS:
ESTIMACIÓN DE LA DIFERENCIA ENTRE DOS MEDIAS
DIFERENCIA DE DOS MEDIAS 1-2 CON 1 y 2 CONOCIDAS
𝑋ത1 − 𝑋ത2
𝑍=
𝜎12 𝜎22
+
𝑛1 𝑛2
64 36 64 36
6 − 2.06 + < 𝜇𝐵 − 𝜇𝐴 < 6 + 2.06 +
Datos: 76 50 76 50
μA = 36
μB = 42 6 − 2.06 0.842 + 0.72 < 𝜇𝐵 − 𝜇𝐴 < 6 + 2.06 0.882 + 0.72
= 0.04
Z0.02=2.06 6 − 2.06(1.25) < 𝜇𝐵 − 𝜇𝐴 < 6 + 2.06(1.25)
1 1 1 1
𝑋ത1 − 𝑋ത2 − 𝑡𝛼ൗ 𝑆𝑝 + ത ത
< 𝜇1 − 𝜇2 < 𝑋1 − 𝑋2 + 𝑡𝛼ൗ 𝑆𝑝 +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Se eligieron 2 estaciones de muestreo independientes para este estudio: una que se localiza corriente abajo del punto de
descarga ácida de la mina y la otra ubicada corriente arriba. Para 12 muestras mensuales reunidas en la estación
corriente abajo el índice de diversidad de especies tuvo un valor medio deX1 = 3.11 y una desviación estándar de S1 =
0.771; mientras que 10 muestras reunidas mensualmente en la estación corriente arriba tuvieron un valor medio del
índice X2 = 2.04 y una desviación estándar de S2 = 0.448. Calculemos un intervalo de confianza del 90% para la
diferencia entre las medias de la población de los dos sitios, suponiendo que las poblaciones se distribuyen de forma
aproximadamente normal y que tienen varianzas iguales.
2 2
Datos: 𝑛1 − 1 𝑆1 + 𝑛 2 − 1 𝑆2
𝑆𝑝2 =
𝑥ҧ 1 = 3.11 𝑛1 + 𝑛2 − 2
𝑥ҧ 2 = 2.04 𝑋ത1 − 𝑋ത2 = 3.11 − 2.04 = 1.07
11 (0.771 2) + (9)(0.4482)
S1 = 0.771
𝑆𝑝2 = = 0.42
S2 = 0.448 12 + 10 − 2
n1 =12
n2 =10
𝑆𝑝2 = 0.42
= 0.1 =0.05
t0.05=1.725 1 1 1 1
g.l.=20 𝑋ത1 − 𝑋ത2 − 𝑡𝛼ൗ 𝑆𝑝 + ത ത
< 𝜇1 − 𝜇2 < 𝑋1 − 𝑋2 + 𝑡𝛼ൗ 𝑆𝑝 +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
estimación puntual de μ1 – μ2 es
Una sola muestra: estimación de la varianza
Datos:
n=51
S2=12
=0.05
Ns=95%
𝑋𝛼2Τ2 =71.4202
2
𝑋1− 𝛼Τ =32.3574
2
(51-1)(12)/71.4202 2 (51-1)(12)/32.3574
g.l.=n-1=50
8.4 2 18.5