03 Estimacion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 44

Universidad Autónoma de Sinaloa

Facultad de Ciencias Químico Biológicas


QUÍMICO FARMACEÚTICO BIÓLOGO

BIOESTADÍSTICA
Estimación y pruebas de hipótesis

MC. Víctor Limón Valenzuela

Culiacán de Rosales, Sinaloa; a Mayo de 2021


La inferencia estadística es el procedimiento por medio del cual se llega a inferencias
acerca de una población con base en los resultados obtenidos de una muestra
extraída de esa población.

Estimación
Cualquier inferencia que se haga sobre la población tendrá que basarse
necesariamente en estadísticos muestrales, es decir en función de la información
muestral.- La elección apropiada de estos estadísticos dependerá de cual sea el
parámetro de interés de la población.- El verdadero parámetro será desconocido y un
objetivo será estimar su valor.-
Estimación de Parámetros

«En estadística se refiere a los valores o medidas que caracterizan a una población como,
¿Qué son los por ejemplo, la media y la desviación típica de una población (…) Son cantidades
parámetros? indeterminadas, constantes o fijas respecto a una condición o situación, que caracterizan
a un fenómeno en un momento dado que ocurre en una población» (Sierra Bravo, 1991).

¿Qué son los Se contrapone al parámetro porque es un valor que se obtiene a partir de los
Estadísticos? valores muéstrales. Se pueden obtener media y varianzas muéstrales.

«En estadística es la operación mediante la cual se trata de


¿Qué es la
determinar el valor del parámetro, utilizando datos incompletos
Estimación? procedentes de una muestra (Estadístico)

Estadístico Parámetro
Estimación

Estimaciones Estimaciones de
puntuales Intervalo
ESTIMACIÓN PUNTUAL

Estimación.

El objetivo es “estimar” el valor de parámetros


poblacionales de una v.a. , a partir de una
muestra x1,…,xn

Población
μ, σ, …

Muestra
Parámetro poblacional Estimador
Media x X

Variancia ²x S²x

Desviación estándar x sx

Proporción P p
Veamos un ejemplo.-

Las ganancias por acciones de una muestra de 10 valores de la Bolsa de Buenos


Aires en un día particular fueron:

10 16 5 10 12 8 4 6 5 4

Hallar estimaciones puntuales para los siguientes parámetros poblacionales; media,


variancia, desvío estándar y la proporción para los que la ganancia por acción fue
mayor que 8,5.-
Entonces:
Nº Xi X²
1 10 100
2 16 256
3 5 25
4 10 100
5 12 144
6 8 64
7 4 16
8 6 36
9 5 25
10 4 16
Total 80 782
Tenemos que:
n = 10  Xi = 80  X² = 782

Por lo tanto la media muestral es


 xi 80
X = ------------ = ------------ = 8.0
n 10

Que es nuestra estimación de la media poblacional.-

Una estimación de la variancia poblacional será:

 x² - n X² 782 - 10 * 64
S² = ---------------------------- = --------------------------- = 15.7
n - 1 9
Para la desviación estándar la estimación puntual será

Sx =  S² = 15,78 = 3.97
Finalmente, en la muestra, el número de valores para los
cuales la ganancia por acción es mayor que 8,5 son
cuatro.- Por lo tanto nuestra estimación puntual de la
proporción poblacional es:

x 4
p = = = 0.40
n 10
Número de personas que entraron a salud digna a realizarse análisis de sangre de 7-8 hrs.
en los últimos cuatro meses.
Encontrar las estimaciones puntuales de la media y la desviación estandar de la población.
De igual manera encontrar la proporción cuando el número de personas fue mayor a 325.
X ത
(X-𝑋) ത2
(X-𝑋)
242 -54.81 3004.136
𝑛 = 16 245 -51.81 2684.276 N

269 -27.81 773.4 𝑋ത = x


i 1
i
𝑋ത =
4749
= 296.81
275 -21.81 475.68 n
16
276 -20.81 433.06
279 -17.81 317.2 19408.437
289 -7.81 61 𝜎= = 35.97
290 -6.81 46.38 15
294 -2.81 7.9
302 5.19 26.94 𝑥 3
305 8.19 67.08 𝑃ത = = = 0.1875
306 9.19 84.46
𝑛 16
322 25.19 634.54
18.75 % de las semanas
328 31.19 672.82
por mes fue mayor a 325
342 45.19 2042.136
385 88.19 7777.476
4749 19408.437
Propiedades de un estimador
- Sólo un valor numérico sirva para estimar el parámetro, es decir, asigna directamente al
parámetro el valor obtenido para el estadístico

- Constituye la inferencia más simple que se puede realizar: asignar al parámetro el valor del
estadístico que mejor sirva para estimarlo.

a) Carencia de Sesgo: Un estimador será insesgado si su valor


esperado coincide con el del parámetro a estimar

b) Consistencia: Un estimador será consistente si, conforme


Condiciones para ser aumenta el tamaño muestral, su valor se va aproximando al del
un buen estimador parámetro

c) Eficiencia: Dados dos posibles estimadores, diremos que el


primero es un estimador más eficiente que el segundo si se
cumple que el primer estimador tiene una varianza menor que
el segundo.

d) Suficiencia: Un estimador será suficiente si utiliza toda la


información muestral disponible
DIFERENCIA ENTRE ESTIMACIÓN PUNTUAL Y ESTIMACIÓN POR INTERVALO

• La estimación puntual consiste en utilizar un solo valor para estimar el


parámetro
Ejemplo: Se estima que los jóvenes en edad escolar en pandemia, pasan en la
televisión en promedio 8 hrs del día.”

• La estimación por intervalo se utiliza un rango de valores o intervalo


Ejemplo: “Se estima con una confianza del 90%, de estar en lo correcto al afirmar
que los jóvenes en edad escolar en pandemia, pasan en la televisión en promedio
8 hrs del día.”
Estimación de Intervalos
Ejemplo: Construcción repetida de un intervalo de confianza
para la media muestral:

Si los intervalos de confianza mostrados son del 95% significa que si se construye un
gran número de ellos, el 95% de ellos contendrá a la media
Mayor confianza requiere IC más anchos
Un tamaño de muestra más grande resulta en un IC más angosto (Se necesita
aumentar la muestra 4 veces para reducir la longitud del IC a la mitad)
En muestras grandes, la media muestral tiene aproximadamente una
distribución normal con media  y error estándar
Estimación de Intervalos

En la práctica se obtiene solamente una muestra y se calcula con ella


un intervalo de confianza dicho intervalo contiene o no contiene a m,
no es razonable asignar una probabilidad a este evento.

La proposición a decuada es que el intervalo contiene a m “con una


confianza” del 95%

La longitud del intervalo de confianza (u-l) es una medida de la calidad de la


información obtenida en la muestra, al semi intervalo u-q, o q-l se le llama
Precisión del estimador.

¿Qué significado tiene un intervalo grande?


¿És deseable que sea grande o que sea pequeño?
¿Qué relación tiene con el valor de 1-a?
-Estimación de la media poblacional con desviación poblacional conocida
-Estimación de la media poblacional con desviación poblacional desconocida
-Estimación de la diferencia de medias poblacionales con desviaciones poblacionales conocidas
-Estimación de la diferencia de medias poblacionales con desviaciones poblacionales desconocidas
-Estimación de la proporción poblacional
-Estimación de la diferencia de proporciones poblacionales
-Estimación de la varianza o desviación poblacional
Estimación de Intervalos
Intervalo para la Media (Varianza conocida)

Situación: Se tiene una población con media desconocida m, pero se supone


conocida la varianza s2.

Se toma una muestra aleatoria (X1,X2,...,XN). Con esta muestra se calcula el estadístico
el cual es un estimador puntual insesgado para la media m desconocida. Se puede
obtener un intervalo de confianza del 100(1-) % para m si consideramos los
siguientes hechos acerca de la distribución de :
Intervalo para la media
Intervalo para la Media (Varianza conocida)
1. Si la población es Normal, la distribución de es Normal

2. Si la población no es Normal, el Teorema del límite central nos garantiza una


distribución de aproximadamente normal cuando N 

3. La media de es m ( es insesgado)

4. La varianza de es s2/n

Teorema del Límite Central:


Afirma que la media muestral tiene una distribución Normal aunque la población
original no la tenga, siempre y cuando la muestra sea muy grande (de manera
práctica n>30)
Intervalo para la media
Intervalo para la Media (Varianza conocida)
De acuerdo a lo anterior, podemos suponer que la variable

___

Z X μ
Tiene una distribución N(0,1) σ/ N

/2 /2

-z/2 z/2 Z

de la figura: P{-z/2  Z  z/2 }=1-.


Con lo cual el intervalo de confianza del 100(1-)% para la media es

__ __

xz α/2σ/ N  μ  x  z α/2σ/ N


Número de personas que entraron a salud digna a realizarse análisis de sangre de 7-8 hrs.
en los últimos cuatro meses.
Encontrar las estimaciones puntuales de la media y la desviación estandar de la población.
De igual manera encontrar la proporción cuando el número de personas fue mayor a 325.
X ത
(X-𝑋) ത2
(X-𝑋)
242 -54.81 3004.136
245 -51.81 2684.276 N

269 -27.81 773.4 𝑋ത = x


i 1
i
𝑋ത =
4749
= 296.81
275 -21.81 475.68 n
16
276 -20.81 433.06
279 -17.81 317.2 19408.437
289 -7.81 61 𝜎= = 35.97
290 -6.81 46.38 15
294 -2.81 7.9
302 5.19 26.94 𝑥 3
305 8.19 67.08 𝑃ത = = = 0.1875
306 9.19 84.46
𝑛 16
322 25.19 634.54
18.75 % de las semanas
328 31.19 672.82
por mes fue mayor a 325
342 45.19 2042.136
385 88.19 7777.476
4749 19408.437
Número de personas que entraron a salud digna a realizarse análisis de sangre de 7-8 hrs.
en los últimos cuatro meses.
Encontrar las estimaciones puntuales de la media y la desviación estandar de la población.
De igual manera encontrar la proporción cuando el número de personas fue mayor a 325.
4749
𝑋ത = = 296.81 __ __
16
xz σ/ N  μ  x  z α/2σ/ N
α/2

19408.437
𝜎= = 35.97
15

𝛼
90% 𝑍 = = 1.65 296.81 − 𝑍𝛼 𝜎ൗ ≤ 𝑋ത ≤ 296.81 + 𝑍𝛼 𝜎ൗ 296.81 − (1.65)(
35.97
) ≤  ≤ 296.81 + (1.65)(
35.97
)
2 2 𝑛 2 𝑛 4 4

296.81 ± 14.84 𝐼𝐶 = 281.97 − 311.65 intervalo de confianza del 100(1-)%= 1-0.1=.90


𝛼
95% 𝑍 = = 1.96 296.81 − 𝑍𝛼 𝜎ൗ ≤ 𝑋ത ≤ 296.81 + 𝑍𝛼 𝜎ൗ 35.97 35.97
2 2 𝑛 2 𝑛 296.81 − (1.96)( ) ≤ 𝑋ത ≤ 296.81 + (1.96)( )
4 4
296.81 ± 17.62 𝐼𝐶 = 279.19 − 314.43 intervalo de confianza del 100(1- )%= 1-0.05=.95
𝛼
99% 𝑍 =
2
= 2.58 296.81 − 𝑍𝛼 𝜎ൗ ≤ 𝑋ത ≤ 296.81 + 𝑍𝛼 𝜎ൗ 296.81 − (2.58)(
35.97
)
35.97
≤ 𝑋ത ≤ 296.81 + (2.58)( 4 )
2 𝑛 2 𝑛 4
296.81 ± 23.20 𝐼𝐶 = 273.61 − 320.01 intervalo de confianza del 100(1- )%= 1-0.01=.95
Intervalo para la Media (Varianza conocida)

Una sola muestra: estimación de la media

Error en la estimacion de μ mediante x


El caso en que se desconoce σ
Mayor confianza requiere IC más anchos
Un tamaño de muestra más grande resulta en un IC más angosto (Se necesita
aumentar la muestra 4 veces para reducir la longitud del IC a la mitad)
En muestras grandes, la media muestral tiene aproximadamente una
distribución normal con media  y error estándar 
Distribución t para diferentes grados de libertad
INTERVALO DE PREDICCIÓN

𝑋ത − 𝑡𝛼ൗ 𝑆 1 + 1ൗ𝑛 < 𝑥0 < 𝑋ത + 𝑡𝛼ൗ 𝑆 1 + 1ൗ𝑛


2 2

𝑋ത + 𝑡𝛼ൗ 𝑆 1 + 1ൗ𝑛 𝑋ത − 𝑡𝛼ൗ 𝑆 1 + 1ൗ𝑛


2 2
Un inspector de alimentos seleccionó aleatoriamente 30 paquetes de carne de res 95%
magra. La muestra dio como resultado una media de 96.2% con una desviación estándar
muestral de 0.8%. Calcule un intervalo de confianza del 99% para la media. Suponga
normalidad.

Datos: (100-)= 99%= 100-0.01


n=30
g.l.=29
Media= 𝑋ത = 96.2%
DE 𝑆 = 0.8%
t0.005= 2.756
=0.01 0.8 0.8
96.2 − (2.756)(5.47)  96.2 + (2.756))(5.47)

96.2 − 0.4  96.2 + 0.4)

IC=95.8-96.6
INTERVALO DE PREDICCIÓN-Para una media con varianza poblacional desconocida

Un inspector de alimentos seleccionó aleatoriamente 30 paquetes de carne de res 95%


magra. La muestra dio como resultado una media de 96.2% con una desviación estándar
muestral de 0.8%. Calcule un intervalo de predicción del 99% para la condición baja en
grasa de un paquete nuevo. Suponga normalidad.
Para:
g.l. = 29
t0.005 = 2.756.
Por lo tanto, un intervalo de predicción del 99% para una observación nueva x0 es

𝑋ത − 𝑡𝛼ൗ 𝑆 1 + 1ൗ𝑛 < 𝑥0 < 𝑋ത + 𝑡𝛼ൗ 𝑆 1 + 1ൗ𝑛


2 2

1 1
96.2 − (2.756)(0.8) 1 + ≤ 𝑥0 ≤ 96.2 + (2.756)(0.8) 1 +
30 30

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑝𝑟𝑒𝑑𝑖𝑐𝑐𝑖ó𝑛 (𝐼𝑃) = 93.96 − 98.44


Una sola muestra: estimación de una proporción

Limite del teorema central


INTERVALO DE CONFIANZA DE UNA PROPORCIÓN
En una muestra aleatoria de n = 500 familias que tienen televisores en la ciudad
de Hamilton, Canadá, se encuentra que x = 340 están suscritas a HBO. Calcule un
intervalo de confianza del 95% para la proporción real de familias que tienen
televisores en esta ciudad y están suscritas a HBO.
Método 1. 𝑥 340
𝑃ത = = = 0.68
Datos 𝑛 500
n=500

𝑃=(340/500)=0.68
𝑞ො = 1 − 𝑝=0.32
Ƹ 𝑝Ƹ 𝑞ො 𝑝Ƹ 𝑞ො
𝑃෠ − 𝑍𝛼ൗ ෠
< 𝑥0 < 𝑃 + 𝑍𝛼ൗ
NS==0.05 2 𝑛 2 𝑛
Z0.025= 1.96

𝐼𝐶 = 0.68 ± 0.021
IC= 0.6891-0.7209
Método 2.

IC= 0.6786 ± 0.0408


IC= 0.6786 < 𝑃෠ <± 0.0408
IC= 0.6786 ± 0.0408
97% de nivel de confianza

0.08 0.09

0.01 0.0007
0.0001

Z= 1.8814

0.9699 0.9706
DOS MUESTRAS:
ESTIMACIÓN DE LA DIFERENCIA ENTRE DOS MEDIAS
DIFERENCIA DE DOS MEDIAS 1-2 CON 1 y 2 CONOCIDAS

𝑋ത1 − 𝑋ത2
𝑍=
𝜎12 𝜎22
+
𝑛1 𝑛2

𝜎12 𝜎22 𝜎12 𝜎22


𝑋ത1 − 𝑋ത2 − 𝑍𝛼ൗ + < 𝜇1 − 𝜇2 < 𝑋ത1 − 𝑋ത2 + 𝑍𝛼ൗ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
El ingreso medio familiar de una muestra de 75 pacientes admitidos a un hospital A fue de 𝑥ҧ 1 = $6, 800.00,
mientras que el promedio basado en una muestra de 80 pacientes de un hospital B se encontró como 𝑥ҧ 2 =
$4, 450.00. Si las desviaciones estándar de las poblaciones son 𝜎1 = $600.00 y 𝜎2 = $500.00 encuentre el
intervalo de confianza del 99 por ciento para 𝜇1 − 𝜇2 , la diferencia entre las medias de ambas poblaciones
Datos:
𝑛1 = 75
𝑛2 = 80
𝑥ҧ 1 = $6, 800.00
𝑥ҧ 2 = $4, 450.00
𝜎1 = $600.00
𝜎2 = $500.00
Estimador 𝜇1 − 𝜇2 = 𝑥ҧ 1 − 𝑥ҧ 2
𝑍𝛼Τ2 = 𝑍0.005 = 2.58 2 2 2 2
𝜎1 𝜎2 𝜎1 𝜎2
𝑋ത1 − 𝑋ത2 − 𝑍𝛼ൗ + ത ത
< 𝜇1 − 𝜇2 < 𝑋1 − 𝑋2 + 𝑍𝛼ൗ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

360000 250000 360000 250000


6800 − 4450 − 2.58 + < 𝜇1 − 𝜇2 < 6800 − 4450 − 2.58 +
75 80 75 80

2,350 − 229.68 < 𝜇1 − 𝜇2 < 2,350 + 229.68

2,120.32 < 𝜇1 − 𝜇2 < 2,579.68


Se llevó a cabo un experimento donde se compararon dos tipos de motores, el A y el B. Se midió el rendimiento de
combustible en millas por galón. Se realizaron 50 experimentos con el motor tipo A y 75 con el motor tipo B. La
gasolina utilizada y las demás condiciones se mantuvieron constantes. El rendimiento promedio de gasolina para el
motor A fue de 36 millas por galón y el promedio para el motor B fue de 42 millas por galón. Calcule un intervalo de
confianza del 96% sobre μB – μA, donde μA y μB corresponden a la media de la población del rendimiento de millas
por galón para los motores A y B, respectivamente. Suponga que las desviaciones estándar de la población son 6 y 8
para los motores A y B, respectivamente.

𝜎𝐵2 𝜎𝐴2 𝜎𝐵2 𝜎𝐴2


𝑋ത𝐵 − 𝑋ത𝐴 − 𝑍𝛼ൗ + < 𝜇𝐵 − 𝜇𝐴 < 𝑋ത𝐵 − 𝑋ത𝐴 + 𝑍𝛼ൗ +
2 𝑛𝐵 𝑛𝐴 2 𝑛𝐵 𝑛𝐴

64 36 64 36
6 − 2.06 + < 𝜇𝐵 − 𝜇𝐴 < 6 + 2.06 +
Datos: 76 50 76 50
μA = 36
μB = 42 6 − 2.06 0.842 + 0.72 < 𝜇𝐵 − 𝜇𝐴 < 6 + 2.06 0.882 + 0.72
 = 0.04
Z0.02=2.06 6 − 2.06(1.25) < 𝜇𝐵 − 𝜇𝐴 < 6 + 2.06(1.25)

6 − 2.575 < 𝜇𝐵 − 𝜇𝐴 < 6 + 2.575


INTERVALO CON NIVEL DE CONFIANZA DE 96% = 3.42-8.57
VARIANZAS DESCONOCIDAS PERO IGUALES
Estimado agrupado de la varianza
2 2
2
𝑛1 − 1 𝑆1 + 𝑛 2 − 1 𝑆2
𝑆𝑝 =
𝑛1 + 𝑛2 − 2

Intervalo de confianza para 𝝁𝟏 − 𝝁𝟐 , 𝟐𝟏 = 𝟐𝟐 cuando se desconocen ambas varianzas.

1 1 1 1
𝑋ത1 − 𝑋ത2 − 𝑡𝛼ൗ 𝑆𝑝 + ത ത
< 𝜇1 − 𝜇2 < 𝑋1 − 𝑋2 + 𝑡𝛼ൗ 𝑆𝑝 +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Se eligieron 2 estaciones de muestreo independientes para este estudio: una que se localiza corriente abajo del punto de
descarga ácida de la mina y la otra ubicada corriente arriba. Para 12 muestras mensuales reunidas en la estación
corriente abajo el índice de diversidad de especies tuvo un valor medio deX1 = 3.11 y una desviación estándar de S1 =
0.771; mientras que 10 muestras reunidas mensualmente en la estación corriente arriba tuvieron un valor medio del
índice X2 = 2.04 y una desviación estándar de S2 = 0.448. Calculemos un intervalo de confianza del 90% para la
diferencia entre las medias de la población de los dos sitios, suponiendo que las poblaciones se distribuyen de forma
aproximadamente normal y que tienen varianzas iguales.
2 2
Datos: 𝑛1 − 1 𝑆1 + 𝑛 2 − 1 𝑆2
𝑆𝑝2 =
𝑥ҧ 1 = 3.11 𝑛1 + 𝑛2 − 2
𝑥ҧ 2 = 2.04 𝑋ത1 − 𝑋ത2 = 3.11 − 2.04 = 1.07
11 (0.771 2) + (9)(0.4482)
S1 = 0.771
𝑆𝑝2 = = 0.42
S2 = 0.448 12 + 10 − 2
n1 =12
n2 =10
𝑆𝑝2 = 0.42
 = 0.1 =0.05
t0.05=1.725 1 1 1 1
g.l.=20 𝑋ത1 − 𝑋ത2 − 𝑡𝛼ൗ 𝑆𝑝 + ത ത
< 𝜇1 − 𝜇2 < 𝑋1 − 𝑋2 + 𝑡𝛼ൗ 𝑆𝑝 +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

1.07 − 1.725(.65)(0.428) < 𝜇1 − 𝜇2 < 1.07 + 1.725(.65)(0.428)

0.59 < 𝜇1 − 𝜇2 < 1.55


Varianzas desconocidas y distintas
Intervalo de confianza para μ1 – μ2, σ1 ≠ σ2 y ambas varianzas se desconocen

𝑆12 𝑆22 𝑆12 𝑆22


𝑋ത1 − 𝑋ത2 − 𝑡𝛼ൗ + < 𝜇1 − 𝜇2 < 𝑋ത1 − 𝑋ത2 + 𝑡𝛼ൗ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2

estimación puntual de μ1 – μ2 es
Una sola muestra: estimación de la varianza

Intervalo de confianza para σ2


A cada uno de los miembros de una muestra de 51 estudiantes de enfermería se le hizo una
prueba estandarizada para medir su nivel de responsabilidad. Se obtuvo un valor de S2 =12.
Construya los intervalos de confianza del 95 por ciento para 2 y .

Datos:
n=51
S2=12
=0.05
Ns=95%
𝑋𝛼2Τ2 =71.4202
2
𝑋1− 𝛼Τ =32.3574
2
(51-1)(12)/71.4202  2 (51-1)(12)/32.3574
g.l.=n-1=50

8.4  2  18.5

También podría gustarte