2 Hipotesis
2 Hipotesis
2 Hipotesis
PRUEBAS DE HIPÓTESIS
x 20.75 20
z 1.875
0.4
n
con esta abscisa, se calcula la probabilidad (área hacia la derecha), resultando 0.0304.
Gráficamente:
Este gráfico está hecho sobre valores reales, no normalizados. Para los cálculo se
usan estos últimos cuando se trabaja con tablas.
Supóngase ahora que la media real del tiempo de secado es =21 min. Luego, la
probabilidad de obtener una media muestral menor o igual que 20.75 (y por lo tanto
equivocarse en la aceptación) está dada por:
______________________________________________________________________ 1
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
1 – Se formula una Hipótesis Nula simple y una Hipótesis Alterna apropiada que se
acepta cuando la Hipótesis Nula debe ser rechazada.
______________________________________________________________________ 2
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
4 – Se calcula, a partir de los datos, el valor del estadístico sobre el cual se basa la
decisión.
______________________________________________________________________ 3
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
Por otro lado, será tal que el área bajo la normal a su derecha sea /2 y
será tal que el área bajo la normal a su izquierda sea /2. Estos dos valores
definen las zonas de aceptación y rechazo de la Hipótesis Nula. Según donde caiga el
valor de z calculado por la expresión anterior, se producirá la aceptación o rechazo.
4 – Cálculos:
1570 1600
z 2.5
120
100
5- Dado que –2.5 < -z0.025 se Rechaza la Hipótesis Nula, luego la duración media de los
tubos es significativamente menor que 1600 horas. Como se puede apreciar en el
siguiente gráfico, la media muestral cae fuera de la zona de aceptación:
Ejemplo II: Una empresa de transportes desconfía de la afirmación de que la vida útil
promedio de ciertos neumáticos es al menos de 28000. Para verificar se colocan 40
neumáticos en camiones y se obtiene una vida útil promedio de 27463 con una s=1348.
¿Qué se puede concluir con ese dato si la probabilidad de Error Tipo I es a lo sumo
0.01?.
______________________________________________________________________ 4
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
4 – Cálculos:
27463 28000
z 2.52
1348
40
5- Dado que –2.52 < -z0.01 se Rechaza la Hipótesis Nula, luego la vida útil de los
neumáticos es significativamente menor que 28000. Como se puede apreciar en el
siguiente gráfico, la media muestral cae fuera de la zona de aceptación:
4 – Cálculos:
______________________________________________________________________ 5
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
1070 1120
t 1.131
125
8
5- Dado que –1.131 > -t0.05 se Acepta la Hipótesis Nula, luego la vida útil de los
neumáticos es significativamente igual a 1120 horas. Como se puede apreciar en el
siguiente gráfico, la media muestral cae dentro de la zona de aceptación:
Hasta el momento no se han atendido a los Errores Tipo II. La elección de =21
min en el tiempo de secado fue arbitraria. Veremos qué sucede con otros valores de .
L() será la probabilidad de aceptar la Hipótesis Nula ( > o, cola derecha),
aún siendo la media =21, para distintos valores de . Rescatando el ejemplo de la
pintura, en que o = 20, = 2.4 y n=36 y la línea divisoria del criterio en = 20.75
min, se verifica:
______________________________________________________________________ 6
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
y así siguiendo.
Así se puede construir una tabla como la siguiente
¨ ¨ Probabilidad de
Valor de Valor de z Aceptar la Ho
L(
19.50 3.125 0.999
19.75 2.5 0.99
20.00 1.875 0.97
20.25 1.25 0.89
20.50 0.625 0.73
20.75 0 0.50
21.00 -0.625 0.27
21.25 -1.25 0.11
21.50 -1.875 0.03
21.75 -2.5 0.01
22.00 -3.125 0.001
______________________________________________________________________ 7
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
Si la hipótesis alterna fuese la contraria ( < o, cola izquierda) con los datos
o = 20 , = 2.4, n=36, y la línea divisoria de criterio en = 19.25, se verifica:
19.50 19.75
para =19.50 z 0.625 L 0.73
0.4
y así siguiendo.
Esto lleva a la siguiente tabla:
¨ ¨ Probabilidad de
Valor de Valor de z Aceptar la Ho
L(
18.50 -1.875 0.03
18.75 -1.25 0.11
19.00 -0.625 0.27
19.25 0 0.5
19.50 0.625 0.73
19.75 1.25 0.89
20.00 1.875 0.97
20.25 2.5 0.99
20.50 3.125 0.999
______________________________________________________________________ 8
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
Se puede apreciar que los mismos son la imagen del espejo uno de otro.
Si la hipótesis alterna fuese <> o, bilateral, o de dos colas, con los
datos o = 20 , = 2.4, n=36, y las línea divisorias del criterio entre = 19.25 min y
= 20.75 min, se verifica:
19.25 19 20.75 19
para =19 z1 0.625 z2 4.375
0.4 0.4
L 0.27
¨ ¨ Probabilidad de
Valor de Valor de z Aceptar la Ho
L(
18.50 1.875 0.03
18.75 1.25 0.11
19.00 0.625 0.27
19.25 0 0.5
19.50 -0.625 0.73
______________________________________________________________________ 9
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
y así siguiendo.
Esto lleva a la siguiente tabla:
¨ ¨ Probabilidad de
Valor de Valor de z Aceptar la Ho
L(
18.50 -1.875 0.03
18.75 -1.25 0.11
19.00 -0.625 0.27
19.25 0 0.5
19.50 0.625 0.73
19.75 1.25 0.89
20.00 1.875 0.97
20.25 2.5 0.99
20.50 3.125 0.999
______________________________________________________________________ 10
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
Se puede apreciar que los mismos son la imagen del espejo uno de otro.
Si la hipótesis alterna fuese <> o, bilateral, o de dos colas, con los datos o =
20 , = 2.4, n=36, y las línea divisorias del criterio entre = 19.25 min y
= 20.75 min, se verifica:
19.25 19
para =19.00 z 0.625 L 0.27
0.4
¨ Probabilidad de
Valor de Valor de z1 Valor de z2 Aceptar la Ho
L(
18.50 1.875 5.625 0.03
18.75 1.25 5 0.106
19.00 0.625 4.375 0.27
19.25 0 3.75 0.5
19.50 -0.625 3.125 0.733
19.75 -1.25 2.5 0.88
20.00 -1.875 1.875 0.939
20.25 -2.5 1.25 0.88
______________________________________________________________________ 11
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
Volviendo al caso testigo de las pinturas, se analizará qué ocurre con L()
cuando la muestra es más grande, como por ejemplo n=50 (antes n=36), con los datos
o = 20 , = 2.4, y las línea divisorias del criterio = 20.75 min, se verifica:
19.25 19 20.75 19
para =19 z1 0.625 z2 4.375
0.4 0.4
L 0.27
y así siguiendo.
Esto lleva a la siguiente tabla:
¨ ¨ Probabilidad de
Valor de Valor de z Aceptar la Ho
L(
19.50 3.683 1
19.75 2.946 0.998
20.00 2.21 0.986
20.25 1.473 0.93
20.50 0.737 0.769
20.75 0 0.50
21.00 -0.737 0.231
21.25 -1.473 0.07
21.50 -2.21 0.014
21.75 -2.946 0.0016
22.00 -3.683 0
______________________________________________________________________ 12
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
______________________________________________________________________ 13
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
1.65d n
( d n) 0.5
1
2
exp 0.5 x dx
2
0
El siguiente segmento de programa en Matlab permite trazar las curvas de
operación para tres tamaños muestrales: 1, 5 y 10:
function curvas_ope
>> curvas_ope
______________________________________________________________________ 14
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
Para pruebas de cola izquierda, los gráficos son la "imagen del espejo" de los
anteriores, con lo cual (para generalizar) se usa como abscisa el valor absoluto de d,
sirviendo entonces el juego de curvas para ambas pruebas.
Para pruebas de dos colas:
Se puede verificar que el error tipo II, en este caso, sigue la siguiente función
(considerando como siempre =0.05 y por lo tanto /2=0.025, con z=1.96):
1.96d n 1.96d n
exp 0.5 x dx dx
1 1
( d n)
2 2
exp 0.5 x
2 2
0 0
En la literatura, se han hecho gráficos para calcular mediante ellos el error tipo II
para distintos valores de d, usando el tamaño muestral (n) como parámetro y con valores
de nivel de significancia de 0.01 y 0.05, para muestras de una cola y de dos colas.
El siguiente segmento de programa en Matlab permite el mismo cálculo que el
que se haría con los gráficos.
______________________________________________________________________ 15
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
function beta=error_II(cola,alfa,mu0,mu,sigma,n)
>> error_ii(1,0.05,75.2,77,3.6,15)
donde el primer argumento indica que es una prueba de una cola (1), el segundo es
(0.05), el tercero (75.2), el cuarto (75.2), el quinto (3.6) y el sexto el tamaño
muestral, n (15). Resultando:
beta =
0.3873
______________________________________________________________________ 16
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
es decir:
luego:
______________________________________________________________________ 17
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
este estadístico es aún válido para muestras grandes (n1 y n2 mayores que 30)
sustituyendo 1 y 2 por s1 y s2.
Las regiones críticas para probar la hipótesis nula 1-2= son para poblaciones
normales con 1 y 2 conocidas o grandes muestras.
4 – Cálculos:
5- Dado que 2.65 > z0.05 se Rechaza la Hipótesis Nula, por lo tanto se acepta la
Hipótesis Alternativa, esto es se refrenda la afirmación 12 > 0.050. Vale decir, la
aleación reduce significativamente en más de 0.050 ohms la resistencia del conductor
Ejemplo II: La estatura media de 50 estudiantes de un colegio que tomaban parte en las
pruebas atléticas fue de 1.70 mts con desviación estándar de 0.0625 mts, mientras que
50 estudiantes que no mostraban interés en tal participación tenían una estatura media
______________________________________________________________________ 18
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
de 1.687 mts con desviación estándar de 0.07 mts. Ensayar la hipótesis de que los
estudiantes que participan en pruebas atléticas son más altos que los otros, con un nivel
de significancia de 0.05.
4 – Cálculos:
1.70 1.687
z 0.98
2 2
0.0625 0.007
50 50
5- Dado que 0.98 < z0.05 se Acepta la Hipótesis Nula 12 = 0. Vale decir, los
estudiantes que participan en pruebas atléticas no son significativamente más altos que
los otros
Si se deben correr riesgos de Error Tipo II, en los cuales las probabilidades
dependen de las diferencias alternas reales ‘12 , se pueden usar las curvas
característica de operación con :
´
d
1 2 2 2
Ejemplo III: Con respecto al ejemplo anterior ¿Cuál es la probabilidad de cometer un
Error Tipo II para ‘=0.02 mts.?
0 0.02
d 0.213
2 2
( 0.0625) ( 0.07)
dado que = 0.05 y n = 50, trabajando con la tabla correspondiente o ejecutando la
función error_II de Matlab definida previamente:
>> mu0=0;mu=0.02;sigma=sqrt(0.0625^2+0.07^2);n=50;error_II(1,0.05,mu0,mu,sigma,n)
se obtiene:
______________________________________________________________________ 19
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
ans =
0.5549
1 2 2 2
n
1 2 2 2
n1 n2
Cuando n1 , n2 o ambos son pequeños y se desconocen las varianzas de las
poblaciones, se puede fundamentar la hipótesis nula 1-2 = en un estadístico
adecuado t, con tal de suponer a ambas poblaciones normales con 1= 2 (=). En estas
condiciones:
con 2 estimado por ponderación de las sumas de los cuadrados con respecto a las
media muestrales:
n1 2 n2 2
x1i x1
x2i x2
2 i 1 i 1 n1 1 s12 n2 1 s22
n1 n2 2 n1 n2 2
______________________________________________________________________ 20
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
5- Dado que 1.849 > t0.05 (t = 1.717) se Rechaza la Hipótesis Nula 12 = 0. Vale
decir, hay un incremento significativo en la producción de trigo por el empleo del
fertilizante.
Ejemplo: Los siguientes datos son las horas-hombre que se pierden semanalmente en
promedio por accidentes en 10 plantas industriales antes y después de implantar un
cierto programa de seguridad:
45 y 36 73 y 60 46 y 44 124 y 119 33 y 35
57 y 51 83 y 77 34 y 29 26 y 24 17 y 11
9 13 2 5 2 6 6 5 2 6
x 5.2
10
______________________________________________________________________ 21
Cátedra Estadística Aplicada II
Universidad de Mendoza Ing. Jesús Rubén Azor Montoya
s
92 132 22 52 22 62 62 52 22 62 10 5.22 4.077
9
5.2 0
t 4.033
4.077
10
5- Dado que 4.033 > t0.05 (t = 1.833) se Rechaza la Hipótesis Nula = 0. Vale decir,
el sistema de seguridad es eficaz.
Esta prueba t se conoce como “Prueba t para Muestras Apareadas”.
______________________________________________________________________ 22
Cátedra Estadística Aplicada II