Pruebas de Hipotesis Completo
Pruebas de Hipotesis Completo
Pruebas de Hipotesis Completo
Pruebas de Hipótesis
Problemas de Pruebas de Hipótesis:
• Conocer si después de capacitar a un grupo de empleados
sobre el manejo de un equipo, el nivel de destreza se ha
incrementado.
• Determinar si la disminución de impuestos reduce el fraude
fiscal.
• Verificar si la variabilidad de los tiempos de atención es
menos de una desviación estándar.
• Invertir si la aceptabilidad de un producto en la población está
por encima del nivel deseado.
En general
El error tipo I: se comete cuando se rechaza una hipótesis nula que realmente es cierta.
El error tipo II: se comete cuando se acepta una hipótesis nula que realmente es falsa.
Como uno puede elegir los valores críticos del intervalo de aceptación
uno controla el valor de α. Uno puede entonces controlar la
probabilidad de rechazar de manera errónea H0.
Por esto en lugar de decir “se acepta H0” se prefiere decir “incapaz de
rechazar H0”, es decir, no se ha encontrado evidencia suficiente
para rechazar H0. O sea, no quiere decir que exista gran evidencia de
que H0 sea cierta sino que no hay gran evidencia de que sea falsa.
Ejemplo
Ejemplo
Ejemplo
Etapas de un Contraste de Hipótesis
1. Formulación de las hipótesis.
2. Se fija el nivel α de significación, o máximo error tipo I dispuestos a
admitir.
3. Estadístico de prueba. Se basa al conocimiento de la distribución
poblacional, los parámetros y el tamaño muestral.
4. Regla de decisión. Decidiremos cual es el valor crítico que limita la zona
de aceptación y de rechazo.
5. Decisión. Comparación de los datos experimentales con el valor crítico.
Prueba Estadística:
x − µo
Población ⇒ Z = ~ N(0, 1)
σ
Normal
n
Decisión:
Si Zcal < -Zα entonces Si |Zcal |>Zα/2 entonces Si Zcal >Zα entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Prueba de hipótesis usando “P-values”
Ejemplo
Si Ha: µ >µo, entonces P-value = Prob (Z>Zcalc).
Si Ha: µ <µo, entonces P-value = Prob (Z<Zcalc).
Si Ha: µ ≠ µo, entonces P-value = 2Prob (Z>|Zcalc|).
a) El peor error que se puede cometer es, en este caso, suponer que el
proceso está fuera de control cuando en realidad no lo está, por los
costos de recalibramiento de la máquina. Además, observemos que se
juzga fuera de control cuando hay diferencia por defecto o exceso
respecto a las 20 onzas y por lo tanto el test debe ser bilateral:
One-Sample Z: Demanda
95%
Lower
Variable N Mean StDev SE Mean Bound Z P
Demanda 20 225.900 13.094 2.907 221.119 2.03 0.021
Interpretación:
El valor del “P-value” (el área a la derecha de 2.03) es .021 menor que el
nivel de significación α =0.05, por lo tanto; se rechaza la hipótesis nula y se
concluye de que sí hay evidencia estadística de que el nivel promedio de
demanda es mayor de 220. O sea los resultados apoyan lo que afirma el
empresario.
Prueba Estadística:
x − µo
Una muestra pequeña t = t se distribuye como una
(n < 30) tomada de la s t-student con n-1 g.l.
población normal
n
Si tcal < -tα entonces Si |tcal |>tα/2 entonces Si tcal >tα entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Ejemplo
3.1 0.9 2.8 4.3 0.6 1.4 5.8 9.9 6.3 10.4 5 11.5
Test of mu = 9 vs not = 9
One-Sample T: tiempo
Test of mu = 9 vs < 9
99%
Upper
Variable N Mean StDev SE Mean Bound T P
tiempo 12 5.16667 3.75967 1.08532 8.11666 -3.53 0.002
Interpretación:
El valor del “P-value” es .002 menor que el nivel de significación α=0.01,
por lo tanto; se rechaza la hipótesis nula y se concluye de que sí hay
evidencia estadística de que el tiempo promedio de atención es menor de 9.
El extremo superior del intervalo confianza de un solo lado empieza en
8.11666 que es menor que 9.
Potencia de un test.
Sea el contraste Ho:θ=θo H1:θ∈Ω. El contraste se realiza eligiendo una
medida de discrepancia y un nivel de significación α, con estos
elementos el problema queda totalmente establecido. Llamaremos
potencia de un contraste a la función:
Como último comentario diremos que los resultados son los esperados
dado que la función de potencia es mayor cuando μ está más lejos de 20.
Si está muy cerca de dicho valor el test no discrimina bien, aunque el
error en ese caso no es tan grave.
< α = 0.05
P −π
Z =
π (1 − π )
n
Decisión
Si Zcal <-Zα entonces Si |Zcal |>Zα / 2 entonces Si Zcal >Zα entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Ejemplo
En 1995 en una zona metropolitana, se reportó que dos de cada 5 personas
reunían el perfil del consumidor de cierto bien. En una encuesta reciente hecha
en 2005 a 1225 personas se encontró que 478 de ellos coincidían con dicho
perfil. ¿Piensa usted que existe evidencia para afirmar de que el perfil del
consumidor ha cambiado con respecto a 1995? Utilice γ = 0.90
Solución:
Hay que hallar un intervalo de confianza del 90% para la
proporción p, y probar la siguiente hipótesis:
( pˆ 1 − pˆ 2 ) − ( p1 − p2 )
Poblaciones de z= ∼ N (µ, σ2)
Bernoulli p1q1 p2 q2
independientes +
m n
X1 X2
Donde pˆ 1 = ˆ
p =
m , , q1 = 1-p1 y q2 = 1-p2 se distribuye aproximadamente
2
n
como una normal estándar cuando n y m son grandes tal que, mp̂1 y np̂ 2 son
mayores que 5.
36
Si la hipótesis nula Ho: p1 = p2 es cierta, entonces el estadístico mencionado
anteriormente se convierte en:
pˆ 1 − pˆ 2
z=
1 1
p q +
m n
X1 + X 2
donde, p es estimado por p = . Luego, las fórmulas para pruebas de
m+n
hipótesis serán como siguen:
37
Dócima para una diferencia de proporciones
Ha : p 1 < p2 Ha : p ≠ p
1 2 Ha : p > p 1 2
Prueba Estadística:
p1 − p 2
Z=
1 1
p(1 − p ) +
m n
Decisión:
Si Z cal < Z entonces
α Si Z < Z α / 2 o Z cal> Z1−α / 2
cal Si Z > Z1−α
cal
38
Ejemplo
Una profesora recrimina sistemáticamente a un colega suyo por el
nivel de exigencia, por lo que éste último le ofrece corregir por
separado los mismos exámenes, que se acaban de celebrar, y
comparar los porcentajes de alumnos que aprueban. Tras la
corrección, la profesora aprueba a 248 de los 400 alumnos mientras
que el segundo aprueba a 214.
a) ¿Qué concluiría usted a un nivel de significación del 5% ?
b) ¿Y al 10%?
39
Solución
Sean Xi = la v.a. que vale 1 si la profesora aprueba al i-ésimo alumno y 0 en
caso contrario; y Yi = la v.a. que vale 1 si el segundo profesor aprueba al i-
ésimo alumno y 0 en caso contrario. Para comprobar, entonces, si los niveles
de exigencia son distintos planteamos las hipótesis:
H0) pX = pY
H1) pX ≠ pY
recordemos que :
40
donde Hn y Kn son variables que dependen de n y de nivel α de la prueba.
41
Como buscamos que, de igual forma el test rechace, cuando pX > pY y
cuando pX < pY, las dos partes de la R.C. deben ser simétricas en
probabilidad, y dado que en este caso trabajamos con una distribución
simétrica como la normal, ello nos conduce a que Hn = – Kn. Entonces Kn
cumplirá que:
42
O equivalentemente:
F 6 5 11
M 8 13 21
total 14 18 32
Event = M
Escuela X N Sample p
privada 8 14 0.571429
pública 13 18 0.722222
45
Dócima para la Varianza Poblacional
Asumiendo que la población de donde se extrae la muestra se distribuye
normalmente se pueden hacer las siguientes hipótesis acerca de la varianza
poblacional:
Ha : σ2 < σ 2
0 Ha : σ2 ≠ σ 2
0 Ha : σ2 > σ 2
0
(n − 1) s
2
80 90 85 82 75 58 70 84
87 81 87 61 73 84 85 70
78 95 77 52
Equivalentemente a:
para su extremo derecho (el izquierdo en este caso es siempre cero) influye
a favor de su crecimiento n y S2, y en su decrecimiento
Prueba Estadística:
Fm-1, n-1:α
con m-1 g.l. en el numerador y n-1 g.l en el denominador
Decisión:
Si Fcal<Fα entonces Si Fcal<Fα/2 o Fcal >F1-α/2 Si Fcal>F1-α entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Ejemplo
Se espera que dos operadores produzcan, en promedio, el mismo número
de unidades terminadas en el mismo tiempo. Los siguientes datos son los
números de unidades terminadas para ambos trabajadores en una semana
de trabajo:
y como f4, 4, 0,95 = 6,38823, entonces 3,03571 < 6,38823, con lo que no
rechazamos H0 a un nivel de α = 0,05. Por lo tanto no existe evidencia
estadística suficiente para asumir que las varianzas son distintas al nivel
mencionado.
Ejemplo item ingresos empresa
Se trata de comparar la variabilidad 1 58.0 A
de ingresos por concepto de ventas
2 63.8 A
en dos empresas, los datos son:
3 64.2 B
4 70.4 A
5 76.7 B
6 64.1 B
7 72.1 B
8 62.5 B
9 69.4 A
10 61.5 A
11 61.7 A
12 62.3 A
13 68.9 B
14 68.9 A
Test for Equal Variances: ingresos versus empresa
empresa
Lev ene's Test
Test Statistic 0.30
P-Value 0.594
B
2 4 6 8 10 12 14 16
95% Bonferroni Confidence Intervals for StDevs
A
empresa
60 64 68 72 76
ingresos
( x − y ) − ( µ1 − µ 2 )
t=
1 1
sp +
m n
( m − 1) s 2
+ ( n − 1) s 2
s 2p = 1 2
m+n−2
b) Varianzas de las poblaciones no son iguales: (σ 12 ≠ σ 22 )
entonces se usa una prueba aproximada de t, donde el número de grados de
libertad es calculado aproximadamente. La prueba de t aproximada está dada
por:
x − y − (µ1 − µ 2 )
t=
s12 s22
+
m n
donde los grados de libertad (gl) son aproximados por la siguiente fórmula:
(c1 + c 2 ) 2
gl = 2
c1 c 22
+
m −1 n −1
s12 s 22
Con c1 = y c2 =
m n
Las pruebas de hipótesis son:
Caso I Caso II Caso III
Ho : µ1 = µ 2 Ho : µ1 = µ 2 Ho : µ1 = µ 2
Ha : µ1 < µ 2 Ha : µ1 ≠ µ 2 Ha : µ1 > µ 2
Prueba Estadística:
x−y x−y
t= t=
1 1
+ o s12 s 22
sp +
m n m n
Decisión:
Si t cal < − tα entonces Si t < tα / 2 o t cal > t1−α / 2 Si t cal > t1−α
cal
se rechaza Ho se rechaza Ho se rechaza Ho
Ejemplo
Se realizó un experimento para comparar el tiempo promedio requerido por
el cuerpo humano para absorber dos medicamentos, A y B. Suponga que el
tiempo necesario para que cada medicamento alcance un nivel específico
en el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a
doce personas para ensayar cada fármaco registrándose el tiempo en
minutos que tardó en alcanzar un nivel específico en la sangre. Calcule con
α = 0.05 si existe diferencia entre los tiempos promedio y obtenga el valor
de P. Suponga varianzas iguales.
Solución
Primero se pondrá a prueba el supuesto de varianzas iguales mediante una
prueba de hipótesis con α = 0.10.
Ejemplo
Solución
Dócima para muestras relacionadas
Caso I Caso II Caso III
Ho : µd = 0 Ho : µd = 0 Ho : µ d = 0
Ha : µd < 0 Ha : µd ≠ 0 Ha : µd > 0
Prueba Estadística:
d
t= se distribuye como una t de Student con n-1 gl.
sd
n
Decisión:
Si t<-tα entonces Si | t |>tα/2 entonces Si tcal >tα entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Ejemplo
Se ha evaluado el nivel de Estudiante Test 1 Test 2
conocimientos a un grupo de 1 13.2 14
estudiantes sobre un tema en 2 8.2 8.8
particular antes de una 3 10.9 11.2
capacitación. Las puntuaciones
4 14.3 14.2
varían entre un mínimo de 0 y un
5 10.7 11.8
máximo de 15. Pasados tres
meses después de la 6 6.6 6.4
( zα + z β ) 2 σ 2 ( zα / 2 + z β ) 2 σ 2
n= n=
( µ1 − µ 0 ) 2 ( µ1 − µ 0 ) 2
Donde:
81
82
f ( x / H1 : µ = µ1 ) f ( x / H o : µ = µo )
I I Zα
-Zα µ0
I I
Zβ
µ1 Zβ
83
84
Tamaño de muestra para la Comparación de
dos medias en muestras independientes
( zα + z β ) 2 (σ 12 + σ 22 )
n=
( µ 2 − µ1 ) 2
Donde:
85
Tamaño de muestra para la Comparación
de dos medias en muestras independientes:
86
Ejemplo
Deseamos utilizar un nuevo tipo Solución:
de publicidad y consideramos que
seria técnicamente eficaz si d = 150
lograse un aumento de las ventas
en 150 u.m. en promedio respecto S = 160
a la antigua publicidad. Por Zα = 1,645
estudios previos sabemos que la
desviación típica de las ventas Zβ = 1,282
que reciben la antigua publicidad
es de 160 u.m. Aceptamos un
2(1,645 + 1,282) 2 *160 2
riesgo de 0.05 y deseamos un
poder estadístico de 90% para
n=
detectar diferencias si es que
150 2
existen de lo que se afirma.
n = 20
87
Tamaño de muestra para probar una
proporción poblacional
n=
[Z α * po (1 − po ) + Z β * p (1 − p ) ]
2
( p − po ) 2
Donde:
88
Ejemplo
Sea X1, X2, ...., Xn una MAS c/r de una variable X~Bernoulli (p) elegida
para probar H0: p=0,49 contra H1: p=0,51. Usando la aproximación
normal, determinar n para que la probabilidad de ambos tipos de error
no supere 0,01.
Solución
Como debemos discriminar entre H0: p=0,49 contra H1: p=0,51, rechazaremos
H0.
Se nos pide calcular n, para que α y β sean menores o iguales a 0,01 y por lo
tanto se debe cumplir que:
89
90
91
Con las inecuaciones de a) y b) generamos un sistema:
92
Tamaño de muestra para la comparación
de dos proporciones
n=
[Z α * 2 p (1 − p ) + Z β * p1 (1 − p1 ) + p2 (1 − p2 ) ]
2
( p1 − p2 ) 2
Donde:
93
Ejemplo
Se desea evaluar si un nuevo Solución
plan de prevención (T1) es mejor
que el habitual (T2) para p1 = 0,7
minimizar los riesgos laborales.
Para lo cual se diseña un estudio.
p2 = 0,9
Sabiendo que por datos previos Zα = 1,645
la eficacia del plan habitual está
alrededor del 70% y se considera Zβ = 0,842
relevante si el nuevo plan
minimiza el riesgo laboral en p1 + p2
90%. El nivel de significación es p = = 0 ,8
0.05 y se desea un poder 2
estadístico de 80%.
n=
[1.645 * 2 * 0.8(1 − 0.8) + 0.842 * 0.7(1 − 0.7) + 0.9(1 − 0.9) ]
2
n = 49
(0.7 − 0.9) 2
94
Zα
95
Potencia
β 1-β Zβ
0,01 0,99 2,326
0,05 0,95 1,645
0,10 0,90 1,282
0,15 0,85 1,036
0,20 0,80 0,842
0,25 0,75 0,674
0,30 0,70 0,524
0,35 0,65 0,385
0,40 0,60 0,253
0,45 0,55 0,126
96
Ejercicios
Solución
97
a)
98
b)
99
Ejercicio
Solución
100
101
Ejercicio
Las capas de óxido en las obleas semiconductoras son depositadas
en una mezcla de gases para alcanzar el espesor apropiado. La
variabilidad del espesor es una característica crítica de la oblea, y lo
deseable para los siguientes pasos de la fabricación es tener una
variabilidad baja. Para ello se estudian dos mezclas diferentes de
gases con la finalidad de determinar con cuál se obtienen mejores
resultados en cuanto a la reducción en la variabilidad del espesor del
óxido. Veintiún obleas son depositadas en cada gas. Las
desviaciones estándar de cada muestra del espesor del óxido son s1
= 1.96 angstroms y s2 = 2.13 angstroms. ¿Existe evidencia que
indique una diferencia en las desviaciones? Utilice a=0.05.
Solución
102
103
Para el ejercicio anterior, encontrar la probabilidad de cometer error tipo
II si la verdadera relación es
104
Valores críticos
105