PRUEBAS DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS Y PROPORCIONES
Algunas veces, por ejemplo, nos interesamos por conocer la diferencia entre la nota promedio de todos los
estudiantes de Administración de Empresas y los estudiantes de Contaduría o preguntarnos si existe una
diferencia real entre los hábitos de estudio de los estudiantes hombres y mujeres. Estos ejemplos comparan
los parámetros de dos poblaciones de forma muy similar a lo estudiado en el tema de intervalos de confianza
para la diferencia de parámetros de dos poblaciones, Dq = q1 - q 2 , ya sea para medias, Dµ = µ1 - µ2 o para
proporciones Dp = p1 - p 2 .
Esta diferencia se tratará ahora mediante pruebas de hipótesis. La formulación de las hipótesis se aborda tal
como en el caso de una población, es decir: la hipótesis nula, H 0 , indica que no hay diferencia significativa
entre los parámetros y la hipótesis alternativa, H1 , expresa que se ha producido algún cambio significativo de
un parámetro a otro. Así,
H 0 : q1 - q 2 = q0 H 0 : q1 - q 2 = q0 H 0 : q1 - q 2 £ q0
cola bilateral; cola izquierda y cola derecha
H1 : q1 - q 2 ¹ q0 H1 : q1 - q 2 < q0 H1 : q1 - q 2 > q0
Al seleccionar dos muestras al azar independientes cada una de poblaciones diferentes, 1 y 2, se tiene, como
en los casos de los intervalos de confianza y de prueba de un parámetro vistos en temas precedentes, que:
CASO 1: Si los tamaños de las respectivas muestras son grandes ( n1 ³ 30 y n2 ³ 30) la distribución de la
diferencia entre las medias de las muestras, DX = X 1 - X 2 , o la diferencia de proporciones de las muestras,
Dp = p1 - p2 , es aproximadamente normal (se utiliza Za o Za ) con:
2
s 12 s 22 p1 (1 - p1 ) p 2 (1 - p 2 )
s DX = + o s Dp = +
n1 n2 n1 n2
CASO 2. Los tamaños de las muestras son pequeñas ( n1 < 30 y n2 < 30) y seleccionadas en forma
independientes con varianzas, s 12 y s 22 , desconocidas. Como en el caso de una población se hace uso
de la distribución t - Student con n1 + n2 - 2 grados de libertad. Además, las desviaciones típicas para la
DX = X1 - X 2 y la Dp = p1 - p2 son dadas respectivamente , como en los intervalos de confianza, por:
(n1 - 1) s12 + (n2 - 1)s 22 1 1 (n1 - 1) p1 (1 - p1 ) + (n2 - 1) p2 (1 - p2 ) 1 1
s DX = + y s Dp = +
n1 + n2 - 2 n1 n2 n1 + n2 - 2 n1 n2
EJEMPLO 1. Dos ciudades vecinas, A y B , disputan sobre la calidad de vida de sus habitantes respecto a
los ingresos familiares. El alcalde de la ciudad A afirma que el ingreso medio de sus familias es $150 mayor
que el de la ciudad B . El alcalde de B reclama dicha afirmación.
Se contrata un estadístico para dirimir la discusión; éste aborda el problema estimando la diferencia verdadera
entre ambos ingresos medios familiares; para esto, extrae una muestra aleatoria de cada ciudad, obteniendo
los siguientes resultados:
Ciudad A (1) Ciudad B (2)
n 100 120
X $5.900 $5.800
s2 9.050 8.700
Con una significación de a = 1% , ¿a qué conclusión llegaría el estadístico?
SOLUCIÓN:
Las hipótesis nula y alternativa serían:
H 0 : µ1 - µ2 ³ $150
¿El alcalde de la ciudad A tiene la razón en su afirmación?
H1 : µ1 - µ2 < $150
Zc = -3,92 Za = -2,33 (punto crítico)
Figura 1. Prueba para H 0 cola inferior con Z1%
Como las muestras son grandes, n1 = 100 y n2 = 120 , y el nivel de significación a = 1% entonces, por la
tabla Za (cola izquierda) se obtiene el punto crítico Za = -2,33 .
Para probar H 0 , se calcula el estadístico de la prueba, Z c = ( X 1 - X 2 ) - Dµ0 mediante los datos de la muestra:
s DX
DX = X 1 - X 2 = 5.900 - 5.800 = 100 ; Dµ0 = 150 ; además, las varianzas son desconocidas se utilizan las
s12 s22 9050 8700
varianzas de las muestras para calcular s DX = + = + = 12,7671, obteniendo
n1 n2 100 120
( X 1 - X 2 ) - Dµ0 (5.900 - 5.800) - 150
Zc = = = -3,92 .
s DX 12,7671
Por lo que Zc = -3,92 < Za = -2,33 ; así que Z c = -3,92 (cae en la región de rechazo de H 0 ) como se observa
en la figura 1. Concluyéndose que la hipotesis alternativa no puede rechazarse en a = 1% .
Es decir, de acuerdo con las muestras, lo afirmado por el alcalde de la ciudad A carece de veracidad.
EJEMPLO 2. En campaña electoral para elecciones del cargo de Rector de cierta Universidad el candidato A
desea conocer la verdadera diferencia en las preferencias de sus electores, en cuanto al género.
Para esto se toman dos muestras de electores hombres y electores mujeres de 150 y 120, respectivamente;
se encuentra que 70 hombres y 60 mujeres están a favor del candidato A . Con una significación de 5%
¿Cuál es la verdadera diferencia, en las preferencias para A , de hombres y mujeres?
SOLUCIÓN: Lo expuesto en el problema permite formular las hipótesis nula y alternativa siguientes:
H 0 : p1 - p 2 = 0
H1 : p 1 - p 2 ¹ 0
Como las muestras son grandes, el punto crítico para a = 5% (dos colas) es Za = ±1,96
2
Figura 2. Prueba para H 0 de dos cola con Z 2 ,5%
Ahora, se halla el valor del estadístico de la prueba, Z c , para compararlo con el punto crítico, Za = ±1,96
2
Para calcular Z c se parte de los datos de las muestras:
Las proporciones de muestras de hombres y mujeres son respectivamente
70 60
p1 = = 0,47 y p2 = = 0,50 ; en consecuencia. Dp = p1 - p2 = 0,47 - 0,5 = -0,03;
150 120
(0,47)(0,53) (0,5)(0,5)
además, Dp 0 = 0 y s Dp = + = 0,061
150 120
(#! $#" )$ ∆(# $*,*,$*
Luego, el estadístico de la prueba (Z calculado, ZC) es 𝑍! = )∆%
= *,*-.
= −0,492
Comparando el estadístico calculado 𝑍! = − 0,492 con el punto crítico, Za = -1,96 , se tiene que
𝑍! = −0,492 > 𝑍/ = −1,96 (ver Figura 2); así que 𝑍! = −0,492 cae en la región de aceptación de H 0 .
Este resultado muestra que la diferencia entre las verdaderas proporciones no es significativa; es decir,
indicando que las preferencias de hombres y mujeres hacia el candidato A son prácticamente las mismas.
EJEMPLO 3. Supóngase que se está interesado en descubrir si hay o no alguna diferencia real entre los
ingresos anuales medios de carpinteros y pintores de casas en cierta ciudad con una significación de a = 5%
Se extraen dos muestras aleatorias independientes, cada una de las cuales da la siguiente información:
Carpinteros Pintores de casas
Muestra 1 2
n 12 15
X $6.000 $5.400
S2 565.000 362.500
SOLUCIÓN: El problema lleva a formular las hipótesis nula y alternativa siguientes (dos colas)
H 0 : µ1 - µ2 = 0
H1 : µ1 - µ2 ¹ 0
¿existe diferencia significativa entre los ingresos medios verdaderos de los carpinteros y pintores de casas?
Los datos dan pequeñas muestras y varianzas reales desconocidas; la tabla t - Student con a = 5% y
n1 + n2 - 2 = 12 + 15 - 2 = 25 grados de libertad entrega el punto crítico t25 = ±2,06 (ver Figura 3).
a = 2,5%
2
t 25 = -2,06 t 25 = 2,06 tc = 2,31
Figura 3. Prueba de t 2 , 5% con 25 grados de libertad
Ahora, con base en los datos de las muestras se halla Dµ0 = 0 , ∆𝑋/ = X 1 - X 2 = 600 y
(n1 - 1) s12 + (n2 - 1) s22 1 1 (11)(565.000) + (14)(362.500) 1 1
s DX = + = + = 260,26 para calcular el
n1 + n2 - 2 n1 n2 25 12 15
( X1 - X 2 ) - Dµ0 600 - 0
estadístico de la prueba tc = = = 2,31.
s DX 260,26
Comparando tc = 2,31 con ta = 2,06 se indica que tc = 2,31 > ta = 2,06 , por lo que tc = 2,31 cae en la
2 2
región de rechazo de H 0 (ver Figura 3); razón por la cual no puede rechazarse la hipótesis alternativa, H1.
Concluyendo así que los carpinteros y los pintores de casas presentan una diferencia significativa en sus
ingresos anual promedio.