Apunte 14: Prueba de Bondad de Ajuste, de Independencia Y de Homogeneidad
Apunte 14: Prueba de Bondad de Ajuste, de Independencia Y de Homogeneidad
Apunte 14: Prueba de Bondad de Ajuste, de Independencia Y de Homogeneidad
Apunte 14
PRUEBA DE BONDAD
DE AJUSTE, DE
INDEPENDENCIA Y
DE HOMOGENEIDAD
Ricardo Rivera
Introducción
Todos los métodos de inferencia que hasta aquí vimos se han circunscripto a parámetros poblacionales
(intervalos de confianza o pruebas de hipótesis). En general, estos métodos están vinculados a una serie
de supuestos bastante restrictivos acerca de características de la población (v.gr.: distribución normal de
la población, igualdad de varianzas para diversos grupos, etc.).
Debe tenerse en cuenta que, aun cuando puedan aplicarse de manera efectiva los métodos no
paramétricos, hay que proceder con prudencia. Estas pruebas, para un número dado de observaciones,
tienen menor potencia (es decir, menor aptitud para rechazar la hipótesis nula) que los test paramétricos.
Desarrollo
Esta es una prueba para decidir, a partir de una muestra particular, si se rechaza o no la hipótesis de que
una variable aleatoria se ajusta a una distribución probabilística especifica. En clases anteriores, los
métodos aplicados se basaban en el supuesto de población normal o tamaños de muestra lo
suficientemente grandes como para que proceda la aplicación del TCL. Un procedimiento adecuado para
El procedimiento comienza con el planteo de la hipótesis nula de que la variable aleatoria bajo estudio
tiene una distribución específica. Luego, se toma una muestra aleatoria de la población que provee las
frecuencias observadas. Seguidamente, se compara con la distribución teórica. Los valores de las
probabilidades teóricos cuando se los multiplica por el tamaño de la muestra, se transforman en las
frecuencias esperadas. Algunos ejemplos pueden describir mejor el procedimiento de prueba.
Suponga el siguiente caso, una financiera registró el número de días de atraso por semana en el pago de
los préstamos acordados para los últimos 80 clientes. Los resultados se muestran en la Tabla 1. Con el
objeto de estimar intereses y saldos disponibles para próximos préstamos, desea probar la hipótesis de
que las variables aleatorias “días de atraso” se ajusta a una distribución Poisson.
Figura 1: Tabla 1
En primer lugar, como se desconoce l, se deberá encontrar su estimador de máxima verosimilitud: λ = x̄.
^
^
Para los datos presentados en la tabla 1: λ = 1, 51 (sugerimos que usted calcule y verifique este resultado).
Se elige un nivel de significación, para el ejemplo tomaremos α = 0,05 (asignado arbitrariamente). Por lo
tanto, 0,05 es la probabilidad de rechazar una hipótesis nula verdadera.
2 k
(oi − oi )2
cobs = ai=1 (bajo el supuesto de hipótesis nula cierta).
ei
Los pasos necesarios para calcularlo se encuentran en la tabla 2 y a continuación, se referencia cada
columna de la misma.
Columna (1) y (2): corresponden a los valores observados en la muestra y sus frecuencias asociadas
(también observadas).
^
Columna (3): cálculo de las probabilidades teóricas de Poisson: P(xi, λ = 1, 51), a partir de las tablas estadísticas.
Columna (4): cómputo de las frecuencias esperadas o teóricas. Surgen de multiplicar el tamaño de
muestra por la probabilidad teórica asociada a cada valor de la variable. Luego, las tres últimas clases se
Columna (5): cálculo del cociente entre el cuadrado de las diferencias y la frecuencia esperada para cada
línea. La suma es el valor de Chi-cuadrado:
Figura 2: Tabla 2
Recuérdese que se necesita encontrar un valor (valor crítico) que separe la zona de no rechazo de la zona
de rechazo. En cuanto a los grados de libertad, se obtienen de la siguiente manera: g. l. = k – m = 5 – 2 = 3.
Esto es debido a que k = 5 y se tienen m = 2 restricciones lineales, ya que hay una restricción lineal
porque la suma total de los conteos tiene que ser igual a n. Más una restricción de estimar un parámetro
desconocido que se requiere para calcular las frecuencias esperadas.
El valor crítico para 3 grados de libertad y al nivel de significación 0,05 (a la derecha), se encuentra en las
tablas estadísticas y es igual a 7,81. Es decir:
ZNR ={ χ2 /χ2 ≤ 7,81}, la zona de no rechazo está conformada por los valores Chi-cuadrado tales que
sean menores o iguales a 7,81.
El complemento: ZR = {χ2 /χ2 > 7, 81 }, la zona de rechazo está conformada por todos los valores Chi-
cuadrado tales que sean mayores a 7,81.
El valor observado de χ2 (1,01) es menor que 7,81. Por lo tanto, no se rechaza la hipótesis nula y se
puede inferir, a un nivel de significación del 5%, que la distribución del número de días de atraso se
distribuye Poisson. Para los siguientes datos se comprobará si los mismos provienen de una distribución
normal (figura 3):
Figura 3: Tabla 3
En este caso, se trata de una situación en la que interesa poner a prueba si existe o no independencia
entre dos variables cualitativas (atributos) de una población. Para ello, se toma una muestra, se construye
una tabla de contingencia con las dos variables cualitativas de interés en base a la distribución de
frecuencias conjunta observada en esa tabla de contingencia y la frecuencia esperada, que se calcula de
acuerdo a la hipótesis nula planteada. Con esto se construye el estadístico Chi-cuadrado con el objeto de
evaluar las diferencias entre ambas. Si la diferencia no es significativa, se concluye que las variables son
independientes. Caso contrario, se dice que esas dos variables de clasificación están relacionadas o son
dependientes. Recurriremos nuevamente a un ejemplo para desarrollar la prueba.
En una encuesta de opinión pública se le solicitó a 1000 habitantes de la ciudad su calificación respecto
del desempeño del intendente, siendo las respuestas posibles: BUENO, REGULAR o MALO. La
distribución de dichas respuestas, clasificadas según el nivel educacional de los encuestados, es (figura 4):
Figura 4: Tabla 4
Si el objetivo es contrastar la hipótesis nula de que la calificación respecto del desempeño del intendente
es independiente del nivel educacional de los encuestados, la hipótesis nula establecerá que la
Se llamará pA a la probabilidad marginal (no condicionada) de que la opinión sea Bueno (A). Así
también, se definen pB y pC como las probabilidades que se presenten las respuestas Regular (B) o Malo
(C), respectivamente. De la misma manera, pI, pII y pIII son las probabilidades que un individuo haya
alcanzado el nivel primario (I), secundario (II) o terciario (III), mutuamente. Se sabe además que la suma
de las probabilidades filas y la suma de las probabilidades columnas deben ser igual a la unidad, es decir:
Entonces, de acuerdo a la ley multiplicativa de probabilidad, si las dos variables son independientes entre
sí, la probabilidad de una celda (probabilidad conjunta) será igual al producto de sus correspondientes
probabilidades fila y columna (probabilidades marginales):
pij = pi. pj,
Luego, se puede obtener el estimador de máxima verosimilitud para cualquier probabilidad fila y columna
como sigue:
nij
p^ij = , (i = 1, …, f ; j = 1, …, c)
n
Donde:
(n n )
^ n = n P^ . P^ = n fi . cj = fi ci
eij = E ( ij) ( i j)
n
Entonces, para la primera celda de nuestro ejemplo se obtiene como se muestra a continuación:
700 (100)
e11 = = 70; de la misma manera se pueden calcular las siguientes frecuencias esperadas que
1000
se muestran en la Tabla:
Figura 5: Tabla 5
Es decir, se puede observar que la frecuencia esperada para una celda particular es igual al cociente del
producto de sus respectivas frecuencias marginales y la frecuencia total.
Ahora, se puede calcular el valor del estadístico de prueba, utilizando las frecuencias observadas de la
tabla 6 y las frecuencias esperadas de la tabla anterior:
Finalmente, resta obtener los grados de libertad asociados al estadístico de la prueba. Recordando que
dichos grados de libertad se obtienen de la cantidad de celdas luego de reagrupar (en este caso k = f.c)
menos un grado de libertad por cada restricción lineal independiente impuesta sobre las frecuencias
observadas de las celdas. Entonces, los grados de libertad se obtienen de la siguiente manera:
Figura 6: Tabla 6
Es decir:
1.- H0: la calificación del desempeño del intendente es independiente del nivel educacional de los
encuestados.
H1: la calificación del desempeño del intendente depende del nivel educacional de los encuestados.
2.- Nivel de significación: α=0,05
3.- Chi-cuadrado observado, bajo supuesto de hipótesis nula verdadera:
2
Xobs = 15.30
4.- Regla de decisión: el número de grados de libertad, según los cálculos anteriores, es 4. El valor crítico
es χ2 = χ2 (4;0,95) = 9, 49 , debido a que P (Xi2(4) > 9, 49) = 0, 05. En consecuencia, se puede expresar la
2
5.- Decisión o inferencia final: el valor observado de Xobs (15,30) es mayor al valor crítico (9,49). En
consecuencia, se rechaza la hipótesis nula y se puede inferir, a un nivel de significación del 5%, que la
calificación del desempeño del intendente depende del nivel educacional de los encuestados.
Cabe aclarar que, cuando el tamaño de muestra es pequeño (menor que 30) y se tiene una tabla de 2 x 2,
es posible aplicar una prueba muy útil como es la prueba exacta de Fisher. Esta permite conseguir las
probabilidades de obtener exactamente la distribución de frecuencias conforme a la hipótesis nula.
Prueba de homogeneidad
La prueba Chi-cuadrado se puede aplicar para determinar si dos o más muestras aleatorias
independientes se extraen de la misma población. Para ello, se clasifica a la población en términos de una
Por ejemplo, se podría querer probar si las opiniones (de acuerdo, en desacuerdo), respecto a la política
del gobernador de la provincia de Córdoba, son homogéneas en tres poblaciones. Pueden ser Ciudad de
Córdoba, Río Cuarto y Villa María, de las que se obtuvieron tres muestras independientes. También, este
tipo de prueba se puede aplicar para realizar un análisis confirmatorio de los datos que se poseen de una
encuesta ya efectivizada. En este último caso, de acuerdo a las dos variables categóricas, se podrá armar
una tabla de contingencia con las frecuencias asociadas, lo que definiremos como éxito y fracaso para
cada grupo.
En la tabla siguiente, se presentan los resultados de las tres muestras, considerando la opinión de los
encuestados: de acuerdo (éxito), en desacuerdo (fracaso) véase la tabla 7.
Figura 7: Tabla 7
Se puede observar que se tienen tres experimentos binomiales independientes, con sus respectivas
probabilidades asociadas al éxito p1, p2 y p3 de que un encuestado esté de acuerdo con las políticas del
gobierno. Por lo tanto, si lo que se desea es contrastar la hipótesis de que las proporciones son
homogéneas en las tres poblaciones, la hipótesis nula es:
Ho: p1 = p2 = p3
^ (n ) = fi ci
eij = E ij
n
Si la hipótesis nula es verdadera y pj es igual para cada población, una combinación de las estimaciones de
esas proporciones 10/ estaría proporcionando una estimación del parámetro poblacional p. Este
representa la proporción global de los individuos que están de acuerdo con las políticas del gobierno
(proporción de éxitos), es decir:
X1 + X2 + X3 X
p̄ = =
n1 + n 2 + n3 n
115 + 53 + 40 208 84
p̄ = = = 0.69; q̄ = = 0.31
150 + 75 + 75 300 300
Luego, para obtener las frecuencias esperadas de cada celda, multiplicaremos el tamaño de muestra de
cada una de las poblaciones por la estimación de las proporciones p y q, según si pertenecen a la primera
o a la segunda fila respectivamente. Para la primera celda, es (figura 8):
Procediendo de la misma forma para las restantes celdas, se obtienen las frecuencias esperadas
correspondientes. Todas las frecuencias esperadas se presentan en la tabla 8:
Figura 9: Tabla 8
Se puede demostrar además, que la variable resultante tendrá distribución Chi-cuadrado con (f-1).(c-1)
grados de libertad 11/ y utilizando un nivel de significación, la hipótesis nula se rechazara si el
estadístico de prueba Chi-cuadrado:
2
(oij − oij )2 (35 − 23)
f c
2 (115 − 104)2 (35 − 46)2
∑∑
Xobs = = + +…+ = 12.89
i=1 j=1
eij 104 46 23
1.- H0: p1 = p2 = p3
H1: Existe por lo menos una pj distintas a las demás (j = 1, 2, 3)
2
Xobs = 12.89
4.- Regla de decisión:
Al estudiar el contenido de este material, se espera que las y los futuros Ingenieros Industriales puedan
reconocer cuándo es necesario aplicar procedimientos no paramétricos para prueba de hipótesis. Utilizar este
tipo de metodología sirve para probar hipótesis de independencia, de bondad de ajuste y de homogeneidad.
Finalmente, es necesario reconocer casos en que deban aplicarse otras pruebas no paramétricas.
Referencias bibliográficas
Hines, W. y Montgomery, D. (1990). Probabilidad y Estadística para Ingeniería (Tercera Edición ed.). CECSA.
Walpole, R., Myers, R. y Myers, S. (2012). Probabilidad y Estadística para Ingenieros (Novena Edición ed.).
Prentice may.