Apunte 14: Prueba de Bondad de Ajuste, de Independencia Y de Homogeneidad

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 17

14206

Apunte 14
PRUEBA DE BONDAD
DE AJUSTE, DE
INDEPENDENCIA Y
DE HOMOGENEIDAD

Ricardo Rivera

INDUSTRIA VIRTUAL 2021 1


INDUSTRIA VIRTUAL 2021 2
PRUEBA DE BONDAD DE AJUSTE, DE INDEPENDENCIA
Y DE HOMOGENEIDAD

Introducción

Todos los métodos de inferencia que hasta aquí vimos se han circunscripto a parámetros poblacionales
(intervalos de confianza o pruebas de hipótesis). En general, estos métodos están vinculados a una serie
de supuestos bastante restrictivos acerca de características de la población (v.gr.: distribución normal de
la población, igualdad de varianzas para diversos grupos, etc.).

Ahora, nos dedicaremos al estudio de los denominados MÉTODOS NO PARAMÉTRICOS O DE


DISTRIBUCIÓN LIBRE. Estos tienen la particularidad de realizar inferencias estadísticas no solo referidas
a parámetros poblacionales, sino también, a otras situaciones. Por ejemplo probar si dos variables
cualitativas están asociadas o no; si la distribución de cierta característica es similar en varias
poblaciones; si la forma de la distribución poblacional de cierta variable es normal o Poisson; o si
responde a cierta forma específica.

Debe tenerse en cuenta que, aun cuando puedan aplicarse de manera efectiva los métodos no
paramétricos, hay que proceder con prudencia. Estas pruebas, para un número dado de observaciones,
tienen menor potencia (es decir, menor aptitud para rechazar la hipótesis nula) que los test paramétricos.

Desarrollo

Prueba de bondad de ajuste

Esta es una prueba para decidir, a partir de una muestra particular, si se rechaza o no la hipótesis de que
una variable aleatoria se ajusta a una distribución probabilística especifica. En clases anteriores, los
métodos aplicados se basaban en el supuesto de población normal o tamaños de muestra lo
suficientemente grandes como para que proceda la aplicación del TCL. Un procedimiento adecuado para

INDUSTRIA VIRTUAL 2021 3


contrastar ese supuesto es la prueba de la bondad del ajuste, debiendo aclararse que no es en el único
caso en que se puede aplicar esta prueba ya que, esta es susceptible de utilizarse cualquiera sea la
distribución especificada: uniforme, Poisson, exponencial, normal, entre otras.

El procedimiento comienza con el planteo de la hipótesis nula de que la variable aleatoria bajo estudio
tiene una distribución específica. Luego, se toma una muestra aleatoria de la población que provee las
frecuencias observadas. Seguidamente, se compara con la distribución teórica. Los valores de las
probabilidades teóricos cuando se los multiplica por el tamaño de la muestra, se transforman en las
frecuencias esperadas. Algunos ejemplos pueden describir mejor el procedimiento de prueba.

Suponga el siguiente caso, una financiera registró el número de días de atraso por semana en el pago de
los préstamos acordados para los últimos 80 clientes. Los resultados se muestran en la Tabla 1. Con el
objeto de estimar intereses y saldos disponibles para próximos préstamos, desea probar la hipótesis de
que las variables aleatorias “días de atraso” se ajusta a una distribución Poisson.

Figura 1: Tabla 1

Fuente: Elaboración propia

INDUSTRIA VIRTUAL 2021 4


1.- Hipótesis:

Ho: El número de días de atraso se distribuye Poisson, P (x, λ=?)


H1: El número de días de atraso no se distribuye Poisson.

En primer lugar, como se desconoce l, se deberá encontrar su estimador de máxima verosimilitud: λ = x̄.
^

^
Para los datos presentados en la tabla 1: λ = 1, 51 (sugerimos que usted calcule y verifique este resultado).

2.- Nivel de significación:

Se elige un nivel de significación, para el ejemplo tomaremos α = 0,05 (asignado arbitrariamente). Por lo
tanto, 0,05 es la probabilidad de rechazar una hipótesis nula verdadera.

3.- Cálculo del valor observado del estadístico:

El estadístico de prueba, según se especificó antes, se calcula mediante la siguiente expresión:

2 k
(oi − oi )2
cobs = ai=1 (bajo el supuesto de hipótesis nula cierta).
ei

Los pasos necesarios para calcularlo se encuentran en la tabla 2 y a continuación, se referencia cada
columna de la misma.

Columna (1) y (2): corresponden a los valores observados en la muestra y sus frecuencias asociadas
(también observadas).

^
Columna (3): cálculo de las probabilidades teóricas de Poisson: P(xi, λ = 1, 51), a partir de las tablas estadísticas.

Columna (4): cómputo de las frecuencias esperadas o teóricas. Surgen de multiplicar el tamaño de
muestra por la probabilidad teórica asociada a cada valor de la variable. Luego, las tres últimas clases se

INDUSTRIA VIRTUAL 2021 5


agrupan dado que, las frecuencias teóricas son menores que 5. Entonces k = 5 (5 categorías después del
reagrupamiento).

Columna (5): cálculo del cociente entre el cuadrado de las diferencias y la frecuencia esperada para cada
línea. La suma es el valor de Chi-cuadrado:

Figura 2: Tabla 2

Fuente: Elaboración propia

4.- Regla de decisión:

Recuérdese que se necesita encontrar un valor (valor crítico) que separe la zona de no rechazo de la zona
de rechazo. En cuanto a los grados de libertad, se obtienen de la siguiente manera: g. l. = k – m = 5 – 2 = 3.
Esto es debido a que k = 5 y se tienen m = 2 restricciones lineales, ya que hay una restricción lineal
porque la suma total de los conteos tiene que ser igual a n. Más una restricción de estimar un parámetro
desconocido que se requiere para calcular las frecuencias esperadas.

El valor crítico para 3 grados de libertad y al nivel de significación 0,05 (a la derecha), se encuentra en las
tablas estadísticas y es igual a 7,81. Es decir:

χ2 = χ2 (3;0,95) = 7,81, porque P (Xi2(3) > 7,81) 0, 05

INDUSTRIA VIRTUAL 2021 6


Y se puede expresar la regla de decisión de la siguiente forma:

ZNR ={ χ2 /χ2 ≤ 7,81}, la zona de no rechazo está conformada por los valores Chi-cuadrado tales que
sean menores o iguales a 7,81.

El complemento: ZR = {χ2 /χ2 > 7, 81 }, la zona de rechazo está conformada por todos los valores Chi-
cuadrado tales que sean mayores a 7,81.

5.- Decisión o inferencia final:

El valor observado de χ2 (1,01) es menor que 7,81. Por lo tanto, no se rechaza la hipótesis nula y se
puede inferir, a un nivel de significación del 5%, que la distribución del número de días de atraso se
distribuye Poisson. Para los siguientes datos se comprobará si los mismos provienen de una distribución
normal (figura 3):

Figura 3: Tabla 3

Fuente: Elaboración propia

INDUSTRIA VIRTUAL 2021 7


La prueba Chi-cuadrado de la bondad de ajuste para probar la normalidad, sigue el procedimiento
desarrollado. Su aplicación más frecuente se da cuando los datos están disponibles tal como fueron
recopilados y los parámetros μ y σ2 se estiman a partir de dichos datos. Por lo tanto, su distribución
tendrá (k-3) grados de libertad.

Prueba de independencia: Tablas de contingencia

En este caso, se trata de una situación en la que interesa poner a prueba si existe o no independencia
entre dos variables cualitativas (atributos) de una población. Para ello, se toma una muestra, se construye
una tabla de contingencia con las dos variables cualitativas de interés en base a la distribución de
frecuencias conjunta observada en esa tabla de contingencia y la frecuencia esperada, que se calcula de
acuerdo a la hipótesis nula planteada. Con esto se construye el estadístico Chi-cuadrado con el objeto de
evaluar las diferencias entre ambas. Si la diferencia no es significativa, se concluye que las variables son
independientes. Caso contrario, se dice que esas dos variables de clasificación están relacionadas o son
dependientes. Recurriremos nuevamente a un ejemplo para desarrollar la prueba.

En una encuesta de opinión pública se le solicitó a 1000 habitantes de la ciudad su calificación respecto
del desempeño del intendente, siendo las respuestas posibles: BUENO, REGULAR o MALO. La
distribución de dichas respuestas, clasificadas según el nivel educacional de los encuestados, es (figura 4):

Figura 4: Tabla 4

Fuente: Elaboración propia

Si el objetivo es contrastar la hipótesis nula de que la calificación respecto del desempeño del intendente
es independiente del nivel educacional de los encuestados, la hipótesis nula establecerá que la

INDUSTRIA VIRTUAL 2021 8


clasificación por filas (f) es independiente de la clasificación por columnas (c). Frente a la alternativa que
las dos clasificaciones son dependientes o están relacionadas.

Se llamará pA a la probabilidad marginal (no condicionada) de que la opinión sea Bueno (A). Así
también, se definen pB y pC como las probabilidades que se presenten las respuestas Regular (B) o Malo
(C), respectivamente. De la misma manera, pI, pII y pIII son las probabilidades que un individuo haya
alcanzado el nivel primario (I), secundario (II) o terciario (III), mutuamente. Se sabe además que la suma
de las probabilidades filas y la suma de las probabilidades columnas deben ser igual a la unidad, es decir:

pA + pB + pC = 1 (suma de las probabilidades filas)


pI + pII + pIII = 1 (suma de las probabilidades columnas)

Entonces, de acuerdo a la ley multiplicativa de probabilidad, si las dos variables son independientes entre
sí, la probabilidad de una celda (probabilidad conjunta) será igual al producto de sus correspondientes
probabilidades fila y columna (probabilidades marginales):
pij = pi. pj,

Para el ejemplo: pAI = pA . pI


Teniendo las probabilidades estimadas para cada celda en caso de independencia, se podrán obtener las
frecuencias esperadas de cada celda, multiplicando por el tamaño de la muestra, las que se utilizaran en la
construcción del estadístico Chi-cuadrado.

Luego, se puede obtener el estimador de máxima verosimilitud para cualquier probabilidad fila y columna
como sigue:

nij
p^ij = , (i = 1, …, f ; j = 1, …, c)
n
Donde:

nij: frecuencia observada de la celda ij.


pij: probabilidad que una observación caiga en la celda ij, que es simplemente, la frecuencia relativa
observada para esa celda.

INDUSTRIA VIRTUAL 2021 9


Asimismo, las probabilidades marginales, probabilidades fila y columna respectivamente, están dadas por:
fi cj
p^i = y p^j =
n n
(donde: fi y cj son las frecuencias absolutas de la fila i y las frecuencias absolutas de la columna j,
respectivamente) y constituyen los estimadores de máxima verosimilitud de pi y pj.

Según lo planteado en la hipótesis nula, el estimador de máxima verosimilitud de nij es:

(n n )
^ n = n P^ . P^ = n fi . cj = fi ci
eij = E ( ij) ( i j)
n

Entonces, para la primera celda de nuestro ejemplo se obtiene como se muestra a continuación:
700 (100)
e11 = = 70; de la misma manera se pueden calcular las siguientes frecuencias esperadas que
1000
se muestran en la Tabla:

Figura 5: Tabla 5

Fuente: Elaboración propia

Es decir, se puede observar que la frecuencia esperada para una celda particular es igual al cociente del
producto de sus respectivas frecuencias marginales y la frecuencia total.

Ahora, se puede calcular el valor del estadístico de prueba, utilizando las frecuencias observadas de la
tabla 6 y las frecuencias esperadas de la tabla anterior:

INDUSTRIA VIRTUAL 2021 10


(49 − 36)
2
f c (oij − oij )2 (82 − 70)2 (10 − 18)2
2
∑∑
Xobs = = + +…+ = 15,30
i=1 j=1
eij 70 18 36

Finalmente, resta obtener los grados de libertad asociados al estadístico de la prueba. Recordando que
dichos grados de libertad se obtienen de la cantidad de celdas luego de reagrupar (en este caso k = f.c)
menos un grado de libertad por cada restricción lineal independiente impuesta sobre las frecuencias
observadas de las celdas. Entonces, los grados de libertad se obtienen de la siguiente manera:

Figura 6: Tabla 6

Fuente: Elaboración propia

Es decir:

g.l. = (f.c) – 1 – (c-1) – (f-1)


g.l. = f.c – 1 – c +1 –f +1
g.l. = f.c – c – f + 1
g.l. = c (f-1)- (f-1)
g.l. = (f-1). (c-1)

Para el ejemplo los grados de libertad son: (3-1) . (3-1) = 4.

INDUSTRIA VIRTUAL 2021 11


Se plantea ahora, la prueba de independencia siguiendo todos los pasos:

1.- H0: la calificación del desempeño del intendente es independiente del nivel educacional de los
encuestados.
H1: la calificación del desempeño del intendente depende del nivel educacional de los encuestados.
2.- Nivel de significación: α=0,05
3.- Chi-cuadrado observado, bajo supuesto de hipótesis nula verdadera:

2
Xobs = 15.30

4.- Regla de decisión: el número de grados de libertad, según los cálculos anteriores, es 4. El valor crítico
es χ2 = χ2 (4;0,95) = 9, 49 , debido a que P (Xi2(4) > 9, 49) = 0, 05. En consecuencia, se puede expresar la

zona de no rechazo y la zona de rechazo de la siguiente forma:

ZNR = {χ2 /χ2 ≤ 9, 49}


ΖΡ = {χ2 /χ2 > 9, 49}

2
5.- Decisión o inferencia final: el valor observado de Xobs (15,30) es mayor al valor crítico (9,49). En

consecuencia, se rechaza la hipótesis nula y se puede inferir, a un nivel de significación del 5%, que la
calificación del desempeño del intendente depende del nivel educacional de los encuestados.

Cabe aclarar que, cuando el tamaño de muestra es pequeño (menor que 30) y se tiene una tabla de 2 x 2,
es posible aplicar una prueba muy útil como es la prueba exacta de Fisher. Esta permite conseguir las
probabilidades de obtener exactamente la distribución de frecuencias conforme a la hipótesis nula.

Prueba de homogeneidad

La prueba Chi-cuadrado se puede aplicar para determinar si dos o más muestras aleatorias
independientes se extraen de la misma población. Para ello, se clasifica a la población en términos de una

INDUSTRIA VIRTUAL 2021 12


variable cualitativa en k grupos (categorías de la variable) o niveles de un factor, con el objeto de evaluar
si las proporciones poblacionales son homogéneas.

Por ejemplo, se podría querer probar si las opiniones (de acuerdo, en desacuerdo), respecto a la política
del gobernador de la provincia de Córdoba, son homogéneas en tres poblaciones. Pueden ser Ciudad de
Córdoba, Río Cuarto y Villa María, de las que se obtuvieron tres muestras independientes. También, este
tipo de prueba se puede aplicar para realizar un análisis confirmatorio de los datos que se poseen de una
encuesta ya efectivizada. En este último caso, de acuerdo a las dos variables categóricas, se podrá armar
una tabla de contingencia con las frecuencias asociadas, lo que definiremos como éxito y fracaso para
cada grupo.

En la tabla siguiente, se presentan los resultados de las tres muestras, considerando la opinión de los
encuestados: de acuerdo (éxito), en desacuerdo (fracaso) véase la tabla 7.

Figura 7: Tabla 7

Fuente: Elaboración propia

El procedimiento a aplicar es semejante al de prueba de independencia; no obstante, su justificación es


algo diferente.

Se puede observar que se tienen tres experimentos binomiales independientes, con sus respectivas
probabilidades asociadas al éxito p1, p2 y p3 de que un encuestado esté de acuerdo con las políticas del
gobierno. Por lo tanto, si lo que se desea es contrastar la hipótesis de que las proporciones son
homogéneas en las tres poblaciones, la hipótesis nula es:

Ho: p1 = p2 = p3

INDUSTRIA VIRTUAL 2021 13


Los estimadores máximos verosímiles de las frecuencias esperadas de las celdas son los mismos que se
presentaron en la prueba de independencia y están dados por:

^ (n ) = fi ci
eij = E ij
n

Si la hipótesis nula es verdadera y pj es igual para cada población, una combinación de las estimaciones de
esas proporciones 10/ estaría proporcionando una estimación del parámetro poblacional p. Este
representa la proporción global de los individuos que están de acuerdo con las políticas del gobierno
(proporción de éxitos), es decir:

X1 + X2 + X3 X
p̄ = =
n1 + n 2 + n3 n

Y el complemento: q̄ = 1 − p̄ representa una estimación de la proporción global de los individuos que


están en desacuerdo con las políticas del gobierno (proporción de fracasos). Para el ejemplo, dichas
estimaciones son:

115 + 53 + 40 208 84
p̄ = = = 0.69; q̄ = = 0.31
150 + 75 + 75 300 300

Luego, para obtener las frecuencias esperadas de cada celda, multiplicaremos el tamaño de muestra de
cada una de las poblaciones por la estimación de las proporciones p y q, según si pertenecen a la primera
o a la segunda fila respectivamente. Para la primera celda, es (figura 8):

INDUSTRIA VIRTUAL 2021 14


Figura 8: Frecuencia

Fuente: Elaboración propia

Procediendo de la misma forma para las restantes celdas, se obtienen las frecuencias esperadas
correspondientes. Todas las frecuencias esperadas se presentan en la tabla 8:

Figura 9: Tabla 8

Fuente: Elaboración propia

Se puede demostrar además, que la variable resultante tendrá distribución Chi-cuadrado con (f-1).(c-1)
grados de libertad 11/ y utilizando un nivel de significación, la hipótesis nula se rechazara si el
estadístico de prueba Chi-cuadrado:

2
(oij − oij )2 (35 − 23)
f c
2 (115 − 104)2 (35 − 46)2
∑∑
Xobs = = + +…+ = 12.89
i=1 j=1
eij 104 46 23

INDUSTRIA VIRTUAL 2021 15


Es mayor al valor crítico de la cola superior de una distribución Chi-cuadrado con (c-1).(f-1) grados de libertad.

La prueba de homogeneidad para el ejemplo, es:

1.- H0: p1 = p2 = p3
H1: Existe por lo menos una pj distintas a las demás (j = 1, 2, 3)

2.- Nivel de significación: α=0,05 (asignado arbitrariamente).

3.- Chi-cuadrado observado, bajo supuesto de hipótesis nula verdadera:

2
Xobs = 12.89
4.- Regla de decisión:

El número de grados de libertad, según lo expresado anteriormente, es (c-1)=2.


El valor crítico es X2 = X2(2;0,95) = 5, 99 , debido a que P (Xi2(2) > 5, 99) = 0, 05; en consecuencia,

podemos expresar la zona de no rechazo y la zona de rechazo de la siguiente forma:

ZNR = {χ2 /χ2 ≤ 5, 99}

ZR = {χ2 /χ2 > 5, 99}

5.- Decisión o inferencia final:

El valor observado de χ 2 (12,89) es mayor al valor crítico (5,99). En consecuencia, se rechaza la


hipótesis nula y se puede inferir, a un nivel de significación del 5%, que existe por lo menos una pj
distinta a las demás. Es decir, las opiniones respecto a las políticas del gobierno de la provincia no son
homogéneas en las tres ciudades relevadas.

INDUSTRIA VIRTUAL 2021 16


Conclusiones

Al estudiar el contenido de este material, se espera que las y los futuros Ingenieros Industriales puedan
reconocer cuándo es necesario aplicar procedimientos no paramétricos para prueba de hipótesis. Utilizar este
tipo de metodología sirve para probar hipótesis de independencia, de bondad de ajuste y de homogeneidad.
Finalmente, es necesario reconocer casos en que deban aplicarse otras pruebas no paramétricas.

Referencias bibliográficas

Hines, W. y Montgomery, D. (1990). Probabilidad y Estadística para Ingeniería (Tercera Edición ed.). CECSA.
Walpole, R., Myers, R. y Myers, S. (2012). Probabilidad y Estadística para Ingenieros (Novena Edición ed.).
Prentice may.

INDUSTRIA VIRTUAL 2021 17

También podría gustarte