Prueba de Independencia

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

Prueba de independencia (ji-cuadrada)

(Richard I. Levin, 2010) En realidad, las pruebas ji-cuadrada nos


permiten hacer mucho más que probar la igualdad de varias
proporciones. Si clasificamos una población en diferentes categorías
respecto a dos atributos
(por ejemplo, edad y desempeño en el trabajo), entonces podemos
utilizar una prueba ji-cuadrada
para determinar si los dos atributos son independientes entre sí.
Los administradores también se topan con situaciones en las que
resulta útil probar la igualdad de
más de dos medias de población. De nuevo: no podemos aplicar los
métodos introducidos en el capítulo 9 debido a que están limitados a la
prueba de la igualdad de solamente dos medias. El análisis de varianza,
que se estudia en la cuarta sección de este capítulo, nos permitirá
probar si más de
dos medias de población pueden considerarse iguales.
Es claro que no siempre estaremos interesados en medias y
proporciones. Existen muchas situaciones administrativas en las que la
preocupación se centrará en la variabilidad de una población

(Anderson, Sweeney y Williams, 2008) La X 2 es una prueba de libre


distribución (no paramétrica) que mide la discrepancia entre una
distribución de frecuencias observadas y esperadas. Dentro de sus
características generales, la prueba X 2 toma valores entre cero e infinito
y no tiene valores negativos porque es la suma de valores elevados al
cuadrado (1).
Existen tres usos relevantes de la prueba X2:
– Prueba de bondad de ajuste (una variable)
– Prueba de independencia (dos variables)
– Prueba de homogeneidad (dos variables)
Ji-cuadrada como prueba de independencia
En muchas ocasiones, los administradores necesitan saber si las diferencias que
observan entre varias proporciones de la muestra son significativas o sólo se deben
al azar. Suponga que el administrador de campaña de un candidato a la presidencia
estudia tres regiones geográficas y encuentra que
el 35, 42 y 51%, respectivamente, de los votantes investigados de las tres regiones
reconocen el nombre del candidato. Si esta diferencia es significativa, el
administrador puede llegar a la conclusión de
que el lugar afectará la forma en que debe actuar el candidato. Pero si la diferencia
no es significativa (es decir, si el administrador concluye que la diferencia solamente
se debe al azar), entonces puede decidir que el lugar escogido para pronunciar un
discurso proselitista no tendrá efecto sobre su
recepción. Para conducir la campaña con éxito, entonces, el administrador necesita
determinar si el
lugar y el reconocimiento del nombre del candidato son dependientes o
independientes.
Tablas de contingencia

La tabla 11-1 se conoce como tabla de contingencia e ilustra la respuesta a esta


pregunta que dio la muestra encuestada. Una tabla como ésta está formada por
renglones y columnas: los renglones corren de manera horizontal y las columnas
verticalmente. Note que las cuatro columnas de la tabla 11-1 proporcionan una base
de clasificación —regiones geográficas— y los dos renglones clasifican la
información de otra manera: preferencia por los métodos de evaluación. La tabla 11-
1 se conoce como tabla de contingencia 2 4, ya que consta de
dos renglones y cuatro columnas. Describimos las dimensiones de una tabla de
contingencia estableciendo primero el número de renglones y luego el número de
columnas. La columna y el renglón
con el “total” no cuentan como parte de las dimensiones.
Frecuencias observadas y esperadas
Suponga que ahora simbolizamos las proporciones verdaderas de la población total
de empleados que prefieren el plan actual como:

• pN ← Proporción de empleados en el noreste que prefieren el plan actual


• pS ← Proporción de empleados en el sureste que prefieren el plan actual
• pC ← Proporción de empleados de la región central que prefieren el plan actual
• pW ← Proporción de empleados de la región de la costa oeste que prefieren el
plan actual

Utilizando estos símbolos, podemos establecer las hipótesis nula y alternativa de la


siguiente manera:
H0: pN pS pC pW ← Hipótesis nula
H1: pN, pS, pC, pW no son iguales ← Hipótesis alternativa
Si la hipótesis nula es verdadera, podemos combinar los datos de las cuatro
muestras y luego estimar la proporción de la fuerza de trabajo total (la población
total) que prefiere el método de evaluación actual:
Determinación de frecuencias esperadas:
Obviamente, si el valor 0.6643 estima la proporción de población esperada que
prefiere el método presente de evaluación, entonces 0.3357 ( 1 0.6643) es la
estimación de la proporción esperada de la población que prefiere el método
propuesto. Utilizando 0.6643 como estimación de la
proporción de la población que prefiere el método de evaluación actual y 0.3357
como la estimación
de la proporción de la población que prefiere el nuevo método, podemos estimar el
número de empleados de la muestra de cada región que podríamos esperar que
prefieran cada uno de los métodos
de evaluación. La tabla 11-2 presenta estos cálculos.

Comparación de frecuencias esperada y observada:


La tabla 11-3 combina toda la información contenida en las tablas 11-1 y 11-2. En
ella se ilustran
tanto la frecuencia real u observada, como la teórica o esperada, de trabajadores de
la muestra que
prefieren cada uno de los métodos de evaluación. Recuerde que las frecuencias
esperadas, presentadas en negritas, fueron estimadas a partir de nuestra
estimación combinada de la proporción.
Razonamiento intuitivo acerca de las pruebas ji-cuadrada
Para probar la hipótesis nula, PN = PS = PC = PW, debemos comparar las frecuencias
que se observaron (números en cursivas de la tabla 11-3) con las frecuencias que
esperaríamos si la hipótesis nula fuera verdadera (números en negritas). Si los
conjuntos de frecuencias observadas y esperadas son casi iguales, podemos
razonar de manera intuitiva que la hipótesis nula se acepta. Si existe una diferencia
grande entre estas frecuencias, podemos rechazar la hipótesis nula intuitivamente y
concluir que existen diferencias significativas en las proporciones de empleados de
las cuatro regiones que prefieren el nuevo método.

El estadístico ji-cuadrada
Para ir más allá de nuestra intuición acerca de las frecuencias observadas y
esperadas, podemos usar el estadístico ji-cuadrada, que se calcula de la siguiente
manera:

Esta fórmula establece que ji-cuadrada, o X2, es la suma que obtendremos si:
1. restamos fe de fo para cada uno de los ocho valores de la tabla 11-3;
2. elevamos al cuadrado cada diferencia;
3. dividimos cada diferencia al cuadrado entre fe, y
4. sumamos los ocho resultados.
Numéricamente, los cálculos son sencillos si utilizamos una tabla como la 11-4, que
muestra los pasos.
Interpretación del Estadístico ji-cuadrada:
La respuesta obtenida, 2.764, es el valor de ji-cuadrada en nuestro problema de
comparación de las preferencias de métodos de evaluación. Si este valor fuera muy
grande, digamos 20, indicaría una diferencia sustantiva entre los valores observados
y los valores esperados. Una ji-cuadrada de cero,
por otro lado, indica que las frecuencias observadas son exactamente iguales a las
frecuencias esperadas. El valor de ji-cuadrada nunca puede ser negativo, porque la
diferencia entre las frecuencias observadas y esperadas siempre están al cuadrado.

La distribución ji-cuadrada
Descripción de una distribución ji-cuadrada:
Si la hipótesis nula es verdadera, entonces la distribución de muestreo del
estadístico ji-cuadrada, 2, puede aproximarse bastante bien mediante una curva
continúa conocida como distribución ji-cuadrada. Como en el caso de la distribución
t, existe una distribución ji-cuadrada diferente para cada número de grados de
libertad. En la figura 11-1 se indican las tres diferentes distribuciones ji-cuadrada
correspondientes a 1, 5 y 10 grados de libertad. Para un número muy pequeño de
grados de libertad, la distribución ji-cuadrada está seriamente sesgada a la derecha.
Conforme aumenta el número de grados de libertad, la curva hace cada vez más
simétrica hasta que el número de grados de libertad alcanza valores grandes, en
cuyo caso la distribución puede aproximarse con la normal.

Búsqueda de probabilidades cuando se utiliza una distribución ji-cuadrada:


La distribución ji-cuadrada es una distribución de probabilidad. En consecuencia, el
área total bajo la curva de cada distribución ji-cuadrada es 1.0. Como en el caso de
la distribución t, es posible tener un número muy grande de distribuciones ji-
cuadrada, de modo que no resulta práctico construir una tabla que contenga las
áreas bajo la curva de todos los valores posibles del área. En la tabla 5 del apéndice
se ilustran sólo las áreas de la cola que se utilizan con más frecuencia en pruebas
de significancia que usan la distribución ji-cuadrada.
Determinación de los grados de libertad
Para utilizar la prueba ji-cuadrada, debemos calcular los grados de libertad en la
tabla de contingencia aplicando la ecuación 11-2:
Bibliografia
 Anderson, Sweeney y Williams, 2008. “Estadística para administración y
economía” 10a Ed. Prentice Cengage Learning Editores, S.A. de C.V. D.F.
México.

 Levin, R. and Rubin, D., 2010. Estadística para administración y economía


[recurso electrónico] $c. 7th ed. México: Pearson Educación, pp.448-42.

También podría gustarte