Pruebas de Homogeneidad. Chi Cuadrada

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 32

Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

PRUEBAS DE HIPOTESIS QUE UTILIZAN LA DISTRICUCIÓN JI-CUADRADA


4.5.Pruebas de Homogeneidad

Las pruebas de homogeneidad son matemáticamente equivalentes a las pruebas de independencia. La


diferencia estriba en que, en las pruebas de independencia, la muestra aleatoria se ha extraído de la
misma población, y los totales marginales por fila y columna, respecto a los criterios de clasificación,
son aleatorios, no prefijados. En las pruebas de homogeneidad, el investigador obtiene las muestras
aleatorias, de manera independiente, de diferentes poblaciones y fija los totales marginales de
acuerdo a un criterio de clasificación. El otro criterio es el que se aplica a las muestras, y tienen un
carácter aleatorio. Se trata de probar si las muestras provienen de poblaciones homogéneas respecto
a este último criterio.
La prueba de homogeneidad se utiliza para determinar, si dos o más muestras aleatorias provienen de
la misma población o de poblaciones diferentes. Cuando se dice que las clasificaciones son
homogéneas, se quiere dar a entender que tienen algo en común. En cambio, la prueba de
independencia es aplicada para establecer si hay alguna relación, en cuanto a los criterios de
clasificación de la información. Se emplean datos muéstrales para probar la independencia de dos
variables.

Para mayor claridad, se podrá decir que, en la prueba de independencia, se extrae una sola muestra de
una población y sólo nos interesa probar sí existe alguna relación entre los criterios de clasificación
establecidos. Algunos, erróneamente, creen que se trata de establecer la relación o correlación que
puede haber entre las variables; para este caso se aplican las técnicas de regresión y las pruebas de
correlación. En las pruebas de independencia pudo verse que los totales de las columnas y de las filas
son aleatorias; en otras palabras, son contingentes, por circunstancias que escapan a nuestro control.

En la prueba de homogeneidad, al contrario, a la de independencia, se extraen dos o más muestras


provenientes de dos o más poblaciones; algunas veces, de una muestra se puede obtener dos o más
categorías y el interés es el de probar si las poblaciones tienen cierta identidad con respecto a la
característica analizada.

Las pruebas de homogeneidad se utilizan cuando el investigador controla una de las variables, de
manera que los totales de filas (o columnas) están predeterminados.

Las diferencias entre ambas pruebas se pueden resumir así:

Pruebas de independencia Pruebas de homogeneidad


 Se ocupan de si un atributo es  Se ocupan de detectar si las diferencias muéstrales
independiente de otro provienen de la misma población o de poblaciones
diferentes.
 Incluyen una sola muestra  Incluye dos o más muestras independientes, una de
tomada de una población cada una de las posibles poblaciones en estudio
 Las frecuencias marginales son  Las frecuencias marginales de filas son tamaño
cantidades aleatorias muéstrales

En resumen, el cálculo de Ji-cuadrado es igual para las dos pruebas y se diferencia en cuanto a la
manera como se recolectan los datos y se interpretan los resultados.

Estructura de las hipótesis nula y alternativa en las pruebas de homogeneidad.

Elaborado y compilado por Carlos H. VargasPá gina 1


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

HO: No tienen nada en común las dos variables analizadas o, las muestras aleatorias provienen de
diferentes poblaciones y no tienen nada en común con respecto a las características analizadas.

H1: Si tienen algo en común las dos variables analizadas o, las muestras aleatorias provienen de
diferentes poblaciones y si tienen algo en común con respecto a las características analizadas.

NOTA: Para asegurar resultados exactos, todas las frecuencias esperadas necesitan ser grandes a fin
de emplear la prueba al tratar con las tablas de contingencia de “r x c”. Como en el caso de las
tablas de contingencia de 2 x c, todas las frecuencias esperadas deben ser al menos de 1. Para el caso
en que una o más de las frecuencias esperadas sean menores de 1, usted puede utilizar la prueba
después de condensar dos o más filas de baja frecuencia en una sola fila (o condensar dos o más
columnas de baja frecuencia en una sola columna). Fusionar filas o columnas por lo general da como
resultado frecuencias esperadas suficientemente grandes como para realizar la prueba con
exactitud.

Fórmula para encontrar el valor de Ji-Cuadrada:

χ2 =

Los grados de libertad se encuentran con la misma fórmula que se tiene en las “Pruebas de
Independencia”: G. de L. = (F – 1). (C – 1).

F = Número de filas en el ejercicio.


C = Número de columnas en el ejercicio.

El cálculo de las Frecuencias Esperadas (FE ij), utiliza la misma fórmula que se ha estudiado en el tema
de las Pruebas de Independencia.
Cálculo de las frecuencias esperadas (FE) de cada celda:

Dónde: Total, de la fila = suma de todas las frecuencias de la fila


Total, de la columna = suma de todas las frecuencias de la columna
n = tamaño general de la muestra

NOTA: Para asegurar resultados exactos, todas las frecuencias esperadas necesitan ser grandes a fin
de emplear la prueba al tratar con las tablas de contingencia de “r x c”. Como en el caso de las
tablas de contingencia de 2 x c, todas las frecuencias esperadas deben ser al menos de 1. Para el caso
en que una o más de las frecuencias esperadas sean menores de 1, usted puede utilizar la prueba
después de condensar dos o más filas de baja frecuencia en una sola fila (o condensar dos o más
columnas de baja frecuencia en una sola columna). Fusionar filas o columnas por lo general da como
resultado frecuencias esperadas suficientemente grandes como para realizar la prueba con
exactitud.

HOJA DE EJERCICIOS No. 4

Elaborado y compilado por Carlos H. VargasPá gina 2


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

1. Un investigador social, interesado en estudiar el grado de uso de drogas entre los estudiantes
de educación media, que habían declarado usar drogas, selecciono de este grupo una muestra
aleatoria de 150 alumnos del primer año; 135 alumnos del segundo, 125 del tercero y 100
alumnos del cuarto año. Cada estudiante completó un cuestionario en el cual se indicó el
grado de uso de las drogas como: “por curiosidad”, “casual” y “moderado hasta intenso”. Los
resultados se presentan en el siguiente cuadro. ¿Son compatibles estos datos con la hipótesis
de que las cuatro poblaciones de donde se han extraído las muestras son homogéneas con
respecto al grado en el uso de drogas? Usar alfa del 5%. R: Ji-Cuadrado de prueba = 19.3669.

Grado de uso de drogas entre los estudiantes de educación media, clasificados por año de
estudio
Grado del uso de drogas
Año de estudio Total
Por curiosidad Casual Moderado a intenso
Primero 57 50 43 150
Segundo 57 58 20 135
Tercero 56 45 24 125
Cuarto 45 22 33 100
Totales 215 175 120 510

SOLUCIÓN EN FORMA MANUAL

PASO 1. Se formulan la hipótesis nula (Ho) y la hipótesis alternativa (H1).

Para plantear Ho y H1 se deben analizar los datos del ejercicio y utilizar el marco teórico de la página 2,
en donde se establece la manera de cómo se deben formular.
H0. La variable “Año de estudio de los estudiantes de educación media” (Variable de la Fila) no tiene
nada en común con la variable “Grado del uso de drogas por parte de los estudiantes” (Variable de
columna).
H1. La variable “Año de estudio de los estudiantes de educación media” (Variable de la Fila) si tiene
algo en común con la variable “Grado de uso de drogas por parte de los estudiantes” (Variable de
columna).

PASO 2. Se establece el nivel de significación.


α = 5%. Nivel de confianza = 95%

PASO 3. Se establece la distribución de muestreo a ser utilizada.


El estadístico Ji cuadrado sirve para probar de manera formal si hay algo en común o no entre dos
variables con escala nominal, que es el caso de este ejercicio, por lo cual se utilizará la Prueba de Ji-
cuadrada .

Datos: En forma tabular se establecen las FO y se calculan las FE de cada una de las celdas de la tabla
de datos.
Calculo de las frecuencias esperadas (FE) de cada celda:

Dónde: Total de la fila = suma de todas las frecuencias de la fila

Elaborado y compilado por Carlos H. VargasPá gina 3


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Total, de la columna = suma de todas las frecuencias de la columna


n = tamaño general de la muestra

El siguiente cuadro nos muestra las FE que se deben calcular en cada celda:

Grado de uso de drogas entre los estudiantes de educación media, clasificados por año de
estudio
Grado del uso de drogas
Año de estudio Total
Por curiosidad Casual Moderado a intenso
Primero FE11 FE12 FE13 150
Segundo FE21 FE22 FE23 135
Tercero FE31 FE32 FE33 125
Cuarto FE41 FE42 FE43 100
Totales 215 175 120 510

Tabla de datos de las FO y de las FE de cada celda:


Grado de uso de drogas entre los estudiantes de educación media, clasificados por año de
estudio
Grado del uso de drogas
Año de estudio Total
Por curiosidad Casual Moderado a intenso
Primero FO11 = 57 FO12 = 50 FO13 = 43 150
FE11= 63.24 FE12 = 51.47 FE13 = 35.29
Segundo 57 58 20 135
FE21 = 56.91 FE22 = 46.32 FE23 = 31.76
Tercero 56 45 24 125
FE31 = 52.70 FE32 = 42.89 FE33 = 29.41
Cuarto 45 22 33 100
FE41 = 42.16 FE42 = 34.31 FE43 = 23.53
Totales 215 175 120 510

PASO 4. Se calculan los valores de Chi cuadrada de prueba y de Chi cuadrada crítica (en tabla):

y .

Elaborado y compilado por Carlos H. VargasPá gina 4


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

En tabla se calcula ; con α = 0.05 y, : (g. de l.) = (F – 1). (C – 1) = (4 - 1) . (3 - 1) = 6


Dónde: F = El número de filas de la tabla y C = El número de columnas de la tabla.

Con estos dos datos se busca en tabla de Ji-cuadrada y se encuentra que es = 12.59.

NOTA: Como buscar en la Tabla de Chi-cuadrada el valor crítico.


La tabla contiene en la parte superior los valores del Nivel de Significación y en la primera columna los
grados de libertad. Por lo tanto, primero ubicamos en la primera columna el valor de 6 y nos vamos por
fila a buscar el valor de 0.05 que es el del nivel de significación, esa intersección entre fila y columna
nos da el valor de 12.59.

PASO 5. Análisis y criterio de decisión.


Para hacer la gráfica de esta función utilizaremos Minitab 16.

Pasos en Minitab: Menú Gráfica------“Gráfica de distribución de probabilidad”, se selecciona la opción


4, “Ver probabilidad” ---Aceptar. En la ventana que nos aparece, en el campo “Distribución”
seleccionamos “Chi-cuadrada” y en el campo Grados de libertad se coloca el valor de 6. Luego
buscamos el campo “Área sombreada” y damos clic en ella y nos aparece otra ventana, en donde
seleccionamos el campo “Valor x”, dando un cheque en ese círculo, luego se selecciona la opción
primera “cola derecha” y en el campo “Valor x” se ingresa el valor de Chi-cuadrada crítica = 12.59----
aceptar. A continuación, nos aparece la gráfica general. Luego damos un clic derecho al mouse sobre la
gráfica encontrada y, seleccionamos “agregar”, “líneas de referencia”, en la ventana que se nos
muestra, en el campo “mostrar líneas de referencia en valores x:”, colocamos el valor de Chi Cuadrada
de prueba = 19.37, luego, “aceptar” y nos aparece la gráfica completa siguiente:

Elaborado y compilado por Carlos H. VargasPá gina 5


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

En esta grafica la parte a la izquierda (la parte de color blanco) antes de 12.59 es la “Región de
Aceptación” y la parte de la cola (de color rojo) es la “Región de Rechazo”.
En esta grafica se coloca el valor de Chi-cuadrado de prueba = 19.37 y se observa que estará en la
Región de rechazo.
Por esta razón, se puede rechazar la hipótesis nula (H 0), es decir que, es posible que la Hipótesis
Alternativa sea cierta.
Es decir, es posible que, “la variable “Año de estudio de los estudiantes de educación media” (Variable
de la Fila) si tiene algo en común con la variable “Grado de uso de drogas por parte de los estudiantes”
(Variable de columna)”. Con un nivel de significación del 5%.

SOLUCIÓN EN MINITAB 16.


En la Hoja de Trabajo se crea la Tabla de datos del ejercicio. Se usan las columnas de esa tabla (Por
curiosidad, Casual, Moderado a intenso). Se ingresan los datos de columnas.

Grado de uso de drogas entre los estudiantes de educación media, clasificados por año de
estudio
Grado del uso de drogas
Año de estudio Total
Por curiosidad Casual Moderado a intenso
Primero 57 50 43 150
Segundo 57 58 20 135
Tercero 56 45 24 125
Cuarto 45 22 33 100
Totales 215 175 120 510

Elaborado y compilado por Carlos H. VargasPá gina 6


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Menú “Estadísticas” ----Tablas---Prueba Chi-cuadrada (Tabla de dos factores en hoja de trabajo);

En la ventana que se nos despliega, nos aparece el campo “Columnas que contiene la tabla”, en ese
campo se colocan las columnas C1 = Por curiosidad; la C2 = Casual y la C3 = Moderado a intenso,
utilizando el cursor y dando seleccionar, una por una.

Elaborado y compilado por Carlos H. VargasPá gina 7


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Luego damos aceptar y a continuación, se muestra la respuesta:

Prueba Chi-cuadrada: Por curiosidad, Casual, Moderado a intenso

Los conteos esperados se imprimen debajo de los conteos observados


Las contribuciones Chi-cuadradas se imprimen debajo de los conteos esperados

Por Moderado
curiosidad Casual a intenso Total
1 57 50 43 150
63.24 51.47 35.29
0.615 0.042 1.682

2 57 58 20 135
56.91 46.32 31.76
0.000 2.943 4.357

3 56 45 24 125
52.70 42.89 29.41
0.207 0.104 0.996

4 45 22 33 100
42.16 34.31 23.53
0.192 4.419 3.812

Total 215 175 120 510

Chi-cuadrada = 19.369, GL = 6, Valor P = 0.004

En la respuesta se nos muestra la tabla de datos: las FO, las FE y el resultado de la fórmula para cada
operación: Datos de color rojo que se encontraran cuando se resolvió el ejercicio en Forma Manual
(ver cálculo de la formula a continuación).

Elaborado y compilado por Carlos H. VargasPá gina 8


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

También nos aparece en la respuesta el valor de Chi-cuadrada de prueba = 19.369; los G. de L. = 6 y el


Valor-P = 0.004.

PASO 5. Análisis y criterio de decisión.


Para ello utilizaremos el marco teórico siguiente:

Método del valor-p para la prueba de hipótesis


a) Si el valor-p es mayor o igual que α, no rechace la hipótesis nula.
b) Si el valor-p es menor que α, rechace la hipótesis nula.

El Valor – P (0.004) es < que α (0.05), por esta razón, se dice que se puede rechazar la Hipótesis Nula,
es decir que es posible que la Hipótesis Alternativa sea cierta.
Es decir, es posible que, “la variable “Año de estudio de los estudiantes de educación media” (Variable
de la Fila) si tiene algo en común con la variable “Grado de uso de drogas por parte de los estudiantes”
(Variable de columna)”. Con un nivel de significación del 5%.

Nota: la respuesta de Minitab, es la misma que se obtuvo en la Solución Manual

SOLUCIÓN EN SPSS 22.


En la “Vista de variables”, se construye la tabla de valores del ejercicio que estamos estudiando, la cual
tiene cuatro filas y tres columnas.

Grado de uso de drogas entre los estudiantes de educación media, clasificados por año de
estudio
Grado del uso de drogas
Año de estudio Total
Por curiosidad Casual Moderado a intenso
Primero FO11 = 57 FO12 = 50 FO13 = 43 150
Segundo FO21 = 57 FO22 = 58 FO23 = 20 135
Tercero FO31 = 56 FO32 = 45 FO33 = 24 125
Cuarto FO41 = 45 FO42 = 22 FO43 = 33 100
Totales 215 175 120 510

Las filas corresponden Año de estudio” (Que tiene cuatro tipos de valores: Primero, Segundo, Tercero
y Cuarto) y las columnas que es el “Grado de uso de drogas” (Que tienen tres tipos de valores: Por
curiosidad, Casual, Moderado a intenso).

Se crean tres variables de la siguiente manera:

Elaborado y compilado por Carlos H. VargasPá gina 9


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Nombre Tipo Anchura Decimales Etiqueta Valores


Año_estudio Numérico 4 0 1 = Primero
Año de estudio de los 2 = Segundo
estudiantes 3 = Tercero
4 = Cuarto
Grado Numérico 4 0 1 = Por curiosidad
Grado de uso de 2 = Casual
drogas 3 = Moderado a
intenso
Cantidad Numérico 4 0 Ninguna
Cantidad de
estudiantes que usan
drogas, serán las FO.

La “Vista de variables”, se muestra a continuación:

El siguiente cuadro nos muestra las FE que se deben calcular en cada celda: Es la estructura
que se elabora en la “Vista de datos”:

Grado de uso de drogas entre los estudiantes de educación media, clasificados por año de
estudio
Grado del uso de drogas
Año de estudio Total
Por curiosidad Casual Moderado a intenso
Primero FE11 FE12 FE13 150
Segundo FE21 FE22 FE23 135
Tercero FE31 FE32 FE33 125

Elaborado y compilado por Carlos H. VargasPá gina 10


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Cuarto FE41 FE42 FE43 100


Totales 215 175 120 510

En la “Vista de datos”, se ingresan los siguientes datos que responden a la estructura de la tabla
anterior:

Si en esta pantalla damos un clic al campo “Etiqueta de valores” la Vista de datos nos muestra
lo siguiente:

Solución: Se selecciona el menú “Datos” -------“Ponderar casos”. En la ventana que nos aparece
ponemos un cheque en la opción “Ponderar casos mediante” y, en el campo que se muestra “Variable

Elaborado y compilado por Carlos H. VargasPá gina 11


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

de frecuencia”, ingreso la variable “Cantidad de estudiantes (FO)”, que es la tercera variable definida
en la Vista de Variables, a continuación, le damos aceptar.

Luego seleccionamos el menú “Analizar” -----y seleccionamos la opción “Estadísticos descriptivos”


y en ella seleccionamos “Tablas cruzadas”.

En la ventana que nos aparece, “Tablas cruzadas” en el campo “Filas” ingreso la variable de fila “Año
de estudio” y en el campo “Columna”, ingreso la variable “Grado de uso de drogas”.

Elaborado y compilado por Carlos H. VargasPá gina 12


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Luego en esa misma pantalla de “Tablas cruzadas” damos clic en el botón “Exacta” y en la ventana que
nos aparece, ponemos un cheque en la casilla de Monte Carlos y en los campos que se habilitan
ingresamos: en el campo Nivel de confianza = 95% (sin el porcentaje), en el campo “Número de
muestras" = 510 y luego damos continuar.

Luego en esa misma pantalla de “Tablas cruzadas” damos clic en “Estadísticos” y en la ventana que nos
aparece, ponemos un cheque en la casilla de “Chi Cuadrado” y luego damos continuar.

Elaborado y compilado por Carlos H. VargasPá gina 13


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Luego regresando a la pantalla de “Tablas cruzadas” damos clic en el botón “Casillas” y en la ventana
que se nos despliega damos un cheque en las casillas de “Recuentos” “Observado” y también en
“Esperado” y luego damos continuar.

Luego regresamos a la pantalla “Tablas cruzadas” y damos clic en el botón aceptar y nos aparece la
respuesta siguiente:

Resumen de procesamiento de casos

Casos

Válido Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

Elaborado y compilado por Carlos H. VargasPá gina 14


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Año de estudio de los


estudiantes * Grado de uso 510 100.0% 0 0.0% 510 100.0%
de drogas

La segunda tabla de respuesta nos muestra la tabla de filas y columnas con los valores de las FO y los
valores de las FE para cada una de las 12 celdas de la tabla del ejercicio.

El valor de = Chi- cuadrado de Pearson = 19.369, que es el mismo resultado que se encontró en
forma manual y en Minitab.
Los Grados de Libertad = 6 y el valor de Sigma asintótica (2 caras) = 0.004. Este valor es igual al Valor –
P = 0.004 que ya obtuvimos en Minitab.

PASO 5. Análisis y criterio de decisión.


Para ello utilizaremos el marco teórico siguiente:

Método del valor-p para la prueba de hipótesis


a) Si el valor-p es mayor o igual que α, no rechace la hipótesis nula.
b) Si el valor-p es menor que α, rechace la hipótesis nula.

Elaborado y compilado por Carlos H. VargasPá gina 15


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

El Valor – P (0.004) es < que α (0.05), por esta razón, se dice que se puede rechazar la Hipótesis Nula,
es decir que es posible que la Hipótesis Alternativa sea cierta.
Es decir, es posible que, “la variable “Año de estudio de los estudiantes de educación media” (Variable
de la Fila) si tiene algo en común con la variable “Grado de uso de drogas por parte de los estudiantes”
(Variable de columna)”. Con un nivel de significación del 5%.

Misma conclusión que se obtuvo en forma manual y en Minitab.

2. La institución de derechos de los liberados de prisión, investigo la siguiente pregunta ¿Un hombre
liberado de una prisión tiene una adaptación diferente a la vida civil si regresa a su ciudad natal o si
se va a vivir a otra parte? En otras palabras, ¿hay una relación entre la adaptación a la vida civil y el
lugar de residencia después de salir de prisión? A la agencia le interesa determinar si el ajuste a la
vida civil es contingente respecto del lugar donde vaya el prisionero después de salir en libertad.
Utilice un nivel de significancia de 1%. Los psicólogos de la dependencia entrevistaron a 200 ex
prisioneros seleccionados de manera aleatoria. Mediante una serie de preguntas, los psicólogos
clasificaron la adaptación de cada individuo a la vida civil como sobresaliente, buena, regular o
insatisfactoria. Las clasificaciones de los 200 ex prisioneros se ordenaron de acuerdo a los datos
mostrados en la tabla de contingencia:

Residencia al salir de Adaptación a la vida civil


Total
prisión Sobresaliente Buena Regular Insatisfactoria
Ciudad natal 27 35 33 25 120
No en la ciudad natal 13 15 27 25 80
Total 40 50 60 50 200
R: Ji-Cuadrado de prueba = 5.7291.

SOLUCIÓN EN FORMA MANUAL

PASO 1. Se formulan la hipótesis nula (Ho) y la hipótesis alternativa (H1).

Para plantear Ho y H1 se deben analizar los datos del ejercicio y utilizar el cuadro del marco teórico de
la página 2, en donde se establece la manera de cómo se deben formular.

H0. La variable “Residencia al salir de prisión” (Variable de la Fila) no tiene nada en común con la
variable “Adaptación a la vida civil” (Variable de columna).
H1. La variable “Residencia al salir de prisión” (Variable de la Fila) si tiene algo en común con la
variable “Adaptación a la vida civil” (Variable de columna).

PASO 2. Se establece el nivel de significación.


α = 1%. Nivel de confianza = 99%

PASO 3. Se establece la distribución de muestreo a ser utilizada.


El estadístico Ji cuadrado sirve para probar de manera formal si hay en común o no entre dos variables
con escala nominal, que es el caso de este ejercicio, por lo cual se utilizará la Prueba de Ji-cuadrada .

Datos: En forma tabular se establecen las FO y se calculan las FE de cada una de las celdas de la tabla
de datos.

Elaborado y compilado por Carlos H. VargasPá gina 16


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Calculo de las frecuencias esperadas (FE) de cada celda:

Dónde: Total de la fila = suma de todas las frecuencias de la fila


Total, de la columna = suma de todas las frecuencias de la columna
n = tamaño general de la muestra

Residencia al salir de Adaptación a la vida civil


Total
prisión Sobresaliente Buena Regular Insatisfactoria
Ciudad natal FE11 FE12 FE13 FE14 120
No en la ciudad natal FE21 FE22 FE23 FE24 80
Total 40 50 60 50 200

A continuación, se muestra la tabla con las FO y las FE de cada celda:

Residencia al salir de Adaptación a la vida civil


Total
prisión Sobresaliente Buena Regular Insatisfactoria
Ciudad natal FO11 = 27 FO12 = 35 FO13 = 33 FO14 = 25
120
FE11 = 24 FE12 = 30 FE13 = 36 FE14 = 30
No en la ciudad natal FO21 = 13 FO22 = 15 FO23 = 27 FO24 = 25
80
FE21 = 16 FE22 = 20 FE23 = 24 FE24 = 20
Total 40 50 60 50 200

PASO 4. Se calculan los valores de Chi cuadrada de prueba y de Chi cuadrada crítica (en tabla):

y .

En tabla se calcula ; con α = 0.01 y: (g. de l.) = (# de Filas – 1). (# de Columnas – 1) = (2 - 1) . (4 - 1)


=3
Dónde: F = El número de filas de la tabla y C = El número de columnas de la tabla.

Elaborado y compilado por Carlos H. VargasPá gina 17


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Con estos dos datos se busca en tabal de Ji-cuadrada y se encuentra que es = 11.34.

NOTA: Como buscar en la Tabla de Chi-cuadrada el valor crítico.


La tabla contiene en la parte superior los valores del Nivel de Significación y en la primera columna los
grados de libertad. Por lo tanto, primero ubicamos en la primera columna el valor de 3 y nos vamos por
fila a buscar el valor de 0.01 que es el del nivel de significación, esa intersección entre fila y columna
nos da el valor de 11.34.

PASO 5. Análisis y criterio de decisión.


Para hacer la gráfica de esta función utilizaremos Minitab 16.

Pasos en Minitab: Menú Gráfica------“Gráfica de distribución de probabilidad”, se selecciona la opción


4, “Ver probabilidad” ---Aceptar. En la ventana que nos aparece, en el campo “Distribución”
seleccionamos “Chi-cuadrada” y en el campo Grados de libertad se coloca el valor de 3. Luego
buscamos el campo “Área sombreada” y damos clic en ella y nos aparece otra ventana, en donde
seleccionamos el campo “Valor x”, dando un cheque en ese círculo, luego se selecciona la opción
primera “cola derecha” y en el campo “Valor x” se ingresa el valor de Chi-cuadrada crítica = 11.34----
aceptar. A continuación, nos aparece la gráfica general. Luego damos un clic derecho al mouse sobre la
gráfica encontrada y, seleccionamos “agregar”, “líneas de referencia”, en la ventana que se nos
muestra, en el campo “mostrar líneas de referencia en valores x:”, colocamos el valor de Chi Cuadrada
de prueba = 5.73, luego, “aceptar” y nos aparece la gráfica completa siguiente:

En esta grafica la parte a la izquierda (la de color blanco) antes de 11.34 es la “Región de Aceptación” y
la cola derecha (la de color rojo) es la “Región de Rechazo”.
En esta grafica se coloca el valor de Chi-cuadrado de prueba = 5.7291 y se observa que estará en la
Región de aceptación.
Por esta razón, no se puede rechazar la hipótesis nula (H 0), es decir que, no se ha podido demostrar la
Hipótesis Alternativa.

Elaborado y compilado por Carlos H. VargasPá gina 18


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Es decir, no se ha demostrado que, “la variable “Residencia al salir de prisión” (Variable de la Fila) si
tiene algo en común con la variable “Adaptación a la vida civil” (Variable de columna”). Con un nivel de
significación del 1%.

SOLUCIÓN EN MINITAB 16.


En la Hoja de Trabajo se crea la Tabla de datos del ejercicio. Se usan las columnas de esa tabla
(Sobresaliente, Buena, Regular, Insatisfactoria). Se ingresan los datos de columnas.

Residencia al salir de Adaptación a la vida civil


Total
prisión Sobresaliente Buena Regular Insatisfactoria
Ciudad natal 27 35 33 25 120
No en la ciudad natal 13 15 27 25 80
Total 40 50 60 50 200

Menú “Estadísticas” ----Tablas---Prueba Chi-cuadrada (Tabla de dos factores en hoja de trabajo);

Elaborado y compilado por Carlos H. VargasPá gina 19


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

En la ventana que se nos despliega, nos aparece el campo “Columnas que contiene la tabla”, en ese
campo se colocan las columnas C1 = Sobresaliente; la C2 = Buena, la C3 = Regular y la C4 =
Insatisfactoria, utilizando el cursor y dando seleccionar, una por una.

Luego damos aceptar y a continuación, se muestra la respuesta:

Prueba Chi-cuadrada: Sobresaliente, Buena, Regular, Insatisfactoria

Los conteos esperados se imprimen debajo de los conteos observados


Las contribuciones Chi-cuadradas se imprimen debajo de los conteos esperados

Sobresaliente Buena Regular Insatisfactoria Total


1 27 35 33 25 120
24.00 30.00 36.00 30.00

Elaborado y compilado por Carlos H. VargasPá gina 20


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada
0.375 0.833 0.250 0.833

2 13 15 27 25 80
16.00 20.00 24.00 20.00
0.563 1.250 0.375 1.250

Total 40 50 60 50 200

Chi-cuadrada = 5.729, GL = 3, Valor P = 0.126

En la respuesta se nos muestra la tabla de datos: las FO, las FE y el resultado de la fórmula para cada
operación: Datos de color rojo que se encontraran cuando se resolvió el ejercicio en Forma Manual
(ver cálculo de la formula a continuación).

También nos aparece en la respuesta el valor de Chi-cuadrada de prueba = 5.729; los G. de L. = 3 y el


Valor-P = 0.126.

PASO 5. Análisis y criterio de decisión.


Para ello utilizaremos el marco teórico siguiente:

Método del valor-p para la prueba de hipótesis


a) Si el valor-p es mayor o igual que α, no rechace la hipótesis nula.
b) Si el valor-p es menor que α, rechace la hipótesis nula.

El Valor – P (0.126) es > que α (0.01), por esta razón, se dice que no se puede rechazar la Hipótesis
Nula, es decir que no se ha podido demostrar la Hipótesis Alternativa.
Es decir, no se ha demostrado que, “la variable “Residencia al salir de prisión” (Variable de la Fila) si
tiene algo en común con la variable “Adaptación a la vida civil” (Variable de columna)”. Con un nivel de
significación del 1%.

Nota: la solución y conclusión obtenida en Minitab es la misma que la obtenida en forma manual.

SOLUCIÓN EN SPSS 22.


En la “Vista de variables”, se construye la tabla de valores del ejercicio que estamos estudiando, la cual
tiene dos filas y cuatro columnas.

Residencia al salir de Adaptación a la vida civil


Total
prisión Sobresaliente Buena Regular Insatisfactoria
Ciudad natal 27 35 33 25 120
No en la ciudad natal 13 15 27 25 80
Total 40 50 60 50 200

Elaborado y compilado por Carlos H. VargasPá gina 21


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Las filas corresponden a: “Residencia al salir de prisión” (Que tiene dos tipos de valores: 1 = Ciudad
Natal y, 2 = No en Ciudad Natal) y las columnas que es “Adaptación a la vida civil” (Que tienen cuatro
tipos de valores: 1 = Sobresaliente, 2 = Buena, 3 = Regular y 4 = Insatisfactoria).

Se crean tres variables de la siguiente manera:

Nombre Tipo Anchura Decimales Etiqueta Valores


Residencia Numérico 4 0 Residencia al salir de 1 = Ciudad Natal
prisión 2 = No en Ciudad Natal
Adaptación Numérico 4 0 Adaptación a la vida 1 = Sobresaliente
civil 2 = Buena
3 = Regular
4 = Insatisfactoria
Frecuencia Numérico 4 0 Ninguna
Cantidad de ex
prisioneros

La “Vista de variables” se muestra a continuación:

En la “Vista de datos”, se ingresan los siguientes datos. Se toma como base la estructura que se
estableció en forma manual para encontrar las Frecuencias Esperadas (FE):

Residencia al salir de Adaptación a la vida civil


Total
prisión Sobresaliente Buena Regular Insatisfactoria
Ciudad natal FE11 FE12 FE13 FE14 120
No en la ciudad natal FE21 FE22 FE23 FE24 80
Total 40 50 60 50 200

Elaborado y compilado por Carlos H. VargasPá gina 22


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Si en esta pantalla damos un clic al campo “Etiqueta de valores” la Vista de datos nos muestra
lo siguiente:

Solución: Se selecciona el menú “Datos” -------“Ponderar casos”. En la ventana que nos aparece
ponemos un cheque en la opción “Ponderar casos mediante” y, en el campo que se muestra “Variable
de frecuencia”, ingreso la variable “Cantidad de ex prisioneros (FO)”, que es la tercera variable definida
en la Vista de Variables, a continuación, le damos aceptar.

Elaborado y compilado por Carlos H. VargasPá gina 23


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Luego seleccionamos el menú “Analizar” -----y seleccionamos la opción “Estadísticos descriptivos”


y en ella seleccionamos “Tablas cruzadas”.

En la ventana que nos aparece, “Tablas cruzadas” en el campo “Filas” ingreso la variable de fila
“Residencia al salir del país” y en el campo “Columna”, ingreso la variable “Adaptación a la vida civil”.

Elaborado y compilado por Carlos H. VargasPá gina 24


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Luego en esa misma pantalla de “Tablas cruzadas” damos clic en el botón “Exacta” y en la ventana que
nos aparece, ponemos un cheque en la casilla de Monte Carlos y en los campos que se habilitan
ingresamos: en el campo Nivel de confianza = 99% (sin el porcentaje), en el campo “Número de
muestras" = 200 y luego damos continuar.

Luego en esa misma pantalla de “Tablas cruzadas” damos clic en “Estadísticos” y en la ventana que nos
aparece, ponemos un cheque en la casilla de “Chi Cuadrado” y luego damos continuar.

Elaborado y compilado por Carlos H. VargasPá gina 25


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Luego regresando a la pantalla de “Tablas cruzadas” damos clic en el botón “Casillas” y en la ventana
que se nos despliega damos un cheque en las casillas de “Recuentos” “Observado” y también en
“Esperado” y luego damos continuar.

Luego regresamos a la pantalla “Tablas cruzadas” y damos clic en el botón aceptar y nos aparece la
respuesta siguiente:

Resumen de procesamiento de casos

Casos

Válido Perdidos Total

Elaborado y compilado por Carlos H. VargasPá gina 26


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

N Porcentaje N Porcentaje N Porcentaje

Residencia al salir de prisión


200 100.0% 0 0.0% 200 100.0%
* Adaptación a la vida civil

La segunda tabla de respuesta nos muestra la tabla de filas y columnas con los valores de las FO y los
valores de las FE para cada una de las 8 celdas de la tabla del ejercicio.

En la tabla # 3, el valor de = Chi- cuadrado de Pearson = 5.729, que es el mismo resultado que se
encontró en forma manual y en Minitab.
Los Grados de Libertad = 3 y el valor de Sigma asintótica (2 caras) = 0.126. Este valor es igual al Valor –
P = 0.126 que ya obtuvimos en Minitab.
En este tema de Pruebas de Homogeneidad el Valor-P es igual al valor de Sigma asintótica que se
obtiene en SPSS.

PASO 5. Análisis y criterio de decisión.


Para ello utilizaremos el marco teórico siguiente:

Método del valor-p para la prueba de hipótesis


a) Si el valor-p es mayor o igual que α, no rechace la hipótesis nula.
b) Si el valor-p es menor que α, rechace la hipótesis nula.

El Valor – P (0.126) es > que α (0.01), por esta razón, se dice que no se puede rechazar la Hipótesis
Nula, es decir que no se ha podido demostrar la Hipótesis Alternativa.

Elaborado y compilado por Carlos H. VargasPá gina 27


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Es decir, no se ha demostrado que, “la variable “Residencia al salir de prisión” (Variable de la Fila) si
tiene algo en común con la variable “Adaptación a la vida civil” (Variable de columna)”. Con un nivel de
significación del 1%.

Con estos dos ejercicios resueltos en forma manual, por MINITAB 16 y, por SPSS 22, ya ustedes
pueden resolver los siguientes ejercicios.

-------------------------------------------------------------------------------------------------------------------------------

Continuación de los ejercicios de la Hoja N° 4.

3. Dos grupos A y B cada uno de 100 individuos, padecen una enfermedad. Se administra un suero solo
al grupo A; en todo lo demás, los dos grupos fueron tratados idénticamente. Se encuentra que en los
grupos A y B, 75 y 65 individuos, respectivamente, se han recuperado de la enfermedad. Probar la
hipótesis de que el suero ayuda a curar la enfermedad con un nivel de significación de 0.05. R: Ji-
Cuadrado de prueba = 2.38.

Resultado del tratamiento


Tratamiento Se No se Total
recuperaron recuperaron
Grupo A (Suero) 75 25 100
Grupo B (sin suero) 65 35 100
Total 140 60 200

4. Suponga que en la encuesta de satisfacción de huéspedes de hoteles (ejemplo 6d) se hizo una
segunda pregunta a todos los encuestados que indicaron que no era probable que regresarán. Se
pidió a cada uno de los huéspedes que indicaran la razón principal de su respuesta. La siguiente
tabla presenta los resultados de la tabla de contingencia de 4 x 3. Se desea establecer si existe
evidencia importante de una relación entre la razón principal para no volver y el hotel. Utilizar un
nivel de significancia de 0.05. R: Ji-Cuadrado de prueba = 27.402.

Principal razón para no HOTEL


regresar Golden Palm Palm Royale Palm Princess Total
Precio 23 7 37 67
Ubicación 39 13 8 60
Alojamiento en el cuarto 13 5 13 31
Otras 13 8 8 29
Total 88 33 66 187

5. Un almacén vende lavadoras y aspiradoras eléctricas y tiene 3 vendedores. Las ventas realizadas
en un mes por dichos vendedores, son las siguientes:

Vendedores
Productos Totales
V1 V2 V3
Lavadoras 20 8 15 43
Aspiradoras 17 16 5 38
Totales 37 24 20 81

Elaborado y compilado por Carlos H. VargasPá gina 28


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

¿Demuestra este resultado que la habilidad de cada vendedor depende del tipo de artículo que vende?
Pruebe la hipótesis de homogeneidad al nivel del 5%. R: Ji-Cuadrado de prueba = 7.6303.

6. Un criador de pavos navideños alimenta, con diferentes raciones, a tres grupos de 1,200 pavos
pequeño. Lo que se pretende determinar es si hay alguna asociación entre la mortalidad de cada
grupo y la cantidad de ración que recibe. Utilizar un nivel de significación del 5%. (NOTA: si no
existe asociación, las proporciones de mortalidad entre los grupos deberían ser iguales).

Tipos de pavos
Raciones Total
Vivos Muertos
A 84 16 100
B 97 3 100
C 93 7 100
Total 274 26 300

7. Una compañía tiene en funcionamiento 4 máquinas en 3 turnos diarios. A partir de los registros de
producción, se tienen los siguientes datos respecto al número de interrupciones que se han
producido en el proceso de producción. Determine si las interrupciones tienen algo en común entre
el tipo de la máquina y el turno de trabajo. Utilizar un nivel de significación del 1%.

Turno de MAQUINAS
Total
trabajo A B C D
T1 41 20 12 16 89
T2 31 11 9 14 65
T3 15 17 16 10 58
Total 87 48 37 40 212

8. Los siguientes datos corresponden al número de vehículos que salen de una vía rápida, por 4 salidas
consecutivas a las calles A, B, C y D, entre las 7:30 y 8:00 a.am; entre las 12:00 y 12:30 p.m. y entre las
6:00 y 6:30 p.m. Pruebe si existe alguna relación entre el intervalo-horario y la selección de salidas
laterales, utilizando un nivel de significación del 1%.

Tipos de vehículos
Intervalo-horario Total
A B C D
07:00-8:00 a.m. 125 150 143 117 535
12:00-12:30 p.m. 150 100 97 82 429
18:00-18:30 p.m. 115 125 139 141 520
Total 390 375 379 340 1,484

9. Un fabricante de jalea enlatada quiere averiguar si la calidad que el consumidor encuentra en su


producto depende de la cantidad de colorante empleado en la fabricación del mismo. Para
comprobarlo, reparte 70 latas del producto sin colorante, 80 latas con una coloración tenue y 100
latas del producto con coloración intensa. El encuestado tiene dos opciones para contestar: bueno
o malo. Los datos obtenidos se presentan en el siguiente cuadro. Utilizando un nivel de significación
del 10%, compruebe si la calidad encontrada depende de la calidad del colorante.

Cantidad de colorante empleado en la fabricación


Calidad
Sin color Color Tenue Color intenso

Elaborado y compilado por Carlos H. VargasPá gina 29


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Bueno 28 48 52
Malo 42 32 48

10. Un criminalista llevó a cabo una investigación para determinar si la incidencia de cierto tipo de
delitos variaba de una zona a otra, en una gran ciudad. Para ello se consideraron como delitos: el
asalto, robo en casa, latrocinio y homicidio. El siguiente cuadro muestra el número de delitos
cometidos en cuatro zonas de la ciudad, durante el año pasado. Con estos datos, ¿se puede
concluir, con un nivel de significación del 10%, que el tipo de delito cometido depende de una
región determinad?

Tipo de delito
Zona Asaltos Robos de casas Latrocinios Homicidios
A 162 118 451 18
B 310 196 996 25
C 258 193 458 10
D 280 175 390 19

11. Una prueba que compara la aptitud hacia la matemática entre los estudiantes asiáticos y los
estudiantes estadounidenses de raza blanca, arrojó los siguientes resultados que se muestran en la
tabla. Compruebe la hipótesis de que la distribución de puntajes es la misma independientemente
de significancia del 5%.del país de origen, Utilizar un nivel de significación del 5%.

País de origen
Puntajes Asiáticos Estadounidenses (raza blanca)
70-80 601 22,564
60-69 2,001 86,521
50-59 3,190 158,049
40-49 2,788 151,466
30-39 1,309 74,498
20-29 208 9,892

12. A cada persona de una muestra aleatoria total de 500 votantes se les preguntó su opinión acerca
de un nuevo impuesto municipal. ¿Respalda la evidencia mostrada en la siguiente tabla de que los
votantes dentro de los distintos grupos de residentes tienen opiniones distintas acerca de la
propuesta municipal? Utilizar un alpha del 5%.

Tipo de Posición a la propuesta municipal


Totales
Residente A favor En contra
Urbano 175 75 250
Suburbano 95 80 175
Rural 25 50 75
Totales 295 205 500

13. Los dueños de un centro comercial hicieron varias preguntas para investigar que mejoras son
necesarias acerca del aspecto estético del centro. Se obtuvieron respuestas con las que se
construyó la tabla de contingencia que se muestra a continuación. Luego, se decidió con
anticipación que la muestra quedara estructurada de manera que se entrevistaron exactamente 50
hombres y 50 mujeres. ¿Están distribuidas igualmente en ambos sexos las opiniones sobre la
estética del establecimiento? Utilizar un alpha del 5%.

Elaborado y compilado por Carlos H. VargasPá gina 30


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Sexo del Calificación del aspecto estético del centro comercial


Totales
entrevistado Excelente Bueno Regular Malo
Femenino 6 21 16 7 50
Masculino 8 10 11 21 50
Totales 14 31 27 28 100

14. Se llevó un estudio para determinar si hay una diferencia entre las proporciones de padres en los
estados de Maryland, Virginia, Georgia y Alabama, que están a favor de introducir biblias en las
escuelas primarias. Las respuestas de 100 padres seleccionados al azar en cada uno de estos
estados se registraron en la siguiente tabla. ¿Se puede concluir que las proporciones de padres a
favor de introducir biblias en las escuelas son las mismas para estos estados? Utilizar un alpha del
2.5%.

Estados analizados
Preferencia
Maryland Virginia Georgia Alabama
Sí 65 71 78 82
No 35 29 22 18
15. Se realizó una investigación en dos ciudades de Virginia para determinar el sentimiento de los
votantes con relación a dos candidatos a gobernadores en las próximas elecciones. Se eligieron
aleatoriamente 500 votantes de cada ciudad y se registraron los resultados en el siguiente cuadro.
Probar la hipótesis nula, con un nivel de significación del 5%, de que las proporciones de votantes
que favorecen al candidato A, o que están indecisos son las mismas para cada ciudad.

Ciudades
Sentimiento del votante
Richmond Norfolk
A favor de A 204 225
A favor de B 211 198
Indecisos 85 77

16. Se realizó una investigación en Indiana, Kentucky y Ohio para determinar la actitud de votantes
relacionada con el transporte escolar. Un escrutinio de 200 votantes de cada uno de estos estados
produjo los siguientes resultados que se muestran en la tabla. Con un nivel de significación del
2.5%, probar la hipótesis de que las proporciones de votantes en cada categoría de actitudes son
las mismas para cada uno de los tres estados.

Actitud del votante


Estado Total
Mantenimiento No mantenimiento Indecisos
Indiana 82 97 21 200
Kentucky 187 66 27 280
Ohio 93 74 33 200
Total 362 237 81 680

17. De acuerdo con un estudio de la Universidad John Hopkins publicado en el American Journal of
Public Health, las viudas sobreviven más tiempo que los viudos. Considerar los siguientes datos,
referidos al tiempo que sobreviven después de la muerte del cónyuge, obtenidos de 100 viudas y
de 100 viudos. ¿Se puede concluir, con un nivel de significación del 5%, que la proporción de viudas
y viudos son iguales respecto a los diferentes periodos de tiempo que un cónyuge sobrevive
después de la muerte de su pareja?

Elaborado y compilado por Carlos H. VargasPá gina 31


Asignatura: Estadística 2 Tema: Prueba ji-cuadrada

Tipos de conyuges
Años vividos
Viudas Viudos
Menos de 5 años 25 39
De 5 a 10 años 42 40
Más de 10 años 33 21

Elaborado y compilado por Carlos H. VargasPá gina 32

También podría gustarte