Universidad Adventista de Bolivia
Ingeniería de Sistemas
TAREA GRUPAL
Prueba Chi Cuadrada
Prueba Kolmogorov-Smirnov
Integrantes: Alan Elvis Ochoa Pérez
José Abad Sandoval Ortega
Marvin Cuellar Salinas
Milton Jonnathan Chuima Vargas
Grupo # 6
Modulo: Simulación y Dinámica de
Sistemas
Docente: Ing. Iván Alcon
Fecha: 01/09/2022
Prueba de chi-cuadrado
1. Definición
La prueba de chi-cuadrado, también conocida como Chi-Cuadrado de Pearson
o prueba exacta de Fisher, es uno de los métodos utilizados para probar una
hipótesis en una investigación.
En este artículo te presentaremos en qué consiste, qué tipos existen y cómo
puedes desarrollarla de forma práctica.
La prueba de Chi-Cuadrado es un procedimiento estadístico utilizado para
determinar si existe una diferencia significativa entre los resultados esperados y
los observados en una o más categorías.
Se trata de una prueba no paramétrica que es utilizada por los investigadores
para examinar las diferencias entre variables categóricas en la misma
población. También puede utilizarse para validar o proporcionar un contexto
adicional para las frecuencias observadas.
La idea básica de la prueba es que se comparan los valores de los datos reales
con lo que se esperaría si la hipótesis nula fuera cierta.
De esta forma, se busca determinar si una diferencia entre los datos
observados y los esperados se debe al azar, o si se debe a una relación entre
las variables que se están estudiando.
2. Importancia del chi cuadrado en la investigación
La prueba de Chi-cuadrado es una excelente opción para comprender e
interpretar la relación entre dos variables categóricas.
La tabulación cruzada presenta las distribuciones de dos variables categóricas
simultáneamente, con las intersecciones de las categorías de las variables que
aparecen en las celdas de la tabla.
El cálculo estadístico de Chi-Cuadrado y su comparación con un valor crítico de
la distribución Chi-Cuadrado permite al investigador evaluar si los recuentos de
celdas observados son significativamente diferentes de los recuentos de celdas
esperados.
Debido a la forma en que se calcula el valor de Chi-Cuadrado, es
extremadamente sensible al tamaño de la muestra: cuando el tamaño de la
muestra es demasiado grande (~500), casi cualquier pequeña diferencia
parecerá estadísticamente significativa.
También es sensible a la distribución dentro de las celdas. Esto puede
solucionarse utilizando siempre variables categóricas con un número limitado
de categorías.
3. Tipos de pruebas de Chi-Cuadrado
Existen diferentes tipos de pruebas de Chi-Cuadrado: Prueba de bondad de
ajuste, prueba de independencia y prueba de homogeneidad. Ahora te
presentaremos en qué consiste cada uno:
3.1 Prueba de bondad de ajuste
La prueba de bondad de ajuste Chi-cuadrado se utiliza para comparar una
muestra recogida aleatoriamente que contiene una única variable categórica
con una población mayor.
Esta prueba se utiliza con mayor frecuencia para comparar una muestra
aleatoria con la población de la que se ha recogido potencialmente.
3.2 Prueba de independencia
La prueba de independencia de Chi-Cuadrado busca una asociación entre dos
variables categóricas dentro de la misma población.
A diferencia de la prueba de bondad de ajuste, la prueba de independencia no
compara una única variable observada con una población teórica, sino dos
variables dentro de un conjunto de muestras entre sí.
3.3 Prueba de homogeneidad de Chi-Cuadrado
La prueba de homogeneidad de Chi-Cuadrado se organiza y ejecuta
exactamente igual que la prueba de independencia.
La principal diferencia que hay que recordar entre ambas es que la prueba de
independencia busca una asociación entre dos variables categóricas dentro de
la misma población, mientras que la prueba de homogeneidad determina si la
distribución de una variable es la misma en cada una de varias poblaciones
(asignando así la propia población como segunda variable categórica).
3.4 Formula general
Para obtener el valor del Chi-Cuadrado. Se tiene la siguiente formula:
4. Cómo realizar una prueba de Chi-Cuadrado
Ahora que ya sabes un poco más acerca de qué es una prueba Chi-Cuadrado,
te presentaremos cómo llevarla a cabo a través de 5 pasos principales:
Define tus hipótesis nula y alternativa antes de iniciar la recolección de datos.
Decide cuál será el valor alfa. Esto implica decidir el riesgo que estás dispuesto
a asumir de llegar a una conclusión errónea. Por ejemplo, supongamos que
fijamos un valor α=0,05 para las pruebas de independencia. En este caso, has
decidido un riesgo del 5 % de concluir que las dos variables son
independientes, cuando en realidad no lo son.
Comprueba los datos para ver si hay errores.
Comprueba los supuestos de la prueba.
Realiza la prueba y obtén tus conclusiones.
5. Chi cuadrado como prueba de asociación
Supongamos que un investigador está interesado en evaluar la asociación
entre uso de cinturón de seguridad en vehículos particulares y el nivel
socioeconómico del conductor del vehículo. Con este objeto se toma una
muestra de conductores a quienes se clasifica en una tabla de asociación,
encontrando los siguientes resultados:
Tabla I. Tabla de asociación, valores observados.
¿Permiten estos datos afirmar que el uso del cinturón de seguridad depende
del nivel socioeconómico? Usaremos un nivel de significación alfa=0,05.
Los pasos del análisis estadístico en este caso son los siguientes:
a) En primer lugar se debe plantear las hipótesis que someteremos a prueba
H0: “El uso de cinturón de seguridad es independiente del nivel
socioeconómico”.
H1: “El uso de cinturón de seguridad depende del nivel socioeconómico”.
En esta prueba estadística siempre la hipótesis nula plantea que las variables
analizadas son independientes.
b) En segundo lugar, obtener (calcular) las frecuencias esperadas
Estas son las frecuencias que debieran darse si las variables fueran
independientes, es decir, si fuera cierta la hipótesis nula.
Las frecuencias esperadas se obtendrán de la distribución de frecuencias del
total de los casos, 51 personas de un total de 94 usan el cinturón y 43 de 94 no
lo usan. Esa misma proporción se debería dar al interior de los tres grupos de
nivel socioeconómico, de manera que el cálculo responde al siguiente
razonamiento: si de 94 personas 51 usan cinturón; de 21 personas, ¿cuántas
debieran usarlo?
La respuesta a esta pregunta se obtiene aplicando la “regla de tres” y es 11,4.
Este procedimiento debe repetirse con todas las frecuencias del interior de la
tabla.
El detalle de los cálculos es el siguiente:
Nivel bajo: (21x51/94)=11,4-(21x43/94)=9,6
Nivel medio: (31x51/94)=16,8-(31x43/94)=14,2
Nivel alto: (42x51/94)=22,8-(42x43/94)=19,2
Estas son las frecuencias que debieran presentarse si la hipótesis nula fuera
verdadera y, por consiguiente, las variables fueran independientes.
Estos valores los anotamos en una tabla con las mismas celdas que la anterior;
así tendremos una tabla con los valores observados y una tabla con los valores
esperados, que anotaremos en cursiva, para identificarlos bien.
Tabla II. Tabla de asociación, valores esperados.
c). En tercer lugar se debe calcular el estadístico de prueba
En este caso, el estadístico de prueba es Ji-cuadrado que, como dijimos al
comienzo, compara las frecuencias que entregan los datos de la muestra
(frecuencias observadas) con las frecuencias esperadas, y tiene la siguiente
fórmula cálculo:
donde “Oi” representa a cada frecuencia observada y ei representa a cada
frecuencia esperada.
De este modo el valor del estadístico de prueba para este problema será:
Entonces Este es el valor de nuestro estadístico de prueba.
Comprobamos el ejercicio a través de simulador en línea:
“Chi-Square Calculator | Good Calculators”