La Prueba de Chi Cuadrado

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 15

LA PRUEBA DE CHI CUADRADO

El estadístico ji-cuadrado (o chi cuadrado), que tiene distribución de probabilidad del mismo


nombre, sirve para someter a prueba hipótesis referidas a distribuciones de frecuencias. En
términos generales, esta prueba contrasta frecuencias observadas con las frecuencias
esperadas de acuerdo con la hipótesis nula.

Podríamos estar interesados en averiguar si ciertos conjuntos de datos son independientes.


Supongamos que recopilamos datos acerca del color favorito de camisetas por hombres y
mujeres. Podríamos querer averiguar si el color y el sexo son independientes o no.

Una forma de hacerlo es llevando a cabo una prueba de Chi-cuadrado (  ) para la


2

independencia.

Cuando dos variables son independientes una no afecta a la otra. Aquí estaremos averiguando
si el sexo de una persona influye en la elección del color.

Ejemplo: Dada la tabla de contingencia hallar sobre la preferencia de colores de camisetas


entre hombres y mujeres. Hallar la Prueba de Chi cuadrado.

Para llevar a cabo una prueba Chi-cuadrado hay cuatro pasos principales

H 0 y la hipótesis alternativa H1
Paso1: Escribir la Hipótesis nula

H 0 indica que los conjuntos son independientes.

H1 indica que los conjuntos no son independientes.

Por ejemplo, las hipótesis para el color de la camisa y el sexo podrían ser:

H 0 : El color de la camisa es independiente del sexo

H1 : El color de la camisa no es independiente del sexo.

Paso2: Calcular el estadístico Chi cuadrado

Primero, necesitamos colocar los datos en una tabla de contingencia, que muestra las
frecuencias de dos variables. Los elementos en la tabla son los datos observados. Los datos
deben ser frecuencias (No porcentajes).

Si nos dan la tabla de contingencia, podríamos necesitar extenderla para incluir una fila o una
columna adicionales para los “totales”

A partir de los datos observados, podemos calcular las frecuencias esperadas.


El numero esperado de hombre que les gusta las camisetas negras seria:

150 83 83 150 83
f e (48)    300    41,5
300 300 300 2
El numero esperado de hombre a los que les gusta las camisetas blancas es:

150 58 58  150 58
f e (48)    300    29
300 300 300 2 , y así sucesivamente

Los valores esperados nunca pueden ser menores que 1

Los valores esperados deben ser mayores o iguales a 5.

Si hay celdas con valores entre 1 y 5, se pueden combinar columnas o filas en la tabla.

Para los cálculos hechos a mano, necesitamos las fracciones esperadas, para hallar el valor de
2 .

( fo  fe )2
 2
Cal 
Para calcular el valor de  , se usa la formula
2
fe

f o : frecuencia observada , f e : frecuencia esperada


Donde

Paso3: Calcular el valor critico

Primero hay que mencionar el nivel de significación. Este está dado en las preguntas de los
exámenes, pero en los proyectos hay que decidir qué nivel usar. Los niveles mas comunes son
1% , 5% y 10%

Luego se debe calcular el número de grados de libertad.

Gl  (nde filas  1)(n de columnas  1)

El nivel de significación y los grados de libertad se pueden usar para hallar el valor critico. Sin
embargo, el valor critico siempre estará dado.

 2Cal con el  2Critico


Paso 4: Comparar

 2Cal   2Critico , entonces no se rechaza la hipótesis nula. (Se acepta la hipótesis


 Si ,
Nula)
 2Cal   2Critico , entonces se rechaza la hipótesis Nula.
 Si ,

Usando la CPG, podemos comparar el valor de p con el nivel de significación

 Si el valor de p < que el nivel de significación, entonces se rechaza la hipótesis nula


 Si el valor de p > que el nivel de significación, entonces se acepta la hipótesis nula.

El valor de p es el valor de la probabilidad. Es la probabilidad de la evidencia en contra de


la hipótesis Nula.
Ejemplo1 : Dada la tabla de contingencia hallar sobre la preferencia de colores de camisetas
entre hombres y mujeres. Hallar la Prueba de Chi cuadrado, a un nivel de significación de 5%

SOLUCION

83 150
f e (48)   41,5
300
83  150
f e (35)   41,5
300
58 150
f e (12)   29
300
58 150
f e (46)   29
300
75 150
f e (33)   37,5
300
75 150
f e (42)   37,5
300
84 150
f e (57)   42
300
84 150
f e (27)   42
300
Colocamos los valores esperados en otro cuadro de doble entrada tal como lo valores
observados.

Ahora calculamos la prueba Chi cuadrado.

(48  41,5) 2 (12  29) 2 (33  37,5) 2 (57  42) 2 (35  41, 5) 2 (46  29)2 (42  37,5)2 (27  42)2
 2Calculado        
41,5 29 37,5 42 41,5 29 37,5 42

 2Calculado  33,8

Gl  (n filas  1)(n columnas  1)  (2  1)(4  1)  3


Hallamos el grado de libertad.

Nivel de significación de 0,05


 2Calculado  33,8 ,  2Critico  7,8147 , entonces como  2Calculado   2Critico , se rechaza la
Hipótesis Nula.

Además, como p  0, 0000002 , grado de significación 0, 005

Como p  0, 05 , entonces se rechaza la Hipótesis Nula.


SOLUCIONMEDIANTE CALCULADORA DE PANTALLA GRAFICA.

PROBLEMAS DE APLICACIÓN

1.-

Una entrenadora de baloncesto estuvo observando a 60 de sus jugadores para determinar si


su rendimiento y su peso eran variables independientes la una de la otra. Fue anotando sus
observaciones, tal y como se muestra en la siguiente tabla.
Ella decide realizar una prueba de independencia de χ 2 a un nivel de significación del 5 % .

(d) Para esta prueba,

(i)indique la hipótesis nula; [1]

(ii) halle el valor del parámetro p . [2]

(e) Indique la conclusión de esta prueba. Justifique su respuesta. [2]


M18/5/MATSD/SP2/SPA/TZ0/XX

2.- En una competición internacional, los participantes pueden responder a las preguntas
solamente en una de estas tres lenguas: portugués, chino mandarín o hindi. En la competición
hubo 80 participantes. En la siguiente tabla se indica cuántos de estos participantes
contestaron en portugués, cuántos en mandarín y cuántos en hindi.

(a) Indique cuántos varones contestaron a las preguntas en portugués. [1]

Se escoge un varón al azar.

(b) Halle la probabilidad de que el varón haya contestado a las preguntas en hindi. [2]

Ahora se escogen dos mujeres al azar.

(c) Calcule la probabilidad de que una mujer haya contestado a las preguntas en mandarín y la
otra haya contestado a las preguntas en hindi. [3]
M18/5/MATSD/SP1/SPA/TZ0/XX

3.- En un colegio, a todos los alumnos de Estudios Matemáticos NM se les tomó un examen.
El examen constaba de cuatro preguntas y cada una correspondía a una unidad distinta del
programa de estudios. La calidad de cada pregunta se calificaba de satisfactoria o de no
satisfactoria. Cada alumno respondía solo tres de las cuatro preguntas, cada una en una hoja
de respuesta distinta.

La siguiente tabla muestra, para cada pregunta, el número de respuestas satisfactorias y no


satisfactorias que hubo.

(a) Si profesor elige una respuesta al azar, halle la probabilidad de que

(i) sea una respuesta a la pregunta de Cálculo;

(ii) sea una respuesta satisfactoria a la pregunta de Cálculo;

(iii) sea una respuesta satisfactoria, sabiendo que es una respuesta correspondiente a la
pregunta de Cálculo. [6]

(b) El profesor agrupa las respuestas por unidad, y elige dos respuestas a la pregunta de Lógica.
Halle la probabilidad de que las dos respuestas hayan sido no satisfactorias.
[3]

Con los datos que se muestran en la tabla se realizó una prueba de χ2 a un nivel de
significación del 5 %.

(c) Indique la hipótesis nula para esta prueba. [1]

(d) Muestre que la frecuencia esperada de respuestas satisfactorias a la pregunta de Cálculo es


igual a 12.
[1]

(e) Escriba el número de grados de libertad de esta prueba.


[1]

(f) Utilice la calculadora de pantalla gráfica para hallar el estadístico χ2 para estos datos. [2]

Para esta prueba, el valor crítico es 7,815.

(g) Indique la conclusión de esta prueba de χ2. Dé una razón que justifique su respuesta.
[2]
M17/5/MATSD/SP2/SPA/TZ0/XX

4.- En un hospital han recogido datos de 1000 pacientes ingresados en cuatro plantas distintas

para analizar la calidad de la atención sanitaria que reciben. Estos datos se reúnen en la
siguiente tabla, donde se muestra el número de pacientes que contrajeron una
infeccióndurante su estancia en el hospital
Para ello, se llevó a cabo una prueba χ2 a un nivel de significación del 5 %.

El valor crítico correspondiente a esta prueba es 7,815.

La hipótesis nula correspondiente a esta prueba es

H0: El contraer una infección durante una estancia en el hospital es independiente de la planta
en la que te ingresen.

(a) Halle la frecuencia esperada de pacientes que contrajeron una infección estando en la

planta Nightingale. [2]

(b) Para esta prueba, escriba el estadístico χ2 . [2]

(c) Indique, dando una respuesta razonada, si se debería rechazar o no la hipótesis nula. [2]
N16/5/MATSD/SP1/SPA/TZ0/XX

5.- En la cafetería de un colegio anotan el sexo y la bebida preferida (té, café o chocolate
caliente) de unos estudiantes. Los resultados se muestran en la siguiente tabla.

(a) Escriba el número total de estudiantes que participaron en la encuesta. [1]

Se llevó a cabo una prueba de χ2 a un nivel de significación del 5 %.

(b) Escriba la hipótesis nula para esta prueba. [1]

(c) Utilice la calculadora de pantalla gráfica para hallar el estadístico χ2 . [2]

El valor crítico, a un nivel de significación del 5 %, es igual a 5,99.

(d) Indique la conclusión de esta prueba. De una respuesta razonada. [2]


N15/5/MATSD/SP1/SPA/TZ0/XX

6.- A 180 espectadores de un campeonato de natación se les preguntó cuál, de cuatro estilos
de natación, preferían ver.
Las respuestas que dieron se muestran en la siguiente tabla.

Se llevó a cabo una prueba χ 2, a un nivel de significación del 5 %.

(a) Escriba la hipótesis nula para esta prueba. [1]

(b) Escriba el número de grados de libertad. [1]

(c) Escriba el valor de χ 2calc. [2]

El valor crítico, a un nivel de significación del 5 %, es igual a 7,815.

(d) Indique de manera razonada cuál es la conclusión de la prueba. [2]


N13/5/MATSD/SP1/SPA/TZ0/XX

7.-Una tienda fue anotando sus ventas de televisores durante el Mundial de fútbol

de 2010. Analizaron el número de televisores vendidos, desglosado por sexo del comprador y

por tamaño de la pantalla del televisor.

Esta información aparece resumida en la siguiente tabla, donde S representa el tamaño

de la pantalla del televisor en pulgadas.

La tienda desea utilizar esta información para predecir la probabilidad de vender

televisores de cada uno de estos tamaños para el Mundial de fútbol de 2014.

(a) Utilice la tabla para hallar la probabilidad de que

(i) una mujer compre un televisor;

(ii) se compre un televisor con un tamaño de pantalla de 32 < S ≤ 46 ;

(iii) una mujer compre un televisor con un tamaño de pantalla de 32 < S ≤ 46 ;


(iv) se compre un televisor con un tamaño de pantalla más grande que 46 pulgadas, sabiendo
que el que lo compra es un hombre. [6]

El gerente de la tienda quiere determinar si el tamaño de pantalla elegido es independiente


del sexo del comprador. Para ello, se lleva a cabo una prueba de chi cuadrado a un nivel de
significación del 1 %.

(b) Escriba la hipótesis nula.


[1]

(c) Compruebe que la frecuencia esperada de mujeres que compraron un tamaño de pantalla
de 32 < S ≤ 46 , es igual a 79, redondeando al número entero más próximo.
[2]

(d) Escriba el número de grados de libertad. [1]

(e) Escriba el valor calculado de χ2 . [2]

(f) Escriba el valor crítico de esta prueba.


[1]

(g) Determine si se debería aceptar la hipótesis nula. Dé una respuesta razonada.


[2]
N12/5/MATSD/SP2/SPA/TZ0/XX

8.- Pam ha estado recabando datos de un grupo de 400 alumnos del Diploma del BI.

Les ha preguntado qué asignatura de Matemáticas han estudiado y en qué idioma han hecho
el examen (inglés, español o francés). A continuación, se muestra un resumen de los datos
recogidos.

Se elige al azar a un estudiante del grupo.

(a) Halle la probabilidad de que el estudiante

(i) haya estudiado Matemáticas NS;

(ii) haya hecho el examen en francés;

(iii) haya estudiado Matemáticas NS y haya hecho el examen en francés;

(iv) no haya estudiado Matemáticas NM y no haya hecho el examen en inglés;


(v) haya estudiado Estudios Matemáticos NM, sabiendo que dicho estudiante hizo el examen
en español.
[8]

Pam cree que la asignatura de Matemáticas que elige cada estudiante es independiente del
idioma en el que dicho estudiante hace el examen.

(b) Utilizando las respuestas anteriores de los apartados (a) (i), (ii) y (iii), indique si

hay o no pruebas que sustenten la teoría de Pam. Dé una respuesta razonada.


[2]

Pam decide poner a prueba su teoría utilizando una prueba de chi-cuadrado a un nivel de
significación del 5 %.

(c) (i) Establezca la hipótesis nula para esta prueba.

(ii) Compruebe que el número esperado de alumnos de Estudios Matemáticos

NM que hicieron el examen en español es 41,3, redondeando a 3 cifras

significativas.
[3]

(d) Escriba

(i) el valor calculado de chi-cuadrado;

(ii) el número de grados de libertad;

(iii) el valor crítico de chi-cuadrado.


[4]

(e) Indique, dando una razón, si a un nivel de significación del 5 % hay suficientes

pruebas que indiquen que la teoría de Pam es correcta.


[2]
N11/5/MATSD/SP2/SPA/TZ0/XX

9.-Se ha realizado una encuesta, y en ella ha participado un grupo de 200 personas. A cada una
de estas personas se le preguntó si fumaba o no. La información recabada se organizó en la
siguiente tabla.

Se escoge al azar una persona de este grupo.

(a) Escriba la probabilidad de que esta persona sea fumadora. [2]

(b) Escriba la probabilidad de que esta persona sea hombre, sabiendo que es fumador. [2]
(c) Halle la probabilidad de que esta persona sea fumadora o sea hombre. [2]
N10/5/MATSD/SP1/SPA/TZ0/XX

10.- A esos mismos 100 alumnos se les pregunta también cuántas comidas, en promedio,
tienen al día. Los datos recabados se han organizado en la siguiente tabla.

Se lleva a cabo una prueba de  a un nivel de significación del 5 %.


2

H0 .
(a) Escriba para esta prueba la hipótesis nula, [1]

(b) Escriba el número de grados de libertad de esta prueba. [1]

(c) Escriba el valor crítico de esta prueba. [1]

(d) Compruebe que el número esperado de mujeres que hacen más de 5 comidas al día es
igual a 13 (redondeando al número entero más próximo). [2]

 2Calc [2]
(e) Utilice su calculadora de pantalla gráfica para hallar, para estos datos, el valor de

H 0 . Justifique su respuesta.
(f) Decida si se debe o no aceptar [2]
N10/5/MATSD/SP2/SPA/TZ0/XX

11.- En un estudio en el que participaron 100 alumnos, pareció detectarse una diferencia entre
varones y mujeres, cuando se les preguntó por su color de coche preferido.

Los resultados se muestran en la siguiente tabla. Se llevó a cabo una prueba de  .


2

(a) Escriba el número total de alumnos varones. [1]

(b) Compruebe que la frecuencia esperada de varones que prefieren coches azules es

igual a 12,6. [2]

El valor calculado de χ 2 es 1,367.


(c) (i) Escriba para esta prueba la hipótesis nula.

(ii) Escriba el número de grados de libertad.

(iii) Escriba el valor crítico de χ 2 a un nivel de significación del 5 % .

(iv) Determine si se debería aceptar la hipótesis nula. Dé una respuesta razonada. [5]
N09/5/MATSD/SP2/SPA/TZ0/XX+

12.- Jorge ha realizado una encuesta entre 200 conductores. Les ha hecho dos preguntas:

¿Hace cuánto tiempo que tiene permiso de conducir?

¿Se pone el cinturón de seguridad cuando conduce?

Las respuestas aparecen resumidas en la siguiente tabla.

(a) Jorge realiza una prueba de  a un nivel de significación del 5 % para investigar si el uso
2

del cinturón de seguridad está asociado con el tiempo que hace que el conductor tiene
permiso de conducir.

H0 .
(i) Escriba la hipótesis nula,

(ii) Escriba el número de grados de libertad.

(iii) Compruebe que el número esperado de conductores que se ponen el cinturón de


seguridad y que tienen permiso de conducir desde hace más de 15 años es igual a 22
redondeando al número entero más cercano.

(iv) Escriba para estos datos el estadístico  .


2

H 0 ? Justifique su respuesta.
(v) ¿Acepta Jorge la [8]

(b) Considere los 200 conductores que participaron en la encuesta. Se escoge

un conductor al azar. Halle la probabilidad de que:


(i) este conductor se ponga el cinturón;

(ii) el conductor no se ponga el cinturón, sabiendo que el conductor tiene permiso de conducir
desde hace más de 15 años.

(c) Se escogen dos conductores al azar. Halle la probabilidad de que

(i) ambos se pongan el cinturón;

(ii) al menos uno se ponga el cinturón. [6]

También podría gustarte