Distribucion Chi Cuadrado - Gupo 09
Distribucion Chi Cuadrado - Gupo 09
Distribucion Chi Cuadrado - Gupo 09
INGENIERÍA QUÍMICA
ESCUELA PROFESIONAL DE INGENIERÍA QUÍMICA
DISTRIBUCION DE CHI-CUADRADA
DOCENTE: ALUMNO(A)S:
ing. Vilma Rosario Calderón Flores Gomez Romero Erick Renato IQI
Carl
Friedrich
Gauss
Así, se dice que una característica sigue una
distribución normal de media y varianza , y se
denota como , si su función de
densidad viene dada por la ecuación 1.
RAZONES DE LA IMPORTANCIA EN LA ESTADÍSTICA
• test de Shapiro-Wilk
El test de Shapiro-Wilk funciona bien con muestras pequeñas (menores de 50), se ejecuta con la función
shapiro.test().
2. Analíticamente: test de Shapiro-Wilk, de
Kolmogorov–Smirnov.
• test de Kolmogorov–Smirnov
El test de Kolmogorov–Smirnov
funciona bien con muestras pequeñas (mayores de 50), se ejecuta con la función
ks.test().
ÁREA BAJO LA CURVA NORMAL ESTÁNDAR
El área bajo la curva normal estándar es útil para asignar probabilidades de ocurrencias de la variable X.
Debemos tomar en cuenta que el área total bajo la curva es igual a 1, por ser una gráfica simétrica cada
mitad tiene un área de 0.5 .
PASOS PARA DETERMINAR EL
ÁREA BAJO LA CURVA NORMAL
ESTÁNDAR:
● PASO 1: Interpretar gráficamente
el área de interés.
● PASO 2: Determinar el valor de Z.
● PASO 3: Busca en la tabla de
probabilidades.
● PASO 4: Hacer la suma o resta de
áreas para encontrar la
probabilidad deseada.
HALLANDO EL ÁREA BAJO LA CURVA
EJERCICIO 1
Supongamos que sabemos que el peso de un grupo de estudiantes universitarios sigue una distribución
aproximadamente normal, con una media de 70kg y una desviación estándar de 10 kg.
µ=70kg
σ=10kg
Determine la probabilidad de que un estudiante tenga un peso menor o igual a 75kg.
75kg
Paso 02: Determine el valor de Z:
Z=(x-µ)/σ = (75-70)/10 =0.50
Paso 03: Buscar en la tabla de probabilidades.
Buscamos en la tabla. El valor Z=0.50 y obtenemos el área de 0.6915
Paso 04: Hacer la suma o resta de áreas para encontrar la
probabilidad deseada.
En este ejemplo no es necesario realizar la resta a 1, ya que el área es la misma que se representa en la tabla .
Por lo tanto la probabilidad de que X<75 es igual a 0.6915. (En porcentaje sería el 69,15%)
EJERCICIO 2
Shaver manufacturing, Inc. Ofrece a sus empleados seguros de atención dental. Un estudio reciente
realizado por el director de recursos humanos demuestra que el costo anual por empleado tuvo una
distribución de probabilidad normal, con una media de $1280 y una desviación estándar de $420
anuales.
1500
b) ¿Qué porcentaje de empleados genero entre $1500 y $2000 anuales de gastos dentales?
a) ¿Cuál es la probabilidad de que tarde al menos media hora para llegar al trabajo?
𝑦
𝑃 (𝑥 ≥ 30)
𝜇=24
𝜎 =3.8 ?
𝑥 − 𝜇 30 − 24 𝑥
𝑧=
𝜎
=
3.8
=1.58
𝑦 24 30
𝑓 (𝑧)
𝑃 ( 𝑥 ≥30 )=𝑃 ( 𝑧 ≥ 1.58)
𝑥
¿ 1− 0.94295=0.05705 0 1,58
b) Si su primera clase a las 9:00 a.m. y el profesor sale a diario de su casa a las
8:45. ¿Qué porcentaje de las veces llegará tarde al trabajo?
𝑥
𝑃 (𝑥 ≥ 15)
𝜇=24
𝑥 − 𝜇 15 −24
𝑧=
𝜎
=
3.8
=− 2.37 15 24 𝑦
𝑓 (𝑧)
𝑃 ( 𝑥 ≥15 )=𝑃 ( 𝑧 ≥ 2.37)
¿ 1 − 0.0089 −2.37 0 z
¿ 0.9911= 99.11 %
𝜇=24
𝜎 =3.8
𝑃 ( 𝑥 <𝑡 ) =0.85
𝑥−𝜇
𝑍=
𝜎
+
𝑥=( 1.04 )( 3.8 )+ 24=27.95=27 : 57 ≈ 28 𝑚𝑖𝑛
El profesor debe salir de su casa a más tardar a las 8:32 a.m. para llegar a tiempo el 85% de las veces y no perder
el estímulo por puntualidad
EJERCICIO 4
Los salarios mensuales de los recién graduados que acceden a su primer empleo se distribuyen según una ley normal de
media 1300 € y desviación típica 600 €. Calcular el porcentaje de graduados que cobran: a) Menos de 600 € al mes b)
Entre 1000 y 1500 € al mes c) Más de 2200 € al mes
SOLUCIÓN:
• x: variable aleatoria “salarios mensuales, en euros, de los recién graduados en su primer empleo”.
• La distribución de la variable x es N(1300, 600); μ = 1300; σ = 600
• Hay que tipificar la variable para obtener las probabilidades a partir de la tabla N(0, 1).
Por tanto, el 32,08% de los recién graduados cobra entre 1000 y 1500 € al mes en su primer trabajo.
CHI-CUADRADO
• Es una prueba de estadística descriptiva, esta se aplica al estudio de dos variables.
• Otro de sus usos es en intervalos de confianza y pruebas de hipótesis para las varianzas o
desviaciones estándar.
• Se simboliza por
Existen tres usos relevantes de la prueba :
– Prueba de bondad de ajuste (una variable)
En una prueba de ajuste la hipótesis nula establece que una variable X tiene una cierta
distribución de probabilidad con unos determinados valores de los parámetros.
– Prueba de independencia o contingencia (dos variables)
La prueba chi-cuadrado de contingencia sirve para comprobar la independencia de
frecuencias entre dos variables aleatorias, X e Y.
– Prueba de homogeneidad (dos variables)
Otra de las aplicaciones interesantes de la prueba chi-cuadrado de independencia consiste
en la comprobación de la homogeneidad de distintas muestras de una variable.
TIPOS DE HIPÓTESIS
Las dos hipótesis con los que se va a trabajar:
GRADOS DE LIBETAD
Es el numero de valores que pueden ser asignados de forma arbitraria ,antes de que el resto
de las variables tomen un valor automáticamente.
A priori, tendrá tantos grados de libertad como parejas frecuencia observada - frecuencia
esperada
FORMULA DEL CHI CUADRADO
PROPIEDADES
FUNCIÓN DE DENCIDAD FUNCIÓN DISTRIBUCIÓN ACUMULADA
Es una distribución de probabilidad continua con
Su función de distribución es :
un parámetro que representa los grados de
libertad de la variable aleatoria. Donde y(k,z) es la función gamma incompleta
Su función de densidad es :
El valor esperado y la varianza de una variable
aleatoria X con distribución son , respectivamente , K Y
2K .
APLICACIONES
• La distribución chi-cuadrada ) tiene muchas aplicaciones en inferencia estadística. La
más conocida es la de la denominada prueba chi-cuadrada (utilizada como prueba de
independencia y como prueba de bondad de ajuste y en la estimación de varianzas.
Véase esto también
La Distribución chi-cuadrado, tiene por función de densidad
La Distribución chi-cuadrado no tiene sentido para valores negativos de x, como se puede ver en la figura.
Téngase en cuenta que para k = 1 y k = 2 la función de densidad para x = 0, se hace infinito.
También vemos que al aumentar el número de grados de libertad, la curva se aproxíma a la distribución normal .
PROCEDOMIENTOS
Se calcula a través de una tabla de contingencia o tabulación.
Es una tabla de dos dimensiones y cada dimensión contienen una variable
Cada variable se subdivide en dos o más categorías.
Pasos para resolverlos:
1) Defina la hipótesis de trabajo.
2) Defina el nivel de significancia para la prueba estadística.
3) Calcule los grados de libertad para la prueba.
4) Establezca el valor de rechazo de la hipótesis nula para la distribución .
5) Calcular el valor para el estadístico de contraste .
6) Calcular el valor de .
7) Interpretación.
EJERCICIO 1
Hipótesis Nula (): No depende de la tienda
Hipótesis Alterna (): Si depende de la tienda
Margen de error = 0.1
TRANSFERENCIAS 93 18 32 143
TARJETAS 94 98 49 241
Donde:
f = Frecuencia obtenida
ft = Frecuencia esperada
GRADOS DE LIBERTAD: (g!)
Ubicamos el margen de error que nos dio el ejercicio en el cuadro de distribución de
Hipotesis Nula (): No depende de la tienda
Hipótesis Alterna (): Si depende de la tienda
Donde:
f = Frecuencia obtenida
ft = Frecuencia esperada
GRADOS DE LIBERTAD: (g!)
Hipotesis Nula (): No depende de la tienda
Hipótesis Alterna (): Si depende de la tienda
Máquinas
Repetición
A B C D
1 250.3 249.3 250 251.1
2 250.2 246.8 251.1 250.1
3 249.9 248.3 250.9 248.9
4 249.3 247.9 248.3 249.3
5 250.6 249.7 248.9 251
6 250.3 249.9 249.9 249.9
Total 1500.6 1491.9 1499.1 1500.3
Promedio 250.1 248.65 249.85 250.05
Si 0.2 1.44 1.20 0.78
a) Prueba el supuesto de normalidad los reportes.
P1)PLANTENAMIENTO DE HIPÓTESIS
P3) P-valor
P4) CRITERIO DECISIÓN:
Máquina P-valor ; α = 0.05
A 0.254 ; P-valor > α
B 0.576 ; P-valor>α
C 0.630 ; P-valor> α
D 0.621 ; P- valor> α
P5) CONCLUSIÓN:
Se cumple que el peso de las bolsas de detergente se distribuye normalmente.
b) Pruebe el supuesto homogeneidad de varianzas; α= 0.05
P1) PLANTEAMIENTO DE HIPÓTESIS:
Ho: 𝜎21 = 𝜎2 2 = 𝜎23 = 𝜎24 = 𝜎2
HI: Al menos una 𝜎i2 es diferente 𝑖 = 1,2,3,4
P2) NIVEL DE SIGNIFICACION:
α = 5%
P3) PRUEBA ESTADÍSTICA:
Máquinas
Repetición
A B C D Total
1 250.3 249.3 250 251.1 1000.7
2 250.2 246.8 251.1 250.1 998.2
3 249.9 248.3 250.9 248.9 998
4 249.3 247.9 248.3 249.3 994.8
5 250.6 249.7 248.9 251 1000.2
6 250.3 249.9 249.9 249.9 1000
Total 1500.6 1491.9 1499.1 1500.3 5991.9
ni 6 6 6 6
ni-1 5 5 5 5 20
S^2 0.204 1.439 1.199 0.783
(ni-1)S^2 1.02 7.195 5.995 3.915 18.125
(n-1)lnS^2 -7.94817643 1.81974214 0.90743938 -1.22311291 -6.44410782
1/(ni-1) 0.2 0.2 0.2 0.2 0.8
S^2p 0.90625
t= 4
Q= 4.1311
4P) CRITERIO DE DESICIÓN:
=7.81473
5P) CONCLUSION:
Con un nivel de significancia del 5% no se rechaza la hipótesis nula; es decir las varianzas en los 4 grupos son
homogéneos, por lo tanto se cumple el supuesto de homogeneidad de varianzas.
PRUEBA EN MINITAB:
v= (2-1) (2-1)
v= 1
p= 1- 0.001 = 0.99
Comparación entre los valores del chi-cuadrado calculado y el crítico
X2 ≤ valor crítico
6.2248 ≤
6.635
Entonces se acepta la hipótesis nula, cual es “El uso del cinturón de
seguridad es independiente al género”
CHI-CUADRADO EN RSTUDIO
UNIVERSIDAD NACIONAL DEL CENTRO DEL
PERÚ
EJERCICIO 5
FACULTAD DE INGENIERÍA
QUÍMICA
E.A.P. INGENIERÍA QUÍMICA
INDUSTRIAL
2022
En el proceso de cocción de piezas de pollo en el restaurante de Popeyes en Huancayo, una de las variables críticas es
la temperatura. Se toma una muestra aleatoria de n = 10 discos de la producción del turno de la mañana. Se formatean
y se reporta el rendimiento de cada disco. Los datos obtenidos son: 11,3,3,3,3,6,7.5,5,2.5,3,6. Con base en estos datos
estimar puntualmente y por intervalo la media y la desviación estándar para la cantidad de piezas producidas en ese
tiempo. Los estimadores puntuales son:
EJERCICIO 6
En la siguiente tabla se observa la cantidad de alumnos que asistieron a clases en distintos cursos.
2
(0
❑
− 𝐸)
𝑥 =∑
2
❑ 𝐸
Deficiente 23 60 29 112
Promedio 28 79 60 167
Muy bueno 9 49 63 121
Total 60 188 152 400
Con el nivel de significación 0.01 a) ¿La calificación del rendimiento del trabajador está asociada con el turno
en el que labora el empleado? Analice la magnitud de la asociación, si la hubiera.
1P) PLANEAMIENTO DE HIPÓTESIS:
16.8 52.64 42.56
Ho: No existe una relación entre el rendimiento en el eij=
eij 25.05 78.49 63.46
trabajo y turno laboral.
18.15 56.87 45.98
HI: Existe una relación entre el rendimiento en el
trabajo y turno laboral
2P) NIVEL DE SIGNIFICACIÓN:
2.2881 1.0291 4.3203
α= 0.01
0.3474 0.0033 0.1886
3P) ESTADÍSTICO DE PRUEBA:
4.6128 1.0891 6.3001
Mañana Tarde Noche Total n.i
Deficiente 23 60 29 112 =
Promedio 28 79 60 167
Muy 4P) CRITERIO DE DESICIÓN:
9 49 63
bueno 121
Total n.j 60 188 152 400 =20.1789 > por lo tanto se rechaza la hipótesis
nula
=13.2767
PRUEBA POR MINITAB
5P) CONCLUSIÓN:
Filas: RENDIMIENTO Columnas: TURNO
Con un nivel de significación del 1% existe una evidencia
LABORAL
para rechazar la hipótesis nula, es decir, se puede afirmar
que hay una relación entre el rendimiento en el trabajo y Mañana Noche Tarde Todo
turno laboral del empleado.
Deficiente 23 29 60 112
16.80 42.56 52.64
b) Para hallar el grado de disociación se usa el coeficiente Muy bueno 9 63 49 121
de Pearson: 18.15 45.98 56.87
C= C= =0.2191 Promedio
28 60 79 167
25.05 63.46 78.49
Esto quiere decir que hay una baja asociación entre el
Todo 60 152 188 400
rendimiento del trabajo y el turno laboral.
Prueba de chi-cuadrada
Chi-cuadrada GL Valor p
Pearson 20.179 4 0.000
Relación de 20.892 4 0.000
verosimilitud