IC PruebasHipotesis ANOVA R 2019I
IC PruebasHipotesis ANOVA R 2019I
IC PruebasHipotesis ANOVA R 2019I
Página 1 de 14
1 Inferencia Estadística para una muestra
1.1 Distribución Z
Para la Distribucion Z (Cuando la varianza es conocida) R no posee los
comandos para desarrollar esta prueba de manera directa. La forma estadís-
tica para probar una media de datos con varianza conocida es desarrollarla de
forma simple.
X̄ − µ
Z= √ (1)
σ/ n
Ejemplo. Se esta interesado en obtener una estimacion del peso, de una
especie de ave en una cierta poblacion que se ubica en una zona seca. Se
toman 30 muestras de forma aleatoria de la misma especie y se determina el
peso para cada una de ellas. El peso medio reportado fue de 37.4 gramos con
una varianza de 25. Supongase que los datos asumen una distribucion apro-
ximadamente normal. Con un nivel de confianza del 95%, es posible concluir
que el peso medio de las aves de esa población sea igual a 40 gramos?
xbar=37.4
n = 30
mu = 40
var = 25
Z0<-(xbar-mu)/(var/sqrt(n))
Z0
-0.5696315
pvalor<-pnorm(Z0)
pvalor
0.5689277
1.2 Distribución t
Estudiemos ahora la función en el lenguaje R,
t.test(datosx , datosy = N U LL, alternative = ”two.sided”, mu = 0, paired =
F ALSE, var.equal = F ALSE, conf.level = 0.95)
Las opciones indicadas son todas las ofrecidas por defecto. Podemos indi-
car sólo un conjunto de datos para muestras unidimensionales (estimaciones
puntuales) o dos conjuntos para comparación de muestras.
El argumento alternative indica el tipo de contraste, bilateral (two.sided); si
la hipótesis alternativa es mayor (greater ); si la hipótesis alternativa es menor
(less).
En mu indicamos el valor de la hipótesis nula. En paired=FALSE estamos ante
Página 2 de 14
una situación de datos no pareados; para indicar que estamos ante datos pa-
reados se debe indicar paired=TRUE.
Con var.equal estamos trabajando con los casos de igualdad o no de varianzas
que sólo se emplean en comparación de dos poblaciones. Si var.equal=T las
varianzas de las dos poblaciones son iguales si var.equal=F las varianzas de
ambas poblaciones no se suponen iguales. Por último tenemos el argumento
conf.level en el que indicamos el nivel de confianza de la prueba.
X<-c(3.35,3.92,4.26,3.36,3.72,4.19,3.42,4.38,4.5)
t.test(X,conf.level=0.90)
data: X
t = 25.674, df = 8, p-value = 5.681e-09
alternative hypothesis: true mean is not equal to 0
90 percent confidence interval:
3.617526 4.182474
sample estimates:
mean of x
3.9
X̄ − µ 3.9 − 0
t0 = √ = √ = 25674 (2)
s/ n 0.4557137/ 9
df =8 indica que la muestra tenía 9 datos.
Página 3 de 14
En el lenguaje R procedemos como sigue:
X<-c(3.35,3.92,4.26,3.36,3.72,4.19,3.42,4.38,4.5)
t.test(X,conf.level=0.90,alternative="greater",mu=4)
One Sample t-test
data: X
t = -0.6583, df = 8, p-value = 0.7356
alternative hypothesis: true mean is greater than 4
90 percent confidence interval:
3.687817 Inf
sample estimates:
mean of x
3.9
Página 4 de 14
1-sample proportions test with continuity correction
Página 5 de 14
Introduciomos las dos muestras en dos variables:
> blancas <- c(120, 132, 123, 122, 140, 110, 120, 107)
> amarillas <- c(126, 124, 116, 125, 109, 130, 125, 117, 129, 120)
Configuramos la función a un nivel del 95% y con varianzas iguales cómo
nos indica el enunciado del problema:
> t.test(blancas, amarillas, conf.level = 0.95, var.equal= TRUE)
Y se recibe el resultado:
Dieta1<-c(12,8,15,13,10,12,14,11,12,13)
Dieta2<-c(15,19,15,12,13,16,15)
Verifique normalidade dos dados
> shapiro.test(Dieta1)
> shapiro.test(Dieta2)
Página 6 de 14
Verifique homogeneidad de varianzas:
var.test(Dieta1,Dieta2))
t.test(Dieta1,Dieta2, var.equal=TRUE,alternative="two.sided")
> ago<-c(10.3,11.4,10.9,12.0,10.0,11.9,12.2,12.3,11.7,12.0)
> sept<-c(12.2,12.1,13.1,11.9,12.0,12.9,11.4,12.1,13.5,12.3)
> boxplot(ago,sept,names=c("Agosto","Setembro"))
Página 7 de 14
Figura 1: Box-plots de poblaciones pareadas
shapiro.test(ago)
data: ago
W = 0.8701, p-value = 0.1002
shapiro.test(sept)
data: sept
W = 0.9302, p-value = 0.45
> var.test(ago,sept)
Página 8 de 14
ratio of variances
1.649649
Los datos son normales y las varianzas son homogéneas. Podemos correr
el test - t con las dos muestras pareadas. La prueba es bicaudal con las vari-
anzas iguales.
> t.test(ago,sept,paired=TRUE,alternative="two.sided",var.equal=TRUE)
Paired t-test
El resultado indica que hay una diferencia significativa entres las medias
de las dos muestras y concluimos que el aumento en masa entre agosto y
septiembre es significativo.
Página 9 de 14
Creamos los dos vectores con las respuestas de medida de colesterol, los
cuales representan las dos poblaciones.
colesterolA<-c(51.3,39.4,26.3,39,48.1,34.2,69.8,31.3,45.2,46.4)
colesterolB<-c(29.6,47,25.9,13.0,33.1,22.1,34.1,19.5,43.8,24.9)
data: colesterolA
W = 0.9406, p-value = 0.5602
shapiro.test(colesterolB)
data: colesterolB
W = 0.9697, p-value = 0.8884
var.test(colesterolA,colesterolB)
Página 10 de 14
Obtención de la Tabla ANOVA
Observación: Una vez que se verifican los supuestos, ahora se pro-
cede a realizar el análisis de varianza
H0 : µcolA = µcolB
H1 :Las medias de colesterol son diferentes
> summary(anova)
Df Sum Sq Mean Sq F value Pr(>F)
dieta 1 952.2 952.20 7.2711 0.01476 *
Residuals 18 2357.2 130.96
---
Signif. codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1
Página 11 de 14
Figura 3: Ejemplo ANOVA un factor, realizando los cálculos
shapiro.test(tiempoM1)
Página 12 de 14
shapiro.test(tiempoM2)
shapiro.test(tiempoM3)
VERIFICACIÓN DE LOS SUPUESTOS DE HOMOCEDASTICIDAD o vari-
anza constante
var.test(tiempoM1,tiempoM2)
var.test(tiempoM1,tiempoM3)
var.test(tiempoM2,tiempoM3)
H0 : µM 1 = µM 2 = µM 3
H1 :Al menos una media es diferente
anova<-aov(tiempo metodo)
anova
summary(anova)
> summary(anova)
Df Sum Sq Mean Sq F value Pr(>F)
metodo 2 26.8 13.4000 9.3488 0.003568 **
Residuals 12 17.2 1.4333
---
Signif. codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1
Página 13 de 14
Ejercicio. Realizar el análisis de Varianza Completo del siguiente pro-
blema:
Estamos interesados en conocer si hay colores más atractivos para los in-
sectos. Para ello se diseñaron trampas con los siguientes colores: amarillo,
azul, blanco y verde. Se cuantificó el número de insectos que quedaban atra-
pados:
Azul: 16 11 20 21 14 7
Verde: 37 32 15 25 39 41
Blanco: 21 12 14 17 13 17
Amarillo: 45 59 48 46 38 47
Página 14 de 14