1.
- Descripción general de la actividad: Analiza un caso de diseño de
experimentos por bloques.
2.- Objetivo general: Investiga, indaga, comprende, aplica los fundamentos de
inferencia estadística en diseños experimentales por bloques.
3.- Objetivos específicos:
1. Investiga los fundamentos de ANOVA.
2. Indaga en las características, principios y fundamentos de VARIANZA.
3. Aplica los principios del modelado experimental.
Se comienzan a ingresar el texto en código Fuente en el programa R.
En las indicaciones todo lo que se le antepone # es indicaciones y so se copian en
el programa R.
1-En esta parte vienen los datos de la persona que está realizando el problema de
Bloques en el programa R.
## ============================================
# Dr. Carlos Téllez Martínez
# Marzo de 2015
# MODELO DE BLOQUES ALEATORIOS
# Diseño y Análisis de Experimentos
# Tecnológico de Monterrey Campus Guadalajara
## ============================================
2-Para la siguiente parte se debe crear una tabla en Excel cuidando la parte de los
títulos de los parámetros
Rendimiento Proceso_Trat Mezcla_Bloq
89 A mezcla 1
88 B mezcla 1
97 C mezcla 1
94 D mezcla 1
84 A mezcla 2
77 B mezcla 2
92 C mezcla 2
79 D mezcla 2
81 A mezcla 3
87 B mezcla 3
87 C mezcla 3
85 D mezcla 3
87 A mezcla 4
92 B mezcla 4
89 C mezcla 4
84 D mezcla 4
79 A mezcla 5
83 B mezcla 5
89 C mezcla 5
88 D mezcla 5
En este paso debemos copiar la ubicación del archivo haciendo una modificación
en el código invirtiendo el símbolo de /. Isertar el código en R.
# Llamada de datos
Datos <- read.csv("/Datos.csv")
Se inserta la tabla en R-
Posterior a esto se empiezan a ingresar los códigos:
View(Datos)
# Apertura base de datos
attach(Datos)
names(Datos)
## [1] "Rendimiento" "Proceso_Trat" "Mezcla_Bloq"
str(Datos)
## 'data.frame': 20 obs. of 3 variables:
## $ Rendimiento : int 89 88 97 94 84 77 92 79 81 87 ...
## $ Proceso_Trat: Factor w/ 4 levels "A","B","C","D": 1 2 3 4 1 2 3 4 1 2 ...
## $ Mezcla_Bloq : Factor w/ 5 levels "Mezcla 1","Mezcla 2",..: 1 1 1 1 2 2 2 2
3 3 ...
# Generación de los bloques y los tratamientos
Proceso_Trat <- factor(Proceso_Trat)
Mezcla_Bloq <- factor(Mezcla_Bloq)
Modelo <- lm(Rendimiento ~ Mezcla_Bloq+Proceso_Trat)
ANOVA <- aov(Modelo)
summary(ANOVA)
En esta parte se ingresa en R en la parte de los paquetes, donde se ingresa el
país (México), y posteriormente el termino de Agricole y esperar a que cargue en
en el programa.
# Df Sum Sq Mean Sq F value Pr(>F)
## Mezcla_Bloq 4 264 66.00 3.504 0.0407 *
## Proceso_Trat 3 70 23.33 1.239 0.3387
## Residuals 12 226 18.83
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Los tratamientos no son significativos, esto significa que
## Las variantes en el proceso básico no afectan el rendimiento del
## proceso, todas dan el mismo rendimiento
## Los bloques si son significativos lo cual indica que hay diferencia
## en las mezclas
# Análisis de comparación de medias para las Mezclas
# Se requiere el paquete "agricolae"
library(agricolae)
# Comando LSD.test(Respuesta, Variable, glError, MSError)
Grupos.Mezclas <- LSD.test(y = ANOVA, trt = "Mezcla_Bloq",group = T, console =
T)
##
## Study: ANOVA ~ "Mezcla_Bloq"
##
## LSD t Test for Rendimiento
##
## Mean Square Error: 18.83333
##
## Mezcla_Bloq, means and individual ( 95 %) CI
##
## Rendimiento std r LCL UCL Min Max
## Mezcla 1 92 4.242641 4 87.27226 96.72774 88 97
## Mezcla 2 83 6.683313 4 78.27226 87.72774 77 92
## Mezcla 3 85 2.828427 4 80.27226 89.72774 81 87
## Mezcla 4 88 3.366502 4 83.27226 92.72774 84 92
## Mezcla 5 82 4.082483 4 77.27226 86.72774 79 88
##
## alpha: 0.05 ; Df Error: 12
## Critical Value of t: 2.178813
##
## Least Significant Difference 6.686033
## Means with the same letter are not significantly different.
##
## Groups, Treatments and means
## a Mezcla 1 92
## ab Mezcla 4 88
## b Mezcla 3 85
## b Mezcla 2 83
## b Mezcla 5 82
# Gráficamente:
bar.group(x = Grupos.Mezclas$groups,
ylim=c(0,110),
main="Prueba de comparación de medias por medio del método LSD",
xlab="Tipo de Mezcla",
ylab="Rendimiento del proceso",
col="red")
# Estadísticos de la prueba LSD
Grupos.Mezclas$statistics
## Mean CV MSerror LSD
## 86 5.046208 18.83333 6.686033
# Prueba de comparaciones múltiples de Duncan
Grupos.Mezclas.Duncan <-duncan.test(y = ANOVA, trt = "Mezcla_Bloq", group = T,
console = T)
##
## Study: ANOVA ~ "Mezcla_Bloq"
##
## Duncan's new multiple range test
## for Rendimiento
##
## Mean Square Error: 18.83333
##
## Mezcla_Bloq, means
##
## Rendimiento std r Min Max
## Mezcla 1 92 4.242641 4 88 97
## Mezcla 2 83 6.683313 4 77 92
## Mezcla 3 85 2.828427 4 81 87
## Mezcla 4 88 3.366502 4 84 92
## Mezcla 5 82 4.082483 4 79 88
##
## alpha: 0.05 ; Df Error: 12
##
## Critical Range
## 2 3 4 5
## 6.686033 6.998357 7.187591 7.312833
##
## Means with the same letter are not significantly different.
##
## Groups, Treatments and means
## a Mezcla 1 92
## ab Mezcla 4 88
## b Mezcla 3 85
## b Mezcla 2 83
## b Mezcla 5 82
# Gráficamente:
bar.group(x = Grupos.Mezclas.Duncan$groups,
ylim=c(0,110),
main="Prueba de comparación de medias por medio del método Duncan",
xlab="Tipo de Mezcla",
ylab="Rendimiento del proceso",
col="blue")
## Análisis de la adecuación del modelo
# Normalidad de los residuos
qqnorm(rstandard(Modelo))
qqline(rstandard(Modelo))
cvbnm,.-23
shapiro.test(rstandard(Modelo))
##
## Shapiro-Wilk normality test
##
## data: rstandard(Modelo)
## W = 0.9505, p-value = 0.3743
## No hay problemas con las observaciones
Análisis
Es un modelo donde tenemos dos variables independientes, el problema tiene 4 tipos de proceso
a evaluar como tratamiento, llamados tratamientos bloques, con 5 tipos diferentes de mezclas, los
bloques representan la restricción a la aleatoriedad, con procesos de forma aleatoria A, B, C, D.
La variable de respuesta va a ser conforme al rendimiento. El problema está buscando el mayor
valor de rendimiento. En los rendimientos son enteros.
El modelo que se usa es de tipo lineal que es la mezcla más el proceso (mezcla+ proceso)
El ANOVA se idéntica las diferentes respuestas viendo los grados de libertad. También nos dice
que la hipótesis nula se rechaza ya que todas las medias son iguales.
Se hace el análisis de medias para las mezclas, en el programa R se debe activar la librería Agricole
Se puede ver que en las mezclan se pueden ver la variable de respuesta es los rendimientos que
van desde el 92 hasta el 82
La mezcla 1, 4 (a)son de un grupo y la mezcla 2 a la 4 (b) pertenecen a otro grupo, por lo que
podemos ver que la mezcla 1 es la mayor rendimiento.
En esta grafica podemos ver también de forma clara a que grupo pertenece cada mezcla, por lo
que la mezcla 1 y 4 perteneces a grupo a y la mezcla 2,3,4,5 pertenecen al grupo b.
Para finalizar la comparación se corre el comando: shapiro.test(rstandard(Modelo))
P-Value es de 0.3743 por lo que no podemos rechazar la hipótesis nula.
Conclusión
Lo que podemos concluir que este modelo se utiliza para evaluar la variables de forma
independiente, ya que si queremos hacerlo con variables que interactúen entre sí en los factores
tendríamos que utilizar un modelo factorial. Pero en el problema vemos que las variables actúan
de manera independiente.