Diseño de Experimentos - Conceptos Preliminares PDF
Diseño de Experimentos - Conceptos Preliminares PDF
Diseño de Experimentos - Conceptos Preliminares PDF
Tipos de estudios
Existen dos tipos de estudios que generan datos, los estudios observacionales y los estudios
experimentales.
Llamamos estudio observacional cuando sobre un proceso existente se observan (registra
informacin) una o ms variables aleatorias. La finalidad de estos estudios es explorar,
describir y confirmar hiptesis.
Qu es un experimento?
Prueba o serie de pruebas en las cuales se inducen cambios deliberados en las variables de
entrada de un proceso o sistema de manera que sea posible observar e identificar las causas
de los cambios en la respuesta de salida (Montgomery 1991).
Es una reproduccin restringida de la realidad con el fin de observar los efectos de su
manipulacin planificada (Casanoves y Di Rienzo, 1999).
La finalidad de estudios basados en experimentos es contrastar hiptesis, modelar y
predecir.
La diferencia principal entre estos dos tipos de estudio es que en los observacionales existe
una realidad que se observa y en los experimentales se manipula la realidad para observar
su respuesta. En la practica en muchas ocasiones se obtienen datos provenientes de
combinaciones de ambos tipos de estudios. En estos casos el desafo es modelar
correctamente los datos obtenidos.
Unidad experimental
Es la mnima porcin del material experimental sobre el cual un tratamiento puede ser
realizado. La unidad experimental (UE) puede ser una parcela de terreno, una maceta, un
animal, el conjunto de alumnos de un curso, etc. Pueden ser unidades naturales como en el
caso de una persona, un automvil, una planta o unidades artificialmente delimitadas como
en el caso de una parcela de terreno, una cantidad de agua, etc.
Unidad Observacional
Es la porcin de la unidad experimental que se mide u observa. En muchos estudios, la
unidad experimental coincide con la unidad observacional, pero en otros, una unidad
experimental puede representar un conjunto de unidades observacionales. Cuando en un
estudio se registran dos o mas variables, la unidad observacional puede ser distinta para
cada una de ellas. Por ejemplo, si la unidad experimental es una parcela con plantas de
trigo, se puede registrar la variable rendimiento sobre toda la parcela y la variable nmero
de espigas por planta sobre algunas plantas de la parcela. As, las unidades de observacin
son distintas para estas variables.
Factores
Son todas las fuentes de variacin reconocidas a priori por el investigador (no incluye el
error experimental). Cada uno de los valores que asume un factor se denomina nivel. Por
ejemplo, la temperatura de coccin del pan es un factor y las diferentes temperaturas
evaluadas son los niveles. Los factores pueden ser de inters del investigador (cuando se
desea hacer inferencia sobre ellos) o simplemente pueden ser reconocidos como una fuente
1
Aleatorizacin
En diseo y anlisis de experimentos hay dos etapas importantes de aleatorizacin. La
primera se relaciona con la necesidad de contar con unidades experimentales que
representen una muestra aleatoria de la poblacin de UE. La segunda aleatorizacin es la
que se realiza para asignar los distintos tratamientos en las UE o viceversa. Esta es una
condicin necesaria para que la estimacin de los parmetros de inters sea insesgada.
Error experimental
Este error est compuesto por los errores de tratamiento, de muestreo y de medicin y
aunque en la prctica generalmente son indistinguibles, es importante reconocerlos para
tratar de minimizarlos. En el ANAVA, el error experimental es un estimador de 2 y por lo
tanto mantener en niveles bajo los errores que lo componen harn ms eficientes las
comparaciones de inters.
Error de Tratamiento: Es el error que se podra cometer al no poder aplicar el mismo
tratamiento de manera exactamente igual en las unidades experimentales (UE) que le
fueron asignadas.
Error de Medicin: Error relacionado a la obtencin del dato. Podra ser introducido por
parte del operario que obtiene el dato o por el instrumento de medicin.
Error de Muestreo: Est relacionado con la variacin de las UE que es de esperar exista
an cuando toda otra fuente de variacin se encuentre controlada. Su magnitud depende de
la heterogeneidad de las UE.
El error de tratamiento se controla con un buen protocolo de aplicacin de los tratamientos,
el error de medicin, con la capacitacin del personal y la eleccin de buenos aparatos de
medida. El error de muestreo, se controla mediante un proceso de aleatorizacin que
contemple la estructura de las unidades experimentales, es decir asegurarse que todos los
tratamientos estn representados en todos los grupos o bloques de unidades experimentales.
Diseo de experimentos
El diseo de experimentos consiste en un conjunto de tcnicas que tienen, entre otras, la
finalidad de controlar las fuentes de variacin no deseadas y disminuir el trmino de error
experimental.
Uno de los principales objetivos en la planificacin de una experiencia, siguiendo un diseo
experimental, es la reduccin del error experimental, con el propsito de incrementar la
eficiencia de la inferencia relacionada a la comparacin de tratamientos.
El diseo experimental puede entenderse como una estrategia de combinacin de la
estructura de tratamientos (factor/es de inters) con la estructura de unidades
experimentales, de manera tal que la variabilidad de la variable respuesta, al menos en
algn subgrupo de unidades experimentales, pueda ser atribuidas solamente a la accin de
los tratamientos, excepto por errores aleatorios. As, es posible contrastar (comparar)
medias de tratamientos o combinaciones lineales de medias de tratamientos con el menor
ruido posible.
La estructura de tratamientos esta relacionada al nmero de factores involucrados en el
experimento, sus niveles y la combinacin de los mismos. La estructura de unidades
experimentales surge del agrupamiento de las mismas en grupos o bloques que puedan
considerarse formados por UE homogneas. Es importante en toda situacin donde se
4
disea una experiencia distinguir entre la estructura de parcelas o estructura de las UE por
un lado, y la estructura de tratamientos, por el otro.
La estructura de parcelas es generalmente determinada a priori de la aplicacin de los
tratamientos a las UE, tratando que sta contemple todos los factores que producen
variacin en la respuesta entre las distintas unidades experimentales. En la mayora de las
experiencias, es posible identificar patrones en las UE, los que se asocian a factores, que si
bien no corresponden a los tratamientos de inters, podran diferenciar las respuestas
provenientes de las distintas UE. Una estrategia para controlar el efecto de dichos factores
es la estratificacin o bloqueo.
La estructura de tratamientos esta asociada a las cuestiones sobre las que interesa inferir. La
aleatorizacin es el proceso que permite combinar ambas estructuras. La estructura de
tratamientos es aleatorizada en las unidades experimentales.
As, un diseo experimental involucra:
a) la eleccin de la estructura de tratamientos.
b) la deteccin de la estructura de parcelas (independientemente de la estructura de
tratamientos).
c) la eleccin del mtodo de aleatorizacin acorde para la combinacin de ambas
estructuras.
El diseo experimental determina el modelo a utilizar para un correcto anlisis de la
variabilidad en la respuesta.
Algunas estructuras de parcelas clsicas son aquellas que caracterizan los diseos: 1)
completamente aleatorizados (DCA), donde las UE no tienen estructura; 2) en bloques
completos aleatorizados (DBCA), donde las UE homogneas se agrupan en un mismo
bloque y los bloques son heterogneos en relacin a un factor de clasificacin (o
combinacin de factores de clasificacin); 3) cuadrado latino (DCL), donde las UE se
agrupan en bloques heterogneos en relacin a dos factores de clasificacin independientes
(estructura de UE a dos va de clasificacin).
No debe existir interaccin entre los componentes de la estructura de parcelas y los
componentes de la estructura de tratamientos, es decir, se asume que la relacin existente
entre tratamientos es consistente de bloque a bloque (excepto por la variacin aleatoria).
Preguntas que pueden hacerse para realizar, identificar y analizar un experimento
comparativo
tratamientos?
las comparaciones
donde:
Yij es la j-sima respuesta en el i-simo tratamiento
es la media poblacional de la variable respuesta
i es el efecto del i-simo tratamiento
ij es un termino de error aleatorio. Bajo los supuestos del modelos de muestreo ideal, los
trminos de error asociados a cada una de las observaciones se suponen
independientemente distribuidos, normales, con esperanza 0 y varianza 2 i,j (Varianza
constante).
La media general () pueda ser entendida como la media de todas las medias poblacionales
asociadas a cada uno de los grupos en estudio. Se considera un parmetro fijo y su valor es
constante a travs de todas las observaciones, por lo que suele denominarse simplemente
constante. Los efectos de tratamientos (i) representan la diferencia o corrimiento entre la
media poblacional del grupo considerado y la media general. En el modelo de ANAVA de
efectos fijos los (i) se consideran constantes (valores fijos) desconocidas. El efecto del
tratamiento 1 (1) es la diferencia que hay entre la media del tratamiento 1 y la media
general. La hiptesis nula del ANAVA postula la igualdad de medias de todos los
tratamientos comparados. Si la hiptesis nula del ANAVA fuera verdadera las a
poblaciones estaran centradas sobre la misma esperanza, es decir, en . El trmino de error
asociado a la observacin ij, representa la diferencia entre dicha observacin y la media
poblacional del grupo o tratamiento correspondiente.
El modelo de ANAVA tambin puede plantearse en trminos de la media de celda o media
de grupo (modelo de celdas o modelo de medias) en lugar de hacerlo sobre la base de
efectos de grupos. Es decir,
Yij =i + ij , con i=1,...,a y j=1,..,ni
El nmero de parmetros de posicin en esta parametrizacin es igual al nmero de medias
de grupo. Para el caso de estudios involucrando un solo factor con igual tamao de muestra
para cada nivel no existen diferencias entre este modelo y el de efectos a la hora del
contraste de hiptesis. El modelo de celdas puede ser ventajoso en algunas situaciones con
diseos complejos o multifactoriales donde se ha perdido una celda.
Si bien los i del modelo de efectos no son estimables, los i = + i si se pueden estimar
para cada grupo. Debido a la equivalencia entre el modelo de celdas y el modelo de efectos,
resulta indistinto plantear la hiptesis nula del ANAVA en trminos de media de celda o
efectos de tratamiento.
Las hiptesis que se contrastan en el ANAVA de efectos fijos pueden expresarse como:
H0: 1 = 2 = ...= a versus
H1: Al menos un par de medias difiere
o alternativamente como:
7
El error estndar para una media de tratamientos, que permite construir intervalos de
confianza para las medias poblacionales bajo cada tratamiento y/o comparar medias de
tratamiento es:
Y2
i
CMR
ni
donde CMR es el cuadrado medio residual del ANAVA tambin conocido como cuadrado
medio dentro (CMD), ya que es un estimador de la variabilidad entre las UE tratadas de la
misma forma, es decir, dentro de un mismo tratamiento.
Los trminos de error son estimados por los residuos eij como la diferencia entre el valor
observado y el valor predicho por el modelo ( Yij Yi ):
ij eij Yij Yi
(
Y
)
Y
ij
CME
ij
Tratamientos
1
n
N
i 1 i
j 1
i 1 j 1
gle
i
Dentro
(Error
Experimental)
Total
SCD=SCT-SCE
ni
i 1
SCT Yij2
gld= N - a
1 a ni
Yij
N i 1 j 1
CMD
CME
CMD
SCD
gld
glt= N 1
Una forma de calcular el cuadrado medio dentro es a partir de las varianzas muestrales
obtenidas para cada tratamiento:
CME Y2 n .
A diferencia del CMD que es un estimador incondicional de 2, el CME estima a 2 slo si
las esperanzas de los tratamientos que se comparan son iguales (H0 verdadera) de lo
a
igualdad de las esperanzas. Por lo tanto otra forma de plantear la hiptesis en ANAVA es la
siguiente:
H0 : E2 = D2 vs. H1 : E2 > D2
El contraste de hiptesis consiste en calcular el estadstico F utilizando los estimadores de
E2 y D2 , de la siguiente forma:
CME
CMD
a
Este estadstico tiene, bajo H0, una distribucin F(a-1),(N-a)) con N = ni . Luego, para un
i 1
implica que i2 es distinto de 0 y por lo tanto, que algn i 0; luego se concluye que no
i 1
todas las medias de tratamiento son iguales o que al menos un tratamiento tiene efecto
distinto de 0.
En este diseo se supone que las unidades experimentales son homogneas, es decir no se
identifica estructura alguna. Los tratamientos (que pueden o no tener estructura) se asignan
completamente al azar a las unidades experimentales. El nmero de repeticiones puede
variar de un tratamiento a otro. Aquellos con igual nmero de repeticiones se denominan
balanceados; para algunas tcnicas de estimacin asociadas, el balance es una caracterstica
deseada.
Ejemplo: Diseo completamente aleatorizado a una va de clasificacin
Una panadera desea probar 4 temperaturas de horneado de pan (100, 130, 160 y 190 C) con
el fin de verificar si existen diferencias en el volumen del pan obtenido. Para hacer la prueba
se amas el pan y se formaron 16 bollos. Cada uno de los bollos fue asignado al azar a una de
las temperaturas. Luego se aleatoriz el orden de las temperaturas del horno y despus del
horneado se midi el volumen del pan obtenido (cm3). Los datos estn en el archivo pan.idb.
Se realiz un ANAVA a una va de clasificacin y se obtuvo la siguiente tabla:
Anlisis de la varianza
Variable
vol
16
RAj
CV
0.59
0.48
2.52
SC
gl
CM
Valor p
Modelo
9220.50
3073.50
5.66
0.0119
Temperatura
9220.50
3073.50
5.66
0.0119
Error
6515.50
12
542.96
Total
15736.00
15
10
Cuantiles observados(RDUO_vol)
45.55
RDUO_vol
26.02
6.50
-13.02
-32.55
887.11
902.99
918.88
934.76
n= 16 r= 0.969 (RDUO_vol)
22.28
2.57
-17.15
-36.87
-36.87
950.64
PRED_vol
-17.15
2.57
22.28
42.00
N
16
R
0.05
RAj
0.00
CV
72.28
p (una cola)
0.2452
11
12
ser descartar una droga que en realidad produce el efecto deseado. En cambio, si se esta por
recomendar una droga para un paciente, el riesgo mayor es recomendar una que no sea
efectiva. En el primer caso se debe elegir una prueba que controle el error de tipo I mientras
que para el segundo una que controle el error tipo II.
Para los datos del ejemplo de la panadera, se realiz la prueba de Tukey para comparar las
medias de las temperaturas estudiadas obtenindose los siguientes resultados:
Test : Tukey Alfa: 0.05 DMS: 48.92143
Error: 542.9583 gl: 12
Temperatura Medias
n
100
890.00
4
A
190
910.25
4
A
B
160
944.00
4
B
130
947.75
4
B
Letras distintas indican diferencias significativas(p<=0.05)
Los mayores volmenes de pan se obtienen con las temperaturas de 190, 160 y 130 C.
Estas temperaturas no difirieren entre si, por lo que se recomienda la temperatura de 130 C
ya que es la ms econmica de lograr. Se puede ver claramente la falta de transitividad del
mtodo de Tukey, ya que la temperatura 100 no difiere de 190, la temperatura 190 no
difiere de 160, pero la temperatura 100 difiere de 160. Usando un mtodo LSD se obtienen
los siguientes resultados:
Test : LSD Fisher Alfa:
Error: 542.9583 gl: 12
Temperatura Medias
100
890.00
190
910.25
160
944.00
130
947.75
A
A
B
B
C
C
Esta prueba indica que el mayor volumen de pan se logra con las temperaturas 160 o 130.
No obstante se sigue recomendando la temperatura 130 por cuestiones econmicas. Se
puede observar que la prueba LSD encuentra ms diferencias que la prueba de Tukey.
Adems de la clasificacin por su carcter transitivo o no, los mtodos de comparaciones
mltiples pueden clasificarse por su objetivo, por el tipo de tasa de error que contro lan, y
por si la mnima diferencia significativa que se obtiene con ellos es constante o variable
entre otros criterios.
Respecto a la clasificacin por el objetivo de la comparacin pueden separarse en: 1) todas
las comparaciones posibles de a pares (Ej.: Tukey, Duncan, LSD, DGC, Jollife), 2) todas
las comparaciones contra un testigo (Ej.: Dunnett), 3) todas contra la media mayor o todas
contra la media menor (Ej.: HSU).
Respecto al tipo de tasa de error que controlan sta puede ser por experimento o por
comparacin. La tasa de error por experimento se calcula como el nmero de experimentos
en que se comete un error sobre el nmero total de experimentos (se suponen repeticiones
independientes del mismo experimento). La tasa de error por comparacin se calcula como
el nmero de comparaciones donde se comete un error sobre el nmero total de
13
14
gl
1
1
1
3
CM
649.80
8372.25
198.45
3073.50
F
Valor p
1.20 0.2954
15.42 0.0020
0.37 0.5567
5.66 0.0119
Cont. 3
-1.00
3.00
-3.00
1.00
vol_suavizada
960
929
897
865
96
120
145
170
195
Temperatura
15
denominan contrastes a priori. Por ejemplo, si de tres tratamientos que se estn ensayando
el tratamiento 1 corresponde a un testigo y los y los otros dos tratamientos representan 2
nuevas acciones que se estn experimentando, podra ser de inters postular a priori el
siguiente par de contrastes sobre las tres medias M1, M2 y M3: el contraste
0 1 1 comparar la M2 con la M3 (las dos acciones experimentales entre si) y el contraste 2
-1 -1 es equivalente a comparar M1 con la media de M2 y M3 (el promedio de las acciones
experimentales versus el testigo).
Por ltimo, si bien los contraste ortogonales proveen informacin independiente, en
algunos casos resultan de inters contrastes o comparaciones que no son ortogonales. Este
el caso, por ejemplo, cuando se tiene un tratamiento testigo que se desea comparar con el
resto de los tratamientos experimentales. Si se tiene un testigo (T) y dos tratamientos
nuevos (N1 y N2) y se desea comparar cada uno de los nuevos tratamientos versus el
testigo, los contrastes serian: 1 1 0 (para comparar T versus N1) y 1 0 1 (para comparar T
versus N2). Estos contrastes no son ortogonales ya que su producto interno es distinto de
cero (1 en este caso).
En sntesis el tipo de contraste a realizar depender de la hiptesis de investigacin y de la
estructura de los tratamientos.
16
unidades experimentales de los dos experimentos originales, se podra hacer una repeticin
completa de todo el experimento factorial y se tendra el doble de unidades experimentales
para cada nivel de cada uno de los factores. En este sentido, los experimentos factoriales
son ms eficientes para evaluar los efectos de los factores individuales. Adems los
experimentos factoriales, cuando estn repetidos, permiten evaluar si las variaciones en la
respuesta debidas a los efectos de un factor son independientes de los niveles del otro
factor, fenmeno que se conoce como interaccin. Dado que la interaccin es comn en los
sistemas involucrando varios factores, los experimentos que son capaces de detectarla son
siempre preferibles.
Modelos aditivos
Los modelos factoriales aditivos son aquellos en los que los trminos que modelan la
interaccin estn ausentes. Para ejemplificar este caso se presenta un experimento factorial
en el que es de inters estudiar los factores riego con tres niveles (100, 150 y 200mm.) y el
factor insecticida con dos niveles (con y sin insecticida) en la produccin de tomate. Los
3x2=6 tratamientos resultantes se asignan a las UE (parcelas) segn un diseo
completamente aleatorizado. Se conoce por experiencias previas (o se supone) que no hay
interaccin entre los efectos de riego e insecticida. Los factores se han designado como R
(riego) e I (insecticida) y sus niveles como R1,R2,R3 e I1,I2. Los 6 tratamientos de inters
surgen del cruzamiento de ambos factores, es decir cada nivel de un factor se asocia con
cada uno de los niveles del otro factor para definir un tratamiento. As el arreglo factorial se
representa como R1I1, R2 I1, R3I1, R1I2, R2 I2, R3I2. Cada uno de los tratamientos se evalu
una sola vez, es decir los tratamientos no estn repetidos. No obstante esto, si existen
repeticiones para cada nivel de un factor dentro de cada uno de los niveles del otro factor.
La variable observada es el rendimiento. Los datos estn en el archivo Tomate.idb. Se
presenta a continuacin los resultados obtenidos mediante el ANAVA.
Anlisis de la varianza
Variable
N
R
RAj
Rendimiento 6
0.98 0.96
CV
3.53
Se concluye que hay efecto de riego (p=0.0229) y que hay efecto de insecticida (p=0.0275).
En el caso del factor insecticida, al tener 2 niveles no hace falta ms informacin que las
medias para concluir sobre la conveniencia del uso o no de insecticida.. Para el factor riego,
por tener tres niveles se necesita indagar ms sobre la comparacin de medias. Por ser un
factor cuantitativo de niveles equidistantes, se realizaron contrastes polinmicos
ortogonales para evaluar si existan tendencias lineales y/o cuadrticas de los rendimientos
promedio en relacin a los niveles de riego. Tambin se podran haber realizado
comparaciones mltiples, en tal caso hubiera habido tres contrastes involucrados (R1vs R2,
R1vsR3 y R2vsR3). Con la estrategia seleccionada (contrastes polinmicos) las mismas
17
SC
102.26
0.04
102.30
gl
1
1
2
CM
102.26
0.04
51.15
F
Valor p
85.43 0.0115
0.03 0.8716
42.73 0.0229
Se concluye que existe una tendencia lineal para el factor riego (p=0.0115) y que la
tendencia cuadrtica no es significativa (p=0.8716). Dado que el rendimiento promedio
para el tercer nivel del factor fue mayor que para el primero, se concluye que existe una
relacin lineal positiva y por tanto dentro de los niveles ensayados (intervalo 100,200), a
mayor cantidad de riego se espera mayor rendimiento. En el siguiente grfico se visualiza
esta tendencia, como as tambin la ausencia de interaccin entre los efectos de riego y
insecticida.
32
Rendimiento
30
28
26
24
100
125
150
175
200
Riego
Con insecticida
Sin insecticida
Modelo
El modelo para un experimento con estructura factorial de tratamientos (dos factores o
bifactorial), sin estructura de parcelas, diseo completamente aleatorizado y suponiendo
falta de interaccin (modelo aditivo) es el siguiente:
Yij=+i+j+ij
Donde Yij representa la respuesta al i-simo nivel del factor A y j-simo nivel de factor B,
representa una media general, i el efecto que produce el i-simo nivel del factor A (con
a niveles), j corresponde al efecto del j-simo nivel del factor B (con b niveles) y ij es el
trmino de error aleatorio asociado a la observacin ij-sima que como siempre se supone
es una variable aleatoria normal, con esperanza cero y varianza 2.
Si el supuesto de aditividad (no interaccin) no se cumple entonces el experimento est
deficientemente diseado ya que haran falta repeticiones de los tratamientos (combinacin
de los niveles de ambos factores) para inferir sobre efectos principales e interacciones.
Existen algunas pruebas estadsticas para verificar este supuesto como la prueba de
aditividad de Tukey (1949), Mandel (1967) y pruebas grficas.
Cuadro de Anlisis de la Varianza para el modelo bifactorial aditivo con DCA.
Fuente de
Suma de Cuadrados
Grados de
Cuadrado
F
Variacin
Libertad
Medio
2
2
Factor A
a
gla=a-1
CMA
SCA
Y Y
CMA
SCA i. ..
CMD
gla
b
ab
i 1
2
Factor B
glb=b-1
b
CMB
SCB
Y. j Y.. 2
CMB
SCB
CMD
glb
a
ab
j 1
SCD
Error
SCD=SCT-SCA-SCB
gld=(a-1)(b-1) CMD
gld
Experimental
.
2
a
b
Total
glt=a b-1
Y..
SCT Yij2
i 1 j 1
ab
19
SCA
Yi..
ni.
i 1
Factor B
SCB
Total
Y
...
. j.
n..
Y Y
2
i 1 j 1
ij .
...
nij
n..
nij
i 1 j 1 k 1
Y...
n..
CMA
SCA
gla
CMA
CMD
glb=b-1
CMB
SCB
glb
CMB
CMD
SCD=SCT-SCA-SCB-SCAB
SCT Yijk2
gla=a-1
...
n. j
SCAB
n..
Y Y
j 1
Interaccin
AB
Error
glab(a-1)(b-1)
gld=glt-glaglb-glab
CMAB
CMD
SCAB
glab
CMAB
CMD
SCD
gld
glt= N-1
Ejemplo
En las grandes ciudades, los lodos que surgen del tratado de los efluentes son generalmente
vertido en suelos de regiones perifricas a la ciudades. En un estudio medioambiental sobre
contaminacin con zinc (Zn) debida a esta prctica, se realiz un ensayo para comparar los
efectos de efluentes procedentes de tres ciudades sobre los niveles de Zn en hortalizas
producidas en regiones perifricas. Se tomaron 36 macetones con plantas de tomate y en un
diseo completamente aleatorizado se asignaron los tratamientos que surgieron de un
arreglo factorial del factor cualitativo procedencia del lodo adicio nado a la maceta, al que
denominaremos ciudad con tres niveles (A, B y C) y el factor cuantitativo cantidad de
lodo adicionado, denominado lodo, con tres niveles (0.5, 1 y 1.5 Kg por unidad). Luego
se cosecharon los tomates producidos y se les midi el contenido en partes por milln
(ppm) de Zn, obteniendo los promedios por maceta como variable respuesta. Los datos se
encuentran en el archivo Ciudad.idb. El ANAVA arroj los siguientes resultados.
20
Anlisis de la varianza
Variable
N
R
RAj
CV
Zn
36
0.95 0.93 12.96
Cuadro de Anlisis de la Varianza (SC Tipo III)
F.V.
SC
gl
CM
F
Modelo
9475.52
8
1184.44
61.75
lodo
1945.45
2
972.72
50.71
ciudad
5720.67
2
2860.34
149.13
lodo*ciudad 1809.40
4
452.35
23.58
Error
517.86
27
19.18
Total
9993.38
35
Valor p
<0.0001
<0.0001
<0.0001
<0.0001
La interaccin entre lodo y ciudad result significativa (p<0.0001) razn por la cual no
tiene sentido estudiar a los efectos principales de los factores a travs de las medias de
todos los datos. Es necesario estudiar o abrir la interaccin, esto es estudiar los efectos de
un factor dentro de cada uno de los niveles del otro. En este ejemplo hay dos factores de
distinta naturaleza, uno cuantitativo y el otro cualitativo. Dado que uno de los intereses de
la investigacin es determinar si la cantidad de lodo agregado se relaciona con la cantidad
de Zn encontrado en las plantas, se decide hacer contrastes para verificar tendencias lineal y
cuadrtica para contenido de Zn dentro de cada uno de los niveles del factor ciudad.
Construccin de los contrastes
Tenemos 4 grados de libertad para la interaccin, que se usarn para realizar dos contrastes
de tendencia lineal y dos de cuadrtica. El inters se centrar en el estudio de estas
tendencias en las distintas ciudades. Los contrastes deben reflejar entonces no slo las
tendencias lineales y cuadrticas de la respuesta en relacin a los niveles de lodo sino
tambin las diferencias de dichas tendencias entre ciudades.
Para construir los contrastes se pueden seguir los siguientes pasos:
1) Listar los tratamientos que surgen de la combinacin de los factores de manera
conveniente (ordenado por un factor cuantitativo):
A,0.5 B,0.5 C,0.5 A,1 B,1
C,1
A,1.5 B,1.5 C,1.5
2) Plantear un conjunto de contrastes ortogonales para indagar sobre la o las tendencias de
las respuestas promedio en relacin a los niveles del factor cuantitativo:
-1
-1
-1
0
0
0
1
1
1 (lodo lineal)
-1
-1
-1
2
2
2
-1
-1
-1 (lodo cuadrtico)
3) Plantear un conjunto de contrastes ortogonales para comparar medias de los niveles del
factor cualitativo (ciudad). Como el factor ciudades tiene tres niveles habr 2 grados de
libertad para ser particionados en contrastes ortogonales. Un conjunto de contrastes que
responde a estos requerimiento podra ser el siguiente:
-2
1
1
-2
1
1
-2
1
1
(A vs.(B+C)/2)
0
-1
1
0
-1
1
0
-1
1
(B vs.C)
4) Obtener los contrastes de inters (interaccin) multiplicando los contrastes definidos en
el paso 2 por aquellos definidos en el paso 3:
2
0
-1
1
-1
-1
0
0
0
0
0
0
-2
0
1
-1
1
1
lineal (A vs.(B+C)/2)
lineal (B vs.C)
21
2
-1
-1
-4
2
2
2
-1
-1 cuadr. (A vs.(B+C)/2)
0
1
-1
0
-2
2
0
1
-1 cuadr. (B vs.C)
Calculando las sumas de cuadrados asociadas a los dos primeros contraste se obtienen los
siguientes resultados:
Contrastes
lodo*ciudad
SC
Contraste1
121.92
Contraste2 1638.23
Total
1760.15
gl
1
1
2
CM
121.92
1638.23
880.07
F
Valor p
6.36 0.0179
85.41 <0.0001
45.88 <0.0001
Se concluye que hay variabilidad entre ciudades para los coeficientes de regresin lineal de
la respuesta en funcin de los niveles de lodo (p<0.0001).
Calculando las sumas de cuadrados asociadas a los dos ltimos contraste se obtienen los
siguientes resultados:
CM
F
1.05 0.05
48.20 2.51
24.63 1.28
Valor p
0.8167
0.1246
0.2933
78.00
63.00
Zn (ppm)
Contrastes
lodo*ciudad SC
gl
Contraste1
1.05 1
Contraste2 48.20 1
Total
49.25 2
48.00
33.00
18.00
0.50
1.00
1.50
lodo
Zn-A
Zn-B
22
Zn-C
Aunque en los ejemplos anteriores se han presentado experimentos con estructura factorial
de tratamientos, slo en diseos completos al azar, la combinacin de estructuras factoriales
y estructuras de parcela da lugar a una amplia variedad de arreglos experimentales. Por
diversas razones, quizs no puedan asegurarse las mismas condiciones experimentales de
repeticin a repeticin y por lo tanto se tiene una fuente potencial de variacin sistemtica
reconocida a priori sobre las UE que si bien no es de inters por si misma debe
incorporarse al modelo de anlisis para disminuir el error experimental. De este modo, cada
repeticin podra considerarse un bloque y el experimento completo sera un experimento
con estructura bifactorial de tratamiento y estructura de parcelas en bloques completos al
azar. Existen numerosas combinaciones de estructuras de parcela y estructuras de
tratamiento, dependiendo de la jerarqua en la estructura de parcelas y las restricciones a la
aleatorizacin. Los diseos emergentes se conocen como multifactoriales con restricciones
a la aleatorizacin.
i 1
b
j 1
( )
ij
0 j 1,..., b
( )
ij
0 i 1,..., a
i 1
b
j 1
yi.. y...
i 1,..., a
j y. j . y...
j 1,..., b
i 1,..., a
( )i j yij . yi.. y. j . y...
j 1,..., b
23
podemos usar estas estimaciones de los parmetros, para estimar el valor esperado de
cualquier observacin y obtener as el valor ajustado de yijk.
Luego,
yijk j ( )i j
yijk y... ( yi.. y... )+(y. j . y... )+(yij . yi.. y. j . y... )
yijk yij .
El disponer de los valores ajustados permite calcular los residuos para el modelo. Estos
residuos se usarn para evaluar el cumplimiento de los supuestos que sustentan el anlisis
de la varianza clsico (MMI).
Verificacin de supuestos
Los supuestos del anlisis de la varianza se refieren a las propiedades estadsticas de los
errores que se suponen normales con esperanza cero, varianza comn e independientes.
Existen distintas tcnicas de validacin de supuestos, pero las mas usuales se basan en los
predictores de los errores, es decir los residuos.
Una vez calculados los residuos se puede verificar el cumplimiento de los supuestos de
normalidad, independencia y homogeneidad de varianzas de los ijk, mediante pruebas de
hiptesis e interpretaciones grficas como se ha explicado anteriormente. Estas pruebas
usualmente se construyen reparametrizando el modelo factorial como un modelo de celdas,
donde cada celta corresponde a un tratamiento que surge de la combinacin de los niveles
de los factores.
Diseos en bloques
Introduccin
Cuando la UE que se disponen para realizar un experimento no son homogneas, se debe
reconocer el o los factores que pueden afectar a la respuesta de las distintas UE ms all de
los tratamientos. Estas fuentes de variacin deben ser contempladas en el diseo para
disminuir el error experimental. Esto implica reconocer la estructura que tienen las UE.
Esta estructura puede deberse a una variacin local, espacial o temporal del material
experimental. Cuando las UE no son homogneas, pueden no reaccionar o responder a los
tratamientos de la misma manera o con la misma capacidad debido a sus diferencias
intrnsecas, hecho que puede ocurrir an cuando las UE tengan el mismo aspecto.
La forma tradicional de controlar la variacin del material experimental en experiencias
planificadas es formando grupos de UE homogneas. Estos grupos o estratos, comnmente
llamados bloques, son de una naturaleza tal que las unidades experimentales dentro de un
bloque, varan menos entre s que entre los bloques. Reconocidos los grupos de UE
homogneas, los tratamientos, de ser posible, debieran compararse dentro de cada grupo.
As se elimina del error experimental la variabilidad debida a los bloques, aumentando en
consecuencia la precisin de las comparaciones de las medias de tratamientos.
24
Los criterios de bloqueo pueden deberse no slo a las caractersticas relacionadas con las
unidades experimentales sino tambin, en algunas circunstancias, a aquellas ligadas con la
toma de informacin o la realizacin de los tratamientos. A las caractersticas relacionadas
con las UE se las denomina naturales mientras que al resto se las llama inducidas. Por
ejemplo, si tenemos un conjunto de UE homogneas pero algunos subgrupos de este
conjunto son manejados por distintos operarios, estos pueden introducir una fuente de
variacin en la respuesta (inducida). En este caso sera apropiado que cada operario trabaje
con todos los tratamientos a comparar.
Los bloques, a su vez, pueden ser fijos o aleatorios. En los dos casos, las hiptesis acerca de
los tratamientos son las mismas, pero el espacio de inferencia es distinto.
Distingamos la situacin en que hay uno o ms factores que particionan el conjunto de las
unidades experimentales en subconjuntos, tal que la unidades experimentales de un mismo
subconjunto o bloque sean homogneas (ms all de los tratamientos) en relacin a la
respuesta observada.
Ejemplos
En esta figura se observa que hay un efecto 'sombra' sobre el terreno, que determina que los
bloques queden as delimitados.
Bloque 1
Bloque 1
Bloque 2
Bloque 3
25
B1
B2
20
B3
B1
23
21
20
Bloque 1
Bloque 2
Bloque 3
Modelo
El modelo para analizar un diseo en bloques completamente aleatorizados (DBCA) sin
estructura factorial de tratamientos es:
yij = + i + j + ij
26
donde:
27
Error
SCBloque
j 1
Y Y
.j
..
ab
SCD=SCT-SCTrat-SCBloque
Total
SCT Y
i 1 j 1
2
ij
Y
..
glbl=b-1
gld=(a-1)(b-1)
CMBloq
CMD
SCBloq
glbl
CMBloq
CMD
SCD
gld
glt=a.b-1
ab
i 1
b
j 1
28
y..
yi. y..
i 1,..., a
j y. j y..
j 1,..., b
podemos usar estas estimaciones de los parmetros, para estimar el valor esperado de
cualquier observacin y obtener as el valor ajustado de yij.
Luego,
yij j
yij y.. ( yi. y.. )+(y. j y.. )
yij yi. y. j y..
El disponer de los valores ajustados (predichos) permite calcular los residuos para el
modelo. Estos residuos se usarn para evaluar el cumplimiento de los supuestos que
sustentan el anlisis de la varianza clsico (MMI).
Verificacin de supuestos
El anlisis de los supuestos del MMI se realiza utilizando las tcnicas descriptas
anteriormente. En el caso del DBCA se agrega el supuesto de aditividad bloquetratamiento.
Aditividad bloque-tratamiento:
Como ya se mencion con anterioridad la estructura de parcelas no debe interactuar con la
estructura de tratamientos, es decir el efecto en este caso de los bloques debe ser aditivo. De
no ser as, seria imposible hacer recomendaciones acerca de los tratamientos en forma
independiente a los bloques. Existen pruebas formales para determinar la presencia de
interaccin bloque-tratamiento, entre ellas las propuestas por Mandel y por Tukey. Estas
pruebas no siempre estn disponibles en los Software Estadsticos, por lo que se puede
recurrir a mtodos grficos de deteccin como se ve a continuacin:
Sin interaccin bloque-tratamiento
25.50
35.50
21.50
29.00
respuesta
respuesta
17.50
22.50
16.00
13.50
9.50
9.50
1
bloque 1
bloque 2
tratamiento
tratamiento
bloque 3
bloque 1
bloque 2
bloque 3
29
R
0.82
RAj
0.70
CV
21.42
30
F.V.
Modelo
Turno
velocidad
Material
Velocidad*Material
Error
Total
SC
650.91
127.32
89.20
206.89
227.49
145.63
796.53
gl
8
2
3
1
2
12
20
CM
81.36
63.66
29.73
206.89
113.75
12.14
F
Valor p
6.70 0.0019
5.25 0.0231
2.45 0.1138
17.05 0.0014
9.37 0.0035
R
0.82
RAj
0.70
CV
21.42
Se concluye que hay efecto de tratamientos (p=0.0020). Si bien la hiptesis sobre efecto
turno no es de inters y por las restricciones a la aleatorizacin que implica el hecho de que
los tratamientos se asignaron al azar dentro de cada turno la prueba F para turno no es
valida, no obstante, a partir del valor p=0.0231 se puede inferir que la inclusin de este
factor de bloqueo fue pertinente.
31
SC
14.96
206.89
67.89
6.35
89.83
137.66
523.58
gl
1
1
1
1
1
1
6
CM
14.96
206.89
67.89
6.35
89.83
137.66
87.26
F
Valor p
1.23
0.2886
17.05
0.0014
5.59
0.0357
0.52
0.4834
7.40
0.0186
11.34
0.0056
7.19
0.0020
Resistencia
20
15
10
5
0
1000
2000
3000
Velocidad
E
N1
N2
32
SC
650.91
127.32
523.58
gl
8
2
6
CM
81.36
63.66
87.26
1
1
2
67.89
6.35
1
1
2
89.83
1
137.66 1
145.63 12
796.53 20
14.96
206.89
37.12
67.89
6.35
113.75
89.83
137.66
F
Valor p
6.70
0.0019
5.25
0.0231
7.19
0.0020
1.23
17.05
3.06
5.59
0.52
9.37
7.40
11.34
0.2886
0.0014
0.0844
0.0357
0.4834
0.0035
0.0186
0.0056
12.14
RDUO_resistencia
6.07
2.57
-0.93
-4.43
-7.93
5.18
10.90
16.62
22.34
PRED_resistencia
28.07
Cuantiles observados(RDUO_resistencia)
Con los residuos y predichos de este modelo se obtuvieron los siguientes resultados:
5.43
n= 21 r= 0.963 (RDUO_resistencia)
2.25
-0.93
-4.11
-7.29
-7.29
-4.11
-0.93
2.25
5.43
33
Shapiro-Wilks (modificado)
Variable
RDUO_resistencia
n
21
Media D.E.
0.00 2.70
W*
0.96
p (una cola)
0.7850
N
21
R
0.77
RAj
0.62
CV
63.88
resistencia
25.19
18.62
12.04
5.47
testigo
V1N1
V2N1
V3N1
V1N2
V2N2
V3N2
tratamiento
resistencia-M
resistencia-N
resistencia-T
34
35
Cada PP tiene tantas UE de menor tamaos como niveles tiene el segundo factor, en este
caso la variedad, con 5 niveles. Estas UE son comnmente denominadas subparcela (SP).
Por ltimo, dentro de cada PP se aleatorizan las variedades en las SP, es decir no hay
restricciones a este nivel.
Para el ejemplo, un esquema experimental posible sera:
36
Fechai*Bloquek
Variedadj
Variedadj*Bloquek
Para evaluar el efecto Fecha se usa como trmino de error la interaccin Fecha*Bloque que
es conocida como error A.
Para evaluar los efectos Variedad, Variedad*Bloque y Fecha*Variedad, se usa el trmino
de error corriente (error experimental), en este contexto llamado error B.
El efecto de la interaccin Variedad*Bloque debe ser nulo, ya que la estructura de parcelas
no debe interactuar con la de tratamientos (supuesto de aditividad). Este trmino puede
entonces colocarse para contrastar esta hiptesis. Algunos autores sugieren que luego de
verificar el supuesto de aditividad, este trmino puede eliminarse del modelo, aumentando
de esa forma los grados de libertad para el contraste de las hiptesis sobre Variedades y
Variedad*Fecha.
En los diseos en Parcelas Divididas, el factor que se asigna en las PP, en este caso Fecha,
se contrasta con menor precisin que el asignado a las SP, en este caso variedad.
Este tipo de diseo se puede generalizar a ms de dos factores, agregando las restricciones
correspondientes. Si se utilizan 2 restricciones a la aleatorizacion, adems de la
correspondiente a Bloque si lo hubiere, se dice que el diseo es en parcelas subdivididas.
37
En este caso, aparece un nuevo trmino de error, por lo cual los trminos de error son tres.
Comnmente se los denomina A, B y C, siendo este ltimo el error experimental.
Los datos para el ensayo de fechas y variedades en un diseo en parcelas divididas en
bloques completos aleatorizados estn en el archivo variedadesPDB.idb.
Los resultados del anlisis de varianza se presentan a continuacin:
Anlisis de la varianza
Variable
Rendimiento
N
45
Cuadro de Anlisis
F.V.
Modelo
Fecha
Bloque
Bloque*Fecha
Variedad
Bloque*Variedad
Fecha*Variedad
Error
Total
R
0.97
R Aj
CV
0.92 6.27
valor p
<0.0001
0.0015
<0.0001
0.4302
0.0003
0.1671
0.4066
(Error)
(Bloque*Fecha)
Test:Duncan Alfa:=0.05
Error: 3.6290 gl: 4
Fecha Medias n
1.00
27.12 15
A
3.00
29.54 15
B
2.00
33.99 15
C
Letras distintas indican diferencias significativas(p<= 0.05)
Test:Duncan Alfa:=0.05
Error: 3.5844 gl: 16
Variedad
Medias n
1.00
28.05 9
A
2.00
28.06 9
A
4.00
31.60 9
B
5.00
31.66 9
B
3.00
31.71 9
B
Letras distintas indican diferencias significativas(p<= 0.05)
38
sobre ellas se aleatorizan las fechas. Posteriormente se aleatorizan las variedades en las SP
dentro de cada PP. Un esquema posible para el ejemplo con este tipo de experimento es:
N
45
Cuadro de Anlisis
F.V.
Modelo
Fecha
Fecha>Repeticiones
Variedad
Variedad*Fecha
Error
Total
R
0.82
R Aj
CV
0.66 8.33
(Error)
(Fecha>Repeticiones)
39
Test:Duncan Alfa:=0.05
Error: 5.6757 gl: 6
Fecha Medias
n
1
26.63
15
A
3
28.46
15
A
2
33.21
15
B
Letras distintas indican diferencias significativas(p<= 0.05)
Test:Duncan Alfa:=0.05
Error: 6.0070 gl: 24
Variedad
Medias
n
1
27.03
9
A
2
27.68
9
A
B
4
29.63
9
B
C
3
30.67
9
C
D
5
32.17
9
D
Letras distintas indican diferencias significativas(p<= 0.05)
R
0.77
R Aj CV
0.67 8.28
40
Se observa que hay efecto de fecha (p<0.0001) y efecto de variedad dentro de fecha
(p=0.0022). Se recomienda a partir de la prueba de Duncan, la fecha 2, y dentro de esta, las
variedades 3, 4, o 5.
Si se hubiera considerado la Fecha de siembra como aleatoria, el modelo de anlisis es el
mismo, pero cambian las esperanzas de los cuadrados medios y por ende la construccin de
las pruebas F. En este caso, si la fecha es aleatoria, su variabilidad debe evaluarse usando el
cuadrado medio de Variedad(fecha) como trmino de error. Los resultados para un anlisis
con fecha como aleatoria y variedad como fija se muestran a continuacin:
41
Anlisis de la varianza
Variable
N
R
R Aj CV
Rendimiento 45
0.77
0.67 8.28
Cuadro de Anlisis de la Varianza (SC tipo III)
F.V.
Modelo
Fecha
Fecha>Variedad
Error
Total
SC
602.61
346.24
256.36
178.22
780.83
gl
14
2
12
30
44
Test:Duncan Alfa:=0.05
Error: 5.9408 gl: 30
Fecha Variedad
Medias
1
2
23.56
3
1
25.53
1
4
26.57
1
1
26.90
1
3
27.23
3
4
28.58
2
1
28.66
3
3
28.87
1
5
28.89
3
2
29.44
3
5
29.88
2
2
30.03
2
4
33.74
2
3
35.90
2
5
37.73
CM
43.04
173.12
21.36
5.94
F
7.25
8.10
3.60
valor p
<0.0001
0.0059
0.0022
(Error)
(Fecha>Variedad)
n
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
A
A
A
A
A
B
B
B
B
B
B
B
B
B
B
B
C
C
C
C
D
D
D
Como la fecha se consider aleatoria, las hiptesis que se prueban sobre ella son:
H0: La varianza de las fechas es igual a cero
H1: La varianza de las fechas es distinta de cero
La hiptesis de varianza de fechas igual a cero se rechaza (p=0.0059). Se siguen
recomendando las variedades 3, 4, o 5 en la fecha 2.
42
covarianza es que la/s covariable/s no interactuen con los tratamientos y que exista una
relacin lineal entre la respuesta y la covariable.
Al ser la covariable independiente de los tratamientos, para obtener soluciones solo es
necesario imponer la restriccin usual:
i 0
Para realizar comparaciones de medias de tratamiento estas deben ser previamente
ajustadas por la covariable:
Yi ( ajustada ) Yi X i X
a
donde
X
i 1 j 1
a
ij
X i Yij Yi
X
i 1 j 1
ij
Xi
2
1
Xi X
CMR
ni SCresidual ( X )
Luego, las hiptesis que se contrastan en el ANCOVA de efectos fijos se realizan sobre las
medias ajustadas y pueden expresarse como:
H0: 1(aj) = 2(aj) = ...= a(aj) versus
H1: Al menos un par de medias ajustadas difiere
O alternativamente como:
H0: 1(aj) = 2(aj) = ...= a(aj)=0 versus
H1: Al menos un i(aj) 0
Ejemplo
Recordando el ejemplo de una panadera que desea probar 4 temperaturas de horneado de pan
(100, 130, 160 y 190 C) con el fin de verificar si existen diferencias en el volumen del pan
obtenido. Para hacer la prueba se amas el pan y se formaron 16 bollos. Cada uno de los
bollos fue asignado al azar a una de las temperaturas. Luego se aleatoriz el orden de las
temperaturas del horno y despus del horneado se midi el volumen del pan obtenido (cm3).
Los datos estn en el archivo pan.idb. En este ejemplo, la unidad experimental es el bollo de
pan. Estos se realizan a mano y en forma artesanal, razn por la cual es de pensar que no todos
los bollos tengan el mismo pero al entrar al horno. Si las UE son variables y no se tiene en
cuenta esta variacin, esto se traduce en un aumento de los residuos.
Se realiz un ANAVA a una va de clasificacin (DCA) usando el peso del bollo como
covariable y se obtuvo la siguiente tabla:
Anlisis de la varianza
Variable
N
R
vol
16
0.97
RAj
0.96
CV
0.70
44
Valor p
<0.0001
<0.0001
<0.0001
Coef
2.07
DMS: 48.92143
n
4
4
4
4
A
A
B
B
B
A
A
B
B
Por un lado, la DMS paso de 48.9 a 15.2, y por el otro, las medias de tratamiento han
cambiado, debido a que en el segundo anlisis son medias de tratamiento ajustadas por la
covariable.
ves de medir el peso del bollo se hubiera medido el peso del pan obtenido luego del
horneado, es posible que esta covariable haya sido afectada por los tratamientos, ya que es
de suponer que a mayor temperatura mayor deshidratacin y por consecuencia menor peso
del pan. En este caso, el tratamiento afect a la covariable y esta no debe ser usada como
tal.
1) Existe una relacin lineal entre la variable respuesta y la covariable.
Para verificar este supuesto se puede hacer un grfico o un anlisis de regresin. Con los
datos del ejemplo de la panadera se obtienen los siguiente resultados:
992
PRED_vol
960
929
897
865
185.50
193.75
202.00
210.25
218.50
peso
Est.
E.E.
LI(95%)
LS(95%)
711.94
3.66
T
3.73
3.89
Valor p
0.0023
0.0016
CpMallows
15.19
Se puede observar que hay una regresin lineal significativa (p=0.0016) entre volumen del
pan y peso del bollo.
Es importante notar que en el anlisis anterior no se removi el efecto de los tratamientos,
que como ya se vio en el primer anlisis es significativo. La no remocin de este efecto
puede llevar a no rechazar la hiptesis de coeficiente de regresin igual a cero cuando esta
es falsa. Si se tiene alguna duda al respecto, se puede realizar un ANAVA con efectos de
46
tratamiento nicamente y sobre los residuos de ese modelo (que ya tienen removido el
efecto de tratamiento) realizar la prueba del supuesto de linealidad. A continuacin se
muestra este anlisis para los datos de la panadera.
PRED_RDUO_vol1
45.55
26.02
6.50
-13.02
-32.55
185.50
193.75
202.00
210.25
218.50
peso
Valor p
<0.0001
<0.0001
CpMallows
110.61
Valor p
<0.0001
<0.0001
Puede verse como ha mejorado el ajuste haciendo la regresin de los residuos de volumen
versus peso. Ahora el valor de R2 paso de 0.52 a 0.89 y el valor p para la pendiente de
0.0016 a <0.0001.
El coeficiente de regresin es el mismo para todos los grupos de tratamiento.
Las comparaciones entre las medias de tratamiento ajustadas son independientes de la
covariable si las lneas de regresin para cada uno de los tratamientos son paralelas. Si esto
no ocurre, se debe ajustar de manera diferencial a las medias de cada tratamiento. En este
caso el modelo de anlisis es:
Yij = + i + i(Xij- X ) + ij , con i=1,...,a y j=1,..,ni
donde:
i es el coeficiente de regresin de Y sobre X en el i-simo tratamiento
47
Yi ( ajustada ) Yi i X ij X i
n
donde i
X
j 1
ij
X i Yij Yi
X
j 1
Y ( ajustado )
i
ij
Xi
2
1
Xi X
CMR
ni SCresidual ( X )
Vol
959
929
899
869
186
194
202
210
219
peso
vol-100
vol-160
vol-130
vol-190
En el grfico se puede ver que no hay una falta de paralelismo muy marcada, por lo tanto se
puede pensar en una nica pendiente de regresin para ajustar las medias de los
tratamientos.
Los supuestos del MMI se prueban sobre los residuos, que en el caso del anlisis de
covarianza para un DCA tienen la siguiente forma:
eij Yij Yi X ij X i
En general, los supuestos del MMI en ANCOVA son evaluados con las mismas tcnicas
grficas y/o probabilsticas usadas en ANAVA.
Por ultimo, la tcnica de anlisis de covarianza puede extenderse a todos los diseos y
arreglos factoriales mas comunes sin mayores complicaciones. Por ejemplo, en el caso de
un diseo en BCA con una covariable, el modelo resultante es:
Yij = + i + j + (Xij- X ) + ij ,
48