Diseño de Experimentos - Conceptos Preliminares PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 48

Diseo de experimentos: Conceptos preliminares

Tipos de estudios
Existen dos tipos de estudios que generan datos, los estudios observacionales y los estudios
experimentales.
Llamamos estudio observacional cuando sobre un proceso existente se observan (registra
informacin) una o ms variables aleatorias. La finalidad de estos estudios es explorar,
describir y confirmar hiptesis.
Qu es un experimento?
Prueba o serie de pruebas en las cuales se inducen cambios deliberados en las variables de
entrada de un proceso o sistema de manera que sea posible observar e identificar las causas
de los cambios en la respuesta de salida (Montgomery 1991).
Es una reproduccin restringida de la realidad con el fin de observar los efectos de su
manipulacin planificada (Casanoves y Di Rienzo, 1999).
La finalidad de estudios basados en experimentos es contrastar hiptesis, modelar y
predecir.
La diferencia principal entre estos dos tipos de estudio es que en los observacionales existe
una realidad que se observa y en los experimentales se manipula la realidad para observar
su respuesta. En la practica en muchas ocasiones se obtienen datos provenientes de
combinaciones de ambos tipos de estudios. En estos casos el desafo es modelar
correctamente los datos obtenidos.
Unidad experimental
Es la mnima porcin del material experimental sobre el cual un tratamiento puede ser
realizado. La unidad experimental (UE) puede ser una parcela de terreno, una maceta, un
animal, el conjunto de alumnos de un curso, etc. Pueden ser unidades naturales como en el
caso de una persona, un automvil, una planta o unidades artificialmente delimitadas como
en el caso de una parcela de terreno, una cantidad de agua, etc.
Unidad Observacional
Es la porcin de la unidad experimental que se mide u observa. En muchos estudios, la
unidad experimental coincide con la unidad observacional, pero en otros, una unidad
experimental puede representar un conjunto de unidades observacionales. Cuando en un
estudio se registran dos o mas variables, la unidad observacional puede ser distinta para
cada una de ellas. Por ejemplo, si la unidad experimental es una parcela con plantas de
trigo, se puede registrar la variable rendimiento sobre toda la parcela y la variable nmero
de espigas por planta sobre algunas plantas de la parcela. As, las unidades de observacin
son distintas para estas variables.
Factores
Son todas las fuentes de variacin reconocidas a priori por el investigador (no incluye el
error experimental). Cada uno de los valores que asume un factor se denomina nivel. Por
ejemplo, la temperatura de coccin del pan es un factor y las diferentes temperaturas
evaluadas son los niveles. Los factores pueden ser de inters del investigador (cuando se
desea hacer inferencia sobre ellos) o simplemente pueden ser reconocidos como una fuente
1

de variacin que de no contemplarse disminuyen la precisin de las comparaciones de


inters (factores de bloqueo).
En cualquiera de estos casos, los efectos de los factores pueden ser de naturaleza fija o
aleatoria. Por ejemplo, las temperaturas de coccin del pan se pueden fijar en 100, 110 y
120 grados o elegirse al azar temperaturas entre 100 y 120 grados. Los factores de efectos
fijos se utilizan cuando todos los niveles del factor que son de inters se incluyen en el
estudio. La extrapolacin de las conclusiones estadsticas mas all de los niveles
especificados hacia otros niveles no tiene sustento estadstico. Los modelos lineales
basados en variables predictoras categricas fijas (factores fijos) se denominan modelos de
efectos fijos. Cuando en el modelo se incluyen efectos aleatorios, es decir, se incluye en el
experimento una muestra aleatoria de posibles niveles del factor, se denomina modelo de
efectos aleatorios. Las inferencias generalmente se orientan hacia todos los posibles grupos
o niveles del o los factores de efectos aleatorios. A pesar que la distincin entre factores de
efectos fijos o aleatorios no afecta el procedimiento de ajuste del modelo de ANAVA ni el
contraste de hiptesis, en el modelo a una va de clasificacin, las hiptesis que se
contrastan son fundamentalmente diferentes. En el caso de efectos fijos se contrastan
hiptesis sobre igualdad de medias de tratamiento. En el caso de efectos aleatorios, se
contrastan hiptesis sobre la varianza de los niveles del factor. Cuando se combinan efectos
fijos y aleatorios se esta en presencia de un modelo mixto. Un a introduccin a los modelos
aleatorios y mixtos se vera mas adelante. Por ahora solo se har referencia a los modelos de
efectos fijos.
Cuando se estudia un solo factor se dice que el experimento es unifactorial ya que los
tratamientos consisten en aplicar distintos niveles de un mismo factor. Si en cambio un
tratamiento consiste en la combinacin de niveles de 2 o ms factores, entonces se dice que
el experimento es un experimento con estructura factorial de tratamientos.
Tipo de Factores
Los factores estudiados pueden ser de naturaleza cuantitativa o cualitativa. Un ejemplo del
primer caso es cundo se estudian dosis de fertilizantes en un cultivo. Un ejemplo de factor
cualitativo es el cultivar o variedad agrcola donde sus niveles son los distintos cultivares
evaluados.
Tratamientos
Se denomina tratamientos al conjunto de poblaciones estudiadas y/o acciones realizadas
sobre las unidades experimentales. Si el experimento es unifactorial, los tratamientos son
los distintos niveles del factor. Si el experimento es multifactorial (ms de un factor) los
tratamientos surgen de la combinacin de los niveles de los factores intervinientes. Por
ejemplo, si se prueba el factor temperaturas con tres niveles, 100, 110 y 120 C, los
tratamientos son las tres temperaturas. Si en esta experiencia adems se evala el factor tipo
de horno con tres niveles, elctrico (E), a gas (G) y a lea (L), se tendr un total de 9
tratamientos que surgen de la combinacin de los niveles de los dos factores, temperatura y
tipo de horno. Los tratamientos entonces sern: E-100, E-110, E-120, G-100, G-110, G120, L-100, L-110 y L-120.
Repeticin
Se denomina repeticin a cada una de las realizaciones independientes de un tratamiento.

Se denomina corrida a la realizacin de una repeticin de todos los tratamientos. Otras


veces se usa el termino replica para referirse a una repeticin de todo el experimento.
Pseudo-repeticin
Se denomina Pseudo-repeticin a cada una de las realizaciones no independientes de un
tratamiento. En algunas reas se denominan submuestras.
Confundimiento
Se dice que hay confundimiento cuando la comparacin entre los niveles de un factor puede
representar tambin la comparacin entre los niveles de otro factor. As ser imposible
conocer cul es el factor que podra estar causando las diferencias observadas. Por ejemplo,
si se desea probar el efecto de dos dietas A y B y se asigna la dieta A a un conjunto de
varones tomados al azar y la dieta B a un conjunto de mujeres tomadas al azar. Si al cabo
de un tiempo se observa la diferencia de peso respecto al peso inicial, no se podr
determinar si las diferencias se deben al efecto del factor dieta o al efecto del factor sexo.
En tal caso se dice que los efectos de dieta y sexo estn confundidos. El confundimiento se
podra evitar con la simple aleatorizacin de las dietas en las unidades experimentales
(individuos sin distincin de sexos) o la aleatorizacin de las dietas dentro de cada uno de
los sexos (recomendable si se espera que el sexo tenga efecto sobre la diferencia de peso).
Cuando se realiza un ANAVA (o test T) con pseudo-repeticiones nicamente, los efectos
de los tratamientos pueden estar confundidos con variaciones en las unidades
experimentales que, al no estar repetidas, no pueden distinguirse. Por ejemplo, si se estudia
la cantidad de especies vegetales de dos reas contiguas, una que fue hace aos arrasada por
el fuego y otra que no, se pueden obtener pseudo-repeticiones de los tratamientos (fuego y
no fuego). Si se hace una prueba con estos datos no se podr saber si las diferencias se
deben al efecto del fuego o a que las reas contiguas tenan diferencias entre si mas all del
fuego.
Control y testigo
Usualmente se denomina control al nivel del factor tratamiento que representa ausencia de
tratamiento. Es comn ver en experimentos UE a las que no se le aplican los tratamientos
de inters. El objetivo es comparar los efectos de tratamientos descontando variaciones
debidas a la manipulacin experimental. Por ejemplo, en un estudio involucrando varias
dosis de fertilizantes el rendimiento observado bajo los distintos tratamientos podra
deberse a la dosis de fertilizante pero tambin a las condiciones experimentales que no son
en las que habitualmente se observa el rendimiento (siembra a mano, riego con regadera,
etc.). Luego si no se incorpora un control (sin fertilizar) ser difcil discernir cunto de lo
observado se debe a la fertilizacin.
Se denomina testigo al tratamiento tradicional que se desea comparar con nuevos
tratamientos. Por ejemplo, para evaluar tres nuevas variedades de trigo en cuanto a su
rendimiento, se podra incluir la variedad tradicional como testigo, de manera de poder
comparar los rendimientos de las nuevas versus el testigo bajo las mismas condiciones
experimentales.

Aleatorizacin
En diseo y anlisis de experimentos hay dos etapas importantes de aleatorizacin. La
primera se relaciona con la necesidad de contar con unidades experimentales que
representen una muestra aleatoria de la poblacin de UE. La segunda aleatorizacin es la
que se realiza para asignar los distintos tratamientos en las UE o viceversa. Esta es una
condicin necesaria para que la estimacin de los parmetros de inters sea insesgada.
Error experimental
Este error est compuesto por los errores de tratamiento, de muestreo y de medicin y
aunque en la prctica generalmente son indistinguibles, es importante reconocerlos para
tratar de minimizarlos. En el ANAVA, el error experimental es un estimador de 2 y por lo
tanto mantener en niveles bajo los errores que lo componen harn ms eficientes las
comparaciones de inters.
Error de Tratamiento: Es el error que se podra cometer al no poder aplicar el mismo
tratamiento de manera exactamente igual en las unidades experimentales (UE) que le
fueron asignadas.
Error de Medicin: Error relacionado a la obtencin del dato. Podra ser introducido por
parte del operario que obtiene el dato o por el instrumento de medicin.
Error de Muestreo: Est relacionado con la variacin de las UE que es de esperar exista
an cuando toda otra fuente de variacin se encuentre controlada. Su magnitud depende de
la heterogeneidad de las UE.
El error de tratamiento se controla con un buen protocolo de aplicacin de los tratamientos,
el error de medicin, con la capacitacin del personal y la eleccin de buenos aparatos de
medida. El error de muestreo, se controla mediante un proceso de aleatorizacin que
contemple la estructura de las unidades experimentales, es decir asegurarse que todos los
tratamientos estn representados en todos los grupos o bloques de unidades experimentales.

Diseo de experimentos
El diseo de experimentos consiste en un conjunto de tcnicas que tienen, entre otras, la
finalidad de controlar las fuentes de variacin no deseadas y disminuir el trmino de error
experimental.
Uno de los principales objetivos en la planificacin de una experiencia, siguiendo un diseo
experimental, es la reduccin del error experimental, con el propsito de incrementar la
eficiencia de la inferencia relacionada a la comparacin de tratamientos.
El diseo experimental puede entenderse como una estrategia de combinacin de la
estructura de tratamientos (factor/es de inters) con la estructura de unidades
experimentales, de manera tal que la variabilidad de la variable respuesta, al menos en
algn subgrupo de unidades experimentales, pueda ser atribuidas solamente a la accin de
los tratamientos, excepto por errores aleatorios. As, es posible contrastar (comparar)
medias de tratamientos o combinaciones lineales de medias de tratamientos con el menor
ruido posible.
La estructura de tratamientos esta relacionada al nmero de factores involucrados en el
experimento, sus niveles y la combinacin de los mismos. La estructura de unidades
experimentales surge del agrupamiento de las mismas en grupos o bloques que puedan
considerarse formados por UE homogneas. Es importante en toda situacin donde se
4

disea una experiencia distinguir entre la estructura de parcelas o estructura de las UE por
un lado, y la estructura de tratamientos, por el otro.
La estructura de parcelas es generalmente determinada a priori de la aplicacin de los
tratamientos a las UE, tratando que sta contemple todos los factores que producen
variacin en la respuesta entre las distintas unidades experimentales. En la mayora de las
experiencias, es posible identificar patrones en las UE, los que se asocian a factores, que si
bien no corresponden a los tratamientos de inters, podran diferenciar las respuestas
provenientes de las distintas UE. Una estrategia para controlar el efecto de dichos factores
es la estratificacin o bloqueo.
La estructura de tratamientos esta asociada a las cuestiones sobre las que interesa inferir. La
aleatorizacin es el proceso que permite combinar ambas estructuras. La estructura de
tratamientos es aleatorizada en las unidades experimentales.
As, un diseo experimental involucra:
a) la eleccin de la estructura de tratamientos.
b) la deteccin de la estructura de parcelas (independientemente de la estructura de
tratamientos).
c) la eleccin del mtodo de aleatorizacin acorde para la combinacin de ambas
estructuras.
El diseo experimental determina el modelo a utilizar para un correcto anlisis de la
variabilidad en la respuesta.
Algunas estructuras de parcelas clsicas son aquellas que caracterizan los diseos: 1)
completamente aleatorizados (DCA), donde las UE no tienen estructura; 2) en bloques
completos aleatorizados (DBCA), donde las UE homogneas se agrupan en un mismo
bloque y los bloques son heterogneos en relacin a un factor de clasificacin (o
combinacin de factores de clasificacin); 3) cuadrado latino (DCL), donde las UE se
agrupan en bloques heterogneos en relacin a dos factores de clasificacin independientes
(estructura de UE a dos va de clasificacin).
No debe existir interaccin entre los componentes de la estructura de parcelas y los
componentes de la estructura de tratamientos, es decir, se asume que la relacin existente
entre tratamientos es consistente de bloque a bloque (excepto por la variacin aleatoria).
Preguntas que pueden hacerse para realizar, identificar y analizar un experimento
comparativo

Cuntos tratamientos se desean comparar?


Cuntas repeticiones por tratamiento son suficientes para comparar con la precisin
deseada?

Es necesario observar la evolucin de la respuesta en el tiempo?


Cules son las unidades experimentales?
Cules son las unidades de observacin?
Son las unidades experimentales homogneas?
Son las unidades experimentales homogneas suficientes para

realizar todos los

tratamientos?

Cmo se asignan los tratamientos a las unidades experimentales?


Los tratamientos tienen alguna estructura?
Puede el diseo resultante ser analizado estadsticamente y

las comparaciones

deseadas llevadas a cabo?.

Anlisis de la varianza (ANAVA)


Introduccin
En experimentos con fines comparativos, usualmente se realiza la aplicacin de varios
tratamientos a un conjunto de unidades experimentales para valorar y comparar las
respuestas obtenidas bajo cada tratamiento. La tcnica del Anlisis de Varianza (ANAVA)
permite realizar las estimaciones de las respuestas promedio de tratamientos y las
comparaciones entre ellas. El ANAVA es un procedimiento que descompone la
variabilidad total en la muestra (suma de cuadrados total de las observaciones) en
componentes (sumas de cuadrados) asociados cada uno a una fuente de variacin
reconocidas.
El ANAVA es una tcnica general en la que participa y se analiza la variacin en una
variable respuesta continua. La variacin es particionada en variacin explicada y no
explicada por uno o ms predictores llamados factores. Las categoras de cada factor
(niveles) generalmente conforman grupos o condiciones experimentales (tratamientos). El
objetivo es la comparacin de las medias de la variable respuesta en esos grupos. El
ANAVA examina la contribucin relativa de diferentes fuentes de variacin respecto a la
variacin total en la variable respuesta y permite contrastar la H0 sobre igualdad de medias
entre los grupos versus la H1 que establece que al menos 1 es diferente.
La variables involucradas en el ANAVA son la variable dependiente o respuesta, las
variables de clasificacin (predictoras asociadas a factores cualitativos o cuantitativos con
un numero discreto de niveles) y las covariables (predictoras asociadas a fuentes de
variacin continuas entre UE) en caso de que existan.
La variable dependiente es la variable sobre la cual se desea hacer comparaciones entre los
tratamientos. Las variables de clasificacin son las que representan factores o fuentes de
variacin que permiten separar o clasificar las observaciones en grupos. Normalmente
existen factores que tienen que ver con la estructura de tratamientos del experimento y
factores relacionados a la estructura de las unidades experimentales.
Las covariables (o variables concomitantes) representan variables aleatorias continuas cuyo
valor vara con cada unidad experimental y que posiblemente estn relacionadas
linealmente con la variable respuesta. Las covariables no deben interactuar con los factores
que se evalan en el experimento. En situaciones donde se registr una variable
concomitante, se puede realizar el anlisis de covarianza. En este anlisis antes de estudiar
las diferencias entre tratamientos, se ajusta o remueve en la variable dependiente la
variabilidad debida a la covariable. Ms adelante se desarrollar el tema anlisis de
covarianza.
6

Modelo de ANAVA de efectos fijos a un criterio de clasificacin


La tcnica de anlisis de la varianza presupone un modelo lineal para explicar la variacin
en la variable respuesta . Cuando se estudia un solo factor con a niveles (o a tratamientos)
se dice que el anlisis de varianza es a un criterio de clasificacin y el modelo (modelo de
efectos) queda definido de la siguiente forma:
Yij = + i + ij ,

con i=1,...,a y j=1,..,ni

donde:
Yij es la j-sima respuesta en el i-simo tratamiento
es la media poblacional de la variable respuesta
i es el efecto del i-simo tratamiento
ij es un termino de error aleatorio. Bajo los supuestos del modelos de muestreo ideal, los
trminos de error asociados a cada una de las observaciones se suponen
independientemente distribuidos, normales, con esperanza 0 y varianza 2 i,j (Varianza
constante).
La media general () pueda ser entendida como la media de todas las medias poblacionales
asociadas a cada uno de los grupos en estudio. Se considera un parmetro fijo y su valor es
constante a travs de todas las observaciones, por lo que suele denominarse simplemente
constante. Los efectos de tratamientos (i) representan la diferencia o corrimiento entre la
media poblacional del grupo considerado y la media general. En el modelo de ANAVA de
efectos fijos los (i) se consideran constantes (valores fijos) desconocidas. El efecto del
tratamiento 1 (1) es la diferencia que hay entre la media del tratamiento 1 y la media
general. La hiptesis nula del ANAVA postula la igualdad de medias de todos los
tratamientos comparados. Si la hiptesis nula del ANAVA fuera verdadera las a
poblaciones estaran centradas sobre la misma esperanza, es decir, en . El trmino de error
asociado a la observacin ij, representa la diferencia entre dicha observacin y la media
poblacional del grupo o tratamiento correspondiente.
El modelo de ANAVA tambin puede plantearse en trminos de la media de celda o media
de grupo (modelo de celdas o modelo de medias) en lugar de hacerlo sobre la base de
efectos de grupos. Es decir,
Yij =i + ij , con i=1,...,a y j=1,..,ni
El nmero de parmetros de posicin en esta parametrizacin es igual al nmero de medias
de grupo. Para el caso de estudios involucrando un solo factor con igual tamao de muestra
para cada nivel no existen diferencias entre este modelo y el de efectos a la hora del
contraste de hiptesis. El modelo de celdas puede ser ventajoso en algunas situaciones con
diseos complejos o multifactoriales donde se ha perdido una celda.
Si bien los i del modelo de efectos no son estimables, los i = + i si se pueden estimar
para cada grupo. Debido a la equivalencia entre el modelo de celdas y el modelo de efectos,
resulta indistinto plantear la hiptesis nula del ANAVA en trminos de media de celda o
efectos de tratamiento.
Las hiptesis que se contrastan en el ANAVA de efectos fijos pueden expresarse como:
H0: 1 = 2 = ...= a versus
H1: Al menos un par de medias difiere
o alternativamente como:
7

H0: 1 = 2 = ...= a=0 versus


H1: Al menos un i 0
Estimacin
En el marco del modelo de efectos, los parmetros a estimar sern, la media general, los
efectos de tratamientos y la varianza de los trminos de error, la cual se asumi constante a
travs de los niveles de los factores. La estimacin de estos parmetros usualmente se
realiza mediante los procedimientos de estimacin de mnimos cuadrados (MC) o mxima
verosimilitud (MV). El modelo de muestreo ideal (MMI) es aquel modelo que cumple con
los supuestos de independencia, homocedasticidad y distribucin normal para los trminos
de error. Bajo los supuestos del MMI las estimaciones de los parmetros de posicin
obtenidas por uno u otro procedimiento son las mismas, mientras que la estimacin de la
componente de varianza residual difiere. El estimador MV de 2 es sesgado mientras que el
estimador por MC es insesgado, pero la eficiencia del estimador MV puede ser mayor sobre
todo si el tamao de muestra es grande.
En experimentos con pocas repeticiones por tratamiento y bajo el MMI, usualmente se
utiliza el procedimiento de mnimos cuadrados ordinarios, el que provee de los siguientes
estimadores para los parmetros del modelo de efectos:
Y
Y Y (Yi Y ) Yi

El error estndar para una media de tratamientos, que permite construir intervalos de
confianza para las medias poblacionales bajo cada tratamiento y/o comparar medias de
tratamiento es:
Y2
i

CMR
ni

donde CMR es el cuadrado medio residual del ANAVA tambin conocido como cuadrado
medio dentro (CMD), ya que es un estimador de la variabilidad entre las UE tratadas de la
misma forma, es decir, dentro de un mismo tratamiento.
Los trminos de error son estimados por los residuos eij como la diferencia entre el valor
observado y el valor predicho por el modelo ( Yij Yi ):
ij eij Yij Yi

Tabla de anlisis de varianza para un modelo a una va de clasificacin


Fuente de
Suma de Cuadrados
Grados
Cuadrado
Variacin
de
Medio
Libertad
2
a
Entre
gle= a
1 n
1 a n
SCE
2
SCE

(
Y
)

Y
ij
CME

ij
Tratamientos
1
n
N
i 1 i
j 1
i 1 j 1
gle
i

Dentro
(Error
Experimental)
Total

SCD=SCT-SCE

ni

i 1

SCT Yij2

gld= N - a

1 a ni
Yij
N i 1 j 1

CMD

CME
CMD

SCD
gld

glt= N 1

Una forma de calcular el cuadrado medio dentro es a partir de las varianzas muestrales
obtenidas para cada tratamiento:

(n1 -1)12 ... (na -1) a2


CMD
(n1 -1) ... (na -1)
El Cuadrado Medio Dentro es un estimador insesgado de 2, es decir E(CMD) = 2.
El cuadrado medio entre (CME) se asocia a la variabilidad entre las medias de tratamientos.
En el caso de tamaos muestrales iguales para cada tratamiento se puede obtener de la
siguiente forma:

CME Y2 n .
A diferencia del CMD que es un estimador incondicional de 2, el CME estima a 2 slo si
las esperanzas de los tratamientos que se comparan son iguales (H0 verdadera) de lo
a

contrario estima a 2 + c 2i , con c una constante mayor que 0. Luego, CME es un


i 1

estimador insesgado de slo si H0 es verdadera, de lo contrario estima a 2 ms una


cantidad que representa una medida de la magnitud de los efectos de tratamiento.
Si H0 es verdadera, todo i=0 y por lo tanto la componente aadida por los efectos de
tratamiento se anula y la esperanza del CME es 2. Luego el CMD y el CME son ambos
estimadores independientes de 2 bajo H0.
Sean E2 y D2 las varianzas estimadas por el CME y el CMD respectivamente, luego bajo
la hiptesis de igualdad de medias de tratamiento, E2 = D2 de lo contrario E2 > D2 . El
ANAVA se basa en dos estimadores independientes de la varianza de las observaciones:
uno basado en la variabilidad dentro de los tratamientos y otro basado en la variabilidad
entre los tratamientos. Si no hay diferencias entre las medias de los tratamientos, estos dos
estimadores estiman al mismo parmetro, de lo contrario el segundo tiende a ser mayor
cuanto mayor es la diferencia entre los tratamientos. Luego, a pesar de que la hiptesis de
inters del ANAVA se refiera a la igualdad de las esperanzas de dos o ms distribuciones,
la tcnica del ANAVA se basa en la comparacin de varianzas para inferir acerca de la
9

igualdad de las esperanzas. Por lo tanto otra forma de plantear la hiptesis en ANAVA es la
siguiente:
H0 : E2 = D2 vs. H1 : E2 > D2
El contraste de hiptesis consiste en calcular el estadstico F utilizando los estimadores de
E2 y D2 , de la siguiente forma:

CME
CMD
a

Este estadstico tiene, bajo H0, una distribucin F(a-1),(N-a)) con N = ni . Luego, para un
i 1

nivel de significacin , si el valor observado de F es mayor que el cuantil (1-) de la


distribucin F(a-1),(N-a) se rechaza H0, implicando que H1 es verdadera. El rechazo de H0
a

implica que i2 es distinto de 0 y por lo tanto, que algn i 0; luego se concluye que no
i 1

todas las medias de tratamiento son iguales o que al menos un tratamiento tiene efecto
distinto de 0.
En este diseo se supone que las unidades experimentales son homogneas, es decir no se
identifica estructura alguna. Los tratamientos (que pueden o no tener estructura) se asignan
completamente al azar a las unidades experimentales. El nmero de repeticiones puede
variar de un tratamiento a otro. Aquellos con igual nmero de repeticiones se denominan
balanceados; para algunas tcnicas de estimacin asociadas, el balance es una caracterstica
deseada.
Ejemplo: Diseo completamente aleatorizado a una va de clasificacin
Una panadera desea probar 4 temperaturas de horneado de pan (100, 130, 160 y 190 C) con
el fin de verificar si existen diferencias en el volumen del pan obtenido. Para hacer la prueba
se amas el pan y se formaron 16 bollos. Cada uno de los bollos fue asignado al azar a una de
las temperaturas. Luego se aleatoriz el orden de las temperaturas del horno y despus del
horneado se midi el volumen del pan obtenido (cm3). Los datos estn en el archivo pan.idb.
Se realiz un ANAVA a una va de clasificacin y se obtuvo la siguiente tabla:
Anlisis de la varianza
Variable

vol

16

RAj

CV

0.59

0.48

2.52

Cuadro de Anlisis de la Varianza (SC Tipo III)


F.V.

SC

gl

CM

Valor p

Modelo

9220.50

3073.50

5.66

0.0119

Temperatura

9220.50

3073.50

5.66

0.0119

Error

6515.50

12

542.96

Total

15736.00

15

10

El valor p=0.0119 para el efecto de tratamientos (temperaturas) sugiere el rechazo de la


hiptesis nula de igualdad de medias de tratamientos.

Anlisis de los supuestos del MMI


Para el anlisis de los supuestos del modelo de muestreo ideal, se utilizan las mismas
tcnicas grficas y de pruebas de hiptesis que se desarrollaron en regresin lineal.
A continuacin se muestra el diagrama de dispersin de residuos versus predichos, el
grfico qq-plot para de residuos, la prueba de homogeneidad de varianzas de Levene y la
prueba de Shapiro-Wilks para el supuesto distribucional para los datos del archivo pan.idb.
42.00

Cuantiles observados(RDUO_vol)

45.55

RDUO_vol

26.02

6.50

-13.02

-32.55
887.11

902.99

918.88

934.76

n= 16 r= 0.969 (RDUO_vol)

22.28

2.57

-17.15

-36.87
-36.87

950.64

PRED_vol

-17.15

2.57

22.28

42.00

Cuantiles de una Normal(0,434.37)

Anlisis de la varianza Prueba de Levene


Variable
RABS_vol

N
16

R
0.05

RAj
0.00

CV
72.28

Cuadro de Anlisis de la Varianza (SC Tipo III)


F.V.
SC
gl
CM
F
Valor p
Modelo
103.30
3
34.43
0.23
0.8745
Temperatura 103.30
3
34.43
0.23
0.8745
Error
1805.19
12
150.43
Total
1908.48
15
Shapiro-Wilks (modificado)
Variable
n
Media D.E.
W*
RDUO_vol
16
0.00 20.84 0.91

p (una cola)
0.2452

11

No hay evidencias para rechazar el supuesto de homogeneidad de varianzas (Prueba de


Levene, p=0.8745) ni el de distribucin normal de los errores (Prueba de Shapiro-Wilks,
p=0.2425).
Como los supuestos del MMI pueden ser sostenidos, y se rechaz la hiptesis nula de
igualdad de medias de tratamientos, por lo que se concluye que al menos una temperatura
de horneado produce un volumen promedio diferente. Para identificar cul o cuales
tratamientos se asocian a valores medios diferentes se puede recurrir a tcnicas de
comparaciones mltiples (donde se contrastan todos los pares de medias) o a la estimacin
de contrastes entre medias especficamente determinados por el usuario en funcin del
conocimiento del problema y el objetivo de la investigacin.
Comparaciones mltiples
Usualmente, cuando la hiptesis nula del ANAVA es rechazada se implementa una prueba
para comparar las medias.
Para analizar las diferencias de a pares, entre las medias de las distribuciones que se
comparan, existe una gran variedad de pruebas a posteriori o comparaciones mltiples
entre las que se pueden mencionar procedimientos tradicionales y procedimientos
jerrquicos (basados en algoritmos de agrupamiento jerrquico). Con un nmero alto de
medias de tratamiento, los procedimientos tradicionales pueden producir resultados de
difcil interpretacin ya que una misma media puede pertenecer a ms de uno de los grupo
de medias que resultan en la comparacin (falta de transitividad). Por el contrario, los
mtodos jerrquicos producen agrupamientos mutuamente excluyentes (particin del
conjunto de medias de tratamientos).
Entre los procedimientos tradicionales se encuentran, entre otras, las siguientes pruebas:
LSD de Fisher, Bonferroni, Tukey, Duncan y Student-Newman-Keuls (S.N.K).
Entre los procedimientos jerrquicos se pueden mencionar: Di Rienzo, Guzmn y
Casanoves (D.G.C.), (Di Rienzo, et al., 2002); Jollife (Jollife, 1975), Scott y Knott (Scott y
Knott (1974)) y la prueba BSS (Bautista et al. (1997)), entre otras.
La eleccin del mtodo de comparaciones mltiples depende del objetivo de la
investigacin y de que tasa de error (Tipo I o Tipo II) se desee controlar. Las pruebas de
hiptesis tienen riesgos asociados al rechazo y al no rechazo de la hiptesis (contraste) de
inters. El error tipo I considera el riesgo de rechazar una hiptesis nula verdadera y su
probabilidad esta determinada por el investigador. El error tipo II es el riesgo de no
rechazar una hiptesis falsa, es decir, en el contexto de las comparaciones mltiples de a
pares, declarar iguales dos medias que en realidad no lo son. La tasa de error tipo II, para
un nivel de significacin dado, esta determinada por el tamao muestral, la varianza y la
magnitud de las diferencias entre las medias poblacionales involucradas. Los riesgos de
cometer error de tipo I y de tipo II tienen una relacin inversa; manteniendo constante las
caractersticas mencionadas arriba en relacin al error de tipo II, si disminuye , aumenta
el error de tipo II.
La importancia relativa de uno u otro error depende del contexto en el cual se realiza el
contraste de hiptesis. Por ejemplo, si un laboratorio esta en las primeras etapas de
investigacin de diversas drogas para el control de una enfermedad, el riesgo mayor podra

12

ser descartar una droga que en realidad produce el efecto deseado. En cambio, si se esta por
recomendar una droga para un paciente, el riesgo mayor es recomendar una que no sea
efectiva. En el primer caso se debe elegir una prueba que controle el error de tipo I mientras
que para el segundo una que controle el error tipo II.
Para los datos del ejemplo de la panadera, se realiz la prueba de Tukey para comparar las
medias de las temperaturas estudiadas obtenindose los siguientes resultados:
Test : Tukey Alfa: 0.05 DMS: 48.92143
Error: 542.9583 gl: 12
Temperatura Medias
n
100
890.00
4
A
190
910.25
4
A
B
160
944.00
4
B
130
947.75
4
B
Letras distintas indican diferencias significativas(p<=0.05)

Los mayores volmenes de pan se obtienen con las temperaturas de 190, 160 y 130 C.
Estas temperaturas no difirieren entre si, por lo que se recomienda la temperatura de 130 C
ya que es la ms econmica de lograr. Se puede ver claramente la falta de transitividad del
mtodo de Tukey, ya que la temperatura 100 no difiere de 190, la temperatura 190 no
difiere de 160, pero la temperatura 100 difiere de 160. Usando un mtodo LSD se obtienen
los siguientes resultados:
Test : LSD Fisher Alfa:
Error: 542.9583 gl: 12
Temperatura Medias
100
890.00
190
910.25
160
944.00
130
947.75

0.05 DMS: 35.89948


n
4
4
4
4

A
A

B
B

C
C

Letras distintas indican diferencias significativas(p<=0.05)

Esta prueba indica que el mayor volumen de pan se logra con las temperaturas 160 o 130.
No obstante se sigue recomendando la temperatura 130 por cuestiones econmicas. Se
puede observar que la prueba LSD encuentra ms diferencias que la prueba de Tukey.
Adems de la clasificacin por su carcter transitivo o no, los mtodos de comparaciones
mltiples pueden clasificarse por su objetivo, por el tipo de tasa de error que contro lan, y
por si la mnima diferencia significativa que se obtiene con ellos es constante o variable
entre otros criterios.
Respecto a la clasificacin por el objetivo de la comparacin pueden separarse en: 1) todas
las comparaciones posibles de a pares (Ej.: Tukey, Duncan, LSD, DGC, Jollife), 2) todas
las comparaciones contra un testigo (Ej.: Dunnett), 3) todas contra la media mayor o todas
contra la media menor (Ej.: HSU).
Respecto al tipo de tasa de error que controlan sta puede ser por experimento o por
comparacin. La tasa de error por experimento se calcula como el nmero de experimentos
en que se comete un error sobre el nmero total de experimentos (se suponen repeticiones
independientes del mismo experimento). La tasa de error por comparacin se calcula como
el nmero de comparaciones donde se comete un error sobre el nmero total de
13

comparaciones de un experimento. En general las tasas de error por experimento son


mayores que las tasas de error por comparacin.
Algunos procedimientos de comparaciones mltiples como son Bonferroni y Scheff,
permiten realizar contrastes generales e intervalos de confianza simultneos. Esta
generalidad trae como consecuencia una prdida de potencia.
La prueba de Tukey requiere medias no correlacionadas y si bien fue pensada para igual
nmero de repeticiones por tratamiento puede usarse una correccin en caso de desbalance
(Tukey-Kramer). Controla el error tipo I por experimentacin, razn por la cual es una
prueba conservadora (poco potente).
La prueba de rango mltiple de Duncan y la de SNK tambin requieren de medias no
correlacionadas e igual nmero de repeticiones por tratamiento. Son ms potentes que
Tukey pero menos que LSD.
La prueba LSD no requiere igual nmero de repeticiones, est entre las ms potentes y
controla la tasa de error tipo I por comparacin.
Dentro de los procedimientos que tienen diferencia mnima significativa constante se
encuentran el mtodo de Tukey, el LSD, el DGC y dentro de los que poseen diferencia
mnima significativa variable estn el SNK, Duncan y el REGW, entre otros.
Contrastes
Si bien el uso de las comparaciones mltiples realizadas en el ejemplo del volumen de pan
es apropiado, numerosos autores recomiendan en caso como este, donde se cuenta con
niveles equidistantes de un factor cuantitativo, realizar contrastes polinmicos ortogonales
para identificar si existe alguna tendencia particular en las medias de la variable respuesta
respecto a los niveles del factor. Con a niveles del factor tratamiento a analizar, es posible
postular a-1 polinomios ortogonales de orden 1,...,a-1. Coeficientes para polinomios
ortogonales para varios nmeros de tratamientos pueden ser encontrados en cualquier texto
de diseo de experimentos. Un contraste es definido como una combinacin lineal de los
parmetros del modelo. En el anlisis de varianza los contrastes generalmente toman la
forma c1M1+ c2M2+...+ caMa (donde Mi es la i-sima media poblacional y los coeficientes
ci son constantes conocidas, al menos dos distintos de cero, y su suma es cero).
Si se desea plantear ms de un contraste, para que las comparaciones sean independientes
unas de otras, los contrastes debern ser ortogonales. Dos contrastes son ortogonales si la
suma de los productos de los coeficientes de ambos contrastes es cero. O sea, para C1 =
c1M1 + c2M2+...+ caMa y C2 = b1M1 + b2M2+...+ baMa, C1 y C2 son ortogonales si c1b1+
c2b2+...+ caba = 0. Tres o ms contrastes son ortogonales si todos los pares de contrastes
definidos entre ellos son ortogonales.
El nmero mximo de contrastes ortogonales a realizar es igual al nmero de tratamientos
menos 1 (a-1).
La sumas de cuadrados asociadas a un conjunto de contrastes ortogonales representan una
particin de la suma de cuadrados de tratamientos. Si se realizan a-1 contrastes ortogonales
y se cuenta con igual nmero de repeticiones por tratamiento, la suma de cuadrados de cada
uno de los contrastes suma la suma de cuadrados de tratamientos.

14

En el ejemplo de la panadera, al tener 4 temperaturas, se pueden realizar 3 contrastes


polinmicos ortogonales cuyos coeficientes podran ser:
Tendencia lineal:
-3 1 1 3
Tendencia cuadrtica: 1 1 1 1
Tendencia cbica: -1 3 3 1
Con estos contrastes se obtienen los siguientes resultados:
Contrastes
Temperatura
SC
Contraste1
649.80
Contraste2 8372.25
Contraste3
198.45
Total
9220.50

gl
1
1
1
3

CM
649.80
8372.25
198.45
3073.50

Coeficientes de los contrastes


Temperatura Cont. 1
Cont. 2
100
-3.00
1.00
130
-1.00
-1.00
160
1.00
-1.00
190
3.00
1.00

F
Valor p
1.20 0.2954
15.42 0.0020
0.37 0.5567
5.66 0.0119

Cont. 3
-1.00
3.00
-3.00
1.00

La tendencia lineal (contraste 1) es no significativa (p=0.2954) al igual que la tendencia


cbica (contraste 3, p=0.5567). La tendencia cuadrtica result significativa (p=0.0020).
Estos hallazgos pueden visualizarse en el siguiente grfico:
992

vol_suavizada

960

929

897

865
96

120

145

170

195

Temperatura

Como cada tratamiento tenia el mismo nmero de repeticiones, la suma de la suma de


cuadrados de los contrastes es igual a la suma de cuadrados de tratamiento (particin
ortogonal).
Adems de usarse para verificar tendencia (contrastes polinmicos), los contrastes permiten
tambin hacer otro tipo de comparaciones entre medias, planificadas en funcin de la
estructura de los tratamientos y/o los objetivos del estudio. Estos contrastes podran
realizarse an antes de obtener los datos ya que no dependen de los resultados
particularmente obtenidos en la realizacin del experimento; por ello muchos autores los

15

denominan contrastes a priori. Por ejemplo, si de tres tratamientos que se estn ensayando
el tratamiento 1 corresponde a un testigo y los y los otros dos tratamientos representan 2
nuevas acciones que se estn experimentando, podra ser de inters postular a priori el
siguiente par de contrastes sobre las tres medias M1, M2 y M3: el contraste
0 1 1 comparar la M2 con la M3 (las dos acciones experimentales entre si) y el contraste 2
-1 -1 es equivalente a comparar M1 con la media de M2 y M3 (el promedio de las acciones
experimentales versus el testigo).
Por ltimo, si bien los contraste ortogonales proveen informacin independiente, en
algunos casos resultan de inters contrastes o comparaciones que no son ortogonales. Este
el caso, por ejemplo, cuando se tiene un tratamiento testigo que se desea comparar con el
resto de los tratamientos experimentales. Si se tiene un testigo (T) y dos tratamientos
nuevos (N1 y N2) y se desea comparar cada uno de los nuevos tratamientos versus el
testigo, los contrastes serian: 1 1 0 (para comparar T versus N1) y 1 0 1 (para comparar T
versus N2). Estos contrastes no son ortogonales ya que su producto interno es distinto de
cero (1 en este caso).
En sntesis el tipo de contraste a realizar depender de la hiptesis de investigacin y de la
estructura de los tratamientos.

Introduccin a los experimentos factoriales


El uso de experimentos factoriales implica un reconocimiento de la estructura de
tratamientos que hace al anlisis ms eficiente en cuanto a las comparaciones de inters
entre los tratamientos. Es posible evaluar la respuesta en relacin a los niveles de cada uno
de los factores (efectos principales) y la interaccin entre factores o cambios en las
comparaciones de los niveles de un factor entre los distintos niveles de otro/s factor/es.
Cuando se combinan niveles de varios factores para conformar un tratamiento, el
experimentador se pregunta si es posible identificar los efectos de cada uno de los factores
y eventualmente probar hiptesis sobre ellos. Los experimento con arreglo factorial de
tratamiento permiten responder a esa pregunta. A pesar de que otras estrategias podran ser
usadas, por qu son preferibles los arreglos factoriales?. La respuesta est relacionada con
el concepto de eficiencia, que en trminos prcticos, se relaciona con la cantidad de
repeticiones que son necesarias en un experimento para tener una precisin deseada para
los contrastes de inters. Por ejemplo, si para evaluar los efectos de los factores A y B con
tres niveles cada uno se dispone de tres repeticiones para cada nivel, se tendrn , si se
realizan dos ensayos unifactoriales por separado, 9 unidades experimentales para el ensayo
del factor A y otras 9 para el ensayo del factor B, haciendo un total de 18 unidades
experimentales. Si en vez de utilizar dos experimentos separados se planifica un
experimento con 9 tratamientos (3 niveles de A x 3 niveles de B) y solo se repite una vez
cada tratamiento, solamente se necesitarn 9 unidades experimentales para el experimento
manteniendo las tres repeticiones para cada uno de los niveles. Es decir, que aunque no se
cuentan con repeticiones para las combinaciones de niveles de cada factor, s las hay (tres)
para cada uno de los niveles de los factores individuales. En consecuencia, con la mitad de
las unidades experimentales necesarias para acomodar los experimentos separados, se
puede montar un nico experimento que provee la misma precisin para la evaluacin de
cada factor individual (efectos principales de A y B). Si an se pudieran utilizar las 18

16

unidades experimentales de los dos experimentos originales, se podra hacer una repeticin
completa de todo el experimento factorial y se tendra el doble de unidades experimentales
para cada nivel de cada uno de los factores. En este sentido, los experimentos factoriales
son ms eficientes para evaluar los efectos de los factores individuales. Adems los
experimentos factoriales, cuando estn repetidos, permiten evaluar si las variaciones en la
respuesta debidas a los efectos de un factor son independientes de los niveles del otro
factor, fenmeno que se conoce como interaccin. Dado que la interaccin es comn en los
sistemas involucrando varios factores, los experimentos que son capaces de detectarla son
siempre preferibles.
Modelos aditivos
Los modelos factoriales aditivos son aquellos en los que los trminos que modelan la
interaccin estn ausentes. Para ejemplificar este caso se presenta un experimento factorial
en el que es de inters estudiar los factores riego con tres niveles (100, 150 y 200mm.) y el
factor insecticida con dos niveles (con y sin insecticida) en la produccin de tomate. Los
3x2=6 tratamientos resultantes se asignan a las UE (parcelas) segn un diseo
completamente aleatorizado. Se conoce por experiencias previas (o se supone) que no hay
interaccin entre los efectos de riego e insecticida. Los factores se han designado como R
(riego) e I (insecticida) y sus niveles como R1,R2,R3 e I1,I2. Los 6 tratamientos de inters
surgen del cruzamiento de ambos factores, es decir cada nivel de un factor se asocia con
cada uno de los niveles del otro factor para definir un tratamiento. As el arreglo factorial se
representa como R1I1, R2 I1, R3I1, R1I2, R2 I2, R3I2. Cada uno de los tratamientos se evalu
una sola vez, es decir los tratamientos no estn repetidos. No obstante esto, si existen
repeticiones para cada nivel de un factor dentro de cada uno de los niveles del otro factor.
La variable observada es el rendimiento. Los datos estn en el archivo Tomate.idb. Se
presenta a continuacin los resultados obtenidos mediante el ANAVA.
Anlisis de la varianza
Variable
N
R
RAj
Rendimiento 6
0.98 0.96

CV
3.53

Cuadro de Anlisis de la Varianza (SC Tipo III)


F.V.
SC
gl
CM
F
Valor p
Modelo
143.99
3
48.00 40.10 0.0244
Riego
102.30
2
51.15 42.73 0.0229
Insecticida 41.70
1
41.70 34.84 0.0275
Error
2.39
2
1.20
Total
146.39
5

Se concluye que hay efecto de riego (p=0.0229) y que hay efecto de insecticida (p=0.0275).
En el caso del factor insecticida, al tener 2 niveles no hace falta ms informacin que las
medias para concluir sobre la conveniencia del uso o no de insecticida.. Para el factor riego,
por tener tres niveles se necesita indagar ms sobre la comparacin de medias. Por ser un
factor cuantitativo de niveles equidistantes, se realizaron contrastes polinmicos
ortogonales para evaluar si existan tendencias lineales y/o cuadrticas de los rendimientos
promedio en relacin a los niveles de riego. Tambin se podran haber realizado
comparaciones mltiples, en tal caso hubiera habido tres contrastes involucrados (R1vs R2,
R1vsR3 y R2vsR3). Con la estrategia seleccionada (contrastes polinmicos) las mismas
17

comparaciones se realizan a travs de dos contrastes; un menor nmero de contrastes para


obtener las mismas conclusiones siempre es preferible debido a las consecuencias de la
inferencia simultanea sobre las tasas de error.
Los pruebas de hiptesis asociadas a los contrastes polinmicos planteados para el factor
riego se presentan a continuacin:
Contrastes
Riego
Contraste1
Contraste2
Total

SC
102.26
0.04
102.30

gl
1
1
2

CM
102.26
0.04
51.15

F
Valor p
85.43 0.0115
0.03 0.8716
42.73 0.0229

Coeficientes de los contrastes


Riego
Cont. 1
Cont. 2
100.00
-1.00
1.00
150.00
0.00
-2.00
200.00
1.00
1.00

Se concluye que existe una tendencia lineal para el factor riego (p=0.0115) y que la
tendencia cuadrtica no es significativa (p=0.8716). Dado que el rendimiento promedio
para el tercer nivel del factor fue mayor que para el primero, se concluye que existe una
relacin lineal positiva y por tanto dentro de los niveles ensayados (intervalo 100,200), a
mayor cantidad de riego se espera mayor rendimiento. En el siguiente grfico se visualiza
esta tendencia, como as tambin la ausencia de interaccin entre los efectos de riego y
insecticida.
32

Rendimiento

30

28

26

24
100

125

150

175

200

Riego
Con insecticida

Sin insecticida

Modelo
El modelo para un experimento con estructura factorial de tratamientos (dos factores o
bifactorial), sin estructura de parcelas, diseo completamente aleatorizado y suponiendo
falta de interaccin (modelo aditivo) es el siguiente:
Yij=+i+j+ij

con i=1,...,a; j=1,...,b


18

Donde Yij representa la respuesta al i-simo nivel del factor A y j-simo nivel de factor B,
representa una media general, i el efecto que produce el i-simo nivel del factor A (con
a niveles), j corresponde al efecto del j-simo nivel del factor B (con b niveles) y ij es el
trmino de error aleatorio asociado a la observacin ij-sima que como siempre se supone
es una variable aleatoria normal, con esperanza cero y varianza 2.
Si el supuesto de aditividad (no interaccin) no se cumple entonces el experimento est
deficientemente diseado ya que haran falta repeticiones de los tratamientos (combinacin
de los niveles de ambos factores) para inferir sobre efectos principales e interacciones.
Existen algunas pruebas estadsticas para verificar este supuesto como la prueba de
aditividad de Tukey (1949), Mandel (1967) y pruebas grficas.
Cuadro de Anlisis de la Varianza para el modelo bifactorial aditivo con DCA.
Fuente de
Suma de Cuadrados
Grados de
Cuadrado
F
Variacin
Libertad
Medio
2
2
Factor A
a
gla=a-1
CMA
SCA
Y Y
CMA
SCA i. ..
CMD
gla
b
ab
i 1
2
Factor B
glb=b-1
b
CMB
SCB
Y. j Y.. 2

CMB
SCB

CMD
glb
a
ab
j 1
SCD
Error
SCD=SCT-SCA-SCB
gld=(a-1)(b-1) CMD
gld
Experimental
.
2
a
b
Total
glt=a b-1
Y..
SCT Yij2
i 1 j 1

ab

Modelos para arreglos factoriales incluyendo interaccin


Si el experimentador supone o sospecha que la respuesta a dos o ms factores adems de
involucrar la suma de los efectos individuales de esos factores depende de la combinacin
especfica de los niveles de esos factores, entonces el modelo para el experimento factorial
deber incluir trminos de interaccin que den cuenta de este hecho. La inclusin de
trminos de interaccin en el modelo conlleva la necesidad de tener repeticiones para cada
tratamiento porque de otra forma no es posible estimar los parmetros adicionales. Cuando
el experimento tiene dos factores, existen solo interacciones de primer orden, cuando tiene
tres factores, existen interacciones de primer y de segundo orden y as sucesivamente para
arreglos factoriales de mayor orden.
El modelo lineal para un experimento bifactorial con interacciones es una ampliacin del
modelo para el experimento bifactorial de efectos aditivos, que incluye un conjunto
adicional de parmetros, conocidos como de interaccin y bajo un DCA puede expresarse
como:
Yijk=+i+j+ij+ijk con i=1,...,a; j=1,...,b; k=1,..,nij
En este modelo Yijk representa la respuesta en la k-sima repeticin del i-simo nivel del
factor A y j-simo nivel de factor B, representa la media general, i el efecto que produce
el i-simo nivel del factor A, j corresponde al efecto del j-simo nivel del factor B

19

y los trminos ij representan los efectos adicionales (interacciones) de las combinaciones


de los niveles de los factores. Los trminos de error ijk asociados a cada observacin se
suponen (usualmente) normal e independientemente distribuidos con esperanza cero y
varianza comn 2. Debe notarse que el subndice k se mueve entre 1 y nij, que representa
el nmero de repeticiones para el tratamiento ij. Los nmeros de repeticiones dentro de
cada tratamiento pueden ser distintos.
Cuadro de Anlisis de la Varianza para el modelo bifactorial con interaccin para un
DCA.
Fuente de
Suma de Cuadrados
Grados de
Cuadrado
F
Variacin
Libertad
Medio
Factor A

SCA

Yi..
ni.

i 1

Factor B

SCB

Total

Y
...

. j.

n..

Y Y
2

i 1 j 1

ij .

...

nij

n..

nij

i 1 j 1 k 1

Y...
n..

CMA

SCA
gla

CMA
CMD

glb=b-1

CMB

SCB
glb

CMB
CMD

SCD=SCT-SCA-SCB-SCAB
SCT Yijk2

gla=a-1

...

n. j

SCAB

n..

Y Y

j 1

Interaccin
AB
Error

glab(a-1)(b-1)
gld=glt-glaglb-glab

CMAB

CMD

SCAB
glab

CMAB
CMD

SCD
gld

glt= N-1

Ejemplo
En las grandes ciudades, los lodos que surgen del tratado de los efluentes son generalmente
vertido en suelos de regiones perifricas a la ciudades. En un estudio medioambiental sobre
contaminacin con zinc (Zn) debida a esta prctica, se realiz un ensayo para comparar los
efectos de efluentes procedentes de tres ciudades sobre los niveles de Zn en hortalizas
producidas en regiones perifricas. Se tomaron 36 macetones con plantas de tomate y en un
diseo completamente aleatorizado se asignaron los tratamientos que surgieron de un
arreglo factorial del factor cualitativo procedencia del lodo adicio nado a la maceta, al que
denominaremos ciudad con tres niveles (A, B y C) y el factor cuantitativo cantidad de
lodo adicionado, denominado lodo, con tres niveles (0.5, 1 y 1.5 Kg por unidad). Luego
se cosecharon los tomates producidos y se les midi el contenido en partes por milln
(ppm) de Zn, obteniendo los promedios por maceta como variable respuesta. Los datos se
encuentran en el archivo Ciudad.idb. El ANAVA arroj los siguientes resultados.

20

Anlisis de la varianza
Variable
N
R
RAj
CV
Zn
36
0.95 0.93 12.96
Cuadro de Anlisis de la Varianza (SC Tipo III)
F.V.
SC
gl
CM
F
Modelo
9475.52
8
1184.44
61.75
lodo
1945.45
2
972.72
50.71
ciudad
5720.67
2
2860.34
149.13
lodo*ciudad 1809.40
4
452.35
23.58
Error
517.86
27
19.18
Total
9993.38
35

Valor p
<0.0001
<0.0001
<0.0001
<0.0001

La interaccin entre lodo y ciudad result significativa (p<0.0001) razn por la cual no
tiene sentido estudiar a los efectos principales de los factores a travs de las medias de
todos los datos. Es necesario estudiar o abrir la interaccin, esto es estudiar los efectos de
un factor dentro de cada uno de los niveles del otro. En este ejemplo hay dos factores de
distinta naturaleza, uno cuantitativo y el otro cualitativo. Dado que uno de los intereses de
la investigacin es determinar si la cantidad de lodo agregado se relaciona con la cantidad
de Zn encontrado en las plantas, se decide hacer contrastes para verificar tendencias lineal y
cuadrtica para contenido de Zn dentro de cada uno de los niveles del factor ciudad.
Construccin de los contrastes
Tenemos 4 grados de libertad para la interaccin, que se usarn para realizar dos contrastes
de tendencia lineal y dos de cuadrtica. El inters se centrar en el estudio de estas
tendencias en las distintas ciudades. Los contrastes deben reflejar entonces no slo las
tendencias lineales y cuadrticas de la respuesta en relacin a los niveles de lodo sino
tambin las diferencias de dichas tendencias entre ciudades.
Para construir los contrastes se pueden seguir los siguientes pasos:
1) Listar los tratamientos que surgen de la combinacin de los factores de manera
conveniente (ordenado por un factor cuantitativo):
A,0.5 B,0.5 C,0.5 A,1 B,1
C,1
A,1.5 B,1.5 C,1.5
2) Plantear un conjunto de contrastes ortogonales para indagar sobre la o las tendencias de
las respuestas promedio en relacin a los niveles del factor cuantitativo:
-1
-1
-1
0
0
0
1
1
1 (lodo lineal)
-1
-1
-1
2
2
2
-1
-1
-1 (lodo cuadrtico)
3) Plantear un conjunto de contrastes ortogonales para comparar medias de los niveles del
factor cualitativo (ciudad). Como el factor ciudades tiene tres niveles habr 2 grados de
libertad para ser particionados en contrastes ortogonales. Un conjunto de contrastes que
responde a estos requerimiento podra ser el siguiente:
-2
1
1
-2
1
1
-2
1
1
(A vs.(B+C)/2)
0
-1
1
0
-1
1
0
-1
1
(B vs.C)
4) Obtener los contrastes de inters (interaccin) multiplicando los contrastes definidos en
el paso 2 por aquellos definidos en el paso 3:
2
0

-1
1

-1
-1

0
0

0
0

0
0

-2
0

1
-1

1
1

lineal (A vs.(B+C)/2)
lineal (B vs.C)
21

2
-1
-1
-4
2
2
2
-1
-1 cuadr. (A vs.(B+C)/2)
0
1
-1
0
-2
2
0
1
-1 cuadr. (B vs.C)
Calculando las sumas de cuadrados asociadas a los dos primeros contraste se obtienen los
siguientes resultados:
Contrastes
lodo*ciudad
SC
Contraste1
121.92
Contraste2 1638.23
Total
1760.15

gl
1
1
2

CM
121.92
1638.23
880.07

F
Valor p
6.36 0.0179
85.41 <0.0001
45.88 <0.0001

Coeficientes de los contrastes


lodo*ciudad Cont. 1
Cont. 2
0.50:A
-2.00
0.00
0.50:B
1.00
-1.00
0.50:C
1.00
1.00
1.00:A
0.00
0.00
1.00:B
0.00
0.00
1.00:C
0.00
0.00
1.50:A
2.00
0.00
1.50:B
-1.00
1.00
1.50:C
-1.00
-1.00

Se concluye que hay variabilidad entre ciudades para los coeficientes de regresin lineal de
la respuesta en funcin de los niveles de lodo (p<0.0001).
Calculando las sumas de cuadrados asociadas a los dos ltimos contraste se obtienen los
siguientes resultados:
CM
F
1.05 0.05
48.20 2.51
24.63 1.28

Valor p
0.8167
0.1246
0.2933

Coeficientes de los contrastes


lodo*ciudad Cont. 1
Cont. 2
0.50:A
2.00
0.00
0.50:B
-1.00
1.00
0.50:C
-1.00
-1.00
1.00:A
-4.00
0.00
1.00:B
2.00
-2.00
1.00:C
2.00
2.00
1.50:A
2.00
0.00
1.50:B
-1.00
1.00
1.50:C
-1.00
-1.00

Aqu se concluye que no hay diferencias en las tendencias


cuadrticas de las respuestas promedio en funcin de los
niveles de lodo para las distintas ciudades (p=0.2933).
En el grfico que se presenta a la derecha se pueden
visualizar estos hallazgos:

78.00

63.00

Zn (ppm)

Contrastes
lodo*ciudad SC
gl
Contraste1
1.05 1
Contraste2 48.20 1
Total
49.25 2

48.00

33.00

18.00
0.50

1.00

1.50

lodo
Zn-A

Zn-B

22

Zn-C

Aunque en los ejemplos anteriores se han presentado experimentos con estructura factorial
de tratamientos, slo en diseos completos al azar, la combinacin de estructuras factoriales
y estructuras de parcela da lugar a una amplia variedad de arreglos experimentales. Por
diversas razones, quizs no puedan asegurarse las mismas condiciones experimentales de
repeticin a repeticin y por lo tanto se tiene una fuente potencial de variacin sistemtica
reconocida a priori sobre las UE que si bien no es de inters por si misma debe
incorporarse al modelo de anlisis para disminuir el error experimental. De este modo, cada
repeticin podra considerarse un bloque y el experimento completo sera un experimento
con estructura bifactorial de tratamiento y estructura de parcelas en bloques completos al
azar. Existen numerosas combinaciones de estructuras de parcela y estructuras de
tratamiento, dependiendo de la jerarqua en la estructura de parcelas y las restricciones a la
aleatorizacin. Los diseos emergentes se conocen como multifactoriales con restricciones
a la aleatorizacin.

Estimacin de los parmetros de un modelo bifactorial con


interaccin para un DCA
Los parmetros del modelo se pueden estimar por el mtodo de mnimos cuadrados. El
nmero de parmetros a estimar es 1+ a + b + ab, siendo a los niveles del factor A y b los
niveles correspondientes al factor B. Cuando se plantean las ecuaciones normales para
obtener las estimaciones, se encuentran a + b + 1 dependencias lineales por lo cual no
existe una solucin nica para el sistema de ecuaciones. Para poder obtener una solucin, se
deben imponer algunas restricciones. Restricciones comnmente usadas son:
a

i 1
b


j 1

( )

ij

0 j 1,..., b

( )

ij

0 i 1,..., a

i 1
b

j 1

Al imponer estas restricciones, se obtienen las siguientes soluciones:


y...

yi.. y...

i 1,..., a

j y. j . y...

j 1,..., b

i 1,..., a
( )i j yij . yi.. y. j . y...
j 1,..., b

23

podemos usar estas estimaciones de los parmetros, para estimar el valor esperado de
cualquier observacin y obtener as el valor ajustado de yijk.
Luego,

yijk j ( )i j
yijk y... ( yi.. y... )+(y. j . y... )+(yij . yi.. y. j . y... )
yijk yij .
El disponer de los valores ajustados permite calcular los residuos para el modelo. Estos
residuos se usarn para evaluar el cumplimiento de los supuestos que sustentan el anlisis
de la varianza clsico (MMI).

Verificacin de supuestos
Los supuestos del anlisis de la varianza se refieren a las propiedades estadsticas de los
errores que se suponen normales con esperanza cero, varianza comn e independientes.
Existen distintas tcnicas de validacin de supuestos, pero las mas usuales se basan en los
predictores de los errores, es decir los residuos.
Una vez calculados los residuos se puede verificar el cumplimiento de los supuestos de
normalidad, independencia y homogeneidad de varianzas de los ijk, mediante pruebas de
hiptesis e interpretaciones grficas como se ha explicado anteriormente. Estas pruebas
usualmente se construyen reparametrizando el modelo factorial como un modelo de celdas,
donde cada celta corresponde a un tratamiento que surge de la combinacin de los niveles
de los factores.

Diseos en bloques
Introduccin
Cuando la UE que se disponen para realizar un experimento no son homogneas, se debe
reconocer el o los factores que pueden afectar a la respuesta de las distintas UE ms all de
los tratamientos. Estas fuentes de variacin deben ser contempladas en el diseo para
disminuir el error experimental. Esto implica reconocer la estructura que tienen las UE.
Esta estructura puede deberse a una variacin local, espacial o temporal del material
experimental. Cuando las UE no son homogneas, pueden no reaccionar o responder a los
tratamientos de la misma manera o con la misma capacidad debido a sus diferencias
intrnsecas, hecho que puede ocurrir an cuando las UE tengan el mismo aspecto.
La forma tradicional de controlar la variacin del material experimental en experiencias
planificadas es formando grupos de UE homogneas. Estos grupos o estratos, comnmente
llamados bloques, son de una naturaleza tal que las unidades experimentales dentro de un
bloque, varan menos entre s que entre los bloques. Reconocidos los grupos de UE
homogneas, los tratamientos, de ser posible, debieran compararse dentro de cada grupo.
As se elimina del error experimental la variabilidad debida a los bloques, aumentando en
consecuencia la precisin de las comparaciones de las medias de tratamientos.
24

Los criterios de bloqueo pueden deberse no slo a las caractersticas relacionadas con las
unidades experimentales sino tambin, en algunas circunstancias, a aquellas ligadas con la
toma de informacin o la realizacin de los tratamientos. A las caractersticas relacionadas
con las UE se las denomina naturales mientras que al resto se las llama inducidas. Por
ejemplo, si tenemos un conjunto de UE homogneas pero algunos subgrupos de este
conjunto son manejados por distintos operarios, estos pueden introducir una fuente de
variacin en la respuesta (inducida). En este caso sera apropiado que cada operario trabaje
con todos los tratamientos a comparar.
Los bloques, a su vez, pueden ser fijos o aleatorios. En los dos casos, las hiptesis acerca de
los tratamientos son las mismas, pero el espacio de inferencia es distinto.
Distingamos la situacin en que hay uno o ms factores que particionan el conjunto de las
unidades experimentales en subconjuntos, tal que la unidades experimentales de un mismo
subconjunto o bloque sean homogneas (ms all de los tratamientos) en relacin a la
respuesta observada.
Ejemplos
En esta figura se observa que hay un efecto 'sombra' sobre el terreno, que determina que los
bloques queden as delimitados.

Bloque 1

Bloque 1

Bloque 2

Bloque 3

25

Las unidades experimentales que conforman un bloque no necesariamente deben ser


adyacentes, como se muestra a continuacin:

B1

B2
20
B3
B1

23

21

20

Estas curvas son llamadas de isofertilidad y se construyen uniendo puntos de igual


rendimiento.
Si los tratamientos son asignados respetando este tipo de estructura de parcelas de manera
tal que cada tratamiento aparezca una vez en cada bloque, todos los tratamientos estn en
todos los bloques y la aleatorizacin se los tratamientos a las UE se realice dentro de cada
bloque, el diseo experimental se denomina diseo en bloques completos al azar (la
aleatorizacin de los tratamientos se realiza en un bloque, y luego se repite el proceso en
forma independiente en cada uno de los otros bloques).
A modo de ejemplo, un arreglo posible en tres bloques para comparar 4 tratamientos
denotados por A, B, C y D es el siguiente:

Bloque 1

Bloque 2

Bloque 3

Modelo
El modelo para analizar un diseo en bloques completamente aleatorizados (DBCA) sin
estructura factorial de tratamientos es:

yij = + i + j + ij

26

donde:

yij es la respuesta del i-simo tratamiento en el j-simo bloque


es la media general
i es el efecto del i-simo tratamiento i = 1, ...,a
j es el efecto del j-simo bloque j = 1, ...,b
ij es el trmino de error aleatorio.

Si se puede suponer que existe aditividad bloque-tratamiento y que los ij son


independientes e idnticamente distribuidos N (0, 2) puede obtenerse una prueba exacta
para la hiptesis de igualdad de medias de tratamientos.
Las hiptesis que se somete a prueba en este tipo de diseos es, como en el diseo
completamente aleatorizado a una va de clasificacin, establecida sobre la medias de las
poblaciones relacionadas a cada tratamiento (i = + i con i = 1, ... ,a):
H0 : 1= 2= , ... , =a
H1 : Al menos un par de medias difiere
Observemos que a pesar de haber cambiado, respecto al diseo completamente
aleatorizado, el diseo a nivel de la estructura de UE, las hiptesis que se contrastan en
relacin al efecto de tratamientos sigue siendo la misma.
Algebraicamente, en el contexto del ANAVA, existe una forma conveniente de expresar la
magnitud de la variabilidad debida a los bloques en el contexto de las otras fuentes de
variacin intervinientes:
SCTotal = SCtratamiento + SCbloque + SCerror
Es decir que la suma de los desvos cuadrados de cada observacin con respecto a la media
general puede ser particionada en tres sumas de cuadrados, una indicadora de las
diferencias entre tratamientos: Suma de Cuadrados de Tratamientos (SCtratamiento), otra
de la diferencia entre bloques: Suma de Cuadrados de Bloques (SCbloque) y otra que
expresa la variacin aleatoria de unidades experimentales que recibieron el mismo
tratamiento despus de descontar las variaciones debidas a las diferencias entre bloques, es
decir el error experimental: Suma de Cuadrados del Error (SCerror).
Si las diferencias entre unidades experimentales debidas al factor de bloqueo no es
considerada, la Suma de Cuadrados de Bloques se adiciona a la Suma de Cuadrados del
Error. Esto implica que el error experimental aumenta, que no es un indicador de la
varianza innata de la respuesta, y como consecuencia se pierde eficiencia en la prueba de la
hiptesis de inters.
Si los tratamientos son considerados fijos, el valor esperado para el cuadrado medio de
tratamientos es:
2
E [CMTrat.] = 2 + b i / (a-1)
El valor esperado para el cuadrado medio del error (CMR) es 2 y por tanto podemos
construir un estadstico F a partir del cociente entre estos dos cuadrados medios que se
utiliza para contrastar las hiptesis de inters.

27

Cuadro de Anlisis de Varianza para el modelo correspondiente a un DBCA con un


factor tratamiento
Fuente de
Suma de Cuadrados
Grados de
Cuadrado
F
Variacin
Libertad
Medio
2
2
Tratamiento
a
gltr=a-1
CMTrat
SCTrat
Y Y
CMTrat
SCTrat i. ..
CMD
gltr
b
ab
i 1
Bloque

Error

SCBloque
j 1

Y Y
.j

..

ab

SCD=SCT-SCTrat-SCBloque

Total

SCT Y
i 1 j 1

2
ij

Y
..

glbl=b-1

gld=(a-1)(b-1)

CMBloq

CMD

SCBloq
glbl

CMBloq
CMD

SCD
gld

glt=a.b-1

ab

Es importante resaltar que el supuesto de no-interaccin entre bloques y tratamientos


(conocido tambin como supuesto de aditividad es necesario para que el valor observado
para el estadstico F en el experimento particular pueda ser evaluado usando la distribucin
F de Snedecor. Existen pruebas desarrolladas por Tukey y Mandel, conocidas como
pruebas de no-aditividad, que permiten controlar formalmente el supuesto de aditividad.
La comparacin entre las medias de bloques, en general no es de inters: 1) porque por
construccin se espera que sean diferentes; 2) porque en general no se asocian con
cuestiones de inters, slo responden a una estrategia para evaluar los tratamientos en
forma ms precisa.
Debe recordarse tambin que la aleatorizacin fue realizada solo dentro de los bloques, se
dice por ello que el bloqueo representa una restriccin a la aleatorizacin.
Algunos autores, como Anderson y McLean (1974) y Box, Hunter y Hunter (1978),
argumentan que esa restriccin de aleatorizacin impide que el estadstico pueda ser til
para inferir sobre diferencias entre medias de bloques. Lo que si suele usarse en los diseos
en bloques es el cociente entre CMBloque y CMError como un indicador de la magnitud de
las diferencias entre bloques, que puede ser usado para realizar sugerencias sobre la
necesidad de bloqueo en experiencias futuras similares a la realizada.
Estimacin de los parmetros de un modelo en bloques completos aleatorizados
Los parmetros del modelo se pueden estimar por el mtodo de mnimos cuadrados. Para
poder obtener una solucin, se deben imponer algunas restricciones. Restricciones
comnmente usadas son:
a

i 1
b


j 1

Al imponer estas restricciones, se obtienen las siguientes soluciones:

28

y..
yi. y..

i 1,..., a

j y. j y..

j 1,..., b

podemos usar estas estimaciones de los parmetros, para estimar el valor esperado de
cualquier observacin y obtener as el valor ajustado de yij.
Luego,

yij j
yij y.. ( yi. y.. )+(y. j y.. )
yij yi. y. j y..
El disponer de los valores ajustados (predichos) permite calcular los residuos para el
modelo. Estos residuos se usarn para evaluar el cumplimiento de los supuestos que
sustentan el anlisis de la varianza clsico (MMI).

Verificacin de supuestos
El anlisis de los supuestos del MMI se realiza utilizando las tcnicas descriptas
anteriormente. En el caso del DBCA se agrega el supuesto de aditividad bloquetratamiento.
Aditividad bloque-tratamiento:
Como ya se mencion con anterioridad la estructura de parcelas no debe interactuar con la
estructura de tratamientos, es decir el efecto en este caso de los bloques debe ser aditivo. De
no ser as, seria imposible hacer recomendaciones acerca de los tratamientos en forma
independiente a los bloques. Existen pruebas formales para determinar la presencia de
interaccin bloque-tratamiento, entre ellas las propuestas por Mandel y por Tukey. Estas
pruebas no siempre estn disponibles en los Software Estadsticos, por lo que se puede
recurrir a mtodos grficos de deteccin como se ve a continuacin:
Sin interaccin bloque-tratamiento

25.50

35.50

21.50

29.00

respuesta

respuesta

Con interaccin bloque-tratamiento

17.50

22.50

16.00

13.50

9.50

9.50
1

bloque 1

bloque 2

tratamiento

tratamiento
bloque 3

bloque 1

bloque 2

bloque 3

29

Existe un diseo en bloques llamado DBCA generalizado en el cual los tratamientos se


encuentran repetidos dentro de cada bloque. La existencia de repeticiones permite el
agregado del trmino de interaccin bloque-tratamiento en el modelo de manera tal de
poder realizar la prueba de hiptesis de no interaccin en forma directa.

Ejemplo de DBCA con estructura factorial de tratamientos ms un


testigo
En una fabrica que embala productos perecederos es de particular importancia la resistencia
de los embalajes. El material de embalaje es plstico termocontraible y los productos
envasados deben pasar por un horno a cierta temperatura para lograr que el envoltorio
plstico se contraiga. La empresa ha estado embalando los productos con un mtodo
tradicional que no le ha dado los resultados esperados.
Decide entonces evaluar nuevos materiales de embalaje. En el mercado le ofrecen 2 nuevos
materiales (N1 y N2) que, a diferencia del tradicional, requieren circulacin de aire al entrar
al horno. La velocidad de circulacin del aire depende del tamao de los productos a
embalar, por lo que se decide probar 3 velocidades distintas para el ventilador (1000, 2000
y 3000 rpm). De la combinacin de los factores: material, con 2 niveles, y velocidad del
ventilador, con 3 niveles, surge una estructura factorial con 6 tratamientos. Para poder
comparar objetivamente a los 6 tratamientos con el tratamiento tradicional, se coloca un
testigo usando el plstico tradicional sin ventilador, razn por la cual resultan un total de 7
tratamientos.
Se decide hacer 3 repeticiones para la experiencia, pero como no se puede realizar todo el
ensayo en un solo turno de trabajo, se hace una corrida del experimento en cada uno de los
tres turnos, maana, tarde y noche (M, T y N respectivamente). Si bien no interesa evaluar
el factor turno, este se modela para descontar las posibles diferencias en la respuesta para
cada uno de ellos, es decir se lo usa como factor de bloqueo.
La variable que se mide para evaluar los tratamientos es la resistencia del embalaje. Los
datos estn en el archivo embalaje.idb.
A continuacin se presenta un ANAVA para un DBCA con estructura factorial de
tratamientos, bajo el siguiente modelo:
Yijk=+Materiali+Velocidad+Material*Velocidadij+Turnok+ijk
Variable
N
Resistencia 21

R
0.82

RAj
0.70

CV
21.42

Modelo desbalanceado en celdas.


Se presentan las sumas de cuadrado secuenciales (Tipo I).
Para otra descomposicin de la SC del modelo
especifique los contrastes apropiados.
Cuadro de Anlisis de la Varianza (SC Tipo I)

30

F.V.
Modelo
Turno
velocidad
Material
Velocidad*Material
Error
Total

SC
650.91
127.32
89.20
206.89
227.49
145.63
796.53

gl
8
2
3
1
2
12
20

CM
81.36
63.66
29.73
206.89
113.75
12.14

F
Valor p
6.70 0.0019
5.25 0.0231
2.45 0.1138
17.05 0.0014
9.37 0.0035

En el cuadro de ANAVA anterior se puede observar la leyenda modelo desbalanceado en


celdas. Esto es debido a que adems de la estructura factorial de tratamientos esta el
agregado del testigo y el modelo resultante tiene celdas faltantes. Puede observarse en la
definicin de los tratamientos que las velocidades estn en todos los materiales, pero no
todos los materiales estn en todas las velocidades.
Cuando existe este tipo de problemas, hay que definir los tratamientos y posteriormente
realizar las comparaciones de inters mediante contrastes.
Puede verse adems, que la interaccin entre velocidad y material es significativa
(p=0.0035), razn por la cual deberan realizarse contrastes para analizar la interaccin.
Los 7 tratamientos del ejemplo pueden definirse como:
Testigo, N1V1, N1V1, N1V3, N2V1, N2V2 y N3V3.
El modelo reparametrizado es:
Yij=+Tratamientoi+Turnoj+ij
A partir de este modelo se obtiene el siguiente cuadro de ANAVA:
Anlisis de la varianza
Variable
N
resistencia1 21

R
0.82

RAj
0.70

CV
21.42

Cuadro de Anlisis de la Varianza (SC Tipo III)


F.V.
SC
gl
CM
F
Valor p
Modelo
650.91 8
81.36 6.70
0.0019
tratamiento 523.58 6
87.26 7.19
0.0020
Turno
127.32 2
63.66 5.25
0.0231
Error
145.63 12
12.14
Total
796.53 20

Se concluye que hay efecto de tratamientos (p=0.0020). Si bien la hiptesis sobre efecto
turno no es de inters y por las restricciones a la aleatorizacin que implica el hecho de que
los tratamientos se asignaron al azar dentro de cada turno la prueba F para turno no es
valida, no obstante, a partir del valor p=0.0231 se puede inferir que la inclusin de este
factor de bloqueo fue pertinente.

31

A continuacin se presentan los contraste ortogonales de inters. El primero contrasta el


testigo versus el promedio del resto de los tratamientos, y como no result significativo
(p=0.2886) no hay evidencias para rechazar esta hiptesis.
El segundo contraste compara el promedio del material N1 con el promedio del material N2
y resulto significativo (p=0.0014).
Los contrastes 3 y 4 prueban la hiptesis sobre tendencia lineal y cuadrtica de resistencia
en funcin de velocidad del aire respectivamente. Existe tendencia lineal (p=0.0357) pero
no cuadrtica (p=0.4834).
Los contrastes 5 y 6 son los contraste que descomponen la suma de cuadrados de la
interaccin velocidad*material (con solo los materiales nuevos). El contraste 5 es para
probar la igualdad de tendencia lineal entre los materiales y se concluye que las tendencias
lineales son diferentes en los materiales nuevos (p=0.0186). El contraste 6 hace lo propio
para la tendencia cuadrtica entre los materiales y se concluye que las tendencias
cuadrticas son diferentes en los materiales nuevos (p=0.0186).
Contrastes
tratamiento
Contraste1
Contraste2
Contraste3
Contraste4
Contraste5
Contraste6
Total

SC
14.96
206.89
67.89
6.35
89.83
137.66
523.58

gl
1
1
1
1
1
1
6

CM
14.96
206.89
67.89
6.35
89.83
137.66
87.26

F
Valor p
1.23
0.2886
17.05
0.0014
5.59
0.0357
0.52
0.4834
7.40
0.0186
11.34
0.0056
7.19
0.0020

Coeficientes de los contrastes


tratamiento
testigo
V1N1
V1N2
V2N1
V2N2
V3N1
V3N2

Cont. 1 Cont. 2 Cont. 3 Cont. 4 Cont. 5 Cont. 6


-6.00
0.00
0.00
0.00
0.00
0.00
1.00
1.00 -1.00
1.00 -1.00
1.00
1.00 -1.00 -1.00
1.00
1.00 -1.00
1.00
1.00
0.00 -2.00
0.00 -2.00
1.00 -1.00
0.00 -2.00
0.00
2.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00 -1.00
1.00
1.00 -1.00 -1.00

El siguiente grfico sirve para visualizar los hallazgos:


25

Resistencia

20

15

10

5
0

1000

2000

3000

Velocidad
E

N1

N2

32

Se recomienda el uso del material N1 con la velocidad 2000.


Ms all de los resultados y conclusiones para este ejemplo, es importante visualizar que a
partir de la particin en contrastes ortogonales realizada en el ltimo anlisis, se puede
reconstruir la tabla de anlisis de varianza presentada en primer trmino (modelo de efectos
e interacciones) como se muestra a continuacin:
Cuadro de Anlisis de la Varianza
F.V.
Modelo
Turno
tratamiento

SC
650.91
127.32
523.58

gl
8
2
6

c1(testigo Vs.Resto) 14.96


Material (c2)
206.89
velocidad
74.24
Lineal (c3)
Cuad. (c4)
Velocidad*Material 227.49
Lin*mat (c5)
Cuad*mat (c6)
Error
Total

CM
81.36
63.66
87.26
1
1
2
67.89
6.35

1
1

2
89.83
1
137.66 1

145.63 12
796.53 20

14.96
206.89
37.12
67.89
6.35
113.75
89.83
137.66

F
Valor p
6.70
0.0019
5.25
0.0231
7.19
0.0020
1.23
17.05
3.06
5.59
0.52
9.37
7.40
11.34

0.2886
0.0014
0.0844
0.0357
0.4834
0.0035
0.0186
0.0056

12.14

Verificacin de los supuestos


Al tener los tratamientos una estructura factorial, para el anlisis de los supuestos es
conveniente obtener los residuos y predichos desde el modelo reparametrizado con efectos
de tratamiento y bloque:
Yij=+Tratamientoi+Turnoj+ij

RDUO_resistencia

6.07

2.57

-0.93

-4.43

-7.93
5.18

10.90

16.62

22.34

PRED_resistencia

28.07

Cuantiles observados(RDUO_resistencia)

Con los residuos y predichos de este modelo se obtuvieron los siguientes resultados:
5.43

n= 21 r= 0.963 (RDUO_resistencia)

2.25

-0.93

-4.11

-7.29
-7.29

-4.11

-0.93

2.25

5.43

33

Cuantiles de una Normal(1.6521E-17,7.2813)

Shapiro-Wilks (modificado)
Variable
RDUO_resistencia

n
21

Media D.E.
0.00 2.70

W*
0.96

p (una cola)
0.7850

Anlisis de la varianza (Prueba de Levene)


Variable
RABS_resistencia

N
21

R
0.77

RAj
0.62

CV
63.88

Cuadro de Anlisis de la Varianza (SC Tipo III)


F.V.
SC
gl
CM
F
Valor p
Modelo
56.69 8
7.09 5.06
0.0063
Turno
3.74 2
1.87 1.33
0.2997
tratamiento 52.95 6
8.83 6.30
0.0035
Error
16.81 12
1.40
Total
73.51 20

No hay evidencias para rechazar el supuesto distribucional (Shapiro-Wilks, p=0.7850).


La prueba de Levene indica que las varianzas no son homogneas (p=0.0035). En este caso
quedan dos opciones: si los resultados dejan conforme al investigador, en el sentido que
puede confirmar las hiptesis que se plante a priori, puede informarse como esta; si por el
contrario el investigador esperaba encontrar resultados diferentes a los encontrados, se
debera probar con una transformacin o usar mnimos cuadrados ponderados.
Por ltimo, se muestra un grfico para evaluar aditividad bloque-tratamiento, en el que no
se evidencia un comportamiento para sospechar de la falta de aditividad.
31.76

resistencia

25.19

18.62

12.04

5.47
testigo

V1N1

V2N1

V3N1

V1N2

V2N2

V3N2

tratamiento
resistencia-M

resistencia-N

resistencia-T

34

Experimentos Multifactoriales con restricciones a la aleatorizacin


Cuando se tiene una estructura factorial de tratamientos y los tratamientos que la
conforman no pueden ser asignados al azar en las UE, surgen los experimentos con
restricciones a la aleatorizacin. Estas restricciones deben imponerse ya sea por cuestiones
operativas o por la naturaleza de los factores. En funcin del momento y la forma de
imponer las restricciones a la aleatorizacin, y de la forma en que se relacionan los factores
en estudio, surgen los diseos conocidos como en parcelas Divididas, donde los factores
estn totalmente cruzados, y los diseos Encajados (tambin conocidos como jerrquicos o
anidados) donde los niveles de un factor estn dentro de los niveles del otro factor.
Ejemplo
Se desea evaluar el efecto que tiene la fecha de siembra en distintas variedades de Soja
sobre el rendimiento del cultivo. El factor fecha de siembra tiene 3 niveles (F1, F2 y F3)
mientras que el efecto variedad tiene 5 niveles (V1, , V5).
Supongamos que el terreno disponible para el ensayo es totalmente homogneo en cuanto a
aquellos factores que afectan al rendimiento. En este caso, se podra hacer un diseo
completamente aleatorizado con estructura factorial de tratamientos y si se realizan tres
repeticiones por tratamiento, un arreglo posible sera el siguiente:

F1V4 F3V1 F2V4 F3V5 F1V2


F1V3 F2V2 F1V4 F1V1 F3V1
F3V4 F2V5 F3V2 F2V3 F3V2
F2V5 F1V1 F1V3 F3V4 F2V2
F1V5 F2V1 F3V5 F3V5 F1V5
F3V1 F3V4 F1V2 F3V3 F2V4
F1V2 F3V2 F3V3 F2V4 F2V5
F3V3 F2V3 F2V3 F1V3 F2V2
F2V1 F1V5 F2V1 F1V1 F1V4
El problema con este experimento completamente aleatorizado es que al sembrar en
distintas fechas se hace muy difcil de manejar. La maquina sembradora es poco
maniobrable y se debe entrar con ella en el ensayo en tres momentos diferentes. En la
figura anterior se han sealado las parcelas con fecha de siembra 1 (F1Vj, j=1,,5) y se
puede observar el intrincado camino a realizar para realizar la siembra.
Si el terreno no fuera homogneo y podemos distinguir por ejemplo tres bloques de
unidades experimentales homogneas, podra haberse utilizado un diseo en bloque
completamente aleatorizados con estructura factorial de tratamientos, y una disposicin
podra ser:

35

F2V1 F3V1 F2V4 F3V5 F1V4


F1V3 F2V2 F1V5 F1V2 F3V3 Bloque 1
F1V1 F2V5 F3V2 F2V3 F3V4
F2V5 F1V1 F1V3 F3V1 F2V2
F1V4 F2V1 F3V2 F3V5 F1V5 Bloque 2
F2V3 F3V4 F1V2 F3V3 F2V4
F1V2 F3V2 F3V4 F2V4 F3V5
F3V3 F2V3 F2V5 F1V3 F2V2 Bloque 3
F2V1 F1V5 F3V1 F1V1 F1V4
En cualquiera de estos diseos, el DCA y el DBCA, se tiene el problema de que dentro de
una determinada fecha de siembra, las UE a sembrar que estn desordenadas en el
espacio.
Una solucin para este problema es imponer restricciones a la aleatorizacin de manera tal
que todas las UE de una misma fecha de siembra queden agrupadas. Este tipo de
restricciones a la aleatorizacin conduce a los diseos en parcelas divididas o a los diseos
anidados dependiendo de cmo se realiza la restriccin.

Diseo en parcelas divididas en bloques completos aleatorizados


Supongamos para el ejemplo de las fechas de siembra y variedades que se cuenta con un
terreno como el mostrado en la segunda figura (DBCA).
El diseo bifactorial en parcelas divididas con estructura de parcelas en bloques completos
aleatorizados consiste en imponer las siguientes restricciones:
1) La primer restriccin es impuesta por el bloqueo de las UE, es decir, los
tratamientos estn en todos los bloques
2) La segunda restriccin consiste en dividir cada bloque en lo que se denomina
parcelas principales (PP). En nuestro ejemplo, como el problema eran las distintas
fechas de siembra, se divide el bloque en tres PP, y en cada una de ellas se
aleatoriza una fecha de siembra.

Cada PP tiene tantas UE de menor tamaos como niveles tiene el segundo factor, en este
caso la variedad, con 5 niveles. Estas UE son comnmente denominadas subparcela (SP).
Por ltimo, dentro de cada PP se aleatorizan las variedades en las SP, es decir no hay
restricciones a este nivel.
Para el ejemplo, un esquema experimental posible sera:

36

F2V1 F2V4 F2V5 F2V3 F2V2 PP1


F1V3 F1V2 F1V5 F1V1 F1V4 PP2 Bloque 1
F3V1 F3V5 F3V2 F3V3 F3V4 PP3
F1V5 F1V1 F1V3 F1V2 F1V4 PP1
F3V4 F3V1 F3V2 F3V5 F3V3 PP2 Bloque 2
F2V3 F2V4 F2V2 F2V5 F2V1 PP3
F1V2 F1V3 F1V4 F1V1 F1V5 PP1
F3V3 F3V1 F3V5 F3V4 F3V2 PP2 Bloque 3
F2V1 F2V5 F2V3 F2V2 F2V4 PP3
Se puede observar que cada uno de los bloques contiene las tres fechas de siembra en las
PP y en cada PP estn aleatorizadas las variedades. Las PP tienen un tamao mayor que las
subparcelas, motivo por el cual a estos tipos de diseo se los conoce tambin como diseos
con UE de distintos tamaos.
Al imponer restricciones a la aleatorizacin, el modelo de anlisis cambia y debido a que
las esperanzas de los cuadrados medios se ven afectadas por esta restriccin, para cada
factor en el modelo se debe construir la prueba F con el trmino de error adecuado.
El modelo para un diseo en parcelas divididas en bloque completos aleatorizados con
estructura bifactorial de tratamientos es, para el ejemplo, el siguiente:
Yijk=+Fechai+Bloquek+
Fechai*Variedadj + ijk

Fechai*Bloquek

Variedadj

Variedadj*Bloquek

Para evaluar el efecto Fecha se usa como trmino de error la interaccin Fecha*Bloque que
es conocida como error A.
Para evaluar los efectos Variedad, Variedad*Bloque y Fecha*Variedad, se usa el trmino
de error corriente (error experimental), en este contexto llamado error B.
El efecto de la interaccin Variedad*Bloque debe ser nulo, ya que la estructura de parcelas
no debe interactuar con la de tratamientos (supuesto de aditividad). Este trmino puede
entonces colocarse para contrastar esta hiptesis. Algunos autores sugieren que luego de
verificar el supuesto de aditividad, este trmino puede eliminarse del modelo, aumentando
de esa forma los grados de libertad para el contraste de las hiptesis sobre Variedades y
Variedad*Fecha.
En los diseos en Parcelas Divididas, el factor que se asigna en las PP, en este caso Fecha,
se contrasta con menor precisin que el asignado a las SP, en este caso variedad.
Este tipo de diseo se puede generalizar a ms de dos factores, agregando las restricciones
correspondientes. Si se utilizan 2 restricciones a la aleatorizacion, adems de la
correspondiente a Bloque si lo hubiere, se dice que el diseo es en parcelas subdivididas.

37

En este caso, aparece un nuevo trmino de error, por lo cual los trminos de error son tres.
Comnmente se los denomina A, B y C, siendo este ltimo el error experimental.
Los datos para el ensayo de fechas y variedades en un diseo en parcelas divididas en
bloques completos aleatorizados estn en el archivo variedadesPDB.idb.
Los resultados del anlisis de varianza se presentan a continuacin:
Anlisis de la varianza
Variable
Rendimiento

N
45

Cuadro de Anlisis
F.V.
Modelo
Fecha
Bloque
Bloque*Fecha
Variedad
Bloque*Variedad
Fecha*Variedad
Error
Total

R
0.97

R Aj
CV
0.92 6.27

de la Varianza (SC tipo III)


SC
gl
CM
F
1970.77
28
70.38 19.64
364.88
2
182.44 50.27
1369.56
2
684.78 191.04
14.52
4
3.63
1.01
140.41
4
35.10
9.79
49.59
8
6.20
1.73
31.83
8
3.98
1.11
57.35
16
3.58
2028.13
44

valor p
<0.0001
0.0015
<0.0001
0.4302
0.0003
0.1671
0.4066

(Error)
(Bloque*Fecha)

Test:Duncan Alfa:=0.05
Error: 3.6290 gl: 4
Fecha Medias n
1.00
27.12 15
A
3.00
29.54 15
B
2.00
33.99 15
C
Letras distintas indican diferencias significativas(p<= 0.05)
Test:Duncan Alfa:=0.05
Error: 3.5844 gl: 16
Variedad
Medias n
1.00
28.05 9
A
2.00
28.06 9
A
4.00
31.60 9
B
5.00
31.66 9
B
3.00
31.71 9
B
Letras distintas indican diferencias significativas(p<= 0.05)

En primer lugar se examina la interaccin Fecha*Variedad. Al ser no significativa


(p=0.4066) se pueden evaluar los efectos de Fecha y Variedad por separado. Hay efecto de
Variedad y (p=0.0003) y de Fecha (p=0.0015).
De acuerdo a la prueba de comparaciones mltiples de medias de Duncan se recomienda la
fecha 2 y las variedades 3, 4 o 5 indistintamente.

Diseo en parcelas divididas completamente aleatorizado


Este mismo ensayo del ejemplo se puede realizar sobre un conjunto de UE homogneas. Se
prepara un conjunto de PP (en este caso 9, tres fechas con tres repeticiones por fe fecha) y

38

sobre ellas se aleatorizan las fechas. Posteriormente se aleatorizan las variedades en las SP
dentro de cada PP. Un esquema posible para el ejemplo con este tipo de experimento es:

F3V4 F3V1 F3V2 F3V5 F3V3


F1V3 F1V2 F1V4 F1V1 F1V5
F3V4 F3V5 F3V2 F3V3 F3V1
F2V5 F2V1 F2V3 F2V4 F2V2
F1V5 F1V1 F1V4 F1V3 F1V2
F3V1 F3V4 F3V2 F3V3 F3V5
F2V2 F2V1 F2V3 F2V4 F2V5
F1V3 F1V5 F1V2 F1V4 F1V1
F2V1 F2V5 F2V3 F2V2 F2V4
Se puede observar que ahora las fechas y sus repeticiones estn completamente
aleatorizadas en las PP.
El modelo para un diseo en parcelas divididas completamente aleatorizado con estructura
bifactorial de tratamientos es, para el ejemplo, el siguiente:
Yijk=+Fechai+Repeticin(Fecha)k(i) + Variedadj + Fechai*Variedadj + ijk
Las Repeticiones deben declararse para poder obtener el efecto de Repeticiones dentro de
fechas (repeticiones(fechas)). El cuadrado medio de este efecto es usado como trmino de
error para evaluar el efecto de Fecha (error A). El resto de los efectos de inters, Variedad y
Variedad*Fecha, se contrastan con el error experimental (error B).
Para los datos del ejemplo, que se encuentran en el archivo variedadesDPDCA.idb, se
obtiene los siguientes resultados:
Variable
Rendimiento

N
45

Cuadro de Anlisis
F.V.
Modelo
Fecha
Fecha>Repeticiones
Variedad
Variedad*Fecha
Error
Total

R
0.82

R Aj
CV
0.66 8.33

de la Varianza (SC tipo III)


SC
gl
CM
F
valor p
636.66 20
31.83 5.30
0.0001
346.24 2
173.12 30.50
0.0007
34.05 6
5.68 0.94
0.4821
161.01 4
40.25 6.70
0.0009
95.36 8
11.92 1.98
0.0929
144.17 24
6.01
780.83 44

(Error)
(Fecha>Repeticiones)

39

Test:Duncan Alfa:=0.05
Error: 5.6757 gl: 6
Fecha Medias
n
1
26.63
15
A
3
28.46
15
A
2
33.21
15
B
Letras distintas indican diferencias significativas(p<= 0.05)
Test:Duncan Alfa:=0.05
Error: 6.0070 gl: 24
Variedad
Medias
n
1
27.03
9
A
2
27.68
9
A
B
4
29.63
9
B
C
3
30.67
9
C
D
5
32.17
9
D
Letras distintas indican diferencias significativas(p<= 0.05)

En primer lugar se examina la interaccin Fecha*Variedad. Al ser no significativa


(p=0.0929) se pueden evaluar los efectos de Fecha y Variedad por separado. Hay efecto de
Variedad y (p=0.0009) y de Fecha (p=0.0007).
De acuerdo a la prueba de comparaciones mltiples de medias de Duncan se recomienda la
fecha 2 y las variedades 3 o 5 indistintamente.

Diseo encajado o anidado


Siguiendo con el ejemplo, supongamos que las 5 variedades que estn en una fecha no son
las mismas que estn en las otras. Esto es razonable ya que en soja hay variedades de ciclo
corto, variedades de ciclo intermedio y de ciclo largo. Esto implica que a las variedades, en
vez de indicarlas como V1,,V5, las podramos haber llamado V1,,V15. Toda vez que
se pueda indicar como en el segundo caso, decimos que estamos en presencia de un arreglo
encajado. En este tipo de diseos no es de inters estudiar la interaccin ya que los niveles
del factor encajado son distintos dentro de cada uno de los factores donde se encajan. En
nuestro ejemplo, si hay distintas variedades en cada fecha de siembra, se tiene un diseo
encajado con los factores Fecha y Variedad dentro de Fecha.
El modelo para el ejemplo es:
Yijk=+Fechai +Variedad(Fecha)j(i) + ijk
Considerando la fecha y las variedades como fijas, los efectos de Fecha y Variedad(fecha)
se contrastan usando el cuadrado medio del error experimental.
Haciendo el anlisis de varianza para los datos del archivo se obtienen los siguientes
resultados:
Anlisis de la varianza
Variable
N
Rendimiento 45

R
0.77

R Aj CV
0.67 8.28

40

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
SC
gl
CM
F
valor p
Modelo
602.61
14
43.04
7.25 <0.0001
Fecha
346.24
2
173.12
29.14 <0.0001
Fecha>Variedad
256.36
12
21.36
3.60 0.0022
Error
178.22
30
5.94
Total
780.83
44
Test:Duncan Alfa:=0.05
Error: 5.9408 gl: 30
Fecha Medias
n
1
26.63
15
A
3
28.46
15
B
2
33.21
15
C
Letras distintas indican diferencias significativas(p<= 0.05)
Test:Duncan Alfa:=0.05
Error: 5.9408 gl: 30
Fecha Variedad
Medias
n
1
2
23.56
3
A
3
1
25.53
3
A
B
1
4
26.57
3
A
B
1
1
26.90
3
A
B
1
3
27.23
3
A
B
3
4
28.58
3
B
2
1
28.66
3
B
3
3
28.87
3
B
1
5
28.89
3
B
3
2
29.44
3
B
C
3
5
29.88
3
B
C
2
2
30.03
3
B
C
2
4
33.74
3
C
D
2
3
35.90
3
D
2
5
37.73
3
D
Letras distintas indican diferencias significativas(p<= 0.05)

Se observa que hay efecto de fecha (p<0.0001) y efecto de variedad dentro de fecha
(p=0.0022). Se recomienda a partir de la prueba de Duncan, la fecha 2, y dentro de esta, las
variedades 3, 4, o 5.
Si se hubiera considerado la Fecha de siembra como aleatoria, el modelo de anlisis es el
mismo, pero cambian las esperanzas de los cuadrados medios y por ende la construccin de
las pruebas F. En este caso, si la fecha es aleatoria, su variabilidad debe evaluarse usando el
cuadrado medio de Variedad(fecha) como trmino de error. Los resultados para un anlisis
con fecha como aleatoria y variedad como fija se muestran a continuacin:

41

Anlisis de la varianza
Variable
N
R
R Aj CV
Rendimiento 45
0.77
0.67 8.28
Cuadro de Anlisis de la Varianza (SC tipo III)
F.V.
Modelo
Fecha
Fecha>Variedad
Error
Total

SC
602.61
346.24
256.36
178.22
780.83

gl
14
2
12
30
44

Test:Duncan Alfa:=0.05
Error: 5.9408 gl: 30
Fecha Variedad
Medias
1
2
23.56
3
1
25.53
1
4
26.57
1
1
26.90
1
3
27.23
3
4
28.58
2
1
28.66
3
3
28.87
1
5
28.89
3
2
29.44
3
5
29.88
2
2
30.03
2
4
33.74
2
3
35.90
2
5
37.73

CM
43.04
173.12
21.36
5.94

F
7.25
8.10
3.60

valor p
<0.0001
0.0059
0.0022

(Error)
(Fecha>Variedad)

n
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3

A
A
A
A
A

B
B
B
B
B
B
B
B
B
B
B

C
C
C
C

D
D
D

Letras distintas indican diferencias significativas(p<= 0.05)

Como la fecha se consider aleatoria, las hiptesis que se prueban sobre ella son:
H0: La varianza de las fechas es igual a cero
H1: La varianza de las fechas es distinta de cero
La hiptesis de varianza de fechas igual a cero se rechaza (p=0.0059). Se siguen
recomendando las variedades 3, 4, o 5 en la fecha 2.

42

Introduccin al anlisis de la covarianza


El anlisis de la covarianza combina las tcnicas del ANAVA con regresin y se usa como
una practica de control local para reducir el error experimental y aumentar la precisin de la
estimacin de las medias de tratamiento y las pruebas de hiptesis.
La tcnica del anlisis de covarianza (ANCOVA) consiste en realizar un anlisis de
varianza con la inclusin de una o mas variables regresoras.
Las variables regresoras son conocidas en este contexto como variables concomitantes o
covariables. Las covariables son variables medidas sobre cada una de las unidades
experimentales.
Si bien la medida mas generalizada para el control local o control de la variabilidad de las
UE es el uso de bloques, salvo raras excepciones estos deben definirse antes de comenzar el
ensayo, en cambio las covariables pueden medirse en cualquier momento durante el
experimento. Por otra parte puede ocurrir a veces que el nmero de UE disponibles para
cada nivel del factor de bloqueo sea insuficiente para realizar todos los tratamientos. En
estos casos, se puede recurrir a bloques incompletos o al control del factor de bloqueo por
una covariable.
Otro caso donde las covariables toman relevancia es cuando hay varios factores de bloqueo
y la estructura de las UE es compleja, determinando un modelo de anlisis con muchas
restricciones que se puede tornar ineficiente. La inclusin de una covariable para controlar
un factor solo lleva 1 grado de libertad por factor. En cambio, los factores de bloqueo
requieren de b-1 grados de libertad cada uno, con b igual al nmero de bloques.
Modelo
El modelo para una anlisis de covarianza con una covariable en un DCA tiene la siguiente
expresin:
Yij = + i + (Xij- X ) + ij , con i=1,...,a y j=1,..,ni
donde:
Yij es la j-sima respuesta observada en el i-simo tratamiento
es la media poblacional de la variable respuesta
i es el efecto del i-simo tratamiento
es el coeficiente de regresin promedio de las regresiones de Y sobre X en cada uno de
los a tratamientos
Xij es el valor de la covariable en el i-simo tratamiento y la j-sima repeticin
X es el valor promedio de la covariable en todo el ensayo.
ij es un termino de error aleatorio. Bajo los supuestos del modelos de muestreo ideal, los
trminos de error asociados a cada una de las observaciones se suponen
independientemente distribuidos, normales, con esperanza 0 y varianza 2 i,j (Varianza
constante).
Las estimaciones de son correctas bajo la suposicin de que las pendientes de las
regresiones para cada tratamiento son iguales. Otra suposicin importante en anlisis de
43

covarianza es que la/s covariable/s no interactuen con los tratamientos y que exista una
relacin lineal entre la respuesta y la covariable.
Al ser la covariable independiente de los tratamientos, para obtener soluciones solo es
necesario imponer la restriccin usual:
i 0
Para realizar comparaciones de medias de tratamiento estas deben ser previamente
ajustadas por la covariable:
Yi ( ajustada ) Yi X i X
a

donde

X
i 1 j 1
a

ij

X i Yij Yi

X
i 1 j 1

ij

Xi

y su error estndar es:


Y ( ajustado )
i

2
1

Xi X

CMR
ni SCresidual ( X )

Luego, las hiptesis que se contrastan en el ANCOVA de efectos fijos se realizan sobre las
medias ajustadas y pueden expresarse como:
H0: 1(aj) = 2(aj) = ...= a(aj) versus
H1: Al menos un par de medias ajustadas difiere
O alternativamente como:
H0: 1(aj) = 2(aj) = ...= a(aj)=0 versus
H1: Al menos un i(aj) 0
Ejemplo
Recordando el ejemplo de una panadera que desea probar 4 temperaturas de horneado de pan
(100, 130, 160 y 190 C) con el fin de verificar si existen diferencias en el volumen del pan
obtenido. Para hacer la prueba se amas el pan y se formaron 16 bollos. Cada uno de los
bollos fue asignado al azar a una de las temperaturas. Luego se aleatoriz el orden de las
temperaturas del horno y despus del horneado se midi el volumen del pan obtenido (cm3).
Los datos estn en el archivo pan.idb. En este ejemplo, la unidad experimental es el bollo de
pan. Estos se realizan a mano y en forma artesanal, razn por la cual es de pensar que no todos
los bollos tengan el mismo pero al entrar al horno. Si las UE son variables y no se tiene en
cuenta esta variacin, esto se traduce en un aumento de los residuos.
Se realiz un ANAVA a una va de clasificacin (DCA) usando el peso del bollo como
covariable y se obtuvo la siguiente tabla:
Anlisis de la varianza
Variable
N
R
vol
16
0.97

RAj
0.96

CV
0.70

44

Cuadro de Anlisis de la Varianza (SC Tipo III)


F.V.
SC
gl
CM
F
Modelo
15283.06
4
3820.76
92.79
Temperatura
7110.00
3
2370.00
57.56
peso
6062.56
1
6062.56
147.23
Error
452.94
11
41.18
Total
15736.00
15

Valor p
<0.0001
<0.0001
<0.0001

Coef
2.07

A partir de los resultados se concluye que hay efecto de temperatura (p<0.0001) y de la


covariable peso (p<0.0001). El cuadrado medio residual, que ahora es de 41.18, tenia un
valor de 542.96 en el ANAVA sin la covariable peso (es decir, el estimador de varianza se
ha visto reducido a menos del 10% de su valor original!!).
Tambin se pueden observar cambios en las pruebas de comparaciones de medias. Antes
del ajuste por la covariable, la prueba de Tukey arrojaba los siguientes resultados:
Test : Tukey Alfa: 0.05
Error: 542.9583 gl: 12
Temperatura Medias
100
890.00
190
910.25
160
944.00
130
947.75

DMS: 48.92143
n
4
4
4
4

A
A

B
B
B

Luego del ajuste por la covariable con la prueba de Tukey se obtiene:


Test : Tukey Alfa: 0.05 DMS: 15.25938
Error: 41.1765 gl: 11
Temperatura Medias n
100
896.74 4
190
907.66 4
160
940.89 4
130
946.71 4

A
A
B
B

Por un lado, la DMS paso de 48.9 a 15.2, y por el otro, las medias de tratamiento han
cambiado, debido a que en el segundo anlisis son medias de tratamiento ajustadas por la
covariable.

Validacin del modelo:


Adems de los supuestos del MMI, para que el anlisis de covarianza sea valido se debe
verificar :
Los tratamientos no afectan a la covariable (no interaccin).
Si los tratamientos afectan a la covariable X al igual que a la variable respuesta Y, la
respuesta resultante es multivariada y no puede realizarse un ANCOVA ya que el ajuste de
las medias de tratamiento no es adecuado. En estos casos se debe realizar un anlisis
multivariado para la respuesta bivariada (X,Y).
El ajuste por covariables es adecuado si esta se mide antes de aplicar el tratamiento, de
manera tal que estos no tengan la posibilidad de afectar su valor. Si en cambio la covariable
se mide junto con la respuesta o en cualquier momento luego de aplicados los tratamientos,
se deber suponer la no interaccin para que el ajuste de las medias de tratamiento por la
covariable sea adecuado. En el ejemplo de la panadera, el peso del bollo fue medido antes
de aplicar los tratamientos de temperaturas, por lo cual este no pudo afectarlos. Pero si en
45

ves de medir el peso del bollo se hubiera medido el peso del pan obtenido luego del
horneado, es posible que esta covariable haya sido afectada por los tratamientos, ya que es
de suponer que a mayor temperatura mayor deshidratacin y por consecuencia menor peso
del pan. En este caso, el tratamiento afect a la covariable y esta no debe ser usada como
tal.
1) Existe una relacin lineal entre la variable respuesta y la covariable.
Para verificar este supuesto se puede hacer un grfico o un anlisis de regresin. Con los
datos del ejemplo de la panadera se obtienen los siguiente resultados:
992

PRED_vol

960

929

897

865
185.50

193.75

202.00

210.25

218.50

peso

Anlisis de regresin lineal


Variable
N
R
RAj
vol
16
0.52 0.49
Coef.

Est.

E.E.

LI(95%)

const 451.84 121.27 191.74


peso
2.36
0.61
1.06

LS(95%)
711.94
3.66

T
3.73
3.89

Valor p
0.0023
0.0016

CpMallows
15.19

Tabla de anlisis de la varianza SC Tipo III


FV
SC
gl
CM
F
Valor p
Modelo
8173.06
1
8173.06
15.13 0.0016
peso
8173.06
1
8173.06
15.13 0.0016
Error
7562.94
14
540.21
Total
15736.00
15

Se puede observar que hay una regresin lineal significativa (p=0.0016) entre volumen del
pan y peso del bollo.
Es importante notar que en el anlisis anterior no se removi el efecto de los tratamientos,
que como ya se vio en el primer anlisis es significativo. La no remocin de este efecto
puede llevar a no rechazar la hiptesis de coeficiente de regresin igual a cero cuando esta
es falsa. Si se tiene alguna duda al respecto, se puede realizar un ANAVA con efectos de
46

tratamiento nicamente y sobre los residuos de ese modelo (que ya tienen removido el
efecto de tratamiento) realizar la prueba del supuesto de linealidad. A continuacin se
muestra este anlisis para los datos de la panadera.

PRED_RDUO_vol1

45.55

26.02

6.50

-13.02

-32.55
185.50

193.75

202.00

210.25

218.50

peso

Anlisis de regresin lineal


Variable
N
R
RAj
RDUO_vol
16
0.89 0.89
Coeficientes de regresin y estadsticos asociados
Coef.
Est.
E.E.
LI(95%)
LS(95%)
T
const -397.63 36.75
-476.44 -318.82 -10.82
peso
1.99 0.18
1.60
2.38
10.83
Tabla de anlisis de la varianza SC Tipo III
FV
SC
gl
CM
F
Modelo
5821.13
1
5821.13
117.37
peso
5821.13
1
5821.13
117.37
Error
694.37
14
49.60
Total
6515.50
15

Valor p
<0.0001
<0.0001

CpMallows
110.61

Valor p
<0.0001
<0.0001

Puede verse como ha mejorado el ajuste haciendo la regresin de los residuos de volumen
versus peso. Ahora el valor de R2 paso de 0.52 a 0.89 y el valor p para la pendiente de
0.0016 a <0.0001.
El coeficiente de regresin es el mismo para todos los grupos de tratamiento.
Las comparaciones entre las medias de tratamiento ajustadas son independientes de la
covariable si las lneas de regresin para cada uno de los tratamientos son paralelas. Si esto
no ocurre, se debe ajustar de manera diferencial a las medias de cada tratamiento. En este
caso el modelo de anlisis es:
Yij = + i + i(Xij- X ) + ij , con i=1,...,a y j=1,..,ni
donde:
i es el coeficiente de regresin de Y sobre X en el i-simo tratamiento

47

Yi ( ajustada ) Yi i X ij X i
n

donde i

X
j 1

ij

X i Yij Yi

X
j 1

Y ( ajustado )
i

ij

Xi

2
1

Xi X

CMR

ni SCresidual ( X )

Este supuesto se puede verificar en forma grfica o mediante pruebas formales.


Para los datos del archivo pan.idb se obtiene el siguiente grfico:
990

Vol

959

929

899

869
186

194

202

210

219

peso
vol-100
vol-160

vol-130
vol-190

En el grfico se puede ver que no hay una falta de paralelismo muy marcada, por lo tanto se
puede pensar en una nica pendiente de regresin para ajustar las medias de los
tratamientos.
Los supuestos del MMI se prueban sobre los residuos, que en el caso del anlisis de
covarianza para un DCA tienen la siguiente forma:
eij Yij Yi X ij X i
En general, los supuestos del MMI en ANCOVA son evaluados con las mismas tcnicas
grficas y/o probabilsticas usadas en ANAVA.
Por ultimo, la tcnica de anlisis de covarianza puede extenderse a todos los diseos y
arreglos factoriales mas comunes sin mayores complicaciones. Por ejemplo, en el caso de
un diseo en BCA con una covariable, el modelo resultante es:
Yij = + i + j + (Xij- X ) + ij ,

con i=1,...,a y j=1,..,b

Donde j es el efecto del j-simo bloque

48

También podría gustarte