Diseño Cruzado
Diseño Cruzado
Diseño Cruzado
Modelo matemtico
Se dice que un factor B est anidado en otro factor A (o que sus niveles estn anidados en los de A) cuando cada nivel del factor B aparece asociado a un nico nivel del factor A. Se denota como B A. A1 . & B1 B2 B3 obs. 1 obs. 1 obs. 1 obs. 2 obs. 2 obs. 2 obs. 3 obs. 3 obs. 3 A2 . & B4 B5 B6 obs. 1 obs. 1 obs. 1 obs. 2 obs. 2 obs. 2 obs. 3 obs. 3 obs. 3 Aa . & Bm2 Bm1 Bm obs. 1 obs. 1 obs. 1 obs. 2 obs. 2 obs. 2 obs. 3 obs. 3 obs. 3
j (i) = 0 i = 0
a X i=1
Se observa que j (i) representa el efecto medio adicional del nivel j -simo anidado en el nivel i. Por otro lado, b es el nmero de niveles anidados en cada nivel i, de modo que el nmero total de niveles de B es a b y la suma de los efectos del factor B dentro de cada nivel de A es 0.
,i , j (i)
= y
yijk ny n ( yi y ) n j (i) = 0 =
j (i) = y ij y i De este modo, y ijk = y + ( yi y ) + ( yij y i ) = y ij El nmero total de observaciones es a b n y el nmero total de parmetros a estimar es 1+(a1)+a(b1) = ab, luego el nmero de grados de libertad total es abnab = ab(n1). De este modo, la estima de la varianza es Pa Pb Pn =
2 i=1 j =1
(yijk y ij )2 . ab(n 1)
k=1
(yijk y )2
(yijk y )
b X n a X X i=1 j =1 k=1
( yi y )2 + ( yij y i )2 + (yijk y ij )2
+ entonces
SCT = SCA + SCB (A) + SCE que puesto en trminos de totales queda A1 B1 B2 y111 y121 . . . . . . yij yi y11n y12n y11 y12 y1 A2 B3 B4 y211 y221 . . . . . . y21n y22n y21 y22 y2 A3 B5 B5 y311 y321 . . . . . . y31n y32n y31 y32 y3
a X b X n X
2 yijk
1 2 y abn
1 2 y abn
Pa
i=1
1 X 2 1 XX 2 yij y SCB (A) = n i=1 j =1 bn i=1 i SCE = SCT SCA SCB (A)
Los contrastes de hiptesis que se realizan son: H0 : 1 = = a = 0 (el factor A no inuye) H1 : algn i 6= 0 (el factor A inuye) en este caso F0 = de modo que se rechaza H0 a nivel si
SCA a1 SCE ab(n1)
MCA MCE
F0 > F(a1),ab(n1), La otra hiptesis que se contrasta es, i = 1, . . . , a H0 : 1(i) = = b(i) = 0 H1 : algn j (i) 6= 0 en este caso, F0 =
SCB (A) a(b1) SCE ab(n1)
F0 > Fa(b1),ab(n1), En este caso, se contrasta la hiptesis de que todos los niveles del factor anidado B son iguales dentro del factor A donde estn anidados. Sin embargo, si se obtiene que son distintos a nivel global, es interesante contrastar, a continuacin, si los niveles del factor B anidado en A son iguales entre s, dentro de cada nivel i (de A) en el que estn anidados. As, para cada nivel jado de i, donde i = 1, . . . , a se contrasta si los niveles del factor anidado son iguales o no dentro de cada uno de los niveles del factor A en el que estn anidados de manera individual 5
de modo que se rechaza H0 a nivel si F0 > F(b1),ab(n1) , La tabla ANOVA es F. V. Factor A S. C. SCA G. L. a1 M. C. MCA = F FA =
Ejemplo. Un gelogo estudia el contenido en trazas radiactivas de cinco tipos diferentes de suelo. Para ello recoge cuatro muestras de contenido en sustancias radiactivas en cuatro localidades diferentes que estn situadas sobre cada tipo de suelo. Se obtienen los siguientes datos: A B 1 2 3 4 5 6 7 8 6 13 1 7 10 2 4 0 2 3 10 4 9 1 1 3 0 9 0 7 7 1 7 4 8 8 6 9 12 10 9 1 16 33 17 27 38 14 21 8 93 81 402 6 C 11 8 5 0 7 20 82
yij yi y
9 10 0 10 0 11 5 6 5 7 10 34
12 7 2 5 4 18
D 13 11 0 6 4 21 14 5 10 8 3 26 15 1 8 9 4 22 88 16 0 8 6 5 19 17 1 4 7 9 21 18 6 7 0 3 16
E 19 3 0 2 2 7 58 20 3 7 4 0 14
yij yi y
402
SCT =
a X b X n X i=1 j =1 k=1
2 yijk
SCE = SCT SCA SCB (A) = 642 La tabla ANOVA es F. V. Factor A terreno S. C. 45,75 G. L. a1=4 M. C. F 11,269 FA =
Factor B(A) localidad 282,875 a(b 1) = 15 18,858 Residual 642 ab(n 1) = 60 10,7 Total 969,95 abn 1 = 79 Se obtiene que F(a1),ab(n1), = F4,60,00 1 = 2,04 7
por lo cual se acepta H0 : 1 = = a = 0 As no existen diferencias signicativas entre los terrenos a nivel = 0,1. Por otro lado, Fa(b1),ab(n1), = F15,60,00 1 = 1,6 luego se rechaza i = 1, . . . , a la hiptesis H0 : 1(i) = = b(i) = 0 a nivel = 0,1. Estudiamos los contrastes individuales por nivel. Se calcula para cada i 1X 2 1 2 1X 2 1 2 yij yi = yij yi SCB (A)i = n j =1 bn 4 j =1 16
b 4
De este modo, i=1 i=2 i=3 i=4 i=5 SCB (A)1 SCB (A)2 SCB (A)3 SCB (A)4 SCB (A)5 = = = = =
1 (162 4 1 (382 4 1 (102 4 1 (212 4 1 (212 4 1 + 332 + 172 + 272 ) 16 932 = 50,18 1 2 2 2 + 14 + 21 + 8 ) 16 832 = 126,18 1 + 342 + 202 + 182 ) 16 822 = 74,75 1 2 2 2 + 26 + 22 + 19 ) 16 882 = 6,5 1 + 162 + 72 + 142 ) 16 582 = 25,25
La tabla ANOVA queda como F. V. Factor A terreno Factor B(A) localidad A(1) B(2) C(3) D(4) E(5) Residual Total Como F3,60,00 1 = 2,18 existen diferencias signicativas en los niveles B (2) y C (3), es decir, respecto a los terrenos de tipo B y C las localidades tienen distinto nivel de sustancia radiactiva. S. C. 45,75 282,875 50,18 126,18 74,75 6,5 25,25 642 969,95 G. L. M. C. 4 11,269 15 18,858 3 16,726 3 42,06 3 24,92 3 2,16 3 8,41 60 10,7 79 F FA = 1,053 FB(A) = 1,762 FB(A)1 = 1,56 FB(A)2 = 3,93 FB(A)1 = 2,33 FB(A)1 = 0,202 FB(A)1 = 0,786
para todo i,
Las estimas de los componentes de la varianza son: 2 = MCE 2 MCB (A) MCE = n MCA MCB (A) 2 = bn 9
Las esperanzas de los cuadrados medios son: 2 E (MCA) = 2 + n 2 + bn E (MCB (A)) = 2 + n 2 E (MCE ) = 2
Si FA =
MCA > Fa1,a(b1); se rechaza la hiptesis nula, H0 2 = 0 MCB (A) MCB (A) > Fa(b1),ab(n1); se rechaza la hiptesis nula, H0 2 = 0 MCE
Si FB(A) =
i = 0
para todo i,
j (i) N 0, 2 donde todas las v.a. son independientes. As, 2 yijk N + i , 2 + ijk N 0, 2
Las estimas de los componentes de la varianza son: 2 = MCE MCB (A) MCE 2 = n i y i = y 10
Las esperanzas de los cuadrados medios son: Xa 2 bn i i=1 E (MCA) = 2 + n 2 + a1 2 2 E ( MCB ( A )) = + n E (MCE ) = 2
Los contrastes de hiptesis son: Si FA = MCA > Fa1,a(b1); se rechaza la hiptesis nula, H0 i = 0, i MCB (A) MCB (A) > Fa(b1),ab(n1); se rechaza la hiptesis nula, H0 2 = 0 MCE
Si FB(A) =
para todo i,
j (i) = 0
ijk N 0, 2
2 yijk N + j (i) , 2 +
Las esperanzas de los cuadrados medios son: E (MCA) = 2 + bn 2 Xa Xb 2 n j (i) i =1 j =1 2 E ( MCB ( A )) = + a(b 1) E (MCE ) = 2
11
Los contrastes de hiptesis son: MCA > Fa1,a(b1); se rechaza la hiptesis nula, H0 2 = 0 MCE MCB (A) > Fa(b1),ab(n1); se rechaza la hiptesis nula, H0 i(i) = 0, i MCE
Si FB(A) =
. T1 I1 I2
P1 T2 T3 I3 I5 I4 I6
& T4 I7 I8
P2 . & T1 T2 T3 T4 I 9 I 11 I 13 I 15 I 10 I 12 I 14 I 16
Se observa que todos los niveles del factor posicin se cruzan con todos los niveles del factor tamao y que el factor individuo tiene niveles distintos para cada uno de los cruces, es decir, trabajan personas diferentes en cada caso. El esquema es P T y I (P T ).
Modelo matemtico. En el modelo se tienen que incluir: Los efectos principales de P y T. Las interacciones entre P y T. Los efectos de cada nivel k del factor I anidado en la combinacin de (i, j ).
i =
b X j =1
(i, j ) jo
k(ij ) = 0
ya que el factor I tiene c niveles anidados en cada combinacin de los niveles de P y T. Se minimiza la suma de cuadrados de los errores para obtener los estimadores, derivan-
13
n X ij k(ij ) = 0 = yijkl y
ijk y ij k(ij ) = y
Las respectivas sumas de cuadrados y grados de libertad son: Sumas de Cuadrados b X c X n a X X SCT = (yijkl y )2 SCA = bcn
i=1 j =1 k=1 l=1 a X i=1 b X
( yi y )2 ( yj y )2 ( yij y i y j + y )2 ( yijk y ij )2
SCB = acn
SCAB = cn
j =1 b a X X
(yijkl y ijk )2
La tabla ANOVA es
14
G. L.
a1 b1 (a1)(b1) ab(c1) abc(n1) abcn1
As los contrastes que se establecen son: Si FA > Fa1,abc(n1), se rechaza H0 i = 0 a nivel . Si FB > Fb1,abc(n1), se rechaza H0 j = 0 a nivel . Si FAB > F(a1)(b1),abc(n1), se rechaza H0 ( )ij = 0 a nivel . Si FC (AB) > Fab(c1),abc(n1), se rechaza H0 k(ij ) = 0 a nivel . Modelo 2. En una serie de establecimientos de una cadena de tiendas de ropa se contabilizan las ventas realizadas de ropa de verano y de ropa de invierno. Se anotan, adems los empleados que realizan las ventas. Hay tres factores: A Tienda B Tipo de ropa C Empleado El esquema es el siguiente Tienda 1 . & V I E1 E2 E1 E2 Tienda 2 . & V I E 3 E4 E 3 E4
Se observa, aqu, que el factor C (empleado) no est anidado en el cruce de los factores A y B (AB ) porque no est combinado con una nica combinacin (i, j ), ya que se supone que estn los mismos empleados en verano e invierno. As, Empleados T iendas = C A Empleados Ropa = C B T iendas Ropa = A B 15
Modelo matemtico. yijkl = + i + j + ( )ij + k(i) + ( )k(i)j + ijkl donde i = 1, . . . , a j = 1, . . . , b k = 1, . . . , c l = 1, . . . , n sujeto a las restricciones
a X i=1
i =
b X j =1
y para cada i
c X k=1
k(i) = 0
Se minimiza la suma de cuadrados de los errores para obtener los estimadores, derivando con respecto a cada uno delo parmetros e igualando a 0. Se obtiene: = y i = y i y j = y j y c )ij = y ( ij y i y j + y k(i) = y ik y i Del mismo modo, para i, j, k jados:
2 X j ( c )ij yijkl i k(i) ( )k(i)j = 0 = ( )k(i)j i,j,k,l X 2 ij y ik + y i ( )k(i)j = 0 yijkl y ( )k(i)j i,j,k,l
l=1
n X 2 ij y ik + y i ( )k(i)j = 0 = yijkl y
16
Las respectivas sumas de cuadrados y grados de libertad son: Sumas de Cuadrados SCT =
n a X b X c X X i=1 j =1 k=1 l=1 a X i=1 b X
grados de libertad = = = = = = = abcn 1 a1 b1 ab a b + 1 = = (a 1)(b 1) ac a = a(c 1) abc ab ac + a = a(b 1)(c 1) abcn abc = = abc(n 1)
(yijkl y )2
SCA = bcn
SCB = acn
SCAB = cn
j =1 b a X X
SCC (A) = bn
i=1 j =1 a X c X
(yijkl y ijk )2
i =
b X j =1
j =
(i, j ) jo k(ij ) N (0, 2 ) ijkl N (0, 2 ) independientes entre s. Las esperanzas de los cuadrados medios son: Xa 2 bcn i i=1 2 2 + n + E [ MCA ] = a 1 X b 2 acn j j =1 E [MCB ] = 2 + n 2 + b 1 X X a b ( )2 cn ij i=1 j =1 2 2 E [MCAB ] = + n + (a 1)(b 1) 2 2 E [MCC (AB )] = + n E [MCE ] = 2
Las estimas de los componentes de la varianza son: 2 = MCE MCC (AB ) MCE 2 = n MCA > Fa1,ab(c1); se rechaza la hiptesis nula, H0 i = 0, i MCC (AB ) MCB > Fb1,ab(c1); se rechaza la hiptesis nula, H0 j = 0, j MCC (AB ) MCAB > F(a1)(b1),ab(c1); se rechaza la hiptesis nula, H0 ( )ij = 0, ij MCC (AB ) MCC (AB ) > Fab(c1),abc(n1); se rechaza la hiptesis nula, H0 2 = 0 MCE
Si FAB =
Si FC (AB) =
18