Tema 3
Tema 3
Tema 3
3.1 Introducción
4. Conclusiones y recomendaciones.
aleatorio. El objetivo se concentra en probar hipótesis apropiadas con respecto a los efectos
de los tratamientos y hacer una estimación de los mismos. Para probar las hipótesis, se
supone que los errores del modelo son variables aleatorias independientes normalmente
distribuidas, con media cero y varianza σ 2 . Se supone que esta última es constante para
todos los niveles del factor.
1 2 …i…k
_____________________________________
y11 y 21 ... y i1 ... y k 1
y12 y 22 ... y i 2 ... y k 2
. . . .
. . . .
. . . .
y1n y 2 n ... y in ... y kn
_____________________________________
Total T1. T2. ... Ti. ... Tk . T..
− − − − −
Media y 1. y 2. ... y i. ... y k . y ..
El modelo estadístico presentado a través de la ecuación (3.1), describe dos situaciones con
respecto al efecto de los tratamientos. En primer lugar, los tratamientos podrían haber sido
seleccionados específicamente por el experimentador. En esta situación se desea probar
hipótesis sobre las medias de los tratamientos y las conclusiones se aplican sólo a los
niveles del factor considerados en el análisis. Las conclusiones no pueden hacerse
extensivas a tratamientos similares que no hayan sido considerados específicamente.
También sería deseable estimar los parámetros del modelo ( µ ,τ i , σ 2 ) . Este modelo se
denomina modelo de efectos fijos.
Alternativamente, los k tratamientos pueden ser una muestra aleatoria de una población
mayor de tratamientos. En esta situación, sería interesante generalizar las conclusiones
(basadas en la muestra de tratamientos) a todos los tratamientos de la población, ya sea que
hayan sido explícitamente considerados en el análisis o no. En este caso, las τ i son
variables aleatorias y resulta relativamente útil conocer sus valores particulares para los
tratamientos investigados. En su lugar, se prueban hipótesis con referencia a la variabilidad
de las τ i y se intenta dicha variabilidad. Esto se conoce como modelo de efectos
En este modelo los efectos de tratamiento τ i se definen usualmente como desviaciones con
respecto a la media general, por esta razón
k
∑τ
i =1
i = 0 (3.2)
si no se rechaza la hipótesis nula, todos los tratamientos tienen la media común µ . Una
forma equivalente de expresar las hipótesis anteriores en términos de los efectos del
tratamiento es la siguiente:
H 0 : τ 1 = τ 2 = ... = τ k = 0 (3.4)
H 1 : τ i ≠ 0 para al menos un i
k n
T 2 ..
SCT = ∑∑ y ij2 − (3.5)
i =1 j =1 nk
k
∑T
i =1
2
i.
T 2 ..
SCTR = − (3.6)
n nk
SCE = SCT − SCTR (3.7)
k ni
T 2 ..
SCT = ∑∑ y ij2 − (3.8)
i =1 j =1 N
k
∑T i =1
2
i.
T 2 ..
SCTR = − (3.9)
ni N
SCE = SCT − SCTR (3.10)
k
con N = ∑ ni . Los grados de libertad para SCTR siguen siendo k-1; mientras que para
i =1
Agregado (peso %)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Total 3.320 3.416 3.663 2.791 3.664 16.854
Media 553,33 569,33 610,50 465,17 610,67 561,80
H 0 : µ1 = µ 2 = µ 3 = µ 4 = µ 5
H 1 : Al menos dos de las medias son diferentes.
16.854 2
SCT = 5512 + 457 2 + ... + 679 2 − = 9.677.954 − 9.468.577 = 209.377
30
3.320 2 + 3.416 2 + ... + 3.664 2
SCTR = − 9.468.577 = 85.356
6
SCE = 209.377 − 85.356 = 124.021
Total 209.377 29
Ejemplo 3.2. Parte del estudio “Serum Inorganic Phosporus Levels in Children with
Seizure Disorders Taking Anticonvulsant Drugs”, llevado a cabo en Virginia Polytechnic
Institute and State University en 1982, fue diseñado para medir los niveles de actividad de
la fosfatasa alcalina de suero (Unidades Bessey-Lowry) en niños con problemas de
crecimiento que recibieron terapia anticonvulsiva bajo el cuidado de un especialista
privado. Se encontraron 45 personas para el estudio y se clasificaron en cuatro grupos
según su medicamento:
1. Planteamiento de hipótesis:
H 0 : µ1 = µ 2 = µ 3 = µ 4
H 1 : Al menos dos de las medias son diferentes.
4: Cálculos: T1. = 1.460,25; T2. = 440,36; T3. = 842,45; T4. = 707,41; T.. = 3.450,47
3.450,47 2
SCT = 49,20 2 + 44,54 2 + ... + 111.50 2 −
45
= 331.886,9701-264.572,0716 = 67.314,8985
1.460,25 2 440,36 2 842,45 2 707,412 3.450,47 2
SCTR = + + + −
20 9 9 7 45
= 278.510,6729 − 264.572,0716 = 13.938,6013
SCE = 67.314,8985 − 13.938,6013 = 53.376,2972
En el caso del modelo de efectos aleatorios τ i es una variable aleatoria con varianza σ τ2 y
V ( y ij ) = σ τ2 + σ 2 (3.11)
H 0 : σ τ2 = 0
(3.12)
H 1 : σ τ2 > 0
Todos los tratamientos son idénticos si σ τ2 = 0 ; por otra parte, si σ τ2 > 0 existe
variabilidad entre los tratamientos. El procedimiento de análisis de varianza para el modelo
∧ 2
σ = CME (3.13)
y
∧ 2 CMTR − CME
στ = (3.14)
n
k
1 k ∑ ni2
n0 = ∑ ni − i =k1 (3.15)
k − 1 i =1
∑ ni
i =1
Ejemplo 3.3. Una compañía textil utiliza un gran número de telares. Se desea que los
telares sean homogéneos con el objeto de producir tela de resistencia uniforme. El
ingeniero de procesos supone que, aparte de la variación usual en la resistencia de tela en
muestras del mismo telar, puede existir una variación significativa de la resistencia entre los
distintos telares. Para investigar esto, selecciona cuatro telares al azar y realiza cuatro
determinaciones de la resistencia de la tela manufacturada por cada uno. Este experimento
es realizado en orden aleatorio y los datos se muestran a continuación:
De este análisis se concluye que existen diferencias significativas entre los telares de la
∧ 2
planta. Las estimaciones para los componentes de varianza son σ = 1,90 y
∧ 2 29,73 − 1,90
στ = = 6,96
4
Así, los resultados indican que la mayor variabilidad se atribuye a diferencias entre los
telares. Este ejemplo ilustra un uso importante de los componentes de varianza, a saber, al
aislar las diferentes fuentes de variabilidad que afectan a un producto o sistema. El
problema de la variabilidad de un producto surge, frecuentemente, en el aseguramiento de
la calidad, siendo frecuentemente difícil aislar las fuentes que producen la variabilidad. El
ingeniero debería intentar aislar las causas específicas de la diferencia de desempeño de los
telares. Si puede identificar y aislar estas fuentes de variabilidad, la varianza de la
producción del proceso puede ser reducida considerablemente y hacer que el proceso sea
más homogéneo en términos del desempeño de los telares.
Existe una forma equivalente de probar la hipótesis de no existencia de una relación lineal
entre X e Y ( H 0 : β 1 = 0) utilizando el método del ANOVA. En estos términos, es
importante recordar la siguiente descomposición:
donde:
_ _ 2
SCT = ∑ (Yi − Y ) 2 = ∑ Yi 2 − n Y (3.17)
∧ _ ∧ 2 _ 2
SCR = ∑ (Y i − Y) 2 = β 1 (∑ X i2 − n X ) (3.18)
∧
SCE = ∑ (Yi − Y i ) 2 = SCT - SCR (3.19)
En el caso que el contraste sea por la derecha ( H 1 : β1 > 0) se rechaza la hipótesis nula si
y solo si Fc > F1,n −2;α . Si es por la izquierda ( H 1 : β1 < 0) se rechaza la H 0 si
1. H 0 : β1 = 0
H 1 : β1 >0.
2. α = 0,05 .
3. Ft = F1,5;0, 01 = 6.61 .
Total 710 6
Desde el punto de vista de un experimentador, podría parecer necesario llegar a una prueba
de significancia acerca de interacción separando la variación del error verdadero de la
variación debida a la interacción. Los efectos de los factores A y B, a menudo denominados
efectos principales, adquieren diferentes significados en presencia de la interacción. Si ésta
última no es significativa, entonces los resultados de las pruebas acerca de los efectos
principales tienen sentido; sin embargo, si la interacción es significativa entonces sólo
aquellas pruebas acerca de los efectos principales que resulten ser significativas tienen
sentido. Efectos principales no significativos en presencia de la interacción podrían muy
bien ser un resultado del encubrimiento y plantear la necesidad de observar la influencia de
cada factor para niveles fijos del otro. Ampliando la expresión (3.1) se tiene:
tomada para el i-ésimo nivel del factor A y para el j-ésimo nivel del factor B de las abn
observaciones.
donde ε ijk mide las desviaciones de los valores observados yijk en la (ij)-ésima celda de la
media poblacional µ ij . Si (αβ ) ij denota el efecto de interacción del i -ésimo nivel del
factor A y el j-ésimo nivel del factor B, α i el efecto del i-ésimo nivel del factor A y el j-
ésimo nivel del factor B; y µ la media total, se puede escribir:
µ ij = µ + α i + β j + (αβ ) ij , (3.22)
y entonces
a b b
sobre lo cual se imponen las restricciones (i) ∑α
i =1
i = 0, (ii) ∑β
j =1
j = 0 , (iii) ∑ (αβ )
j =1
ij =0 y
b
(iv) ∑ (αβ )
j =1
ij =0.
H 0 : α 1 = α 2 = ... = α a = 0, (3.24)
H 0 : β 1 = β 2 = ... = β b = 0, (3.25)
a b n
T...2
SCT = ∑∑∑ y ijk
2
− (3.27)
i =1 j =1 k =1 abn
a
∑T T...2
i =1
2
i ..
SCA = − (3.28)
bn abn
b
∑T
j =1
2
. j.
T...2
SCB = − (3.29)
an abn
a b a b
∑∑ T
i =1 j =1
2
ij . ∑ Ti..2 ∑T
j =1
2
. j.
T 2 ...
i =1
SC ( AB ) = − − + (3.30)
n bn an abn
rechaza la hipótesis nula si Fc > Fb−1, ab ( n −1);α ; mientras que en el último se rechaza si y solo
si Fc > F( a −1)( b−1),ab ( n −1);α . Es conveniente realizar el test para la interacción antes de intentar
Ejemplo 3.5. En un experimento realizado para determinar cuál de tres diferentes sistemas
de misiles es preferible, se midió el promedio de combustión del impulsor para 24
encendidos estáticos. Fueron utilizados cuatro diferentes tipos de impulsor. El experimento
produjo observaciones duplicadas de los promedios de ignición a cada combinación de los
tratamientos. Los datos se muestran tal y como sigue:
combustión del impulsor para los cuatro tipos de impulsor y c) H 0 : No hay interacción
entre los diferentes sistemas de misiles y los diferentes tipos de impulsor.
1. a) H 0 : α 1 = α 2 = α 3 = 0,
b) H 0 : β 1 = β 2 = β 3 = β 4 = 0,
2. α = 0,05.
710,2 2
SCT = 34,0 2 + 32,7 2 + ... + 29,12 − = 21.107,68 − 21.016,00 = 91,68
24
244,0 2 + 237,4 2 + 228,8 2 710,2 2
SCA = − = 21.030,52 − 21.016,00 = 14,52
8 24
189,6 2 + 179,12 + 170,3 2 + 171,2 2 710,2 2
SCB = − = 21.056,08 − 21.016,00 = 40,08
6 24
66,7 2 + 65,2 2 + ... + 57,9 2
SC ( AB) = − 21.030,52 − 21.056,08 + 21.016,00 = 22,17
2
SCE = 91,68 − 14,52 − 40,08 − 22,17 = 14,91.
5. Para el tercer contraste, se tiene que Fc < Ft por lo que no se rechaza la hipótesis nula de
no interacción entre los diferentes sistemas de misiles y los diferentes tipos de impulsor a
un nivel de confianza del 95%. Ya que no hay interacción significativa, las pruebas de los
Los diseños factoriales son ampliamente utilizados en experimentos en los que intervienen
varios factores para estudiar el efecto conjunto de éstos sobre una respuesta. Existen varios
casos especiales del diseño factorial general que resultan importantes porque se usan
ampliamente en el campo de investigación, y porque constituyen la base para otros diseños
de gran valor práctico. El más importante de estos casos especiales ocurre cuando se tienen
k factores, cada uno con dos niveles. Estos niveles pueden ser cuantitativos como en el caso
de dos valores de temperatura, presión o tiempo. También pueden ser cualitativos como
sería el caso de dos máquinas, dos operadores, los niveles “superior” e “inferior” de un
factor o, quizás la ausencia o presencia de un factor. Una réplica completa de tal diseño
requiere que se recopilen 2 × 2 × 2 × ...2 = 2 k observaciones y se conoce como diseño
factorial 2 k .
Este diseño es particularmente útil en las primeras fases del trabajo experimental, cuando es
probable que haya muchos factores por investigar. Conlleva el menor número de corridas
con los cuales pueden estudiarse k factores en un diseño factorial completo. Debido a que
sólo hay dos niveles para cada factor, debe suponerse que la respuesta es aproximadamente
lineal en el intervalo de los niveles elegidos de los factores.
El primero diseño de la serie 2 k es aquel que tiene sólo dos factores, llamados A y B, cada
uno con dos niveles. Este diseño se conoce como diseño factorial 2 2 . Arbitrariamente, los
niveles del factor pueden llamarse “inferior” y “superior” o “bajo y alto”. Para las n
observaciones experimentales por cada combinación de tratamientos, se designan los
niveles superiores de los factores A, B, C… por las letras a, b, c,… y los niveles inferiores
B Media
(1) (b) b + (1)
A 2n
a ab ab + a
2n
Media a + (1) ab + b
2n 2n
[ab + a - b - (1)]2
SCA = (3.32)
n.4
[ab + b - a - (1)] 2
SCB = (3.33)
n.4
[ab + (1) - a - b] 2
SCAB = (3.34)
n.4
2 2 n
Y...2
SCT = ∑∑∑ y ijk2 − (3.35)
i =1 j =1 k =1 4n
Ejemplo 3.6. Supóngase que una investigación llevada a cabo para estudiar el efecto que
tienen la concentración de un reactivo y la presencia de un catalizador sobre el tiempo de
reacción de un proceso químico. Sea la concentración del reactivo el factor A con dos
niveles de interés, 15% y 20%. El catalizador constituye el factor B; el nivel alto (o
superior) denota el uso de dos sacos de catalizador y el nivel bajo (o inferior) denota el uso
de sólo un saco. El experimento se realiza (“replica” o “repite” tres veces y los datos son
como sigue:
Tabla 3.16. Datos para la concentración del reactivo y uso del catalizador
Réplica
Combinación de tratamientos I II III Total
A baja, B baja 28 25 27 80
A alta, B baja 36 32 32 100
A baja, B alta 18 19 23 60
A baja, B alta 31 30 29 90
(10) 2 (10) 2
SCAB = = 8,33 SCAB = = 8,33
4(3) 4(3)
SCT = 9.398,0 − 9.075,00 = 323,00 SCE = 323,00 − 208,33 − 75,00 − 8,33 = 31,34
Total 323,00 11