Tema 3

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 24

Tema 3: Introducción al Análisis y Diseño de Experimentos

3.1 Introducción

La metodología del Diseño de Experimentos se basa en analizar los cambios en la


operación de un proceso o sistema para medir el efecto de ese cambio sobre las propiedades
del producto elaborado. En este sentido, el experimento posee como objetivo primordial,
determinar los cambios en los materiales, métodos o condiciones del proceso y por el otro
los cuales permitan detectar, minimizar o eliminar posibles problemas de calidad.

En concordancia con lo anterior, el Diseño Estadístico de Experimentos (DEX) proporciona


la técnica y la estrategia necesarias para conducir eficazmente los procesos a mejores
condiciones de operación, organizando los experimentos para que éstos generen datos que
al analizarlos estadísticamente, produzcan conclusiones y decisiones que deriven en
mejoras del desempeño del proceso. Para tal fin, se hace uso de determinadas técnicas
estadísticas las cuales manipulan el proceso induciéndolo a generar la información
necesaria para mejorarlo y así lograr la máxima eficacia productiva al menor costo posible.

3.2. Objetivos del Diseño y Análisis de Experimentos

. Determinar las principales causas de variación en la respuesta del proceso.


. Encontrar las condiciones experimentales bajo las que se obtienen valores extremos en la
variable respuesta.
. Comparar las respuestas para diferentes niveles de observación de variables controladas.
. Obtener modelos estadístico-matemáticos que permitan hacer predicciones de la variable
respuesta.

3.3. Etapas en un Diseño Experimental

1. Planeación del DEX

1.1. Etapas pre-experimentales:


1.1.1. Identificación del problema a ser resuelto y definición de los objetivos del
experimento.

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 1


Estadística II
1.1.2. Identificación de las posibles fuentes de variación: factores, niveles unidades
experimentales
1.1.3. Elección de la variable respuesta, especificando las medidas a ser utilizadas.

1.2. Etapas experimentales:


1.2.1. Selección del diseño experimental. Reglas de asignación de las unidades
experimentales a las condiciones de estudio. Determinar tamaño de muestra.
1.2.2. Ejecución del experimento. Planear y organizar el trabajo experimental, realizando
un experimento piloto.

2. Análisis estadístico de los datos. Especificar modelo del DEX.

3. Interpretación de los resultados.

4. Conclusiones y recomendaciones.

3.4. Análisis de Varianza

En el contexto de los contrastes de hipótesis, el Análisis de Varianza (ANOVA) es un


método estadístico el cual juega un papel fundamental, en cuanto a discernir si un
parámetro estimado para un modelo es estadísticamente significativo, las varianzas de dos
poblaciones son estadísticamente diferentes u otros casos. En este contexto, la técnica
similarmente puede ser utilizada para realizar contrastes de medias; así, el procedimiento
asume que cualquier variación existente entre los promedios de las poblaciones es atribuida
a 1) una variación dentro de las observaciones de las poblaciones y 2) una variación entre
las observaciones de las poblaciones. En cualquier caso, se considerará la variación dentro
de las observaciones (muestra) de una población como una variación al azar o aleatoria; y
la variación entre las observaciones de las poblaciones como una variación sistemática y
aleatoria, ambas considerándolas como las fuentes de variación fundamentales para la
técnica.

Supóngase que se desea comparar k tratamientos o niveles de un factor único. La respuesta


que se observa en cada uno de los k tratamientos es una variable aleatoria. Teniendo un

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 2


Estadística II
conjunto de datos presentados bajo el esquema de la tabla 3.1., yij representa la j-ésima

observación del i-ésimo tratamiento. En general, habrá n observaciones del tratamiento i.


Describiendo las observaciones mediante un modelo estadístico lineal se tiene:

y ij = µ + τ i + ε ij ; i = 1,2,..., k y j = 1,2,..., n (3.1)

en donde yij es la (ij ) − ésima observación, µ es un parámetro común a todos los

tratamientos denominado media global o la gran media, τ i es un parámetro único para el i-

ésimo tratamiento llamado efecto del tratamiento i-ésimo y ε ij es el componente de error

aleatorio. El objetivo se concentra en probar hipótesis apropiadas con respecto a los efectos
de los tratamientos y hacer una estimación de los mismos. Para probar las hipótesis, se
supone que los errores del modelo son variables aleatorias independientes normalmente
distribuidas, con media cero y varianza σ 2 . Se supone que esta última es constante para
todos los niveles del factor.

Tabla 3.1. Datos típicos para un experimento unifactorial


____________________________________
Tratamiento

1 2 …i…k
_____________________________________
y11 y 21 ... y i1 ... y k 1
y12 y 22 ... y i 2 ... y k 2
. . . .
. . . .
. . . .
y1n y 2 n ... y in ... y kn
_____________________________________
Total T1. T2. ... Ti. ... Tk . T..
− − − − −
Media y 1. y 2. ... y i. ... y k . y ..

Este modelo se denomina análisis de varianza clasificación en un sentido o en una sola


dirección, porque sólo investiga un factor. Adicionalmente, se requiere que el experimento
se realice en orden aleatorio, de manera que el medio ambiente en el que se usan los

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 3


Estadística II
tratamientos (llamados a menudo unidades experimentales) sea lo más uniforme posible.
Por tanto, este diseño experimental es un diseño completamente aleatorizado.

El modelo estadístico presentado a través de la ecuación (3.1), describe dos situaciones con
respecto al efecto de los tratamientos. En primer lugar, los tratamientos podrían haber sido
seleccionados específicamente por el experimentador. En esta situación se desea probar
hipótesis sobre las medias de los tratamientos y las conclusiones se aplican sólo a los
niveles del factor considerados en el análisis. Las conclusiones no pueden hacerse
extensivas a tratamientos similares que no hayan sido considerados específicamente.
También sería deseable estimar los parámetros del modelo ( µ ,τ i , σ 2 ) . Este modelo se
denomina modelo de efectos fijos.

Alternativamente, los k tratamientos pueden ser una muestra aleatoria de una población
mayor de tratamientos. En esta situación, sería interesante generalizar las conclusiones
(basadas en la muestra de tratamientos) a todos los tratamientos de la población, ya sea que
hayan sido explícitamente considerados en el análisis o no. En este caso, las τ i son
variables aleatorias y resulta relativamente útil conocer sus valores particulares para los
tratamientos investigados. En su lugar, se prueban hipótesis con referencia a la variabilidad
de las τ i y se intenta dicha variabilidad. Esto se conoce como modelo de efectos

aleatorios o de componentes de varianza.

3.5. Modelo de Efectos Fijos

En este modelo los efectos de tratamiento τ i se definen usualmente como desviaciones con
respecto a la media general, por esta razón
k

∑τ
i =1
i = 0 (3.2)

Si se seleccionan muestras aleatorias de tamaño n de diferentes poblaciones asumidas


independientes y normalmente distribuidas con medias µ1 , µ 2 , µ 3 ,..., µ k y varianza común

σ 2 , es posible establecer el siguiente contraste:

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 4


Estadística II
H 0 : µ1 = µ 2 = ... = µ k
(3.3)
H 1 : µ i ≠ µ j para al menos un par (i, j )

si no se rechaza la hipótesis nula, todos los tratamientos tienen la media común µ . Una
forma equivalente de expresar las hipótesis anteriores en términos de los efectos del
tratamiento es la siguiente:

H 0 : τ 1 = τ 2 = ... = τ k = 0 (3.4)

H 1 : τ i ≠ 0 para al menos un i

Fórmulas para calcular la suma de cuadrados, muestras de igual tamaño:

k n
T 2 ..
SCT = ∑∑ y ij2 − (3.5)
i =1 j =1 nk
k

∑T
i =1
2
i.
T 2 ..
SCTR = − (3.6)
n nk
SCE = SCT − SCTR (3.7)

Tabla 3.2. ANOVA para el modelo de efectos fijos unifactorial

Fuente de Suma de Grados de Cuadrado medio F calculado


variación cuadrados libertad
Tratamiento SCTR k-1 SCTR CMTR
CMTR = Fc =
Error k −1 CME

SCE k(n-1) SCE


CME =
k (n − 1)

Total SCT nk-1

Respecto al contraste, se rechaza la hipótesis nula H 0 si y solamente si Fc > Fk −1,k ( n −1);α .

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 5


Estadística II
Fórmulas para calcular la suma de cuadrados; muestras de diferentes tamaños:

k ni
T 2 ..
SCT = ∑∑ y ij2 − (3.8)
i =1 j =1 N
k

∑T i =1
2
i.
T 2 ..
SCTR = − (3.9)
ni N
SCE = SCT − SCTR (3.10)

k
con N = ∑ ni . Los grados de libertad para SCTR siguen siendo k-1; mientras que para
i =1

SCE es N-k y para SCT es N-1. Se rechaza la H 0 si y solo si Fc > Fk −1, N − k ;α .

Ejemplo 3.1. Supóngase que, en un experimento industrial, un ingeniero se encuentra


interesado en averiguar cómo varía la absorción media de humedad del concreto en cinco
diferentes agregados de concreto. Las muestras se expusieron a la humedad por 48 horas.
Se decidió probar seis muestras para cada agregado, requiriéndose probar un total de 30
muestras. Los datos se muestran a continuación:

Tabla 3.3. Absorción de la humedad en los agregados del concreto

Agregado (peso %)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Total 3.320 3.416 3.663 2.791 3.664 16.854
Media 553,33 569,33 610,50 465,17 610,67 561,80

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 6


Estadística II
Realizar un contraste de hipótesis para testificar la igualdad promedio de absorción de los
agregados de concreto. Use un nivel de confianza del 95%.

1. En primer lugar, se formulan las siguientes hipótesis:

H 0 : µ1 = µ 2 = µ 3 = µ 4 = µ 5
H 1 : Al menos dos de las medias son diferentes.

2. Debe fijarse el nivel de significación, para este caso α = 0,05 .

3. Se halla la región crítica o región de rechazo. En el ejercicio se tiene que


Ft = F4, 25;0, 05 = 2,76.

4. Realizar los cálculos respectivos para posteriormente, construir la tabla de ANOVA:

16.854 2
SCT = 5512 + 457 2 + ... + 679 2 − = 9.677.954 − 9.468.577 = 209.377
30
3.320 2 + 3.416 2 + ... + 3.664 2
SCTR = − 9.468.577 = 85.356
6
SCE = 209.377 − 85.356 = 124.021

Tabla 3.4. ANOVA para los datos de la tabla 3.3

Fuente de Suma de Grados de Cuadrado F calculado


variación cuadrados libertad medio
Agregados 85.356 4 21.339 4,30
Error 124.021 25 4.961

Total 209.377 29

5. Finalmente, debe realizarse la comparación respectiva y por ende concluir en función de


la hipótesis nula. Dado que se cumple la relación Fc > Ft (4,30>2,76) se rechaza la

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 7


Estadística II
hipótesis nula H 0 ; por lo que se puede decir que con un nivel de confianza del 95% (o
significación del 5%) hay evidencias suficientes de que los compuestos no tienen el mismo
nivel promedio de absorción.

Ejemplo 3.2. Parte del estudio “Serum Inorganic Phosporus Levels in Children with
Seizure Disorders Taking Anticonvulsant Drugs”, llevado a cabo en Virginia Polytechnic
Institute and State University en 1982, fue diseñado para medir los niveles de actividad de
la fosfatasa alcalina de suero (Unidades Bessey-Lowry) en niños con problemas de
crecimiento que recibieron terapia anticonvulsiva bajo el cuidado de un especialista
privado. Se encontraron 45 personas para el estudio y se clasificaron en cuatro grupos
según su medicamento:

G-1: control (sin recibir anticonvulsivos y sin tener un historial de problemas de


crecimiento),
G-2: fenorbital,
G-3: carbamazepina,
G-4: otros anticonvulsivos.

De las muestras de sangre extraídas a cada sujeto, se determinó y registró el nivel de


actividad de la fosfatasa alcalina de suero, los resultados registrados fueron los siguientes:

Tabla 3.5. Nivel de actividad de la fosfatasa alcalina del suero


Grupo de medicamentos
G-1 G-2 G-3 G-4
49, 20 97,50 97,07 62,10 110,60
44,54 105,00 73,40 94,95 57,10
45,80 58,05 68,50 142,50 117,60
95,84 86,60 91,85 53,00 77,71
30,10 58,35 106,60 175,00 150,00
36,50 72,80 0,57 79,50 82,90
82,30 116,70 0,79 29,50 111,50
87,85 45,15 0,77 78,40
105,00 70,35 0,81 127,50
95,22 77,40

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 8


Estadística II
Pruebe la hipótesis con un nivel de significación de 0,05, de que el nivel promedio de la
actividad de la fosfatasa alcalina del suero es el mismo para los cuatro grupos.

1. Planteamiento de hipótesis:
H 0 : µ1 = µ 2 = µ 3 = µ 4
H 1 : Al menos dos de las medias son diferentes.

2. Fijación del nivel de significación: α = 0,05.


3. Establecimiento de la región crítica o región de rechazo: Ft = F3, 41;0,05 = 2,836.

4: Cálculos: T1. = 1.460,25; T2. = 440,36; T3. = 842,45; T4. = 707,41; T.. = 3.450,47

3.450,47 2
SCT = 49,20 2 + 44,54 2 + ... + 111.50 2 −
45
= 331.886,9701-264.572,0716 = 67.314,8985
1.460,25 2 440,36 2 842,45 2 707,412 3.450,47 2
SCTR = + + + −
20 9 9 7 45
= 278.510,6729 − 264.572,0716 = 13.938,6013
SCE = 67.314,8985 − 13.938,6013 = 53.376,2972

Tabla 3.6. ANOVA para los datos de la tabla 3.5

Fuente de Suma de Grados de Cuadrado F calculado


variación cuadrados libertad medio
Grupo de
medicamentos 13.938,6013 3 4.646,2004 3,57
Error 53.376,2972 41 1.301,8609
Total 67.314,8985 44

5. Decisión y conclusión: como se cumple que Fc > Ft se rechaza la H 0 . Con un nivel de


confianza del 95%, se tiene que los niveles promedio de actividad de la fosfatasa alcalina
del suero para los cuatro grupos no son todos iguales.

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 9


Estadística II
3.6. Modelo de Efectos Aleatorios

Frecuentemente al experimentador le interesa un factor que tiene un gran número de


posibles niveles. Se dice que el factor es aleatorio si el experimentador selecciona
aleatoriamente k de estos niveles de la población de niveles del factor. En este sentido, se
obtienen conclusiones de toda la población de niveles del factor porque los niveles usados
en el experimento fueron seleccionados al azar. Se supone que la población de niveles del
factor es infinita o lo suficientemente grande para ser considerada infinita. Los casos en que
la población de niveles del factor es suficientemente pequeña, para emplear un enfoque de
población finita no se encuentran muy seguido.

En el caso del modelo de efectos aleatorios τ i es una variable aleatoria con varianza σ τ2 y

es independiente de ε ij . La varianza de cualquier observación es

V ( y ij ) = σ τ2 + σ 2 (3.11)

Las varianzas σ τ2 y σ 2 se conocen como componentes de varianza y el modelo presentado


en (3.1) se denomina modelo de componentes de varianza o de efectos aleatorios. Para
probar las hipótesis se requiere que los ε ij sean NID(0, σ 2 ) , que los τ i sean NID(0, σ τ2 ) y

que τ i y ε ij sean independientes.

Al igual que en el modelo de efectos fijos, la variabilidad total en las observaciones se


descompone en un componente que mide la variación entre los tratamientos (SCTR) y otra
que mide la variación dentro de los tratamientos (SCE). En este caso, carece de sentido
probar hipótesis que se refieren a los efectos de tratamiento individuales y en su lugar
deben probarse las hipótesis:

H 0 : σ τ2 = 0
(3.12)
H 1 : σ τ2 > 0

Todos los tratamientos son idénticos si σ τ2 = 0 ; por otra parte, si σ τ2 > 0 existe
variabilidad entre los tratamientos. El procedimiento de análisis de varianza para el modelo

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 10


Estadística II
de efectos aleatorios es idéntico al de efectos fijos. Sin embargo, las conclusiones son un
tanto diferentes ya que se aplican a toda la población de tratamientos. En el modelo de
efectos aleatorios, los componentes de varianza son

∧ 2
σ = CME (3.13)

y
∧ 2 CMTR − CME
στ = (3.14)
n

Para tamaños de muestra desiguales, n se debe reemplazar por

 k

1  k ∑ ni2 
n0 = ∑ ni − i =k1  (3.15)
k − 1  i =1
 ∑ ni 
i =1 

Ejemplo 3.3. Una compañía textil utiliza un gran número de telares. Se desea que los
telares sean homogéneos con el objeto de producir tela de resistencia uniforme. El
ingeniero de procesos supone que, aparte de la variación usual en la resistencia de tela en
muestras del mismo telar, puede existir una variación significativa de la resistencia entre los
distintos telares. Para investigar esto, selecciona cuatro telares al azar y realiza cuatro
determinaciones de la resistencia de la tela manufacturada por cada uno. Este experimento
es realizado en orden aleatorio y los datos se muestran a continuación:

Tabla 3.7. Datos de resistencia de los telares


Observaciones
Telares 1 2 3 4 Totales
1 98 97 99 96 390
2 91 90 93 92 366
3 96 95 97 95 383
4 95 96 99 98 388

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 11


Estadística II
Para los datos en cuestión, se lleva a cabo un análisis de varianza similar al presentado en el
ejemplo 3.2.

Tabla 3.8. ANOVA para los datos de la tabla 3.7

Fuente de Suma de Grados de Cuadrado F calculado


variación cuadrados libertad medio

Telares 89,19 3 29,73 15,68


Error 22,75 12 1,90
Total 111,94 15

De este análisis se concluye que existen diferencias significativas entre los telares de la
∧ 2
planta. Las estimaciones para los componentes de varianza son σ = 1,90 y

∧ 2 29,73 − 1,90
στ = = 6,96
4

Por tanto, la estimación de la varianza de cualquier observación de la muestra es:


∧ 2 ∧ 2
σ + σ τ = 1,90 + 6,96 = 8,86

Así, los resultados indican que la mayor variabilidad se atribuye a diferencias entre los
telares. Este ejemplo ilustra un uso importante de los componentes de varianza, a saber, al
aislar las diferentes fuentes de variabilidad que afectan a un producto o sistema. El
problema de la variabilidad de un producto surge, frecuentemente, en el aseguramiento de
la calidad, siendo frecuentemente difícil aislar las fuentes que producen la variabilidad. El
ingeniero debería intentar aislar las causas específicas de la diferencia de desempeño de los
telares. Si puede identificar y aislar estas fuentes de variabilidad, la varianza de la
producción del proceso puede ser reducida considerablemente y hacer que el proceso sea
más homogéneo en términos del desempeño de los telares.

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 12


Estadística II
3.7. Análisis de Varianza en la Regresión Lineal Simple

Existe una forma equivalente de probar la hipótesis de no existencia de una relación lineal
entre X e Y ( H 0 : β 1 = 0) utilizando el método del ANOVA. En estos términos, es
importante recordar la siguiente descomposición:

SCT = SCR + SCE, (3.16)

donde:

_ _ 2
SCT = ∑ (Yi − Y ) 2 = ∑ Yi 2 − n Y (3.17)

∧ _ ∧ 2 _ 2
SCR = ∑ (Y i − Y) 2 = β 1 (∑ X i2 − n X ) (3.18)

SCE = ∑ (Yi − Y i ) 2 = SCT - SCR (3.19)

Tabla 3.9. ANOVA en Regresión Lineal Simple

Fuente de Suma de Grados de Cuadrado F calculado


variación cuadrados libertad medio
Regresión SCTR 1 SCTR CMTR
CMTR = Fc =
1 CME

Error SCE n-2 SCE


CME =
(n − 2)

Total SCT n-1

En el caso que el contraste sea por la derecha ( H 1 : β1 > 0) se rechaza la hipótesis nula si
y solo si Fc > F1,n −2;α . Si es por la izquierda ( H 1 : β1 < 0) se rechaza la H 0 si

Fc < 1 / Fn− 2,1;α .

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 13


Estadística II
Ejemplo 3.4. Retomando el ejemplo 2.1 del tema anterior se tiene:

1. H 0 : β1 = 0

H 1 : β1 >0.

2. α = 0,05 .

3. Ft = F1,5;0, 01 = 6.61 .

4. SCT = 710; SCR = 474,4480; SCE = 235,5520.

Tabla 3.10. ANOVA para los datos del ejemplo 2.1

Fuente de Suma de Grados de Cuadrado F calculado


variación cuadrados libertad medio
Regresión 474,4480 1 474,4480 10,07

Error 235,5520 5 47,1104

Total 710 6

5. Como Fc > Ft se rechaza la hipótesis nula. A un nivel de significación del 5% se puede


concluir que los datos presentan evidencias suficientes que existe una relación lineal directa
entre las variables producción mensual de artículos y maquinaria utilizada en los procesos
industriales.

3.8. Experimentos factoriales

Considere una situación en la cual es de interés estudiar el efecto de dos factores, A y B,


sobre alguna respuesta. Por ejemplo, en un experimento químico podría desearse variar de
manera simultánea la presión y el tiempo de la reacción y estudiar el efecto de cada uno
sobre el comportamiento del experimento. En un experimento biológico, es de interés

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 14


Estadística II
estudiar el efecto del tiempo de secado y de la temperatura de la cantidad de sólidos
(porcentaje por unidad) remanente en muestras de fermentadores. El término factor es
utilizado en sentido general para denotar cualquier característica del experimento, como la
temperatura, el tiempo o la presión, que pueden variarse de ensayo a ensayo. Se definen los
niveles de un factor como los valores reales utilizados en el experimento. Así, en cada uno
de estos casos, resulta de suma importancia, no sólo determinar si los dos factores tienen
una influencia sobre la respuesta, adicionalmente, es de interés determinar si hay una
interacción significativa entre los dos factores.

3.9. Interacción en los experimentos de dos factores

Desde el punto de vista de un experimentador, podría parecer necesario llegar a una prueba
de significancia acerca de interacción separando la variación del error verdadero de la
variación debida a la interacción. Los efectos de los factores A y B, a menudo denominados
efectos principales, adquieren diferentes significados en presencia de la interacción. Si ésta
última no es significativa, entonces los resultados de las pruebas acerca de los efectos
principales tienen sentido; sin embargo, si la interacción es significativa entonces sólo
aquellas pruebas acerca de los efectos principales que resulten ser significativas tienen
sentido. Efectos principales no significativos en presencia de la interacción podrían muy
bien ser un resultado del encubrimiento y plantear la necesidad de observar la influencia de
cada factor para niveles fijos del otro. Ampliando la expresión (3.1) se tiene:

yij = µ + α i + β j + (αβ ) ij + ε ij (3.20)

En este caso, se considera el caso de n réplicas de las combinaciones de tratamientos


determinadas por a niveles del factor A y b niveles del factor B. Cada combinación de
tratamientos define una celda en el arreglo matricial conformado por ambos factores. Cada
combinación de tratamientos define una celda en el arreglo. De esta forma, se tienen ab
celdas, conteniendo cada celda n observaciones. Así, yijk representa la k-ésima observación

tomada para el i-ésimo nivel del factor A y para el j-ésimo nivel del factor B de las abn
observaciones.

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 15


Estadística II
Las observaciones en la (ij)-ésima celda constituyen una muestra aleatoria de tamaño n de
una población que se asume está distribuida en forma normal con media µ ij y varianza σ 2 .

Los siguientes símbolos son importantes para la comprensión de este apartado:

Tij . = suma de las observaciones en la (ij)-ésima celda

Ti.. = suma de las observaciones para el i-ésimo nivel del factor A

T. j. = suma de las observaciones para el j-ésimo nivel del factor B

T... = suma de todas las observaciones abn.


Cada observación puede ser escrita de la forma:

y ijk = µ ij + ε ijk , (3.21)

donde ε ijk mide las desviaciones de los valores observados yijk en la (ij)-ésima celda de la

media poblacional µ ij . Si (αβ ) ij denota el efecto de interacción del i -ésimo nivel del

factor A y el j-ésimo nivel del factor B, α i el efecto del i-ésimo nivel del factor A y el j-
ésimo nivel del factor B; y µ la media total, se puede escribir:

µ ij = µ + α i + β j + (αβ ) ij , (3.22)

y entonces

yijk = µ + α i + β j + (αβ ) ij + ε ijk , (3.23)

a b b
sobre lo cual se imponen las restricciones (i) ∑α
i =1
i = 0, (ii) ∑β
j =1
j = 0 , (iii) ∑ (αβ )
j =1
ij =0 y

b
(iv) ∑ (αβ )
j =1
ij =0.

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 16


Estadística II
Las tres hipótesis a ser probadas son las siguientes:

H 0 : α 1 = α 2 = ... = α a = 0, (3.24)

H 1 : Al menos una de las α i' s no es igual a cero.

H 0 : β 1 = β 2 = ... = β b = 0, (3.25)

H 1 : Al menos una de las β 'j s no es igual a cero.

H 0 : (αβ )11 = (αβ )12 = ... = (αβ ) ab = 0, (3.26)

H 1 : Al menos una de las (αβ ) ij' s no es igual a cero.

Cada una de estas pruebas se encuentra basada en una comparación de estimaciones


independientes de σ 2 suministrada por la división de la suma total de cuadrados de los
datos en cuatro componentes. Las fórmulas de cálculo son:

a b n
T...2
SCT = ∑∑∑ y ijk
2
− (3.27)
i =1 j =1 k =1 abn
a

∑T T...2
i =1
2
i ..
SCA = − (3.28)
bn abn
b

∑T
j =1
2
. j.
T...2
SCB = − (3.29)
an abn
a b a b

∑∑ T
i =1 j =1
2
ij . ∑ Ti..2 ∑T
j =1
2
. j.
T 2 ...
i =1
SC ( AB ) = − − + (3.30)
n bn an abn

SCE = SCT − SCA − SCB − SC ( AB ) (3.31)

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 17


Estadística II
Tabla 3.11. ANOVA para el experimento de dos factores con n réplicas

Fuente de Suma de Grados de Cuadrado medio F calculado


variación cuadrados libertad
Efecto SCA CMA
CMA = Fc =
principal SCA a-1 a −1 CME

A SCB b-1 SCB CMB


CMB = Fc =
b −1 CME
B
SC ( AB) CM ( AB )
Interacción de CM ( AB) = Fc =
(a − 1)(b − 1) CME
dos factores SC(AB) (a-1)(b-1)
AB
SCE
Error SCE ab(n-1) CME =
ab(n − 1)
Total SCT abn-1

En el primer contraste, se rechaza la H 0 si y solo si Fc > Fa −1,ab ( n −1);α . Para el segundo se

rechaza la hipótesis nula si Fc > Fb−1, ab ( n −1);α ; mientras que en el último se rechaza si y solo

si Fc > F( a −1)( b−1),ab ( n −1);α . Es conveniente realizar el test para la interacción antes de intentar

obtener inferencias acerca de los efectos principales. Si la interacción no es significativa, el


experimentador puede proceder a probar los efectos principales. Sin embargo, una
interacción significativa podría implicar que los datos deben ser analizados de algún modo
diferente, como observando el efecto del factor A a niveles fijos del factor B; por ejemplo.

Ejemplo 3.5. En un experimento realizado para determinar cuál de tres diferentes sistemas
de misiles es preferible, se midió el promedio de combustión del impulsor para 24
encendidos estáticos. Fueron utilizados cuatro diferentes tipos de impulsor. El experimento
produjo observaciones duplicadas de los promedios de ignición a cada combinación de los
tratamientos. Los datos se muestran tal y como sigue:

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 18


Estadística II
Tabla 3.12. Promedios de combustión del impulsor

Sistema de Tipo de impulsor


misiles b1 b2 b3 b4

a1 34,0 30,1 29,8 29,0


32,7 32,8 26,7 28,9
a2 32,0 30,2 28,7 27,6
33,2 29,8 28,1 27,8
a3 28,4 27,3 29,7 28,8
29,3 28,9 27,3 29,1

Utilice un nivel de significación del 5% para probar las siguientes hipótesis: a) H 0 : No


hay diferencia en la media de los promedios de combustión del impulsor cuando se utilizan
diferentes sistemas de misiles. b) H 0 : No hay diferencia en la media de los promedios de

combustión del impulsor para los cuatro tipos de impulsor y c) H 0 : No hay interacción
entre los diferentes sistemas de misiles y los diferentes tipos de impulsor.
1. a) H 0 : α 1 = α 2 = α 3 = 0,

H 1 : Al menos una de las α i' s no es igual a cero

b) H 0 : β 1 = β 2 = β 3 = β 4 = 0,

H 1 : Al menos una de las β 'j s no es igual a cero.

c) H 0 : (αβ )11 = (αβ )12 = ... = (αβ ) 34 = 0,

H 1 : Al menos una de las (αβ ) ij' s no es igual a cero.

2. α = 0,05.

3. Regiones críticas: Ft = F2,12;0, 05 = 3,89. Ft = F3,12;0, 05 = 3,49. Ft = F6,12;0, 05 = 3,00.

4. De la tabla 3.12, en primer lugar se construye la de totales:

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 19


Estadística II
b1 b2 b3 b4 Total

a1 66,7 62,9 56,5 57,9 244,0

a2 65,2 60,0 56,8 55,4 237,4


57,7 56,2 57,0 57,9 228,8
a3

Total 189,6 179,1 170,3 171,2 710,2

Posteriormente se realizan los cálculos:

710,2 2
SCT = 34,0 2 + 32,7 2 + ... + 29,12 − = 21.107,68 − 21.016,00 = 91,68
24
244,0 2 + 237,4 2 + 228,8 2 710,2 2
SCA = − = 21.030,52 − 21.016,00 = 14,52
8 24
189,6 2 + 179,12 + 170,3 2 + 171,2 2 710,2 2
SCB = − = 21.056,08 − 21.016,00 = 40,08
6 24
66,7 2 + 65,2 2 + ... + 57,9 2
SC ( AB) = − 21.030,52 − 21.056,08 + 21.016,00 = 22,17
2
SCE = 91,68 − 14,52 − 40,08 − 22,17 = 14,91.

Tabla 3.13. ANOVA para los datos de la tabla 3.12

Fuente de Suma de Grados de Cuadrado F calculado


variación cuadrados libertad medio
Sistema de misiles 14,52 2 7,26 5,85
Tipo de impulsor 40,08 3 13,36 10,77
Interacción 22,17 6 3,70 2,98
Error 14,91 12 1,24
Total

5. Para el tercer contraste, se tiene que Fc < Ft por lo que no se rechaza la hipótesis nula de
no interacción entre los diferentes sistemas de misiles y los diferentes tipos de impulsor a
un nivel de confianza del 95%. Ya que no hay interacción significativa, las pruebas de los

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 20


Estadística II
sistemas de misiles y de los tipos de impulsor tienen sentido. Para ambas, se rechaza la H 0
y con un nivel de significación del 5% por un lado se tiene que: a) diferentes sistemas de
misiles proporcionan como resultado diferentes medias de los promedios de combustión de
los impulsores y b) las medias de los promedios de combustión de los impulsores no son las
mismas para los cuatro tipos de impulsores.

3.10. Diseños factoriales 2k

Los diseños factoriales son ampliamente utilizados en experimentos en los que intervienen
varios factores para estudiar el efecto conjunto de éstos sobre una respuesta. Existen varios
casos especiales del diseño factorial general que resultan importantes porque se usan
ampliamente en el campo de investigación, y porque constituyen la base para otros diseños
de gran valor práctico. El más importante de estos casos especiales ocurre cuando se tienen
k factores, cada uno con dos niveles. Estos niveles pueden ser cuantitativos como en el caso
de dos valores de temperatura, presión o tiempo. También pueden ser cualitativos como
sería el caso de dos máquinas, dos operadores, los niveles “superior” e “inferior” de un
factor o, quizás la ausencia o presencia de un factor. Una réplica completa de tal diseño
requiere que se recopilen 2 × 2 × 2 × ...2 = 2 k observaciones y se conoce como diseño
factorial 2 k .
Este diseño es particularmente útil en las primeras fases del trabajo experimental, cuando es
probable que haya muchos factores por investigar. Conlleva el menor número de corridas
con los cuales pueden estudiarse k factores en un diseño factorial completo. Debido a que
sólo hay dos niveles para cada factor, debe suponerse que la respuesta es aproximadamente
lineal en el intervalo de los niveles elegidos de los factores.

3.11. El diseño factorial 22

El primero diseño de la serie 2 k es aquel que tiene sólo dos factores, llamados A y B, cada
uno con dos niveles. Este diseño se conoce como diseño factorial 2 2 . Arbitrariamente, los
niveles del factor pueden llamarse “inferior” y “superior” o “bajo y alto”. Para las n
observaciones experimentales por cada combinación de tratamientos, se designan los
niveles superiores de los factores A, B, C… por las letras a, b, c,… y los niveles inferiores

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 21


Estadística II
de cada factor con la notación (1). En un diseño de este tipo, se pueden interpretar entonces
los símbolos (1), a, b, y ab como los resultados totales para cada una de las combinaciones
de tratamientos. La tabla presentada a continuación, proporciona una tabla con dos
direcciones acerca de estos comportamientos totales:

Tabla 3.14. Experimentos factoriales

B Media
(1) (b) b + (1)
A 2n

a ab ab + a
2n
Media a + (1) ab + b
2n 2n

Las fórmulas de las sumas de cuadrados son las siguientes:

[ab + a - b - (1)]2
SCA = (3.32)
n.4

[ab + b - a - (1)] 2
SCB = (3.33)
n.4

[ab + (1) - a - b] 2
SCAB = (3.34)
n.4

2 2 n
Y...2
SCT = ∑∑∑ y ijk2 − (3.35)
i =1 j =1 k =1 4n

SCE = SCT − SCA − SCB − SCAB (3.36)

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 22


Estadística II
Tabla 3.15. ANOVA para el diseño 22

Fuente de Suma de Grados de Cuadrado medio F calculado


variación cuadrados libertad
A SCA 1 SCA CMA
CMA = Fc =
1 CME

B SCB 1 SCB CMB


CMB = Fc =
1 CME
SCAB CMAB
AB SCAB 1 CMAB = Fc =
1 CME
SCE
Error SCE 4(n-1) CME =
4(n − 1)

Total SCT 4n-1

Ejemplo 3.6. Supóngase que una investigación llevada a cabo para estudiar el efecto que
tienen la concentración de un reactivo y la presencia de un catalizador sobre el tiempo de
reacción de un proceso químico. Sea la concentración del reactivo el factor A con dos
niveles de interés, 15% y 20%. El catalizador constituye el factor B; el nivel alto (o
superior) denota el uso de dos sacos de catalizador y el nivel bajo (o inferior) denota el uso
de sólo un saco. El experimento se realiza (“replica” o “repite” tres veces y los datos son
como sigue:

Tabla 3.16. Datos para la concentración del reactivo y uso del catalizador

Réplica
Combinación de tratamientos I II III Total
A baja, B baja 28 25 27 80
A alta, B baja 36 32 32 100
A baja, B alta 18 19 23 60
A baja, B alta 31 30 29 90

Los cálculos se presentan a continuación:

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 23


Estadística II
(50) 2 (−30) 2
SCA = = 208,33 SCB = = 75,00
4(3) 4(3)

(10) 2 (10) 2
SCAB = = 8,33 SCAB = = 8,33
4(3) 4(3)
SCT = 9.398,0 − 9.075,00 = 323,00 SCE = 323,00 − 208,33 − 75,00 − 8,33 = 31,34

Tabla 3.17. ANOVA para los datos de la tabla 3.16

Fuente de Suma de Grados de Cuadrado F calculado


variación cuadrados libertad medio
Concentración del 208,33 1 208,33 53,15
reactivo
Uso del catalizador 75,00 1 75,00 19,13
Interacción 8,33 1 8,33 2,13
Error 31,34 8 3,92

Total 323,00 11

A un nivel de significación del 5% Ft = F1,8;0, 05 = 5,32 ; por lo que ambos efectos

principales son significativos; mas no el de interacción.

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 24


Estadística II

También podría gustarte