De - Diseños Factoriales
De - Diseños Factoriales
De - Diseños Factoriales
OPTIMIZACIÓN DE SISTEMAS
CON MÚLTIPLES RESPUESTAS
Parte 2: Selección de factores
Héctor Goicoechea
E-mail: [email protected]
http://www.fbcb.unl.edu.ar/laboratorios/ladaq/
Identificación de factores y
respuestas
Selección de factores
Diseños de Screening
o Cribado
Factores No Eliminar
Cambio de
significativos? niveles factor
Si
Muchas pruebas
experimentales
Mucho tiempo
Mucho dinero
Ortogonalidad
Rotabilidad
Error estandar-leverage
Eficiencia
Resolución
ORTOGONALIDAD
b = (XTX)-1XT y b = [b0 ; b1 ; b2 ]
• La varianza de la respuesta
estimada en un punto se
obtiene multiplicando el
leverage por la varianza
experimental.
EFICIENCIA
Hay confusión
15
Etapa de screening: Selección de factores
Diseños más usados para realizar experimentos de
previsualización o screening para factores numéricos
y categóricos
Representación geométrica
Diseños factoriales completos a dos niveles
Efecto de un factor
Diseños factoriales completos a dos niveles
Efecto de la interacción
Problema:
se necesita incrementar la eficiencia de un procedimiento de
extracción de cromo (VI) en muestras de agua de rio utilizando la
metodología de microextracción en fase líquida
A microextraction procedure based on an ionic liquid as an ion-pairing agent optimized using a design of experiments for chromium
species separation and determination in water samples. Anal. Methods, 2013, 5, 5065. P Berton, L Vera Candioti, H Goicoechea, R
Wuilloud
Considerando un diseño 27 con 128 experimentos:
Se pueden
estimar 127
efectos
“Aliasing”
“Aliasing”
Diseño 24-1
Diseños factoriales fraccionados
Diseño 25-2
Diseños factoriales fraccionados
Resolución V o mayor
Los efectos principales y las interacciones dobles se
confunden con interacciones triples o de orden
mayor.
Resolución IV
Los efectos principales no se confunden entre ellos
ni con interacciones dobles, pero si estas entre si.
Resolución III
Los efectos principales no se confunden entre ellos
pero hay efectos principales que se confunden con
interacciones dobles. 37
Diseños factoriales fraccionados
…
Estimación de efectos
Estimación de efectos: construcción de un
modelo matemático que explique la variación
PRUEBA DE HIPÓTESIS
(ANOVA)
Modelo de efectos: ANOVA
Variabilidad
debida al
Variabilidad Variabilidad
Variabilidad error
debida al debida al
efecto error debida al fecto
El objetivo es:
54
Ejemplo: uso de un diseño completo y réplica
En una fábrica de dispositivos electrónicos hay roturas y
se piensa que hay tres factores (temperaturas de la etapa
de procesamiento) responsables del problema.
+1
Factor 2
-1
-1 Factor 1 +1
Forma de operar:
1- Hacer un ANOVA con todos los efectos.
57
A continuación se proveerá
información sobre los modelos
matemáticos y el ajuste, que
servirá tanto para esta etapa de
selección de factores, como para
la etapa posterior de
optimización con la RSM
58
Construcción del Modelo
REGRESIÓN LINEAL MULTIPLE
Ecuación de regresión
error
1
Respuesta i Efectoi
(variable dependiente) 2
coeficientes de regresión
factores
(variables independientes)
Polinomios simples
• Seleccionar factores significativos
• Explorar el comportamiento de la
Modelos con
respuesta en un entorno experimental Interacciones
acotado
Modelos Cuadráticos
• Describir lo más exactamente posible el
comportamiento de la respuesta
Modelos Cúbicos
• Encontrar un óptimo para la respuesta
Polinomios complejos
CONSTRUCCIÓN DE UN MODELO
Construcción del Modelo
¿Cómo obtenemos el mejor modelo a partir de los datos experimentales
recolectados con un diseño de experimentos?
1- Ajustar los distintos tipos de modelos posibles a los datos
Lineal
Lineal con Interacción
Cuadrático
2
s1
Fc 2
s2 Siendo s1 > s2
F( n1 1),( n2 1),
3.072
Cuando hay muchos términos en el modelo, se
prefiere R2aj sobre R2 (para no incrementar en
forma artificial con cada término que se agrega).
R2aj baja con cada término artificial que se agrega.
Se cumple: 0≤ R2aj ≤ R2 ≤ 1
Verificación de los
supuestos del ANOVA
Conclusiones
69
Verificación de los
supuestos del
ANOVA
Evaluación de
modelos
70
71
Evaluación de los Modelos
RESIDUO
eij yij yˆ ij
Diferencia entre
la respuesta
observada y la
predicha por el
modelo
Normalidad de los residuos
Gráfico de probabilidad normal
Si los residuos se
distribuyen
aleatoriamente, se
Residuo
considera que el
supuesto de
homocedasticidad está
satisfecho.
Valor predicho
Independencia de los residuos
Si los residuos se
distribuyen
Residuo
aleatoriamente, se
considera que el
supuesto de
independencia está
satisfecho.
Escalado de residuos
Residuo estandarizado
eij
d ij
σˆ
σˆ MC E
Residuo estudentizado
Medida de la
localización del
eij
rij punto en el espacio
experimental
σˆ (1 hij )
0 hij 1
escalados
L
Reiduo Estudentizado
Posibles causas de puntos atípicos
Errores experimentales.
Errores de transcripción.
Ubicación en una región del espacio experimental
en la que el modelo, que aparentemente estaba bien
ajustado, no esta haciendo una buena predicción de la
respuesta.
Escalado
Escaladodede
residuos
residuos
Gráficas de residuos estudentizados – Aplicación de pruebas
GRAFICAS DE estadísticas
RESIDUO ESTUDENTIZADOS
Capacidad predictiva del modelo
Aproximación a la función real
Gráfica que muestra la bondad de ajuste: cuanto más se
aproximen los datos a la diagonal, mejor es el modelo
No normales
Heterocedásticos
Correlaciondados
Transformar la respuesta
Transformación de la respuesta
y´ y
Parámetro de
transformación
yk 0
Valores de - 3 a +3
Si el intervalo calculado
incluye al 1
no es necesario
transformar los datos.
Transformaciones más frecuentes
Transformación de la respuesta
Primer ajuste de un modelo para estudiar el comportamiento de una
respuesta en función de tres factores
Transformación de la respuesta
Mala predicción.
El modelo no es capaz de predecir bien los datos
No hay un buen ajuste.
Transformación de la respuesta
El intervalo de confianza
no incluye al uno
Se sugiere transformación logarítmica
(esto lo determina el programa usado)
Transformación de la respuesta
Ajuste con los datos transformados y´ ln y
eij eij
rij tij
σˆ (1 hij ) σˆ (ij ) (1 hij )
Estimada
Estimada como
internamente como
CME al ajustar el modelo
CME obtenido al ajustar
cuando se quita el dato yij
el modelo con TODOS
los datos
Puntos atípicos e influyentes
Residuo estudentizado externamente OUTLIERT
LEVERAGE
hii yˆ Hy
Elemento de la diagonal
Matriz que determina la varianza y
de la matriz H
covarianza de la respuesta predicha
y de los residuos
Leverage
promedio
Puntos influyentes
LEVERAGE
Depende de la matriz
experimental y del modelo que se
quiere ajustar.
Significancia de la Regresión
Ajustar el Modelo
Falta de Ajuste
Modelo Definitivo
¡Importante!
105
Evaluación de los efectos
Efectos que claramente afectan la respuesta
EFECTOS Efectos que claramente no afectan la respuesta
Opciones gráficas
Se decide cuáles de los efectos principales, interacciones
dobles y triples se pueden enviar al error. La SCerror
contendrá los efectos “excluidos”.
Gráfica de Pareto
Gráfica de Probabilidad Normal (Daniel)
Gráfica de Probabilidad Media Normal (Daniel)
108
Opciones gráficas
Diagrama de Pareto
Naranja: positivos
Azules: negativos
Opciones gráficas
GRÁFICA
DE
DANIEL
GRÁFICA DE
DANIEL
Opciones gráficas
Test de Shapiro Wilk
Opciones gráficas
Gráfico Semi-Normal
Papel 99
probabílístico
% Probabilidad semi-normal
medio normal 97
95
A
90
85
80
B
70
60 Efectos significativos
D
40
20
0 C
|Efecto|
Se debe
analizar si
la
interacción
AD es
factible o
si es
alguno de
los alias
128
Problema
131
132
133
Eliminando aquellos factores e interacciones con p>0.05:
135
136
Detección de un punto influyente…
139
ETAPA-SCREENING Resumen
ANOVA
Es el mejor ANOVA-modelo final donde sólo se incluyen términos
significativos, o ¿hay que seguir excluyendo efectos?
Los grados de libertad del error deben ser al menos 8 para tener un ANOVA
confiable.
Indicadores del ajuste (R cuadrado ajustado).
Conclusiones
Para que es necesario conocer el modelo de regresión?
Puntos al centro
Tratamiento formado por la combinación del nivel
intermedio o medio de todos los factores del diseño
Puntos al centro
144
145