0% encontró este documento útil (0 votos)
136 vistas59 páginas

Experimentos de Un Factor General

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 59

Experimentos de un factor

general
Ing. Brayan López Fallas
Investigaciones con experimentos factoriales:
Panorama

Entrada controlable Salidas

Factores Procesos
A un proceso le afectan o
“entran” factores controlables o
no controlables y del proceso
Entrada no controlable se produce una “salida”
El caso de los experimentos de un solo factor

1 Factor de
entrada
(controlable)
Salidas
Varios niveles Procesos
(más de dos)
En los experimentos de un solo
factor se considera que solo un
factor es el que afecta o “entra”
al proceso… Se puede decir
que apela a la ley de Pareto
Técnicas de Análisis Estadístico para los datos
del Experimento
ANOVA
• Procedimiento para realizar una prueba de
medias poblacionales cuando hay más de dos
medias de interés (k>2 muestras)
Analiza la variación total divida en componentes
significativos
Técnica Del Análisis De Varianza
• Se habla de un factor cuando solo hay una variable de
interés para el análisis (al factor se le suele denominar
tratamiento)
• Ej.: Estudiar el efecto de la temperatura en una
reacción química, si existieran varias temperaturas
posibles para realizar el experimento, estas serían los
niveles del factor.
Ejemplo inicial (*)
• Un ingeniero esta interesado en cómo la absorción media de
humedad en concreto varía entre cinco mezclas diferentes de
concreto
• Las muestras se exponen a humedad durante 48 horas.
• Se prueban 6 muestras para cada mezcla, así en total se
requieren probar 30 muestras

(*) Ejemplo del libro Probabilidad y Estadística de Walpole & Myers


Datos de absorción de humedad
Mezcla 1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Solución
Mezcla 1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Total 3320 3416 3663 2791 3664
Promedio 553.33 569.33 610.50 465.17 610.67
Hipótesis a probar

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5

𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠


Supuestos del Análisis de Varianza
Cualquier variación que exista entre los promedios de las mezclas se
atribuye a:
(1) la variación en la absorción entre las observaciones dentro de los
tipos de mezclas
(2) la variación que se debe a los tipos de mezclas, es decir, las que se
deben a diferencias entre en la composición química de las mezclas.
Variaciones dentro de las mezclas
Ocasionadas por diversas causas: condiciones de humedad y
temperatura variaron durante el experimento, o
simplemente la heterogeneidad entre sus materias primas
Así la variación dentro de la muestra es una variación
aleatoria o al azar
Objetivo del ANOVA
• Parte del objetivo del ANOVA es determinar si las diferencias
entre las 5 medias muestrales de las mezclas de cemento son
debidas solo a la variación aleatoria o si en realidad también
hay una contribución de la variación sistemática debido a los
tipos de mezclas
Procedimiento del ANOVA
• Es en esencia separar la variabilidad total en los dos siguientes
componentes:
1) Variabilidad entre las mezclas, mediante la medición de la variación
sistemática y la aleatoria
2) Variabilidad dentro de las mezclas, mediante la medición de la
variación aleatoria solamente.
Se determina si el componente 1 es significativamente mayor que el 2
Estrategia del Diseño Experimental
• El objetivo es distribuir uniformemente entre los niveles del
factor los riesgos causados por la heterogeneidad de las
unidades experimentales
• Una asignación aleatoria simula mejor las condiciones que
supone el modelo
Análisis de Varianza Unilateral: Diseño
Completamente Aleatorizado
• Se seleccionan muestras aleatorias de tamaño n de cada una de las k
poblaciones
• Las k poblaciones diferentes se clasifican sobre la base de un solo
criterio de interés, como tratamiento, por ejemplo fertilizantes
diferentes, regiones diferentes, etc.
• Las k poblaciones se suponen independientes y normalmente
distribuidas con medias 𝜇1 , 𝜇2 , … , 𝜇𝑘 y varianza común 𝜎 2
Método de Cálculos: k muestras aleatorias
Tratamiento 1 2 … i … K
𝑦11 𝑦21 … 𝑦𝑖1 … 𝑦𝐾1
𝑦12 𝑦22 … 𝑦𝑖2 … 𝑦𝐾2
… … … … … …
𝑦1𝑛 𝑦2𝑛 … 𝑦𝑖𝑛 … 𝑦𝐾𝑛
Total 𝑌1 𝑌2 … 𝑌𝑖 … 𝑌𝐾
Media 𝑌1 𝑌2 … 𝑌𝑖 … 𝑌𝐾
Prueba de hipótesis
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝐾

𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠

• Cada observación se puede escribir de la forma 𝑦𝑖𝑗 = 𝜇𝑖 + 𝜀𝑖𝑗


• Donde 𝜀𝑖𝑗 mide la desviación de la j-ésima observación de la i-
ésima muestra de la correspondiente media del tratamiento, es el
error aleatorio
Forma alternativa de escribir las
observaciones
• Se prefiere sustituir cada 𝜇1 por 𝜇 + 𝛼𝑖 sujeta a la restricción:
𝑘
• 𝑖=1 𝛼𝑖 =0

• De allí se puede escribir: 𝑦𝑖𝑗 = 𝜇 + 𝛼𝑖 + 𝜀𝑖𝑗 , donde 𝜇 es la media


general y 𝛼𝑖 es el efecto de i-ésimo tratamiento:
𝑘
𝑖=1 𝛼𝑖
•𝜇=
𝑘
Planteo equivalente de la Hipótesis
𝐻0 : 𝛼1 = 𝛼2 = ⋯ = 𝛼𝐾 = 0

𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 ∝𝑖 𝑛𝑜 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑎 0

• Esta forma de plateo es la más usada en el diseño experimental


(con efectos 𝛼 en lugar de medias 𝜇)
Identidad de la suma de cuadrados
• SST = SSTR + SSE

• De donde: SSE = SST - SSTR


Sumas de cuadrados
Cuadrado Medios
• Para el tratamiento:
• Si Ho es verdadera una estimación de 𝜎² que se basa en k-1
grados de libertad la proporciona 𝑠12 = 𝑆𝑆𝑇𝑅 / (𝑘 − 1)
• Para el error:
• 𝑠 2 = 𝑆𝑆𝐸 / 𝑘(𝑛 − 1) , esta estimación es insesgada a pesar
de que la hipótesis nula sea verdadera o falsa.
Grados de libertad
• La identidad de la suma de cuadrados también divide
el numero total de grados de libertad:

𝑛𝑘 − 1 = 𝑘 − 1 + 𝑘(𝑛 − 1)
Tabla ANOVA para Clasificación Unilateral

Grados de
Fuente SC CM fcalculo
Libertad
Tratamiento 𝑆𝑆𝑇𝑅 𝑘−1 𝑠12 = 𝑆𝑆𝑇𝑅 / (𝑘 − 1) 𝑠12 /𝑠 2
Error 𝑆𝑆𝐸 𝑘(𝑛 − 1) 𝑠 2 = 𝑆𝑆𝐸 / 𝑘(𝑛 − 1)
Total 𝑆𝑆𝑇 𝑛𝑘 − 1
Ejemplo (*)
• Probar para los datos del experimento de las 5 mezclas de cemento:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5

𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠

• Utilice 𝛼 = 0.05
• Datos: n = 6, k = 5

(*) Ejemplo del libro Probabilidad y Estadística de Walpole & Myers


EXCEL
Tabla Anova
Distintos tamaños de muestra
• En ocasiones las muestras son de tamaños diferentes
por lo que hay que corregir las fórmulas
Ejemplo 2 (*)
• Se estudian cuatro grupos de personas que toman distintos
medicamentos (uno no toma medicación)

(*) Ejemplo del libro Probabilidad y Estadística de Walpole & Myers


Comparaciones Múltiples
• Cuando se rechaza la hipótesis nula y se acepta que
no todas las medias son iguales, aun no se sabe cuales
medias son iguales y cuales son diferentes
• A menudo es de interés realizar varias comparaciones
pareadas, quizás todas las posibles, entre los
tratamientos
Hipótesis a probar
Enfoque del Intervalo de Confianza para
comparaciones pareadas
Prueba Tukey
• Permite la formación de intervalos de confianza de 100 (1- α)%
simultáneos para todas las comparaciones pareadas
• El método se basa en la distribución del rango studentizado.
• El punto percentil apropiado es una función de α, k, y v grados de
libertad para s²
• En las tablas se muestran los puntos porcentuales superiores para
α=0.05
Considere el siguiente ejemplo
• Considere un experimento de un factor completamente aleatorizado
con seis tratamientos y un tamaño de cinco observaciones para cada
uno de los niveles de tratamiento. Lo que resulta en v=24 g.l. para el
error.
• Además suponga que se construye el análisis vía tabla ANOVA
encontrando un cuadrado medio del error s²= 2.45.
Solución
Comparaciones
• Si hay k medias a comparar, esto implica hacer
p=k (k-1)/2 comparaciones
• Así al ser k=6 , se van a realizar 6*5/2=15 pares
de comparaciones
Conclusiones
Resp.: Así se ve que existen diferencias significativas entre muchas
de las medias, las que rechazaron la hipótesis nula Ho

Estas son:
y1-y2
y1-y4
y1-y5
y1-y6
y2-y3
y2-y4
y2-y6
y3-y5
y4-y5
y5-y6
Caso tamaño de muestra diferente
Prueba Duncan
• Este procedimiento se basa también en la noción general del rango
studentizado
• El rango de cualquier subconjunto de p medias muestrales debe ser
excedido por cierto valor antes de que se encuentre que cualquiera
de las p medias es diferente
• Este valor es el rango de menor significancia para las p medias y se
denota Rp:
Rango studentizado de menor significancia
• Los valores de rp dependen del nivel de significancia
deseado y del número de grados de libertad para el
error.
Ejemplo para prueba Duncan
• Considere el ejemplo anterior de seis tratamientos, con cinco
observaciones cada uno.
• Suponga que el cuadrado medio del error que se toma de la tabla
ANOVA es s²= 2.45 con v=24 g.l.
Cálculo de los rp
Comparaciones
1) ordenar las medias ascendentemente
Conclusiones
• Se obtuvieron las mismas conclusiones que con la prueba
Tukey solo que Duncan también encontró diferencias
significativas entre las medias 2 y 5
• Esto es porque la prueba Tukey es más reservada que la
Duncan, pero no existe un criterio para decir si una prueba
es mejor que la otra así que ambas se pueden utilizar.
Caso tamaño de muestras diferente
COMPARACIONES CON UN CONTROL
• A veces es necesario comparar los niveles del factor
con un nivel de control, para determinar si hay
diferencias con respecto al control. El método Dunnet
permite este tipo de análisis.
• Ejemplo: se analizan tres catalizadores para
determinar si difieren de un catalizador “control”
Hipótesis a probar
Criterio de Rechazo de Ho
Prueba
Caso tamaño de muestras diferente

También podría gustarte