Trabajo de Diseño Experimental

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 16

Trabajo de Diseño Experimental

Carrera:
Ingeniería Petroquímica

Nombre:
Eduardo Martínez

Periodo Académico:
Octubre 2016 – febrero 2017
1. Tema
Diseño y análisis de un experimento para determinar la concentración de metanol
(CH 3 OH ) presente en una muestra obtenida de un proceso de destilación.

2. Objetivos
 Diseñar y analizar un experimento con base en el diseño completamente al azar
(DCA) para determinar la concentración de metanol presente en una muestra
recogida de un proceso de destilación.
 Realizar un análisis de varianza (ANOVA) al diseño realizado para realizar la
prueba de hipótesis de igualdad de los tratamientos con respecto a la media de la
correspondiente variable de respuesta.
 Realizar pruebas de comparaciones múltiples para determinar si los datos
analizados cumplen con los requerimientos del problema.

3. Introducción
Investigadores de practicamente todos los campos de estudio llevan a cabo
experimentos, por lo general para descubrir algo acerca de un proceso o sistema
particular. En un sentido literal, un experimento es una prueba. En una perspectiva más
formal, un experimento puede definirse como una prueba o serie de pruebas en las que
se haces cambias deliberados en las variables de entrada de un proceso o sistemas para
observar e identificar razones de los cambios que pudieran observase en la respuesta de
salida.
El diseño de experimentos trata de la planeación y realizacion de experimentos y del
análisis de los datos resultantes a fin de obtener conclusiones válidas y objetivas. La
atención se centra en los experimentos de ingeniería y las ciencias físicas y químicas.
En ingeniería, la experimentación desempeña un papel importante en el diseño de
productos nuevos, el desarrollo de procesos de manufactura y el mejoramiento de
procesos.

4. Revision bibliográfica
Experimentos con un solo factor (análisis de varianza)
Diseño completamente al azar y ANOVA
Muchas comparaciones, se hacen con base en el diseño completamente al azar (DCA),
que es el más simple de todos los diseños que se utilizan para comparar dos o más
tratamientos, dado que sólo consideran dos fuentes de variabilidad: los tratamientos y el
error aleatorio.
Este diseño se llama completamente al azar porque todas las corridas experimentales se
realizan en orden aleatorio completo. De esta manera, si durante el estudio se hacen en

total N pruebas, éstas se corren al azar, de manera que los posibles efectos ambientales
y temporales se vayan repartiendo equitativamente entre los tratamientos.

Tabla 1 Diseño completamente al azar.


ANOVA para el diseño completamente al azar (DCA)
El análisis de varianza (ANOVA) es la técnica central en el análisis de datos
experimentales. La idea general de esta técnica es separar la variación total en las partes
con las que contribuye cada fuente de variación en el experimento. En el caso del DCA
se separan la variabilidad debida a los tratamientos y la debida al error.

Cuando la primera predomina “claramente” sobre la segunda, es cuando se concluye


que los tratamientos tienen efecto o, dicho de otra manera, las medias son diferentes.
Cuando los tratamientos no dominan contribuyen igual o menos que el error, por lo que
se concluye que las medias son iguales. El objetivo del análisis de varianza en el DCA
es probar la hipótesis de igualdad de los tratamientos con respecto a la media de la
correspondiente variable de respuesta.

Tabla 2: Tabla de anova para el DCA


Comparaciones o pruebas de rango múltiples
Después de que se rechazó la hipótesis nula en un análisis de varianza, es necesario ir a
detalle y ver cuáles tratamientos son diferentes. Existen tres estrategias distintas para ir
a ese detalle.

Método LSD (diferencia mínima significativa)


Es la diferencia mínima que debe haber entre dos medias muestrales para considerar que
dos tratamientos son diferentes.

Una vez que se rechazó Ho en el ANOVA, el problema es probar la igualdad de todos


los posibles pares de medias con la hipótesis:

para toda i ≠ j. Para k tratamientos se tienen en total k (k – 1) /2 pares de medias. Por


ejemplo, si k = 4 existen 4 × 3/2 = 6 posibles pares de medias. El estadístico de prueba
para cada una de las hipótesis dadas es la correspondiente diferencia en valor absoluto
entre sus medias muestrales. Se rechaza la hipótesis Ho: µi = µj si ocurre que:

donde el valor de tα/2, N – k se lee en las tablas de la distribución T de Student con N –


k grados de libertad que corresponden al error, el CME es el cuadrado medio del error y
se obtiene de la tabla de ANOVA, ni y nj son el número de observaciones para los
tratamientos i y j, respectivamente. la diferencia mínima significativa se reduce a:

En caso de rechazar Ho se acepta la hipótesis alternativa HA: mi ≠ mj, la cual nos dice
que las medias de los tratamientos i y j son diferentes. El método LSD tiene una
potencia importante, por lo que en ocasiones declara significativas aun pequeñas
diferencias.

Método de Tukey
Un método más conservador para comparar pares de medias de tratamientos es el
método de Tukey, el cual consiste en comparar las diferencias entre medias muestrales
con el valor crítico dado por:

donde CME es el cuadrado medio del error, n es el número de observaciones por


tratamiento, k es el número de tratamientos, N – k es igual a los grados de libertad para
el error, α es el nivel de significancia prefijado y el estadístico qα (k, N – k) son puntos
porcentuales de la distribución del rango estudentizado, que se obtienen de la
correspondiente tabla. Se declaran significativamente diferentes los pares de medias
cuya diferencia muestral en valor absoluto sea mayor que Tα. A diferencia de los
métodos LSD y Duncan, el método de Tukey trabaja con un error a muy cercano al
declarado por el experimentador.

Método de Duncan
En este método para la comparación de medias, si las k muestras son de igual tamaño,
los k promedios se acomodan en orden ascendente y el error estándar de los promedios
se estima con:

Si alguno o todos los tratamientos tienen tamaños diferentes, se reemplaza n por la


media armónica de las que está dada por,

Nótese que cuando n1 = n2 = … = nk = n, ocurre que nAR = n. De la tabla de rangos


significantes de Duncan, se obtienen los valores críticos rα (p, l), p = 2, 3, …, k, donde
α es el nivel de significancia prefijado y l son los grados de libertad para el error. Con
estos k – 1 valores se obtienen los rangos de significancia mínima dados por

Las diferencias observadas entre las medias muestrales se comparan con los rangos Rp
de la siguiente manera: primero se compara la diferencia entre la media más grande y la
más pequeña con el rango Rk. Luego, la diferencia entre la media más grande y la
segunda más pequeña se compara con el rango Rk−1. Estas comparaciones continúan
hasta que la media mayor se haya comparado con todas las demás. Enseguida, se
compara la diferencia entre la segunda media más grande y la media menor con el rango
Rk−1. Después, la diferencia entre la segunda media más grande y la segunda más
pequeña se

compara con el valor de Rk−2 , y así sucesivamente hasta que se comparan los k(k – 1)/2
pares de medias posibles con el rango que les corresponda.
En las comparaciones donde la diferencia observada es mayor que el rango respectivo,
se concluye que esas medias son significativamente diferentes. Si dos medias caen entre
otras dos que no son muy diferentes, entonces esas dos medias poblacionales también se
consideran estadísticamente iguales.

Diseños de bloques
Diseño de bloques completos al azar
En un diseño en bloques completos al azar (DBCA) se consideran tres fuentes de
variabilidad: el factor de tratamientos, el factor de bloque y el error aleatorio. La palabra
completo en el nombre del diseño se debe a que en cada bloque se prueban todos los

tratamientos, o sea, los bloques están completos. La aleatorización se hace dentro de


cada bloque; por lo tanto, no se realiza de manera total como en el diseño
completamente al azar. El hecho de

que existan bloques hace que no sea práctico o que incluso sea imposible aleatorizar en
su totalidad.

Tabla 3 Arreglo de los datos en un diseño en bloques completos al azar.


Modelo estadístico
Cuando se decide utilizar un DBCA, el experimentador piensa que cada medición será
el resultado del efecto del tratamiento donde se encuentre, del efecto del bloque al que
pertenece y de cierto error que se espera sea aleatorio. El modelo estadístico para este
diseño está dado por:

donde Yij es la medición que corresponde al tratamiento i y al bloque j; µ es la media


global poblacional; τi es el efecto debido al tratamiento i, γj es el efecto debido al
bloque j, y εij es el error aleatorio atribuible a la medición Yij.

Hipótesis a probar
La hipótesis de interés es la misma para todos los diseños comparativos, y está dada por:

En cualquiera de estas hipótesis la afirmación a probar es que la respuesta media


poblacional lograda con cada tratamiento es la misma para los k tratamientos y que, por
lo tanto, cada respuesta media µi es igual a la media global poblacional, µ. De manera
alternativa, es posible afirmar que todos los efectos de tratamiento sobre la variable de
respuesta son nulos, porque cuando el efecto τi = µi – µ = 0, entonces necesariamente la
respuesta media del tratamiento es igual a la media global (µi = µ).

Análisis de varianza
La hipótesis se prueba con un análisis de varianza con dos criterios de clasificación,
porque se controlan dos fuentes de variación: el factor de tratamientos y el factor de
bloque. En la tabla 2 se muestra el aspecto del ANOVA para diseño DBCA.
Tabla 4: ANOVA para un diseño en bloques completos al azar.

Diseño en cuadro latino


En el diseño en cuadro latino (DCL) se controlan dos factores de bloque y se estudia un
factor de tratamientos, por lo que se tienen cuatro fuentes de variabilidad que pueden
afectar la respuesta observada, éstas son: los tratamientos, el factor de bloque I
(columnas), el factor de bloque II

(renglones) y el error aleatorio. Se llama cuadro latino por dos razones: es un cuadro
debido a que tiene la restricción adicional de que los tres factores involucrados se
prueban en la misma cantidad de niveles, y es latino porque se utilizan letras latinas para
denotar a los tratamientos o niveles del factor de interés. Sean A, B, C, …, K, los k
tratamientos a comparar, por lo tanto, ambos factores de bloques tienen también k
niveles cada uno.

Análisis del diseño


El modelo estadístico para describir el comportamiento de las observaciones está dado
por
donde Yijles la observación del tratamiento i, en el nivel j del factor renglón y en el
nivel l del factor columna; εij es el error atribuible a dicha observación. De acuerdo con
este modelo, la variabilidad total presente en los datos se puede descomponer como

y los grados de libertad correspondientes son

El ANOVA para el diseño en cuadro latino se muestra en la tabla3. En él se prueba la


hipótesis sobre los efectos de tratamiento del factor renglón y del factor columna. Otra
vez, la hipótesis fundamental es la de los tratamientos; las otras dos proporcionan un

adicional al objetivo inicial y permiten comprobar la relevancia de controlar los factores


de bloque.

Tabla 5: ANOVA para el diseño de cuadro latino.


Selección y aleatorización de un cuadro latino
No cualquier arreglo de letras latinas en forma de cuadro es un cuadro latino. La regla
fundamental es que cada letra debe aparecer sólo una vez en cada renglón y en cada
columna. Siempre es fácil construir un cuadro latino estándar: en el que en la primera
columna y en el primer renglón aparecen las letras en orden alfabético. Por ejemplo, un
cuadro latino estándar de tamaño cuatro está dado por:

Diseño en cuadro grecolatino


Con el diseño en cuadro grecolatino (DCGL) se controlan tres factores de bloque,
además del factor de tratamientos. Se llama cuadro grecolatino porque los cuatro
factores involucrados se
prueban en la misma cantidad de niveles, de aquí que se pueda escribir como un cuadro,
además, se utilizan letras latinas para denotar a los tratamientos y letras griegas para
nombrar a los niveles del tercer factor de bloque. Al igual que en el cuadro latino, cada
letra (latinas y griegas) debe aparecer sólo una vez en cada renglón y en cada columna.
Además, cada par de letras debe aparecer sólo una vez en todo el arreglo. En la tabla 4
se presenta el aspecto de los datos del diseño en cuadro latino de dimensión k = 4. El
modelo estadístico que describe a las mediciones en un cuadro grecolatino está dado por

Tabla 6. Diseño en cuadrado grecolatino


El modelo estadístico que describe a las mediciones en un cuadro grecolatino está dado
por

donde Yijl es la observación o respuesta que se encuentra en el tratamiento i (i-ésima


letra latina), en el renglón j, en la columna l y en la m-ésima letra griega; τi es el efecto
del tratamiento i, γj es el efecto del renglón j, l representa el efecto de la columna l y φm
representa el efecto de la m-ésima letra griega, que son los niveles del tercer factor de

bloque; el término εijlm representa el error aleatorio atribuible a la medición Yijlm. Es


importante no confundir las letras griegas del modelo que representan efectos, con las
letras griegas en el diseño que simbolizan a los niveles del tercer factor de bloque. La
variabilidad total presente en los datos se puede partir de la manera usual como.

donde las sumas SCB1, SCB2 y SCB3 miden la variabilidad debida a los factores de
bloque renglón, columna y de letras griegas, respectivamente. Para k tratamientos, los
grados de libertad correspondientes a cada suma son.
Un bosquejo del análisis de varianza se muestra en la tabla 5, en la cual se prueban las
hipótesis de igualdad de letras latinas (tratamientos), de renglones, de columnas y de
letras griegas.

Tabla 7. ANOVA para el diseño en cuadro grecolatino.


5. Problema
¿Los análisis realizados por los cuatro ingenieros químicos tienen los mismos resultados
de concentración de metanol en la muestra analizada?
6. Hipótesis
La concentración es una propiedad física de una solución que define el grado de pureza
de la misma, la cual se puede medir utilizando técnicas analíticas cuantitativas. En
procesos industriales es indispensables utilizar métodos de separación como destilación,
extracción y secado para obtener productos deseados de alta pureza.
7. Metodología

 Se pide a cuatro ingenieros químicos realizar un análisis cuantitativo, para


determinar el porcentaje de alcohol metílico. Cada ingeniero hace 3
determinaciones.
 Se realiza un diseño completamente al azar (DCA) con los resultados obtenidos
de los análisis realizados por los ingenieros. El diseño es el siguiente.

Determinaciones (% de C3OH)
Químico 1 2 3
Tratamiento 1 1 84.99 84.04 84.38
Tratamiento 2 2 85.15 85.13 84.88
Tratamiento 3 3 84.72 84.48 85.16
Tratamiento 4 4 84.2 84.1 84.55

 Se realiza el análisis de varianza (ANOVA) para el diseño completamente al


azar (DCA).

 Se tabula en la tabla de puntos porcentuales de la distribución F el valor del


estadístico, para una distribución F, con (k-1) grados de libertad en el
numerador, (N-k) grados de libertad en el denominador y un valor de
significancia (α) establecido.
 En función de los resultados obtenidos en el análisis de varianza probar la
hipótesis de igualdad de los tratamientos con respecto a la media de la
correspondiente variable de respuesta. Esto es, se rechaza Ho si F o > F α , k−1 , N−k
donde F α ,k−1 , N−k es el valor de estadístico. De lo contrario se acepta Ho.
 Si se rechazó la hipótesis nula (Ho) en el análisis de varianza, se realiza pruebas
de rango múltiple para ir a detalle y ver cuáles tratamientos son diferentes.

8. Resultados
TOTAL
(YI) YI2 YI2/n PROMEDIO
64216.628
253.41 1 21405.5427 84.47
65106.625 21702.2085
255.16 6 3 85.05333333
64699.009 21566.3365
254.36 6 3 84.78666667
63933.122 21311.0408
252.85 5 3 84.28333333
257955.38
SUMA= 1015.78 6 85985.1286 338.5933333

Determinaciones (% de C3OH)
Químico 1 2 3 TOTAL
Tratamiento 1 1 7223.3001 7062.7216 7119.9844 21406.0061
Tratamiento 2 2 7250.5225 7247.1169 7204.6144 21702.2538
Tratamiento 3 3 7177.4784 7136.8704 7252.2256 21566.5744
2
¿ ∑ ij
Tratamiento 4 4 7089.64 7072.81 7148.7025 21311.1525
SUMA= 85985.9868

2 2
2 y 2 y
S . C .Total =∑ ij − =1.90276667 S . C .Trat =1/n ∑ yi − =1.04456667
N N

y= 1015.78
N= 12
n= 3
a= 4

Tabla de análisis de varianza (ANOVA)


Fuente de suma de grados de Fo
variacion cuadrados libertad cuadrado medio calculado F tabulado
Tratamiento 1.044566667 3 0.348188889 3.25 4.07
Error 0.8582 8 0.107275
Total 1.902766667 11

F calculado F tabulado
3.25 < 4.07

Ho: µ1=µ2=µ3=µ4=µ5 (Hipótesis nula)


H1: Algunas medias son diferentes (Hipótesis alternativa)
Para probar que Ho: µ1=µ2=µ3=µ4=µ5 en oposición a H1: al menos hay un tratamiento
diferente de los demás. Con un a=0.05, obtenemos un F = 4.07 de la tabla
correspondiente y puesto que 3.25<4.07 se acepta el Ho con un a=0.05 y se concluye
que no hay diferencias entre tratamientos (Ing Químicos).

Pruebas de rango múltiple.


Prueba de Tukey.

T α =q α ( a , f )
√ M sE
n √
=q α ( 4 , 8 )
M sE
n
=4.53 ×

0.107275
3
= 0.85661729

Punto % del estadístico= 4.53


Tα= 0.85661729
VALORES DIFERENCI DIFERENCIA
PARES DE PARES A POSITIVA Y VALOR
Y1-Y2 84.47-85.05 -0.5833 0.5833 Y1 84.47
Y1-Y3 84.47-84.79 -0.3167 0.3167 Y2 85.05333333
Y1-Y4 84.47-84.28 0.1867 0.1867 Y3 84.78666667
Y2-Y3 85.05-84.79 0.2667 0.2667 Y4 84.28333333
Y2-Y4 85.05-84.28 0.7700 0.7700
Y3-Y4 84.79-84.28 0.5033 0.5033

Número de pares de media significativamente diferentes= 0

No existen pares de medias significativamente diferentes

Prueba de Diferencia mínima significativa.


Sil Yi−Yjl> LSD

LSD=t α , N −a
2 √ 2 M sE
n √
=t 0.025 , ( 12−4 )
2 ( 0.107275 )
3

¿ t 0.025 , ( 8 )
√ 2 ( 0.107275 )
3
=2.306 ×

2 ( 0.107275 )
3
=107.0 .181025

VALORES DIFERENCIA
PARES DE PARES DIFERENCIA POSITIVA
Y1-Y2 84.47-85.05 -0.5833 0.5833
Y1-Y3 84.47-84.79 -0.3167 0.3167
Y1-Y4 84.47-84.28 0.1867 0.1867
Y2-Y3 85.05-84.79 0.2667 0.2667
Y2-Y4 85.05-84.28 0.7700 0.7700
Y3-Y4 84.79-84.28 0.5033 0.5033

El único par de medias que difieren significativamente es Y2-Y4

Prueba del rango múltiple de Duncan


Sȳ =
1
√ √
M sE
n
=
0.107275
3
=0.18909874

NIVEL DE Puntos % ERROR


NIVELES.G
RANGO SIGNIFICACIO del S ESTANDA
L ERROR
N estadístico R
R2 0.05 (2,8) 3.26 0.18909874 0.62
R3 0.05 (3,8) 3.39 0.18909874 0.64
R4 0.05 (4,8) 3.47 0.18909874 0.66

Y VALOR
Y4 84.28333333
Y1 84.47
Y3 84.78666667
Y2 85.05333333

Y2-Y4 0.770 > 0.66 R4


Y2-Y1 0.5833 < 0.64 R3
Y2-Y3 0.2667 < 0.62 R2
Y3-Y4 0.5033 < 0.64 R3
Y3-Y1 0.3167 < 0.62 R2
Y1-Y4 0.1867 < 0.62 R2

9. Conclusiones.
 El diseño del experimento realizado, en basa al DCA, fue lo suficientemente
adecuado para determinar el porcentaje de metanol en la muestra.
 El análisis de varianza ayuda a realizar la prueba de hipótesis, para determinar si
existe alguna diferencia entre tratamientos.
 Las pruebas de rango múltiple son necesarias realizarlas, para ver cuáles de los
tratamientos son diferentes.

10. Recomendaciones.
 Para realizar los cálculos de una manera correcta es necesario utilizar un
software de análisis estadístico.

11. Bibliografía:
 Humberto Gutiérrez Pulido Román de la Vara Salazar. (2008). Análisis y
diseño de experimentos. México: Mc Graw Hill.
 Montgomery, D. C. (2004). Diseño y Análisis de Experimentos. México:
Limusa Wiley.

También podría gustarte