Clase 6

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

Universidad Nacional de Ingeniería

Instituto de Estudios Superiores


UNI-IES

ASIGNATURA: ESTADISTICA II
UNIDAD II: INTRODUCCIÓN AL DISEÑO EXPERIMENTAL

OBJETIVOS PARTICULARES

- Explicar las diferentes técnicas de análisis experimental, a través del análisis de


varianza de los diferentes diseños.
- Diferenciar los tipos de diseños mediante las definiciones de éstos.
- Ser crítico en el análisis de los diseños estudiados en la unidad.

CONTENIDOS

2.1. Análisis de Varianza (efecto fijo) (análisis de error)


2.2. Contraste, Contraste Ortogonal.
2.3. Método diferencia significativa mínima
2.4. Prueba de Bartlett y Duncan
2.5. Diseño completamente Aleatorizado
2.6. Diseño de bloques aleatorios.
2.7. Diseño Cuadrado Latino.
2.8. Diseño Cuadrado Grecolatino (análisis de error).
2.9. Modelo lineal del diseño bloque.
2.10. Factoriales
2.11. Diseño 22, Diseño 23
2.12. Diseño 32
2.13. Análisis de covarianza.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

Análisis de Varianza (efecto fijo)

Los experimentos son esenciales para desarrollar y mejorar los métodos científicos y de
ingeniería. Sólo mediante la experimentación se pueden comparar las diferentes variantes
de un método con el fin de comprobar cuál es el más efectivo. Para que sea útil, un
experimento se debe diseñar adecuadamente, y los datos que se obtienen de éste se deben
analizar en forma correcta. En esta unidad se analizará el diseño y el análisis de datos a partir
de una clase de experimentos conocidos como experimentos factoriales.

Al estudiar los métodos de análisis de datos cuantitativos, se resuelven problemas que


implican una sola muestra de números y el análisis comparativo de dos muestras diferentes.
En problemas de una muestra, los datos se componían de observaciones sobre respuestas de
individuos u objetos experimentales seleccionados de una sola población.

En problemas de dos muestras, las dos muestras se tomaron de dos poblaciones diferentes
y los parámetros de interés fueron las medias de la población o bien se aplicaron dos
tratamientos distintos a unidades experimentales (individuos u objetos) seleccionados de
una sola población; en el último caso, los parámetros de interés fueron las medias de
tratamiento verdaderas.
El análisis de la varianza, o más brevemente, ANOVA, se refiere en general a un conjunto de
situaciones experimentales y procedimientos estadísticos para el análisis de respuestas
cuantitativas de unidades experimentales.
El problema ANOVA más simple se conoce indistintamente como unifactorial (o un sólo
factor), de clasificación única o ANOVA unidireccional e implica el análisis de datos
muestreados de más de dos poblaciones (distribuciones) numéricas o de datos de
experimentos en los cuales se utilizaron más de dos tratamientos. La característica que
diferencia los tratamientos o poblaciones una de otra se llama factor en estudio y los
distintos tratamientos o poblaciones se conocen como niveles o tratamientos del factor.
Por último, los objetos con los que se realizan las mediciones se llaman unidades
experimentales. Las unidades asignadas a un tratamiento dado se llaman réplicas.

Ejemplos de tales situaciones incluyen los siguientes:

1. Un experimento para estudiar los efectos de cinco marcas diferentes de gasolina con
respecto a la eficiencia de operación de un motor automotriz (mpg).
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

2. Un experimento para estudiar los efectos de la presencia de cuatro soluciones azucaradas


diferentes (glucosa, sucrosa, fructosa y una mezcla de las tres) en cuanto a crecimiento de
bacterias.
3. Un experimento para investigar si la concentración de madera dura en la pulpa (%) afecta
la resistencia a la tensión de bolsas hechas de la pulpa.
4. Un experimento para decidir si la densidad de color de un espécimen de tela depende de
la cantidad de tinte utilizado.

En 1) el factor de interés es la marca de la gasolina y existen cinco niveles diferentes del


factor. En 2) el factor es el azúcar con cuatro niveles (o cinco, si se utiliza una solución de
control que no contenga azúcar). Tanto en 1) como en 2), el factor es de naturaleza
cualitativa y los niveles corresponden a posibles categorías del factor. En 3) y 4), los factores
son concentración de madera dura y cantidad de tinte, respectivamente; estos dos factores
son de naturaleza cuantitativa, por lo que los niveles identifican diferentes ajustes del factor.
Cuando el factor de interés es cuantitativo, también se pueden utilizar técnicas estadísticas
de análisis de regresión (desarrollado en la unidad I) para analizar los datos.

Antes de desarrollar un análisis de varianza, primero se debe de conocer algunas


definiciones importantes.

Experimento completamente aleatorio.

En un experimento completamente aleatorio, es adecuado considerar que cada tratamiento


representa una población, y a las respuestas observadas para las unidades asignadas a ese
tratamiento como una muestra aleatoria simple de esa población. Por consiguiente, los datos
del experimento constan de algunas muestras aleatorias, cada una proveniente de una
población diferente. Las medias poblacionales se llaman medias del tratamiento.

Las preguntas de interés relacionadas con las medias de tratamiento son, si son todas iguales,
y si no, cuáles son diferentes, qué tan grandes son las diferencias, etcétera.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

Estrategia del experimento completamente aleatorio.


En Estadística I se estudiaron los conceptos de la estimación y la prueba de hipótesis para el
caso de dos muestras, bajo la importante perspectiva de la manera en que se realiza el
experimento. Esto forma parte de la categoría amplia de los diseños experimentales. Por
ejemplo, para la prueba t agrupada que se estudió anteriormente, se supone que los niveles
de los factores (los tratamientos) se asignan al azar a las unidades experimentales.

Como las unidades experimentales son las unidades (ratones, pacientes, especímenes de
concreto, tiempo) que proporcionan la heterogeneidad que conduce al error experimental
en una investigación científica. La asignación aleatoria elimina el sesgo que podría originarse
con una asignación sistemática.

El objetivo consiste en distribuir en forma uniforme entre los niveles de los factores los
riesgos que introduce la heterogeneidad de las unidades experimentales. Una asignación al
azar simula mejor las condiciones que se asumen en el modelo.

Análisis de Varianza de un factor: diseño completamente aleatorio (ANOVA de


un factor)
De k poblaciones se seleccionan muestras aleatorias de tamaño n. Las k poblaciones
diferentes se clasifican con base en un criterio único, como tratamientos o grupos distintos.
En la actualidad el término tratamiento se utiliza por lo general para designar las diversas
clasificaciones, ya sean diferentes agregados, analistas, fertilizadores o regiones del país.

Suposiciones e hipótesis de ANOVA de un solo factor.

Se supone que las k poblaciones son independientes y que están distribuidas en forma
normal con medias 𝜇1 , 𝜇2 , … , 𝜇𝑘 , y varianza común 𝜎 2 . Estas suposiciones son más
aceptables mediante la aleatoriedad. Se desea obtener métodos adecuados para probar las
hipótesis

Sea que 𝑦𝑖𝑗 denote la j-ésima observación del i-ésimo tratamiento, y el orden de los datos es
el que se observa en la tabla siguiente:
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

Aquí

𝑌𝑖 : es el total de todas las observaciones de la muestra, del i-ésimo tratamiento,

𝑦̅𝑖 : es la media de todas las observaciones en la muestra del i-ésimo tratamiento,

𝑌… es el total de todas la 𝑛𝑘 observaciones, y

𝑦̅... es la media de todas las 𝑛𝑘 observaciones.

Modelo de ANOVA para un solo factor.

Cada observación puede escribirse en la forma

donde ∈𝑖𝑗 mide la desviación que tiene la observación j-ésima de la i-ésima muestra, con
respecto de la media del tratamiento correspondiente. El término ∈𝑖𝑗 representa el error
aleatorio y desempeña el mismo papel que los términos del error en los modelos de
regresión. Una forma alternativa y preferible de esta ecuación se obtiene sustituyendo 𝜇𝑖 =
𝜇 + 𝛼𝑖 , sujeta a la restricción ∑𝑘𝑖=1 𝛼𝑖 = 0 por lo tanto, se escribe
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

La resolución de la variabilidad total en componentes depende de una comparación de dos


estimadores independientes de la varianza poblacional común 𝜎 2 . Dichos estimadores se
obtendrán haciendo la partición de la variabilidad total de los datos, denotados mediante la
sumatoria doble en dos componentes.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

Uso de la prueba F en el ANOVA

El estimado 𝑠 2 es no sesgado, independientemente de la veracidad o falsedad de la hipótesis


nula. Es importante señalar que la identidad de la suma de cuadrados ha hecho la partición
no sólo de la variabilidad total de los datos, sino también del número total de grados de
libertad. Es decir;

Razón F para probar la igualdad de las medias.


𝑠1 2
Cuando la hipótesis nula es verdadera, la razón 𝑓 = es un valor de la variable aleatoria F,
𝑠2
que tiene la distribución F con 𝑘 − 1 𝑦 𝑘(𝑛 − 1) grados de libertad.

Como 𝑠1 2 sobrestima a 𝜎 2 cuando 𝐻0 es falsa, se tiene una prueba de una cola con la región
crítica localizada por completo en la cola derecha de la distribución.

A un nivel de significancia de 𝜶 se rechaza la hipótesis nula 𝑯𝟎 cuando

Los cálculos para un problema de análisis de varianza por lo general se resumen en forma
tabular, de la siguiente manera:
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

Ejemplo 1:

Suponga que en un experimento industrial a un ingeniero le interesa la forma en que la


absorción media de humedad del concreto varía para 5 agregados de concreto diferentes.
Las muestras se exponen a la humedad durante 48 horas y se decide que para cada agregado
deben probarse 6 muestras, lo que hace que se requiera probar un total de 30 muestras. En
la tabla se muestran los datos.

El modelo que se considera para esta situación es el siguiente. Se tomaron 6 observaciones


de cada una de las 5 poblaciones, con medias 𝜇1 , 𝜇2 , … , 𝜇5 respectivamente, probar si

Observación:

En el procedimiento del análisis de varianza se supone que cualquier variación que exista
entre los promedios de los agregados se atribuye a

1) la variación en la absorción entre observaciones dentro de los tipos de agregados, y

2) la variación entre los tipos de agregados, es decir, a las diferencias en la composición


química de los agregados.

Por supuesto, la variación dentro de los agregados se debe a varias causas. Quizá las
condiciones de temperatura y humedad no se mantuvieron constantes durante el
experimento. Es posible que haya habido cierta cantidad de heterogeneidad en los lotes de
materias primas que se usaron.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

En todo caso debe considerarse la variación dentro de la muestra como una variación
aleatoria o al azar. Parte del objetivo del análisis de varianza consiste en determinar si las
diferencias entre las 5 medias muestrales son lo que se esperaría debido sólo a la variación
aleatoria o si, más bien, se trata de una variación más allá de los simples efectos del azar,
como las diferencias en la composición química de los agregados.

SOLUCION:

Decisión: rechazar la hipótesis nula y concluir que los agregados no tienen la misma media
de absorción.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

Contraste, Contraste Ortogonal.


El análisis de varianza en la clasificación de un solo factor, o experimento de un solo factor,
como se le denomina con frecuencia, tan sólo indica si puede rechazarse o no la hipótesis de
medias de tratamientos iguales. Por lo general, el experimentador preferiría efectuar un
análisis más profundo.

Como ilustración, en el ejemplo anterior, mediante el rechazo de la hipótesis nula, se


concluye que las medias no son iguales, pero aún no se sabe en dónde residen las diferencias
entre los agregados. Es probable que el ingeniero intuya de antemano que los agregados 1 y
2 deberían poseer propiedades similares de absorción, al igual que los agregados 3 y 5. Sin
embargo, sería interesante estudiar las diferencias entre los dos grupos. Así, parece
apropiado probar las hipótesis

Se observa que la hipótesis es una función lineal de las medias de la población, en las cuales
los coeficientes suman cero.

DEFINICION:

Con frecuencia el experimentador puede hacer comparaciones múltiples probando la


significancia de los contrastes de las medias de los tratamientos, es decir, probando una
hipótesis del tipo:
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

DEFINICION:

Ejemplo 2:

Remítase al ejemplo 1 y calcule la suma de cuadrados de los contrastes que corresponden a


los contrastes ortogonales
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

Y efectúe las pruebas de significancia adecuadas. En este caso es de interés comparar los dos
grupos (1, 2) y (3, 5). Un contraste importante e independiente consiste en realizar la
comparación entre el conjunto de agregados (1, 2,3,5) y el agregado 4.

TABLA ANOVA

De la tabla ANOVA se observa que las dos sumas de cuadrados de los contrastes explican casi
toda la suma de cuadrados de los agregados. Existe una diferencia significativa entre las
propiedades de absorción de los agregados, y el contraste 𝜔1 es significativo marginalmente.
Sin embargo, el valor de f es 14.12 para 𝜔2 es muy significativo, y se rechaza la hipótesis nula.
Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
UNI-IES

Los contrastes ortogonales permiten al profesional dividir la variación del tratamiento en


componentes independientes. Por lo general el experimentador tiene interés en hacer
ciertos contrastes. Eso ocurrió en nuestro ejemplo, donde las consideraciones a priori
sugerían que los agregados (1, 2) y (3, 5) constituían grupos distintos con propiedades
diferentes de absorción, un planteamiento que no obtuvo mucho respaldo con la prueba de
significancia.

Sin embargo, la segunda comparación apoyó la conclusión de que el agregado 4 parecía


“destacar” de los demás. En este caso no fue necesaria la partición completa de SCT, dado
que dos de las cuatro comparaciones independientes posibles explicaban la mayor parte de
la variación en los tratamientos.

También podría gustarte