Bocos-U5 Conceptos
Bocos-U5 Conceptos
Bocos-U5 Conceptos
ESTADÍSTICA INFERENCIAL II
Profesor: Bocos Patrón Ramón Agustín.
ALUMNO:
Uc Chan Rafael
UNIDAD V:
Conceptos
NOMBRE DE LA UNIDAD:
Diseño experimental con bloques al azar y diseños factoriales.
2
Introducción
En esta unidad los alumnos de Ing. Gestión Empresarial tendrán una visión concreta acerca
de cómo identificar y analizar las variables dependientes e independientes, ya que nos
muestra aumentar la probabilidad de detectar cambios significativos en la respuesta como
las variables dependen de otras en tantos aspectos de la vida cotidiana, además le brinda
aptitudes y conocimientos generales de la estadística inferencial para que pueda desarrollar
en un ámbito profesional.
3
Competencias específicas a desarrollar
4
Diseño de bloques completos aleatorizados
Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor, es deseable
que las posibles diferencias se deban principalmente al factor de interés y no a otros factores
que no se consideran en el estudio. Cuando esto no ocurre y existen otros factores que no se
controlan o nulifican para hacer la comparación, las conclusiones podrían ser afectadas
sensiblemente.
Por ejemplo, supongamos que se quieren comparar varias máquinas, si cada máquina es
manejada por un operador diferente y se sabe que éste tiene una influencia en el resultado,
entonces es claro que el factor operador debe tomarse en cuenta si se quiere comparar a las
máquinas de manera justa.
Un operador más hábil puede hacer ver a su máquina (aunque ésta sea la peor) como la que
tiene el mejor desempeño, lo cual impide hacer una comparación adecuada de los equipos.
Para evitar este sesgo hay dos maneras de anular el posible efecto del factor operador: la
manera lógica es utilizar el mismo operador en las cuatro máquinas; sin embargo, tal
estrategia no siempre es aconsejable, ya que utilizar el mismo sujeto elimina el efecto del
factor operador pero restringe la validez de la comparación con dicho operador, y es posible
que el resultado no se mantenga al utilizar a otros operadores. La otra forma de anular el
efecto operador en la comparación consiste en que cada operador trabaje durante el
experimento con cada una de las máquinas. Esta estrategia es la más recomendable, ya que
utilizar a todos los operadores con todas las máquinas permite tener resultados de la
comparación que son válidos para todos los operadores. Esta forma de nulificar el efecto de
operadores, recibe el nombre de bloqueo.
Factores de bloque
A los factores adicionales al factor de interés que se incorporan de manera explícita en un
experimento comparativo se les llama factores de bloque. Éstos tienen la particularidad de
que no se incluyen en el experimento porque interese analizar su efecto, sino como un medio
para estudiar de manera adecuada y eficaz al factor de interés.
Los factores de bloque entran al estudio en un nivel de importancia secundaria con respecto
al factor de interés y, en este sentido, se puede afirmar que se estudia un solo factor, porque
es uno el factor de interés.
En un diseño en bloques completos al azar (DBCA) se consideran tres fuentes de
variabilidad:
El factor de tratamientos
El factor de bloque
El error aleatorio
es decir, se tienen tres posibles ¨culpables¨ de la variabilidad presente en los datos. La palabra
completo en el nombre del diseño se debe a que en cada bloque se prueban todos los
tratamientos, o sea, los bloques están completos. La aleatorización se hace dentro de cada
bloque; por lo tanto, no se realiza de manera total como en el diseño completamente al azar.
5
Los factores de bloqueo que aparecen en la práctica son: Turno, lote, día, tipo de material,
línea de producción, operador, maquina, método, etc.
Supongamos una situación experimental con k tratamientos y b bloques. El aspecto de los
datos para este caso se muestra en la tabla 3,1. Considerando una repetición en cada
combinación de tratamiento y bloque.
Modelo estadístico
Cuando se decide utilizar un DBCA, el experimentador piensa que cada medición será el
resultado del efecto del tratamiento donde se encuentre, del efecto al que pertenece y de cierto
error que se espera sea aleatorio. El modelo estadístico para este diseño está dado por:
Hipótesis a probar
La hipótesis de interés es la misma para todos los diseños comparativos, y está pada por:
6
Análisis de varianza
La hipótesis dada se prueba con un análisis de varianza con dos criterios de clasificación,
porque se controlan dos fuentes de variación: el factor de tratamientos y el factor de bloque.
En la tabla 3.2 se muestra el aspecto del ANOVA para diseño DBCA.
El proceso por medio del cual se miden las observaciones de las respuestas se centra en el
diseño estadístico. En general, en los experimentos diseñados estadísticamente, las unidades
experimentales deben seleccionarse en forma imparcial, así como los tratamientos aplicados
a estas, mediante un proceso aleatorio, con el propósito de remover los posibles sesgos
sistemáticos. Es de especial importancia el concepto de repetición. El propósito es medir el
error experimental.
El interés recae también en como asignar las unidades experimentales a los tratamientos (o
viceversa), para asegurar un proceso imparcial. En este contexto surgen dos conceptos
básicos: la asignación debe hacerse con base en un diseño completamente aleatorio, o en un
diseño en bloques completamente aleatorio. En forma general se hace uso de un
procedimiento aleatorio sencillo como la generación de números aleatorios para llevar a cabo
el proceso de asignación. En este modelo está implícito que las condiciones bajo las cuales
será observada la respuesta serán las mismas a lo largo de todo el experimento.
7
La razón de agrupar en bloques es tomar en cuenta, y de esta forma remover, la fuente de
variación en la respuesta que no es de interés, con lo que se incrementa la sensibilidad para
detectar diferencias entre los tratamientos.
Existen varias pruebas estadísticas que permiten comparar las medias de una variable
continua entre dos o más grupos. Cada una de estas pruebas ha sido diseñada para poder ser
aplicada cuando se cumplen una serie de supuestos necesarios, bajo diferentes condiciones
de aplicación. Prácticamente todas las hipótesis que podamos plantear (como comparar las
medias de una característica entre dos grupos) se pueden analizar bajo una base paramétrica
o una base no paramétrica. La decisión de cuándo aplicar una prueba correspondiente a cada
uno de estos grupos, depende básicamente de las características inherentes a la variable que
deseamos analizar. En general, como se ha indicado en capítulos anteriores, las pruebas
paramétricas son más potentes que las pruebas no paramétricas, pero exigen que se cumplan
una serie de supuestos como la normalidad en la distribución de la variable, la
Homocedasticidad (igualdad de varianzas) y la independencia de las observaciones,
requiriendo algunas pruebas que se cumplan todo el conjunto de supuestos o alguno de ellos,
dependiendo de la prueba a utilizar, sin los cuales, estas pruebas pierden todo su potencial y
resulta imprescindible recurrir a sus homólogas no paramétricas. Exceptuando algunas
pruebas que exigen más sofisticación y complejidad de las que las pruebas no paramétricas
pueden ofrecer, casi todas las pruebas disponibles bajo una base paramétrica, disponen de
una homóloga o equivalente bajo una base no paramétrica.
Si los datos que deseamos analizar cumplen los supuestos necesarios establecidos para poder
aplicar pruebas paramétricas, la prueba t de Student para datos independientes o el análisis
de la varianza (ANOVA) son las más indicadas para comparar las medias de una
característica entre dos o más grupos. La prueba t de Student para datos independientes se
utiliza cuando deseamos comparar única y exclusivamente las medias entre dos grupos (por
ejemplo deseamos saber si la altura varía según el género), mientras que el ANOVA resulta
conveniente cuando deseamos comparar las medias entre más de dos grupos (por ejemplo
deseamos saber si las cifras de tensión arterial sistólica difieren según la edad, considerando
a los sujetos en 3 grupos de edad: menores de 35 años, entre 35 y 55 años y mayores de 55
años).
8
Análisis de residuales y verificación del modelo.
Como en cualquier modelo estadístico hay que contrastar que se verifican las hipótesis del
modelo. Esto se hace, básicamente, por medio del análisis de los residuos. Todo lo
estudiado sobre este particular en el modelo de un solo factor (diseño completamente
aleatorizado) sigue siendo válido para este modelo. Se contrastarán las hipótesis de:
Foto Foto Foto Foto Una empresa fotográfica tiene que realizar una
A B C D compra de impresoras de gran calidad que se van a
utilizar en imprimir fotografías digitales. La
Impresora 1 89 88 97 94 empresa tiene ofertas de I = 5 marcas de impresoras
de similares características y precio. Para la
empresa fotográfica es muy importante la
Impresora 2 84 77 92 79
“velocidad de impresión” y, por este motivo, está
interesada en saber si las 5 impresoras ofertadas
Impresora 3 81 87 87 85 tienen la misma velocidad o hay una que es más
rápida. Para responder a esta pregunta decide hacer
un experimento que consiste en elegir una única
Impresora 4 87 92 89 84
muestra de J = 4 fotos e imprimirlas en las 5
impresoras.
Impresora 5 79 81 80 88
9
Diseño de cuadros latinos
La idea básica de estos diseños es la de fracción; es decir, seleccionar una parte del diseño
completo de forma que, bajo ciertas hipótesis generales, permita estimar los efectos que
interesan. Uno de los diseños en bloques incompletos aleatorizados más importante con dos
factores de control es el modelo en cuadrado latino, dicho modelo requiere el mismo número
de niveles para los tres factores. En general, para K niveles en cada uno de los factores, el
diseño completo en bloques aleatorizados utiliza K2 bloques, aplicándose en cada bloque los
K niveles del factor principal, resultando un total de K3 unidades experimentales. Los diseños
en cuadrado latino reducen el número de unidades experimentales a K2 utilizando los K2
bloques del experimento, pero aplicando sólo un tratamiento en cada bloque con una
disposición especial. De esta forma, si K fuese 4, el diseño en bloques completos necesitaría
4 3 = 64 observaciones, mientras que el diseño en cuadrado latino sólo necesitaría 4 2 = 16
observaciones.
Los diseños en cuadrados latinos son apropiados cuando es necesario controlar dos fuentes
de variabilidad. En dichos diseños el número de niveles del factor principal tiene que
coincidir con el número de niveles de las dos variables de bloque o factores secundarios y
además hay que suponer que no existe interacción entre ninguna pareja de factores.
Supongamos que el número de niveles de cada uno de los factores es K. El diseño en cuadrado
latino utiliza K2 bloques, cada uno de estos bloques corresponde a una de las posibles
combinaciones de niveles de los dos factores de control. En cada bloque se aplica un solo
10
tratamiento de manera que cada tratamiento debe aparecer con cada uno de los niveles de los
dos factores de control.
Si consideramos una tabla de doble entrada donde las filas y las columnas representan cada
uno de los dos factores de bloque y las celdillas los niveles del factor principal o tratamientos,
el requerimiento anterior supone que cada tratamiento debe aparecer una vez y sólo una en
cada fila y en cada columna.
Recibe el nombre de cuadrado latino de orden K a una disposición en filas y columnas de K
letras latinas, de tal forma que cada letra aparece una sola vez en cada fila y en cada columna.
A continuación vamos a dar una forma simple de construcción de cuadrados latinos. Se parte
de una primera fila con las letras latinas ordenadas alfabéticamente
Las sucesivas filas se obtienen moviendo la primera letra de la fila anterior a la última
posición (construcción por permutación cíclica), el cuadrado así obtenido es un cuadrado
latino estándar. Un cuadrado latino se denomina estándar cuando las letras de la primera fila
y la primera columna están ordenadas alfabéticamente.
A parte de los cuadrados latinos así obtenidos existen otros cuadrados latinos diferentes,
estándares y no estándares. En el Apéndice B se muestran algunos cuadrados latinos
estándares para los órdenes 3, 4, 5, 6, 7, 8 y 9.
3) Se asignan aleatoriamente los tres factores a las filas, columnas y letras, respectivamente.
11
Diseño de cuadros greco-latinos
El modelo en cuadrado greco-latino se puede considerar como una extensión del cuadrado
latino en el que se incluye una tercera variable de control o variable de bloque. En este
modelo, como en el diseño en cuadrado latino, todos los factores deben tener el mismo
número de niveles K y el número de observaciones necesarias sigue siendo K2. Este diseño
es, por tanto, una fracción del diseño completo en bloques aleatorizados con un factor
principal y 3 factores secundarios que requeriría K4 observaciones. Los cuadrados greco-
latinos se obtienen por superposición de dos cuadrados latinos del mismo orden y ortogonales
entre sí, uno de los cuadrados con letras latinas el otro con letras griegas. Dos cuadrados
reciben el nombre de ortogonales si, al superponerlos, cada letra latina y griega aparecen
juntas una sola vez en el cuadrado resultante. En el Apéndice C se muestra una tabla de
cuadrados latinos que dan lugar, por superposición de dos de ellos, a cuadrados greco-latinos.
Notamos que no es posible formar cuadrados greco-latinos de orden 6.
Donde:
12
Conceptos básicos en los diseños factoriales
Sirve para estudiar el efecto individual y de interacción de varios factores sobre una o varias
respuestas. Se llaman Diseños Factoriales a aquellos experimentos en los que se estudia
simultáneamente dos o más factores, y donde los tratamientos se forman por la combinación
de los diferentes niveles de cada uno de los factores. Los Diseños factoriales se emplean en
todos los campos de la investigación, son muy útiles en investigaciones exploratorias en las
que poco se sabe acerca de muchos factor es. El objetivo de un diseño factorial es estudiar el
efecto de varios factores sobre una o varias respuestas o características de calidad y
determinar una combinación de niveles de los factores en la cual el desempeño del proceso
sea mejor que en las condiciones de operación actuales es decir, encontrar nuevas
condiciones de operación del proceso que eliminen o disminuyan ciertos problema de calidad
en la variable de salida. Los factores pueden ser de tipo cualitativo 'máquinas, tipos de
material, operador, la presencia o ausencia de una operación previa, o de tipo cuantitativo
'temperatura, humedad, velocidad, presión, etc. Para poder estudiar la manera en que influye
cada factor sobre la variable respuesta, es necesario elegir al menos dos niveles de prueba
para cada uno de ellos 'tres máquinas, dos operadores, tres velocidades, dos temperaturas,
etc. Y son el diseño factorial completa se corren aleatoriamente en el proceso todas las
posibles combinaciones que pueden formarse con los niveles seleccionados.
Los factores pueden ser de tipo cualitativo (máquinas, tipos de material, operador, la
presencia o ausencia de una operación previa, etc.), o de tipo cuantitativo (temperatura,
humedad, velocidad, presión, etc.) Para poder estudiar la manera en que influye cada factor
sobre la variable respuesta, es necesario elegir al menos dos niveles de prueba para cada uno
de ellos (tres máquinas, dos operadores, tres velocidades, dos temperaturas, etc.) Con el
diseño factorial completa se corren aleatoriamente en el proceso todas las posibles
combinaciones que pueden formarse con los niveles seleccionados.
Un diseño factorial con dos factores consiste en experimentar con todos los tratamientos que
se obtienen al combinar cada nivel de un factor con los niveles del otro.
13
En ocasiones, el experimentador está interesado en estudiar el efecto sobre la variable
respuesta de varios factores. En estos casos la alternativa a la experimentación clásica, en la
que se estudia el efecto de cada factor en experimentos independientes, es el diseño factorial.
Ejemplo:
Existen dos factores de interés, el primero con K niveles y el segundo con J niveles distintos, el
conjunto de datos del diseño factorial se resume en una tabla del tipo:
14
15
Bibliografía
- http://wpd.ugr.es/~bioestad/wp-content/uploads/BloquesCompletos.pdf
- http://www.revistaseden.org/files/12-cap%2012.pdf
- http://dm.udc.es/asignaturas/estadistica2/sec5_2.html
16