Actividad 1 Unidad 4 Estadistica 2
Actividad 1 Unidad 4 Estadistica 2
Actividad 1 Unidad 4 Estadistica 2
NOMBRE DE MATERIA:
Estadística Inferencial II
Nombre de actividad:
Actividad 1
Experimentos con un solo factor (Análisis de Varianza).
Objetivo
El objetivo de esta unidad es comprender los diseños al azar y el análisis de varianza,
la importancia de cada uno de los elemento, al igual que conocer sobre el tema del
tamaño de la muestra para conocer ampliamente los rangos múltiples, la comparación
de contrastes verificando los supuestos del modelo.
• Contraste
• Contrastes ortogonales
• Cuadrados medios
• Diagramas de cajas
• Diseño balanceado
• Método de Sheffé
• Notación de puntos
• Residuos
• Tabla de análisis de varianza
• Tratamiento control
• Varianza constante.
Introducción.
Este diseño se llama completamente al azar (DCA) porque es el más simple de los
diseños que se utilizan en la comparación de dos o más tratamientos.
TRATAMIENTOS
METODO DE ENSAMBLE T1 T2 T3 … Tk
A B C D Y11 Y21 Y31 … Yk1
6 7 11 10 Y12 Y22 Y32 … Yk2
8 9 16 12 Y13 Y23 Y33 … Yk3
7 10 11 11
…
8 8 13 9 Y1n1 Y2n2 Y3n3 … Yknk
Diseño balanceado
Las sumas de cuadrados divididas entre sus respectivos grados de libertad se llaman
cuadrados medios. Los dos que más interesan son el cuadrado medio de tratamientos
y el cuadrado medio del error, que se denotan por los valores esperados de los
cuadros medios están dados por:
Con base en este hecho se construye el estadístico de prueba como sigue: se sabe
que SCE y SCTRAT son independientes, por lo que SCE /s2 y SCTRAT /s2 son dos
variables aleatorias independientes con distribución ji-cuadrada con N – k y k – 1
grados de libertad, respectivamente.
FV SC GL CM Fo Valor-p
Tratamientos k-1
Error N-k
Total N-1
Total 9101.33 23
Total 99 15
Cálculos manuales.
Hay personas que, cuando hacen los cálculos de forma manual, complementan el
entendimiento de un análisis con el apoyo de una calculadora de bolsillo, al menos
para los casos más simples. Para el caso del ANOVA, estos cálculos se facilitan si
primero se obtiene la información básica desplegada en la tabla.
Gráficos de medias.
Para toda i π j. Para k tratamientos se tienen en total k (k – 1)/2 pares de medias. Por
ejemplo, si k = 4 existen 4 × 3/2 = 6 posibles pares de medias. El estadístico de prueba
para cada una de las hipótesis dadas en es la correspondiente diferencia en valor
absoluto entre sus medias muéstrales Y Y i j • • − . Se rechaza la hipótesis H0: mi = mj
si ocurre que
Específica, los intervalos en la gráfica de medias (means plot) con el método LSD se
obtienen con:
De esta forma, si dos intervalos se traslapan, entonces no habrá diferencias entre las
medias de los tratamientos correspondientes. Note que CM n E / se está considerando
como el error o desviación estándar de la correspondiente media muestral.
METODO DE TUKEY
Método de Duncan
Las diferencias observadas entre las medias muéstrales se comparan con los rangos
Rp de la siguiente manera: primero se compara la diferencia entre la media más
grande y la más pequeña con el rango Rk. Luego, la diferencia entre la media más
grande y la segunda más pequeña se compara con el rango Rk – 1.
Estas comparaciones continúan hasta que la media mayor se haya comparado con
todas las demás. Enseguida, se compara la diferencia entre la segunda media más
grande y la media menor con el rango Rk – 1. Después, la diferencia entre la segunda
media más grande y la segunda más pequeña se compara con el valor de Rk – 2, y
así sucesivamente hasta que se comparan los k(k – 1)/2 pares de medias posibles con
el rango que les corresponda. En las comparaciones donde la diferencia observada es
mayor que el rango respectivo, se concluye que esas medias son significativamente
diferentes. Si dos medias caen entre otras dos que no son muy diferentes, entonces
esas dos medias poblacionales también se consideran estadísticamente iguales.
Una vez que se rechaza H0 con el ANOVA, en ocasiones uno de los k tratamientos a
comparar es el llamado tratamiento control y el interés fundamental es comparar los k
– 1 tratamientos restantes con dicho control. En muchos casos el tratamiento control
se refiere a un tratamiento estándar de referencia o también a la ausencia de
tratamiento.
No siempre interesa probar sólo las k(k – 1)/2 hipótesis dos a dos dadas por H vs 0 i j :
. μ μ = H i j 0 i j : μ μ ≠ ≠ para , y no siempre estas hipótesis dos a dos interesan todas
por igual. En ocasiones, el objetivo del estudio lleva a contrastar hipótesis que
involucran a más de dos medias. En esta sección se presentan este tipo de
alternativas en la comparación de medias, pero antes se definen los conceptos de
contraste y contrastes ortogonales.
Contraste
Contrastes Octogonales
C1 C2 C3 C4 Contrastes Octogonales
2 -1 -1 0
0 1 -1 0
1 1 1 -3
Método de Sheffe
Este método está diseñado para probar todos los contrastes de medias que pudieran
interesar al experimentador, sin el inconveniente de inflar por ello el error tipo I
(detección de diferencias que no existen).
Donde la hipótesis nula se puede escribir alternativamente como, lo cual implica que la
hipótesis está definida por el contraste De manera que el contraste estimado está
dado por
Normalidad
Consideremos los N residuos ei que resultan del análisis de una varianza, o cualquier
conjunto de N datos de los cuales se quiere verificar su procedencia de una
distribución normal.
Los pasos para la prueba de Shapiro-Wilks son: 1) Se ordenan los datos de menor a
mayor. Denotemos los datos ordenados por X(1), X(2), …, X(n). 2)
Varianza constante.
Otra gráfica que ayuda a verificar el supuesto es la gráfica de niveles de factor contra
residuos. En el eje X de esta gráfica se ponen los tratamientos o los niveles de un
factor, y en el eje vertical se agregan los residuos correspondientes a cada tratamiento
o nivel de factor. Si se cumple el supuesto de varianza constante, se espera que la
amplitud de la dispersión de los puntos en cada nivel de factor tenderá a ser similar; y
no se cumplirá el supuesto si hay diferencias fuertes en esta amplitud, como se
muestra en la figura 3.6d. En la interpretación de esta gráfica debe considerarse que,
en estadística, las pequeñas diferencias por lo general no son significativas, y también
debe tomarse en cuenta la cantidad de observaciones hechas en cada nivel del factor,
puesto que este hecho puede impactar la dispersión aparente en cada tratamiento.
Prueba de Bartlett para homogeneidad de varianzas.
Supongamos que se tienen k poblaciones o tratamientos independientes, cada uno
con distribución normal (N( mi , s 2 i ), i = 1, 2, …, k), donde las varianzas son
desconocidas. Se quiere probar la hipótesis de igualdad de varianzas dada por:
Observe que el estadístico q, en el numerador del estadístico c2 0, es grande en la
medida de que las varianzas muéstrales S2 i son diferentes y es igual a cero cuando
éstas son iguales. La prueba de Bartlett que acabamos de describir es sensible a la
falta de normalidad de las poblaciones de interés, por lo que debe comprobarse el
cumplimiento de este supuesto.
Independencia
CONCLUSION:
Podemos aprender demasiado de estos temas ya que nos explica con muchos
ejemplos cada uno de los programas tradicionales y de forma entendible. Los
programas son herramientas que ya en la actualidad son muy primordiales para
realizar la vida cotidiana. Se puede ver la evolución un desarrollo de la programación o
uso de excel ya que ahí todo se hace más rápido y eficiente además que es más
sencillo para entender y poderlo aplicar en la vida laboral y personal si se tiene un
negocio propio.
El análisis de varianza sirve para comparar si los valores de un conjunto de datos son
significativamente distintos a los valores de otro o más conjuntos de datos.
El método para comparar estos valores está basado en la varianza global observada
en los grupos de datos numéricos a comparar. El análisis de varianza se utiliza para
asociar una probabilidad a la conclusión de que la media de un grupo de puntuaciones
es distinta de la media de otro grupo de puntuaciones.
BIBLIOGRAFIA.
http://elestadistico.blogspot.com/2007/07/anlisis-de-la-varianza-anova.html