RAUDRY
RAUDRY
RAUDRY
Trabajo Final
Probabilidad y Estadística
Integrantes:
MT AIEE 3°B
1
Tabla de contenidos: No. De páginas
Portada………………………………………………………………………………1
Índice…………………………………………………………………………………2
Introducción………………………………………………………………………..3
Fuentes de variación……………………………………………………………...…8(C)
Suma de cuadrados……………………………………………………………..…..8(D)
Cuadrados medios………………………………………………………………..….8(E)
Estadística de prueba…………………………………………………………..……9(F)
Conclusión……………………………………………………………………………..12
Bibliografía………………………………………………………………………..……13
2
Introducción.
3
Tema #1: Regresión lineal y correlación.
a) Regresión lineal:
La regresión lineal estima los coeficientes de la ecuación lineal, con una o más
variables independientes, que mejor prediga el valor de la variable dependiente.
Por ejemplo:
Correlación:
1. Como primer paso hay que tener bien identificado que es lo que está
pasando.
2. Tienes que encontrar con que variables trabajar, tienen que tener alguna
relación.
3. Ya que tengas claro con que variables trabajar, ahora falta tener los
valores de estas variables, solo que tienen que ser dados en el mismo
tiempo para que estas presenten relación.
4. Ya hay que pasar tus variables al plano cartesiano, en el eje X va la
variable independiente (aquella que no es influenciada por la otra), y en el
eje Y se coloca aquella variable dependiente la cual es influenciada por la
otra, y así ya podríamos tener distribuidas nuestras variables, cada quien
en su eje.
5. Determina el coeficiente de correlación: El coeficiente de correlación debe
verse reflejado en la forma que toma el gráfico de dispersión. Es el cociente
4
de la covarianza y la multiplicación de la desviación típica de las dos
variables. Con Excel logramos calcularlo de manera muy simple.
6. Analizamos: Con base en el coeficiente y en el gráfico, definimos cuál es la
relación de las dos variables y tomamos las decisiones pertinentes.
5
El objetivo es utilizar los datos para trazar una línea que represente mejor la
relación entre las dos variables. Ῡ=a + bX
El propósito de un análisis de regresión es calcular los valores de a y b para
desarrollar una ecuación lineal que se ajuste mejor a los datos.
6
Tema #2: Diseño de experimentos.
a) Explicar el concepto de diseño de experimentos.
Una hipótesis es una declaración relativa a una población. La prueba de hipótesis
comienza con una afirmación, o suposición, sobre un parámetro de la población,
como la media poblacional.
-Pasos para probar una hipótesis.
1. Se establecen las hipótesis nula y alternativa
2. Se selecciona un nivel de significancia
3. Se idéntica el estadístico de la prueba
4. Se formula una regla para tomar decisiones
5. Se toma una muestra; se llega a una decisión
6. No se rechaza H0 o se rechaza H0 y se acepta H1
7
c) Fuentes de variación;
Estas pueden ser controladas o aleatorias, las controladas son aquellas en las que
se puede tener la manipulación en tus manos, ya sea bajo una orden o alguna
constante, y las aleatorias son aquellas en las que no se sabe cuál será su
próximo valor.
d) Suma de cuadrados.
La suma total de los cuadrados = suma de los cuadrados del tratamiento (SST) +
suma de los cuadrados del error residual (SSE)
e) Cuadrados medios.
8
El cuadrado medio del error (MSE) se obtiene dividiendo la suma de los cuadrados
del error residual entre los grados de libertad. El MSE representa la variación
dentro de las muestra
f) Estadística prueba:
El objetivo del ANOVA es comparar los diversos valores medios para determinar si
alguno de ellos difiere significativamente del resto.
9
SST es la suma de las diferencias al cuadrado de cada resultado individual
respecto a la media de todos los resultados.
SSR mide las desviaciones entre los resultados individuales (xkj), de cada
laboratorio (donde j indica el nº de repetición) y la media del laboratorio (xk) y, por
lo tanto, es una medida de la dispersión dentro de los laboratorios. Cuando se
divide SSR por los correspondientes grados de libertad, (N - K), se obtiene el
cuadrado medio (o MS, del inglés Mean Square) "dentro de los laboratorios", MSR
SSlab mide las desviaciones entre los resultados medios de los laboratorios y el
resultado medio global y, dividido por sus grados de libertad, (k - 1)
Se calculan, por tanto, MSlab y MSR como una medida de las dispersiones
comentadas y se comparan mediante una prueba de hipótesis F.
Como Fcal > Ftab, en este caso se podría concluir que al menos uno de los
laboratorios ha producido resultados la media de los cuales difiere de forma
estadísticamente significativa del resto de laboratorios.
10
Hemos visto que el ANOVA puede utilizarse para comparar entre sí las medias de
los resultados obtenidos por diversas variables
11
Conclusión
Esperamos y este trabajo les haya sido servido para su información, logramos ver
todos los conceptos que aquí se requerían y confiamos en nosotros en que hayan
estado bien planteados.
12
Bibliografía.
13