Tarea 2 Regresiones Lineales
Tarea 2 Regresiones Lineales
Tarea 2 Regresiones Lineales
ESTADÍSTICA II
ESTUDIANTES: Darío Alexander Hoyos – 1927521
Felipe Burgos González – 1927520
Juan Diego Segura – 1926690
TEMA: REGRESIONES LINEALES
TAREA #2
A partir del desarrollo de las operaciones paso a paso para hallar los coeficientes b 1 y b0
que componen la recta de regresión lineal, obtenemos que:
n
∑ ( xi∗y i )−nx̄ȳ
b 1= i=1n
2
∑ ( x i )2−n x̄
i=1
- Lo cual nos indica que la recta de regresión tiene una pendiente aproximada de
1,5324.
b 0=6,7434
^y =1,5324 x +6,7434
Al graficar el conjunto de datos de la temperatura y la azúcar convertida desde las
herramientas de Excel, podemos observar que fórmula de la recta asignada es el mismo
resultado que la recta obtenida a través de los procedimientos.
b) Analice el 𝑅2
A partir del ^y obtenido del modelo, podemos obtener los valores de la Suma de los
Cuadrados del Error y la STCC, para así poder hallar el R2:
n
2
SCE=∑ ( y i− ^y i) SCE ≅ 0,7864
i=1
n
2 2 SCE
STCC=∑ ( y i − ý ) STCC ≅ 8,77 R =1−
i=1 STCC
0,7864
R2=1−
8,77
R2 ≅ 0,9103 ≡91,03 %
Al ser el porcentaje de efectividad ¿ 0,9nos indica que es un porcentaje ideal y que por tanto
el ajuste sería bueno. Es decir, que en este estudio esa recta de regresión tendría una
efectividad del 91% de representar la relación entre las variables de temperatura y azúcar
convertida.
c) Usando la recta estime la cantidad de azúcar convertida si se usa una temperatura
de 1.74.
Con base a la respuesta anterior, al haber afirmado que la recta de regresión es una buena
opción para representar la relación de las dos variables, podemos estimar la cantidad de
azúcar convertida reemplazando el 1,74 en la variable X de la función.
^y ( x ) =1,5324 x+ 6,7434
Primero, para encontrar el intervalo de confianza del 95% de β 0 se deben de hallar los
siguientes datos para después reemplazarlos en la fórmula siguiente.
n n
b 0−t α
2
S
√n S xx √ ∑ x 2i < βo < b0 +t α
i=1 2
S
√n S xx √ ∑ x 2i
i=1
n
Ahora, debemos de hallar el único término que no tenemos, el cuál es
√∑i=1
x 2i , para lo cual
elevamos cada uno de los términos de la columna x, los sumanos y finalmente le sacamos
raíz cuadrada, obteniendo finalmente el resultado: 7,24
Reemplazando los valores hallados anteriormente se obtiene lo siguiente:
0,23701 0,23701
6,743382353−(2,145) (7,24)< β o <6,743382353+( 2,145) (7,24 )
√(16)3,4 √(16)3,4
Resolviendo y simplificando lo anterior, finalmente conseguimos un intervalo de confianza
del 95% para β 0
6,244425957< β o <7,242338749
Primero, para encontrar el intervalo de confianza del 95% de β 1 se deben de hallar los
siguientes datos para después reemplazarlos en la fórmula siguiente.
S S
b 1−t α < β 1 <b1 +t α
2 √ S xx 2 √ S xx
Para hallar S xx , S yy y S xy debemos de crear una nueva columna para cada una de ellas en la
tabla propuesta por el problema, siendo S xx , S yy sacar el promedio de cada una de las
variables, restarla con cada uno de los datos y después sumar los resultados. Para S xyes la
diferencia de las variables con el mismo proceso anterior.
Para hallar S se debe de seguir el siguiente procedimiento.
2 S yy −b1 S xy
S=
n−2
Teniendo en cuenta que los datos son los siguientes: S yy =8,77 , b1=1,532 , S xy =5,21 ,n=16.
Reemplazamos, para poder así obtener S .
8,77−( 1,532352941 ) .5,21
S2 =
16−2
S=0,237011328
Ya habiendo hallado S, volvemos a la formula inicial:
S S
b 1−t α < β 1 <b1 +t α
2 √ S xx 2 √ S xx
h) Use una prueba de hipótesis de 5% para verificar que 𝛽0≠0. ¿Qué interpretación
tiene el intercepto con el eje 𝑦 en este caso?
α
H0: β0 =0 Ha: β0 ≠0 α= 0,05 =0,025
2
t 0,025;14 = 2,145
- Región de rechazo: tc < -t 0,025;14 0 tc > t 0,025;14
tc < -2,145 0 tc > 2,145
b 0−B 0 6,7434
n 0,2370
tc = (7,2387) = 28,991
S
√ nSxx √ ∑ Xi 2
i=1
=
√ 16 ( 3,4 )
Se tiene que tc = 28,991 y que 28,991>2,145 por tanto tc cae en la región de rechazo de H0 y
se acepta Ha, indicando que β0 ≠0 de manera que la recta no parte del origen; esto significa
que la relación entre las variables no es directamente proporcional.