Regresion Lineal PDF
Regresion Lineal PDF
Regresion Lineal PDF
𝑛 ∑𝑛 𝑛 𝑛
𝑖=1 𝑋𝑖 𝑌𝑖 −∑𝑖=1 𝑋𝑖 ∑𝑖=1 𝑌𝑖
𝐵= 2
𝑛 ∑𝑛 2 𝑛
𝑖=1 𝑋𝑖 − (∑𝑖=1 𝑋𝑖 )
10 ∗ 718 − 91 ∗ 74
𝐵=
10 ∗ 895 − (91)2
𝐵 = 0.67
𝐴 = 𝑌̅ − 𝐵𝑋̅
𝐴 = 7.4 − (0.67) ∗ 9.1
𝐴 = 1.303
𝒀 = 𝟏. 𝟑𝟎𝟑 + 𝟎. 𝟔𝟕𝑿
Interpretación:
El coeficiente A significa que mi consumo mínimo de energía cuando
no tenga ninguna habitación es de 1.303 miles de kW/h.
En el coeficiente B significa por cada incremento en el número de
habitaciones el consumo de energía varia en 0.67.
c. Evalué el consumo (en miles de kilowatts – hora), para una casa de 11 habitaciones.
𝑌 = 1.303 + 0.67𝑋
𝑌 = 1.303 + 0.67(11)
𝑌 = 8.673
El consumo para una casa de 11 habitaciones es de 8.673 miles de
kW/h.
10 ∗ 718 − 91 ∗ 74
𝑟=
√10 ∗ 895 − 912 ∗ √10 ∗ 584 − 742
𝑟 = 0.904
Dado que el coeficiente de correlación resulta 0.904 entonces decimos
que la relación que existe entre el número de habitaciones y el
consumo de energía es alta.
𝑅2 = 𝑟 2 ∗ 100
𝑅2 = (0.904)2 ∗ 100
𝑅2 = 81.72 %
obtenido el coeficiente de determinación nos proporciona la siguiente
interpretación que el número de habitaciones nos explica en un 81.72%
el consumo de energía.
e. Diagrama de dispersión de tendencia creciente
Diagrama de dispersion
12
y = 0.6667x + 1.3333
10
CONSUMO DE ENERGIA
0
0 2 4 6 8 10 12 14 16
NUMERO DE HABITACIONES
𝑛 ∑𝑛 𝑛 𝑛
𝑖=1 𝑋𝑖 𝑌𝑖 −∑𝑖=1 𝑋𝑖 ∑𝑖=1 𝑌𝑖
𝐵= 2
𝑛 ∑𝑛 2 𝑛
𝑖=1 𝑋𝑖 − (∑𝑖=1 𝑋𝑖 )
𝑌 = −12.213 + 2.195𝑋
𝑌 = −12.213 + 2.195(40)
𝑌 = $75.587
Las ventas estimadas son de $75.587 cuando se contacta con 40
clientes.
d. Determine e interprete el coeficiente de determinación y de correlación.
𝑟 = 0.975
Dado que el coeficiente de correlación resulta 0.975 entonces decimos
que la relación que existe entre el numero de contactos y las ventas
estimadas es alta.
𝑅2 = 𝑟 2 ∗ 100
𝑅2 = (0.975)2 ∗ 100
𝑅2 = 95.06 %
obtenido el coeficiente de determinación nos proporciona la siguiente
interpretación que el número de contactos nos explica en un 95.06%
las ventas obtenidas en la empresa.
Diagrama de dispersion
25
y = 2.195x - 12.213
20
Ventas(miles de dolares)
15
10
0
0 10 20 30 40 50 60 70
-5
N° de Contactos
𝑋̅ = 3 𝑌̅ = 24
Solución:
a. Determine la variable dependiente(y) y la variable independiente(x):
Y = la producción de artículos
X = numero de ensambladores
𝑛 ∑𝑛 𝑛 𝑛
𝑖=1 𝑋𝑖 𝑌𝑖 −∑𝑖=1 𝑋𝑖 ∑𝑖=1 𝑌𝑖
𝐵= 2
𝑛 ∑𝑛 2 𝑛
𝑖=1 𝑋𝑖 − (∑𝑖=1 𝑋𝑖 )
5 ∗ 430 − 15 ∗ 120
𝐵=
5 ∗ 55 − (15)2
𝐵=7
𝐴 = 𝑌̅ − 𝐵𝑋̅
𝐴 = 24 − (7) ∗ 3
𝐴= 3
𝒀 = 𝟑 + 𝟕𝑿
Interpretación:
El coeficiente A significa que la producción mínima de artículos
cuando no tenga ningún ensamblador es de 3 unidades.
En el coeficiente B significa por cada incremento en el numero de
ensambladores la variación en la producción es de 7.
c. Para 6 operarios ¿Cuál es la producción esperada?
𝑌 = 3 + 7𝑋
𝑌 = 3 + 7(6)
𝑌 = 45
La producción estimada es de 45 unidades cuando se cuenta con 6
ensambladores.
d. Determine e interprete el coeficiente de determinación y de correlación.
5 ∗ 430 − 15 ∗ 120
𝑟=
√5 ∗ 55 − 152 ∗ √5 ∗ 3450 − 1202
𝑟 = 0.927
Dado que el coeficiente de correlación resulta 0.927 entonces decimos
que la relación que existe entre el número de ensambladores y la
producción estimada es alta.
𝑅2 = 𝑟 2 ∗ 100
𝑅2 = (0.927)2 ∗ 100
𝑅2 = 85.93 %
obtenido el coeficiente de determinación nos proporciona la siguiente
interpretación que el número de ensambladores nos explica en un
85.93% la producción obtenida en la fábrica.
e. Diagrama de dispersión con tendencia creciente
Diagrama de dispersion
45
40
y = 7x + 3
Produccion(unidades)
35
30
25
20
15
10
5
0
0 1 2 3 4 5 6
N° de ensambladores
4. El jefe de personal de una empresa cree que existe una relación entre la ausencia al
trabajo y la edad del empleado. Con el propósito de estudiar el problema tomo en
cuenta la edad de diez trabajadores escogidos al azar y contabilizo los días de
ausencia durante el año. Los resultados fueron como se observa en la tabla que
sigue:
𝑋𝑌 𝑋2 𝑌2
N° Edad en años Ausencia en días
1 25 20 500 625 400
2 50 5 250 2500 25
3 35 10 350 1225 100
4 20 20 400 400 400
5 45 8 360 2025 64
6 50 2 100 2500 4
7 30 15 450 900 225
8 40 12 480 1600 144
9 62 1 62 3844 1
10 40 8 320 1600 64
∑ 397 101 3272 17219 1427
𝑋̅ = 39.7 𝑌̅ = 10.1
a. Construya el diagrama de dispersión
Diagrama de dispersión con tendencia decreciente
Diagrama de dispersion
25
20
y = -0.51x + 30.35
15
EDAD (años)
10
0
0 10 20 30 40 50 60 70
-5
Ausencia en dias
𝑌 = 30.35 − 0.51𝑋
𝑌 = 30.35 − 0.51(38)
𝑌 = 10.97 ≈ 11 𝑑𝑖𝑎𝑠
Un trabajador con 38 años se ausentará 11 días durante el año.
d. Si un trabajador falto 3 días al año ¿Qué edad se puede esperar que tenga este
trabajador?
𝑌 = 30.35 − 0.51𝑋
3 = 30.35 − 0.51𝑋
𝑋 = 54 𝑎ñ𝑜𝑠
𝑟 = −0.958
Dado que el coeficiente de correlación resulta -0.958 entonces decimos
que la relación que existe entre la edad en años y la ausencia en días
es alta inversa.
𝑅2 = 𝑟 2 ∗ 100
𝑅2 = (−0.958)2 ∗ 100
𝑅2 = 91.78 %
obtenido el coeficiente de determinación nos proporciona la siguiente
interpretación que la edad de los empleados nos explica en un 91.78%
la ausencia en días de estos a la empresa.