0% encontró este documento útil (0 votos)
179 vistas40 páginas

Regresion Simple y Multiple

El resumen analiza los datos de 15 clientes de una financiera para determinar si el monto del préstamo depende de los ingresos mensuales. Se encontró una alta correlación positiva de 0.78 entre las variables. El modelo de regresión lineal simple fue validado y explica el 61% de la variabilidad de los ingresos. Se concluyó que el monto del préstamo depende significativamente de los ingresos mensuales de los clientes.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como XLSX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
179 vistas40 páginas

Regresion Simple y Multiple

El resumen analiza los datos de 15 clientes de una financiera para determinar si el monto del préstamo depende de los ingresos mensuales. Se encontró una alta correlación positiva de 0.78 entre las variables. El modelo de regresión lineal simple fue validado y explica el 61% de la variabilidad de los ingresos. Se concluyó que el monto del préstamo depende significativamente de los ingresos mensuales de los clientes.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como XLSX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 40

1.

       El gerente de la financiera “Caja Sur” cree que el monto del préstamo depende de los ingresos de
los clientes. Para probarlo selecciona al azar una muestra del monto del préstamo (miles de soles) y el
ingreso mensual (miles de soles) de 15 clientes de la financiera. En la siguiente tabla se muestran los
datos registrados de la muestra:

a)       Presente el diagrama de dispersión. ¿Los datos se aproximan a una regresión lineal?

b)       Presente la ecuación de regresión lineal simple. Interprete el coeficiente de regresión y valide el
modelo al nivel de significación del 5%.

c)       Pruebe el supuesto de autocorrelación. Use un nivel de significación del 5%.

d)       Interprete el coeficiente de correlación y determinación.


e)       Estime el monto promedio de un préstamo si el ingreso del cliente es de 15 mil soles.
Xi Yi
a) 18

Monto del prestamo Ingreso Mensual 16

19.7 3.5 14
18.5 3.7
32.8 12.6 12 f(x) = 0.366684647620274
R² = 0.60917673978818
29 3.8

Ingreso Mensual
40.2 8.9 10
28.3 7.1
28.4 5.6 8
28.2 7.9
35.6 12.5 6
15.4 6.3
19.7 2.4 4
22.8 8.1
42.5 15.4
2
25.6 3.6
15.6 3.4
0
10 15 20

c) SUPUESTO DE AUTOCORRE
Observación et
1 -0.88
2 -0.24
3 3.42
4 -3.99
5 -2.99
6 -0.43
7 -1.97
8 0.41
9 2.29
10 3.50
11 -1.98
12 2.59
13 2.66
14 -2.94
15 0.53

d)

e) Y= -2.85 + 0.37 X
Y= -2.85 + 0.37 (15)
Y= -2.85 + 5.55
Y = 2.7

Si el monto de prestamo de un cliente es de 15


f(x) = 0.366684647620274 x − 2.84781558250909 b)
R² = 0.60917673978818

15 20 25 30 35 40 45
Monto del préstamo

SUPUESTO DE AUTOCORRELACION
et2 et-1 (et - et-1)2
0.76715171765951 𝐷𝑊=(∑▒ 〖 (𝑒_𝑡−𝑒_(𝑡−1))
0.0556254104566 -0.88 0.41
11.7002248340966 -0.24 13.37
〗 ^2 )/(∑▒𝑒_𝑡^2 )
15.88850849181 3.42 54.86
8.9574938180323 -3.99 0.99
0.1843499624946 -2.99 6.57 183.442
DW=
3.86526770856027 -0.43 2.36 85.714
0.16590023015288 -1.97 5.63
5.26171170464276 0.41 3.56 DW= 2.14
12.256104824498 2.29 1.46
3.9040700640022 3.50 29.99 1 ≤ DW ≤ 3
6.69466782567657 -1.98 20.82
7.09539389596443 2.59 0.01 Se concluye que, no hay
autocorrelacion en los
residuos
Se concluye que, no hay
autocorrelacion en los
8.63955148600588 2.66 31.39 residuos
0.2782932602432 -2.94 12.02
85.714 183.442

Coeficiente de correlación Interpretación: Existe una correlación positiva y alta en


Coeficiente de determinación Interpretación: El monto del préstamo explica en un 6

37 X
37 (15)
55

prestamo de un cliente es de 15 000 soles, entonces su ingreso mensual sera de 2 700 soles
Y= -2.85 + 0.37 X

Por cada unidad adicional en el monto del préstamo, los ingresos


mensuales aumentaran a 0.37 soles

Validacion del modelo


H0: B1 = 0
H1: B1 ≠ 0

Como el p-valor (0.000596) es menor a 0.05, entonces rechazamos Ho; es decir el monto del préstamo depende de los ing

(𝑡−1))
na correlación positiva y alta entre el monto del préstamo y el ingreso mensual de los clientes. Esta relación es de un 78%
o del préstamo explica en un 60.9% la variabilidad de los ingresos mensuales de los clientes
o del préstamo depende de los ingresos mensuales de los clientes; por lo tanto modelo de regresión es válido.
relación es de un 78%
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.7804977513 Correlación de Pearson
Coeficiente de determinación R^2 0.60917673979 Coeficiente de determinación
R^2 ajustado 0.57911341208
Error típico 2.56776339723
Observaciones 15

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF
Regresión 1 133.603018 133.603018 20.2631174
Residuos 13 85.7143152 6.59340886
Total 14 219.317333

Coeficientes Error típico Estadístico t Probabilidad


Intercepción -2.84781558251 2.28311605 -1.2473372 0.23427734
Monto del prestamo 0.36668464762 0.0814591 4.50145726 0.0005957

Análisis de los residuales

Observación Pronóstico Ingreso Mensual


Residuos
1 4.37587197561 -0.87587198
2 3.93585039847 -0.2358504
3 9.17944085944 3.42055914
4 7.78603919848 -3.9860392
5 11.8929072518 -2.99290725
6 7.52935994514 -0.42935995
7 7.56602840991 -1.96602841
8 7.49269148038 0.40730852
9 10.2061578728 2.29384213
10 2.79912799084 3.50087201
11 4.37587197561 -1.97587198
12 5.51259438323 2.58740562
13 12.7362819414 2.66371806
14 6.53931139657 -2.9393114
15 2.87246492037 0.52753508
Valor crítico de F
0.0005956997129

Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
-7.780187938876 2.08455677 -7.78018794 2.08455677
0.1907029656078 0.54266633 0.19070297 0.54266633
2. La empresa multinacional Camposol, basa las predicciones de sus ventas
anuales en los resultados oficiales de la demanda total en la industria. A
continuación, se dan los datos de demanda total y las ventas efectuadas por la
empresa en los últimos 11 años.

a)       Interprete el coeficiente de correlación y determinación.


b)    Presente la ecuación de regresión lineal e interprete los coeficientes de
regresión al 10%
c)    Pruebe el supuesto de DW. Use un nivel de significación del 10%.
d)       Si la demanda total es de 300000 toneladas, ¿Qué volumen de ventas se
predeciría usando la recta de regresión calculada?

a)

b)

c)
d)
Y= 0.388 + 0.028 X
Y= 0.388 + 0.028 (300000)
Y= 0.388 + 8400
Y = 8400.39
Xi Yi

Demanda (Miles de TM) Ventas (miles de TM)

200 9
220 6

400 12
330 7
210 5
390 10
280 8
140 4
280 7
290 10
380 14

Coeficiente de correlación
Coeficiente de determinación

Y= 0.388 + 0.028 X

Por cada unidad adicional en la demanda de miles de TM, las ventas efectuadas en los ultimos 11 años de la empresa Campos

H0: B1 = 0
H1: B1 ≠ 0

Como el p-valor (0.00305) es menor a 0.1, entonces rechazamos Ho; es decir que hay una predicción favorable entre la deman

SUPUESTO DE AUTOCORRELACION
Observación et et2 et-1 (et - et-1)2
1 2.99 8.92885403
2 -0.57 0.32977159 2.99 12.69
3 0.36 0.13275561 -0.57 0.88
4 -2.67 7.1146319 0.36 9.19
5 -1.29 1.67202823 -2.67 1.89
6 -1.35 1.83454955 -1.29 0.00
7 -0.26 0.06832271 -1.35 1.19
8 -0.32 0.10546417 -0.26 0.00
9 -1.26 1.59109499 -0.32 0.88
10 1.46 2.1240898 -1.26 7.39
11 2.93 8.56576414 1.46 2.16
32.467 36.282

Y= 0.388 + 0.028 X
Y= 0.388 + 0.028 (300000)
Y= 0.388 + 8400
Y = 8400.39

Si la demanda total es de 300000 toneladas, entonces su volumen de ventas seran de 8 400 TM anual.
Interpretación: Existe una correlación positiva y muy alta entre la demanda y las ventas efectuadas por la empresa Camposol e
Interpretación: La demanda de miles de TM explica en un 64.1% la variabilidad de las ventas efectuadas de la empresa Campo

os 11 años de la empresa Camposol aumentaran a 0.028 miles de TM

redicción favorable entre la demanda de miles de TM y su volumen de ventas de la empresa Camposol en los ultimos 11 años ; por lo tanto
𝐷𝑊=(∑▒ 〖 (𝑒_𝑡−𝑒_(𝑡−1)
) 〗 ^2 )/(∑▒𝑒_𝑡^2 )

36.282
DW=
32.467

DW= 1.12

1<= DW <=3

Se concluye que, no hay autocorrelacion en los residuos


por la empresa Camposol en los ultimos 11 años. Esta relación es de un 80%
uadas de la empresa Camposol en los ultimos 11 años

ltimos 11 años ; por lo tanto modelo de regresión es válido.


Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.800890196197992
Coeficiente de determinación R^2 0.641425106366058
R^2 ajustado 0.601583451517843
Error típico 1.89933692326422
Observaciones 11

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF
Regresión 1 58.0781278 58.0781278 16.099359
Residuos 9 32.4673267 3.60748075
Total 10 90.5454545

Coeficientes Error típico Estadístico t Probabilidad


Intercepción 0.38811881188119 2.06856767 0.18762684 0.85533111
Demanda (Miles de TM) 0.028118811881188 0.00700798 4.01240066 0.00305281

Análisis de los residuales

Observación Pronóstico Ventas (miles de TM)


Residuos
1 6.01188118811881 2.98811881
2 6.57425742574258 -0.57425743
3 11.6356435643564 0.36435644
4 9.66732673267327 -2.66732673
5 6.29306930693069 -1.29306931
6 11.3544554455446 -1.35445545
7 8.26138613861386 -0.26138614
8 4.32475247524753 -0.32475248
9 8.26138613861386 -1.26138614
10 8.54257425742574 1.45742574
11 11.0732673267327 2.92673267
Valor crítico de F
0.003052810336

Inferior 95% Superior 95%Inferior 90.0%


Superior 90.0%
-4.29130636429 5.06754399 -3.40379934 4.18003696
0.0122656663162 0.04397196 0.0152724 0.04096523
3. Las calificaciones en un examen de Estadística Aplicada y el número de
horas de estudio para dicho examen, de una muestra de 14 estudiantes de
una sección de Administración de la UCV, se visualizan en el siguiente
gráfico. ¿Qué podemos concluir sobre la relación de las variables?

Se puede concluir que existe una relacion lineal directa y muy alta entre el tiempo de estudio de examenes y las calificaciones
Estudiantes Tiempo de estudio Calificacion
1 0 2
2 1 3
3 1 4
4 2 8
5 3 12
6 4 14
7 4 15
8 5 12
9 5 18
10 6 13
o de examenes y las calificaciones del examen de estadistica 11 6 16
12 7 15
13 7 19
14 8 20
R= 0.92
Un promotor inmobiliario desea conocer la tasación de los edificios
de las oficinas que quiere vender; para ello selecciona al azar una
muestra de 11 edificios de oficinas entre un total de 1500 edificios
y obtiene los siguientes datos:

a. Estime la ecuación de regresión e interprete cada uno de los


parámetros.
b. Determine cuál de las variables independientes tienen mayor
influencia sobre la variable dependiente.
c. Estime el valor de la tasación de un edificio que cuenta con un área de
2.500 mts2, tres oficinas y dos accesos.

Superficie Mts2
(X1)

2.31
2.333
2.356
2.273
2.402
2.425
2.448
2.471
2.494
2.517
2.54

a) Ecuacion de regresion

Y= 1239841.42 + -506909.93 X 1

En caso de que la superficie Mt

Por cada unidad adicional en la


Por cada unidad adicional en el
Por cada unidad adicional en el
Por cada unidad adicional en lo

b) Consideramos que la variable in

c) Y= 1 239 841.42 + -506 909.93


Y= 1 239 841.42 + -506 909.93
Y= 1 239 841.42 + -1 267 274.
Y= -27 433.41 + 91 706.13 + 5
Y= 64 272.72 + 52 245.02
Y= 116 517.74
Número de Número de Años de Valor en
Oficinas Accesos Antigüedad del dólares
(X2) (X3) Edificio (X4) (Y)

2 2 20 142000
2 2 12 144000
3 1.5 33 151000
3 2 40 360000
2 3 53 139000
4 2 23 169000
2 1.5 99 126000
2 2 34 142900
3 3 23 163000
4 4 55 189000
2 3 22 149000

n de regresion

841.42 + -506909.93 X1 + 30568.71 X2 + 26122.51 X3 + 335.88 X4

de que la superficie Mts2, el numero de oficinas, el numero de accesos y los años de antigüedad de una tasación de 11 edificios sean c

a unidad adicional en la superficie Mts2, el valor en dólares de cada edificio disminuira en $ 506909.93, independientemente del nume
a unidad adicional en el numero de oficinas, el valor en dólares de cada edificio aumentara en $ 30568.71, independientemente de la s
a unidad adicional en el numero de accesos, el valor en dólares de cada edificio aumentara en $ 36122.51, independientemente de la
a unidad adicional en los años de antigüedad, el valor en dólares de cada edificio aumentara en $ 335.88, independientemente de la su

ramos que la variable independiente que tiene mas influencia es el numero de oficinas sobre la variable dependiente que son la venta

239 841.42 + -506 909.93 X1 + 30 568.71 X2 + 26 122.51 X3


239 841.42 + -506 909.93 (2.500) + 30 568.71 (3) + 26 122.51 (2) Si un edificio que cuenta
con un área de 2.500 mts2,
239 841.42 + -1 267 274.83 + 91 706.13 + 52 245.02 tres oficinas y dos accesos,
7 433.41 + 91 706.13 + 52 245.02 entonces el valor de
tasación será de $ 116
272.72 + 52 245.02 517.74.
6 517.74
ación de 11 edificios sean cero, el valor en dólares será de $ 1239841.42

pendientemente del numero de oficinas, el numero de accesos y años de antigüedad del edificio
ndependientemente de la superficie de Mts2, el numero de accesos y los años de antigüedad del edificio
ndependientemente de la superficie de Mts2, el numero de oficinas y los años de antigüedad del edificio
dependientemente de la superficie de Mts2, el numero de oficinas y el numero de accesos

pendiente que son la venta de dolares , ya que su correlacion es superior a de los demas siendo 30568.707 , lo que quiere decir que a m
, lo que quiere decir que a mas numeros de oficinas mas que sube el precio de venta
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.66080914
Coeficiente de determinación R^2 0.43666872
R^2 ajustado 0.06111454
Error típico 63095.8277
Observaciones 11

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 4 1.8516E+10 4628931617 1.16273162 0.4129569
Residuos 6 2.3887E+10 3981083467
Total 10 4.2402E+10

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%


Intercepción 1239841.42 654694.009 1.89377237 0.10709053 -362137.105

Superficie Mts2
(X1) -506909.926 290537.311 -1.74473263 0.13164607 -1217829.12
Número de Oficinas (X2) 30568.7069 26004.0173 1.17553786 0.28430906 -33060.8311
Número de Accesos (X3) 26122.5137 33759.871 0.7737741 0.46844565 -56484.9148
Años de Antigüedad del Edificio (X4) 335.884808 846.943794 0.39658453 0.70539444 -1736.512
or crítico de F

Superior 95%Inferior 95.0%


Superior 95.0%
2841819.95 -362137.105 2841819.95

204009.263 -1217829.12 204009.263


94198.245 -33060.8311 94198.245
108729.942 -56484.9148 108729.942
2408.28162 -1736.512 2408.28162
1.      La Universidad Cesar Vallejo realiza un estudio
para conocer si la cantidad de horas estudiadas y
la cantidad de exámenes de preparación tomados,
están relacionados al puntaje obtenido sus
exámenes finales. Para ellos toma una muestra de
20 estudiantes.

a. Estime la ecuación de regresión e interprete cada


uno de los parámetros.
b.  Determine e interprete el valor de R2 de cada una de
las variables.
c. ¿Considera que el modelo de ecuación de regresión
es adecuado? Justifique su respuesta.
Horas Examenes Puntaje
1 1 76
2 3 78
2 3 85
4 5 88
2 2 72
1 2 69
5 1 94
4 1 94
2 0 88
4 3 92
4 4 90
3 3 75
6 2 96
5 4 90
3 4 82
4 4 85
6 5 99
2 1 83
1 0 62
2 1 76

a)

Ecuacion de regresion

Y= 67.67 + 5.56 X1 + -0.60 X2


En caso de que la cantidad de horas estudiadas y la canti
Por cada unidad adicional en la cantidad de horas estudi
Por cada unidad adicional en la cantidad de exámenes de

b)

c) El modelo de regresión si es adecuado, porque el coeficie


de horas estudiadas y la cantidad de examenes de preparacion tomados sean cero, el puntaje obtenidos en los examenes finales sera de 67
n la cantidad de horas estudiadas, el puntaje aumentara en 5.55, independientemente la cantidad de examenes de preparacion tomados
n la cantidad de exámenes de preparación tomados, el puntaje disminuirá 0.60, independientemente la cantidad de horas estudiadas.

La cantidad de horas estudiadas y la cantidad de exámenes de preparación tomados explica en un 73.4% la varia

adecuado, porque el coeficiente de correlación y el coeficiente de determinación indican que hay una fuerte relación entre los puntajes o
los examenes finales sera de 67.6.
menes de preparacion tomados
ntidad de horas estudiadas.

dos explica en un 73.4% la variabilidad de los puntajes obtenidos en los exámenes finales

rte relación entre los puntajes obtenidos, la cantidad de horas estudiadas y la cantidad de exámenes de preparación tomados en los estud
eparación tomados en los estudiantes de la UCV .
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.85675388358549
Coeficiente de determinación R^2 0.73402721703882
R^2 ajustado 0.70273630139633
Error típico 5.36570326077178
Observaciones 20

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF
Regresión 2 1350.75688 675.378442 23.4581572
Residuos 17 489.443115 28.7907715
Total 19 1840.2

Coeficientes Error típico Estadístico t Probabilidad


Intercepción 67.6735255413327 2.81580223 24.0334796 1.45819E-14
Horas 5.55574829525063 0.8991917 6.17860274 1.01069E-05
Examenes -0.6016868046417 0.91438503 -0.65802346 0.51933523
Valor crítico de F
1.291564735E-05

Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
61.732702136144 73.6143489 61.7327021 73.6143489
3.6586196408627 7.45287695 3.65861964 7.45287695
-2.530870587665 1.32749698 -2.53087059 1.32749698

También podría gustarte