Taller 2 Modelos de Regresion
Taller 2 Modelos de Regresion
Taller 2 Modelos de Regresion
Sede Bogotá
Facultad de ingeniería
Departamento de ingeniería civil y agrícola
Herramientas de modelación en transporte
Enunciado:
1. Se pide aplicar el modelo lineal y uno de los modelos no lineales y realizar las regresiones
con las variables que aparecen en la siguiente tabla:
INDEPENDIENTES
2. Modelar dos tipos de viajes y realizar hasta 4 regresiones con el tipo de modelo no lineal
indicado, además del modelo lineal.
Desarrollo:
1. Para los cuatro casos consignados en la tabla 1, se toma como variable dependiente los
viajes totales (HBTOTAL) y se escoge como modelo de regresión no lineal el modelo
recíproco en Y.
Modelo lineal:
Y = a + bX1 + cX2 + dX3
Modelo no lineal:
Modelo recíproco en Y: Y=1/(a+bX1 + cX2)
Transformación: 1/Y = a + bX1 + cX2
Estadísticas de la regresión
Observaciones 2038
Tabla 3. Estadísticas de la regresión 1,
modelo lineal
HBTOTAL
6 Pronóstico HBTOTAL
4
2
0
0 2 4 6 8 10 12 14 16
HABIT
Estadísticas de la regresión
Coeficiente de correlación 0,51214
múltiple 423
Coeficiente de 0,26229
determinación R^2 171
0,25965
R^2 ajustado 435
0,22650
Error típico 746
Observaciones 1966
Tabla 5. Estadísticas de la regresión 1, modelo recíproco en Y
1
HBTO=
0.739−0.065 Habit −0.05 8 Vehiculos−0.0 19 Hombres+0.015 Mujeres−0.017 Trabajan−0.037 Estu
1. Modelo Recíproco en Y
120
100
80
60
40
HBTOTAL
HBTOTAL
20 HBTOTAL Regresión
0
-20 0 2 4 6 8 10 12 14 16
-40
-60
-80
HABITANTES
Estadísticas de la regresión
0,5725372
Coeficiente de correlación múltiple 6
0,3277989
Coeficiente de determinación R^2 1
0,3268074
R^2 ajustado 7
1,5713542
Error típico 2
Observaciones 2038
Tabla 7. Estadísticas de la regresión 2, modelo lineal
8 HBTOTAL
6 Pronóstico HBTOTAL
4
2
0
0 2 4 6 8 10 12 14 16
HABIT
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,49562459
Coeficiente de determinación R^2 0,24564373
R^2 ajustado 0,24449028
Error típico 0,22881541
Observaciones 1966
Tabla 9. Estadísticas de la regresión 2, modelo recíproco en Y
40 HBTOTAL
HBTOTAL Regresión
20
0
-20 0 2 4 6 8 10 12 14 16
-40
-60
HABITANTES
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,52546756
Coeficiente de determinación R^2 0,27611616
R^2 ajustado 0,27540472
Error típico 1,63024245
Observaciones 2038
Tabla 11. Estadísticas de la regresión 3, modelo lineal
HBTOTAL
5 Pronóstico HBTOTAL
0
0 2 4 6 8 10 12 14 16
HABIT
1
HBTO=
0.731−0.065 Habit −0.012 Ingresos
3. Modelo Recíproco en Y
500
400
300
HBTOTAL
HBTOTAL
200 HBTOTAL Regresión
100
0
0 2 4 6 8 10 12 14 16
-100
HABITANTES
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,55851146
Coeficiente de determinación R^2 0,31193505
R^2 ajustado 0,31125882
Error típico 1,58939731
Observaciones 2038
Tabla 15. Estadísticas de la regresión 4, modelo lineal
8 HBTOTAL
6 Pronóstico HBTOTAL
4
2
0
0 2 4 6 8 10 12 14 16
HABIT
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,48772333
Coeficiente de determinación R^2 0,23787405
R^2 ajustado 0,23709756
Error típico 0,22993218
Observaciones 1966
Tabla 17. Estadísticas de la regresión 4, modelo recíproco en Y
1
HBTO=
0.728−0.065 Habit −0.072 Vehiculos
4. Modelo Recíproco en Y
200
150
100
50
HBTOTAL
HBTOTAL
0 HBTOTAL Regresión
0 2 4 6 8 10 12 14 16
-50
-100
-150
-200
HABITANTES
1.5 De las cuatro regresiones estudiadas se puede inferir que la primera es la mejor,
partiendo del hecho de que el coeficiente de determinación es más alto que en las
demás regresiones, lo que implica una buena correlación entre las variables, además
de que estas variables son representativas en el modelo, pues los valores del
estadístico t son altos y la confianza supera el 95%. Sin embargo, se puede decir que la
cuarta regresión es económica, pues solo tiene dos variables independientes,
habitantes y vehículos, y tiene una buena representatividad, presentando un
coeficiente de determinación cercano a la primera regresión, lo que indica que estas
dos variables (habitantes y vehículos) son las más representativas, tal cual como lo
indican los valores del estadístico t en todas las regresiones, siendo los más altos con
respecto a las demás variables.
El modelo lineal con respecto al modelo recíproco en Y tiene valores más altos de
coeficiente de determinación en todos los casos. Este último modelo presenta valores
atípicos, positivos y negativos, muy por encima o por debajo de los viajes totales
reales, por lo que se puede decir que el modelo lineal resulta ser el más apropiado
para representar los datos.
2.
2.1 Modelo de forma geométrica
Debido a que hay valores igual a cero se suma una unidad a todas las observaciones, con el
fin de utilizar todos los datos.
Probabilida
Coeficientes Error típico Estadístico t d
Intercepció 10^0,0379511
n 8 0,02011279 1,88691789 0,05931395
HABIT 0,65842509 0,02919738 22,5508254 1,128E-100
VEHICULOS 0,23220683 0,01985717 11,6938539 1,2832E-30
-
MUJERES -0,09420737 0,026172 3,59954784 0,00032641
TRABAJAN 0,06359298 0,02752902 2,31003467 0,0209861
ESTUDIAN 0,13183191 0,01776961 7,41895211 1,7258E-13
TRAYEST 0,1031157 0,03795957 2,71646134 0,00665437
INGRESOS 0,06061589 0,01726991 3,50991318 0,00045803
Tabla 20. Coeficientes, estadístico t, y probabilidad de regresión de viajes totales, modelo de forma geométrica
HBTO
6 HBTO Regresión
4
2
0
0 2 4 6 8 10 12 14 16
Habitantes
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,48518273
Coeficiente de determinación R^2 0,23540228
R^2 ajustado 0,23276574
Error típico 0,19084399
Observaciones 2038
Tabla 21. Estadísticas de la regresión de viajes al trabajo, modelo de forma geométrica
HBW Regresión
3
2
1
0
0 2 4 6 8 10 12 14 16
Habitantes
Con el fin de aplicar la transformación en este modelo, se descartan los viajes totales y
viajes al trabajo con valores igual a cero, por lo que las observaciones se reducen a
1967 y 1594 respectivamente.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,56554878
Coeficiente de determinación R^2 0,31984542
R^2 ajustado 0,31845806
Error típico 0,47832414
Observaciones 1966
Tabla 23. Estadísticas de la regresión de viajes totales, modelo logarítmico en Y
Modelo logarítmico en Y
18
16
14
12
10
HBTOTAL
HBTO
8 HBTO Regresión
6
4
2
0
0 2 4 6 8 10 12 14 16
Habitantes
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,41210951
Coeficiente de determinación R^2 0,16983425
R^2 ajustado 0,16721873
Error típico 0,45912146
Observaciones 1593
Tabla 25. Estadísticas de la regresión de viajes al trabajo, modelo logarítmico en Y
Probabilida
Coeficientes Error típico Estadístico t d
Intercepción -0,04366127 0,03642681 -1,1986025 0,2308615
HABIT 0,08605112 0,00731359 11,765921 1,0585E-30
VEHICULOS 0,1083042 0,01290104 8,3949965 1,018E-16
TRABAJAN 0,08743455 0,01201149 7,27924015 5,2595E-13
ESTUDIAN -0,04963271 0,01155425 -4,29562315 1,8477E-05
OTROS -0,05289861 0,01808889 -2,92436913 0,00350053
Tabla 26. Estadísticas de la regresión de viajes al trabajo, modelo logarítmico en Y
Modelo logarítmico en Y
8
7
6
5
HBW
4
HBW
HBW Regresión
3
2
1
0
0 2 4 6 8 10 12 14 16
Habitantes