5 - Unidad1 - Fase2. Unad. Econometría-MODELOS DE REGRESIÓN LINEAL SIMPLE Y MÚLTIPLE

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 48

ECONOMETRÍA

UNIDAD 1: FASE 2 - MODELOS DE REGRESIÓN LINEAL SIMPLE Y MÚLTIPLE

ALEJANDRA CRISTANCHO

MAYID ERASMO CARVAJAL

MARLY YISELA SALAZAR MONTES

CARLOS ANDRÉS GÓMEZ PEÑALOZA

GRUPO: 105010_5

DIRECTOR: JUAN DAVID PULIDO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

PROGRAMA: ECONOMÍA
Actividades a desarrollar

1. Participar en el foro de la fase construyendo el trabajo


colaborativamente, lo que significa NO repartirse los ejercicios, ni los
puntos teóricos.

2. Leer comprensivamente las lecturas propuestas en la bibliografía,


especialmente, los capítulos 2 y 3 de Wooldridge (2010) y también,
los capítulos 2 y 3 de Gujarati (2009).
CUESTIONARIO

“a) Qué es un coeficiente beta? Por qué la prueba de


significancia se basa en la hipótesis de que beta es igual a cero?”

El coeficiente beta corresponde a los parámetros muéstrales o


estimadores (el de la pendiente y el intercepto, β 1 y β 0 respectivamente).
Es decir, son las variables para hallar a través del cálculo.
Así mismo, si los datos inician en el origen, no posee el coeficiente del
intercepto y el modelo no debe llevar βo.
“La beta tiene como valor de relación el número 1 y si el resultado en su
cálculo es mayor a 1 se supondrá mayor volatilidad y por ende mayor
riesgo, cuando es igual a 1 la rentabilidad de la acción tiene movimiento
en la misma proporción que el índice de referencia, por otro lado, dado
que el coeficiente beta por su formula la varianza del mercado no puede
dar cero, la función beta se aproxima al cero mas no da cero.”

“B) Apoyándose en la función de la recta en la matemática,


explique qué es el intercepto y qué es la pendiente, y
relaciónelos con los coeficientes beta de los modelos de
regresión”

Según: Y = Bo + B1x + u
El coeficiente B1 es la pendiente de la recta, se explica, como el cambio
medio que se produce en la variable Y por cada unidad de cambio que
se produce en x. El coeficiente Bo es el punto en el que la recta corta el
eje vertical.
En otras palabras,
Bo: es la constante del modelo. Punto donde la recta de regresión
intersecta el eje Y. En síntesis, es el valor que toma la variable
dependiente Y cuando todos los valores son iguales a cero.
B1: parámetro de la pendiente en relación entre Y e X. Representa el
cambio en el promedio de la variable dependiente Y cuando el factor X
se incrementa en una unidad, manteniendo fijo el resto de los
regresores.

“C) Qué significa el concepto de “determinación” en


econometría, y por tanto, qué mide el coeficiente de
determinación? Y cómo se interpreta?”

“El coeficiente de determinación r^2 (caso de dos variables) o R^2


(regresión múltiple) es una medida comprendida que dice cuán bien se
ajusta la línea de regresión muestral a los datos.” (Gujarati, 2009, p.73)
Con lo anterior, es importante mencionar que cuando un modelo de
regresión es construido con el objeto de predecir, al investigador le
interesa encontrar una medida de la bondad de ajuste de los resultados
del modelo. Una medida muy común de esta bondad de ajuste es el
coeficiente de determinación o R^2, la cual proporciona información
respecto a que tan bien la línea de regresión muestral se ajusta a los
datos.
Para el caso de un modelo de regresión lineal simple se denota como
r^2 y donde r es el coeficiente de correlación lineal entre las variables Y
y X. Debido a que el r^2 bajo los supuestos de modelo de regresión
clásico se encuentra entre 0 y 1, la manera de interpretarlo es en
porcentaje, argumentándose que dicho valor refleja la magnitud
porcentual de la variación de la variable Y explicada por la variable X.
“D) ¿Qué significa causalidad estadística?”

La causalidad se refiere a una relación de necesidad de concurrencia


(simultaneidad) de dos variables estadísticas correlacionadas, probar
causalidad entre dos variables implica además de que guarden una
correlación positiva.
La correlación implica que si tenemos dos variables (A y B) existe
correlación entre ellas si al disminuir los valores de A lo hacen los de B y
viceversa. La correlación entre dos variables no implica, por si misma,
ninguna relación de causalidad.

“E) Cuál es la diferencia entre el modelo simple y el modelo


múltiple? y de dos ejemplos, a través de ecuaciones, donde se
especifiquen las variables”

El modelo simple estudia la dependencia de una variable respecto de


una única variable explicativa.
El modelo múltiple estudia la dependencia de una variable respecto de
más de una variable explicativa.
Para el primer caso, el modelo que relaciona el salario con la antigüedad
en el empleo y con otros factores no observados:

Salario= β 0+ β 1Antiguedad + u

Si el salario se mide pesos y antigüedad se mide en años, entonces B1


mide la variación en el salario por cada año de antigüedad en el empleo,
cuando los demás factores permanecen constantes.

Para el caso 2, se tendría lo siguiente:


Salario= β 0+ β 1Antigüedad + β 2expLabo + u

El modelo relaciona el salario con la antigüedad en el empleo y la


experiencia laboral y con otros factores no observados. Se observa que
B2 mide la variación en el salario dada la experiencia laboral junto a B1
que mide la variación en el salario por cada año de antigüedad.

“F) Cuál es la relación entre coeficiente de correlación y


coeficiente de determinación?”

El coeficiente de correlación mide como de fuerte es la relación lineal


entre dos variables y el coeficiente de determinación o bondad del
ajuste mide cuanta varianza explica un modelo cualquiera. El coeficiente
de determinación coincide con el cuadrado de correlación solo para
modelos lineales entre dos variables.

“g) Cuál es la diferencia de cálculo entre el coeficiente de


determinación y el coeficiente de determinación ajustado?”

Coeficiente de determinación r𝟐
Este se basa en la siguiente descomposición:
SCT=SCE + SCR
Suma de cuadrados totales (SCT): Es la variación total de los valores
reales de Y respecto de su media muestral
Suma de cuadrados explicada (SCE): variación de los valores de Y
estimados alrededor de su media, que apropiadamente puede llamarse
la suma de cuadrados debida a la regresión, es decir debida a la
variable(s) explicativa(s) o explicada por esta.
Suma de cuadrados de los residuos (SCR): La variación residual o no
explicada de los valores de Y alrededor de la línea de regresión
O también como (Gujarati, 2009, p. 75):

R cuadrado ajustado (Coeficiente de determinación ajustado)


El R cuadrado ajustado nos dice qué porcentaje de variación de la
variable dependiente es explicado colectivamente por todas las variables
independientes.
R2 a    →  R cuadrado ajustado o coeficiente de determinación ajustado

R2       →  R cuadrado o coeficiente de determinación

n         →  Número de observaciones de la muestra

k         →  Número de variables independientes


Resolver los ejercicios de Gujarati (2009): 2.10, 2.12, 2.15 y
2.16.

La conclusión general respecto al diagrama anterior implica que la línea


de regresión es de carácter positivo, con tendencia creciente respecto a
los datos dados, esto indica, que las naciones que más exportan
manufacturas tienen un mayor crecimiento respecto al salario real.
Al haber solo tomado en cuenta 50 países para realizar la regresión, se
está frente a un modelo de regresión muestral.
En la gráfica, lo que se puede apreciar es una relación inversa entre el
salario mínimo y el PIB per cápita, se ve que hay una mala distribución
de los recursos dentro de estos países. Lo que se convierte en un tema
con bastante que debatir porque los salarios mínimos pueden depender
de su efecto sobre el empleo, la naturaleza de la industria donde se
impone y la fuerza del gobierno hace que se cumpla.
Gasto en Comida
7000000

6000000

5000000
Gasto en Comida

4000000 f(x) = 0.44 x + 942087.77


R² = 0.37 Gasto en Comida
3000000 Linear (Gasto en Comida)

2000000

1000000

0
2000000 4000000 6000000 8000000 10000000
Gasto Total

Se puede observar que hay una relación entre los gatos en comida con los
gatos totales proporcionalmente directa, ya que entre mayor es el gasto total
el gasto en comida aumenta

Según lo establecido en Excel, la fórmula es; [y : 0.4368x + 942088; con un


R2 de 0.3698]
No existe una relación lineal indefinida porque al satisfacer las necesidades de
alimentación de las personas, estos gastos tienden a disminuir ya que los
individuos deciden destinar su dinero en otra variedad de productos o bienes
en conclusión se denota que los gatos totales sobrepasan o llegan a 700 rupias
existe gran variabilidad con respecto a una relación lineal.
Hombres-Lectura Crítica
535
530
525
520
Calificaciones

515
510
505
500
495
490
485
1970 1975 1980 1985 1990 1995 2000 2005 2010
Años

Mujeres- Lectura Crítica


540
530
520
Calificaciones

510
Mujeres
500
490
480
470
1970 1975 1980 1985 1990 1995 2000 2005 2010
Años
Hombres - Matemáticas
540
535
530
Calificaciones

525
520 Hombres
515
510
505
500
1970 1975 1980 1985 1990 1995 2000 2005 2010
Años

Mujeres
510

500

490
Calificaciones

480 Mujeres

470

460

450
1970 1975 1980 1985 1990 1995 2000 2005 2010
Años
.

Con el transcurrir de los años, la proporción denotada, tanto para el género masculino como para
el femenino, en relación a las puntuaciones verbales reflejan una estimado a la baja, en los años
de 1980 especifican niveles muy bajos, los puntajes tanto para las matemáticas para los hombres y
las mujeres parecen señalar una tendencia al alza, aunque hay que recalcar que se presentan
variaciones año tras año.

Se podría hacer el modelo de regresión simple de la lectura crítica con las matemáticas, de la
puntuación en ambos sexos.
Comparación Mujeres- hombres en matemáticas
560

540

520

Hombres
500
Mujeres
Axis Title
480

460

440

420
1970 1975 1980 1985 1990 1995 2000 2005 2010

Como muestra el gráfico, con el tiempo, los dos resultados obtenidos se han movido en la
misma dirección.
Comando Inicial:

regress lsalary lsales lmktval

La ecuación se presenta de la siguiente manera:


Log( salario)= 4.620917 + 0.162128 log(sales) + 0.106708 log(mktval)
+u
N= 177 y R2= 0.2991
La variable profits no puede incluirse en el modelo en forma logarítmica
porque presenta valores negativos y no es posible realizar el logaritmo
natural de un número menor a cero.

Se introduce el siguiente comando:


regress lsalary lsales lmktval profits

Al añadir profits (utilidades de la empresa) la ecuación es la siguiente:


Log( salario)= 4.686924 + 0.161368 log(sales) + 0.097529 log(mktval)
+ 0.0000357profits+u
N= 177 y R^2= 0.2993

Como se observa, ambos modelos (el primero sin profits y el segundo


incorporando esta variable) presentan un R Cuadrado de 0,2991 y
0,2993. Si se recuerda, el R Cuadrado estima qué parte del
comportamiento de la variable dependiente es explicada por las
variables independientes introducidas en el modelo. Es así que las
variables independientes seleccionadas para el modelo 1 y 2 tienen un
poder explicativo de apenas el 29,9%.
regress lsalary lsales lmktval profits ceoten

La ecuación que se obtiene es:

Log (salary) = 4.557780+0.162239log (sales)+0.1017598log(mktval)


+0.0000291profits + 0.011685ceoten
N= 177
R^2= 0.318
Por cada año adicional, y dejando las demás variables iguales, el salario
aumentaría en un 1.168%
Hay que recordar que el coeficiente de correlación muestral estima la
dependencia lineal entre dos variables. En el caso observado, un
coeficiente de 0,77 se valora alto, pues está cerca de 1 que indicaría que
la correlación muestral entre las dos variables es total y por tanto se
violaría el supuesto de no colinealidad perfecta. De acuerdo a esto, lo
estimadores de MCO corren el riesgo de no expresar claramente el
efecto sobre la variable dependiente debido a un cambio en alguna de
las dos variables independientes; si existiera una relación lineal perfecta
entre las dos variables los estimadores no serían insesgados.
summarize atndrte priGPA ACT
regress atndrte priGPA ACT

En forma de ecuación es:

atndrte=75.700405+17.260591prigpa+ -1.7165529 act +u


El intercepto tiene un valor B0 de 75,7. Se puede interpretar como el valor
predicho para la variable atndrte cuando las variables priGPA y ACT son iguales a
cero. Dicho de otro modo: el intercepto 75,7 es la predicción del porcentaje de
asistencia a clases si la calificación promedio general acumulada y el examen de
admisión a la universidad son ambos cero. Este intercepto no tiene mucha utilidad
si se tiene en cuenta la lógica detrás del modelo, pues sería incoherente que un
individuo tuviera cero en su promedio de notas y sacara cero en su examen de
admisión a la universidad, pero tuviera un promedio de asistencia a clases de
75,5%, si dicha situación se diera, ni siquiera podría entrar matricularse en la
Universidad.

.
Los coeficientes de pendiente estimados son:
- 17.260591*priGPA
- -1.7165529*ACT

El coeficiente de ACT (calificación en el examen de admisión a la universidad) es negativo


lo cual causa sorpresa porque a simple vista no es lógico que entre más alta sea la
calificación en el examen para entrar a la universidad menor sea el promedio de asistencia a
clases de una persona.
atndrte=75.700405+17.260591prigpa+ -1.7165529 act +u
atndrte= 75.700405 + 17.260591(3.65) + -1.7165529(20)
atndrte= 104.3705

Si priGPA = 3.65 y ACT = 20, el atndrte = 104.3705. Este resultado es


incoherente porque el promedio de asistencia a clases no puede ser
superior a 100%. Hay 60 observaciones con ACT = 20 y no hay
observación con priGPA = 3.65 y ACT = 20
priGPA ACT

4. 2.61 20
16. 2.33 20
57. 2.48 20
72. 2.12 20
76. 1.96 20

82. 2.12 20
83. 3.35 20
86. 2.36 20
91. 2.2 20
102. 2.18 20

115. 2.57 20
123. 2.45 20
124. 3.02 20
131. 2.15 20
137. 2.92 20

162. 2.53 20
164. 2.63 20
170. 2.35 20
171. 2.22 20
181. 2.37 20

189. 1.95 20
194. 2.89 20
212. 2.94 20
227. 2.41 20
247. 2.84 20

249. 2.13 20
252. 2.39 20
254. 2.14 20
257. 2.68 20
261. 2.61 20

264. 2.45 20
285. 2.44 20
304. 3.26 20
305. 3.29 20
308. 2.09 20

327. 2.15 20
374. 2.23 20
385. 1.93 20
387. 2 20
401. 2 20

460. 2.02 20
461. 1.91 20
464. 2.21 20
467. 1.5 20
500. 2.38 20

504. 2.62 20
510. 1.82 20
515. 2.38 20
516. 1.88 20
519. 2.01 20

537. 2.58 20
541. 2.06 20
557. 1.6 20
560. 2.92 20
567. 2.65 20

569. 3.65 20
573. 2.75 20
577. 2.14 20
599. 3.25 20
604. 2.5 20

608. 2.5 20
613. 3.36 20
atndrte=75.700405+17.260591prigpa+ -1.7165529 act +u
atndrte alumno A= 75.700+17.260(3.1)+-1.716(21)
atndrte alumno A= 93.17
atndrte alumno B= 75.700 + 17.260(2.1) + -1.716(26)
atndrte alumno B) 67.33
La diferencia predicha en sus tasas de asistencia es la resta entre
93.17 – 67.33= 25.84
regress IQ educ
El coeficiente de pendiente es 3.533829
ii) regress lwage educ

El coeficiente de pendiente B1 es 0.0598392


i) regress lwage educ IQ

Los coeficientes de educ (B1) es: 0.0391 y el de IQ(B2) corresponde a


0.0058
iv) Verifique que B1 = B1 + B2δ1.
B1 = 0.0391199
B2 = 0.00586313
δ1 = 3.5338292
B1 = B1 + B2δ1
0.0391199 = 0.0391199 + 0.00586313*3.5338292
0.0391199 = 0.0391199 + 0.02071929
0.05983921 = 0.05983921
Psoda= 0.9563+0.114988prpblck+1.60−06 income+u

Tamaño de la muestra: 401


R^2= 0.0642

El coeficiente de (prpblck= 0.1149881), indica un aumento del 11.5%


en el precio de la bebida. Desde mi punto de vista es un aumento
considerable desde la perspectiva económica.
El coeficiente de (prpblck= 0.1149881) en el inciso anterior, en este es
prpblck= 0.0649. Cuando se controla el ingreso la discriminación es
mayor.
Log(psoda)= .793768 + .1215803prpblck + .0765114log(income)+u

Al multiplicar por 100% = 2.43%


Se reduce B prpblck de 0.1215 a 0.0728.Hay una reducción de
proporción de afrodescendientes.
no necesariamente una fuerte correlación entre las variables incita a
eliminar una de las dos.
BIBLIOGRAFÍA

 Wooldrige, J. (2010). Introducción a la Econometría: Un enfoque


moderno, (4a. ed.), Ed. Parafino. Recuperado de
https://s386bc39b85c189f2.jimcontent.com/download/version/14
64323224/module/10581840398/name/Wooldridge_Introduccion-
a-La-Econometria-Un-Enfoque-Moderno-4th.pdf

 Gujarati, D. (2009) Econometría, (5a. ed.), Ed. Mc Graw Hill.


Recuperado de http://www.ebooks7-
24.com.bibliotecavirtual.unad.edu.co/?il=279&pg=1

También podría gustarte