TP N°2 Econometria Fabris

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 16

Modelo

La estimación de este modelo mediante el método matricial y utilizando el programa rstudio. Para ello
tomamos los datos del archivo excel e identificamos variable explicada y variables expplicativas. Luego
de eso armo las matrices según la fórmula correspondiente. Luego realizaré el análisis posestimación
haciendo los respectivos tests para verificar la consistencia del modelo y finalizaré verificando los
supuestos de Gauss-Markov, realizando cambios necesarios y eligiendo un mejor modelo.

Gráficos

En este gráfico se puede observar el consumo real en el eje vertical y el ingreso real en el eje horizontal,
podemos notar una clara relación lineal positiva, cuanto mayor el ingreso, mayor consumo
En este gráfico se puede observar el consumo real en el eje vertical y la riqueza real en el eje horizontal,
podemos notar una clara relación lineal positiva, cuanto mayor la riqueza, mayor consumo

En este gráfico se puede observar el consumo real en el eje vertical y la tasa de interés real en el eje
horizontal, no vemos una relación clara.
Análisis

Los coeficientes de la regresión son los siguientes:

β1=−20 ,6327

β2=0 ,734

β3 =−5,5212

β 4=0,036

Interpretación de los coeficientes:

β1= Es el nivel de consumo real cuando el ingreso real, la tasa de interés real y la riqueza real son 0.

β 2= El consumo real aumenta 0,734 unidades cuando el ingreso real aumenta en una unidad y todas las
demás variables permanecen constantes.

β 3= El consumo real disminuye en 5,5212 unidades cuando la tasa de interés real aumenta en una
unidad y todas las demás variables permanecen constantes.

β 4 = El consumo real aumenta 0,036 unidades cuando la riqueza real aumenta en una unidad y todas las
demás variables permanecen constantes.

Test t de significatividad individual

Se define la matriz de varianzas y covarianzas para poder encontrar la varianza estimada de cada
coeficiente lo que según el estadístico t nos ayudará a calcular el t observado. Si rechazamos la hipótesis
nula, la variable es significativa, es decir, el coeficiente es distinto de 0 en base a una confianza de 0,05, si
no la rechazamos el coeficiente es no significativo.

Obtenemos matriz de varianzas D con lo cual podemos reemplazar en el estadístico para cada
coeficiente y obtener nuestro t observado
Finalmente, concluimos en base a t crítico con confianza 0.95 si rechazamos o no para cada coeficiente

En este caso el intercepto es no significativo, además notar que la variable “interés” si bien es tomada
como significativa dado nuestro nivel de confianza del 0,05 está muy cerca de la zona de no rechazo del
test

Test f de significatividad conjunta

En base a la fórmula del test f de significatividad global calculo el F empírico con los datos que ya tengo.
Reemplazo los R2, N cantidad de elementos, K cantidad de coeficientes. H0 plantea que todos los
coeficientes de la regresión son 0 y h1 plantea que al menos 1 no lo es. En este caso y con estos datos,
rechazo h0, los cooeficientes son significativos.

R2 y R2 ajustado

Calculo R2 que será la variabilidad de Y explicada por el modelo, en este caso nuestras variables
explicativas explican el 99,94% de Y, el R2 ajustado es menor(99,93%) dado que en lugar de medir la
variabilidad lo hace en términos de varianza. Vemos que este modelo ajusta casi perfectamente.

Supuestos Gauss-Markov verificación

1. El modelo es lineal en los parámetros y es el correcto:

Podemos ver que efectivamente el modelo es lineal en los parámetros, ahora debemos verificar
si es el correcto. Para ello, utilizamos el reset test cuya hipótesis nula es que la especificación es
correcta y la hipótesis alternativa indica que debemos cambiarlo. Vemos que se rechaza la
hipótesis nula, el supuesto no se cumple.

2. Autocorrelacion de las perturbaciones:

Para comprobar si las perturbaciones están correlacionadas utilizaremos este test cuya hipótesis
nula es no que existe correlación entre los errores y la alternativadice lo contrario, como rechazo la
hipótesis nula, el supueso no se cumple
3. Homocedasticidad:

Utilizamos este test para ver si la varianza de los errores es constante, la hipótesis nula supone
que hay homocedasticidad, mientras que la alternativa sostiene que las varianzas son diferentes.
En este caso el supuesto no se cumple

4. Test de normalidad:

Pruebo normalidad de la distribución de residuos, si el p valor es superior a mi confianza (0,05),


entonces los residuos son normales, mi hipótesis nula es que hay normalidad. Como el p valor
está muy alejado a la izquierda, no hay normalidad de residuos.

Correcciones al modelo

log ( Y ) =β1+ β2 log ( X2 ) +β3 log ( X3 ) +β4 log ( X4 ) +u

Estimamos un modelo log con todas sus variables logaritmicas, dado que no se cumplia el supuesto de
“El modelo es el correcto” porque no rechazamos la hipótesis nula del reset test y todos los otros
supuestos tampoco se cumplian
Vemos que en este modelo los supestos se cumplen a excepción del de correcta especificación (sigue
fallando el reset test), pero los errores no estan autocorrelacionados, hay homocedasticidad y fuertre
normalidad en los errores con confianza del 0,05.

log ( Y ) =β1+ β2 log ( X2 ) +β3 log ( X3 ) +X 4 +u

Especificamos nuevamente un modelo log, pero con la variable riqueza en niveles, vemos que se
cumplen ahora todos los supuestos de Gauss-Markov pedidos, pero el análisis nos indica que la variable
interés no es significativa, por lo que la eliminaremos.
log ( Y ) =β1+ β2 log ( X2 ) + X4 +u

En esta nueva especificación no se cumple por poco el supuesto de no correlación de errores, pero la
diferencia del valor empírico con su p-valor es despreciable.

En conclusión, este último modelo será el elegido por sobre los otros porque se cumplen todos los
supuestos de Gauss-Markov con una confianza cercana al 0,05 y se eliminan todos los problemas del
modelo principal.
Scripts:

library(readxl)

library(lmtest)

data <- read_excel("C:/Users/tomic/Downloads/02. Econometría - Trabajo Práctico n° 2 - Base de datos


(2C 2023).xlsx",range = "b4:e58")

Y <- as.matrix(data$C)

X <- as.matrix(data[2:4])

plot(data$wealth, Y)

plot(data$interest, Y)

plot(data$Yd, Y)

uno.col <- as.matrix(rep(1,length(X[,1])))

X <- cbind(uno.col, X)

beta_hat <- solve(t(X) %*% X) %*% (t(X) %*% Y) ; beta_hat

#ANALISIS

Y_hat <- X %*% beta_hat

e_hat <- Y - Y_hat ; e_hat

sum(e_hat)

SRC <- t(e_hat) %*% e_hat ; SRC

Y_centrada_cuadrada <- (Y - mean(Y))^2

VT <- sum(Y_centrada_cuadrada)

R2 <- 1 - (SRC / VT) ; R2

N <- length(Y) ; N
K <- length(beta_hat) ; K

R2_ajustado <- 1 - ((1-R2)*((N-1)/(N-K))) ; R2_ajustado

sigma2_hat <- as.vector(SRC/(N-K)) ; sigma2_hat

var_covar <- sigma2_hat * (solve(t(X) %*% X)) ; var_covar

D <- diag(var_covar) ; D

vectorp <- as.matrix(sqrt(D)) ; vectorp

vectorp1 <- 1/vectorp ; vectorp1 ;

m_t <- beta_hat*vectorp1 ; m_t

formula <- 'C ~ Yd + wealth + interest'

resultados <- lm(formula = formula,data= data)

summary(resultados)

#TESTS

t_c <- qt(p = 0.025,

df= N - K

) ; t_c

#Regla de decisión#
ifelse(abs(m_t)>abs(t_c), "Rechazo H0", "No rechazo H0")

num= R2/(K-1)

den= (1-R2)/(N-K)

F_e <- (num)/(den) ; F_e

F_c <- qf(0.95, K-1, N-K) ; F_c

ifelse(F_e>F_c, "RECHAZO H0", "NO RECHAZO H0")

library(tseries)

jarque.bera.test(e_hat)

hist(e_hat)

#RECHAZO SI P VALUE ES MAYOR A 0.05

bgtest(resultados)

bptest(resultados)

resettest(resultados)

#NO SE CUMPLE NINGUN SUPUESTO

#SE CUMPLE TODO MENOS FORMA FUNCIONAL

formula <- 'log(C) ~ log(Yd) + log(wealth) + log(interest)'

resultados <- lm(formula = formula,data= data)

summary(resultados)

errores <- residuals(resultados)

jarque.bera.test(errores)

hist(errores)

#RECHAZO SI P VALUE ES MAYOR A 0.05

bptest(resultados)

resettest(resultados)

bgtest(resultados)

dwtest(resultados)
#EN ESTE MODELO SE CUMPLEN TODOS LOS SUPUESTOS, pero interes es no significativo

formula <- 'log(C) ~ log(Yd) + wealth + log(interest)'

resultados <- lm(formula = formula,data= data)

summary(resultados)

errores <- residuals(resultados)

jarque.bera.test(errores)

hist(errores)

#RECHAZO SI P VALUE ES MAYOR A 0.05

bptest(resultados)

resettest(resultados)

bgtest(resultados)

#EN ESTE MODELO SE CUMPLEN TODOS LOS SUPUESTOS INTERES NO ES SIGNIFICATIVO

formula <- 'log(C) ~ log(Yd) + wealth + interest'

resultados <- lm(formula = formula,data= data)

summary(resultados)

errores <- residuals(resultados)

jarque.bera.test(errores)

hist(errores)

#RECHAZO SI P VALUE ES MAYOR A 0.05

bptest(resultados)

resettest(resultados)

bgtest(resultados)

#Este modelo es con el que me voy a quedar, se cumplen fuertemente los supuestos y elimino variable
no significtiva
formula <- 'log(C) ~ log(Yd) + wealth '

resultados <- lm(formula = formula,data= data)

summary(resultados)

errores <- residuals(resultados)

jarque.bera.test(errores)

hist(errores)

#RECHAZO SI P VALUE ES MAYOR A 0.05

bptest(resultados)

resettest(resultados)

bgtest(resultados)

#CREO QUE INTERES ES NO SIGNIFICATIVA, LA QUITO PARA CORREGIR FORMA FUUNCIONAL

#EN ESTE MODELO SE CUMPLE TODO MENOS FORMA FUNCIONAL Y CON P VALOR MAS BAJO

formula <- 'log(C) ~ log(Yd) + log(wealth)'

resultados <- lm(formula = formula,data= data)

summary(resultados)

errores <- residuals(resultados)

jarque.bera.test(errores)

hist(errores)

#RECHAZO SI P VALUE ES MAYOR A 0.05

bptest(resultados)

resettest(resultados)

bgtest(resultados)

#ESTE ES UN DESASTRE NO SE CUMPLE NADA

formula <- 'log(C) ~ log(Yd)'


resultados <- lm(formula = formula,data= data)

summary(resultados)

errores <- residuals(resultados)

jarque.bera.test(errores)

hist(errores)

#RECHAZO SI P VALUE ES MAYOR A 0.05

bptest(resultados)

resettest(resultados)

bgtest(resultados)

También podría gustarte