Slide 10
Slide 10
Sergio Pastorello
10.1 Regressione lineare con x casuali
▶ Nuove ipotesi:
A1 y = β1 + β2 x + e descrive la popolazione
A2 {(xi , yi ), i = 1, . . . , N} è un campione casuale IID
A3 E(e|x) = 0
A5 Var(e|x) = σ
2
A6 e|x ∼ N (0, σ 2 )
10.1 Regressione lineare con x casuali
▶ A2 (campione casuale):
▶ Implica errori incorrelati (MR4)
▶ Non è adatta a serie storiche
▶ A3 è cruciale:
▶ No variabili omesse (correlate con quelle incluse)
▶ La forma funzionale del modello è corretta
▶ e è incorrelato con x
10.1 Regressione lineare con x casuali
▶ Conseguenze di A3:
1. E(e|x) = 0 ⇒ Cov(e, x) = 0
2. Le x incorrelate con e sono dette esogene
3. x non casuali (sse) sono per costruzione esogene
4. Cov(e, x) ̸= 0 ⇒ E(e|x) ̸= 0
5. x correlate con e sono dette endogene
6. Con x endogene, i MQ non possono più essere utilizzati
10.1.1 Distribuzione per N nito dei MQ
y= β1 + β2 x +e
| {z }
modello economico
▶ b2 sovrastima β2 . Perchè?
▶ I MQ attribuiscono ∆y a ∆x
▶ Qui c'è anche ∆e , correlata positivamente con ∆x
∆y = β2 ∆x + ∆e
(+) (+) (+)
y = β1 + β2 (x − u) + v
= β1 + β2 x + (v − β2 u)
= β1 + β2 x + e
▶ Di conseguenza:
Q = β1 + β2 P + e, e Cov(P, e) ̸= 0
N
1 X
µ̂k = E\
(Y k ) = yik
N i=1
E(Y ) = µ1 = µ
2 2 2 2
Var(Y ) = σ = E(Y ) − µ = µ2 − µ
1
σ̂ 2 = yi2 − ȳ 2
X
µ̂ = ȳ e
N
10.3.2 Stima dei momenti nella RS
▶ y = β1 + β2 x + e :
E(e) =0 ⇒ E(y − β1 − β2 x) = 0
Cov(x, e) = 0 ⇒ E[x(y − β1 − β2 x)] = 0
β1 = − β2 E(xi )
E(yi )
PN
i=1 (xi − x̄)(yi − ȳ )
b1 = ȳ − b2 x̄ and b2 =
2
PN
i=1 (xi − x̄)
1.3.3 Stima IV nella RS
β1 = − β2 E(xi )
E(yi )
PN
1 (zi − z̄)(yi − ȳ )
βb1 = ȳ − βb2 x̄ and βb2 = Pi=
N
i=1 (zi − z̄)(xi − x̄)
1.3.3 Stima IV nella RS
4. Stimatore IV di σ 2 :
σ2 Var(b2 )
Var(β
b2 ) = =
2 (xi − x̄)2 2
P
rzx rzx
▶ Modello:
y = β1 + β2 x2 + . . . + βK xK + e
▶ Esplicative esogene: x2 , . . . , xK −1
▶ Esplicativa endogena: xK
xK = γ1 + γ2 x2 + . . . + γK −1 xK −1 + θ1 z1 + . . . + θL zL + vK
▶ Calcolare:
▶ Secondo passo:
y = β1 + β2 x2 + . . . + βK x̂K + e ∗
▶ Primo passo:
xK = γ1 + γ2 x2 + . . . + γK −1 xK −1 + θ1 z1 + . . . + θL zL + vK
▶ Campione: mroz.dta
▶ y = β1 + β2 x2 + . . . + βK xK + e
▶ G esplicative esogene: x2 , . . . , xG
▶ B = K − G esplicative endogene: xG +1 , . . . , xK
▶ L strumenti: z1 , . . . , zL
▶ NB: È necessario che L ≥ B
▶ Se L = B , il modello è esattamente identicato
▶ Se L > B , il modello è sovraidenticato
10.3.8 IV in un modello generale
▶ Primo passo:
▶ Stimare con i MQ B regressioni per ogni x endogena:
y = β1 + β2 x2 + . . . + βG xG + βG +1 x̂G +1 + . . . + βK x̂K + e
▶ Esempio: B = 2, xG +1 e xG +2 endogene
y = β1 + β2 x2 + . . . + βG xG + βG +1 xG +1 + βG +2 xG +2 + e
▶ L = 2: z1 e z2
10.3.8a Qualità degli strumenti
▶ Primo stadio:
▶ Come con i MQ
▶ Stesse statistiche test
▶ Valgono solo proprietà asintotiche, ma usiamo le
distribuzioni per N nito
▶ Possiamo usare se e test robusti
▶ Con stime IV R2 può essere negativo
10.4 Test di specicazione
b − βb → 0 per N → ∞
b − βb → c ̸= 0 per N → ∞
y = β1 + β2 x + e, strumenti: z1 , z2
1. Stimare con i MQ
x = γ1 + θ1 z1 + θ2 z2 + v , e calcolare v̂
y = β1 + β2 x + δ v̂ + e
▶ H0 : Cov(z, e) = 0
▶ Per la stima IV con B x endogene servono almeno B z
▶ Con esattamente B z il test non si può fare
▶ Con L > B z il test è possibile
10.4.2 Test della validità degli strumenti
N R 2 ∼ χ2(L−B) se N è elevato