Il 0% ha trovato utile questo documento (0 voti)
17 visualizzazioni53 pagine

Slide 10

Caricato da

vq6565pzgb
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd
Il 0% ha trovato utile questo documento (0 voti)
17 visualizzazioni53 pagine

Slide 10

Caricato da

vq6565pzgb
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd
Sei sulla pagina 1/ 53

Modelli econometrici

10. Regressori casuali e stima dei momenti

Sergio Pastorello
10.1 Regressione lineare con x casuali

▶ Cosa accade se le x sono variabili casuali?

▶ NB: x v.c. è praticamente il caso generale

▶ Solo per semplicità: regressione lineare semplice


10.1 Regressione lineare con x casuali

▶ Nuove ipotesi:

A1 y = β1 + β2 x + e descrive la popolazione
A2 {(xi , yi ), i = 1, . . . , N} è un campione casuale IID
A3 E(e|x) = 0

A4 Nel campione x assume almeno 2 valori distinti

A5 Var(e|x) = σ
2

A6 e|x ∼ N (0, σ 2 )
10.1 Regressione lineare con x casuali

▶ A2 (campione casuale):
▶ Implica errori incorrelati (MR4)
▶ Non è adatta a serie storiche
▶ A3 è cruciale:
▶ No variabili omesse (correlate con quelle incluse)
▶ La forma funzionale del modello è corretta
▶ e è incorrelato con x
10.1 Regressione lineare con x casuali

▶ Conseguenze di A3:
1. E(e|x) = 0 ⇒ Cov(e, x) = 0
2. Le x incorrelate con e sono dette esogene
3. x non casuali (sse) sono per costruzione esogene
4. Cov(e, x) ̸= 0 ⇒ E(e|x) ̸= 0
5. x correlate con e sono dette endogene
6. Con x endogene, i MQ non possono più essere utilizzati
10.1.1 Distribuzione per N nito dei MQ

▶ Sotto A1 - A6, e con x casuali, lo stimatore dei MQ è:


1. Corretto
2. BLUE
3. Condizionatamente alle x , ha distribuzione normale
4. Gli standard error si stimano usando le formule classiche
5. Stime intervallari e statistiche test non cambiano

▶ In pratica: Non cambia nulla rispetto al caso di x sse


10.1.2 Proprietà asintotiche dei MQ

▶ Le proprietà per N nito richiedono A3


▶ Versione più debole:

A3∗ : E(e) =0 e Cov(e, x) =0

▶ Sotto A1, A2, A3∗ , A4 e A5, lo stimatore dei MQ è:


1. Consistente: converge al vero β per N → ∞
2. Asintoticamente normale: ha distribuzione normale per
N → ∞ (indipendentemente da A6)
3. Se A3∗ non vale, lo stimatore dei MQ:
▶ Non è più né corretto né consistente (e neanche BLUE)
▶ Stime intervallari e statistiche test non sono più valide
10.1.3 Perchè i MQ non sono più validi?

▶ Un modello econometrico aggiunge un errore al modello


economico:

y= β1 + β2 x +e
| {z }
modello economico

▶ Se Cov(e, x) = 0, lo stimatore dei MQ converge a β1 e β2


▶ Se Cov(e, x) ̸= 0, intercetta e pendenza non sono β1 e β2
10.1.3 Perchè i MQ non sono più validi?
▶ Gracamente: se Cov(e, x) >0
10.1.3 Perchè i MQ non sono più validi?
10.1.3 Perchè i MQ non sono più validi?

▶ b2 sovrastima β2 . Perchè?
▶ I MQ attribuiscono ∆y a ∆x
▶ Qui c'è anche ∆e , correlata positivamente con ∆x

∆y = β2 ∆x + ∆e
(+) (+) (+)

▶ L'eetto di ∆x viene sovrastimato


▶ Esempio: regressione del salario funzione dell'istruzione

▶ Il contrario si verica se Cov(e, x) <0


▶ I MQ non sono consistenti  la distorsione resta anche se
N →∞
10.2.1 Errore di misura

▶ Quando x è osservata con errore, errore nelle variabili

▶ In questo caso x ed e sono correlati

▶ Esempio: Il risparmio y dipende dal reddito permanente


x ∗:
y = β1 + β2 x ∗ + e
▶ x∗ non è osservabile; usiamo il reddito corrente x:

x = x ∗ + u, E(u) = 0, Var(u) = σu2 , Cov(u, v ) = 0


10.2.1 Errore di misura

▶ Esempio (continua): Modello stimabile:

y = β1 + β2 (x − u) + v
= β1 + β2 x + (v − β2 u)
= β1 + β2 x + e

▶ Nel modello stimabile:

Cov(x, e) = E(xe) = E[(x ∗ + u)(v − β2 u)]


2 2
= E(−β2 u ) = −β2 σu ̸= 0

▶ Con errore di misura in x , b2 non è consistente


10.2.2 Equazioni simultanee

▶ Esempio: Prezzi e quantità sono determinati


simultaneamente

▶ In equilibrio, P e Q sono entrambe endogene

▶ Di conseguenza:

Q = β1 + β2 P + e, e Cov(P, e) ̸= 0

▶ Lo stimatore dei MQ non è consistente


10.2.3 Variabili omesse

▶ Cov(e, x) ̸= 0 perchè contiene una variabile omessa

▶ Esempio: Equazione del salario:

log WAGE = β1 + β2 EDUC + β2 EXPER + β4 EXPER 2 + e

▶ Questo modello omette:


1. Condizioni del mercato del lavoro
2. Area geograca
3. Settore di attività
4. Sindacalizzazione
5. Abilità
10.2.3 Variabili omesse

▶ Esempio (continua): L'abilità è correlata sia con il salario


che con l'istruzione:

Cov(ABILITY , EDUC ) >0 ⇒ Cov(e, EDUC ) >0

▶ b2 sovrastima β2 , e la distorsione non scompare


asintoticamente
10.2.4 Stima di un'equazione del salario

▶ Usando mroz.dta, stimiamo con i MQ

log(WAGE ) = β1 +β2 EDUC +β3 EXPER +β4 EXPER 2 +e

considerando solo le 428 donne nella forza lavoro


10.2.4 Stima di un'equazione del salario
10.2.4 Stima di un'equazione del salario

▶ Il rendimento di un anno di istruzione è stimato a 10.75%

▶ Probabilmente questo numero è troppo alto

▶ Per prendere decisioni corrette servono stime attendibili


10.3 Stimatori basati sul metodo dei momenti

▶ Supponiamo di voler stimare µk = E(Y k )


▶ Stimatore naturale: k -esimo momento campionario:

N
1 X
µ̂k = E\
(Y k ) = yik
N i=1

▶ Metodo dei momenti: stima i parametri ignoti sostituendo


i momenti campionari ai momenti teorici
▶ Lo stimatore dei momenti è:
▶ Sempre consistente (non sempre corretto)
▶ Non sempre il migliore o il più preciso
10.3 Stimatori basati sul metodo dei momenti
▶ Esempio: Supponiamo di voler stimare

E(Y ) = µ1 = µ
2 2 2 2
Var(Y ) = σ = E(Y ) − µ = µ2 − µ

▶ Sostituiamo 2 momenti teorici con quelli campionari:

Momenti teorici Momenti campionari


µ̂ = N1
P
E(Y )= µ1 = µ yi = ȳ
2 1
yi2
P
E(Y ) = µ2 µ̂2 = N
▶ Di conseguenza:

1
σ̂ 2 = yi2 − ȳ 2
X
µ̂ = ȳ e
N
10.3.2 Stima dei momenti nella RS
▶ y = β1 + β2 x + e :

E(e) =0 ⇒ E(y − β1 − β2 x) = 0
Cov(x, e) = 0 ⇒ E[x(y − β1 − β2 x)] = 0

▶ Risolviamo rispetto a (β1 , β2 ):

β1 = − β2 E(xi )
E(yi )

E(xi yi ) − E(yi )E(xi ) Cov(xi , yi )


β2 = 2 =
E(xi ) − E(xi )2 Var(xi )

▶ Sostituiamo i momenti teorici con quelli campionari:

PN
i=1 (xi − x̄)(yi − ȳ )
b1 = ȳ − b2 x̄ and b2 =
2
PN
i=1 (xi − x̄)
1.3.3 Stima IV nella RS

▶ Se Cov(x, e) ̸= 0, la seconda condizione non è più valida


▶ Consideriamo un'altra variabile z con:
1. z non ha un eetto diretto su y  non è un'esplicativa
2. Cov(z, e) = 0  z è esogena
3. z è (molto) correlata con x
▶ z è chiamata variabile strumentale
1.3.3 Stima IV nella RS
▶ Stima delle VS basata su zi :

E(ei )=0 ⇒ E(yi − β1 − β2 xi ) = 0


Cov(zi , ei ) = 0 ⇒ E[zi (yi − β1 − β2 xi )] = 0

▶ Risolvendo rispetto a (β1 , β2 ):

β1 = − β2 E(xi )
E(yi )

E(zi yi ) − E(zi )E(yi ) Cov(zi , yi )


β2 = =
E(zi xi ) − E(zi )E(xi ) Cov(zi , xi )

▶ Sostituendo i momenti teorici con quelli campionari:

PN
1 (zi − z̄)(yi − ȳ )
βb1 = ȳ − βb2 x̄ and βb2 = Pi=
N
i=1 (zi − z̄)(xi − x̄)
1.3.3 Stima IV nella RS

▶ (βb1 , βb2 ) è lo stimatore delle variabili strumentali (IV)


▶ Proprietà:
1. Se z è esogena, lo stimatore IV è consistente
2. La distribuzione asintotica è normale
3. Nella regressione semplice,

σ 2 
βb2 ∼ N β2 , 2 P
rzx (xi − x̄)2

4. Stimatore IV di σ 2 :

(yi − βb1 − βb2 xi )2


P
2
σ̂IV =
N −2
10.3.3a Strumenti forti

σ2 Var(b2 )
Var(β
b2 ) = =
2 (xi − x̄)2 2
P
rzx rzx

▶ βb2 è sempre meno preciso di b2


▶ βb2 è consistente anche quando b2 non lo è
▶ Se rzx è basso (z strumento debole), lo stimatore IV:
▶ È poco preciso
▶ Può essere molto distorto, anche per N elevati
▶ Può avere distribuzione non normale, anche per N elevati
▶ Se gli strumenti sono deboli, la stima IV non è adabile
10.3.4 Stima IV nella regressione multipla

▶ Modello:

y = β1 + β2 x2 + . . . + βK xK + e

▶ Esplicative esogene: x2 , . . . , xK −1
▶ Esplicativa endogena: xK

▶ Variabili strumentali (strumenti): z1 , . . . , zL


▶ La stima IV si ottiene in due passi
10.3.4 Stima IV nella regressione multipla
▶ Primo passo:

▶ Stimare con i MQ:

xK = γ1 + γ2 x2 + . . . + γK −1 xK −1 + θ1 z1 + . . . + θL zL + vK

▶ Calcolare:

x̂K = γ̂1 + γ̂2 x2 + . . . + γ̂K −1 xK −1 + θ̂1 z1 + . . . + θ̂L zL

▶ Secondo passo:

▶ Stimare con i MQ:

y = β1 + β2 x2 + . . . + βK x̂K + e ∗

▶ (β̂1 , βb2 , . . . , βbK ): stimatore IV o dei MQ a due stadi


(2SLS)
10.3.4 Stima IV nella regressione multipla

▶ La stima 2SLS di σ2 si basa sui residui calcolati con xK :


N
2 1
(yi − βb1 − βb2 x2i − . . . − βbK xK )2
X
σ̂IV =
N −K i=1

▶ Tutti i software di econometria usano la formula corretta


▶ Usando lo stimatore 2SLS possiamo costruire:
▶ Stime intervallari
▶ Statistiche test
▶ Stimatore, stime intervallari e statistiche test sono:
▶ Validi asintoticamente (N elevato)
▶ Solo se gli strumenti non sono deboli
10.3.4a Strumenti in sovrannumero nella RS

▶ 2SLS coincide IV visto per la RS . . .

▶ . . . ma si usa anche se ci sono più z che x endogene


▶ È facile estenderlo al caso in cui le x endogene sono più
di una

▶ NB: Nella regressione al primo passo si usano tutte le x


esogene  per loro non servono z
10.3.5b Misurare la qualità degli strumenti

▶ Come vericare se gli strumenti sono forti?

▶ Primo passo:

xK = γ1 + γ2 x2 + . . . + γK −1 xK −1 + θ1 z1 + . . . + θL zL + vK

▶ Bisogna che almeno una delle z sia signicativa


▶ Consideriamo H0 : θ1 = 0, . . . , θL = 0

▶ Regola del pollice: bisogna che F > 10

▶ Se non è vero, le z sono deboli e i 2SLS possono essere


peggio dei MQ
10.3.6 Stima IV nell'equazione del salario

log WAGE = β1 + β2 EDUC + β2 EXPER + β4 EXPER 2 + e

▶ Campione: mroz.dta

▶ Sospettiamo EDUC endogena

▶ Come strumento, consideriamo MOTHEREDUC

▶ Non appare come x


▶ È correlata con EDUC (abbastanza?)

▶ È incorrelata con e (con l'abilità?)


10.3.6 Stima IV nell'equazione del salario
10.3.6 Stima IV nell'equazione del salario

▶ Al secondo stadio, sostituiamo \


EDUC a EDUC

▶ Così otteniamo le stime 2SLS ma gli se sono sbagliati

▶ Meglio usare ivregress 2sls


10.3.6 Stima IV nell'equazione del salario

▶ β̂2 è sceso a 4.93% (con i MQ, era 10.75%)


▶ Lo se di βb2 è 0.0374 (con i MQ era 0.0141)
10.3.6 Stima IV nell'equazione del salario

▶ βb2 < b2 è coerente con Cov(EDUC , e) > 0


▶ Lo standard error di βb2 è alto  e al primo stadio
MOTHEREDUC sembrava un'ottimo strumento

▶ Per ridurlo, servono z migliori e/o più z


▶ Aggiungiamo FATHEREDUC
10.3.6 Stima IV nell'equazione del salario
10.3.6 Stima IV nell'equazione del salario

▶ βb2 = 6.14% (↑) e se(β


b2 ) = 0.0312 (↓)
10.3.8 IV in un modello generale

▶ y = β1 + β2 x2 + . . . + βK xK + e
▶ G esplicative esogene: x2 , . . . , xG
▶ B = K − G esplicative endogene: xG +1 , . . . , xK
▶ L strumenti: z1 , . . . , zL
▶ NB: È necessario che L ≥ B
▶ Se L = B , il modello è esattamente identicato
▶ Se L > B , il modello è sovraidenticato
10.3.8 IV in un modello generale

▶ Primo passo:
▶ Stimare con i MQ B regressioni per ogni x endogena:

xG +j = γ1j + γ2j x2 + . . . + γGj xG


+θ1j zi + . . . + θLj zL + vj , j = 1, . . . , B

▶ Calcolare i valori previsti nelle B regressioni:

x̂G +j = γ̂1j + γ̂2j x2 + . . . + γ̂Gj xG


+θ̂1j zi + . . . + θ̂Lj zL , j = 1, . . . , B
10.3.8 IV in un modello generale

▶ Al secondo stadio, stimare con i MQ

y = β1 + β2 x2 + . . . + βG xG + βG +1 x̂G +1 + . . . + βK x̂K + e

▶ Per stimare σ bisogna usare i residui basati su x, non x̂


▶ Meglio usare i comandi del software
10.3.8a Qualità degli strumenti

▶ Con più di una x endogena, il test F non è valido

▶ Con B x endogene, servono almeno B z validi

▶ È dicile vericare che questo sia vero

▶ Esempio: B = 2, xG +1 e xG +2 endogene

y = β1 + β2 x2 + . . . + βG xG + βG +1 xG +1 + βG +2 xG +2 + e

▶ L = 2: z1 e z2
10.3.8a Qualità degli strumenti

▶ Primo stadio:

xG +1 = γ11 + γ21 x2 + . . . + γG 1 xG + θ11 z1 + θ21 z2 + v1


xG +2 = γ12 + γ22 x2 + . . . + γG 2 xG + θ12 z1 + θ22 z2 + v1

▶ I 2 test F possono riutare H0 perchè z1 è uno strumento

valido per entrambe, ma non z2


▶ Con due x endogene servono (almeno) due z validi

▶ Esistono soluzioni (complicate)


10.3.8b Verica d'ipotesi con stime IV

▶ Come con i MQ
▶ Stesse statistiche test
▶ Valgono solo proprietà asintotiche, ma usiamo le
distribuzioni per N nito
▶ Possiamo usare se e test robusti
▶ Con stime IV R2 può essere negativo
10.4 Test di specicazione

1. Come vericare se x è endogena  se Cov(x, e) ̸= 0?


2. Come vericare se z è valido  se Cov(z, e) = 0?

▶ NB: Se siamo sicuri che z sia valido, dobbiamo vericare


che Cov(z, x) ̸= 0
10.4.1 Test di endogenità di Hausman

▶ H0 : Cov(x, e) = 0 contro H1 : Cov(x, e) ̸= 0


▶ Idea: Confrontare stime dei MQ e stime IV
▶ Se H0 è vera, sia b che βb sono consistenti, e

b − βb → 0 per N → ∞

Preferiamo b perchè è eciente


▶ Se H0 è falsa, b non è consistente ma βb lo è. Dunque

b − βb → c ̸= 0 per N → ∞

Preferiamo βb perchè è consistente


▶ Esistono diverse versioni di questo test
10.4.1 Test di endogenità di Hausman
10.4.1 Test di endogenità di Hausman
▶ Test di Hausman n.2: procedura a due passi:

y = β1 + β2 x + e, strumenti: z1 , z2

1. Stimare con i MQ

x = γ1 + θ1 z1 + θ2 z2 + v , e calcolare v̂

Con B x endogene, B equazioni includendo x esogene


2. Aggiungere v̂ alla regressione originaria, e applicare i MQ

y = β1 + β2 x + δ v̂ + e

H0 : Cov(x, e) = 0 equivale a H0 : δ = 0. Con B x


endogene, usare un test F congiunto (robusto)
10.4.1 Test di endogenità di Hausman
10.4.1 Test di endogenità di Hausman

▶ Perα = 5% e α = 1%, entrambi i test non riutano


H0 : Cov(EDUC , e) = 0
▶ Il test a due passi riuta per α = 10%
▶ Date le forti ragioni economiche a sostegno di H1 ,
conviene considerare la stima IV
10.4.2 Test di validità degli strumenti

▶ H0 : Cov(z, e) = 0
▶ Per la stima IV con B x endogene servono almeno B z
▶ Con esattamente B z il test non si può fare
▶ Con L > B z il test è possibile
10.4.2 Test della validità degli strumenti

1. Stima 2SLS usando x esogene e z


2. Calcolare ê
3. Stimare con i MQ la regressione di ê su tutte le z
4. Statistica test: N R 2. Se H0 è vera,

N R 2 ∼ χ2(L−B) se N è elevato

5. Si riuta per valori elevati (ê è correlato con le z)


10.4.2 Test della validità degli strumenti

▶ Stata calcola automaticamente questi test

Potrebbero piacerti anche