Les Variables Instrumentales

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 43

LES VARIABLES INSTRUMENTALES

Cours de Pauline Chauvin


Université de Paris

1
Introduction
• Comment estimer les conséquences d’une PP ?
• Deux cas de figure possibles :
• Les expériences « contrôlées » (1)
ÞDonnées expérimentales
• Les expériences « naturelles » (2)
Þ Données observationnelles / de vie réelle
ÞMise en œuvre de méthodes statistiques pour mesurer un impact causal
• Les variables instrumentales
• Les doubles différences
• Le modèle de discontinuité de la régression
• Les techniques d’appariement

2
I. Présentation
• Si utilisation d’un modèle de régression ci-dessous pour étudier l’impact
d’une PP sur une variable de résultat
• Modèle à estimer :
• 𝑌! = 𝛽" + 𝛽# 𝑇! + 𝛽$ 𝑋#! + 𝛽% 𝑋$! + 𝑈!
• Modèle estimé :
• 𝑌(! = 𝛽)" + 𝛽)# 𝑇! +𝛽)$ 𝑋#! + 𝛽)% 𝑋$!
• Pour pouvoir estimer une relation causale, il faut que l’hypothèse
indépendance conditionnelle des erreurs (CIA) tienne
Þ corr(Ti,ui)=0
Þ Pas d’hétérogénéité inobservée
Þ Pas de relation de simultanéité ou de causalité inverse
Þ Pas d’erreur de mesure
• Remarques : les variables
• corrélées avec ui sont dites endogènes
• Non corrélées avec ui sont dites exogènes
3
I. Présentation

• Les variables instrumentales


• Approche assez ancienne: premières intuitions proposées par Wright (1928)
• On va chercher une variable qui explique le traitement mais non corrélée
avec les autres variables du modèle
• Objectif de l’estimateur à variables instrumentales
Þ Scinder la variation de T en deux parties :
• Une partie corrélée avec u
• Une partie non corrélée avec u
Þ Pour cela, détermination d’un instrument ou d’une variable instrumentale, Z,
qui :
• n’est pas corrélée avec u
• Corr(Zi,ui)=0
• Mais qui est corrélé avec T
4
• Corr(Zi,Ti)≠0
I. Présentation

• Les variables instrumentales


• On cherche une variable ou des variables qui influent sur la probabilité
de bénéficier de la PP mais pas sur le résultat attendu de la PP
• Exemples :
• Affectation aléatoire d’une expérimentation qui n’a pas fonctionné (ex Rapp et al
(2015):
• Base de données: données expérimentales de l’étude PLASA (essai contrôlé d’un
programme d’accompagnement des personnes âgées dépendantes visant à améliorer
leur santé mais qui n’a pas été efficace)
• Variable expliquée: le fait d’être hospitalisé
• Variable explicative endogène: bénéficier de l’APA
• Instrument: le fait d’avoir été dans le groupe de traitement de l’étude PLASA

5
Exemple 1

• Exemple 1: Quel est l’impact de l’APA sur le risque


d’hospitalisation ?
• Ce que l’on voudrait observer :
?

APA Hospitalisa)on

6
Exemple 1

• Exemple 1: Quel est l’impact de l’APA sur le risque


d’hospitalisation ?
• Ce qui nous empêche de l’observer :
?

APA Hospitalisa)on

- Hétérogénéité inobservée (état


de santé)
- Causalité inverse
Etat de santé

7
Exemple 1

• Exemple 1: Quel est l’impact de l’APA sur le risque


d’hospitalisation ?
• Principe des VI: utiliser une variable (instrument) qui explique la
variable endogène mais pas les autres variables pour isoler le lien de
causalité
?

APA Hospitalisa)on

Être dans le
groupe de
traitement de
Etat de santé
l’étude PLASA
I. Présentation

• Les variables instrumentales


• On cherche une variable ou des variables qui influent sur la probabilité
de bénéficier à la PP mais pas sur le résultat attendu de la PP
• Exemples :
• Affectation aléatoire d’une expérimentation qui n’a pas fonctionné (ex Rapp et al
(2015):
• Base de données: données expérimentales de l’étude PLASA (essai contrôlé d’un
programme d’accompagnement des personnes âgées dépendante visant à améliorer
leur santé mais qui n’a pas été efficace)
• Variable expliquée: le fait d’être hospitalisé
• Variable explicative endogène: bénéficier de l’APA
• Instrument: le fait d’avoir été dans le groupe de traitement de l’étude PLASA
• Variations exogènes de l’environnement :
• Changements législatifs
• Événements sociaux (grève, ...), géographique (réorganisation territoriale, …),
climatiques (sécheresse), …
9
I. Présentation

• Estimation par la méthode des doubles moindres carrés


• Deux étapes:
1. Régresser T en fonction de Z
• 𝑇! = 𝜋" + 𝜋# 𝑍! + 𝜋$ 𝑋#! + 𝜋% 𝑋$! + 𝑉!
• On estimera: 𝑇(! = 𝜋 )" + 𝜋
)# 𝑍! + 𝜋
)$ 𝑋#! + 𝜋
)% 𝑋$!
• Objectif: isoler les variations de T qui ne sont pas corrélées avec ui
ÞComme Corr(Zi,ui)=0, Corr(𝑇(! ,ui)=0
2. Régresser Yi en fonction de 𝑇!!
• 𝑌! = 𝛽" + 𝛽#&' 𝑇(! + 𝛽$ 𝑋#! + 𝛽% 𝑋$! + 𝑈!

• Attention, la variance de 𝛽!-./ n’est pas la variance de l’estimateur de la


deuxième étape !
Þ Les logiciels de statistiques sont programmés pour la calculer
10
I. Présentation

• Exemple : la demande de produits agricoles


• On souhaite mesurer l’impact de la variation des prix sur la demande
de pommes
ó On souhaite mesurer l’élasticité prix de la demande pour les pommes
• Modèle à estimer :
• ln(𝑄! ) = 𝛽" + 𝛽# ln(𝑃! ) + 𝑈!
• 𝛽" mesure la variation relative de la quantité correspondant à une variation de
prix de 1%
• On dispose d’une base de données avec les quantités vendues et les
prix sur plusieurs années
• Mesurera-t-on effectivement l’élasticité prix de la demande pour les pommes en
estimant 𝛽" avec les MCO ?

11
I. Présentation Conclusion:
-
Prix Demande
+

Prix
Offre 1 Offre

P1 P’1
Offre 2

P2 P’2

Demande Demande 1
Demande 2

12 Q1 Q2 Quan)tés 12 Q’2 Q’1 Quan)tés


I. Présentation

• Exemple : la demande de produits agricoles


• Solution ?
• On va chercher à estimer la courbe de demande en isolant les déplacements
des prix et des quantités dus à un déplacement de la courbe de l’offre.
Þ Quel instrument permettra d’isoler ces déplacements ?
• La quantité de pluie dans les régions de production (Zi)
• Instrument valide ?
• Oui si on pense que
1. La pluie n’affectera pas la demande:
ÞCorr(Zi,ui) = 0
2. La pluie affectera la production et donc les prix sur le marché
ÞCorr(Zi,Pi) ≠ 0

13
Exemple 2

• Exemple 2 : Mesure de l’élasticité-prix de la demande de pommes


• Ce que l’on voudrait observer :

?
Prix de marché Demande de
des pommes pommes

14
Exemple 2

• Exemple 2: Mesure de l’élasticité-prix de la demande de pommes


• Ce qui nous empêche de l’observer :

?
Prix de marché Demande de
des pommes pommes

- Causalité inverse

15
Exemple 2

• Exemple 2: Mesure de l’élasticité-prix de la demande de pommes


• Principe des VI: utiliser une variable (instrument) qui explique la
variable endogène mais pas les autres variables pour isoler le lien de
causalité

?
Prix de marché Demande de
des pommes pommes

Pluie
I. Présentation

• Exemple : la demande de produits agricoles


• Modèle à estimer :
• ln(𝑄! ) = 𝛽" + 𝛽# ln(𝑃! ) + 𝑈!
• Etape pour l’estimation de 𝛽!-./
(6 )
1. On régresse ln(𝑃6 ) en fonction de Zi pour obtenir ln(𝑃
Þ Contient les variations relatives du prix suite à une variation de l’offre due à une
variation du niveau de pluie
(6 )
2. On régresse ln(𝑄6 ) en fonction de ln(𝑃
Þ Mesure les variations de quantités échangées suite à des variations de prix dues
à une variation de l’offre uniquement

17
I. Présentation

• L’estimateur des variables instrumentales 𝛽!$%& est


• Convergent
ÞIl faut un grand échantillon pour obtenir une estimation sans biais de 𝛽-
;6< ! ./
: 7→9: :𝛽- = 𝛽-
• Suit asymptotiquement une loi normale:𝛽!-./ ~𝑁(𝛽-, 𝜎=(>"# )
!
ÞLes intervalles de confiance et les tests habituels peuvent être utilisés
sur les grands échantillons
• Mais variance plus grande que celle de l’estimateur des MCO

18
I. Présentation

• Concernant les estimations par la méthode des doubles moindres


carrés :
• Si Zi est une variable quantitative
1 )
𝑆%& 𝑛 ∑!(" 𝑌! − 𝑌/ 𝑍! − 𝑍̅
𝛽'" =
#$
=
𝑆'& 1 ∑) 𝑇 − 𝑇/ 𝑍 − 𝑍̅
𝑛 !(" ! !

• Si Zi est une variable binaire (estimateur de wald)

E(Y|Z =1)−E(Y|Z =0)


𝛽'"#$ =
E(T|Z = 1) − E(T|Z = 0)
• On peut utiliser plusieurs instruments pour expliquer les variations de Ti
• Si on utilise un seul instrument
• On dira que 𝛽#&' est identifié
• Si on utilise plusieurs instruments
19
• On dira que 𝛽#&' est suridentifié
I. Présentation

• Interprétation de l’estimateur des variables instrumentales


• On supposera ici que la variable de traitement ainsi que l’instrument
sont des variables binaires.
• 𝛽!-./ ≠ ∆?@@ , effet moyen du traitement sur l’ensemble des traités
• 𝛽!-./ = effet moyen du traitement sur les « compliers ».
• Complier:
• Sous-population des traités
• Pour laquelle l’instrument a effectivement un pouvoir prédictif sur la variable
endogène
• Il y a 4 cas de figure possibles concernant le comportement vis-à-vis de
l’instrument et du traitement (Angrist et alii, 1996):
T=1, Z=1 T=0, Z=1
T=1, Z=0 Always taker Defier
T=0, Z=0 Complier Never taker
I. Présentation

• Interprétation de l’estimateur des variables instrumentales


• 𝛽!-./ = effet moyen du traitement sur les « compliers »
• 𝛽!-./ = ∆A?@B , avec LATE « Local Average Treatment Effect »
• Problèmes ?
• Selon la proportion de compliers, limite la validité externe de l’estimation…
• Autre problèmes:
• On ne connaît pas a priori la population des compliers
• 𝛽C#&' dépendra de l’instrument utilisé
ÞIntérêt de la théorie économique pour déterminer qui sont les compliers et
comprendre les différences entre les estimations de 𝛽C#&'

21
I. Présentation

• Exemples 3:
• Joshua D. Angrist, William N. Evans (1998). Children and Their Parents' Labor
Supply: Evidence from Exogenous Variation in Family Size. The American Economic
Review. 88(3) :450-477.
• Objectif de l’étude: mesurer l’impact d’une naissance sur l’offre de travail des mères

22
I. Présentation

• Objectif de l’étude: mesurer l’impact d’une naissance sur l’offre de travail


des mères
• Population d’analyse:
• Les couples mariés ayant déjà au moins deux enfants
• Modèle estimé:
-
• Participation au marché du travail = f(avoir plus de deux enfants) Nb
Travail
d’enfants
• Problème rencontré pour mesurer cet effet ?
-
• Détermination simultanée entre offre de travail et du nombre d’enfants
• Risque de surestimation de l’effet du nombre d’enfants sur l’offre de travail
• Solution:
• Variable instrumentale pour la variable « avoir plus de deux enfants »
• Instrument proposé: Le sexe des deux premiers enfants est le même
ÞBon instrument ?
23
Exemple 3

• Exemple 3: Mesure de l’impact d’une naissance sur l’offre de


travail des mères
• Ce que l’on voudrait observer :
?

Naissance Offre de travail

24
Exemple 3

• Exemple 3: Mesure de l’impact d’une naissance sur l’offre de


travail des mères
• Ce qui nous empêche de l’observer :

Naissance Offre de travail

- Causalité inverse

25
Exemple 3

• Exemple 3: Mesure de l’impact d’une naissance sur l’offre de


travail des mères
• Principe des VI: utiliser une variable (instrument) qui explique la
variable endogène mais pas les autres variables pour isoler le lien de
causalité
?
Offre de travail
Naissance des mères

Avoir deux
enfants du
même sexe
I. Présentation

27
28
II. Les tests usuels

• Pour rappel,
• La méthode des VI vise à estimer des coefficients non biaisés en
cas de variable explicative endogène
• Un instrument Z est valide s’il
• n’est pas corrélé avec u (condition 1): Corr(Zi,ui)=0
• Mais est corrélé avec T (condition 2): Corr(Zi,Ti)≠0
Þ Les tests présentés visent à vérifier ces différents points.
• Trois tests couramment effectués quand on met en œuvre les VI:
1. Le test de Wu-Haussman
2. Le test contre les instruments faibles
3. Le test d’exogénéité des instruments
29
II. Les tests usuels
1. Le test de Wu-Haussman
• Test de l’endogénéité de la variable de traitement
• Déroulement du test:
• Première étape: 𝑇! = 𝜋" + 𝜋# 𝑍! + 𝜋$ 𝑋#! + 𝜋% 𝑋$! + 𝑉!
• Seconde étape: on régresse Y en fonction des variables explicatives (endogène
incluse) et du résidu de la régression de la première étape: 𝑌! = 𝛽" + 𝛽# 𝑇! +
𝛽$ 𝑋#! + 𝛽% 𝑋$! + 𝛽& 𝑉1! + 𝑈!
• Conclusion:
• Si le coefficient du résidu de la première étape (𝛽& ) est significatif,
ÞIl y a des variables inobservées et corrélées avec T, capturées par 𝑉1! qui
expliquent Y
Þ T est bien endogène et il faut utiliser les DMC
• Sinon, il faut utiliser un MCO
• Problème de ce test:
30
• Pour pouvoir le réaliser, il faut un bon instrument…
II. Les tests usuels

2. Test contre les instruments faibles


• Les instruments sont ils suffisamment puissants pour corriger le biais
observés avec les MCO ?
• On souhaite vérifier la condition (2): Corr(Zmi,Ti)≠0 , ∀𝑚
• Quel est le problème en cas d’instruments faibles ?
Cov(z,u)
• Par définition, 𝑝𝑙𝑖𝑚 𝛽7#'( = 𝛽# + Cov(z,T)
• Si Cov(z,T) proche de 0 :
• L’estimateur sera imprécis, voire plus biaisé que l’estimateur MCO
« naif »
• L’approximation par la loi normale ne sera pas possible
Þ L’ensemble des tests d’hypothèse et des intervalles de confiance seront
31
faussés
II. Les tests usuels

2. Test contre les instruments faibles


• Considérons le cas où il n’y a qu’une seule variable
explicative endogène et qu’il existe trois instruments (m=3)
• Avec les DMC, on aurait à estimer
• Etape 1: 𝑇! = 𝜋" + 𝜋# 𝑍#! + 𝜋$ 𝑍$! + 𝜋% 𝑍%! + 𝑉!
• Etape 2: 𝑌! = 𝛽" + 𝛽#'( 𝑇?! + 𝑈!
Þ À l’étape 1, il faut qu’au moins un des coefficients 𝜋 soit
significativement différent de 0. Sinon on dira que les instruments sont
faibles

32
II. Les tests usuels

2. Test contre les instruments faibles


• À la première étape, on peut faire un test de Fisher
𝐻D: 𝜋- = 𝜋- = ⋯ = 𝜋< = 0
• 2
𝐻-: 𝜋- ≠ 0 ou 𝜋> ≠ 0 ou…ou 𝜋< ≠ 0
• Règle de décision: si F<10, on considère que les instruments
sont faibles

33
II. Les tests usuels

2. Test contre les instruments faibles


• Et si on conclut que les instruments sont faibles ?
Þ Si m>1, éliminer les instruments avec les statistiques de
Student les plus faibles
Þ Trouver de meilleurs instruments…

34
II. Les tests usuels
3. Le test d’exogénéité des instruments
• Appelé aussi :
• J-test
• test de Sargan-Hansen
• test de suridentification
• On souhaite vérifier la condition (1): Corr(Zmi,ui)=0 , ∀𝑚
• Quel est le problème en cas de non exogénéité des instruments ?
Cov(z,u)
• 𝑝𝑙𝑖𝑚 𝛽7#'( = 𝛽# + )
Cov(z,T)
Þ Estimateur des variables instrumentales sera biaisé
• L’hypothèse conditionnelle d’indépendance des erreurs ne tient pas
Þ La première étape des DMC n’a pas permis d’isoler la part de T qui n’est
35
pas corrélée avec les erreurs
II. Les tests usuels

3. Le test d’exogénéité des instruments


• Attention !
• Test de cohérence globale des instruments, pas de validation
rigoureuse de la condition (1)
• Qui teste le fait que les deux instruments corrigent de la même
façon le biais
• Possible seulement lorsque 𝛽!"# est suridentifié.

36
II. Les tests usuels

3. Le test d’exogénéité des instruments


• Soient T une variable explicative endogène et Z1 et Z2 deux instruments
• Les étapes du J-Test:
1) Estimer le modèle par les doubles moindres carrés en utilisant les m instruments
' calculer les valeurs ajustées 𝑌G! en utilisant 𝑇! et non 𝑇G! :
2) À partir des 𝛽,
• 𝑌(! = 𝛽)" + 𝛽)#&' 𝑇! + 𝛽)$ 𝑋#! + 𝛽)% 𝑋$!
3) Calculer les résidus 𝑢H ! = 𝑌! − 𝑌G!
4) Estimer le modèle auxiliaire par les MCO.
• 𝑢* ! = 𝛿" + 𝛿# 𝑍#! + 𝛿$ 𝑍$! + 𝛿% 𝑋#! + 𝛿( 𝑋$! + 𝜂 !
5) Calcul de la statistique J : J=mF,
• avec F la statistique de Fisher du modèle auxiliaire
• On a 𝐽~𝜒 $ (m-1)
𝐻* : les instruments sont exogènes
6) L
𝐻" : les instruments ne sont pas exogènes
37
38
II. Les tests usuels

3. Le test d’exogénéité des instruments


• Les limites du J-test:
• Nécessite d’avoir trouver au moins deux instruments…
• Permet de vérifier le fait que les deux instruments corrigent de la même
façon le biais
• Le test peut valider deux mauvais instruments…
ÞAu moins un des instruments doit être bon !!
• Le test peut invalider deux bons instruments impactant des populations
différentes …
ÞLes compliers doivent être les mêmes

39
II. Les tests usuels
2. Tester l’exogénéité des instruments
• Exemple: mesure de l’impact des variations de prix sur la demande
de cigarettes
• Référence: Stock, James H. and Mark W. Watson (2003)Introduction to
Econometrics, Addison-Wesley Educational Publishers, chapter 10
• Données:
• 48 Etats des Etats–Unis
• de 1985 à 1995
• Modèle:
• Variable expliquée :
• Les différences de log des consommations entre 1985 et 1995.
• Variables explicatives:
• Les différences de log des prix entre 1985 et 1995. (variable endogène)
• Les différences de log des revenus entre entre 1985 et 1995.
• Instruments:
• Sales tax
40 • Impôts sur les cigarettes.
II. Les tests usuels

41
II. Les tests usuels

2. Tester l’exogénéité des instruments


• Conclusion:
• 𝐻D est rejetée à 5%
• Par contre, le test ne dit pas quel instrument pose problème…
• On peut supposer que l’impôt direct sur le tabac peut être lié à la demande de
cigarettes, contrairement à la TVA
ÞIl vaut mieux n’utiliser que saletax.

42
Conclusion
• La méthode des variables instrumentales:
• Une approche possible pour mesurer un effet causal lorsque l’hypothèse
d’indépendance conditionnelle des erreurs ne semble pas tenir
• Limites des variables instrumentales:
• On mesure un effet local
Þ Remise en question possible de la validité externe de la mesure d’impact de
la PP
• On ne peut jamais valider rigoureusement les estimations par la méthode des
VI
• La validité des tests est une condition nécessaire mais non suffisante pour montrer la
qualité des régressions
• Il faut aussi réussir à convaincre le lecteur que l’instrument influence la variable
explicative endogène et n’influence que celle-ci !
• Pas toujours applicable: il n’existe pas toujours de bon instrument
43

Vous aimerez peut-être aussi