Chapitre 6 La méthode des variables instrumentales Licence Econométrie / MASS Econométrie II, 2007-2008 Martin Fournier
[email protected] Econométrie II - L3 Econométrie/Mass
1
1. Présentation du problème La question de l’endogénéité
Econométrie II - L3 Econométrie/Mass
2
1.1 L’hypothèse d’éxogénéité Les MCO supposent l’exogénéité des variables explicatives, i.e. Cov(x,u) = 0 Il existe de nombreuses situations où l’on doit rejeter cette hypothèse La méthode des variables instrumentales permet de tenir compte de l’endogénéité de certaines variables explicatives Econométrie II - L3 Econométrie/Mass
3
1
1.2 Endogénéité et causalité Une première source d’endogénéité concerne la possibilité d’une causalité inverse. On estime : y = β0 + β 1x1 + β 2x2 + u Alors qu’il existe une causalité inverse telle que : x1 = δ0 + δ2x2 + Zγ + αy + v Cov(x1,u) ≠ 0 Econométrie II - L3 Econométrie/Mass
4
1.3 Un exemple On cherche à estimer une équation de croissance économique : ln(PIBt) – ln(PIBt-1) = β0 + β1INVt + β2EXPt + u INV : taux d’investissement EXP : taux d’exportations Or on sait que : INVt = δ0 + δ1PIBt-1 + Zδ + v et EXPt = γ0 + γ1PIBt-1 + Zγ + w Econométrie II - L3 Econométrie/Mass
5
1.4 Endogénéité et variable omise • Supposons que le modèle sous-jacent est : y = β 0 + β 1x 1 + β 2x 2 + u mais que l’on fasse une erreur de spécification en omettant la variable x2. On estime donc : y = δ0 + δ1x1 + v avec v = β2x2 + u • Si les variables x1 et x2 sont corrélées alors x1 est également corrélé à v Econométrie II - L3 Econométrie/Mass
6
2
1.5 Erreurs de mesure CEV « Classical Error-in-Variables » (CEV) :
y = β 0 + β1 x1∗ + u Avec une observation avec erreur : x1
e1 = x1 − x1∗ Équation estimée :
y = β 0 + β1 x1 + (u − β1e1 ) Avec x1 corrélé avec le terme d’erreur u-β1e1.
cov( x1 , u − β1e1 ) = − β1 cov(x1 , e1 ) = − β1σ e21 Econométrie II - L3 Econométrie/Mass
7
2. La méthode des variables instrumentales Le cas de la régression simple
Econométrie II - L3 Econométrie/Mass
8
2.1 Objectifs Méthode qui permet d’estimer des paramètres sans biais lorsqu’une variable explicative est endogène (i.e. Cov(x,u) ≠ 0)
Causalité inverse Biais de variable omise CEV
Econométrie II - L3 Econométrie/Mass
9
3
2.2 Les instruments y = β0 + β 1x1 + β 2x2 + u avec Cov(x1,u) ≠ 0 On appelle instrument pour la variable x1 une variable z qui vérifie les 2 propriétés suivantes : 1) z est une variable exogène : Cov(z,u) = 0 2) z est une variable corrélée avec la variable x1 : Cov(z,x1) ≠ 0 Econométrie II - L3 Econométrie/Mass
10
2.3 Trouver un instrument valide La théorie économique (et le bon sens) permettent (parfois) de trouver des instruments qu’il peut être légitime de supposer exogènes (Cov(z,u) = 0) On peut en revanche aisément tester formellement la deuxième propriété (Cov(z,x1) ≠ 0) par un T-test à partir d’une première estimation : x = π0 + π1z + v H0 : π1 = 0 Econométrie II - L3 Econométrie/Mass
11
2.4 Variables instrumentales – Régression simple Prenons le cas de la régression simple : y = β 0 + β 1x + u avec x endogène et z un instrument valide On peut écrire :
L’estimateur IV de β1 est donc donné par :
Econométrie II - L3 Econométrie/Mass
12
4
2.5 Variables instrumentales – Régression simple (2) Sous l’hypothèse d’homoscédasticité E(u2|z) = σ2 = Var(u) On peut écrire la variance du paramètre estimé :
( )
σ2 nσ x2 ρ x2, z
( )
σˆ 2
Var βˆ1 = Vaˆr βˆ1 =
SSTx Rx2, z
Econométrie II - L3 Econométrie/Mass
13
2.6 IV versus OLS ( )
σˆ 2 Vaˆr βˆ OLS = SSTx
( )
Vaˆr βˆIV =
σˆ 2 SSTx Rx2, z
La variance de l’estimateurs IV ne diffère de celle des MCO que par le R2 de la régression de x sur z Comme R2 < 1, La variance de l’estimateurs IV est plus grande que celle des MCO NB : Mais l’estimateur MCO est biaisé si Cov(x,u) ≠ 0 !
Plus la corrélation entre z et x est forte, plus la variance de l’estimateur IV est faible Econométrie II - L3 Econométrie/Mass
14
2.7 Validité des instruments Il est souvent difficile de tester l’hypothèse d’exogénéité des instruments (Cov(z,u) = 0) Si l’instrument n’est pas exogène, l’estimateur IV sera également biaisé : Corr ( z , u ) σ u IV : plimβˆ1 = β1 + • Corr ( z , x) σ x
σ ~ OLS : plim β1 = β1 + Corr ( x, u ) • u
σx
L’estimateur IV sera préféré si : Corr(z,u)/Corr(z,x) < Corr(x,u) Econométrie II - L3 Econométrie/Mass
15
5
2.8 Variables instrumentales – Doubles Moindres Carrés (2SLS) y = β 0 + β 1x + u x = π0 + π1z + v L’estimateur IV est équivalent à une estimation en deux étapes : 1) Estimation de l’équation d’instrumentation : x = π0 + π1z + v xˆ = π 0 + π 1 z 2) Estimation de l’équation d’intérêt sur x
y = δ 0 + δ1 xˆ + w Econométrie II - L3 Econométrie/Mass
16
2.9 IV – Doubles Moindres Carrés (2) On peut montrer que :
δ1MCO = β1IV La relation : y = δ 0 + δ1 xˆ + w peut être estimée par les MCO avec : δ1MCO = =
π 1Cov( z , y ) Cov(π 0 + π 1 z , y ) = Var (π 0 + π 1 z ) Cov(π 0 + π 1 z , x − u ) π 1Cov( z , y ) Cov( z , y ) = = β1IV π 1Cov( z , x) − Cov( z , u ) Cov( z , x) Econométrie II - L3 Econométrie/Mass
17
3. La méthode des variables instrumentales Le cas de la régression multiple
Econométrie II - L3 Econométrie/Mass
18
6
3.1 IV et régression multiple Les estimations IV peuvent être étendues au cas de la régression multiple : y1 = β0 + β1y2 + β2z1 + u1 avec y2 et y3 endogènes et z1 et z2 exogènes Il est nécessaire d’avoir au moins un instrument pour chaque variable Econométrie II - L3 Econométrie/Mass
19
3.2 IV et régressions multiples (2) Écrivons le modèle structurel comme : y = β 0 + β 1x 1 + β 2x 2 + u avec x1 endogène et x2 exogène Soit z un instrument pour x1 Cov(z,u) = 0 x1 = π0 + π1z + π2x2 + v, avec π1 ≠ 0 NB : Cette équation régresse la variable endogène sur toutes les variables exogènes et l’instrument Econométrie II - L3 Econométrie/Mass
20
3.3 Doubles Moindres Carrés Two Stage Least Squares (2SLS) y = β0 + β1x1 + β2x2 + u Il est possible (et souhaitable) d’avoir plusieurs instruments pour la même variable endogène : x1 = π0 + π1z1 + π2z2 + π3z3 + v Hypothèse : z2 et z3 sont des instruments valides - Ils ne sont pas des déterminants directs de y1 - Ils sont non-corrélés avec le terme d’erreur u1 - Ils sont corrélés avec y2 Econométrie II - L3 Econométrie/Mass
21
7
3.4 L’estimateur IV et les 2SLS On peut montrer (cf. cours de M1) que dans le cas général l’estimateur IV est donné par :
β1IV = ( Z ' X ) −1 Z ' Y avec Z : Ensemble des variables exogènes (explicatives non endogènes + instruments) Ce qui correspond à l’estimateur des doubles moindres carrés :
β12 SLS = ( Xˆ ' Xˆ ) −1 Xˆ ' Y
Avec Xˆ : Ensemble des variables explicatives simulées à partir de l’équation d’instrumentation :
X = Zπ + v Econométrie II - L3 Econométrie/Mass
22
3.5 L’estimateur IV et les 2SLS (2) X = Zπ + v
β1IV = β12 SLS
⇒ πˆ MCO = ( Z ' Z ) −1 Z ' X ⇒ Xˆ = Zπˆ MCO = Z ( Z ' Z ) −1 Z ' X Y = Xˆβ 2 SLS + u ⇒ βˆ 2 SLS = ( Xˆ ' Xˆ ) −1 Xˆ ' Y
[(
)( '
= Z ( Z ' Z ) −1 Z ' X Z ( Z ' Z ) −1 Z ' X = ( Z ' X ) −1 Z 'Y
)] (Z (Z ' Z ) −1
−1
)
'
Z' X Y
Econométrie II - L3 Econométrie/Mass
23
3.6 Doubles Moindres Carrés : La forme de l’instrumentation Remarque 1 : Chacun des instruments pourrait être utilisé indépendamment comme instrument
La meilleure forme d’instrumentation est une combinaison linéaire de toutes les variables exogènes Remarque 2 : Si les coefficients de l’estimateur IV et de l’estimateur 2SLS sont égaux, la variance des MCO pour l’estimation de deuxième étape est Econométrie II - L3 invalide Econométrie/Mass
24
8
3.7 Nombre d’instruments Lorsqu’on a plusieurs variables endogènes, il faut avoir au moins autant d’instruments que de variables endogènes
Econométrie II - L3 Econométrie/Mass
25
4. Le cas particulier des erreurs de mesure
Econométrie II - L3 Econométrie/Mass
26
4.1 Erreurs de mesure CEV et estimations IV Reprenons le modèle d’erreur de mesure CEV y = β0 + β1x1* + β2x2 + u - On observe x1 au lieu de x1* - x 1 = x 1* + e 1 - e1 est non corrélé avec x1* et x2 - x1 est endogène Si l’on peut trouver un instrument z pour x1 t.q. Corr(z,u) = 0 et Corr(z,x1) ≠ 0 Alors l’estimation IV corrige le biais d’atténuation Econométrie II - L3 Econométrie/Mass
27
9
5. Tester l’endogénéité d’une variable
Econométrie II - L3 Econométrie/Mass
28
5.1 Test de Hausman On sait que : - Les estimateurs MCO et IV sont sans biais et convergents sous l’hypothèse d’exogénéité - Seul l’estimateur IV reste sans biais si l’hypothèse d’exogénéité est rejetée - L’estimateur MCO est préférable à l’estimateur IV sous l’hypothèse d’exogénéité L’idée du test de Hausman est de tester l’égalité des estimateurs MCO et IV Test disponible sous tous les logiciels usuels Econométrie II - L3 Econométrie/Mass
29
5.2 Test de corrélation des erreurs y = β0 + β1x1 + β2x2 + u x1 = π0 + π1z1 + π2z2 + π3z3 + v
Si x1 est endogène et z un jeu d’instruments valides alors le résidu de l’équation d’instrumentation v est corrélé au résidu de l’équation d’intérêt u Tester directement cette hypothèse Econométrie II - L3 Econométrie/Mass
30
10
5.3 Test de corrélation des erreurs (2) Procédure en 3 étapes : 1) Estimation de l’équation d’instrumentation et création d’une variables de résidus v 2) Inclusion du résidu v comme variable explicative de l’équation d’intérêt 3) Test de significativité du coefficient associé à v Si le coefficient est statistiquement différent de zéro, l’hypothèse d’exogénéité est rejetée NB : Si l’on a plusieurs variables endogène, il faut tester conjointement la significativité des résidus de chaque équation d’instrumentation Econométrie II - L3 Econométrie/Mass
31
5.4 Tester des restrictions suridentifiées Si l’on a un seul instrument pour la variable endogène, il est impossible de tester l’absence de corrélation entre l’instrument et le terme d’erreur : Corr(z,u) = 0 Modèle « juste identifié » Si l’on dispose de plusieurs instruments, le modèle est « sur-identifié » et il est possible de tester l’exogénéité d’un instrument Econométrie II - L3 Econométrie/Mass
32
5.5 Le test OverID Test en trois étapes : 1) Estimation de l’équation d’intérêt par IV et construction du résidu empirique u 2) Regression du résidu u sur toutes les variables exogènes du modèle (explicatives + instruments) 3) Test de la significativité jointe des coefficients estimé par un test du multiplicateur de Lagrange : Sous l’hypothèse nulle (exogénéité des instruments) : LM = nR2 ~ χq2 avec q le nombre d’instruments en excès Econométrie II - L3 Econométrie/Mass
33
11
6. Exemple
Econométrie II - L3 Econométrie/Mass
34
6.1 Exemple : Equation de salaire ln Wagei = β1 + β 2 Educi + β 3 Experi + β 4 Expersqi + U i Dependent Variable: LWAGE Method: Least Squares Sample (adjusted): 1 428 Included observations: 428 after adjustments Variable
Coefficient
Std. Error
t-Statistic
Prob.
C EDUC EXPER EXPERSQ
-0.522041 0.107490 0.041567 -0.000811
0.198632 0.014146 0.013175 0.000393
-2.628179 7.598333 3.154906 -2.062833
0.0089 0.0000 0.0017 0.0397
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.156820 0.150855 0.666420 188.3052 -431.5990 1.960988
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
MCO
1.190173 0.723198 2.035509 2.073445 26.28616 0.000000
Econométrie II - L3 Econométrie/Mass
35
6.2 Exemple : Equation de salaire (2) On suspecte l’éducation d’être endogène et on a instruments : éducation de la mère (motheduc) et du père (fatheduc) Dependent Variable: EDUC Method: Least Squares
Equation d’instrumentation : Les 2 instruments sont significatifs
Sample: 1 428 Included observations: 428 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C EXPER EXPERSQ MOTHEDUC FATHEDUC
9.102640 0.045225 -0.001009 0.157597 0.189548
0.426561 0.040251 0.001203 0.035894 0.033756
21.33958 1.123593 -0.838572 4.390609 5.615173
0.0000 0.2618 0.4022 0.0000 0.0000
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.211471 0.204014 2.038967 1758.575 -909.7168 1.939888
Mean dependent var 12.65888 S.D. dependent var 2.285376 Akaike info criterion 4.274378 Schwarz criterion 4.321797 F-statistic Econométrie II - L328.36041 Prob(F-statistic) Econométrie/Mass 0.000000
36
12
6.3 Exemple : Equation de salaire (3) Dependent Variable: LWAGE Method: Two-Stage Least Squares
Résultats (automatisé) des Double Moindre Carrés (2SLS)
Sample (adjusted): 1 428 Included observations: 428 after adjustments Instrument list: EXPER EXPERSQ MOTHEDUC FATHEDUC Variable
Coefficient
Std. Error
t-Statistic
Prob.
C EDUC EXPER EXPERSQ
0.048100 0.061397 0.044170 -0.000899
0.400328 0.031437 0.013432 0.000402
0.120152 1.953024 3.288329 -2.237993
0.9044 0.0515 0.0011 0.0257
R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat
0.135708 0.129593 0.674712 1.945659
Mean dependent var S.D. dependent var Sum squared resid Second-stage SSR
1.190173 0.723198 193.0200 212.2096
Econométrie II - L3 Econométrie/Mass
37
6.4 Exemple : Equation de salaire (4) Dependent Variable: LWAGE Method: Least Squares
Résultats (manuels) de l’instrumentation
Sample: 1 428 Included observations: 428 Variable
Coefficient
Std. Error
t-Statistic
C EDUCF EXPER EXPERSQ
0.048100 0.061397 0.044170 -0.000899
0.419756 0.032962 0.014084 0.000421
0.114591 1.862629 3.136129 -2.134408
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.049783 0.043059 0.707456 212.2096 -457.1743 1.958629
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
Prob. 0.9088 0.0632 0.0018 0.0334 1.190173 0.723198 2.155020 2.192956 7.404565 0.000076
Econométrie II - L3 Econométrie/Mass
38
6.5 Exemple : Test d’endogénéité Dependent Variable: LWAGE Method: Least Squares Sample: 1 428 Included observations: 428
L’endogénéité de l’éducation ne peut pas être rejetée au seuil de 10%
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C EDUC EXPER EXPERSQ RESEDUC
0.048100 0.061397 0.044170 -0.000899 0.058167
0.394575 0.030985 0.013239 0.000396 0.034807
0.121904 1.981499 3.336272 -2.270622 1.671105
0.9030 0.0482 0.0009 0.0237 0.0954
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.162350 0.154429 0.665016 187.0701 -430.1908 1.931343
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Econométrie II - L3 Prob(F-statistic) Econométrie/Mass
1.190173 0.723198 2.033602 2.081022 20.49612 0.000000 39
13