ch6-Variables Instrumentales - CNRS

Chapitre 6 La méthode des variables instrumentales Licence Econométrie / MASS Econométrie II, 2007-2008 Martin Fournier [email protected] Econométrie II - L3 Econométrie/Mass

1

1. Présentation du problème La question de l’endogénéité

Econométrie II - L3 Econométrie/Mass

2

1.1 L’hypothèse d’éxogénéité Les MCO supposent l’exogénéité des variables explicatives, i.e. Cov(x,u) = 0 Il existe de nombreuses situations où l’on doit rejeter cette hypothèse La méthode des variables instrumentales permet de tenir compte de l’endogénéité de certaines variables explicatives Econométrie II - L3 Econométrie/Mass

3

1

1.2 Endogénéité et causalité Une première source d’endogénéité concerne la possibilité d’une causalité inverse. On estime : y = β0 + β 1x1 + β 2x2 + u Alors qu’il existe une causalité inverse telle que : x1 = δ0 + δ2x2 + Zγ + αy + v Cov(x1,u) ≠ 0 Econométrie II - L3 Econométrie/Mass

4

1.3 Un exemple On cherche à estimer une équation de croissance économique : ln(PIBt) – ln(PIBt-1) = β0 + β1INVt + β2EXPt + u INV : taux d’investissement EXP : taux d’exportations Or on sait que : INVt = δ0 + δ1PIBt-1 + Zδ + v et EXPt = γ0 + γ1PIBt-1 + Zγ + w Econométrie II - L3 Econométrie/Mass

5

1.4 Endogénéité et variable omise • Supposons que le modèle sous-jacent est : y = β 0 + β 1x 1 + β 2x 2 + u mais que l’on fasse une erreur de spécification en omettant la variable x2. On estime donc : y = δ0 + δ1x1 + v avec v = β2x2 + u • Si les variables x1 et x2 sont corrélées alors x1 est également corrélé à v Econométrie II - L3 Econométrie/Mass

6

2

1.5 Erreurs de mesure CEV « Classical Error-in-Variables » (CEV) :

y = β 0 + β1 x1∗ + u Avec une observation avec erreur : x1

e1 = x1 − x1∗ Équation estimée :

y = β 0 + β1 x1 + (u − β1e1 ) Avec x1 corrélé avec le terme d’erreur u-β1e1.

cov( x1 , u − β1e1 ) = − β1 cov(x1 , e1 ) = − β1σ e21 Econométrie II - L3 Econométrie/Mass

7

2. La méthode des variables instrumentales Le cas de la régression simple


8

2.1 Objectifs Méthode qui permet d’estimer des paramètres sans biais lorsqu’une variable explicative est endogène (i.e. Cov(x,u) ≠ 0)

Causalité inverse Biais de variable omise CEV


9

3

2.2 Les instruments y = β0 + β 1x1 + β 2x2 + u avec Cov(x1,u) ≠ 0 On appelle instrument pour la variable x1 une variable z qui vérifie les 2 propriétés suivantes : 1) z est une variable exogène : Cov(z,u) = 0 2) z est une variable corrélée avec la variable x1 : Cov(z,x1) ≠ 0 Econométrie II - L3 Econométrie/Mass

10

2.3 Trouver un instrument valide La théorie économique (et le bon sens) permettent (parfois) de trouver des instruments qu’il peut être légitime de supposer exogènes (Cov(z,u) = 0) On peut en revanche aisément tester formellement la deuxième propriété (Cov(z,x1) ≠ 0) par un T-test à partir d’une première estimation : x = π0 + π1z + v H0 : π1 = 0 Econométrie II - L3 Econométrie/Mass

11

2.4 Variables instrumentales – Régression simple Prenons le cas de la régression simple : y = β 0 + β 1x + u avec x endogène et z un instrument valide On peut écrire :

L’estimateur IV de β1 est donc donné par :


12

4

2.5 Variables instrumentales – Régression simple (2) Sous l’hypothèse d’homoscédasticité E(u2|z) = σ2 = Var(u) On peut écrire la variance du paramètre estimé :

( )

σ2 nσ x2 ρ x2, z

( )

σˆ 2

Var βˆ1 = Vaˆr βˆ1 =

SSTx Rx2, z


13

2.6 IV versus OLS ( )

σˆ 2 Vaˆr βˆ OLS = SSTx

( )

Vaˆr βˆIV =

σˆ 2 SSTx Rx2, z

La variance de l’estimateurs IV ne diffère de celle des MCO que par le R2 de la régression de x sur z Comme R2 < 1, La variance de l’estimateurs IV est plus grande que celle des MCO NB : Mais l’estimateur MCO est biaisé si Cov(x,u) ≠ 0 !

Plus la corrélation entre z et x est forte, plus la variance de l’estimateur IV est faible Econométrie II - L3 Econométrie/Mass

14

2.7 Validité des instruments Il est souvent difficile de tester l’hypothèse d’exogénéité des instruments (Cov(z,u) = 0) Si l’instrument n’est pas exogène, l’estimateur IV sera également biaisé : Corr ( z , u ) σ u IV : plimβˆ1 = β1 + • Corr ( z , x) σ x

σ ~ OLS : plim β1 = β1 + Corr ( x, u ) • u

σx

L’estimateur IV sera préféré si : Corr(z,u)/Corr(z,x) < Corr(x,u) Econométrie II - L3 Econométrie/Mass

15

5

2.8 Variables instrumentales – Doubles Moindres Carrés (2SLS) y = β 0 + β 1x + u x = π0 + π1z + v L’estimateur IV est équivalent à une estimation en deux étapes : 1) Estimation de l’équation d’instrumentation : x = π0 + π1z + v xˆ = π 0 + π 1 z 2) Estimation de l’équation d’intérêt sur x

y = δ 0 + δ1 xˆ + w Econométrie II - L3 Econométrie/Mass

16

2.9 IV – Doubles Moindres Carrés (2) On peut montrer que :

δ1MCO = β1IV La relation : y = δ 0 + δ1 xˆ + w peut être estimée par les MCO avec : δ1MCO = =

π 1Cov( z , y ) Cov(π 0 + π 1 z , y ) = Var (π 0 + π 1 z ) Cov(π 0 + π 1 z , x − u ) π 1Cov( z , y ) Cov( z , y ) = = β1IV π 1Cov( z , x) − Cov( z , u ) Cov( z , x) Econométrie II - L3 Econométrie/Mass

17

3. La méthode des variables instrumentales Le cas de la régression multiple


18

6

3.1 IV et régression multiple Les estimations IV peuvent être étendues au cas de la régression multiple : y1 = β0 + β1y2 + β2z1 + u1 avec y2 et y3 endogènes et z1 et z2 exogènes Il est nécessaire d’avoir au moins un instrument pour chaque variable Econométrie II - L3 Econométrie/Mass

19

3.2 IV et régressions multiples (2) Écrivons le modèle structurel comme : y = β 0 + β 1x 1 + β 2x 2 + u avec x1 endogène et x2 exogène Soit z un instrument pour x1 Cov(z,u) = 0 x1 = π0 + π1z + π2x2 + v, avec π1 ≠ 0 NB : Cette équation régresse la variable endogène sur toutes les variables exogènes et l’instrument Econométrie II - L3 Econométrie/Mass

20

3.3 Doubles Moindres Carrés Two Stage Least Squares (2SLS) y = β0 + β1x1 + β2x2 + u Il est possible (et souhaitable) d’avoir plusieurs instruments pour la même variable endogène : x1 = π0 + π1z1 + π2z2 + π3z3 + v Hypothèse : z2 et z3 sont des instruments valides - Ils ne sont pas des déterminants directs de y1 - Ils sont non-corrélés avec le terme d’erreur u1 - Ils sont corrélés avec y2 Econométrie II - L3 Econométrie/Mass

21

7

3.4 L’estimateur IV et les 2SLS On peut montrer (cf. cours de M1) que dans le cas général l’estimateur IV est donné par :

β1IV = ( Z ' X ) −1 Z ' Y avec Z : Ensemble des variables exogènes (explicatives non endogènes + instruments) Ce qui correspond à l’estimateur des doubles moindres carrés :

β12 SLS = ( Xˆ ' Xˆ ) −1 Xˆ ' Y

Avec Xˆ : Ensemble des variables explicatives simulées à partir de l’équation d’instrumentation :

X = Zπ + v Econométrie II - L3 Econométrie/Mass

22

3.5 L’estimateur IV et les 2SLS (2) X = Zπ + v

β1IV = β12 SLS

⇒ πˆ MCO = ( Z ' Z ) −1 Z ' X ⇒ Xˆ = Zπˆ MCO = Z ( Z ' Z ) −1 Z ' X Y = Xˆβ 2 SLS + u ⇒ βˆ 2 SLS = ( Xˆ ' Xˆ ) −1 Xˆ ' Y

[(

)( '

= Z ( Z ' Z ) −1 Z ' X Z ( Z ' Z ) −1 Z ' X = ( Z ' X ) −1 Z 'Y

)] (Z (Z ' Z ) −1

−1

)

'

Z' X Y


23

3.6 Doubles Moindres Carrés : La forme de l’instrumentation Remarque 1 : Chacun des instruments pourrait être utilisé indépendamment comme instrument

La meilleure forme d’instrumentation est une combinaison linéaire de toutes les variables exogènes Remarque 2 : Si les coefficients de l’estimateur IV et de l’estimateur 2SLS sont égaux, la variance des MCO pour l’estimation de deuxième étape est Econométrie II - L3 invalide Econométrie/Mass

24

8

3.7 Nombre d’instruments Lorsqu’on a plusieurs variables endogènes, il faut avoir au moins autant d’instruments que de variables endogènes


25

4. Le cas particulier des erreurs de mesure


26

4.1 Erreurs de mesure CEV et estimations IV Reprenons le modèle d’erreur de mesure CEV y = β0 + β1x1* + β2x2 + u - On observe x1 au lieu de x1* - x 1 = x 1* + e 1 - e1 est non corrélé avec x1* et x2 - x1 est endogène Si l’on peut trouver un instrument z pour x1 t.q. Corr(z,u) = 0 et Corr(z,x1) ≠ 0 Alors l’estimation IV corrige le biais d’atténuation Econométrie II - L3 Econométrie/Mass

27

9

5. Tester l’endogénéité d’une variable


28

5.1 Test de Hausman On sait que : - Les estimateurs MCO et IV sont sans biais et convergents sous l’hypothèse d’exogénéité - Seul l’estimateur IV reste sans biais si l’hypothèse d’exogénéité est rejetée - L’estimateur MCO est préférable à l’estimateur IV sous l’hypothèse d’exogénéité L’idée du test de Hausman est de tester l’égalité des estimateurs MCO et IV Test disponible sous tous les logiciels usuels Econométrie II - L3 Econométrie/Mass

29

5.2 Test de corrélation des erreurs y = β0 + β1x1 + β2x2 + u x1 = π0 + π1z1 + π2z2 + π3z3 + v

Si x1 est endogène et z un jeu d’instruments valides alors le résidu de l’équation d’instrumentation v est corrélé au résidu de l’équation d’intérêt u Tester directement cette hypothèse Econométrie II - L3 Econométrie/Mass

30

10

5.3 Test de corrélation des erreurs (2) Procédure en 3 étapes : 1) Estimation de l’équation d’instrumentation et création d’une variables de résidus v 2) Inclusion du résidu v comme variable explicative de l’équation d’intérêt 3) Test de significativité du coefficient associé à v Si le coefficient est statistiquement différent de zéro, l’hypothèse d’exogénéité est rejetée NB : Si l’on a plusieurs variables endogène, il faut tester conjointement la significativité des résidus de chaque équation d’instrumentation Econométrie II - L3 Econométrie/Mass

31

5.4 Tester des restrictions suridentifiées Si l’on a un seul instrument pour la variable endogène, il est impossible de tester l’absence de corrélation entre l’instrument et le terme d’erreur : Corr(z,u) = 0 Modèle « juste identifié » Si l’on dispose de plusieurs instruments, le modèle est « sur-identifié » et il est possible de tester l’exogénéité d’un instrument Econométrie II - L3 Econométrie/Mass

32

5.5 Le test OverID Test en trois étapes : 1) Estimation de l’équation d’intérêt par IV et construction du résidu empirique u 2) Regression du résidu u sur toutes les variables exogènes du modèle (explicatives + instruments) 3) Test de la significativité jointe des coefficients estimé par un test du multiplicateur de Lagrange : Sous l’hypothèse nulle (exogénéité des instruments) : LM = nR2 ~ χq2 avec q le nombre d’instruments en excès Econométrie II - L3 Econométrie/Mass

33

11

6. Exemple


34

6.1 Exemple : Equation de salaire ln Wagei = β1 + β 2 Educi + β 3 Experi + β 4 Expersqi + U i Dependent Variable: LWAGE Method: Least Squares Sample (adjusted): 1 428 Included observations: 428 after adjustments Variable

Coefficient

Std. Error

t-Statistic

Prob.

C EDUC EXPER EXPERSQ

-0.522041 0.107490 0.041567 -0.000811

0.198632 0.014146 0.013175 0.000393

-2.628179 7.598333 3.154906 -2.062833

0.0089 0.0000 0.0017 0.0397

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

0.156820 0.150855 0.666420 188.3052 -431.5990 1.960988

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

MCO

1.190173 0.723198 2.035509 2.073445 26.28616 0.000000


35

6.2 Exemple : Equation de salaire (2) On suspecte l’éducation d’être endogène et on a instruments : éducation de la mère (motheduc) et du père (fatheduc) Dependent Variable: EDUC Method: Least Squares

Equation d’instrumentation : Les 2 instruments sont significatifs

Sample: 1 428 Included observations: 428 Variable

Coefficient

Std. Error

t-Statistic

Prob.

C EXPER EXPERSQ MOTHEDUC FATHEDUC

9.102640 0.045225 -0.001009 0.157597 0.189548

0.426561 0.040251 0.001203 0.035894 0.033756

21.33958 1.123593 -0.838572 4.390609 5.615173

0.0000 0.2618 0.4022 0.0000 0.0000


0.211471 0.204014 2.038967 1758.575 -909.7168 1.939888

Mean dependent var 12.65888 S.D. dependent var 2.285376 Akaike info criterion 4.274378 Schwarz criterion 4.321797 F-statistic Econométrie II - L328.36041 Prob(F-statistic) Econométrie/Mass 0.000000

36

12

6.3 Exemple : Equation de salaire (3) Dependent Variable: LWAGE Method: Two-Stage Least Squares

Résultats (automatisé) des Double Moindre Carrés (2SLS)

Sample (adjusted): 1 428 Included observations: 428 after adjustments Instrument list: EXPER EXPERSQ MOTHEDUC FATHEDUC Variable

Coefficient

Std. Error

t-Statistic

Prob.

C EDUC EXPER EXPERSQ

0.048100 0.061397 0.044170 -0.000899

0.400328 0.031437 0.013432 0.000402

0.120152 1.953024 3.288329 -2.237993

0.9044 0.0515 0.0011 0.0257

R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat

0.135708 0.129593 0.674712 1.945659

Mean dependent var S.D. dependent var Sum squared resid Second-stage SSR

1.190173 0.723198 193.0200 212.2096


37

6.4 Exemple : Equation de salaire (4) Dependent Variable: LWAGE Method: Least Squares

Résultats (manuels) de l’instrumentation

Sample: 1 428 Included observations: 428 Variable

Coefficient

Std. Error

t-Statistic

C EDUCF EXPER EXPERSQ

0.048100 0.061397 0.044170 -0.000899

0.419756 0.032962 0.014084 0.000421

0.114591 1.862629 3.136129 -2.134408


0.049783 0.043059 0.707456 212.2096 -457.1743 1.958629

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Prob. 0.9088 0.0632 0.0018 0.0334 1.190173 0.723198 2.155020 2.192956 7.404565 0.000076


38

6.5 Exemple : Test d’endogénéité Dependent Variable: LWAGE Method: Least Squares Sample: 1 428 Included observations: 428

L’endogénéité de l’éducation ne peut pas être rejetée au seuil de 10%

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C EDUC EXPER EXPERSQ RESEDUC

0.048100 0.061397 0.044170 -0.000899 0.058167

0.394575 0.030985 0.013239 0.000396 0.034807

0.121904 1.981499 3.336272 -2.270622 1.671105

0.9030 0.0482 0.0009 0.0237 0.0954


0.162350 0.154429 0.665016 187.0701 -430.1908 1.931343

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Econométrie II - L3 Prob(F-statistic) Econométrie/Mass

1.190173 0.723198 2.033602 2.081022 20.49612 0.000000 39

13

ch6-Variables Instrumentales - CNRS

Recommend Documents