ch6-Variables Instrumentales - CNRS

y = β0 + β1x1 + β2x2 + u avec Cov(x1,u) ≠ 0. On appelle instrument pour la variable x1 une variable z qui vérifie les 2 propriétés suivantes : 1) z es...

125 downloads 607 Views 225KB Size
Chapitre 6 La méthode des variables instrumentales Licence Econométrie / MASS Econométrie II, 2007-2008 Martin Fournier [email protected] Econométrie II - L3 Econométrie/Mass

1

1. Présentation du problème La question de l’endogénéité

Econométrie II - L3 Econométrie/Mass

2

1.1 L’hypothèse d’éxogénéité Les MCO supposent l’exogénéité des variables explicatives, i.e. Cov(x,u) = 0 Il existe de nombreuses situations où l’on doit rejeter cette hypothèse La méthode des variables instrumentales permet de tenir compte de l’endogénéité de certaines variables explicatives Econométrie II - L3 Econométrie/Mass

3

1

1.2 Endogénéité et causalité Une première source d’endogénéité concerne la possibilité d’une causalité inverse. On estime : y = β0 + β 1x1 + β 2x2 + u Alors qu’il existe une causalité inverse telle que : x1 = δ0 + δ2x2 + Zγ + αy + v  Cov(x1,u) ≠ 0 Econométrie II - L3 Econométrie/Mass

4

1.3 Un exemple On cherche à estimer une équation de croissance économique : ln(PIBt) – ln(PIBt-1) = β0 + β1INVt + β2EXPt + u  INV : taux d’investissement  EXP : taux d’exportations Or on sait que : INVt = δ0 + δ1PIBt-1 + Zδ + v et EXPt = γ0 + γ1PIBt-1 + Zγ + w Econométrie II - L3 Econométrie/Mass

5

1.4 Endogénéité et variable omise • Supposons que le modèle sous-jacent est : y = β 0 + β 1x 1 + β 2x 2 + u mais que l’on fasse une erreur de spécification en omettant la variable x2. On estime donc : y = δ0 + δ1x1 + v avec v = β2x2 + u • Si les variables x1 et x2 sont corrélées alors x1 est également corrélé à v Econométrie II - L3 Econométrie/Mass

6

2

1.5 Erreurs de mesure CEV « Classical Error-in-Variables » (CEV) :

y = β 0 + β1 x1∗ + u Avec une observation avec erreur : x1

e1 = x1 − x1∗  Équation estimée :

y = β 0 + β1 x1 + (u − β1e1 ) Avec x1 corrélé avec le terme d’erreur u-β1e1.

cov( x1 , u − β1e1 ) = − β1 cov(x1 , e1 ) = − β1σ e21 Econométrie II - L3 Econométrie/Mass

7

2. La méthode des variables instrumentales Le cas de la régression simple

Econométrie II - L3 Econométrie/Mass

8

2.1 Objectifs Méthode qui permet d’estimer des paramètres sans biais lorsqu’une variable explicative est endogène (i.e. Cov(x,u) ≠ 0)   

Causalité inverse Biais de variable omise CEV

Econométrie II - L3 Econométrie/Mass

9

3

2.2 Les instruments y = β0 + β 1x1 + β 2x2 + u avec Cov(x1,u) ≠ 0 On appelle instrument pour la variable x1 une variable z qui vérifie les 2 propriétés suivantes : 1) z est une variable exogène : Cov(z,u) = 0 2) z est une variable corrélée avec la variable x1 : Cov(z,x1) ≠ 0 Econométrie II - L3 Econométrie/Mass

10

2.3 Trouver un instrument valide La théorie économique (et le bon sens) permettent (parfois) de trouver des instruments qu’il peut être légitime de supposer exogènes (Cov(z,u) = 0) On peut en revanche aisément tester formellement la deuxième propriété (Cov(z,x1) ≠ 0) par un T-test à partir d’une première estimation : x = π0 + π1z + v H0 : π1 = 0 Econométrie II - L3 Econométrie/Mass

11

2.4 Variables instrumentales – Régression simple Prenons le cas de la régression simple : y = β 0 + β 1x + u avec x endogène et z un instrument valide On peut écrire :

L’estimateur IV de β1 est donc donné par :

Econométrie II - L3 Econométrie/Mass

12

4

2.5 Variables instrumentales – Régression simple (2) Sous l’hypothèse d’homoscédasticité E(u2|z) = σ2 = Var(u) On peut écrire la variance du paramètre estimé :

( )

σ2 nσ x2 ρ x2, z

( )

σˆ 2

Var βˆ1 = Vaˆr βˆ1 =

SSTx Rx2, z

Econométrie II - L3 Econométrie/Mass

13

2.6 IV versus OLS ( )

σˆ 2 Vaˆr βˆ OLS = SSTx

( )

Vaˆr βˆIV =

σˆ 2 SSTx Rx2, z

La variance de l’estimateurs IV ne diffère de celle des MCO que par le R2 de la régression de x sur z Comme R2 < 1, La variance de l’estimateurs IV est plus grande que celle des MCO NB : Mais l’estimateur MCO est biaisé si Cov(x,u) ≠ 0 !

Plus la corrélation entre z et x est forte, plus la variance de l’estimateur IV est faible Econométrie II - L3 Econométrie/Mass

14

2.7 Validité des instruments Il est souvent difficile de tester l’hypothèse d’exogénéité des instruments (Cov(z,u) = 0) Si l’instrument n’est pas exogène, l’estimateur IV sera également biaisé : Corr ( z , u ) σ u IV : plimβˆ1 = β1 + • Corr ( z , x) σ x

σ ~ OLS : plim β1 = β1 + Corr ( x, u ) • u

σx

L’estimateur IV sera préféré si : Corr(z,u)/Corr(z,x) < Corr(x,u) Econométrie II - L3 Econométrie/Mass

15

5

2.8 Variables instrumentales – Doubles Moindres Carrés (2SLS) y = β 0 + β 1x + u x = π0 + π1z + v L’estimateur IV est équivalent à une estimation en deux étapes : 1) Estimation de l’équation d’instrumentation : x = π0 + π1z + v  xˆ = π 0 + π 1 z 2) Estimation de l’équation d’intérêt sur x

y = δ 0 + δ1 xˆ + w Econométrie II - L3 Econométrie/Mass

16

2.9 IV – Doubles Moindres Carrés (2) On peut montrer que :

δ1MCO = β1IV La relation : y = δ 0 + δ1 xˆ + w peut être estimée par les MCO avec : δ1MCO = =

π 1Cov( z , y ) Cov(π 0 + π 1 z , y ) = Var (π 0 + π 1 z ) Cov(π 0 + π 1 z , x − u ) π 1Cov( z , y ) Cov( z , y ) = = β1IV π 1Cov( z , x) − Cov( z , u ) Cov( z , x) Econométrie II - L3 Econométrie/Mass

17

3. La méthode des variables instrumentales Le cas de la régression multiple

Econométrie II - L3 Econométrie/Mass

18

6

3.1 IV et régression multiple Les estimations IV peuvent être étendues au cas de la régression multiple : y1 = β0 + β1y2 + β2z1 + u1 avec y2 et y3 endogènes et z1 et z2 exogènes Il est nécessaire d’avoir au moins un instrument pour chaque variable Econométrie II - L3 Econométrie/Mass

19

3.2 IV et régressions multiples (2) Écrivons le modèle structurel comme : y = β 0 + β 1x 1 + β 2x 2 + u avec x1 endogène et x2 exogène Soit z un instrument pour x1 Cov(z,u) = 0 x1 = π0 + π1z + π2x2 + v, avec π1 ≠ 0 NB : Cette équation régresse la variable endogène sur toutes les variables exogènes et l’instrument Econométrie II - L3 Econométrie/Mass

20

3.3 Doubles Moindres Carrés Two Stage Least Squares (2SLS) y = β0 + β1x1 + β2x2 + u Il est possible (et souhaitable) d’avoir plusieurs instruments pour la même variable endogène : x1 = π0 + π1z1 + π2z2 + π3z3 + v Hypothèse : z2 et z3 sont des instruments valides - Ils ne sont pas des déterminants directs de y1 - Ils sont non-corrélés avec le terme d’erreur u1 - Ils sont corrélés avec y2 Econométrie II - L3 Econométrie/Mass

21

7

3.4 L’estimateur IV et les 2SLS On peut montrer (cf. cours de M1) que dans le cas général l’estimateur IV est donné par :

β1IV = ( Z ' X ) −1 Z ' Y avec Z : Ensemble des variables exogènes (explicatives non endogènes + instruments) Ce qui correspond à l’estimateur des doubles moindres carrés :

β12 SLS = ( Xˆ ' Xˆ ) −1 Xˆ ' Y

Avec Xˆ : Ensemble des variables explicatives simulées à partir de l’équation d’instrumentation :

X = Zπ + v Econométrie II - L3 Econométrie/Mass

22

3.5 L’estimateur IV et les 2SLS (2) X = Zπ + v

β1IV = β12 SLS

⇒ πˆ MCO = ( Z ' Z ) −1 Z ' X ⇒ Xˆ = Zπˆ MCO = Z ( Z ' Z ) −1 Z ' X Y = Xˆβ 2 SLS + u ⇒ βˆ 2 SLS = ( Xˆ ' Xˆ ) −1 Xˆ ' Y

[(

)( '

= Z ( Z ' Z ) −1 Z ' X Z ( Z ' Z ) −1 Z ' X = ( Z ' X ) −1 Z 'Y

)] (Z (Z ' Z ) −1

−1

)

'

Z' X Y

Econométrie II - L3 Econométrie/Mass

23

3.6 Doubles Moindres Carrés : La forme de l’instrumentation Remarque 1 : Chacun des instruments pourrait être utilisé indépendamment comme instrument

 La meilleure forme d’instrumentation est une combinaison linéaire de toutes les variables exogènes Remarque 2 : Si les coefficients de l’estimateur IV et de l’estimateur 2SLS sont égaux, la variance des MCO pour l’estimation de deuxième étape est Econométrie II - L3 invalide Econométrie/Mass

24

8

3.7 Nombre d’instruments Lorsqu’on a plusieurs variables endogènes, il faut avoir au moins autant d’instruments que de variables endogènes

Econométrie II - L3 Econométrie/Mass

25

4. Le cas particulier des erreurs de mesure

Econométrie II - L3 Econométrie/Mass

26

4.1 Erreurs de mesure CEV et estimations IV Reprenons le modèle d’erreur de mesure CEV y = β0 + β1x1* + β2x2 + u - On observe x1 au lieu de x1* - x 1 = x 1* + e 1 - e1 est non corrélé avec x1* et x2 - x1 est endogène Si l’on peut trouver un instrument z pour x1 t.q. Corr(z,u) = 0 et Corr(z,x1) ≠ 0 Alors l’estimation IV corrige le biais d’atténuation Econométrie II - L3 Econométrie/Mass

27

9

5. Tester l’endogénéité d’une variable

Econométrie II - L3 Econométrie/Mass

28

5.1 Test de Hausman On sait que : - Les estimateurs MCO et IV sont sans biais et convergents sous l’hypothèse d’exogénéité - Seul l’estimateur IV reste sans biais si l’hypothèse d’exogénéité est rejetée - L’estimateur MCO est préférable à l’estimateur IV sous l’hypothèse d’exogénéité L’idée du test de Hausman est de tester l’égalité des estimateurs MCO et IV  Test disponible sous tous les logiciels usuels Econométrie II - L3 Econométrie/Mass

29

5.2 Test de corrélation des erreurs y = β0 + β1x1 + β2x2 + u x1 = π0 + π1z1 + π2z2 + π3z3 + v

Si x1 est endogène et z un jeu d’instruments valides alors le résidu de l’équation d’instrumentation v est corrélé au résidu de l’équation d’intérêt u  Tester directement cette hypothèse Econométrie II - L3 Econométrie/Mass

30

10

5.3 Test de corrélation des erreurs (2) Procédure en 3 étapes : 1) Estimation de l’équation d’instrumentation et création d’une variables de résidus v 2) Inclusion du résidu v comme variable explicative de l’équation d’intérêt 3) Test de significativité du coefficient associé à v  Si le coefficient est statistiquement différent de zéro, l’hypothèse d’exogénéité est rejetée NB : Si l’on a plusieurs variables endogène, il faut tester conjointement la significativité des résidus de chaque équation d’instrumentation Econométrie II - L3 Econométrie/Mass

31

5.4 Tester des restrictions suridentifiées Si l’on a un seul instrument pour la variable endogène, il est impossible de tester l’absence de corrélation entre l’instrument et le terme d’erreur : Corr(z,u) = 0  Modèle « juste identifié » Si l’on dispose de plusieurs instruments, le modèle est « sur-identifié » et il est possible de tester l’exogénéité d’un instrument Econométrie II - L3 Econométrie/Mass

32

5.5 Le test OverID Test en trois étapes : 1) Estimation de l’équation d’intérêt par IV et construction du résidu empirique u 2) Regression du résidu u sur toutes les variables exogènes du modèle (explicatives + instruments) 3) Test de la significativité jointe des coefficients estimé par un test du multiplicateur de Lagrange : Sous l’hypothèse nulle (exogénéité des instruments) : LM = nR2 ~ χq2 avec q le nombre d’instruments en excès Econométrie II - L3 Econométrie/Mass

33

11

6. Exemple

Econométrie II - L3 Econométrie/Mass

34

6.1 Exemple : Equation de salaire ln Wagei = β1 + β 2 Educi + β 3 Experi + β 4 Expersqi + U i Dependent Variable: LWAGE Method: Least Squares Sample (adjusted): 1 428 Included observations: 428 after adjustments Variable

Coefficient

Std. Error

t-Statistic

Prob.

C EDUC EXPER EXPERSQ

-0.522041 0.107490 0.041567 -0.000811

0.198632 0.014146 0.013175 0.000393

-2.628179 7.598333 3.154906 -2.062833

0.0089 0.0000 0.0017 0.0397

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

0.156820 0.150855 0.666420 188.3052 -431.5990 1.960988

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

MCO

1.190173 0.723198 2.035509 2.073445 26.28616 0.000000

Econométrie II - L3 Econométrie/Mass

35

6.2 Exemple : Equation de salaire (2) On suspecte l’éducation d’être endogène et on a instruments : éducation de la mère (motheduc) et du père (fatheduc) Dependent Variable: EDUC Method: Least Squares

Equation d’instrumentation : Les 2 instruments sont significatifs

Sample: 1 428 Included observations: 428 Variable

Coefficient

Std. Error

t-Statistic

Prob.

C EXPER EXPERSQ MOTHEDUC FATHEDUC

9.102640 0.045225 -0.001009 0.157597 0.189548

0.426561 0.040251 0.001203 0.035894 0.033756

21.33958 1.123593 -0.838572 4.390609 5.615173

0.0000 0.2618 0.4022 0.0000 0.0000

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

0.211471 0.204014 2.038967 1758.575 -909.7168 1.939888

Mean dependent var 12.65888 S.D. dependent var 2.285376 Akaike info criterion 4.274378 Schwarz criterion 4.321797 F-statistic Econométrie II - L328.36041 Prob(F-statistic) Econométrie/Mass 0.000000

36

12

6.3 Exemple : Equation de salaire (3) Dependent Variable: LWAGE Method: Two-Stage Least Squares

Résultats (automatisé) des Double Moindre Carrés (2SLS)

Sample (adjusted): 1 428 Included observations: 428 after adjustments Instrument list: EXPER EXPERSQ MOTHEDUC FATHEDUC Variable

Coefficient

Std. Error

t-Statistic

Prob.

C EDUC EXPER EXPERSQ

0.048100 0.061397 0.044170 -0.000899

0.400328 0.031437 0.013432 0.000402

0.120152 1.953024 3.288329 -2.237993

0.9044 0.0515 0.0011 0.0257

R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat

0.135708 0.129593 0.674712 1.945659

Mean dependent var S.D. dependent var Sum squared resid Second-stage SSR

1.190173 0.723198 193.0200 212.2096

Econométrie II - L3 Econométrie/Mass

37

6.4 Exemple : Equation de salaire (4) Dependent Variable: LWAGE Method: Least Squares

Résultats (manuels) de l’instrumentation

Sample: 1 428 Included observations: 428 Variable

Coefficient

Std. Error

t-Statistic

C EDUCF EXPER EXPERSQ

0.048100 0.061397 0.044170 -0.000899

0.419756 0.032962 0.014084 0.000421

0.114591 1.862629 3.136129 -2.134408

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

0.049783 0.043059 0.707456 212.2096 -457.1743 1.958629

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Prob. 0.9088 0.0632 0.0018 0.0334 1.190173 0.723198 2.155020 2.192956 7.404565 0.000076

Econométrie II - L3 Econométrie/Mass

38

6.5 Exemple : Test d’endogénéité Dependent Variable: LWAGE Method: Least Squares Sample: 1 428 Included observations: 428

L’endogénéité de l’éducation ne peut pas être rejetée au seuil de 10%

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C EDUC EXPER EXPERSQ RESEDUC

0.048100 0.061397 0.044170 -0.000899 0.058167

0.394575 0.030985 0.013239 0.000396 0.034807

0.121904 1.981499 3.336272 -2.270622 1.671105

0.9030 0.0482 0.0009 0.0237 0.0954

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

0.162350 0.154429 0.665016 187.0701 -430.1908 1.931343

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Econométrie II - L3 Prob(F-statistic) Econométrie/Mass

1.190173 0.723198 2.033602 2.081022 20.49612 0.000000 39

13