Introduction à STATA

de 10 mégas ne s'ouvrira pas sauf si on modifie la quantité de mémoire disponible pour Stata. Pour vérifier la taille de la base à charger, on utilise...

87 downloads 436 Views 3MB Size
Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Introduction à STATA Nathalie Colombier & Julien Licheron

Activité organisée par PROJECT Jeudi 3 Juillet 2008

Nathalie Colombier & Julien Licheron

Introduction à STATA

Panel

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Pourquoi STATA ? Logiciel intuitif : interface et fenêtres Relativement exible : dispose souvent de nombreuses options, et permet aussi de programmer Grosse communauté d'utilisateurs : nombreux modules supplémentaires, aide et documentation sur Internet, travail des "

Stata boys "

Particulièrement adapté aux variables qualitatives Utilisé dans des disciplines autres que l'économie (nance, épidémiologie, biologie, . . . )

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Plan de la Présentation 1

Introduction

2

Fichiers de Stata

3

Traiter les Variables

4

Statistiques Descriptives

5

Variables Qualitatives

6

Séries Temporelles

7

Données de Panel

8

Quelques Extensions

Nathalie Colombier & Julien Licheron

Introduction à STATA

Panel

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Présentation STATA Stata se présente sous la forme de 4 fenêtres :

Review : ache l'historique des commandes tapées par l'utilisateur et permet d'en rappeler une facilement.

Results : utilisée pour acher tous les résultats des commandes tapées par l'utilisateur.

Variables : détaille toutes les variables présentes dans la base de

Stata ne peut ouvrir qu'une seule base de données en même temps ). données actuellement ouverte dans Stata (

Command : permet à l'utilisateur d'entrer les commandes.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Présentation STATA

Nathalie Colombier & Julien Licheron

Introduction à STATA

Panel

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Présentation STATA ⇒

Une barre de menus qui permet d'exécuter les commandes les plus

courantes sous Stata sans avoir à se servir de la fenêtre

Nathalie Colombier & Julien Licheron

Introduction à STATA

Command.

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Présentation STATA Data Editor Data Browser ) également accessibles par le biais du menu (Data/Data Editor ou Data/Data Browser ) et directement à partir de la fenêtre de commandes (edit ou browse ). Deux icônes permettant d'acher la base de données (

ou

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Présentation STATA : Fichiers et répertoires Stata utilise plusieurs types de chiers, nommés d'après leurs extensions :

1

Fichier .do : Fichiers de commandes, lisibles dans n'importe quel éditeur de texte et bien entendu par le Do-le Editor inclu dans Stata. Ils permettent à l'utilisateur de lancer plusieurs commandes Stata en une seule opération et de garder une trace des commandes exécutées

2

Fichier .smcl : Fichiers d'aide (.hlp, ) ou de log (extension libre, en général .log). Ces chiers s'achent dans le Viewer Stata ou dans n'importe quel éditeur de texte. La syntaxe smcl permet à Stata d'acher le gras, les italiques, etc.

3

Fichier .dta : Fichiers de données au format Stata.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Présentation STATA : Do-le editor

Il est possible de lancer l'intégralité du do-le ou d'en exécuter seulement une partie.



Pour cela, il sut de sélectionner la partie souhaitée du .do avant de

cliquer sur Do ou Run.

La seule diérence entre Run et Do est que la seconde commande ache les résultats dans la fenêtre Results, alors que la première est silencieuse.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Présentation STATA : Do-le editor L'ouverture du

Do-File Editor

peut se faire en appuyant sur l'icône

correspondante dans la barre de menu, en sélectionnant dans le menu

Windows/Do-le Editor/New le,

ou en entrant

doedit

dans la fenêtre

Command. Lorsqu'on utilise Stata, il est préférable d'utiliser un chier

Nathalie Colombier & Julien Licheron

Introduction à STATA

Do-le.

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Présentation STATA : Do-le editor Un page blanche apparaît, et c'est sur cette page blanche que l'on inscrit toutes les commandes que l'on veut faire exécuter sur nos données. Pour exécuter tout ou une partie des commandes, il sut d'appuyer sur l'icône se trouvant sur la barre d'outil du chier Do-le.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Présentation STATA : Do-le editor Commandes utiles à insérer en préambule du do-le :

1 Gestion de la mémoire :

Lorsque Stata doit ouvrir une base de données,

celle-ci est intégralement chargée en mémoire.



Pour un état des lieux de la mémoire, memory.

Stata dispose par défaut de 10 mégas de mémoire



toute base de plus

de 10 mégas ne s'ouvrira pas sauf si on modie la quantité de mémoire disponible pour Stata. Pour vérier la taille de la base à charger, on utilise la commande

describe using mabase.dta. Si celle-ci nécessite 100 mégas, set memory 100m ⇔ set mem 100m.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Présentation STATA : Do-le editor 2 Log

: Pour conserver une trace complète de tout ce qui s'ache dans la

fenêtre

Results

au cours d'une session (commandes/résultats...), il est

possible (et préférable!) de créer un chier log. Stata permet de créer des log au format texte (option text), ou au format smcl (option smcl). Ce dernier format permet un achage du log dans le Viewer Stata très propre, mais complique la lecture du log avec d'autres logiciels.

Pour commencer un nouveau chier de log :

log using monchier ou bien

log using D:\Home\ncolombi\MES DOCUMENTS\document\économétrie\essai.smcl,text. Pour le fermer log : log close.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Présentation STATA Pour mettre le log à la suite du log issu de la précédente session Stata :

append.

Pour débuter à partir d'un chier vierge :

Nathalie Colombier & Julien Licheron

replace.

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Présentation STATA : Do-le editor

3 Gestion de l'achage : Pour supprimer l'achage des résultats d'une commande,

quietly commande. Pour détailler au maximum les opérations réalisées par Stata :

set trace on. Pour que Stata ne stoppe pas au cours de l'exécution d'un do-le lorsque l'achage des résultats atteint le bas de la fenêtre Results, set more o.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Présentation STATA : Do-le editor EN RÉSUMÉ On débute le programme avec la commande clear an de vider la mémoire de Stata. On spécie la taille de la mémoire à allouer set memory 100m ⇔ set

mem 100m. on indique quelle base utiliser use

D:\document\économétrie\EPCV\indo05.dta . il est conseillé d'ouvrir un chier

log

: log using nouveaunom.log,

replace (par défaut à la racine) ou bien spécier l'emplacement du

log :

log using D:\Home\ncolombi\MES DOCUMENTS\document\économétrie\essai.smcl commencer le programme par set more o il est possible d'inclure des commentaires dans le programme en les

*

encadrant par des  

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Description des données Les variables sous Stata peuvent être numériques ou alphanumériques.

Les variables numériques peuvent être de diérents types, selon la précision (et la place en mémoire) nécessaire. Les variables alphanumériques (en rouge dans browser) sont des chaînes de caractères quelconques (string, str), d'une longueur maximale de 244 caractères. Pour transformer une chaîne en variable numérique,

variable, options.

Parmi les options,

gen(var)

ou

replace.

destring

Stata stocke par défaut une variable sous forme de chaîne lorsque la variable contient au moins un caractère non-numérique (souvent variables manquantes)



Il est impossible d'utiliser cette variable dans une régression. Pour

contraindre Stata à ignorer les caractères non numériques, l'option

Nathalie Colombier & Julien Licheron

Introduction à STATA

force.

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Généralités Lors de l'écriture de programmes :

Pour chaque nouvelle commande il faut passer à la ligne, il est inutile de nir par , ou ;. Par contre, à chaque commande sont associées des options et la structure est : nom_de_commande variables_concernées, options

Stata ne tient pas compte des espaces multiples Minuscules/majuscules : les commandes sont à taper en minuscules, attention aux noms de variables comportant des majuscules.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Opérateurs et fonctions mathématiques Quelques remarques : En ce qui concerne le signe signe

=

=,

il existe une particularité. Lorsque le

est une conjecture (à tester) ou une condition et non une

dénition, on doit le remplacer par

==.

Les valeurs manquantes (symbolisées par un point . sous Stata) sont les plus grandes valeurs. Ainsi, l'expression salaire> 1500 est vraie si le salaire est supérieur strictement à 1500 ou manquant. Pour ne conserver que les valeurs supérieures à 1500 et non manquantes, il faut préciser : salaire>1500

&

salaire<.

Les opérateurs suivent l'ordre de priorité habituel. L'opérateur Et est prioritaire sur l'opérateur Ou.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Opérateurs et fonctions mathématiques

Addition Multiplication Egalité Exposant Racine Logarithme

+ ∗ = b

Et Maximum

max()

Inégalité partie entière

sqrt () log ()

Ou

> |

Minimum

min()

Sup. (resp. Inf.)

− / ∼= ou ! = int () exp () abs () >= (resp. <=) &

Soustraction Division

(resp.

Exponentielle Valeur absolue

<)

Nathalie Colombier & Julien Licheron

Sup. (resp. Inf ) ou égal

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Trois expressions : by, if et in Ces trois expressions peuvent s'utiliser avec la majorité des commandes Stata. On peut les combiner les unes avec les autres.

1

by permet d'appliquer une commande à chaque valeur d'une variable. La syntaxe de cette expression est by variable :

commande variable. En amont, il faut que la base de données soit classée par cette variable. On peut utiliser sort avant by, ou pour classer et eectuer le by en même temps, bysort.

Exemple : bysort sexe : summarize salaire permet d'obtenir le salaire moyen des femmes et des hommes.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Trois expressions : by, if et in

2

if permet de n'appliquer la commande qu'aux observations remplissant une condition particulière. Syntaxe : commande variable if condition.

Exemple : summarize salaire if age==18

|

age>20

&

age<=50 donne les statistiques descriptives de la variable salaire pour les observations dont la variable age est égale à 18 ou comprise entre 20 (exclu) et 50 (inclus). L'opérateur

&

est prioritaire, les parenthèses sont inutiles ici.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Trois expressions : by, if et in

3

in permet de n'appliquer la commande qu'aux observations se situant dans un intervalle donné. Syntaxe : commande variable in condition.

Exemple : summarize salaire in 10/20 donne les statistiques descriptives de la variable salaire pour les observations de la 10ème à la 20ème ligne de la base de données.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Décrire et manipuler des données describe : ache la liste de toutes les variables, le type et les éventuels labels (peu utilisé)



des.

ds : liste les variables codebook variable : détaille la variable ie. modalités possibles, fréquences, nombre de données manquantes,

...

rename ancien_nom nouv_nom : Renomme la variable ancien_nom en nouv_nom.

replace

x = 12 :

Remplace le contenu de la variable

x

x

par 12 (

devient une constante).

replace celle de

x = y if y > 10 & y ∼= . : Remplace la valeur de x y , si y est supérieur à 10 et contient une valeur.

Nathalie Colombier & Julien Licheron

Introduction à STATA

par

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Décrire et manipuler des données

drop x : Supprime la variable

x.

drop _all : Supprime toutes les variables keep x : Conserve la variable x, supprime toutes les autres. label var variable label : Attribue à une variable x un label (une étiquette).

Exemple : label var lnsal "logarithme du salaire brut". global liste var1 var2 var3

...

varn : permet de générer une

liste de variables appellée 'liste'.

regress salaire $liste



regress salaire var1 var2 var3

Nathalie Colombier & Julien Licheron

Introduction à STATA

...

varn

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Décrire et manipuler des données Dans le cadre notamment de l'économétrie des variables qualitatives, le codage est déterminant et il est souvent nécessaire de générer ou modier des variables.

Créer des variables : deux commandes existent : generate permet de créer des variables qui nécessitent des calculs simples

egenerate (extended generate) s'impose lorsque les calculs se complexient un peu ou que l'utilisation de fonctions statistiques spéciques est nécessaire.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Décrire et manipuler des données

Exemples d'utilisation de generate : gen x = 12 : crée une constante nommée x, qui vaut 12. gen x = log(a*b)-sqrt(abs(b)) : La nouvelle variable p

x = log(a × b) −

|b |

.

gen x = (sexe==Homme): x est égal à 1 si la variable sexe contient la chaîne de caractère Homme, 0 sinon.

gen x = y[_n-1] : x est égale à la valeur de l'observation précédente de y.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Décrire et manipuler des données Exemples d'utilisation de egenerate : egen x = sd[y] : x, constante, est égal à l'écart-type de y. egen x = pctile(y), p(50) : x est égal à la médiane de y.

Replace : permet de recoder, de remplacer certaines valeurs d'une variable par d'autres valeurs :

replace satis=1 if satis==2|satis==3 : remplace valeur 1 si

satis

est égale à 2 ou 3.

Nathalie Colombier & Julien Licheron

Introduction à STATA

satis

par la

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Fusionner des bases de données Stata ne peut ouvrir qu'une seule base de données en même temps. Pour travailler simultanément sur deux bases de données : soit ouvrir base 1, l'enregistrer puis ouvrir base 2 ; soit ouvrir deux sessions Stata en parallèle.



Pour fusionner deux bases de données, deux cas sont à distinguer

selon que l'on souhaite ajouter des observations ou bien des variables :

1

Ajouter de nouvelles observations :

append using nom_de_la_base2 Il faut bien entendu que les variables aient rigoureusement le même nom dans les deux bases de données.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Fusionner des bases de données 2

Ajouter de nouvelles variables : il est impératif que les données soient ordonnées de la même facon dans les deux bases (sort

nom_de_variable(s) ). Base 1 ouverte.

merge nom_de_variable(s) using nom_de_base2, options Une nouvelle variable _merge est créée et indique le résultat de la fusion. Les options les plus usitées : unique (conserve observations non fusionnées base 1 et 2), uniqmaster (conserve observations non fusionnées base 1) et uniqusing (conserve observations non fusionnées base 2).

joinby nom_de_variable(s) using nom_de_base2, options : la diérence avec

merge

est que

joinby

ne conserve

que les observations pour lesquelles il y a eu fusion.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Statistiques Descriptives summarize variable (sum) permet d'obtenir les statistiques descriptives usuelles. L'option detail permet d'en avoir plus.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Statistiques Descriptives tabulate variable (tab) calcule les fréquences des valeurs prises par une variable, et permet de créer des tableaux croisés pour deux variables.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Statistiques Descriptives tabulate variable, row col cel (tab) permet de créer des tableaux croisés pour deux variables avec toutes les fréquences conditionnelles associées.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Statistiques Descriptives count if condition renvoies le nombre d'observations qui remplissent la condition imposée. Peut être associée à by.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Panel

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Statistiques Descriptives : corrélation et covariance pwcorr variable1 variable2 donne la matrice de corrélations entre les variables. L'option sig permet d'obtenir le résultat du test de nullité du coecient de corrélation.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Statistiques Descriptives : corrélation et covariance

corr variable1 variable2, cov permet d'obtenir la matrice des variance-covariances.

pwcorr variable1 variable2 variable3 permet d'obtenir les coecients de corrélation partielle entre les variables prises deux à deux.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Tests sur la moyenne, la variance et la distribution des variables ttest permet de comparer les moyennes de deux variables. Attention : ce test repose sur l'hypothèse implicite d'égalité des variances des deux variables. L'option unequal permet de relâcher celle-ci.

Exemples : ttest age, by(homme), pour tester la signicativité de la diérence d'âge entre hommes et femmes.

ttest age=40 : pour savoir si l'âge moyen est égal à 40 ans.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Tests sur la moyenne, la variance et la distribution des variables

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Variables qualitatives : modèle binaire On peut utiliser le modèle logit ou probit. Les commandes sont du type :

logit variable_expliquée variable_explicatives. probit variable_expliquée variable_explicatives. Par exemple : probit horlib homme age cspinter cspintel cycle1 cycle23 useintbu joigndepb logit horlib homme age cspinter cspintel cycle1 cycle23 useintbu joigndepb

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Variables qualitatives : modèle binaire

Nathalie Colombier & Julien Licheron

Introduction à STATA

Panel

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Variables qualitatives : modèle binaire post estimation

1

Pour obtenir les eets marginaux : après l'estimation d'un modèle Logit ou Probit



on utilise la commande mfx compute.

dans le cadre du modèle Probit, la commande dprobit calcule directement les eets marginaux, sans passer par les coecients.

2

predict p permet d'obtenir la probabilité prédite notée p.

3

lstat permet d'obtenir le taux de bonnes et mauvaises prédictions.

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Variables qualitatives : eets marginaux

Nathalie Colombier & Julien Licheron

Introduction à STATA

Panel

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Variables qualitatives : probabilités prédites

Nathalie Colombier & Julien Licheron

Introduction à STATA

Panel

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Variables qualitatives : modèle multinomiaux

Modèles ordonnés : la syntaxe est similaire à celle utilisée pour les modèles binaires avec les commandes oprobit pour le probit ordonné et ologit pour le logit ordonné.

Modèles multinomiaux : Stata gère assez mal les modèles de type Probit multivariés comportant plus de 4 alternatives. Les modèles de type Logit multinomiaux par contre s'estiment sans problème avec la commande mlogit .

mlogit statut homme diplome age, baseoutcome(1)

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Quelques tests . . . Hausman : mlogit statut homme diplome age, baseoutcome(1) est store modele1 mlogit statut homme diplome age if statut !=0, baseoutcome(1) est store modele2 hausman modele1 modele2, alleqs constant Heckman : heckman : régression avec probit de sélection heckman wage educ age, select(married children educ age),options heckprob : probit avec probit de sélection heckman job educ age, select(married children educ age),options

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Utilisation des séries temporelles

Pour spécier la nature temporelle des données, il faut utiliser

tsset variable_temporelle [, options] tsset month, monthly

la commande : Par exemple

tsll :

remplace les "trous" par des valeurs manquantes

tsreport :

reporte des stats sur la structure des séries

temporelles (trous, observations multiples, . . . )

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Principaux opérateurs de séries temporelles L. : L2. F. : F2.

xt − 1 ) : deuxième retard (xt −2 ) opérateur lead (xt +1 ) : deuxième lead (xt +2 ) opérateur retard (

D. : opérateur diérence (xt − xt −1 ) D2. : opérateur diérence (xt − xt −1 )−(xt −1 − xt −2 ) S. : opérateur diérence saisonnière (xt − xt −1 ) S2. : opérateur diérence saisonnière (xt − xt −2 ) Sn. : opérateur diérence saisonnière (xt − xt −n ) Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

,→

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Ces opérateurs peuvent être utilisé directement dans les

commandes, par exemple :

sum L.gdp regress y x1 L.x1 L4.x2 ,→

Ces opérateurs peuvent être combinés, par exemple :

L(1/4).gdp : équivalent à L.gdp L2.gdp L3.gdp L4.gdp F(2/3).inf : équivalent à F2.inf F3.inf

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Quelques modèles disponibles Modèles de régression simples (MCO, MCG) Exemple :

regress y x1 x2, noconstant

Modèles AR(p), MA(q) ou ARMA(p,q) Exemple :

arima y x1 x2, ar(2) ma(1/4)

Modèle ARIMA(p,d,q) Exemple :

arima y x1 x2, arima(2,2,1/4)

Modèles ARCH, GARCH et dérivés Modèles VAR, SVAR et VECM

Nathalie Colombier & Julien Licheron

Introduction à STATA

Panel

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Modèles à variables instrumentales (TSLS) - STATA 9 Exemple :

ivreg y x1 (x2 = inst1 inst2), robust

Modèles GMM - STATA 9 Exemple :

,→

ivreg2 y x1 (x2 = inst1 inst2), gmm robust

Dans STATA 10, une seule commande :

ivregress

ivregress 2sls y x1 (x2 = inst1 inst2), vce(robust) ivregress gmm y x1 (x2 = inst1 inst2), vce(robust)

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Quelques tests pour séries temporelles Tests de racine unitaire ou de stationnarité Test de Dickey-Fuller et tests ADF :

dfuller variable, lags(n) noconstant trend Test de Phillips-Perron :

pperron variable, lags(n) noconstant trend Test KPSS : kpss variable, lags(n) notrend Tests d'autocorrélation des erreurs (après une régression)

estat dwatson Test de Breusch-Godfrey : estat bgodfrey, lags(n) Test de Durbin-Watson :

Nathalie Colombier & Julien Licheron

Introduction à STATA

Panel

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Utilisation des données de panel

Pour dénir la nature de panel des données, il faut utiliser la commande :

tsset

[, options] tsset id quarter, quarterly

var_individu var_temporelle

Par exemple :

xtsum :

permet d'obtenir des stats descriptives intra- et

inter-individuelles (Version panel de

xttab :

sum)

calcule les fréquences intra- et inter-individuelles

(Version panel de

tab)

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Quelques modèles pour données de panel Modèle à eets xes Exemple :

xtreg y x1 x2, fe

Modèle à eets aléatoires Exemple :

xtreg y x1 x2, re

Modèle avec variables instrumentales Exemple :

xtivreg y x1 (x2 = inst1 inst2), fe

Modèle GMM en panel Exemple :

xtivreg2 y x1 (x2 = inst1 inst2), fe gmm

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Modèles de panel dynamique estimés par GMM : commande

xtabond2

dierence-GMM Exemple : xtabond2 y L.y x1 x2, robust small noleveleq gmmstyle(L.y x1) ivstyle(x2)

Estimateur de Arellano & Bond (1991) -

system-GMM xtabond2 y L.y x1 x2, robust small gmmstyle(L.y x1, lags(2 .) collapse) ivstyle(x2, lags(1 .) collapse) Estimateur de Blundell & Bond (1998) -

Exemple :

,→

Plus d'infos sur cette commande :

Roodman D. (2006): "How to do xtabond2: An introduction to

dierence and system GMM in Stata", Center for Global Development, Working Paper 103, Washington. Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Variables qualitatives en panel

Probit à eets aléatoires Exemple :

xtprobit y x1 x2, re

Logit à eets xes Exemple :

xtlogit y x1 x2, fe

Probit ordonné à eets aléatoires Exemple :

reoprobit y x1 x2

Nathalie Colombier & Julien Licheron

Introduction à STATA

Panel

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Quelques tests pour données de panel

Tests de racine unitaire ou de stationnarité Test de Levin, Lin & Chu (LLC) :

levinlin variable, lags(n) noconstant trend Test de Im, Pesaran & Shin (IPS) :

ipshin variable, lags(n) trend nodemean Test d'Hadri :

hadrilm variable, lags(n) notrend

Nathalie Colombier & Julien Licheron

Introduction à STATA

Panel

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Meta-analyse avec STATA Pas de commande unique pour la meta-analyse, mais une suite complète de modules développés par les utilisateurs

meta et metan : stats et forest plot metareg : régression metafunnel et metabias : funnel plot metatrim : "trim and ll" method metainf : tests de sensibilité

et tests d'asymétrie

...

,→ Plus d'infos sur ces commandes : http://www.stata.com/support/faqs/stat/meta.html http://www.blackwellpublishing.com/medicine/bmj/ systreviews/pdfs/chapter18.pdf Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Exportation des tableaux de résultats Exportation en chier ASCII (.out) ou Word (.doc) : commande

outreg

regress y x1 x2 outreg using table1.out, title("Table 1") ctitle("A") regress y x1 x2 x3 outreg using table1.out, append ctitle("B") type table1.out AT X(.tex) : commande Exportation au format L E

,→

Plus d'infos dans le guide de F. Bresson :

est2tex

http://129.3.20.41/eps/prog/papers/0506/0506001.pdf

Nathalie Colombier & Julien Licheron

Introduction à STATA

Extensions

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Ajout de nouvelles commandes Pour installer de nouveaux modules à Stata (chiers .ado et .hlp) :

ssc install

, all

nom_du_module

Par exemple :

ssc install xtabond2, all ssc install levinlin, all Pour voir les nouveaux modules disponibles pour Stata (environ 50 modules depuis janvier 2008 !):

http://ideas.repec.org/s/boc/bocode.html

Nathalie Colombier & Julien Licheron

Introduction à STATA

Intro

Fichiers

Traiter les Variables

Stats Des.

Vbles Quali.

Séries Temp.

Panel

Extensions

Trouver de l'aide. . . Aide interne à Stata :

help

command

Manuels ociels Stata : complètent l'aide en ligne et donnent des exemples

Site(s) Web de Stata et du

Stata Journal

:

http://www.stata.com http://www.stata-press.com http://www.stata-journal.com . . . et également la

Statalist

!

http://www.stata.com/statalist Nathalie Colombier & Julien Licheron

Introduction à STATA