Académique Documents
Professionnel Documents
Culture Documents
UNIVERSITE DE CARTHAGE
MODULE N°1
SOUS STATA
MAI 2012
1ère édition
Electroniccopy
Electronic copy available
available at:
at: https://ssrn.com/abstract=2891006
https://ssrn.com/abstract=2891006
Économétrie des données de panel Mohamed GOAIED & Seifallah SASSI
Introduction
Je voudrai donner quelques conseils principalement aux jeunes doctorants qui auront dans
leur recherches à utiliser les techniques économétriques afin de réussir leur partie empirique
qui constitue une barrière pour plusieurs chercheurs confrontés à la mise en pratique de leurs
connaissances qui restent très souvent théoriques. Il s’agit là, d’une réflexion qui permet, un
tant soit peu, d’orienter le chercheur vers le choix approprié des méthodes économétriques à
utiliser, compte tenu de la nature de l’information statistique disponible, tout en gardant à
l’esprit que tout travail de recherche demeure perfectible. Seul Dieu est parfait !
La démarche économétrique.
Une double vision est requise au niveau de la lecture des articles de référence. (Type
de données, de variables retenues, méthodes d’estimation, type d’instruments et de
tests,…) en plus du cadre conceptuel de la théorie économique. Economie et
statistique vont de pair.
Electroniccopy
Electronic copy available
available at:
at: https://ssrn.com/abstract=2891006
https://ssrn.com/abstract=2891006
Économétrie des données de panel Mohamed GOAIED & Seifallah SASSI
Cette collection d’économétrie appliquée sous Stata et/ou E-Views est une série de modules,
fruit d’un travail de recherche assidu d’une équipe de jeunes chercheurs passionnés du LEFA
que j’ai eu le privilège de diriger. Pour ce premier module, je tiens particulièrement à
remercier Seifallah Sassi et Dorsaf El Byr pour leur sérieux. La série N°1 est consacrée à
l’économétrie des données de panel sous Stata. Elle fait l’objet de séminaires de formation
pour les doctorants pour leur permettre de manipuler les principales estimations en données
de panel, classiques et dynamiques. D’autres modules sont en cours d’élaboration et paraitront
sous forme de modules complémentaires. Je peux citer :
Les lecteurs de ce document peuvent télécharger les bases de données, à partir du site du
laboratoire d’économie et de finance appliquées, LEFA. Nous espérons recevoir vos
commentaires, afin d’améliorer et de mettre à jour, de façon continue les versions proposées.
Mohamed Goaied
Introduction
I. Initiation à Stata
1. Connaissance avec l’environnement de stata
2. Importation des données.
3. Analyse descriptive.
Références bibliographiques.
1. Initiation à Stata
Une instruction utile qui vient juste après l’icône (8) est « variables Manager ».
Elle permet de d’attribuer des étiquettes pour les différentes variables du fichier des
données.
Exemple, le fichier des données ci-dessus contient comme troisième variable, GDP-
Capita qui est le taux de croissance du PIB par tête. Pour lui attribuer une
étiquette, il suffit de cliquer sur l’icône (variables Manager) , après avoir
ouvert le fichier des données. Vous aurez la figure suivante :
Pour attribuer une étiquette ou Label à une variable, vous cliquez sur la variable, puis
vous indiquez à la case label (à droite) : croissance du PIB par tête, puis vous
cliquez sur Apply. Le label indiqué apparait à droite de la variable concernée.
Vous pouvez refaire ce principe pour toutes les variables du fichier de
données.
Vous pouvez créer plusieurs documents, mais les deux principaux sont les suivants :
Data
Fichiers.dta : Base de données brutes + Bases de données qui intègrent les
modifications (transformation logarithmique, nouvelles variables crées, etc.)
Il est fortement conseillé de ne pas travailler directement sur la base brute, mais plutôt
sur une copie.
Log
Fichiers.log : indiquent toutes les sorties de stata. Ils contiennent tous les
résultats des commandes stata que vous avez effectué. Il doit être ouvert, juste après
l’ouverture du fichier des données afin de contenir tous les résultats des commandes que
vous allez effectuer.
Les principales variables sont la croissance annuelle du PIB par tête (prix
constants). Un Indicateur du développement financier CPS : L’ensemble des
crédits alloués au secteur privé, en pourcentage du PIB, le taux d’inflation, le
degré d’ouverture (importations+Exportations/PIB) et les dépenses
gouvernementales. La base de données , se présente sous forme d’un fichier excel,
de ma manière suivante :
10
Input file : Le fichier excel à rechercher avec Browse. Output file, vous recherchez
la version Stata. Vous cliquez par la suite sur Transfert, pour vous permettre
d’avoir le fichier.xlsx converti, dans le même répertoire en fichier.dta ( exemple ;
Panel.xlsx est converti en fichier stata, panel.dta).
Quelques commandes Stata sont utiles, pour créer de nouvelles variables, calculer des
moyennes, des correlations, etc.
11
summarize ..., Calcule pour une variable ou une liste de variables la moyenne, l’écart-
type, le minimum, le maximum
tabulate Calcule les fréquences des observations d’une variable et permet de faire
des tableaux croisés pour deux variables
pwcorr et corr Permet d’obtenir la matrice des corrélations et la matrice des
variance-covariances, avec la significativité statsitique du coefficient de
corrélation linéaire.
ttest ou sdtest Test de comparaison des moyennes ou des variances
tabulate ..., chi2 Test d’indépendance de 2 caractères, test de Pearson
On peut utiliser également les boîtes de dialogue de Stata. Par exemple si, on
veut calculer les : moyenne, écarts type, minimum et maximum des variables, on
procède de la manière suivante :
12
Après avoir retenu les variables, dans la case de gauche (variables), on obtient les
résultats qui suivent :
13
On observe que le nombre d’observations pour les differentes variables, n’est pas
identique. Cela est expliqué par le nombre de données manquantes pour les
principales variables retenues. Les valeurs minimales et maximales peuvent nous
permettre de détecter l’existence d’eventuels points aberrants. Il est possible de
calculer les coeffcients de variation pour chaque variable (ecart-type/ moyenne)
pour voir l’homogénéité/Hétérogénéité de l’echantillon selon la variable étudiée. A
titre d’exemple, le CV de la variable ln_cps est égal à 0.25 < 0.15. Ceci indique
une hétérogénéité de l’echantillon par rapport à l’indicateur du développement
financier. On peut aussi calculer les correlations possibles avec les differentes
variables du modèle afin de detecter le risque de multicolinérité, en cas de
correlations fortes entre certaines variables explicatives du modèle. On procède
de la manière suivante :
De la même façon, on choisit par la suite, les variables, pour lesquelles nous
effectuons l’analyse de la correlation, comme suit :
14
15
Introduction
On utilise une notation à deux indices, i pour l'individu i et t pour le temps. Les variables
explicatives Xkit sont variables dans le temps, alors que les variables z pi sont des facteurs
invariants dans le temps. La double dimension qu’offrent les données de panel est un
atout majeur. En effet, si les données en séries temporelles permettent d’étudier
l’évolution des relations dans le temps, elles ne permettent pas de contrôler
l’hétérogénéité entre les individus. A l’inverse, les données en coupes transversales
permettent d’analyser l’hétérogénéité entre les individus mais elles ne peuvent pas tenir
compte des comportements dynamiques, puisque la dimension temporelle est exclue du
champ d’analyse.
16
En utilisant des données de panel, on pourra exploiter les deux sources de variation de
l’information statistique : Temporelle où variabilité intra-individuelle et individuelle ou
variabilité inter-individuelle. L’augmentation du nombre d’observations permet de
garantir une meilleure précision des estimateurs, de réduire les risques de multi
colinéarité et surtout d’élargir le champ d’investigation. De nombreux modèles
économétriques, exploitant essentiellement des données d'entreprise, peuvent être
confrontés à des données croisées, le caractère particulier de celles-ci invite à considérer
des spécifications et des méthodes d'estimation adaptées. Le panel considéré n’est pas
nécessairement complet (cylindré) où toutes les unités statistiques sont observés durant
la période considérée. Il peut s’agir d’un panel incomplet, non cylindré, où les individus
ne sont pas observés sur toute la période de l’analyse du fait du problème d’entrée/sortie.
A titre d’exemple si on dispose d’un panel incomplet de 1500 entreprises observées sur la
période 1991-2010, certaines entreprises n’existaient pas en 1991 et ont été crées par la
suite. Par ailleurs, d’autres entreprises qui existaient en 1991 ont pu disparaître de
l’échantillon avant 2010, pour diverses raisons (fusion, acquisition, banqueroute, etc).
Dans ce cas de figure, le cylindrage de l’échantillon n’est pas conseillé à cause du risque
de biais de sélectivité, puisque les entreprises que nous éliminerons de l’échantillon, pour
raisons d’informations temporelle incomplète, peuvent ne pas avoir la même typologie
que celle qui sont observées sur toute la période indiquée.
Ce chapitre présente les techniques les plus courantes de modélisation des données de
panel. Théoriquement, les méthodes proposées dans ce cadre supposent que la dimension
individuelle est infinie (des centaines, voire des milliers d’entreprises) et la dimension
temporelle est finie (bilans annuels observés sur quinze à vingt ans). D’où l’intérêt de
contrôler l’hétérogénéité des individuelle qui peut être supposée fixe ou aléatoire.1
1
Dans notre exemple empirique, on retient pour des raisons de commodité un panel de 15 pays observés sur 46
ans.
17
Le modèle à effets fixes suppose que les relations entre la variable dépendante et
les variables explicatives sont identiques pour tous les individus. Si l’on considère N
individus, observés sur Ti périodes de temps et K variables explicatives, le modèle s’écrit
alors :
yi,t = αi + k Xk,i,t + εi,t , i =1,….,N et t =1,…., Ti (4.1)
18
On suppose que les résidus εi,t sont i.i.d. et satisfont les conditions suivantes, et
[1;N] ; [1;Ti] :
E (εi,t) = 0
E (εi,t εi,s) = ,
E (εi,t εj,s) = 0 , ,
Le modèle à effets fixes individuels présente une structure des résidus qui vérifient les
hypothèses standards des MCO. Il s’agit en fait d’un modèle classique avec variables
indicatrices individuelles.
Les réalisations des estimateurs des constantes αi sont déduites au point moyen, après
estimation des paramètres k selon la relation qui suit :
K
ˆ i yi ˆk xki
k 1
L’estimateur MCO des coefficients k est obtenu en centrant les différentes (variables
19
K
yit k xkit it
k 1
Ti
Avec yit yit yi , xkit xkit xki , it it i . On note que yit 1
Ti y
t 1
it .
Les variables xkit et it , étant définies de façon analogue. Il est conseillé dans le cas où le panel
est non cylindré d’utiliser l’option robuste de manière à tenir compte de l’hétéroscédasticité
des erreurs, puisque la variance des erreurs du modèle transformé n’est pas constante. En
effet, on vérifie que : v( it ) 2 TiTi 1 .
Outre le fait que la variabilité inter-individuelle n’est pas exploitée pour estimer les
paramètres structurels du modèle, une limite inhérente au modèle à effets fixes réside
dans le fait que l’impact des facteurs invariants à travers le temps ne peut être identifié.
Ceci constitue une limite au niveau de l’analyse économique, puisqu’il revient à
restreindre le champ d’analyse économique de l’étude.
Pour toutes les applications sous STATA sur des données de panel, on utilise la
même base de données « panel.dta», présentée dans la section précédente.
Avant d'utiliser les commandes sur données de panel, il faut indiquer à Stata la variable précisant la
dimension individuelle et celle relative à la dimension temporelle. Cela se fait par la commande tsset.
Exemple : tsset id tps déclare des données de panel ; où id est la variable indicatrice de la dimension
individuelle et tps l'indicatif de la dimension temporelle.
Pour les commandes qui suivent, il est sous-entendu que la commande tsset doit les précéder.
Dans cette application, l’indicateur de la dimension individuelle est le code_pays, celui de la dimension
temporelle est la variable année.
20
21
La croissance moyenne du PIB par tête, sur l’ensemble de l’échantillon est de 1.98%. La
variance inter-individuelle (between) est égale à 3.9, alors que la variance intra-
individuelle (temporelle) est égale à 60.1 sur une variance totale de 63.9, soit 94% de la
variance totale. Ceci s’explique par l’importance de la dimension temporelle dans notre
échantillon (en moyenne 35 ans par pays) par rapport à la dimension individuelle (15
pays).
22
L’estimation d’un modèle à effets fixes sous Stata se fait avec la syntaxe suivante :
xtreg variable dépendante_ variables explicatives , fe
2
On retient un modèle double logarithmique de manière à pouvoir estimer des élasticités et effectuer l’analyse
en terme relatif.
23
L'option robust associée à la commande xtreg, corrige les t de student de l'hétéroscédasticité par la
méthode de White. Mais La commande xtreg..., fe ne permet pas d'option robust pour la correction de
l'hétéroscédasticité. Pour le faire, il faut utiliser une autre commande nommée areg. (estimation par les MCO
avec variables indicatrices individuelles). La commande areg nécessite de spécifier la dimension individuelle,
même si la commande tsset est utilisée avant. L'option absorb(id) spécifie la variable id comme représentant la
dimension individuelle. Ceci permet de créer les 15 variables indicatrices relatives aux pays.
24
La différence entre xtreg..., fe et areg est qu'avec le premier, les données sont transformées en
différences par rapport a la moyenne individuelle pour éliminer les effets fixes, alors que la commande areg
revient a faire des MCO sur un modèle dans lequel on introduit une variable muette pour chaque individu ou
pays. On note que les deux méthodes fournissent les mêmes valeurs pour les paramètres estimés. La différence
réside dans les écarts-types estimés avec la fonction (areg) qui permet de fournir des estimateurs robustes.
Les estimations des paramètres sont identiques que celles du tableau précédent. Seuls
les écarts types estimés de ces estimateurs sont plus faibles, à cause de l’instruction
robuste. Les résultats montrent qu’en termes d’impact, l’ouverture commerciale présente
un effet marginal plus important sur la croissance économique, qu’une politique
monétaire visant la maîtrise de l’inflation. L’effet négatif du développement financier sur
la croissance peut s’expliquer par plusieurs raisons : (hétérogénéité des pays en matière
de développement financier, la non linéarité de la relation, la présence d’un effet seuil,
etc. La recherche d’une explication doit être davantage du côté de la littérature
économique, plutôt que de l’arsenal économétrique à utiliser !
1.3.2 Modèle à effets fixes avec variables instrumentales
Pour estimer un modèle à effets fixes avec des variables instrumentales, il faut utiliser la commande
xtivreg..., fe dont la syntaxe générale est:
xtivreg variable_dépendante variables_exogènes (variables endogènes = instruments), fe
25
Dans l'exemple qui suit, On retient comme variables exogènes les trois variables
de contrôle. La variable endogène est le ratio des crédits aux secteurs privés par rapport
au PIB, logCPS. On retient comme instrument supplémentaire le trend, (variable year),
sachant que toutes les variables exogènes du modèle sont utilisées comme instruments.
L’application avec variables instrumentales proposée dans cette section ne permet pas
d’améliorer la précision des estimateurs. Elle est retenue, juste pour la vulgarisation de la
méthode. Le choix des instruments peut ne pas être pertinent. Dans la pratique, il s’agit de
procéder à des modifications des instruments à retenir, jusqu’à l’obtention de résultats
significatifs.
2. Le modèle à erreurs composées.
Le modèle à erreurs composées suppose que la spécificité individuelle est sous
forme aléatoire. Le terme constant spécifique à l’individu i est aléatoire. Il se décompose
en un terme fixe et un terme aléatoire spécifique à l’individu permettant de contrôler
l’hétérogénéité individuelle. En regroupant les termes aléatoires du modèle, on obtient
une structure à erreurs composées.
Comme nous décomposons la constante dans le modèle à effets fixes, il s’agit dans
le modèle à effets aléatoires de décomposer les résidus. C’est en effet dans ces derniers
qu’interagissent les variables explicatives omises. Le modèle s’écrit toujours :
26
Généralement, on est conduit à faire un certain nombre d’hypothèses sur cette structure
de résidus.
2.1 Les hypothèses sur les résidus.
On suppose que les résidus sont i.i.d. et satisfont les conditions suivantes :
E (ui) = E (εi,t) = 0
E (ui εi,t) = 0
E (ui u j) = u² i j , 0 sinon
Contrairement au modèle à effets fixes, le modèle à erreurs composées utilise les deux
dimensions du panel. Par conséquent, on peut élargir le champ de recherche empirique,
en mesurant l’effet de facteurs invariants dans le temps, z pi (secteur d’activité de
l’entreprise, à titre d’exemple), en plus des facteurs explicatifs variables dans le temps,
xkit . Puisque les erreurs composées, sont corrélées par individu dans le temps, on utilise
la méthode des moindres carrés généralisés. Il est aisé de vérifier que l’application des
MCG, revient à appliquer les MCO sur le modèle transformé suivant:
3
On retient une structure à erreurs composées ou seule la composante individuelle est prise en compte. Il est
possible d’inclure une composante temporelle.
27
2
Où i
Ti u2 2
Dans la pratique, lorsque le panel est incomplet on, retient où Ti est remplacé par T .
Pour estimer un modèle a effets aléatoires, il suffit de remplacer l'option fe dans la commande xtreg par
l'option re. La syntaxe générale est donc la suivante:
xtreg variable_dependante variables_explicatives , re
28
La commande :
Les résultats d’estimation obtenus par le modèle à erreurs composées ne sont pas
meilleurs que ceux obtenus par le modèle à effets fixes. En effet, les coefficients
associés à l’inflation et à l’ouverture commerciale ne sont plus significatifs, au
seuil conventionnel de 5%. Cela laisse penser que l’hypothèse d’absence de
corrélation entre le terme aléatoire individuel ui et les variables explicatives du
modèle n’est pas vérifiée. Il s’en suit des estimations biaisées. Le test de Haussmann
développé à la section 3, devrait confirmer ces présomptions. Toutefois, cette défaillance
statistique peut également s’expliquer par le problème d’endogénéité de la variable (CPS).
D’où l’intérêt d’utiliser les techniques des variables instrumentales.
29
La commande :
3. Le test de Hausman
3.1. La procédure du test.
Le test de spécification d’Hausman (1978) est un test général qui peut être
appliqué à des nombreux problèmes de spécification en économétrie, traitant avec le
problème d’endogénéité. Son application la plus répandue est celle des tests de
spécification des effets individuels aléatoires en panel. L’idée générale du test
d’Hausman est simple : Supposons que l’on cherche à tester la présence éventuelle d’une
corrélation ou d’un défaut de spécification. Admettons que l’on dispose de deux types
d’estimateurs pour les paramètres du modèle étudié. Le premier estimateur est supposé
être l’estimateur non biaisé à variance minimale sous l’hypothèse nulle de spécification
correcte du modèle (absence de corrélation). En revanche, sous l’hypothèse alternative de
mauvaise spécification, cet estimateur est supposé être biaisé. Par contre, le second
estimateur, celui du modèle à effets fixes, est non biaisé dans les deux cas. L’application
30
technique de ce principe suppose tout de même que l’on construise la matrice de variance
covariance de l’écart entre les deux estimateurs. Le test de spécification de Haussman
repose sur le corps d’hypothèses suivant :
H0 : E(ui i) = 0 ( les estimateurs du modèle à erreurs composées sont efficaces.)
31
La première ligne de commande estime le modèle à effets fixes. La seconde ligne conserve les résultats du
modèle à effets fixes sous le nom fixed. La troisième ligne estime le modèle à effets aléatoire et la quatrième
ligne exécute le test de Hausman proprement dit.
Appliquons le test de Hausman pour choisir le modèle le plus approprié aux données.
32
Les estimateurs du modèle à erreurs composées sont biaisés. Il est préférable de retenir
ceux du modèle à effet fixes qui sont sans biais. Il est possible de refaire la même
procédure pour les estimations du modèle à effets individuels fixes et aléatoires dans le
cadre des techniques des variables instrumentales.
Le modèle linéaire des données de panel est fondé sur l’hypothèse de non-
corrélation entre les effets spécifiques non observés, i , les régresseurs xit et Zi. Hypothèse
z'1i correspond aux L1 variables invariantes dans le temps et non corrélées avec i .
E ( i x1it ) E ( i z1i ) 0
E ( i x2it ) 0 et E ( i z2i ) 0
33
Sur le plan pratique, la difficulté réside dans la partition des facteurs explicatifs
(variant et invariants dans le temps) entre variables endogènes et exogènes. La
méthode d’estimation est celle des MCG avec variables instrumentales.
La commande :
La syntaxe générale de la commande sur Stata est la suivante:
xthtaylor var_dep var_explicatives ,endo(listel) cons(liste2) small
listel est la liste des variables endogènes du modèle (séparées par un espace) y compris
les variables endogènes invariantes dans le temps. Ici le terme endogène désigne une
corrélation uniquement avec l'effet spécifique i et non avec le terme résiduel εit.
liste2 est la liste de l'ensemble des variables invariantes dans le temps. Cette option est
facultative car Stata détecte automatiquement les variables constantes dans le temps et
celles qui varient selon les individus et le temps.
small est l'option qui permet de reporter les t de student au lieu des statistiques z de la
loi normale centrée réduite, et la statistique F de Fisher au lieu de la statistique de chi2.
Cette démarche est valide dans les échantillons de petites tailles, en l’absence de
convergence asymptotiques en lois. Dans cette application, nous avons introduit 2
variables supplémentaires invariantes dans le temps (une variable régionale, exogène:
Middle East=1, pour les pays du moyen orient, 0 sinon) et ressources naturelles,
supposée endogène, égale à 1 pour les pays producteurs de pétrole, 0 sinon). Par
conséquent, pour l’objet de cet exercice, on a 2 variables endogènes : le développement
34
35
Avec
Avec:
n = Nombre d'observations
k = Nombre de variables explicatives si les données proviennent des résidus d'une
régression linéaire. Sinon, k=0.
S = Coefficient d'asymétrie : Moment d'ordre 3 d'une variable centrée-réduite
K = Kurtosis : Moment d'ordre 4 d'une variable centrée-réduite
Le test de Jarque-Bera ne teste pas à proprement parler si les données suivent une loi
normale, mais plutôt si les coefficients de kurtosis et d'asymétrie des données sont les
mêmes que ceux d'une loi normale, de même espérance et variance. On a donc:
H0: S = 0 et K = 3
H1: S 0 et K 3
conséquent, si les données suivent une loi normale, le test s'approche alors de 0 et on
accepteHo, au seuil α. Le résidu prédit, provient d'un modèle estimé par xtreg..., fe ou
xtreg..., re selon l'estimateur choisi. Choisissons le modèle à effets fixes à tester : Après
avoir appliqué le modèle à effets fixes, puis on récupère les valeurs prédites du résidu :
4
Ce test peut aussi s’appliquer si on ne dispose pas de données de panel.
36
La probabilité du test est 0.80 > 0.05, on accepte l'hypothèse nulle Ho de normalité des
résidus.
H 0 : 2 0
H 0 : 2 0
37
La statistique du test est basée sur les résidus estimés par les MCO. Elle prend la forme
suivante :
2
N Ti 2
2
ˆit
NT i 1 t 1
LM 1 2 (1)
2(T 1) N Ti
ˆit2
i 1 t 1
La probabilité du test est 0.0707 > 5%, on accepte l'hypothèse nulle. Le test rejette la
spécification d’une structure à erreurs composées. Ce test doit précéder celui de
Hausman, qui traite du problème de corrélation du terme aléatoire et des variables
explicatives du modèle.
38
Où Zit désigne la matrice des instruments. La statistique du test suit la loi de chi-deux à
I−P degrés de liberté, avec I le nombre des instruments et P le nombre de paramètres
à estimer.
Pour un niveau de significativité , le corps d’hypothèses à tester est le suivant:
39
La probabilité du test est de 0.63 > 0.05. On ne peut donc pas rejeter l'hypothèse nulle
Ho, de validité des instruments. Le test de chi-deux est de 1 degré de liberté ( I=5, P=4),
dans le modèle à effets fixes, il n’y a pas de terme constant.
40
instruments sont en niveau, et vice versa. Dans le modèle à estimer, l'utilisation des
variables retardées comme instruments diffère selon la nature des variables explicatives:
(a) Pour les variables exogènes, leurs valeurs courantes sont utilisées comme
instruments.
(b) Pour les variables prédéterminées ou faiblement exogènes (des variables qui
peuvent être influencées par les valeurs passées de la variable dépendante, mais
qui restent non corrélées aux réalisations futures du terme d'erreur), leurs
valeurs retardées d'au moins une période peuvent être utilisées comme
instruments.
(c) Pour les variables endogènes, leurs valeurs retardées de deux périodes et plus
peuvent être des instruments valides.
La validité des instruments retenus peut être confirmée ou infirmée, à partir des
tests de Hansen et de Sargan. Il existe deux variantes d'estimateur des GMM en panel
dynamique: L'estimateur GMM en différences premières et l'estimateur GMM en
système.
Il s’agit ensuite d’ instrumenter la variable endogène retardée par ses valeurs passés de
2 périodes et plus. Cependant, cette méthode ne permet pas d’identifier l’effet des
facteurs invariants dans le temps. De plus, Blundel et Bond (1998) ont montré à l'aide
des simulations de Monte Carlo que l'estimateur GMM en système est plus performant
que celui en différences premières, ce dernier donne des résultats biaisés dans des
échantillons finis lorsque les instruments sont faibles.
41
Les principaux tests en panels dynamiques, reposent sur les hypothèses suivantes, à
accepter.
- Test de Sargan : H 0 . Les instruments sont valides.
Cet exemple est la suite logique du modèle de croissance économique retenu dans
la première partie. On introduit la variable endogène retardée d’une période dans les
variables explicatives notamment le PIB par tête à t-1 , de manière à tester l’effet de
Comportements dynamiques. Dans cette application, on retient le revenu initial comme
proxy de la croissance du PIB par tête, décalé d’une période, pour tester l’effet de
convergence. Le modèle s’écrit :
( a 2 ) On ajoute l’instruction collapse lorsque le nombre de retard est fixé. Dans le cas contraire (lag(2 .), il n’y
a pas lieu de la rajouter, puisqu’on ne spécifie pas la borne supérieure du retard des instruments qui commencent
à partir du retard d’ordre 2. Pour iv(varinstrum), varinstrum, indique la liste des variables exogènes du modèle qui
sont utilisées comme instruments. L'option small reporte les t de student à la place des statistiques de la loi
normale centrée réduite z. L’option two permet d’avoir un estimateur en 2 étapes, plus précis que celui en une
étape (sans two), car l’estimateur MM en deux étapes tient compte de la structure de la matrice des variances
covariances des erreurs.
42
On voit qu’on accepte la présence d’un effet AR(1) pour les résidus et on accepte l’absence
d’un effet AR(2). Ceci est en conformité avec les hypothèses formulées. Par ailleurs, les tests
de Sargan ou de Hansen valident le choix des instruments. De plus les variables explicatives
sont statistiquement significatives, avec un effet négatif de l’indicateur du développement
financier, de l’inflation et un effet positif de l’ouverture commerciale. Si on se base sur la
littérature des modèles de convergence, en matière de croissance, l’hypothèse de convergence,
suppose un effet négatif du revenu initial. Pour la variable endogène revenu initial, on a
retenu de manière arbitraire les retards d’ordre 4 à 8 comme instruments, soit 5 instruments.
Pour l’indicateur du développement financier, on retient les retards d’ordre 4 à 9 comme
instruments, soit 6 instruments. En plus de ces instruments, les 3 variables exogènes (ln_inf,
ln_gc, ln_to) sont utilisés comme instruments. Le nombre total des instruments est égal à 14
Instruments, comme il est mentionné. Par ailleurs, le nombre de paramètres est égal à P=5.
Par conséquent les tests de Sargan et Hansen, suivent une chi-deux à 14-5=9 degrés de
libertés.
43
De plus, les résultats des paramètres estimés sont meilleurs et conformes à l’intuition
économique. Un effet positif et significatif de l’ouverture commerciale sur la croissance
du PIB par tête, un effet négatif et significatif de l’inflation, indiquant qu’une politique
monétaire qui vise la maitrise de l’inflation permet d’accroitre le PIB par tête. Le
comportement dynamique de la croissance capté par le revenu initial, préconise un effet
de convergence. Seule fausse note, l’effet négatif, toujours significatif de l’indicateur de
développement financier sur la croissance du PIB par tête et ce, malgré les différentes
procédures économétriques retenues. La solution est plutôt d’ordre économique que
44
Références bibliographiques
Baltagi B.H.(2009). A companion to Econometric Analysis of Panel data. John Wiley and
Sons.
45