Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Où, l’indice t : indique qu’on étudie l’évolution de la variable Y en fonction de la variable X au cours d’une période de temps
sur une certaine fréquence (année, trimestre, mois,..etc).
Si l’économètre s’intéresse à l’évolution des phénomènes économiques entre différents individus (entreprises, pays,
régions,….etc) à un instant donné, le modèle étudié, en coupe transversale, prendra la forme suivante :
𝐘𝐢 = 𝛂 + 𝛃𝐗 𝐢 + 𝛆𝐢
Où, l’indice i : indiquant qu’on étudie l’évolution de la variable Y en fonction de la variable X entre différents individus
(consommateurs, producteurs…..etc).
Les données de panel, ou données longitudinales possèdent les deux dimensions précédentes (individuelle et temporelle) et
rapportent les valeurs des variables considérées relevées pour un ensemble d'individus sur une évolution temporelle. Par
conséquent, le modèle en données de panel s’écrit comme un modèle à double indice qui prend la forme suivante :
1. Nature et spécificités des données de Panel
Avec :
La nature des modèles et des estimateurs
• i : La ième unité en coupe instantanée (identification transversale) ; dépendraient ainsi des hypothèses retenues quant
aux composantes 𝑼𝒊 , 𝑽𝒕 𝒆𝒕 𝑾𝒊𝒕.
• t : La ième unité en série temporelle (identification temporelle) ;
Ainsi, en utilisant des données de panel, on
• Yit : Variable endogène observée pour l’individu i à la période t ; pourra exploiter les deux sources de variation de
l’information statistique :
• Xkit : Vecteur des k variables explicatives observées pour l’individu i à la période t ; La variabilité intra-individuelle ou temporelle
(Within)
• 𝛼𝑖 : Terme constant pour l’individu i (effet spécifique ou individuel) ; La variabilité interindividuelles ou individuelle
(Between)
• 𝛽𝑘𝑖 : Vecteur des k coefficients des K variables exogènes pour l’individu i ;
NB :
• 𝜀𝑖𝑡 : Terme d’erreur pour l’individu i à la période t. La double dimension qu’offrent les données de
𝜺𝒊𝒕 = 𝑼𝒊 + 𝑽𝒕 + 𝑾𝒊𝒕 panel est un atout majeur. En effet, si les données
en séries temporelles permettent d’étudier
• 𝑼𝒊 : L’effet spécifique individuel (pays ; entreprise, …etc) et, il ne dépend que de l’individu i l’évolution des relations dans le temps, elles ne
permettent pas de contrôler l’hétérogénéité entre
• 𝑽𝒕 : L’effet spécifique temporel, c’est un terme qui ne dépend que de la période t les individus. A l’inverse, les données en coupe
transversale permettent d’analyser
• 𝑾𝒊𝒕 : C’est un terme aléatoire croisé l’hétérogénéité entre les individus mais elles ne
peuvent pas tenir compte des comportements
dynamiques.
1. Nature et spécificités des données de Panel
Exemple :
Dans une étude sur 9 pays en développement, nous étudions l’impact du développement financier sur la croissance économique. Les
variables de l’étude sont le PIB, la consommation, l’investissement , les dépenses publiques, l’ouverture commerciale, l’inflation, la masse
monétaire et les crédits. L’étude s’étale sur la période 2000-2005.
Pour effectuer une régression des données de panel, il faut structurer la base de données sous cette forme :
C’est un panel au même nombre d’observation pour tous les individus, c’est-à-dire chaque unité de coupe instantanée
possède le même ordre d’observation temporelle. Autrement dit, même nombre d’observations par individus.
C’est un panel où il manque des observations pour certains individus (données manquantes).
Le modèle des données de panel présente une série d'avantages entre autres :
• Modéliser les comportements individuels dans le temps, c’est-à-dire, que la double dimension est un atout. En effet, la
première dimension individuelle (coupe instantanée) permet d’analyser l’hétérogénéité entre les individus, alors que la
deuxième dimension temporelle (série chronologique) permet de tenir compte de la dynamique temporelle des
comportements ;
• Les données de panel permettent d’augmenter le nombre des observations (degré de liberté) et par conséquent plus de
variabilité qui permet d’atteindre plus d’informations qu’enrichit l’étude économique ;
• Les données de panel permettent de réduire le risque de la multi-colinéarité et augmenter le champ d’investigation
empirique ;
• Les données de panel permettent d’identifiées l’effet associé à chaque individu (variation des individus) ;
• Les données de panel permettent de tenir compte explicitement de l’effet de l’hétérogénéité individuelle.
1. Nature et spécificités des données de Panel
1. 3. Les inconvénients des données de panel
Le modèle des données de panel présente certains inconvénients cités comme suit :
• Le panel n’est pas nécessairement complet (équilibré) où toutes les unités statistiques sont observés durant la période
considérée.
• Lorsque les données sont croisés et avec des fréquences répétés dans l’échantillon, le caractère particulier de celles-ci
invite à considérer des spécifications et des méthodes d’estimation adaptées.
• Une autre difficulté associée à l’utilisation de données de panel réside dans la fréquence non négligeable (points atypiques
; observations aberrantes) dans les sources statistiques utilisées
• L’économétrie des données de panel présente le problème de la modélisation de l’hétérogénéité entre les individus. En
effet, l’omission des différences individuelles peut engendrer un biais dans l’estimation des coefficients.
NB : L’effet de l’hétérogénéité est un effet qui ne varie pas dans le temps, mais qui varie d’un individu à un autre.
1. Nature et spécificités des données de Panel
1.4. Choix de la spécification : Hétérogénéité-Homogénéité
L’hétérogénéité individuelle ou effet individuel renvoie aux différences entre les individus mesurées par les variables
explicatives (hétérogénéité observable) et non explicatives (hétérogénéité non observable). Ainsi, nous sommes en présence
d’hétérogénéité individuelle lorsque ces variables (les dépenses étatiques, PIB, les revenus, l’inflation…etc.) sont différentes
les unes des autres. Elles ne sont pas les mêmes d’un individu à l’autre.
Lorsque l’on considère un échantillon de donnée de panel, la toute première chose qu’il convient de vérifier est la
spécification homogène ou hétérogène du processus générateur des données.
Avant de passer à l’estimation du modèle, on commence donc par se poser la question suivante : les individus qui
composent l’échantillon présentent-ils ou non des spécificités individuels ?
Nous devons contrôler l’hétérogénéité individuelle, car dans la majorité des cas, en données de panel, la dimension
individuelle (infinie) est supposée supérieure à la dimension temporelle (finie).
1. Nature et spécificités des données de Panel
On distingue deux types d’hétérogénéité
L’hétérogénéité observable :
Permet de prendre en compte ou d’expliquer les différences de survie d’un échantillon par les valeurs prises sur des variables
explicatives, généralement exogènes (macroéconomiques, financières…etc.).
L’hétérogénéité ne peut pas être expliquée en entier par les facteurs explicatifs dont on dispose.
1. Nature et spécificités des données de Panel
1.5. Les tests de spécification Hétérogénéité-Homogénéité
Les tests de spécification (tests d’homogénéité) constituent la première étape à entreprendre dans l’estimation en données de
panel. Il s’agit de procéder à une vérification de la spécification homogène ou hétérogène du processus générateur des
données.
Pour ce faire, il existe plusieurs tests disponibles pour discriminer le type de spécification, il s’agit :
Le but du test de Fisher va consister à discriminer le choix encore d’un modèle empilé et un modèle à effets spécifiques (individuels).
Autrement dit, ce test consiste à faire un arbitrage entre l’effet spécifique (existence des caractéristiques spécifiques pour chaque individu) et
l’effet d’ensemble (absence des caractéristiques spécifiques pour chaque individu). Cet arbitrage va se faire à l’aide du test d’homogénéité
des constantes.
L’application du test de Fisher nous permettra de tester l’homogénéité des constantes 𝛂𝐢. Cette première étape consiste à vérifier s’il y a bel et bien
présence d’effets individuels dans nos données. On impose dans ce test l’égalité des paramètres 𝛃𝐢. Le test d’homogénéité des constantes permet
d’accepter ou de rejeter l’hypothèse d’égalité des 𝛂𝐢.
Si la p-value est supérieure à 5%, on accepte H0. Dans ce cas, nous avons un effet commun. L’estimation se fait alors par la MCO.
Si la p-value est inférieure à 5%, on rejette H0. Dans ce cas, nous avons un effet spécifique (individuel). D’où le rejet de l’hypothèse H0 d’absence
d’effets individuels et on accepte H1, et nous passons au modèle à effets spécifiques (modèle à effets aléatoires et le modèle à effets fixes). Autrement
dit, cela nous permet de valider l’hypothèse d’hétérogénéité individuelle [N vecteurs de paramètres 𝛃𝐢 sont identiques, tandis que les
constantes 𝜶𝒊 sont différentes]. Donc la configuration la plus adéquate pour le modèle est celle d’un modèle à effet individuel.
2. Estimation en Panel Statique
2.1. Le modèle sur données empilées : estimateur MCO
Le modèle à homogénéité complète (modèle empilé , Pooled model ) est un modèle estimé selon une logique
naïve. Il consiste à appliquer simplement MCO sur l’ensemble des données mises bout-à-bout sans se préoccuper
de leur nature particulière ni de celle du résidu.
Dans ce modèle, nous supposons que la structure du panel est entièrement homogène. Autrement dit, les effets de
panel (pas d’effet spécifique) sont des effets communs à tous les individus.
Lorsqu’il s’agit d’une homogénéité totale (les constantes 𝛼𝑖 et les paramètres 𝛽𝑖 sont identiques). L’équation de
régression s’écrit :
Nous pouvons effectuer une simple régression (MCO) sans prendre en considérations les effets spécifiques.
Le modèle empilé ne permet pas d’élargir le champ d’investigation empirique, et par conséquent, il freine le test des
hypothèses de recherche qui sont issues de la revue de littérature.
2. Estimation en Panel Statique
2.2. Les modèles à effets individuels
En relâche le postulat d’homogénéité tout en admettant l’effet associé à chaque individu (chaque individu i
présente un certain nombre de caractéristiques propres), i.e. un effet qui ne varie pas dans le temps (stables dans
le temps), mais qui varie d’un individu à l’autre. Cet effet peut être fixe ou aléatoire.
Dans ces modèle, nous supposons que la structure de panel est partiellement homogène. Autrement dit, les effets de panel
sont des effets spécifiques pour chaque individu. D’où l’utilisation des modèles à effets individuels (modèle à effets fixes
et modèles à effets aléatoires).
Nous devons spécifier la nature de l’effet de l’hétérogénéité individuelle. Il s’agit de préciser s’il y’a lieu de considérer les
𝛂𝐢 (les effets spécifiques) comme paramètres fixes (constants ) ou comme des paramètres aléatoires (stochastiques)
• Le modèle à effets fixes suppose que l’effet d’hétérogénéité individuelle (𝛂𝐢 ) comme une constante ;
• Le modèle à effets fixes suppose que 𝑢𝑖 𝑒𝑡 𝑣𝑡 sont des effets constants, non aléatoires ;
• Le modèle à effets fixes suppose que les relations entre la variable dépendante et les variables indépendantes
(explicatives) sont constantes.
2. Estimation en Panel Statique
Présentation de la forme linéaire du modèle à effets fixes
Quant à la présence d’effets individuels dans le modèle de panel supposé fixe «𝛂𝐢 ». Ces effets se représentent par une
constante à chaque individus noté «𝜸𝐢 ».
Avec 𝜶𝒊 = 𝜶 + 𝜸𝒊
2. Estimation en Panel Statique
Nous ajoutons cette spécificité individuelle pour chaque individu
𝐤
𝐘𝐢𝐭 = (𝛂 + 𝜸𝒊 ) + 𝛃𝐤𝐢 𝐗 𝐤𝐢𝐭 + 𝛆𝐢𝐭
𝐤=𝟏
Avec :
α : La constante du modèle.
1. Un modèle à effet fixe examine les différences individuelles (effet d’hétérogénéité) dans les constantes (𝛂𝐢 ).
2. Ainsi, le 𝜸𝒊 signifie que chaque individu (pays, entreprises,….etc) a un effet spécifique. La constante n’est donc pas la
même pour tous les individus, mais le coefficient de chaque variable explicative du modèle est le même pour tous les
individus.
2. Estimation en Panel Statique
Les estimateurs du modèle à effets fixes
Estimation within
Estimation LSDV
Il consiste à centrer préalablement toutes les variables à expliquer et explicatives sur leurs moyennes individuelles
respectives et appliquer la méthode des MCO sur le modèle transformé.
L’expression de l’estimateur du paramètre vectoriel 𝛽k𝑖 est donnée par la relation suivante :
L’estimation LSDV (Lest squart Dummy variable) consiste à appliquer des MCO sur le modèle avec variables dichotomiques (indicatrices)
spécifiques pour chaque N individus.
La même démarche que l’estimateur within sauf qu’ on l ’ajoute les variables muettes qui captent les spécificités individuelles.
1. L’impact des facteurs invariants à travers le temps ne peut être identifié (limite pour l’analyse économique).
2.La variabilité inter-individuelle n’est pas exploitée pour estimer les paramètres structurels du modèle.
2. Estimation en Panel Statique
2.2.2. Modèle à effets aléatoires
• Le modèle à effets aléatoires suppose que l’effet de l’hétérogénéité individuelle (𝛂𝐢 ) comme une variable aléatoire ;
• Le modèle à effets aléatoires suppose que la relation entre la variable à expliquer et les variables explicatives n’est plus fixe mais
aléatoire. L’effet individuel (ai) est un paramètre aléatoire ;
• Le modèle à erreur composée permet de prendre en compte les variables invariantes dans le temps.
Avec :
2. Estimation en Panel Statique
Quant à la présence d’effets individuels dans le modèle de panel supposé aléatoire «𝛂𝐢 ». Ces effets se représentent par un terme
aléatoire à chaque individu noté «𝝁𝒊 ».
Donc 𝜶𝒊 = 𝜶 + 𝝁𝒊
Le modèle à effets aléatoires appelé ainsi modèle à erreur composée car le terme d’erreur se décompose de la manière suivante :
𝜺𝒊𝒕 = 𝒖𝒊 + 𝒗𝒕 + 𝒘𝒊𝒕 ∀ 𝒊 ∈ 𝟏; 𝑵 𝒆𝒕 𝒕 ∈ 𝟏; 𝑻
On note 𝒖𝒊 = 𝒂𝒊 ; 𝒗𝒕 = 𝛌𝒕 𝒆𝒕 𝒘𝒊𝒕 = 𝒗𝒕
• 𝒂𝒊 : Désigne les effets individuels aléatoires qui représentent l’ensemble des spécificités ;
• 𝛌𝒕 : Désigne les effets temporels strictement identiques pour tous les individus ;
L’estimation des paramètres 𝛼𝑖 et 𝛽𝑖 dans le modèle à effets aléatoires est appelée : Estimateur des Moindres Carrés
Généralisés (MCG).
Le modèle à effets aléatoires (MEA) est ainsi un modèle de régression dont les perturbations exhibent une forme particulière
d’hétéroscédasticité. Il en résulte que l’estimateur des MCO n’est pas le meilleur et l’estimateur de la variance des
perturbations est biaisé et non convergent. Le meilleur estimateur est celui des MCG quand Ω est connue.
La méthode des moindres carrés généralisés (MCG) nous permet de construire des estimateurs convergents plus efficaces
que ceux des MCO. Elle prend en considération l’hétéroscédasticité et l’autocorrélation.
Cette méthode revient à appliquer MCO sur le modèle transformé qui possède asymptotiquement les propriétés des MCO.
L’estimateur des MCG n’est autre que l’estimateur des MCO du modèle transformé.
Si la matrice de variance-covariance (Ω) est inconnue, nous utilisons l’estimation des MCG en 2 étapes. Cette estimation
revient à appliquer un autre estimateur appelé : MCQG « moindres carrés quasi-généralisés ». FGLS : Feasible Generalized Least
Squares.
2. Estimation en Panel Statique
2.3.Tests de spécification des modèles
Le choix entre MCO, effets fixes et effets aléatoires relève du choix de la spécification du modèle. Pour choisir le type de
modèle économétrique approprié, nous utilisons deux tests de spécification à savoir le test de Breusch-Pagan et le test
d’Hausman.
Ce test constitue une application du test du multiplicateur de Lagrange à la question d’existence des effets individuels. Sous
son hypothèse nulle H0, le test de Breusch-Pagan permet de choisir si le modèle des MCO sur les données empilées est
adéquat contre le modèle à effets aléatoires.
Décision :
Si la probabilité associée à la statistique du test de LM est inférieure à 5%. Ceci nous permet de confirmer l’hypothèse
d’existence d’effets individuels et conclure que le modèle à effets aléatoires est plus approprié que le modèle des MCO.
2. Estimation en Panel Statique
2.3.2. Test d’Hausman
Le test d’Hausman est un test de spécification appliqué sur les modèles à effets individuels. Il permet de discriminer entre
les modèles à effets individuels, à savoir le modèle à effets fixes et aléatoires.
Décision :
Si la probabilité associée au test d’Hausman est inférieure à 5%, on rejette H0 et l’on privilégie l’adoption d’effets
individuels fixes.
Synthèse N°2
• Le modèle empilé : Estimation MCO
Les coefficients du modèle peuvent être estimés par les MCO en « empilant » les données sans égard par rapport aux individus non plus que
par rapport aux dates. Autrement dit, c’est une estimation naïve qui néglige toutes sortes d’hétérogénéités.
Les modèles à effets individuels permettent de prendre en compte l’hétérogénéité des données mais les hypothèses sur la nature des effets
spécifiques (fixes ou aléatoires) diffèrent d’un modèle à l’autre.
Merci de votre
attention