Vous êtes sur la page 1sur 29

Cycle de Formation Doctorale

L’économétrie des données de Panel


Application sur STATA 16
******
Les axes de recherche : * Nature et Spécificités des données de panel
* Estimation en Panel Statique

Dr. SALAH Eddine SALHI


Université Mohamed V de Rabat
Plan
1. Nature et spécificités des données de Panel
1. 1. La représentation des données de Panel

1. 2. Les avantages des données de panel

1. 3. Les inconvénients des données de panel

1.4. Choix de la spécification : Hétérogénéité-Homogénéité

1.4.1. Contrôle de l’hétérogénéité individuelle

1.4.2. Définition de l’hétérogénéité individuelle

1.5. Les tests de spécification Hétérogénéité-Homogénéité

1.5.1. La stratégie de Hsiao

1.5.2. Le test de Fisher


Plan
2. Estimation en Panel Statique
2.1. Le modèle sur données empilées : estimateur MCO

2.2. Les modèles à effets individuels

2.2.1. Modèle à effets fixes

2.2.2. Modèle à effets aléatoires

2.3.Tests de spécification des modèles

2.2.1. Test de Breusch-Pagan

2.3.2. Test d’Hausman

3. Cas d’application sur STATA 16


L’impact du développement financier sur la croissance économique de la région MENA :
Investigation empirique en données de panel.
1. Nature et spécificités des données de Panel
1. 1. Représentation des données de Panel

Un modèle en série chronologique s’écrit comme suit :


𝐘𝐭 = 𝛂 + 𝛃𝐗 𝐭 + 𝛆𝐭

Où, l’indice t : indique qu’on étudie l’évolution de la variable Y en fonction de la variable X au cours d’une période de temps
sur une certaine fréquence (année, trimestre, mois,..etc).

Si l’économètre s’intéresse à l’évolution des phénomènes économiques entre différents individus (entreprises, pays,
régions,….etc) à un instant donné, le modèle étudié, en coupe transversale, prendra la forme suivante :
𝐘𝐢 = 𝛂 + 𝛃𝐗 𝐢 + 𝛆𝐢

Où, l’indice i : indiquant qu’on étudie l’évolution de la variable Y en fonction de la variable X entre différents individus
(consommateurs, producteurs…..etc).

Les données de panel, ou données longitudinales possèdent les deux dimensions précédentes (individuelle et temporelle) et
rapportent les valeurs des variables considérées relevées pour un ensemble d'individus sur une évolution temporelle. Par
conséquent, le modèle en données de panel s’écrit comme un modèle à double indice qui prend la forme suivante :
1. Nature et spécificités des données de Panel
Avec :
La nature des modèles et des estimateurs
• i : La ième unité en coupe instantanée (identification transversale) ; dépendraient ainsi des hypothèses retenues quant
aux composantes 𝑼𝒊 , 𝑽𝒕 𝒆𝒕 𝑾𝒊𝒕.
• t : La ième unité en série temporelle (identification temporelle) ;
Ainsi, en utilisant des données de panel, on
• Yit : Variable endogène observée pour l’individu i à la période t ; pourra exploiter les deux sources de variation de
l’information statistique :
• Xkit : Vecteur des k variables explicatives observées pour l’individu i à la période t ; La variabilité intra-individuelle ou temporelle
(Within)
• 𝛼𝑖 : Terme constant pour l’individu i (effet spécifique ou individuel) ; La variabilité interindividuelles ou individuelle
(Between)
• 𝛽𝑘𝑖 : Vecteur des k coefficients des K variables exogènes pour l’individu i ;
NB :
• 𝜀𝑖𝑡 : Terme d’erreur pour l’individu i à la période t. La double dimension qu’offrent les données de
𝜺𝒊𝒕 = 𝑼𝒊 + 𝑽𝒕 + 𝑾𝒊𝒕 panel est un atout majeur. En effet, si les données
en séries temporelles permettent d’étudier
• 𝑼𝒊 : L’effet spécifique individuel (pays ; entreprise, …etc) et, il ne dépend que de l’individu i l’évolution des relations dans le temps, elles ne
permettent pas de contrôler l’hétérogénéité entre
• 𝑽𝒕 : L’effet spécifique temporel, c’est un terme qui ne dépend que de la période t les individus. A l’inverse, les données en coupe
transversale permettent d’analyser
• 𝑾𝒊𝒕 : C’est un terme aléatoire croisé l’hétérogénéité entre les individus mais elles ne
peuvent pas tenir compte des comportements
dynamiques.
1. Nature et spécificités des données de Panel
Exemple :

Dans une étude sur 9 pays en développement, nous étudions l’impact du développement financier sur la croissance économique. Les
variables de l’étude sont le PIB, la consommation, l’investissement , les dépenses publiques, l’ouverture commerciale, l’inflation, la masse
monétaire et les crédits. L’étude s’étale sur la période 2000-2005.

Nous disposons donc, de N*T= 9*5=45 observations

Pour effectuer une régression des données de panel, il faut structurer la base de données sous cette forme :

• Panel équilibré (Panel cylindré) :

C’est un panel au même nombre d’observation pour tous les individus, c’est-à-dire chaque unité de coupe instantanée
possède le même ordre d’observation temporelle. Autrement dit, même nombre d’observations par individus.

• Panel déséquilibré (Panel non cyclindré) :

C’est un panel où il manque des observations pour certains individus (données manquantes).

Pour notre exemple, il s’agit de la forme suivante :


1. Nature et spécificités des données de Panel
1. Nature et spécificités des données de Panel
1. Nature et spécificités des données de Panel
1. 2. Les avantages des données de panel

Le modèle des données de panel présente une série d'avantages entre autres :

• Modéliser les comportements individuels dans le temps, c’est-à-dire, que la double dimension est un atout. En effet, la
première dimension individuelle (coupe instantanée) permet d’analyser l’hétérogénéité entre les individus, alors que la
deuxième dimension temporelle (série chronologique) permet de tenir compte de la dynamique temporelle des
comportements ;

• Les données de panel permettent d’augmenter le nombre des observations (degré de liberté) et par conséquent plus de
variabilité qui permet d’atteindre plus d’informations qu’enrichit l’étude économique ;

• Les données de panel permettent de réduire le risque de la multi-colinéarité et augmenter le champ d’investigation
empirique ;

• Réduire les problèmes de non stationnarité souvent posés en séries chronologiques. ;

• Les données de panel permettent d’identifiées l’effet associé à chaque individu (variation des individus) ;

• Les données de panel permettent de tenir compte explicitement de l’effet de l’hétérogénéité individuelle.
1. Nature et spécificités des données de Panel
1. 3. Les inconvénients des données de panel

Le modèle des données de panel présente certains inconvénients cités comme suit :

• Le panel n’est pas nécessairement complet (équilibré) où toutes les unités statistiques sont observés durant la période
considérée.

NB : le cylindrage de l’échantillon n’est pas conseillé à cause du risque de biais de sélectivité.

• Lorsque les données sont croisés et avec des fréquences répétés dans l’échantillon, le caractère particulier de celles-ci
invite à considérer des spécifications et des méthodes d’estimation adaptées.

• Une autre difficulté associée à l’utilisation de données de panel réside dans la fréquence non négligeable (points atypiques
; observations aberrantes) dans les sources statistiques utilisées

• L’économétrie des données de panel présente le problème de la modélisation de l’hétérogénéité entre les individus. En
effet, l’omission des différences individuelles peut engendrer un biais dans l’estimation des coefficients.

NB : L’effet de l’hétérogénéité est un effet qui ne varie pas dans le temps, mais qui varie d’un individu à un autre.
1. Nature et spécificités des données de Panel
1.4. Choix de la spécification : Hétérogénéité-Homogénéité

1.4.1. Définition de l’hétérogénéité individuelle

L’hétérogénéité individuelle ou effet individuel renvoie aux différences entre les individus mesurées par les variables
explicatives (hétérogénéité observable) et non explicatives (hétérogénéité non observable). Ainsi, nous sommes en présence
d’hétérogénéité individuelle lorsque ces variables (les dépenses étatiques, PIB, les revenus, l’inflation…etc.) sont différentes
les unes des autres. Elles ne sont pas les mêmes d’un individu à l’autre.

1.4.2. Contrôle de l’hétérogénéité individuelle

Lorsque l’on considère un échantillon de donnée de panel, la toute première chose qu’il convient de vérifier est la
spécification homogène ou hétérogène du processus générateur des données.

Avant de passer à l’estimation du modèle, on commence donc par se poser la question suivante : les individus qui
composent l’échantillon présentent-ils ou non des spécificités individuels ?

Nous devons contrôler l’hétérogénéité individuelle, car dans la majorité des cas, en données de panel, la dimension
individuelle (infinie) est supposée supérieure à la dimension temporelle (finie).
1. Nature et spécificités des données de Panel
On distingue deux types d’hétérogénéité

L’hétérogénéité observable :

Permet de prendre en compte ou d’expliquer les différences de survie d’un échantillon par les valeurs prises sur des variables
explicatives, généralement exogènes (macroéconomiques, financières…etc.).

L’hétérogénéité non observable :

L’hétérogénéité ne peut pas être expliquée en entier par les facteurs explicatifs dont on dispose.
1. Nature et spécificités des données de Panel
1.5. Les tests de spécification Hétérogénéité-Homogénéité

Les tests de spécification (tests d’homogénéité) constituent la première étape à entreprendre dans l’estimation en données de
panel. Il s’agit de procéder à une vérification de la spécification homogène ou hétérogène du processus générateur des
données.

Pour ce faire, il existe plusieurs tests disponibles pour discriminer le type de spécification, il s’agit :

• La stratégie de Hsiao (1986)


• Le test de Fisher
1.5.1. La stratégie de Hsiao

On considère un échantillon de T observations de N processus individuels 𝑌𝑖𝑡 𝑡 ∈ 𝑇, 𝑖 ∈ 𝑁


et 𝑋𝑖𝑡 𝑡 ∈ 𝑇, 𝑖 ∈ 𝑁 . On suppose que le processus 𝑌𝑖𝑡 est défini de façon générale par la
relation linéaire suivante :

𝒀𝒊𝒕 = 𝜶𝒊 + 𝜷𝒊 𝑿𝒊𝒕 + 𝜺𝒊𝒕


𝒌
1. Nature et spécificités des données de Panel
Schéma
Procédure du test de
spécification
(Stratégie de Hsiao)
1. Nature et spécificités des données de Panel
A-Tester l’homogénéité globale 𝑯𝟏𝟎 B- Tester l’homogénéité des coefficients 𝐇𝟎𝟐 C- Tester l’homogénéité des constantes (𝐚𝐢 ) 𝐇𝟎𝟑
La première phase du test de spécification revient à déterminer si
on a le droit de supposer une fonction de régression identique Tester pour tous les individus des k composants des Nous effectuons un test d’hypothèse sur les constantes
pour tous les individus ( 𝛽𝑖 = 𝛽) et la constante elle aussi coefficients 𝛽𝑖 . C’est le test d’homogénéité des 𝒂𝒊 du modèle.
identique pour tous les individus (𝑎𝑖 = 𝑎) selon le modèle Poold coefficients 𝛽𝑖 , notée 𝐻02 ∶
suivant : Soit 𝑯𝟑𝟎 𝒂𝒊 = 𝒂 ∀ 𝒊 ∈ [𝟏, 𝑵]
Soit 𝑯𝟐𝟎 𝜷𝒊 = 𝜷 ∀ 𝒊 ∈ [𝟏, 𝑵]
𝒀𝒊𝒕 = 𝜶𝒊 + 𝜷𝒌𝒊𝒙𝒌𝒊𝒕 + 𝜺𝒊𝒕 Si P-value < 5% :
𝒌 Si P-value<5% :
Il convient de tester si les élasticités des différents facteurs (𝛽𝑖 ) On accepte 𝐻03 d’une parfaite homogénéité
et la constante sont tous identiques pour les individus, autrement On rejette 𝐇𝟎𝟐 , il s’agit d’hétérogénéité totale, les (homogénéité totale), les constantes 𝐚𝐢 et les
dit, il s’agir de tester l’homogénéité totale : constantes ai et les coefficients βi sont tous différents paramètres 𝛃𝐢 sont identiques selon les individus,
pour toutes les valeurs de i. la structure de panel est c’est-à-dire qu’on accepte la structure de panel
Soit 𝑯𝟏𝟎 ∶ 𝒂𝒊 = 𝒂 𝒆𝒕 𝜷𝒊 = 𝜷 ∀ 𝒊 ∈ [𝟏, 𝑵]
rejetée, et donc l’utilisation des données de panel ne se totalement homogène (panel homogène).
Si P-value>5% : les estimateurs communs entre les individus justifie pas et peut conduire à des biais d’estimation.
Donc la structure de panel homogène totale, Poold :
sont identiques (𝐻01 vraie) : Donc on a N individu, alors on doit estimer les fonctions
individu par individu. Autrement dit, équation par
On accepte 𝐻01 d’une parfaite homogénéité (homogénéité 𝑌𝑖𝑡 = 𝛼 + 𝛽𝑘𝑖 𝑥𝑘𝑖𝑡 + 𝜀𝑖𝑡
équation par le biais du MCO.
complète), les constantes 𝐚i et les paramètres 𝛃𝐢 sont identiques 𝑘
selon les individus, c’est-à-dire qu’on accepte la structure de Si P-value>5% :
Si P-value > 5% :
panel (panel homogène). Donc la structure de panel homogène
𝑌𝑖𝑡 = 𝛼 + 𝑘 𝛽𝑘𝑖 𝑥𝑘𝑖𝑡 + 𝜀𝑖𝑡 On accepte l’hypothèse nulle 𝐇𝟎𝟐 (vraie) d’homogénéité
totale, Poold : On rejette 𝐻03 alors on opte pour un modèle à effet
des coefficients 𝛃𝐢 , on retient la structure de panel et
individuel causé par l’hétérogénéité de la constante ai .
Si P-value<5% : les estimateurs communs entre les individus ne on cherche à déterminer dans une troisième étape si les
Donc les N vecteurs de paramètres βi sont identiques
sont pas identiques. constantes 𝒂𝒊 ont une dimension individuelle.
(𝛽𝑖 = 𝛽), tandis que les constantes ai différent selon les
On rejette 𝐻01 d’une parfaite homogénéité, donc les N individus. Il s’agit d’un modèle hétérogène à effets
constantes 𝐚𝒊 ou les N vecteurs de paramètres 𝛃𝐢 sont individuels, où les coefficients des variables
différents selon les individus, on passe à une seconde étape qui explicatives sont homogènes et les termes des
consiste à déterminer si l'hétérogénéité provient des coefficients constants sont hétérogénes
𝜷𝒊 .
1. Nature et spécificités des données de Panel
1.5.2. Le test de Fisher

Le but du test de Fisher va consister à discriminer le choix encore d’un modèle empilé et un modèle à effets spécifiques (individuels).
Autrement dit, ce test consiste à faire un arbitrage entre l’effet spécifique (existence des caractéristiques spécifiques pour chaque individu) et
l’effet d’ensemble (absence des caractéristiques spécifiques pour chaque individu). Cet arbitrage va se faire à l’aide du test d’homogénéité
des constantes.

Le principe du test est le suivant :

L’application du test de Fisher nous permettra de tester l’homogénéité des constantes 𝛂𝐢. Cette première étape consiste à vérifier s’il y a bel et bien
présence d’effets individuels dans nos données. On impose dans ce test l’égalité des paramètres 𝛃𝐢. Le test d’homogénéité des constantes permet
d’accepter ou de rejeter l’hypothèse d’égalité des 𝛂𝐢.

Si la p-value est supérieure à 5%, on accepte H0. Dans ce cas, nous avons un effet commun. L’estimation se fait alors par la MCO.

Si la p-value est inférieure à 5%, on rejette H0. Dans ce cas, nous avons un effet spécifique (individuel). D’où le rejet de l’hypothèse H0 d’absence
d’effets individuels et on accepte H1, et nous passons au modèle à effets spécifiques (modèle à effets aléatoires et le modèle à effets fixes). Autrement
dit, cela nous permet de valider l’hypothèse d’hétérogénéité individuelle [N vecteurs de paramètres 𝛃𝐢 sont identiques, tandis que les
constantes 𝜶𝒊 sont différentes]. Donc la configuration la plus adéquate pour le modèle est celle d’un modèle à effet individuel.
2. Estimation en Panel Statique
2.1. Le modèle sur données empilées : estimateur MCO

Le modèle à homogénéité complète (modèle empilé , Pooled model ) est un modèle estimé selon une logique
naïve. Il consiste à appliquer simplement MCO sur l’ensemble des données mises bout-à-bout sans se préoccuper
de leur nature particulière ni de celle du résidu.
Dans ce modèle, nous supposons que la structure du panel est entièrement homogène. Autrement dit, les effets de
panel (pas d’effet spécifique) sont des effets communs à tous les individus.

Lorsqu’il s’agit d’une homogénéité totale (les constantes 𝛼𝑖 et les paramètres 𝛽𝑖 sont identiques). L’équation de
régression s’écrit :

𝒀𝒊𝒕 = 𝜶 + 𝒌 𝜷𝒌𝒊 𝒙𝒌𝒊𝒕 + 𝜺𝒊𝒕

Nous pouvons effectuer une simple régression (MCO) sans prendre en considérations les effets spécifiques.

Limite du modèle empilé

Le modèle empilé ne permet pas d’élargir le champ d’investigation empirique, et par conséquent, il freine le test des
hypothèses de recherche qui sont issues de la revue de littérature.
2. Estimation en Panel Statique
2.2. Les modèles à effets individuels

En relâche le postulat d’homogénéité tout en admettant l’effet associé à chaque individu (chaque individu i
présente un certain nombre de caractéristiques propres), i.e. un effet qui ne varie pas dans le temps (stables dans
le temps), mais qui varie d’un individu à l’autre. Cet effet peut être fixe ou aléatoire.

Dans ces modèle, nous supposons que la structure de panel est partiellement homogène. Autrement dit, les effets de panel
sont des effets spécifiques pour chaque individu. D’où l’utilisation des modèles à effets individuels (modèle à effets fixes
et modèles à effets aléatoires).

Nous devons spécifier la nature de l’effet de l’hétérogénéité individuelle. Il s’agit de préciser s’il y’a lieu de considérer les
𝛂𝐢 (les effets spécifiques) comme paramètres fixes (constants ) ou comme des paramètres aléatoires (stochastiques)

2.2.1. Modèle à effets fixes

• Le modèle à effets fixes suppose que l’effet d’hétérogénéité individuelle (𝛂𝐢 ) comme une constante ;

• Le modèle à effets fixes suppose que 𝑢𝑖 𝑒𝑡 𝑣𝑡 sont des effets constants, non aléatoires ;

• Le modèle à effets fixes suppose que les relations entre la variable dépendante et les variables indépendantes
(explicatives) sont constantes.
2. Estimation en Panel Statique
Présentation de la forme linéaire du modèle à effets fixes

Soit le modèle linéaire suivant :


𝐤
𝐘𝐢𝐭 = 𝛂𝐢 + 𝛃𝐤𝐢 𝐗 𝐤𝐢𝐭 + 𝛆𝐢𝐭
𝐤=𝟏

Ce modèle est exprimé avec des effets spécifiques (𝛂𝐢 )

Quant à la présence d’effets individuels dans le modèle de panel supposé fixe «𝛂𝐢 ». Ces effets se représentent par une
constante à chaque individus noté «𝜸𝐢 ».

Avec 𝜶𝒊 = 𝜶 + 𝜸𝒊
2. Estimation en Panel Statique
Nous ajoutons cette spécificité individuelle pour chaque individu

𝐤
𝐘𝐢𝐭 = (𝛂 + 𝜸𝒊 ) + 𝛃𝐤𝐢 𝐗 𝐤𝐢𝐭 + 𝛆𝐢𝐭
𝐤=𝟏

Avec :

𝜸𝒊 : La spécificité individuelle pour chaque individu

α : La constante du modèle.

De ce fait, nous pouvons tirer les deux conclusions suivantes :

1. Un modèle à effet fixe examine les différences individuelles (effet d’hétérogénéité) dans les constantes (𝛂𝐢 ).

2. Ainsi, le 𝜸𝒊 signifie que chaque individu (pays, entreprises,….etc) a un effet spécifique. La constante n’est donc pas la
même pour tous les individus, mais le coefficient de chaque variable explicative du modèle est le même pour tous les
individus.
2. Estimation en Panel Statique
Les estimateurs du modèle à effets fixes

L’estimation des paramètres 𝛼𝑖 et 𝛽𝑖 dans le modèle à effets fixes est appelée :

 Estimation within

 Estimation LSDV

• Estimateur within : estimateur intra-individuel

Il consiste à centrer préalablement toutes les variables à expliquer et explicatives sur leurs moyennes individuelles
respectives et appliquer la méthode des MCO sur le modèle transformé.

L’expression de l’estimateur du paramètre vectoriel 𝛽k𝑖 est donnée par la relation suivante :

Sous STATA : xtreg Var (dep) Var (indp), fe


2. Estimation en Panel Statique
Les estimateurs du modèle à effets fixes

• Estimateur LSDV : estimation par l’introduction des variables muettes

L’estimation LSDV (Lest squart Dummy variable) consiste à appliquer des MCO sur le modèle avec variables dichotomiques (indicatrices)
spécifiques pour chaque N individus.

NB : Les dummys variables sont associées aux individus i et aux périodes t.

La même démarche que l’estimateur within sauf qu’ on l ’ajoute les variables muettes qui captent les spécificités individuelles.

𝛅 : coefficients qui captent les spécificités individuelles

Donc, l’estimateur par LSDV s’écrit comme suit :

Sous STATA : reg Var (dep) Var (indp) Dum1,,,,,,,,Dumi

Les limites du modèle à effets fixes

1. L’impact des facteurs invariants à travers le temps ne peut être identifié (limite pour l’analyse économique).

2.La variabilité inter-individuelle n’est pas exploitée pour estimer les paramètres structurels du modèle.
2. Estimation en Panel Statique
2.2.2. Modèle à effets aléatoires

• Le modèle à effets aléatoires suppose que l’effet de l’hétérogénéité individuelle (𝛂𝐢 ) comme une variable aléatoire ;

• Le modèle à erreur composée suppose que les 𝑢𝑖 𝑒𝑡 𝑣𝑡 sont véritablement aléatoires ;

• Le modèle à effets aléatoires suppose que la relation entre la variable à expliquer et les variables explicatives n’est plus fixe mais
aléatoire. L’effet individuel (ai) est un paramètre aléatoire ;

• Le modèle à erreur composée permet de prendre en compte les variables invariantes dans le temps.

Présentation de la forme linéaire du modèle à effets aléatoires


𝐤
Soit le modèle linéaire suivant : 𝐘𝐢𝐭 = 𝛂𝐢 + 𝐤=𝟏 𝛃𝐤𝒊 𝐗 𝐤𝐢𝐭 + 𝛆𝐢𝐭

Avec :
2. Estimation en Panel Statique
Quant à la présence d’effets individuels dans le modèle de panel supposé aléatoire «𝛂𝐢 ». Ces effets se représentent par un terme
aléatoire à chaque individu noté «𝝁𝒊 ».

Donc 𝜶𝒊 = 𝜶 + 𝝁𝒊

𝝁𝒊 : La spécification individuelle aléatoire non observable pour chaque individu

La forme du modèle à effets aléatoires


𝒌
𝒀𝒊𝒕 = 𝜶 + 𝜷𝒌 𝑿𝒌𝒊𝒕 + (𝜺𝒊𝒕 + 𝝁𝒊 )
𝒌=𝟏

Le modèle à effets aléatoires appelé ainsi modèle à erreur composée car le terme d’erreur se décompose de la manière suivante :
𝜺𝒊𝒕 = 𝒖𝒊 + 𝒗𝒕 + 𝒘𝒊𝒕 ∀ 𝒊 ∈ 𝟏; 𝑵 𝒆𝒕 𝒕 ∈ 𝟏; 𝑻

On note 𝒖𝒊 = 𝒂𝒊 ; 𝒗𝒕 = 𝛌𝒕 𝒆𝒕 𝒘𝒊𝒕 = 𝒗𝒕

La nouvelle décomposition résiduelle est devenue :


𝜺𝒊𝒕 = 𝒂𝒊 + 𝝀𝒕 + 𝒗𝒊𝒕 ∀ 𝒊 ∈ 𝟏; 𝑵 𝒆𝒕 𝒕 ∈ 𝟏; 𝑻

• 𝒂𝒊 : Désigne les effets individuels aléatoires qui représentent l’ensemble des spécificités ;

• 𝛌𝒕 : Désigne les effets temporels strictement identiques pour tous les individus ;

• 𝑣𝑖𝑡 : Désigne la composante des résidus,


2. Estimation en Panel Statique
Les estimateurs du modèle à effets aléatoires

L’estimation des paramètres 𝛼𝑖 et 𝛽𝑖 dans le modèle à effets aléatoires est appelée : Estimateur des Moindres Carrés
Généralisés (MCG).

Estimateur MCG : méthode des moindres carrés généralisés.

Le modèle à effets aléatoires (MEA) est ainsi un modèle de régression dont les perturbations exhibent une forme particulière
d’hétéroscédasticité. Il en résulte que l’estimateur des MCO n’est pas le meilleur et l’estimateur de la variance des
perturbations est biaisé et non convergent. Le meilleur estimateur est celui des MCG quand Ω est connue.

La méthode des moindres carrés généralisés (MCG) nous permet de construire des estimateurs convergents plus efficaces
que ceux des MCO. Elle prend en considération l’hétéroscédasticité et l’autocorrélation.

De façon générale, l’estimateur des MCG est :

Cette méthode revient à appliquer MCO sur le modèle transformé qui possède asymptotiquement les propriétés des MCO.
L’estimateur des MCG n’est autre que l’estimateur des MCO du modèle transformé.

Si la matrice de variance-covariance (Ω) est inconnue, nous utilisons l’estimation des MCG en 2 étapes. Cette estimation
revient à appliquer un autre estimateur appelé : MCQG « moindres carrés quasi-généralisés ». FGLS : Feasible Generalized Least
Squares.
2. Estimation en Panel Statique
2.3.Tests de spécification des modèles

Le choix entre MCO, effets fixes et effets aléatoires relève du choix de la spécification du modèle. Pour choisir le type de
modèle économétrique approprié, nous utilisons deux tests de spécification à savoir le test de Breusch-Pagan et le test
d’Hausman.

2.3.1. Test de Breusch-Pagan

Ce test constitue une application du test du multiplicateur de Lagrange à la question d’existence des effets individuels. Sous
son hypothèse nulle H0, le test de Breusch-Pagan permet de choisir si le modèle des MCO sur les données empilées est
adéquat contre le modèle à effets aléatoires.

La statistique établie dans ce cadre se présente comme suit :

Décision :

Si la probabilité associée à la statistique du test de LM est inférieure à 5%. Ceci nous permet de confirmer l’hypothèse
d’existence d’effets individuels et conclure que le modèle à effets aléatoires est plus approprié que le modèle des MCO.
2. Estimation en Panel Statique
2.3.2. Test d’Hausman

Le test d’Hausman est un test de spécification appliqué sur les modèles à effets individuels. Il permet de discriminer entre
les modèles à effets individuels, à savoir le modèle à effets fixes et aléatoires.

Les hypothèses du test sont :

La statistique établie dans ce cadre se présente comme suit :

Décision :

Si la probabilité associée au test d’Hausman est inférieure à 5%, on rejette H0 et l’on privilégie l’adoption d’effets
individuels fixes.
Synthèse N°2
• Le modèle empilé : Estimation MCO

Les coefficients du modèle peuvent être estimés par les MCO en « empilant » les données sans égard par rapport aux individus non plus que
par rapport aux dates. Autrement dit, c’est une estimation naïve qui néglige toutes sortes d’hétérogénéités.

• Les modèles à effets individuels : effets fixes et aléatoires

Les modèles à effets individuels permettent de prendre en compte l’hétérogénéité des données mais les hypothèses sur la nature des effets
spécifiques (fixes ou aléatoires) diffèrent d’un modèle à l’autre.
Merci de votre
attention

Vous aimerez peut-être aussi