Vous êtes sur la page 1sur 72

Université Dr.

Tahar Moulay Saida


Faculté des Sciences Economiques, de Gestion et des Sciences Commerciales
Option: Méthodes Quantitatives en Gestion.

:Thème

PRÉSENTATION DES MODÈLES À DONNÉES


DE PANEL
Présenté par: Encadré par:
 Morsli Aicha.  Melle. Djalouli.
 Falit Cheikh.

2ème Promotion

Année Universitaire: 2013 / 2014


Plan
Introduction

Spécificités des données de panel

Hypothèses et propriétés des estimateurs 

Procédure séquentielle de tests

Etude de cas
: Introduction
En économétrie nous pouvons nous intéresser à
des données temporelles ou à des données en
coupe instantanée, les données de panel mélangent
les deux dimensions : séries temporelles et
.données en coupe
* L’intérêt de cette spécification réside dans la
prise en compte d’un effet temporel et d’un effet
individuel.
: Problématique

Quels sont les phénomènes qui


doivent être traités par le modèle à
données de panel ?
Les exemples sont nombreux :
 Estimation économétrique entre les exportations et
l’ouverture commerciale sur 20 ans(le temps) et 15
pays (les individus).
Le revenu d’un échantillon de ménages sur plusieurs
années.
L’évolution du chiffre d’affaires de 30 grandes
surfaces sur 36 mois.
A. Spécificités des données de panel

1) Définitions :

Les données de panel (ou données longitudinales)


sont représentatives d’une double dimension :
individuelle et temporelle. Un panel équilibré
(balanced panel) a le même nombre d’observations
pour tous les individus, un panel déséquilibré
(unbalanced panel) est un panel où il manque des
observations pour certains individus.
2) Exemple :

Prenons un exemple introductif très simple, un panel composé


de 2 individus (N=2) et connu sur 3 périodes (T=3), soit un
total de N x T=6 observations à K=2 variables explicatives.
Le model général s’écrit :

Yit = a0i + a1i x1it + a2i x2it + ɛit


Yit : variable endogène observée pour l’individu (i) à la
période (t)
x1it  , x2it : variables explicatives observées pour l’individu
(i) à l’instant (t).
a0i : terme constant pour l’individu (i).
a1i , a2i : coefficients des 2 variables exogènes pour
l’individu (i).
ɛit : terme d’erreur pour l’individu (i) à la période (t).
Sous forme matricielle le modèle s’écrit :
Hypothèses et propriétés des estimateurs :
On distingue les hypothè ses stochastiques (liées à l’erreur ɛ)
des hypothèses structurelles.
1. Hypothèses stochastiques :
- H1 : les valeurs xi , t sont observées sans erreur.
- H2 : E(ɛt)=0, l’espé rance mathématique de l’erreur est
nulle.
- H3 : E(ɛt2)=σ2ɛ , la variance de l’erreur est constante (∀t)
(homoscé dasticité).
- H4 : E(ɛt , ɛt ’)=0 si t≠t’ , les erreurs sont non corré lées (ou
encore indé pendantes).
- H5 : Cov (xit , ɛt)=0, l’erreur est indépendante des variables
explicatives
 
1. Hypothèses structurelles :
- H6 : absence de colinéarité entre les variables
explicatives, cela implique que la matrice (X’X) est
régulière et que la matrice inverse (X’X)-1 existe.
- H7 : (X’X)/n tend vers une matrice finie non singuliè re.
- H8 : n k+1, le nombre d’observations est superieur au
nombre des séries explicatives.
 Si les hypothèses classiques sur les erreurs sont respectées
(homoscédasticité et indépendance temporelle) et quelles sont
indépendantes d’un individu à l’autre [Cov (ɛit, ɛjt) = 0 pour i ≠ j ]

Nous pouvons appliquer la méthode des moindres carrés pour


chacune des N équations relatives aux individus. Dans le cas où
l’hypothèse d’indépendance entre les individus
[Cov (ɛit, ɛjt) = σ 2ij ≠ 0 pour i ≠ j] n’est plus vérifié e, l’estimateur des
MCO n’est plus BLUE, nous devons appliquer la
méthode SUR (Seemingly Unrelated Regressions)
 La méthode SUR :
La méthode SUR (Seemingly Unrelated Regressions)
de Zellner (1962) est utilisée lorsque les erreurs des
équations individuelles sont corrélées : la covariance
individuelle Cov (ɛit, ɛjt) =σ2ij ≠ 0 pour i≠ j. Les
individus sont alors interdépendants.
Cette méthode consiste à appliquer les MCG :

­sur=(X’Ω-1X)-1(X’Ω-1Y)

Avec:
Le modèle linéaire simple :
Le modèle en données de panel peut s’écrire pour N individus (i=1,….,N)
et T observations temporelles (t=1,….,T), soit n=NxT observations totales,
de la manière suivante :

Yit = a0i + a‘i xit + ɛit.


Yit : variable endogène observée pour l’individu (i) à la période (t)

xit : vecteur des K variables exogènes x‘it=(x1it  , x2it ,….,xkit), xkit est donc la valeur
observée pour la ke variable exogène pour l’individu (i) à l’instant (t).
a0i : terme constant pour l’individu (i).

a‘i : vecteur des K coefficients des K variables exogènes

a‘i=(a1i , a2i ,…., aki)

ɛit : terme d’erreur.

À partir de cette spécification générale nous pouvons


envisager quatre (4) possibilités.
Procédure séquentielle de tests
Cas n° 1 : homogénéité totale.
Les constantes a0i et les coefficients a‘i sont tous identiques pour tous les
individus, nous avons  a0i = a0 et a‘i = a‘ pour toutes les valeurs de (i). Le
modèle ne comporte qu’une seule équation estimée sur n=NxT
observations empilées par les MCO (ou les MCG selon la structure de la
matrice des variances et covariances des erreurs).

Cas n° 2 : hétérogénéité totale.


Les constantes a0i et les coefficients a‘i sont tous différents pour toutes
les valeurs de (i), la structure en panel est rejetée. Le modèle doit être
estimé équation par équation pour les N équations (une équation par
individu) par les MCO (ou les MCG selon la structure de la matrice des
variances et covariances des erreurs).
Cas n° 3 : hétérogénéité des coefficients des variables
explicatives et homogénéité des termes constants.
Les constantes a0i sont toutes identiques a0i = a0 pour les
individus, mais les coefficients a‘i des variables explicatives
sont différents pour chaque individu. Comme au cas n°2, le
modèle doit être estimé sur les N équations (une équation
par individu) par les MCO (ou les MCG selon la structure de
la matrice des variances et covariances des erreurs).
Cas n° 4 : hétérogénéité des termes constants et homogénéité
des coefficients des variables explicatives (le modèle à effets
individuels).
Les constantes a0i sont différentes pour les individus, mais
les coefficients a‘i des variables explicatives sont
constants pour les individus a‘i = a‘. Ce modèle est appelé
« modèle à effets individuels ».
Procédure séquentielle de tests
ETUDE DE CAS 
Nous nous intéressons à l’évolution des dépenses d’éducation sur 25 ans
(variable à expliquer notée Y) pour neuf (9) pays. Les facteurs explicatifs
proposés sont :
X1it : évolution des dépenses militaires en milliers de dollars pour le pays (i)
à l’année (t).
X2it : évolution du PIB (Produit intérieur brut) en milliers de dollars pour le
pays (i) à l’année (t).
* Les variables sont toutes connues sur 25 ans.
* Le modèle à étudier est donc :
Yit = a0i + a1i x1it + a2i x2it + ɛit

Le nombre total d’observations est égal à NxT=225


ɛit : erreur de spécification pour le pays (i) à l’année (t), ces erreurs
répondent aux hypothèses classiques (homoscédasticité et indépendance
temporelle) et sont indépendantes d’un individu à l’autre (Cov (ɛit, ɛjt) = 0
pour i ≠ j).
On demande d’appliquer la stratégie des tests
d’homogénéité afin de dé terminer la structure du panel en
utilisant E-views 8.
Pour spécifier la structure du
Panel, il faut créer l’objet Pool
Procédure séquentielle de tests
Construction des tests :
1) Test H10 : a0i = a0 et a‘= a‘i. ∀i
Ce test d’hypothèses jointes se ramène à un test de Fisher dont la statistique est
donnée par :
(SCRc1−SCR )/(N−1)(K+1)
F1 =
𝑆𝐶𝑅/[𝑁∗𝑇−𝑁 ሺ𝐾+1ሻ]

SCRc1 = somme des carrés des résidus du modèle contraint sous


l’hypothèse H10, soit à estimer par les MCO le modèle en empilant
toutes les observations. Le degré de liberté est égal à  :
(N x T=nombre total d’observations)-(K+1=nombre de coefficients à
estimer).
 SCR : somme des carrés des résidus du modèle non contraint, elle est égale à
la somme des N sommes des carrés des résidus des modèles estimés sur les T
observations de chaque équation individuelle, soit SCR=. Le degré de liberté
est donc la somme des N degrés de liberté de chaque équation estimée, soit
ddl =
Le degré de liberté du numérateur est donc égal à la différence des degrés de
liberté de SCRc1 et SCR :

ddln =
ddln =

La statistique F1 est à comparer à la valeur lue dans la table de Fisher


aux degrés de liberté du numérateur et du dénominateur.
Si F1 > Fαddln, ddld nous rejetons l’hypothèse H10 au seuil α.
𝐒𝐂𝐑
  𝐜𝟏
𝐒𝐂𝐑
  𝟏
𝐒𝐂𝐑
  𝟐
Pays SCRi
1 2 757 341

2 211 063.8

3 84 306 563

4 82 876 299

5 150 121.7

6 7 419 022

7 2 771 928

8 2 793 154

9 297 885.1

TOTAL SCR 183 583 378


(SCRc1−SCR )/(N−1)(K+1)
F1 =
𝑆𝐶𝑅/[𝑁∗𝑇−𝑁 ሺ𝐾+1ሻ]

(233 782 555.085−183 583 378)/(9−1)(2+1)


F1 =
183 583 378/[9∗25−9ሺ2+1ሻ]

Fc= 2.25

Ft= 1.25
Procédure séquentielle de tests
2) Test H20 : a‘ = a‘i. ∀i
Ce test d’hypothèses jointes se ramène à un test de Fisher dont la statistique
est donnée par : (SCRc2−SCR )/[ሺN−1ሻ∗K]
F2 =
𝑆𝐶𝑅/[𝑁∗𝑇−𝑁 ሺ𝐾+1ሻ]

 SCR = somme des carrés des résidus du modèle contraint sous l’hypothèse H2 ,
c2 0

soit à estimer le modèle à effets fixes individuels. Le degré de liberté est égal à  :
(N x T=nombre total d’observations)-(K+N=nombre de coefficients à estimer),
nous estimons K coefficients et N termes constants.
SCR : somme des carrés des résidus du modèle non contraint. Le degré de liberté
du numérateur est donc égal à  :
ddln =
ddln =
La statistique F2 est à comparer à la valeur lue dans la table de
Fisher aux degrés de liberté du numérateur et du dénominateur.
Si F2 > Fαddln, ddld nous rejetons l’hypothèse H20 au seuil α.
3) Test H30 : a0i = a0. ∀i
Ce test d’hypothèses jointes se ramène à un test de Fisher dont la statistique est
donnée par : (SCRc1−SCR c2)/ሺN−1ሻ
F3 =
SCR c2/[𝑁∗ሺ𝑇−1ሻ−𝐾]

  SCR = somme des carrés des résidus du modèle contraint sous


c2

l’hypothèse H20.

SCRc1 = somme des carrés des résidus du modèle contraint sous


l’hypothèse H10.

Le degré de liberté du numérateur est donc égal à  :


ddln =
ddln =
La statistique F3 est à comparer à la valeur lue dans la table de Fisher aux
degrés de liberté du numérateur et du dénominateur.
Si F > Fα nous rejetons l’hypothèse H3 au seuil α.

Vous aimerez peut-être aussi