Vous êtes sur la page 1sur 14

Math-Recherche et Application, Vol.16, (2017-2018), pp.

18-31

Revue of Maroccan Mathematical Sociaty for teaching and reseach

http ://revues.imist.ma/ ?jounal=MRA

Estimation des modèles à plus de deux régimes avec des données de


panel : Application sur les prix des cultures vivrières dans l’espace
UEMOA
Ichaou MOUNIROU
Laboratoire d’Economie Publique (LEP), Faculté des Sciences Economiques et de Gestion
(FASEG), Université de Parakou (UP), Universités du CAMES
Email : ichaou_bassir@yahoo.f r.

Résumé :
Cet article fournit une méthodologie d’estimation des paramètres d’un modèle avec sélection
et régresseurs endogènes dans le cas de données de panel. La matrice de variance-covariance
asymptotique des paramètres est calculée, en adaptant l’étude établit par Boumahdi et Tho-
mas (1992) aux données de panel. Une application du modèle au calcul des prix des cultures
vivrières dans l’espace UEMOA est proposée ; on montre en particulier la supériorité des ma-
trices d’instruments de Breusch-Mizon-Schmidt (1989) et Amemiya Macurdy (1986) sur celle de
Hausman-Taylor (1981).
Mots clés : UEMOA –productions agricoles - superficies agricoles - données de panel – estimation

Abstract :
This paper show a methodology for estimating parameters of a sample selection model with
endogenous regressors is proposed for the case of panel data. The variance-covariance matrix is
computed by adapting the Boumahdi and Tomas (1992) approach to panel data. An application
of the model to the computation of returns to education is proposed ; the instrumental matrices
of Breusch-Mizon-Schmidt (1989) and Amemiya Macurdy (1986) are shown to be superior to the
one of Hausman-Taylor (1981).
Keywords : MEUWA- agricultural production- agricultural field –panel data -estimation
[2010] Classification : D84, G13, L11

18
1 Introduction
Les modèles à variable dépendante tronquée ont connu un développement considérable depuis
l’article de Tobin (1958). Ce dernier proposait une procédure d’estimation par maximum de vrai-
semblance d’un modèle à une seule équation. L’idée de base derrière ces modèles est l’existence
d’un seuil au-delà duquel la variable dépendante n’est plus observable ou n’a pas de signification
économique.
L’estimation des modèles avec variable dépendante tronquée a été étudiée notamment par Heck-
man (1976, 1979). Ce courant n’a cependant pas, à notre connaissance, encore intégré le domaine
de l’économétrie des données de panel, qui s’est limitée à l’estimation de modèles à un seul ré-
gime. Boumahdi et Thomas (1992) font une extension au cas de deux régimes, une seconde source
d’endogénéité peut alors apparaître.
Dans cet article, une procédure d’estimation des paramètres d’un modèle avec sélection et ré-
gresseurs endogènes est proposée dans le cas de données de panel pour plus de deux régimes.
L’hétéroscédasticité provenant de la structure du modèle à erreurs composées est tout d’abord
éliminée par la diagonalisation de la matrice de variance-covariance. Le biais de sélection est en-
suite corrigé par la méthode classique de l’introduction dans la forme structurelle de l’espérance
conditionnelle des erreurs. L’endogénéité de certaines variables explicatives nécessite enfin le re-
cours à des matrices d’instruments. Les paramètres de la forme structurelle sont présentés et la
matrice de variance-covariance asymptotique des paramètres est calculée, en adaptant l’approche
Boumahdi et Thomas (1992) aux données de panel.
L’article présente d’abord le modèle à plus de deux régimes avec sélection et introduit les nota-
tions utiles. La méthode d’estimation utilisée pour la forme structurelle de notre modèle, ainsi
que l’expression de la matrice de variance-covariance asymptotique des paramètres figure. A
titre d’illustration, l’article présente une application du modèle au calcul des prix des cultures
vivrières dans l’espace UEMOA. Une équation des prix de cultures est estimée en utilisant des
données d’enquête individuelles et en discriminant les individus en fonction de leur production
et superficie. Le calcul des estimateurs de la variance des erreurs est fourni.

2 Modèle
On considère une population d’individus de taille N , constituée de sous-ensembles disjoints
deux à deux, de sorte que N1 + N2 + ... + Nk = N . Le comportement d’un individu peut être
représenté par l’un des régimes Ij , j = 1, 2, , ..., k, selon qu’il appartient à la sous population N1 ,
ou , . . . , Nk . Cette appartenance est observée ex ante. L’affectation de l’individu à l’un de ces
régimes est déterminée par une équation de sélection de la forme :
yi∗ = ωi λ + υi (1)
Où yi∗ est une variable latente non observable et ωi un vecteur de variables exogènes. On suppose
que l’individu i appartient au premier régime si yi∗ > 0. On a par conséquent :
P r [i ∈ Ik ] = P r [yi∗ > 0] P [ωi λ > −υi ] (2)
et
P r [i ∈ Ik+1 ] = P r [yi∗ ≤ 0] = P [ωi λ ≤ −υi ] (3)
L’équation de sélection ne dépend pas du temps, ce qui signifie que l’individu est affecté à l’un des
régimes de façon définitive. La variable dépendante, notée Yjit (observation à la période t pour

19
l’individu i appartenant au régime j) est expliquée par des variables Xjit et Zjit , respectivement
variantes et non variantes dans le temps, et contenant des endogènes. Le modèle à plus de deux
régimes considéré s’écrit :
0 0
Yit = Ykit = βk Xkit + γk Zki + αki + εkit si ωi λ > −υi (4)

0 0
Yit = Yk+1it = βk+1 Xk+1it γk+1 Zk+1i + αk+1i + εk+1it si ωi λ ≤ −υi (5)
où i = 1, . . . , N 1, N1 + 1, . . . , N ; t = 1, . . . , T .
Dans la suite de l’article, on utilisera la forme plus compacte suivante :
Yk = Xk βk + Zk γk + αk + εk , i ∈ Ik k (6)

Yk+1 = Xk+1 βk+1 + Zk+1 γk+1 + αk+1 + εk+1 , i ∈ Ik+1 (7)


 0
où Yj = Yjk1 , . . . , YjkT , Yjk+11 , . . . , Yjk+1T , . . . , YjN 1 , . . . , Y( jNj T est un vecteur T Nj X1 ; Xj
est T Nj XKj , Zj est T Nj XGj . αj est le vecteur T Nj X1 des effets individuels et εj le vecteur
T Nj X1 des termes d’erreur variant dans le temps.

3 Méthode d’estimation
Trois problèmes doivent être traités, de façon séquentielle, afin de fournir des estimateurs
non biaisés et convergents. Tout d’abord, le modèle à erreurs composées implique une structure
hétéroscédastique que l’on corrige en diagonalisant les matrices de variance-covariance. Ensuite,
la corrélation entre les effets individuels et les erreurs de l’équation de sélection introduit un
biais de sélection. Ce problème est résolu en utilisant une méthode de type probit, consistant
à calculer l’espérance du terme d’erreur structurel. Enfin, l’existence de régresseurs endogènes
dans le modèle doit être prise en compte dans le calcul des estimateurs ; il est donc nécessaire
d’utiliser la méthode des variables instrumentales.
Considérons tout d’abord le cas d’un modèle à un régime (équation 6) avec régresseurs endogènes.
Il n’y a pas de problème de biais de sélection et HT ont proposé un estimateur efficace des
deux paramètres βk et γk . Cet estimateur exploite l’hypothèse selon laquelle Xk et Zk sont
indépendants de l’effet αk . AM ont suggéré un estimateur plus efficace que celui de HT, fondé
sur des hypothèses d’exogénéité très fortes. En fait, la différence entre les deux estimateurs réside
dans le traitement des variables variantes dans le temps non corrélées avec les effets individuels.
A cet égard, HT supposent que la moyenne des Xk est indépendante de αk ; ils utilisent chaque
variable dans Xk comme deux instruments : comme moyenne et comme écart à la moyenne. En
revanche, AM imposent une hypothèse d’exogénéité selon laquelle Xk est indépendant de αk à
chaque période t, t = 1, . . . , T . Les auteurs utilisent Xk comme (T +1) instruments : comme écart
à la moyenne et séparément pour chaque période. Plus récemment, BMS ont prolongé l’analyse
de AM pour dériver un estimateur plus efficace que les deux précédents.
Du travail de BT avec deux régimes, le passage à plus de deux régimes introduit une corrélation
supplémentaire, celle entre αk et ν. La méthode de BT est incomplète dans ce cas, car elle
fournirait des estimateurs biaisés.
On a :
E [αki + εkit |Xkit , Zki , ωi λ > −νi ] = E [αki |Xkit , Zki , ωi λ > −νi ] + E [εkit |Xkit , Zki , ωi λ > −ν
(8)
i]
= E [αki |Xkit , Zki , ωi λ > −νi ] 6= 0

20
Dans le contexte d’un modèle à plus de deux régimes (coupe instantanée), LMT ont proposé
l’estimation de deux systèmes d’équations simultanées (pour une coupe instantanée) en présence
de biais de sélection. Leur procédure consiste à estimer les formes réduite et structurelle de
chaque système en tenant compte du biais de sélection et à dériver une matrice asymptotique
de variance-covariance des paramètres pour les deux formes réduite et structurelle. Pour estimer
le système d’équations (6) et (7), nous pouvons donc procéder de la même manière que LMT.
Notre approche va consister à utiliser conjointement les deux méthodes de HT et LMT.
Une première étape consiste à corriger l’hétéroscédasticité en diagonalisant la matrice Ωk . Soit :
−1/2
Ωk = QMk + θk PMk


σ εk
θk0 = 1/2
σε2k + T σα2 k
−1/2
La matrice Ω̂k transforme Ωk en matrice diagonale ; en d’autres termes,
−1/2 −1/2
Ωk Ωk Ωk = σε2k IT N
−1/2 −1/2
En fait, on utilise un estimateur convergent Ω̂k de Ωk , basé sur un estimateur σ̂ε2k obtenu
2
par la méthode de HT, et un estimateur σεk calculé en tenant compte du biais de sélection.

−1/2 −1/2
Estimation de Ωk et Ωk+1
−1/2
L’estimation de Ωk exige alors le calcul d’un estimateur convergent de θk , c’est-à-dire de σε2k
2
et σαk . HT propose un estimateur convergent de σε2k basé sur une transformation des équations
(6) et (7) par la matrice des projecteurs QMk . Les effets individuels étant ainsi éliminés, il n’y a
plus de corrélation entre ces derniers et le terme de perturbation ν. Nous pouvons donc utiliser
cet estimateur dans le cas présent.
Pour obtenir un estimateur convergent ε2αk , on définit, suivant HT, le vecteur de résidus ĥk :

ĥk = PMk Yk − PMk Xk β̂k si i ∈ Ik (9)

En remplaçant β̂k par son expression, on a :


h 0 i
ĥk = PMk Yk − PMk Xk Xk QMk (10)

0
Xk −1 Xk QMk Yk si i ∈ Ik
Après simplification, on obtient :
h 0
i−1 0
ĥk = Zk γk + αk + PMk − PMk Xk Xk QMk Xk Xk QMk εk si i ∈ Ik (11)

Considérons à présent l’estimation de λk dans l’équation (11). Puisque αk est corrélé avec Z̈1 et
ν, il faut calculer l’espérance de αk après avoir transformé les données par la matrice.
On obtient :
h i
E ĥk |i ∈ Ik = Z̃k λk − σν2α̃k ηk (12)

21
En multipliant l’équation (6) par Ω−1/2 , on obtient :
−1/2 −1/2 −1/2 −1/2 −1/2
Ωk Yk = Ωk Xk βk + Ωk Z k γk + Ω k αk + αk εk si i ∈ Ik (13)

Considérons à présent le problème du biais de sélection. L’équation structurelle corrigée de l’hé-


téroscédasticité se réécrit :
−1/2 −1/2 −1/2 −1/2
Ωk Yk = Ωk Xk βk + Ωk Z k γk + Ω k (αk + εk ) (14)

où de façon équivalente :
−1/2 −1/2 −1/2 −1/2 −1/2 −1/2
Ωk Yk = Ωk Ẋk β̇k + Ωk Ẍk β̈k + Ωk Żk γ̇k + Ωk Z̈k γ̈k + Ωk (αk + εk ) (15)

où h i
−1/2
V ar Ωk (αk + εk ) = Σ2εk
et
σε2k
 
cov(αk ; εk ) ... cov(αk ; εk )

 cov(αk ; εk ) σε2k ... cov(αk ; εk ) 

. . ... .
Σ2εk
 
= 

 . . ... . 

 . . ... cov(αk ; εk ) 
cov(αk ; εk ) cov(αk ; εk ) ... σε2k

2
 
β̇11 β̇12 β̈12 ... β̇1k β̈1k
2

 β̇21 β̈21 β̇22 ... β̇2k β̈2k 

 . . ... . 
βk =  

 . . ... . 

 . . ... . 
2
β̇k1 β̈k1 β̇k2 β̈k2 ... β̇kk

2
 
γ̇11 γ̇12 γ̈12 ... γ̇1k γ̈1k
2

 γ̇21 γ̈21 γ̇22 ... γ̇2k γ̈2k 

 . . ... . 
γk =  

 . . ... . 

 . . ... . 
2
γ̇k1 γ̈k1 γ̇k2 γ̈k2 ... γ̇kk
L’espérance conditionnelle de Yk∗ est :
h i
−1/2
E [Yk∗ |i ∈ Ik ] = Ẋk∗ β̇k + Ẍk∗ β̈k + Żk∗ γ̇k + Z̈k∗ γ̈k + E Ωk αk + Ωk −1/2 εk |i ∈ Ik (16)

−1/2 −1/2 −1/2


où Yk∗ = Ωk Yk ; Xk∗ = [Ẋk∗ : Ẍk∗ ] = Ωk Xk ; Zk∗ = [Żk∗ : Z̈k∗ ] = Ωk Zk
On a : h
−1/2
i h
−1/2
i ϕ
E Ωk εk |i ∈ Ik = 0 et E Ωk αk |i ∈ Ik = E [θk αk |i ∈ Ik ] = σνα∗k
φ
où σνα∗k = cov(ν; θk αk ) = cov(ν; αk∗ ) et ϕ
φ est le ratio de Mill, défini comme un vecteur T Nk X1
dont l’élément générique représente le rapport entre la densité et la fonction de répartition de la
loi normale centrée réduite au point −νi , lequel provient de l’estimation préalable de l’équation
de sélection.

22
λ est tout d’abord calculé par maximum de vraisemblance. En remplaçant λ par son estimation
λ̂ on obtient :
ϕ
Yk∗ = Ẋk∗ β̇k + Ẍk∗ β̈k + Żk∗ γ̇k + Z̈k∗ γ̈k − σνα∗k + µ̃k (17)
φ
où µ̃k est un vecteur T Nk X1 de perturbations tel que :

E [µ̃k |i ∈ Ik ] = 0

On pose :  
  βk
ϕ̂
H = Xk∗ ; Zk∗ ; − ; Θ =  γk 
Φ̂ σνα∗k
L’estimateur de la variable instrumentale ou des doubles moindres carrés est donné par :
 0 −1
Θ̂ = H PAk H HPAk Yk∗ (18)
 0 −1 0
avec PAk = Ak Ak Ak Ak , où Ak est la matrice des instruments. Pour HT par exemple,

on a : Ak = QMk , PMk Ẋk , Żk . L’estimateur θ̂ est un estimateur convergent. La matrice de
variance-covariance asymptotique est :
   0 −1  0 −1
V ar θ̂ = σα2 k + σε2k H PAk H − σνα∗k H PAk H
  0 −1 0 −1  0 −1 (19)
0
H PAk × B − BWk W ΛW Wk B PAk H H PAk H

où W , W1 , B et Λ sont définies comme suit :


W = (w11 , . . . ., w1T , . . . , wN k1 , . . . , wN kT , . . . , wN 1 , . . . , wN T ) est la matrice de dimension (Nk + Nk+1 ) X1
des variables exogènes dans l’équation de sélection ;
  2 
φk
wk λ θk ... 0
 O
B= 0 ... 0  IT
  2 
φ φNk
0 ... wNk λ ΦNNk + ΦNk
k

de dimension T Nk XT Nk .
φ2k
 
Φk (1−Φk ) ... 0
O
Λ= 0 ... 0 IT


φ2N
0 ... ΦN (1−ΦN )

est la matrice de dimension T N XT N dont le terme générique représente la contribution de


chaque observation i, i = 1, . . . , N .
BT montrent que cette matrice de variance-covariance est la seule pertinente pour les modèles à
équations simultanées avec sélection. Par rapport à l’approche de BT, les dimensions des matrices
H, W , B et Λ doivent bien entendu être adaptées au cas des données de panel.

23
4 Application au calcul des prix de certaines cultures vi-
vrières de première nécessité dans l’espace UEMOA
Dans cette partie, on propose une application du modèle décrit ci-dessus au calcul des prix de
certaines cultures vivrières de première nécessité dans l’espace UEMOA avec biais de sélection
(voir Willis et Rosen (1979), Boumahdi et Thomas (1992)). Ce modèle permet de mesurer l’avan-
tage relatif en termes de prix de vente d’une culture dans les facteurs déterminants le prix. L’un
des points les plus intéressants est de pouvoir comparer les performances relatives des méthodes
de HT, AM et BMS, qui diffèrent dans la construction de la matrice de variance-covariance des
paramètres estimés.
On considère cinq niveaux de cultures (C1 : Igname ; C2 : Maïs ; C3 : Manioc ; C4 : Riz ; C5 : Sor-
gho) ; Y1 à Y5 indiquent les logarithmes des productions et des superficies. La condition ωi λ > −νi
0 0
désigne ici le passage du régime C1 à C5 de l’individu i. La matrice W = (ω1 , . . . , ωN ) comprend
des variables d’aptitude et d’opportunité :

- CV1 à CV5 : variables indicatrices liées à la culture vivrière indiquée. CV1 = 1 pour
l’igname ; CV2 = pour le maïs ; CV3 = Manioc ; CV4 = Riz ; CV5 = Sorgho.
- PSR1 à PSR8 : variables indicatrices liées au pays de l’espace UEMOA. PSR1 =
Bénin ; PSR2 = Burkina Faso ; PSR3 = Côte d’Ivoire ; PSR4 = Guinée-Bissau ; PSR5
= Mali ; PSR6 = Niger ; PSR7 = Sénégal ; PSR8 = Togo.
- PRO : la production annuelle de la culture.
- SUP : la superficie annuelle emblavée pour la culture.

La disponibilité des données a été déterminante dans le choix de la formulation de l’équation


de sélection. En effet, en absence d’une mesure spécifique de l’aptitude, on a admis que cette
dernière pouvait être captée par les deux variables : la production annuelle de la culture PRO et
la superficie annuelle emblavée pour la culture SUP. La deuxième catégorie de variables jouant
un rôle déterminant sur la probabilité du passage d’un pays pour une culture est représentée par
les variables d’opportunité mesurées notamment par la culture du pays, CVj , P SRi , j = 1, . . . , 5
et i = 1, . . . , 8.
Le logarithme des productions et des superficies est expliqué par les variables suivantes :

- Exogènes et variant dans le temps (Ẋk ) : la production ou superficie (Production =


1 ; Superficie = 0).
- Exogènes et variant dans le temps (Żk ) : pays (PSR1= 1 ; PSR2 = 2 ; PSR3 = 3 ;
PSR4 = 4 ; PSR5 = 5 ; PSR6 = 6 ; PSR7 = 7 ; PSR8 = 8).
- Endogènes et variant dans le temps (Ẍk ) : culture (CV1 = 1 ; CV2 = 2 ; CV3 = 3 ;
CV4 = 4 ; CV5 = 5 ).
- Endogènes et invariants dans le temps (Z̈k ) : système politique agricole (Oui = 1 ;
Non = 0).

L’effet individuel αj représente ici l’aptitude, qui est corrélé avec la culture d’une part, avec
ν d’autre part (voir Chamberlain et Griliches (1975), Griliches (1977), Boumahdi et plassard
(1992), Boumahdi et Thomas (1992)). Remarquons que la corrélation entre αj (variable non
observable) et ν apparaît très justifiée. En effet, le passage du niveau de culture CVk+1 à CVk
peut être expliqué par la matrice W (variables d’aptitude et d’opportunité) mais aussi par l’effet

24
individuel αk .
Il existe dans différents pays des ensembles de données très complets permettant d’estimer notre
modèle. Par exemple aux Etats-Unis, l’enquête PSID (voir Hausman-Taylor(1981)) permet des
études économétriques sur des cultures identiques suivis pendant plus de vingt ans dans 20 états.
Malheureusement, dans l’espace UEMOA, l’on ne dispose pas de données aussi complètes. L’une
des bases de données les plus exhaustives concernant les cultures vivrières, leurs productions
et leurs superficies emblavées est l’enquête de la FAO, qui est réalisée avec des pays différents,
tous les ans. Pour appliquer les méthodes préconisées ci-dessus, nous avons donc construit trois
coupes (1990, 2000, 2010) à partir d’une première coupe (1989) comportant des données réelles.
Les valeurs des variables variant dans le temps ont été simulées pour chaque pays en utilisant
des données statistiques agrégées. L’on disposera donc de quatre coupes instantanées portant sur
les mêmes pays.
Les variables devant être simulées sont PRO, SUP et CV (toutes les autres variables sont soit
invariantes dans le temps, soit déterministes). Les valeurs du logarithme de la production, PRO
de 1960 à 1990 sont calculées en utilisant les taux de croissance annuels de la production en
fonction de la superficie et de la culture du pays.
Pour les variables SUP et CV, la procédure est la suivante. A partir de statistiques sur les pays,
on calcule tout d’abord les probabilités de changement de culture en utilisant les fréquences
correspondantes dans le pays de l’espace UEMOA. De telles fréquences varient bien entendu
selon, en particulier, le climat et la politique agricole. Pour chaque pays i et chaque culture
susceptible de varier (SUP et CV), nous tirons ensuite une variable aléatoire à partir d’une
distribution uniforme U [0 ; 1]. La culture du pays d’une année sur l’autre est changée si la valeur
tirée est inférieure à la probabilité théorique correspondant à cette même culture, étant donné
le climat, la politique agricole du pays.
Les probabilités de changement de pays (pays non propice à la culture vers pays propice et vice-
versa, variable SUP) sont calculées d’après les données de la FAO en 2013.
Nous supposons que la culture, CV, n’est pas modifiée qu’en cas de catastrophe climatique ; de
plus si un pays abandonne la culture, on suppose qu’il adopte une autre culture durant le reste
de la période pour combler le déficit. Les probabilités individuelles correspondantes :

P rob [CVit = 1|CVi,t−1 = 0] et P rob [CVit = 0|CVi,t−1 = 1]

Des précautions doivent être prises pour empêcher des modifications trop fréquentes de la culture
du pays. Puisque l’on dispose de quatre périodes, il est raisonnable de supposer qu’une caractéris-
tique particulière ne peut changer qu’une seule fois de 1960 à 1990. Une telle procédure est bien
sûr critiquable mais elle est néanmoins utilisée ici pour donner au lecteur une idée des méthodes
et de leur applicabilité, plutôt que des résultats numériques précis.
A cet égard, l’on peut s’interroger sur l’effet de la procédure de construction des données simulées
sur les résultats d’estimation. Le fait de simuler des valeurs pour la variable dépendante PRO,
par un argument d’erreur sur les variables, entraîne une sous-estimation des écart-types. En effet,
l’erreur de « mesure » due à la simulation vient s’ajouter au terme d’erreur structurel de notre
modèle, ce qui augmente la variance de la perturbation totale. Comme cet effet n’est pas pris en
compte, les écarts-types des paramètres sont sous-estimés. Ce problème ne nous semble pas trop
important, dans la mesure où cette situation est valable pour les trois méthodes décrites (HT,
AM et BMS), et que notre objectif est de comparer ces trois dernières. En ce qui concerne les
régresseurs, les variables PRO et PRS ne sont pas corrélées avec l’effet individuel, puisqu’elles
sont exogènes dans le modèle. Leur estimation ne devrait donc pas avoir un effet trop néfaste sur

25
la comparaison entre les deux instruments.
Notons que l’objectif majeur de cette application empirique, sur le calcul des prix des cultures
vivrières, est de montrer le gain efficace potentiel lié à l’utilisation des différents instruments
pour traiter la covariance entre les effets individuels et certaines variables explicatives.
L’échantillon utilisé comprend des actifs. Dans ce qui suit, on considèrera l’estimation. Les ré-
sultats figurent dans le tableau 1 de tous les régimes.
Le tableau 2 donne les résultats d’estimation de l’équation de sélection. A partir de ces estima-
tions, le rapport ϕ
φ est aisément calculé ; il sera utilisé plus tard comme régresseur dans l’équation
structurelle. La matrice W sera également nécessaire, pour le calcul de la matrice de variance-
covariance.
Les valeurs qui ont un coefficient négatif sont significatives ; par conséquent, les pays dont la poli-
tique agricole est faible, toutes choses égales par ailleurs, la probabilité de passage à une culture.
Les variables d’opportunité donnent elle aussi des résultats cohérents avec ce que l’on était en
droit d’attendre. Les pays à bonne politique agricole ont un effet positif sur la production par
contre les pays à politique agricole faible ont un effet positif sur la superficie. Ce groupe de pays
utilise plus de superficie pour compenser leurs productions afin d’obtenir un gain à la culture.
L’estimation de l’équation de sélection permet de calculer le ratio de Mill utilisé ensuite comme
variable explicative dans l’équation structurelle du régime (équation 17).
L’étape suivante consiste à calculer les variances σα2 k et σε2k des termes d’erreur. La matrice de
−1/2
variance-covariance Ωk peut dès lors être construite. Nous estimons ensuite les paramètres βk
et γk pour les régimes, dans l’équation corrigée de l’hétéroscédasticité.

26
Tableau 2 : Estimation des paramètres de l’équation de sélection
Variables Igname Maïs Manioc Riz Sorgho
Coef GLS Coef MV Coef GLS Coef MV Coef GLS Coef MV Coef GLS Coef MV Coef GLS Coef MV
Bénin Superficie -0,0232 -70,14 -0,0087 -230,43 0,0077 -226,37 0,0542 -120,22 0,0384 -60,15
Production -0,24 -38,10 -0,2110 -158,80 0,0076 -130,16 0,0071 -100,01 0,0072 -75,47
Burkina-Faso Superficie 0,1256 -80,20 -0,0041 -123,33 -0,0025 -17,20 0,0051 -121,02 0,0067 -49,10
Production 2,30 -4,25 -0,0182 -114,65 -0,0016 -14,65 0,0032 -120,04 0,0035 -52,55
Côte d’Ivoire Superficie -0,0026 -66,17 -0,0028 -170,80 0,0081 -150,66 0,0919 -131,67 0,1490 -100,08
Production -0,07 -60,11 -0,9900 -347,75 0,0085 -140,99 0,0921 -152,25 0,1510 -90,01
Guinée-Bissau Superficie 0,1749 -0,25 0,0048 -180,01 -0,0002 -10,01 0,0720 -120,06 0,0544 -21,21
Production 2,45 -3,25 0,8300 -111,25 -0,0018 -11,25 0,0798 -99,75 0,0614 -19,10
Mali Superficie 0,1395 -105,44 -0,0016 -254,87 -0,0233 -24,17 0,0646 -101,01 0,0318 -40,24
Production 2,72 -58,74 -0,0013 -365,80 -0,1175 -36,08 0,0387 -153,24 0,0509 -30,33
Niger Superficie 0,0437 -40,97 -0,0298 -117,20 -0,0020 -30,17 0,1350 -144,20 0,0340 -115,33
Production 0,89 -34,20 -0,0800 -124,07 -0,0171 -24,07 0,1390 -87,26 0,0376 -110,40
Sénégal Superficie 0,0879 -17,22 0,0001 -197,01 -0,0182 -15,15 0,0822 -160,24 0,0237 -80,17
Production 1,86 -20,17 0,3900 -201,28 -0,0182 -17,18 0,0220 -164,48 0,0258 -70,03

27
Togo Superficie 0,1339 -27,28 -0,0013 -188,33 0,4387 -140,01 0,0905 -117,18 0,0114 -62,17
Production 2,97 -30,11 -0,9000 -200,13 0,3373 -137,25 0,0317 -127,40 0,0691 -70,31

Source : résultats des estimations


Les matrices d’instruments de HT, AM et BMS sont utilisées successivement dans les esti-
mations. Pour chaque méthode, les écart-types des paramètres donnent une indication sur la
performance relative de chacune. Les matrices d’instruments sont calculées comme suit :

AHT = QMk , PMk Ẋk , Żk

AAM = QMk , PMk Ẋk , QMk Ẋk0 , Żk




ABM S = (QMk , PMk Ẋk , QMk Xk0 , Żk )


Rappelons que la procédure d’estimation proposée ici est basée sur l’hypothèse de corrélation
entre (Ẍk0 , Z̈k ) et l’effet individuel αk . Hausman (1978, P. 1263) propose un test d’exogénéité
afin de pouvoir tester l’hypothèse nulle H0 : E[αk |Xk , Zk ] = 0 contre l’hypothèse alternative
H1 : E[αk |Xk , Zk ] 6= 0. Ce dernier consiste à comparer l’estimateur within-groups (intra-groupes)
à celui des moindres carrés généralisés. Sous l’hypothèse nulle, la valeur de la statistique de test,
dans le cas présent, est 196.23. On peut donc rejeter H0 avec un risque pratiquement nul.
Les tableaux 3, 4, et 5 donnent l’estimation de la fonction de gains (équation 17 et 19) est utilisée
pour calculer la matrice de variance-covariance des paramètres. Les estimations des moindres
carrés généralisés sont également présentées.
Tableau 3 : Estimation des paramètres de HT par la méthode des moindres carrés généralisés
(GLS)
R Version 3.8 15/03/09 3 :51 pm
Data Set : watfile
SOLS DUMMY VARIABLE RESULT
Dependent variable : prix
Observations : 700
Number of Groups : 08
Degrees of freedom : 578
Residual SS : 2.578
Std error of est : 0.067
Total SS (corrected) : 2.891
F = 35.033 with 2,578 degrees of freedom
P-value = 0.000
Variables Coefficients Std. Coef Std. Error t-Stat P-Value
sup -0.134245 -0.347461 0.018447 -7.277506 0.000
prod 0.024386 0.035045 0.033223 0.734009 0.463
Group Number Dummy Variable Standard Error
1 4.643484 0.365639
2 4.876781 0.370063
3 5.252595 0.369474
4 4.839490 0.365496
5 4.858434 0.359065
6 5.099257 0.366957
5 4.748630 0.356590
6 4.257099 0.365795
F-statistic for equality of dummy variables : F(115, 578) = 58.3964 P-value : 0.0000
Source : Résultats de nos estimations

28
Tableau 4 : Estimation des paramètres d’AM par la méthode des moindres carrés généralisés
(GLS)
Dependent variable : prix
Observations : 700
Number of Groups : 08
Degrees of freedom : 693
R-squared : 0.172
Rbar-squared : 0.170
Residual SS : 32.532
Std error of est : 0.217
Total SS (corrected) : 39.308
F = 72.175 with 3,693
degrees of freedom 693
P-value = 0.000
Var Std. Coef. Std. Error t-Stat Constant P-Value
4.687235 - 0.355285 13 13.192903 0.000
sup -0.149316 -0.363264 -8.472974 0.000
prod 0.053560 0.071009 1.656247 0.098
Group Number Random Components
1 -0.346522
2 -0.121608
3 0.250638
4 -0.020350
5 0.128761
6 0.512636
7 -0.216224
8 -0.151243
Lagrange Multiplier Test for Error Components Model Null hypothesis :
Individual error components do not exist. Chi-squared statistic (1) : 1367.1014 P-value : 0.0000

Source : Résultats de nos estimations

29
Tableau 5 : Estimation des paramètres de BMS par la méthode des moindres carrés généralisés
(GLS) : un seul effet fixe
The R 3.8 System 16 :15 Monday, March 09, 2015 3
TSCSREG Procedure
Dependent Variable : Lprix
Model Description
Estimation Method FIXONE
Number of Cross Sections 08
Time Series Length 6
Model Variance
SSE 2.578099 DFE 578
MSE 0.00446 Root MSE 0.066786
RSQ 0.9344
F Test for No Fixed Effects
Numerator DF : 115 F value : 58.3964
Denominator DF : 578 Prob.>F : 0.0000
Parameter Estimates
Parameter Standard T for H0 : Variable
Variable DF Estimate Error Parameter=0 Prob > |T| Label
CS 1 1 -0.455773 0.039463 -11.549433 0.0001 Cross Sec
CS 2 1 0.222476 0.039923 -5.572620 0.0001 Cross Sec
CS 3 1 0.153338 0.038900 3.941882 0.0001 Cross Sec
CS 4 1 -0.131488 0.039174 -3.356518 0.0008 Cross Sec
CS 5 1 0.027422 0.038890 0.705132 0.4810 Cross Sec
CS 6 1 0.420843 0.040309 10.440506 0.0001 Cross Sec
CS 7 1 -0.32288 0.039376 -8.200102 0.0001 Cross Sec
CS 8 1 -0.25976 0.03867 -6.716134 0.0001 Cross Sec
Intercept 1 5.0992 0.36695 13.896065 0.0001 Intercept
Lsup1 -0.134245 0.018447 -7.277506 0.0001
Lprod1 0.024386 0.033223 0.734009 0.4632
Source : Résultats de nos estimations
Le coefficient de la variable culture, qui s’interprète comme le taux de la culture, est positif. Cela
signifie qu’une culture supplémentaire entraîne une hausse de production, toutes choses égales
par ailleurs. On doit noter ici que cette différence de gains d’efficacité (il s’agit en fait d’une
efficacité estimée) enregistrée entre HT et AM est beaucoup plus importante que celle enregistré
dans le cadre d’un modèle à un seul régime sans biais de sélection (Cornwell et Rupert (1988),
Baltagi et Khanti-Akoum (1990)) et celle enregistré dans le cadre d’un modèle à deux régimes
sans biais de sélection (Boumahdi et Thomas (1992)).

5 Conclusion
Dans cet article, nous avons présenté une méthodologie d’estimation d’un modèle à des équa-
tions simultanées avec biais de sélection dans le cas de données de panel. L’approche de HT,
permettant de traiter le cas des modèles et erreurs composées, est combinée avec celle de LMT,
portant sur les équations simultanées avec auto-sélection, pour obtenir des estimateurs d’un
modèle à variables explicatives constantes et variantes dans le temps. La matrice de variance-
covariance asymptotique des paramètres est calculée en prenant en compte les modifications liées

30
au cas des données de panel. L’application au calcul des prix des cultures vivrières dans l’espace
UEMOA permet de mesurer les performances relatives des matrices d’instruments de HT, AM
et BMS. Pour l’estimation des régimes, les méthodes de AM et BMS fournissent des estimateurs
nettement plus efficaces que celle de HT. Par contre, la différence entre les instruments de AM
et BMS est négligeable.

Références Bibliographiques

1. Amemiya, T. et McCurdy, T. [1986] – « Instrumental variable estimation of an error-


component model », Econometrica, 54, pp. 869-880.
2. Baltagi, B. H. et Khanti-Akoum, S. [1990]. – « On efficient estimation with panel data :
an empirical comparison of instrumental variables estimators », Journal of applied econo-
metrics, 5, pp. 401-406.
3. Boumahdi, R. et Plassard, J. M.[1992]. « Note à propos du caractère endogène de la variable
éducation dans la fonction de gain », Revue économique, 43, pp. 145-156.
4. Boumahdi, R. et Thomas, A. [1992]. – « Estimation des modèles à deux régimes avec des
données de pannel », Annales d’économie et de statistique, 28, pp. 125-142.
5. Breusch, T. S., Mizon, G. E. et Schmidt, P. [1989]. – « Efficient estimation using panel
data», Econometrica, 57, pp. 695-700.
6. Chamberlain, G. et Griliches, Z. [1975]. – « Unobservables with a variance-components
structure : ability, schooling and the economics sucess of brothers », International Econo-
metric Review, 16, pp. 422-449.
7. Cornwell, C. et Ruppert, P. [1988]. – « Efficient estimation with panel data : an empirical
comparison of instrumental variables estimators», Journal of applied Econometrics, 3, pp.
149-155.
8. Griliches, Z. [1977]. – « Estimating the returns to schooling : some econometric problems»,
Econometrica, 45, pp. 1622.
9. Hausman, J. A. [1978]. – «Specification tests in econometrics», Econometrica, 46, pp. 1251-
1271.
10. Hausman, J. A. et Taylor, W. E. [1981]. – « Panel data and unobservable individual effects
», Econometrica, 49, pp. 1377-1398.
11. Heckman, J. J. [1976]. – «The common structure of statistical models of truncation, sample
selection and limited dependent variables and a simple estimator for such models», Annals
of Economic and Social Measurement, 5, pp. 475-492.
12. Heckman, J. J. [1979]. – «Sample selection bias as a specification error», Econometrica, 47,
pp. 153-161.
13. Tobin, J. [1958]. – «Estimation of relationship for limited dependent variables», Econome-
trica, 26, pp. 24-36.
14. Willis, R. J. et Rosen, S. [1979]. – « Education and self-selection », Journal of political
Economy, 87, s7-s36.

31

Vous aimerez peut-être aussi