Chapitre 7

Une fonction de production de type Cobb-Douglas est de la forme :
Q = α0 K α1 L α2
On demande :
1) de donner une interprétation économique des coefficients α1 et α2 ;
2) d’estimer les paramètres du modèle et de commenter les résultats ;
3) de calculer le risque α de première espèce concernant l’hypothèse des rendements
d’échelle constants.
Les données collectées sont présentées dans le tableau 1 suivant :
Tableau 1 – Données de production pour 25 entreprises

(extrait des données)
K L Q
8 23 106,00
9 14 81,08
… … …
3 10 43,21
6 71 121,24
Solution
1) Les coefficients α1 et α2 représentent respectivement l’élasticité de la production au

facteur capital et l’élasticité de la production au facteur travail.
• Démonstration :
Nous avons une relation du type : Q = α0 K α1 L α2 .
Une transformation logarithmique conduit à :
Log(Q) = Log(α0 ) + α1 Log(K ) + α2 Log(L)
Or l’élasticité de y à x se définit comme étant un rapport de variation relative :
y/y ∂ Log(y)
e= = = rapport de dérivées logarithmiques.
x/x ∂ Log(x)
Les coefficients α1 et α2 sont donc des élasticités.
Dans tout modèle spécifié sous forme Log-Log, les coefficients s’in-
terprètent directement en termes d’élasticités.
2) Estimation des coefficients du modèle Log-linéaire
Le modèle à estimer est donc le suivant :
Log(Q) = Log(α0 ) + α1 Log(K ) + α2 Log(L) +ε
LQ = a0 + α1 LK + α2 LL +ε
où les variables L Q , L K et L L (tableau 2) sont les variables Q , K et L transformées.

Les résultats de l’estimation sont les suivants :
166 ÉCONOMÉTRIE
0,05
Les t ∗ de Student calculés sont tous supérieurs au t lu (t22 = 2,07), les coefficients
sont donc significativement différents de 0 au seuil de 5 %.
Tableau 2 – Données transformées en logarithmiques décimaux

(extrait des données)
LK = LL = LQ =
Log(k) Log(L) Log(Q)
0,90 1,36 2,03
0,95 1,15 1,91
… … …
0,48 1,00 1,64
0,78 1,85 2,08
Attention, la statistique de Durbin et Watson ne s’interprète pas puisque le modèle

est spécifié en coupe instantanée.
L’estimation statistique est donc satisfaisante.
L’élasticité de la production au capital est égale à : α1 = 0,64 .
L’élasticité de la production au travail est égale à : α2 = 0,25 .
(Si le facteur capital augmente de 10 %, la production augmente de 6,4 % et si le fac-
teur travail augmente de 10 %, la production augmente de 2,5 %.)
Le coefficient α0 est égal à : α0 = 101,084 = 12,13 .
= 12,13 K 0,64 L 0,25.
La fonction de production estimée s’écrit : Q
Les modèles non linéaires 167

3) Les rendements d’échelle sont-ils constants ?
Les rendements d’échelle sont :
– décroissants si α1 + α2 < 1 (la production augmente dans une proportion moindre
que les facteurs de production) ;
– constants si α1 + α2 = 1 (la production augmente dans une proportion identique aux
facteurs de production) ;
– croissants si α1 + α2 > 1 (la production augmente plus vite que les facteurs de pro-
duction).
Or nous avons α1 +
α2 = 0,89 , pour quelle probabilité critique cette valeur est-elle
significativement inférieure à 1 ?
On teste donc les hypothèses suivantes :
H0 : α1 + α2 = 1
H1 : α1 + α2 < 1
Le t calculé de Student est donc égal, sous H0, à :
α1 +
α2 − 1
t∗ =

σα̂1+α̂2
Or la matrice des variances et covariances des coefficients est fournie par Eviews :
2 2 2
Soit
σα̂1+α̂2 =
σα̂1 +
σα̂2 α1 ,
+ 2 cov ( α2 )
= 0,000749 + 0,001261 + 2 × 0,000314 = 0,002638
α1 +
α2 − 1 0,64 + 0,25 − 1 0,020
t∗ = = = −2,14 ≃ t22

σα̂1+α̂2 0,05136
Nous avons 2 % de risques de rejeter l’hypothèse H0 à tort, nous pouvons donc

considérer les rendements d’échelle comme significativement décroissants.
B. Les modèles de diffusion

La courbe de vie du produit est une notion utilisée en marketing : les ventes
évoluent en fonction du temps ; le démarrage est relativement lent lorsque le
produit est nouveau, puis elles connaissent une croissance rapide. La courbe
passe ensuite par un point d’inflexion à partir duquel le rythme de croissance des
ventes diminue.
Nous allons examiner deux modèles classiquement utilisés.
168 ÉCONOMÉTRIE
1) Le modèle logistique (ou courbe de Verhulst ou courbe de Pearl)
Ce modèle est défini par la formulation suivante :
ymax
yt =
1 + br t
où b et r sont les deux paramètres du modèle (0 < r < 1) , r définit la vitesse
de diffusion (plus r est proche de 0 , plus vite nous atteindrons l’asymptote) ; b
est une caractéristique d’ordonnée à l’origine ; ymax = seuil de saturation.
Si t → ∞ alors yt → ymax , et si t → −∞ alors yt → 0 .
Le point d’inflexion est fixe et est atteint pour yt = ymax /2 .
Le graphique 1 illustre l’allure générale de la courbe logistique.
Graphique 1 – La courbe logistique (ymax = 148,31, b = 10, r = 0,7)
2) Le modèle de Gompertz
Ce modèle est défini par la formulation suivante :
t +a
yt = ebr → Ln(yt ) = br t + a
(e = base du logarithme népérien).
Avec ymax = ea = seuil de saturation, b et r sont les deux paramètres du
modèle (b < 0 et 0 < r < 1) .
Si t → ∞ alors yt → ymax , et si t → −∞ alors yt → 0 .

3) Les méthodes d’estimation
La difficulté d’estimation de ce type de modèles1 vient du fait qu’ils ne sont

pas linéaires. L’emploi du modèle de régression est donc impossible tel quel.
L’estimation des paramètres d’un tel modèle doit être effectuée par des
méthodes de régression non linéaire qui nécessitent des procédures numériques
itératives assez complexes, objet du paragraphe suivant.
II. Méthodes d’estimation

des modèles non linéaires
Nous avons jusqu’à maintenant procédé à des artifices de calcul afin de se rame-
ner à des modèles linéaires. Cependant, pour certaines spécifications de modèle
il s’avère impossible, même sous certaines hypothèses, d’utiliser les MCO.
Nous allons présenter, très succinctement2, les méthodes d’estimation non
linéaires en essayant d’en montrer l’inspiration générale et les limites. Des
exemples d’utilisation sont présentés, ensuite, à partir des logiciels RATS et
Eviews.
A. Initiation aux méthodes d’estimation non linéaires

L’inspiration générale des techniques d’estimation non linéaires sont les mêmes
quel que soit le type d’algorithme. Il s’agit de méthodes itératives dans les-
quelles l’équation non linéaire est linéarisée à l’aide d’un développement limité
de Taylor (à partir d’un jeu de valeurs de coefficients initiaux). Les MCO sont
alors utilisés sur cette équation linéaire afin d’estimer des nouveaux coefficients.
Ces nouveaux coefficients permettent, à l’aide d’un nouveau développement
limité, de procéder à une nouvelle linéarisation. La procédure est arrêtée lorsque
les coefficients sont relativement stables d’une itération à l’autre.
Pour ce type de méthode soit efficiente, il convient que les valeurs initiales
ne soient pas trop éloignées des valeurs optimales. Dans le cas contraire, il n’y
a pas convergence et la procédure est défaillante.
1. Pour un approfondissement des modèles de diffusion cf. Bourbonnais R. et Usunier J. C.

Chapitre 7, (2013).
2. Pour un développement très complet, le lecteur peut se référer à Greene W.H., chapitre 10, 2000.
170 ÉCONOMÉTRIE
Algorithme de Gauss-Newton
Soit le modèle non linéaire : yt = f (X, a) + εt où X est la matrice des observa-
tions des variables explicatives (de dimension n , k + 1 ) et a est le vecteur (de
dimension k + 1 ) des paramètres à estimer.
Sous les hypothèses classiques concernant εt , l’estimateur des moindres car-
rés est la valeur de a qui minimise la somme des carrés des résidus :
S(a) = e′ e = [yt − f (X, a)]′ [yt − f (X, a)]
Nous avons k + 1 conditions du premier ordre (∂ S/∂a = 0), soit :
∂S ∂ f (X, a)
= −2 [yt − f (X, a)] = 0
∂a ∂a
 ∂ f (x1 , a) ∂ f (x1 , a) 
...
 ∂a0 ∂ak 
∂ f (X, a)  .. .. .. 
Avec = Z (a) =  . . . 
∂a  
∂ f (xn , a) ∂ f (xn , a)
...
∂a0 ∂ak
Soit Z (a 1 ) cette matrice calculée pour les valeurs particulières de a(a = a 1 ) .
Puis, à l’aide d’un développement limité de Taylor au voisinage de a 1, nous pou-
vons approximer la t -ième observation
∂ f (xt , a) ∂ f (xt , a)
f (xt , a) ≃ f (xt , a 1 ) + ... (a − a 1 )
∂a0 ∂ak
a=a1 a=a1
Ou encore, en notation matricielle :

f (X, a) ≃ f (X, a 1 ) + Z (a 1 )(a − a 1 )
Soit y = f (X, a 1 ) + Z (a 1 )(a − a 1 ) + ε
ou encore : y = f (X, a 1 ) + Z (a 1 )a − Z (a 1 )a 1 + ε
En posant y(a 1 ) = y − f (X, a 1 ) + Z (a 1 )a 1, nous pouvons alors construire un
pseudo-modèle linéaire qui est égal à :
y(a 1 ) = Z (a 1 )a + ε
L’estimateur des MCO de ce modèle linéaire est donné par :
a 2 = [Z (a 1 )′ Z (a 1 )]−1 Z (a 1 )′ y(a 1 )
= a 1 + [Z (a 1 )′ Z (a 1 )]−1 Z (a 1 )′ [y − f (X, a 1 )]
Ce qui donne k + 1 nouvelles valeurs pour le vecteur a = a 2 . Le processus
est arrêté à la p -ième itération, lorsque nous observons une relative stabilité des
coefficients ainsi estimés : a = a p ≃ a p−1 .

Cette méthode assez complexe connaît quelque raffinement par l’utilisation
d’un développement limité de Taylor du second ordre (algorithme de Newton-
Raphson).
Les logiciels d’économétrie (Eviews, RATS, …) ainsi que les tableurs – à

l’aide de la fonction SOLVEUR – permettent, très simplement, d’utiliser ces
méthodes d’estimation des modèles non linéaires.
Néanmoins, il convient d’insister sur le fait qu’elles ne sont efficientes que si

nous sommes capables de fournir des valeurs initiales compatibles avec la spé-
cification du modèle et les données.
B. Exemples d’application
Exercice n° 2
fichier C6EX2
Estimation des paramètres d’un modèle de diffusion Logistique
et de Gompertz
Le tableau 3 présente les ventes cumulées (en milliers d’unités) d’un CD audio d’un
artiste à succès sur 19 semaines.
Tableau 3 – Extrait des ventes cumulées sur 19 semaines (milliers d’unités)
Semaines Ventes
1 44,7
2 61,0
… …
18 607,0
19 633,9
On demande :
1) D’estimer les paramètres d’un modèle de diffusion de type Logistique.
2) D’estimer les paramètres d’un modèle de diffusion de type Gompertz.
Solution
Le graphique 2 présente l’évolution des ventes cumulées en fonction des semaines. Ce
graphique peut suggérer une évolution selon un modèle de diffusion, nous serions alors
à proximité du point d’inflexion.
172 ÉCONOMÉTRIE
700
600
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Graphique 2 – Ventes cumulées
1) Estimation d’un modèle de diffusion de type Logistique (Eviews).

Valeurs initiales compatibles
PARAM 1 600. 2 5. 3 0.5
equation NLS ventes=C(1)/(1+c(2)*c(3)^@trend)
Résultats (Eviews) :
Dependent Variable: VENTES

Sample: 1 19
Included observations: 19
Convergence achieved after 8 iterations
VENTES=C(1)/(1+C(2)*C(3)^TEND)
Coefficient Std. Error t–Statistic Prob.
C(1) 718.0033 11.87762 60.45008 0.0000
C(2) 14.77212 0.536144 27.55254 0.0000
C(3) 0.784909 0.004580 171.3614 0.0000
R-squared 0.999009
ymax 718
Le modèle estimé s’écrit : yt = =
1 + br t 1 + 14,77 × 0,785t
2) Estimation d’un modèle de diffusion de type Gompertz (RATS).
* Régression non linéaire

nonlin b r a ← Définition des paramètres à estimer
frml gompertz = exp(b*r**(t)+a) ← Formulation du modèle

*Initialisation des paramètres
eval a = 5.
eval b = -3.5
eval r = 0.5
nlls(frml=gompertz,trace) taux ← Estimation des coefficients
Résultats
t t
Soit le modèle : yt = ebr +a = e(−3,46×0,88 +6,83) ; le seuil de saturation, selon un
modèle de Gompertz, est donc de e6,83 = 927.
Exercice n° 3
fichier C6EX1
Estimation des paramètres d’une fonction de production de type CES
Les fonctions de production à l’élasticité de substitution constante, appelées CES1
(Constant Elasticity of Substitution), sont de la forme :
Q = β1 [β2 K β3 + (1 − β2 ) L β3 ]β4 avec β3 et β4 < 0
où 1/(1 − β3 ) représente l’élasticité de substitution2.

Nous pouvons aussi l’écrire de la manière suivante :
Q = β1 [β2 K β3 + (1 − β2 )] L β3 ]ν/β3
où ν représente alors les rendements d’échelle.

En reprenant les données du tableau 1, on demande :
1. La fonction de production à l’élasticité de substitution constante (CES) a été introduite par

Arrow K.J. et al., 1961.
2. L’élasticité de substitution mesure l’incidence de la variation relative des prix des facteurs sur la
combinaison productive (le rapport K /L ).
174 ÉCONOMÉTRIE
1) de transformer cette fonction de production par un passage aux logarithmes ;
2) d’estimer les paramètres du modèle ;
3) de comparer les résultats avec ceux obtenus à l’exercice 1.
Solution
1) Transformation du modèle
Q = β1 [β2 K β3 + (1 − β2 )] L β3 ]β4
Log(Q) = Log(β1 ) + β4 Log [β2 K β3 + (1 − β2 ) L β3 ]

Nous observons que cette fonction de production n’est pas linéarisable (contraire-
ment à la fonction de production de type Cobb-Douglas). Il convient donc d’utiliser une
technique d’estimation des modèles non linéaires.
2) Estimation des paramètres
Les instructions du logiciel Eviews sont les suivantes :
PARAM 1 12. 2 –1. 3 0.5 4 –0.5 ← Initialisation des 4 paramètres
NLS Q = C(1)*(C(3)*K^C(4))+(1–C(3))*L^C(4))^C(2) ← Équation
Résultats
La fonction de production estimée s’écrit :

Q = β1 [β2 K β3 + (1 − β2 ) L β3 ]β4
= 11,21 [0,404 K −0,597 + 0,594 L −0,597 ]−1,38
3) Comparaison des résultats entre une fonction de production Cobb-Douglas et une
fonction de production de type CES
Lors de l’exercice 1, nous avons estimé les rendements d’échelle de la fonction
α1 +
Cobb-Douglas ( α2 = 0,89) qui sont significativement décroissants.
Pour la fonction de type CES, nous avons :

ν=β 3 × β
4 = −1,38 × −0,597 = 0,82 < 1
Les rendements d’échelle sont décroissants, et l’élasticité de substitution constante
est égale à :
1/(1 − β3 ) = 0,42

7. Les modèles
à décalages temporels
J
usqu’à maintenant, nous avons spécifié des modèles où toutes les
variables sont exprimées à la même période. Cependant, la théorie
économique postule couramment – non pas des effets synchrones –
mais des effets retardés.
Ces modèles à décalages peuvent inclure comme variables retardées aussi
bien la variable endogène que les variables exogènes. Nous étudierons,
tout d’abord en I., les modèles autorégressifs dont la variable retardée
est la variable endogène. Puis, en II., une autre classe de modèle est envi-
sagée : les modèles à retards échelonnés. Dans cette spécification, les
variables exogènes apparaissent à plusieurs décalages.
Enfin, en III., nous présentons deux exemples de modèles dynamiques.
I. Les modèles linéaires autorégressifs

A. Formulation générale
Dans ce type de modèles temporels, la variable endogène yt dépend :
– de k variables exogènes x1t , x2t , . . . , xkt à l’époque t ;
– des valeurs que prend la variable yt pendant les périodes précédentes,
yt−1 , yt−2 , . . . , yt−h .
Soit la formulation :
yt = b1 yt−1 + b2 yt−2 + . . . + bh yt−h + a0 + a1 x1t + a2 x2t + . . . + ak xkt + εt
h
ou encore : yt = bj yt− j + X a + εt
j=1 (n, k + 1) (k + 1, 1)
Les modèles à décalages temporels 177

Dans ce modèle, l’hypothèse H5, d’indépendance entre les variables expli-
catives et l’erreur, n’est plus satisfaite car les variables yt−1 , yt−2 , . . . , yt−h qui
dépendent de εt−1 , εt−2 , . . . , εt−h sont aléatoires puisque yt+1 est fonction de yt
qui dépend de εt , soit : E(yt+1 εt ) = 0 .
Nous remarquons que si les variables exogènes xit et les erreurs εt sont
fixées, les variables endogènes sont solutions de l’équation de récurrence :
yt = b1 yt−1 + b2 yt−2 + . . . + bh yt−h + St
avec St = Xa + εt .
Il est démontré que la solution générale de cette équation de récurrence est
explosive si une des h racines de son équation caractéristique1 a son module
supérieur à 1 .
Or nous devons considérer les processus explosifs – que ce soit d’une façon
monotone ou oscillatoire – comme des phénomènes rares en économie (les
variables sont limitées généralement dans leur croissance), c’est pourquoi il
convient d’ajouter l’hypothèse de stabilité du processus.
Cas particulier : le modèle autorégressif d’ordre 1

Le modèle général spécifié ci-dessus est rarement utilisé, le plus souvent
nous nous limitons à des processus autorégressifs d’ordre 12, de la forme :
yt = b1 yt−1 + a0 + a1 x1t + a2 x2t + . . . + ak xkt + εt [1]
Ce modèle est stable si |b1 | < 1 et explosif si |b1 | > 1 .
B. Test d’autocorrélation et méthodes d’estimation

La méthode d’estimation adéquate dépend d’une éventuelle dépendance des
erreurs ; or, dans le cas d’un modèle autorégressif, le test de Durbin et Watson a
une puissance réduite et est biaisé. C’est pourquoi il convient d’utiliser une autre
statistique, celle du « h » de Durbin.
1) Test d’autocorrélation des erreurs
Dans le cas d’un modèle autorégressif d’ordre 1, le test classique de Durbin et

Watson sous-estime le risque d’autocorrélation, un nouveau test d’autocorréla-
tion des erreurs doit alors être utilisé3. La statistique utilisée est la suivante :
1. L’équation caractéristique s’écrit r h − b1 r h−1 − b2 r h−2 − . . . − bh = 0 .

2. La variable yt dépend néanmoins des valeurs passées yt−1 , yt−2 , . . . y0 .
3. Durbin J., 1970.
178 ÉCONOMÉTRIE

n

h=ρ [2]
σb̂12
1 − n
avec ρ = 1 − dw/2 (dw est la statistique de Durbin et Watson calculée sur la

modèle [1]) ;
n = nombre d’observations ;
σb̂12 = variance estimée du coefficient b1 à partir du modèle [1].

Cette statistique « h » est distribuée de manière asymptotique comme une
variable normale centrée réduite. Ainsi, il y a équivalence entre les deux tests
d’hypothèses suivants :
H0 : ρ = 0 H0 : h = 0
H1 : ρ = 0 H1 : h = 0
Si |h| t α/2 , nous acceptons l’hypothèse H0 d’indépendance des erreurs.
(t α/2 = valeur issue de la loi normale pour un test bilatéral au seuil de α .)
Nous remarquons que si nσb̂12 1 , la statistique « h » ne peut pas être calcu-
lée ; dans ce cas, nous pouvons utiliser la statistique de Durbin et Watson en
incluant la zone de doute dans la zone d’autocorrélation des erreurs.
2) Estimation si les erreurs ne sont pas corrélées
Dans le cas d’absence d’autocorrélation des erreurs, les estimateurs des MCO
appliqués au modèle [1] convergent asymptotiquement vers les valeurs vraies
des paramètres et ont une variance minimale parmi tous les estimateurs conver-
gents.
Cependant, pour les petits échantillons, lors de l’estimation d’un modèle
autorégressif d’ordre h , les résultats asymptotiques sont alors très approxima-
tifs, car le nombre de périodes d’estimation est de n − h . De plus, les problèmes
de colinéarité entre les variables explicatives décalées interdisent pratiquement
d’utiliser les MCO.
En résumé, pour l’estimation des modèles autorégressifs à erreurs indépen-
dantes, l’application de la méthode classique des MCO est licite si le nombre
d’observations est suffisant (souvent dans la pratique n > 15 ).
3) Estimation en cas d’autocorrélation des erreurs
Le modèle s’écrit alors :

yt = b1 yt−1 + a0 + a1 x1t + a2 x2t + . . . + ak xkt + εt [3]
avec εt = ρ εt−1 + vt

Il s’agit d’un modèle à autocorrélation des erreurs, nous avons montré lors
du chapitre 5 que la transformation en quasi-différences premières peut lever
l’autocorrélation des erreurs d’ordre 1.
Nous pouvons citer différentes méthodes d’estimation.
a) Régression sur les différences premières

On procède à deux régressions par la méthode des MCO : la première sur le
modèle spécifié avec des variables non transformées et la seconde sur le modè-
le spécifié avec des variables transformées en différences premières.
Si les deux résultats d’estimation sont proches, nous pouvons conclure que
les paramètres du modèle sont suffisamment bien déterminés sans rechercher la
liaison éventuelle des erreurs.
b) Correction de l’autocorrélation des erreurs par régression sur les quasi-
différences premières
Par une des méthodes présentées au chapitre 5, nous procédons à la correction
de l’autocorrélation des erreurs : estimation directe de ρ , Hildreth-Lu,
Cochrane-Orcutt.
c) D’autres méthodes
Nous pouvons aussi citer :
– la méthode des variables instrumentales (cf. chapitre 5), où nous retenons
comme variable instrumentale la variable yt−2 ;
– la méthode du maximum de vraisemblance.
La méthode des variables instrumentales résout le problème de convergence
des estimateurs lorsque nous sommes en présence d’erreurs à moyenne mobile
de type :
εt = vt − θ1 vt−1 − θ2 vt−2 − . . . − θ p vt− p
Dans le cas d’erreurs autocorrélées, nous devons utiliser une des méthodes
d’estimation robuste présentées au chapitre 5.
4) Prévision dans un modèle autorégressif

La prévision de la variable endogène y, à l’horizon h , est donnée par :
yn+h =
b1
yn+h−1 +
a0 +
a1 x1n+h +
a2 x2n+h + . . . +
ak xkn+h
L’erreur qui affecte les valeurs successives de

yn+h−1 se cumule d’une pério-
de sur l’autre, et ainsi la variance de l’erreur de prévision peut devenir très
importante.
L’utilisation à des fins de prévision du modèle autorégressif doit donc être
limitée à quelques périodes.
180 ÉCONOMÉTRIE
Exercice n° 1
fichier C7EX1
Estimation des paramètres d’un modèle autorégressif à erreurs liées
Un économètre désire tester la relation entre les prix officiels (P O) de la tonne de
café et les prix réellement appliqués à l’exportation (P E) par les pays producteurs. Il se
propose d’estimer la relation :
P Ot = a0 + a1 P Ot−1 + a2 P E t + εt
dans laquelle le prix officiel est fonction de manière instantanée du prix observé et s’ajus-
te avec un retard d’un an au prix officiel.
Il dispose des données, sur 16 ans, présentées au tableau 1.
Tableau 1 – Prix officiel et prix pratiqué

à l’exportation de la tonne de café (en dollars)
t PO PE
1 455,0 615,0
2 500,0 665,0
3 555,0 725,0
4 611,0 795,0
5 672,0 870,0
6 748,5 970,0
7 846,0 1 095,0
8 954,5 1 235,0
9 1 090,0 1 415,0
10 1 243,5 1 615,0
11 1 390,0 1 795,0
12 1 559,0 2 015,0
13 1 781,0 2 315,0
14 2 046,5 2 660,0
15 2 311,0 2 990,0
16 2 551,0 3 280,0
On demande :
1) d’estimer la relation et de tester une éventuelle autocorrélation des erreurs ;
2) d’en corriger les effets, le cas échéant.

Solution
1) Les résultats de l’estimation sont les suivants :
Dependent Variable : PO
Included observations : 15 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.

C –7.078673 1.851077 –3.824084 0.0024
PO(–1) 0.224016 0.037090 6.039727 0.0001
PE 0.622340 0.025520 24.38636 0.0000
R-squared 0.999980 Mean dependent var 1257.267
Adjusted R-squared 0.999976 S.D. dependent var 663.5723
S.E. of regression 3.236240 Akaike info criterion 5.363558
Sum squared resid 125.6790 Schwarz criterion 5.505168
Log likelihood –37.22668 F-statistic 294296.0
Durbin-Watson stat 0.625901 Prob(F-statistic) 0.000000
L’équation est estimé sur 15 périodes (n − 1) car dans le modèle figure une variable
retardée d’une période.
La statistique de Durbin et Watson laisse augurer d’une autocorrélation des erreurs,
ce qui est confirmé par le « h » de Durbin [2] :

n 15

h=ρ 2
= 0,687 = 2,68 > t 0,05 = 1,96
1 − n
σâ1 1 − 15 × 0,0013
Nous rejetons l’hypothèse H0, soit h = 0 → ρ = 0 .

2) Nous allons tout d’abord comparer les estimations obtenues à partir du modèle brut à
celles obtenues à partir du modèle en différences premières.
Nous procédons à l’estimation du modèle en différences premières sur 14 ans car
nous perdons de nouveau une observation lors du calcul des différences premières de
P Ot−1 .
Les résultats sont les suivants :
Dependent Variable : D(PO)

Included observations : 14 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.

C 2.891649 1.298314 2.227234 0.0478
D(PO(–1)) 0.240680 0.024114 9.981022 0.0000
D(PE) 0.598017 0.018553 32.23277 0.0000
R-squared 0.999299 Mean dependent var 146.5000
Adjusted R-squared 0.999172 S.D. dependent var 76.37030
S.E. of regression 2.197504 Akaike info criterion 4.599930
Sum squared resid 53.11925 Schwarz criterion 4.736871
Log likelihood –29.19951 F-statistic 7845.105
Durbin-Watson stat 1.781510 Prob(F-statistic) 0.000000
182 ÉCONOMÉTRIE
Nous observons que les différences entre les coefficients de régression sont assez
faibles pour a1 (0,224 et 0,240) comme pour a2 (0,622 et 0,598); nous pouvons consi-
dérer les résultats obtenus à la première régression comme valides.
Cependant, à titre pédagogique, nous allons utiliser la méthode de correction d’auto-
corrélation des erreurs.
Le modèle estimé, selon la méthode de Hildreth-Lu, est alors :
P Ot = −2,765 + 0,234 × P Ot−1 + 0,6135 × P E t + et

(1,67) (15,5) (57,9)
et = 0,418 et−1 + vt
R 2 = 0,99 ; n = 14 ; DW = 2,08 ; (.) = t de Student
Les prix officiels de la période t sont donc plus influencés par les prix réellement pra-
tiqués en t que par les prix officiels de l’année précédente.
II. Les modèles à retards échelonnés

A. Formulation générale
Dans certaines spécifications de modèles économétriques temporels, nous pou-
vons postuler que la variable endogène dépend des valeurs prises par une
variable exogène à des époques antérieures, tel que :

h
yt = b0 + a0 xt + a1 xt−1 + a2 xt−2 + . . . + ah xt−h + εt = a j xt− j + b0 + εt [6]
j=0
En général, l’effet de la variable explicative s’estompe avec le temps :

a0 > a1 > a2 > . . . > a h
Ce modèle [6] peut se simplifier dans son écriture en utilisant un opérateur
décalage D défini par : Dxt = xt−1 et en général : D i xt = xt−i , soit :

h
h h
j j
yt = a j xt− j + b0 + εt = a j D xt + b0 + εt = aj D xt + b0 + εt
j=0 j=0 j=0
yt = A(D)xt + b0 + εt [7]
où A(D) est un polynôme de degré h , tel que :
A(D) = a0 + a1 D 1 + a2 D 2 + . . . + ah D h
Le nombre de retards, h , peut être fini ou infini. Cependant, la somme des
coefficients a j tend vers une limite finie, sinon yt serait un processus explosif.

Le polynôme A(1) = a0 + a1 + a2 + . . . + ah permet de mesurer, à long
terme, l’impact de la modification de la variable explicative xt d’une quantité
x sur la valeur de yt . En effet, les coefficients a j représentent les multiplica-
teurs instantanés et leur somme le multiplicateur cumulé.
Retard moyen
La notion de retard moyen permet d’appréhender le laps de temps qui corres-

pond à la valeur moyenne des coefficients a j . Il est égal à la moyenne pondérée
des coefficients, soit :

h
ja j
j=0 a1 + 2 a2 + . . . + hah A′ (1)
D= = = [8]
h a0 + a1 + a2 + . . . + a h A(1)
aj
j=0
L’estimation des paramètres du modèle [6] soulève deux types de difficultés :

– en pratique, la valeur h qui mesure l’importance du nombre de retards est
rarement connue, même si nous en connaissons l’ordre de grandeur ;
– le second problème résulte de la colinéarité entre les variables exogènes
décalées. En effet, lorsque le nombre de retards est important, la colinéari-
té entre les variables explicatives décalées risque d’entraîner une impréci-
sion dans l’estimation des coefficients. C’est pourquoi, le plus souvent,
nous émettons des hypothèses sur la forme de retards.
Ces deux points sont abordés ci-dessous.
B. Détermination du nombre de retards

Lorsque la valeur h du nombre de retards du modèle [6] est inconnue, il existe
des critères statistiques permettant de la déterminer1.
1) Test de Fisher
Le test le plus naturel est celui de Fisher dans lequel nous testons l’hypothèse de
la nullité des coefficients de régression pour les retards supérieurs à h .
La formulation des hypothèses est la suivante, lorsque l’on teste, d’une manière
descendante, une valeur de h comprise entre 0 et M : 0 < h < M .
1. Il s’agit de déterminer quelle est la période maximum d’influence de la série explicative. Il peut
très bien arriver, c’est même souvent le cas, que des coefficients de rang inférieur au décalage
h ne soit pas significativement différents de 0.
184 ÉCONOMÉTRIE
H01 : h = M − 1 → a M = 0 H11 : h = M → a M = 0
H02 : h = M − 2 → a M−1 = 0 H12 : h = M − 1 → a M−1 = 0
.. ..
. .
i i
H0 : h = M − i → a M−i+1 = 0 H1 : h = M − i + 1 → a M−i+1 = 0
Chacune de ces hypothèses fait l’objet du classique test de Fisher, soit :
(SC R M−i − SC R M−i+1 )/1
F1∗ = [9]
SC R M−i+1 /(n − M + i − 3)
que l’on compare au F lu dans la table à 1 et (n − M + i − 3) degrés1 de liberté.
Dès que, pour un seuil donné, le F empirique est supérieur au F lu, nous
rejetons alors l’hypothèse H0 i et la procédure est terminée. La valeur du retard
est égale à M − i + 1 : h = M − i + 1 .
Afin de pouvoir procéder à ce test dans ses conditions d’application, la
Somme des Carrés Totaux doit rester constante d’une estimation à l’autre. Cela
oblige donc à estimer les différents modèles avec un nombre d’observations iden-
tique correspondant donc au nombre d’observations réellement disponible pour
le décalage le plus important, chaque décalage entraînant la perte d’une donnée.
2) Critère de Akaike (AIC)2

Une autre méthode consiste à retenir comme valeur de h celle qui minimise la
fonction de Akaike qui est donnée par :

SC Rh 2h
AI C(h) = Ln + [10]
n n
avec SC Rh = Sommes des Carrés des Résidus pour le modèle à h retards
n = nombre d’observations disponible
(chaque retard entraîne la perte d’une observation)
Ln = logarithme népérien
3) Critère de Schwarz (SC)3

Enfin, une méthode très proche de la précédente consiste à retenir la valeur de
h qui minimise la fonction de Schwarz :

SC Rh h Ln n
SC(h) = Ln + [11]
n n
1. Le degré de liberté du dénominateur est égal au nombre d’observations (n) moins le nombre de
paramètres à estimer dans le modèle [6]. Soit pour h = M − i + 1 et en tenant compte du terme
constant et du coefficient de régression pour la variable x à 0 retard :
n − (M − i + 1) − 1 − 1 = n − M + i − 3 .
2. Akaike H., 1973 ; 1974.
3. Schwarz G., 1978.

Exercice n° 2
fichier C7EX2
Détermination du nombre de retards dans un modèle à retards
échelonnés
La théorie économique postule que les dépenses d’investissement (notées yt ) peu-
vent être expliquées par les profits passés (notés x t ). Le modèle prend la forme d’un
modèle à retards échelonnés tel le modèle [6].
Nous disposons d’un extrait des données trimestrielles du tableau 2 concernant l’in-
dustrie chimique française.
N’étant pas certains de la spécification exacte du modèle, nous désirons tout d’abord
rechercher le nombre de décalages trimestriels qui semblent avoir un effet sur les
dépenses d’investissement. Puis après avoir déterminé le nombre de retards, nous calcu-
lerons le délai moyen.
Tableau 2 – Dépenses d’investissement et profit
(en millions d’euros)
Trimestre yt xt
1 2 072 1 660
2 2 077 1 926
… … …
43 2 840 3 449
44 2 837 3 764
Solution
Nous procédons aux estimations des modèles sur 34 trimestres, puisque le décalage
maximum testé est de 10, on élimine les 10 premières observations.
Nous calculons les trois critères : Akaike, Schwarz et Fisher à l’aide d’un program-
me Eviews en téléchargement (C7EX2).
Les résultats sont consignés dans le tableau 3.
Tableau 3 – Résultats de la recherche du nombre de décalages optimal
Décalage Akaike Schwarz Fisher

0 11,96 11,96 16,82
1 11,50 11,54 18,91
2 11,04 11,12 19,18
3 10,55 10,68 10,89
4 10,25 10,42 8,59
5 9,99 10,21 6,86
6 9,84 10,10 1,09
7 9,88 10,19 0,13
8 9,96 10,31 0,77
9 10,03 10,43 0,25
10 10,10 10,55 –
186 ÉCONOMÉTRIE
Nous observons immédiatement que les minima des deux critères (AI C(h) et
SC(h) ) sont situés sur la ligne 6, correspondant donc à 6 décalages. La première valeur
du Fisher empirique qui est significative – en partant du retard 10 – est celle de la ligne
5. Elle est égale à 6,86, ce qui vient confirmer une influence de la variable explicative
allant jusqu’à un décalage de 6 périodes.
Nous allons détailler le calcul des critères1 de Akaike et Schwarz pour le retard 6. Le
résultat de l’estimation pour 6 retards est le suivant :
– Variable à expliquer : Y
– n = 38
Variable Coefficient Écart type t de Student Prob.
C 501,5414 154,8486 3,238915 0,0029

X – 0,011389 0,081532 – 0,139687 0,8898
X(– 1) 0,061265 0,124906 0,490487 0,6274
X(– 2) 0,227569 0,119635 1,902194 0,0668
X(– 3) 0,167932 0,112997 1,486158 0,1477
X(– 4) 0,118734 0,127454 0,931580 0,3590
X(– 5) 0,000169 0,136907 0,001235 0,9990
X(– 6) 0,237174 0,084065 2,821310 0,0084
R2 = 0,92 0,921953 Somme des carrés des résidus = 521116,1
D’après [10], nous avons :
521116 2×6
AI C(6) = Ln + = 9,84
38 38
Et d’après [11] :
521116 6 × Ln (38)
SC(6) = Ln + = 10,10
38 38
Nous remarquons que la probabilité critique du coefficient de la variable X(-6) est

largement inférieure à 0,05 ; le coefficient est donc significativement différent de 0. Ceci
est évidement conforme aux résultats précédents.
Les trois critères sont (heureusement) cohérents, le modèle à retards échelonnés com-
porte 6 retards : l’investissement des entreprises de ce secteur est fonction des profits réa-
lisés sur les six derniers trimestres, soit un an et demi. Il convient de noter que seul le
coefficient du sixième retard est significativement différent de 0.
Le graphique 1 illustre la structure de pondération des retards pour le modèle ainsi
estimé.
1. Nous ne revenons pas sur le test de Fisher qui a été déjà abondamment illustré.

Graphique 1 – Structure de la pondération des retards
Le retard moyen est égal d’après [8] :

6
j
aj
j=0 0,0612 + 2 × 0,227 + 3 × 0,168 + . . . + 6 × 0,237
D= = = 3,64

6 −0,011 + 0,227 + 0,168 + . . . + 0,237

aj
j=0
Le délai moyen de réaction est 3,64 trimestres, soit presque une année.
C. Distribution finie des retards

Considérant que nous avons déterminé la longueur des retards h , il convient
d’estimer les coefficients ai du modèle. Cependant, l’utilisation des MCO peut
se révéler impossible du fait de la multicolinéarité entre les variables explica-
tives décalées. C’est pourquoi, dans ce contexte, nous allons présenter une
méthode permettant, moyennant des hypothèses sur la forme des coefficients, de
réduire le nombre de paramètres à estimer.
Fonction polynomiale des retards (retards d’Almon1)
Nous pouvons imaginer une infinité de formes concernant la distribution des
coefficients ai (graphique 2). La méthode des retards d’Almon est très utilisée,
car elle permet de dégager des profils de retards s’adaptant à des représentations
différentes.
1. Almon S., 1965.
188 ÉCONOMÉTRIE

Chapitre 7

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre 7

Transféré par

Droits d'auteur :

Formats disponibles

Une fonction de production de type Cobb-Douglas est de la forme :

Tableau 1 – Données de production pour 25 entreprises

1) Les coefficients α1 et α2 représentent respectivement l’élasticité de la production au

Log(Q) = Log(α0 ) + α1 Log(K ) + α2 Log(L)

Or l’élasticité de y à x se définit comme étant un rapport de variation relative :

où les variables L Q , L K et L L (tableau 2) sont les variables Q , K et L transformées.

Tableau 2 – Données transformées en logarithmiques décimaux

Attention, la statistique de Durbin et Watson ne s’interprète pas puisque le modèle

Les modèles non linéaires 167

Nous avons 2 % de risques de rejeter l’hypothèse H0 à tort, nous pouvons donc

B. Les modèles de diffusion

Graphique 1 – La courbe logistique (ymax = 148,31, b = 10, r = 0,7)

Les modèles non linéaires 169

La difficulté d’estimation de ce type de modèles1 vient du fait qu’ils ne sont

II. Méthodes d’estimation

A. Initiation aux méthodes d’estimation non linéaires

1. Pour un approfondissement des modèles de diffusion cf. Bourbonnais R. et Usunier J. C.

S(a) = e′ e = [yt − f (X, a)]′ [yt − f (X, a)]

Nous avons k + 1 conditions du premier ordre (∂ S/∂a = 0), soit :

Ou encore, en notation matricielle :

Les modèles non linéaires 171

Les logiciels d’économétrie (Eviews, RATS, …) ainsi que les tableurs – à

Néanmoins, il convient d’insister sur le fait qu’elles ne sont efficientes que si

Tableau 3 – Extrait des ventes cumulées sur 19 semaines (milliers d’unités)

Graphique 2 – Ventes cumulées

1) Estimation d’un modèle de diffusion de type Logistique (Eviews).

Dependent Variable: VENTES

2) Estimation d’un modèle de diffusion de type Gompertz (RATS).

* Régression non linéaire

Les modèles non linéaires 173

Q = β1 [β2 K β3 + (1 − β2 ) L β3 ]β4 avec β3 et β4 < 0

où 1/(1 − β3 ) représente l’élasticité de substitution2.

où ν représente alors les rendements d’échelle.

1. La fonction de production à l’élasticité de substitution constante (CES) a été introduite par

Log(Q) = Log(β1 ) + β4 Log [β2 K β3 + (1 − β2 ) L β3 ]

La fonction de production estimée s’écrit :

Les modèles non linéaires 175

I. Les modèles linéaires autorégressifs

Les modèles à décalages temporels 177

Cas particulier : le modèle autorégressif d’ordre 1

B. Test d’autocorrélation et méthodes d’estimation

1) Test d’autocorrélation des erreurs

Dans le cas d’un modèle autorégressif d’ordre 1, le test classique de Durbin et

1. L’équation caractéristique s’écrit r h − b1 r h−1 − b2 r h−2 − . . . − bh = 0 .

avec ρ = 1 − dw/2 (dw est la statistique de Durbin et Watson calculée sur la

2) Estimation si les erreurs ne sont pas corrélées

3) Estimation en cas d’autocorrélation des erreurs

Le modèle s’écrit alors :

Les modèles à décalages temporels 179

a) Régression sur les différences premières

4) Prévision dans un modèle autorégressif

L’erreur qui affecte les valeurs successives de

Tableau 1 – Prix officiel et prix pratiqué

Les modèles à décalages temporels 181

1) Les résultats de l’estimation sont les suivants :

Variable Coefficient Std. Error t-Statistic Prob.

Nous rejetons l’hypothèse H0, soit h = 0 → ρ = 0 .

Dependent Variable : D(PO)

Variable Coefficient Std. Error t-Statistic Prob.

P Ot = −2,765 + 0,234 × P Ot−1 + 0,6135 × P E t + et

II. Les modèles à retards échelonnés

En général, l’effet de la variable explicative s’estompe avec le temps :

Les modèles à décalages temporels 183

La notion de retard moyen permet d’appréhender le laps de temps qui corres-

Nous rejetons l’hypothèse H0, soit h = 0 → ρ = 0 .