Vous êtes sur la page 1sur 15

Économie & prévision

Modèles à changement de régime et test de la théorie des


anticipations rationnelles de la structure par terme des taux
dintérêt en France
Nicolas Rautureau

Citer ce document / Cite this document :

Rautureau Nicolas. Modèles à changement de régime et test de la théorie des anticipations rationnelles de la structure
par terme des taux dintérêt en France. In: Économie & prévision, n°163, 2004-2. Élargissement de l'Union Européenne.
pp. 117-129;

doi : 10.3406/ecop.2004.7347

http://www.persee.fr/doc/ecop_0249-4744_2004_num_163_2_7347

Document généré le 17/06/2016


Abstract
Regime-Switching Models and Test of the Expectations Theory of the Term Structure of Interest
Rates in France by Nicolas Rautureau
Empirical studies of long-term interest rate behavior using the Campbell-Shiller (1987 )
methodology generally observe spread overreaction compared with the movements implied by the
expectations theory of the term structure of interest rates , especially for the United States .
However , this finding is based on a particular specification of short-term interest rate behavior .
This paper addresses two questions . First of all , we look at whether the use of a Markov
switching VAR model improves the acceptance of the theory for France by taking into account any
regime shifts in the stochastic process followed by the vector autoregression . We then study the
effect of macroeconomic factors on the division of the period between the two states . We find that
Markov chain models improve the statistical acceptance of the expectations theory and identify the
effect of the French franc-deutschmark exchange rate on the empirical findings .

Résumé
L'étude empirique de la dynamique du taux d ’ intérêt de long terme , par l ’ intermédiaire de la
méthodologie développée par Campbell et Shiller (1987 ), a conduit le plus souvent à observer
une sur-réaction du spread observé par rapport à l ’ évolution prédite par la théorie des
anticipations rationnelles , en particulier pour les États-Unis . Cependant , ce résultat repose sur
une spécification particulière du comportement du taux d ’ intérêt de court terme . Nous
poursuivons ici un double objectif . Tout d ’ abord , nous cherchons à savoir si l ’ utilisation des
modèles à chaîne de Markov , par la prise en compte d ’ éventuels changements de régime au
niveau du processus stochastique suivi par le vecteur autorégressif , permet une meilleure
validation de la théorie pour la France . Nous analysons ensuite l ’ importance de l ’ attitude des
facteurs macroéconomiques sur le découpage produit par ces modèles . L ’ utilisation d ’ un VAR
à chaîne de Markov permet , d ’ une part , d ’ obtenir une meilleure validation statistique de la
théorie des anticipations et , d ’ autre part , de souligner l ’ influence du taux de change entre le
franc et le deutschemark sur les résultats obtenus
Modèles à changement de régime et test
de la théorie des anticipations
rationnelles de la structure par terme
des taux d’intérêt en France
Nicolas Rautureau(*)

L’étude empirique de la dynamique du taux d’intérêt de long terme, par l’intermédiaire de la


méthodologie développée par Campbell et Shiller (1987), a conduit le plus souvent à observer une
sur-réaction du spread observé par rapport à l’évolution prédite par la théorie des anticipations
rationnelles, en particulier pour les États-Unis. Cependant, ce résultat repose sur une spécification
particulière du comportement du taux d’intérêt de court terme. Nous poursuivons ici un double
objectif. Tout d’abord, nous cherchons à savoir si l’utilisation des modèles à chaîne de Markov, par la
prise en compte d’éventuels changements de régime au niveau du processus stochastique suivi par le
vecteur autorégressif, permet une meilleure validation de la théorie pour la France. Nous analysons
ensuite l’importance de l’attitude des facteurs macroéconomiques sur le découpage produit par ces
modèles. L’utilisation d’un VAR à chaîne de Markov permet, d’une part, d’obtenir une meilleure
validation statistique de la théorie des anticipations, et d’autre part, de souligner l’influence du taux de
change entre le franc et le deutschemark sur les résultats obtenus.

(*) Laboratoire d’Economie de Nantes (LEN), Faculté des Sciences Economiques et de Gestion.
E-mail:Nicolas.Rautureau@sc-eco.univ-nantes.fr

Je tiens à remercier Eric Jondeau, du Centre de Recherche de la Banque de France, pour ses remarques et pour les données
zéro-coupon utilisées dans cette étude. Je remercie également Christian Bordes ainsi que les rapporteurs de la revue pour leurs
commentaires.

Économie et Prévision n°163 2004/2

117
L’étude du contenu informationnel de la structure par d’un mouvement non anticipé (ou d’une absence de
terme concernant l’évolution future des taux fluctuations anticipées) du taux d’intérêt de court
d’intérêt s’effectue traditionnellement dans le cadre terme au cours de la période concernée. Ce décalage
de la théorie des anticipations rationnelles. Cette entre les cheminements effectif et anticipé du taux de
théorie explique la détermination du taux d’intérêt de court terme peut être provoqué par exemple par une
long terme par le niveau des taux d’intérêt de court action non anticipée de la Banque centrale. De façon
terme observés au présent et anticipés pendant la plus durable, Mankiw et Miron (1986) ont montré
durée de vie du taux long, à une prime de terme que ce résultat peut aussi provenir d’un changement
constante près. Cependant, l’acceptation empirique du régime de politique monétaire en vigueur,
de ce cadre théorique pour l’analyse des fluctuations modifiant ainsi le processus stochastique suivi par le
de la structure par terme s’est heurtée à des résultats taux d’intérêt de court terme.
contradictoires selon les pays, les maturités, les
périodes et les types de tests conduits notamment. La L’utilisation d’un vecteur autorégressif (VAR) à la
France n’échappe pas à cette situation. Ainsi, pour suite des travaux de Campbell et Shiller (1987, 1991)
les maturités courtes, Gerlach et Smets (1997, 1998), a permis, d’une part, d’intégrer les interactions entre
Jondeau et Ricart (1998, 1999b) et Jondeau (2001) les mouvements du taux court et le spread de taux
obtiennent des résultats en faveur de la théorie dans correspondant et, d’autre part, de comparer le
le cas français et pour le marché des euro-taux. Par comportement du spread observé à celui impliqué
contre, Rautureau (2002) trouve des résultats plus par la validité de la théorie. En général, même si les
contrastés à partir du marché monétaire français en restrictions déduites de la théorie des anticipations
données quotidiennes. Pour la partie longue de la sont rejetées, les anticipations du taux d’intérêt de
structure par terme, Jondeau et Ricart (1998, 1999a, court terme expliquent une large part des
1999c) obtiennent des résultats mitigés. Par fluctuations des taux d’intérêt de long terme
exemple, pour la première référence, les tests de (Gerlach, 1996). Un autre résultat communément
régression conduisent à l’observation du puzzle admis concerne la sur-réaction du spread au
usuel présent chez Campbell et Shiller (1991) comportement prédit par la théorie des anticipations
notamment. Et dans les deux références suivantes, rationnelles (Sutton, 1997 et 1998). De plus, les
Jondeau et Ricart concluent à une capacité États-Unis sont le pays pour lequel la théorie est la
informative limitée de la structure par terme plus fortement rejetée (Hardouvelis, 1994).
concernant l’évolution future des taux d’intérêt. De
Hamilton en 1989 a aussi souligné le fait que
plus, peu de travaux ont été publiés sur la relation
l’absence de validation empirique de la théorie peut
entre les taux monétaires et la partie longue de la provenir d’une spécification inadéquate du processus
courbe des taux, malgré l’importance de cette de formation des anticipations. C’est pour cela qu’il
relation pour la transmission de la politique développe un modèle à chaîne de Markov présentant
monétaire à l’économie réelle. Nous pouvons tout de le double avantage de formaliser explicitement la
même citer Colletaz et Gourlaouen (1990) qui, entre perception des changements de régime par les
1973 et 1988, observent la pertinence de la théorie investisseurs, ainsi que les probabilités qu’ils
des anticipations rationnelles pour l’analyse de la assignent à de tels changements dans le futur. Même si
structure par terme. les résultats d’Hamilton (1989) ont été invalidés par la
suite par Driffill (1992), cette approche, et ses
Les explications généralement avancées au rejet de extensions dans un cadre multivarié, ont permis de
la théorie reposent soit sur une spécification souligner l’impact négatif de l’instabilité et de
inadaptée de la dynamique de la prime de terme, soit l’incertitude concernant les régimes de politique
sur une description erronée du processus de monétaire en vigueur sur les résultats des estimations
formation des anticipations. Concernant le premier (Sola et Driffill, 1994 ; Kugler, 1996 ; Sutton, 2000).
point, la proposition d’une prime de terme variable
dans le temps est généralement soutenue. Cette Nous cherchons alors à répondre à deux questions.
hypothèse limite alors l’intérêt de la théorie des En premier lieu, nous étudions la validité de la
anticipations puisque dans ce cadre d’analyse, toute théorie des anticipations rationnelles pour l’analyse
variation du taux à terme ou de la pente des taux ne des fluctuations des taux d’intérêt. Pour ce faire,
révèle plus automatiquement une variation des nous utilisons différentes spécifications du
anticipations du marché sur les taux d’intérêt à venir processus suivi par le taux d’intérêt de court terme,
mais peut aussi traduire une modification de la prime ce qui nous permet d’évaluer aussi la robustesse des
de risque. Cependant, l’étude d’Evans et Lewis résultats à la méthodologie de test proposée par
(1994) indique que la seule explication d’une prime Campbell et Shiller (1987, 1991).
de terme variable ne suffit pas pour rejeter la théorie.
Dans un deuxième temps, nous analysons le
La seconde explication suppose des prévisions découpage produit par les modèles à chaîne de
inadéquates du marché concernant le niveau des taux Markov afin d’étudier l’influence éventuelle de
d’intérêt de court terme à l’avenir, mais ne traduit pas facteurs macroéconomiques sur les résultats
obligatoirement l’absence de rationalité des obtenus.
investisseurs. En effet, cette situation peut provenir

118
opérateurs retards d’ordre p, il est possible de
Cadre théorique réécrire (4) sous la forme d’un VAR de dimension 2p
et d’ordre 1, tel que :
L’analyse multivariée dans le cadre d’un régime (5) Z t = AZ t −1 + u t
unique
La théorie des anticipations rationnelles définit le a v e c Z t = ( ∆R t(m) ,..., ∆R t(−m)pm + m , S t(∞) ,..., S t(−∞)pm + m ) ' .
taux d’intérêt de long terme, R t(n) , comme la L’écriture des prévisions à la date t de Z t + j étant
moyenne, à une prime de terme constante près, des donné ψ t , s’écrit alors :
taux d’intérêt de court terme à m périodes présent,
R t(m) , et à venir pendant la durée de vie du titre long, (6) E ( Z t + j | ψ t ) ≡ A j Z t
R t(+mim
)
. Dans le cas où ce dernier a une durée de vie
infinie, cette relation peut s’écrire (1) : Soient h et g deux vecteurs de dimension 2p dont tous
les termes sont nuls à l’exception respectivement du
∞ premier et du (p +1ème) éléments. Nous avons alors
(1) R t(∞) ≡ ∑ E ( R t(m+ )im | Λ t ) + θ h' Z t = ∆R t(m) et g ' Z t = S t(∞) , ce qui, en introduisant (6)
i= 0
dans (3) permet de reformuler (2) :
où Λ t est l’ensemble d’information disponible à la ∞
date t et θ une prime de risque constante dans le (7) g ' Z t = ∑ h' A i Z t
temps pour toute combinaison (m, n) donnée, où n i =1

représente la maturité du titre long. En soustrayant le


taux court des deux côtés de (1), nous obtenons, à la Cette formulation conduit aux restrictions suivantes
suite des travaux de Campbell et Shiller (1987, qui correspondent à l’hypothèse de validité de la
1991), la relation suivante : théorie des anticipations rationnelles :

(2) S t(∞) = E ( S t(∞)' | Λ t ) + θ (8) g ' = ∑ h' A i = h' A( I − A) −1
i =1
( ∞) ( ∞) ( m) ( ∞)'
avec S = R − R . La variable S
t t t est appeléet
le spread théorique ou spread de prévision parfaite. Elles se traduisent par les contraintes linéaires
Il correspond au niveau qui doit être observé si les suivantes sur les paramètres de l’équation (4), qui
agents formulent des anticipations parfaites sur les peuvent être testées à partir de la statistique de Wald :
taux d’intérêt à court terme à venir et s’écrit :
c i = − a i , i =1,..., p

(3) E ( S t(∞)' | Λ t ) ≡ ∑ E ( ∆R t(m+ )im | Λ t ) d 1 =1 − b1
i= 0

d i = − bi i = 2, ..., p
Avec le passage de (1) à (2), Campbell et Shiller
montrent que le caractère intégré d’ordre 1 du taux L’analyse multivariée dans le cadre d’un modèle à
court s’accompagne d’une stationnarité en niveau du changement de régime
spread de taux, et ainsi de l’existence d’une relation
de cointégration entre les taux d’intérêt de court et de Hamilton (1988) constate que de nombreuses études
long terme. La dynamique du vecteur ont souligné l’importance des changements de
z t = ( ∆R t(m) , S t(∞) ) ' peut alors être représentée soit régime dans l’évolution des taux d’intérêt, en
particulier lors de la modification de la politique
par l’intermédiaire d’un modèle à correction monétaire américaine intervenue en octobre 1979 et
d’erreur, soit sous la forme du VAR suivant : étudiée par Huizinga et Mishkin (1986) notamment.
Cependant, peu de modèles ont été développés pour
 ∆R (m)   a ( L) b ( L)   ∆R t(−mm)   u1 , t  tenir compte de cette caractéristique et de la
(4)  (∞t )  =    (∞)  +  
 S  
 t   c ( L) d ( L)   S t − m   u 2 , t  perception qu’ont les agents de ces changements,
sachant que ces derniers ne peuvent pas être
où les variables ∆R t(m) et S t(∞) sont centrées afin considérés comme la résultante de circonstances
parfaitement prévisibles, mais plutôt d’évènements
d’éliminer de la relation la prime de risque supposée en partie aléatoires. Hamilton développe alors un
constante dans le temps. Par conséquent, l’ensemble modèle caractérisé par des changements de régime
d’information ψ t dont dispose l’économètre est discrets produits à partir d’un processus à chaîne de
inclus dans Λ t et comprend les valeurs passées sur p Markov, ce qui permet de formaliser, d’une part,
périodes des variations du taux court et du spread de l’incertitude sur l’état du régime en vigueur à la date t
taux. Le spread de prévision parfaite est alors obtenu et, d’autre part, le passage d’un régime à un autre. Ses
par projection linéaire sur ψ t . Comme l’ensemble premières applications, publiées en 1988 et 1989,
des polynômes a(L), b(L), c(L) et d(L) sont des concernent alors l’examen de la politique monétaire

119
américaine au cours des années 70 et 80 et l’étude du La probabilité d’observation de l’état j à la date t ne
cycle des affaires. dépend donc que de l’état observé en t -1, qui est
supposé incorporer l’ensemble de l’information
Dans cet article, nous allons employer le modèle passée. La matrice P des probabilités de transition de
utilisé par Warne (1996), où z t est modélisé à partir dimension (q × q) s’écrit alors :
d’un VAR avec une constante(2) :
 p11 K p q1 
p  
(9) Z t = µ st + ∑ B (k )
st
z t − k +ε t t = 1, 2, ..., T (14) P =  M M 
k =1 p p qq 
 1q K
Les valeurs initiales z 0 ,..., z 1 − p sont données comme
fixes. La matrice B s(tk ) est de dimension (N × N ), avec Les probabilités sont toutes supposées strictement
positives, ce qui assure un processus de Markov non
N la dimension du vecteur z t , et intègre les réductible, c’est-à-dire sans la présence d’un état
paramètres autorégressifs pour le retard k. Elle absorbant. Par construction, une des valeurs propres
dépend, avec la constante µ st et la matrice des de P est égale à l’unité et les autres sont supposées à
variances - covariances des résidus Ω st , de l’état l’intérieur du disque unitaire, permettant d’obtenir
inobservable du modèle, noté s t . Le VAR d’ordre p ainsi une chaîne de Markov ergodique. Elle se
de l’équation (9) peut aussi s’écrire sous la forme caractérise par une diminution, avec l’horizon de
réduite d’un VAR d’ordre 1 : projection, de l’importance de l’état courant dans la
détermination des états futurs.
(10) Z t = J ' µ st + B st Z t −1 + J ' ε t t = 1, 2, ..., T
La construction du spread théorique S t(∞)' est alors
avec ε t | s t = N (0,Ω st ) et :
effectuée à partir des résultats de Blix (1997a, b) (3) :
 zt   B s(1t ) B s(t2) K B s(tp) 
    (15) S t(∞)' = g ' Z t = b * Z t
 z t −1  I K 0 
(11) Z t = ,B = N ,
 M  ST  M O M  avec Z t = e1 ⊗ Z t où e i est la ligne i de la matrice
    identité. b * est définie comme :
 z t − p +1   0 K IN 0 
(16) b * = e1' b Φ 1−1 Pnp
J =( I N 0 K 0)

qui sont respectivement des vecteurs et matrices de Avec b =( B1 ,..., B q ) où B st est défini en (11).
dimension (Np × 1), (Np × Np) et (N × Np). Φ 1 = I Npq − Φ , avec I Npq une matrice identité de
dimension (Npq × Npq), où N est le nombre de
Dès lors, et de façon similaire au passage de (5) à (7), variables, p le retard du VAR et q le nombre d’états
il est possible de construire le spread théorique à du modèle. De plus, Φ = Pnp C , avec C une matrice de
partir de l’estimation de (10), et d’en dériver les dimension (Npq × Npq) :
restrictions imposées par la théorie des anticipations
rationnelles. Concernant l’estimation de (10), et  B1 0 K 0 
 
puisque la plupart des paramètres dépend de l’état du 0 B2 M 
modèle à la date t, il reste à définir le mode C =
 M O 
d’obtention de ces états. Hamilton suppose que la  
transition entre les q états possibles est gouvernée  0 K 0 B q 
par un processus de Markov d’ordre 1, et la
probabilité que s t soit égal à j à la date t peut s’écrire : et :
(12) p ( s t = j | s t − 1 = i, s t − 2 = k ,..., I t − 1 ) PNp = P ⊗ I Np
= p ( s t = j | s t − 1 = i) = p ij Les restrictions impliquées par la validité de la
théorie des anticipations rationnelles constituent une
a v e c i, j , k ∈{1,2,... q ) e t I t −1 u n e n s e m b l e généralisation du résultat de Campbell et Shiller
d’information connu à la date t -1 et comprenant les (1987) lorsque le nombre d’états du modèle est
valeurs passées de z t ( I t −1 = [ z t −1 , z t − 2 , ...]) . p ij est supérieur à un. L’avantage d’adopter un horizon
la probabilité de transition de l’état i vers l’état j et infini tient au fait que ces restrictions sont linéaires et
nous avons : prennent la forme suivante :
q
(13) ∑p =1 ∀i =1,..., q (17) Rvecb = r
ij
j =1

120
où l’hypothèse nulle est la validité de l’égalité, avec L’examen des modèles 2 et 3 apporte ensuite une
réponse à la deuxième question concernant la
R = I npq ⊗ (1 1), r = vec e 2' JD Np constance de la prime de risque entre les différents
régimes.
et
Avant d’examiner le résultat des estimations, deux
' '
D Np =1 ⊗ I Np 1 est un vecteur unité de dimension points importants sont à noter. Tout d’abord,
q q
l’estimation des modèles à chaîne de Markov repose
(q × 1). Le test des restrictions (17) s’effectue alors à sur l’hypothèse, déjà mentionnée à plusieurs
partir de la statistique de Wald. reprises, de la présence de deux régimes ou états dans
la dynamique du vecteur Z t sur la période étudiée. Ce
Le résultat des estimations : l’utilisation des choix est dicté par la volonté de conserver un nombre
modèles à changement de régime se justifie-t-elle? suffisant de degrés de liberté, tout en minimisant les
Enjeux et problématique du test de la théorie problèmes numériques éventuellement rencontrés
lors de l’estimation. De plus, il doit permettre
Les tests sont conduits autour de deux questions. d’intégrer une part importante de la diversité des
Tout d’abord, nous cherchons à savoir si le recours situations passées. Cependant, la sélection du
aux modèles à chaîne de Markov conduit à une nombre de régimes demeure problématique.
meilleure validation empirique de la théorie des Hamilton (1994) souligne d’ailleurs ce point à la fin
anticipations rationnelles. Si tel est le cas, il sera du chapitre consacré à ces modèles, sans
alors nécessaire de s’intéresser aux non linéarités véritablement proposer de solution. Le second point
présentes dans la dynamique des taux d’intérêt et concerne le fait que nous utilisons plusieurs modèles
d’en expliquer l’existence. Dans un second temps, statistiques différents pour tester une théorie, dont
nous nous intéressons, à la suite des travaux de nous ne connaissons pas, a priori, la validité sur
Kugler (1996), à la constance de la prime de risque l’échantillon utilisé. La difficulté est alors de cerner
dans le temps, c’est-à-dire à sa stabilité entre les deux ce qui ressort de l’échec ou de la validité de la théorie,
régimes étudiés. Cette analyse devrait fournir une de ce qui dépend des modèles statistiques employés.
indication sur une éventuelle inégalité quant à Mais le propre d’une théorie (valide) est d’anticiper
l’évolution et la répartition du risque depuis 1981. les résultats obtenus par expérimentation, sa
Trois modèles sont étudiés pour y répondre. Le robustesse dépendant du nombre d’amendements
premier est issu directement des travaux de qu’il est nécessaire d’introduire face à la diversité
Campbell et Shiller. Il s’agit de l’estimation du des situations rencontrées. C’est sur la base de ces
modèle linéaire supposant l’existence d’un seul deux remarques, et à partir du cadre méthodologique
régime pour la dynamique stochastique de Z t . Il est défini auparavant, que nous allons alors tester la
représenté par l’équation (5) : théorie des anticipations.
~ ~ Les estimations sont effectuées entre le premier
(18) Z t = AZ t −1 + u t
trimestre 1981 et le quatrième trimestre 1998 (216
avec u t ~ N (0,Ω ). Le symbole ~ utilisé dans cette observations) (4). Le taux d’intérêt de court terme est
section indique que le vecteur Z t est centré. Les deux le taux à un mois du marché monétaire français et le
autres modèles supposent l’existence de deux états taux long est le taux à dix ans extrait de la courbe des
inobservables responsables de la dynamique des taux zéro-coupon construite par la Banque de
taux d’intérêt. Le modèle 2 autorise tous les France(5). Ces séries de taux d’intérêt sont intégrées
coefficients à dépendre du régime en vigueur, y d’ordre un et le spread de taux apparaît stationnaire
compris la constante. Il découle de l’équation (10) : en niveau, ce qui nous autorise à utiliser la
méthodologie de test multivariée proposée par
(19) Z t = c st + B st Z t −1 + v t Campbell et Shiller (1987, 1991).
La prise en compte d’un second régime est-elle
avec v t | s t ~ N (0,Ω st ) et Z t un vecteur non centré. pertinente ?
Le modèle 3 est quant à lui estimé à partir du vecteur
~
Z t , ce qui permet de poser la prime de terme Les tests formels de l’utilité d’une modélisation à n
constante sur les deux régimes observés. Pour le régimes par rapport à la sélection de n-1 régimes sont
modèle 3, les paramètres des matrices B st et Ω st rares. Cette approche est cependant adoptée par
dépendent du régime en vigueur : Hansen (1992), Ang et Bekaert (1998, 1999) et
Chesnay et Jondeau (2001) notamment. La difficulté
~ ~ vient du fait que les paramètres du second régime ne
(20) Z t = B st Z t −1 + v t
sont pas identifiables sous l’hypothèse nulle
d’absence de changements de régime. Pour y
avec v t | s t ~ N (0,Ω st ). remédier, Hansen (1992) et Ang et Bekaert (1999)
ont proposé deux méthodes permettant l’application
La comparaison du modèle 1 aux deux autres
d’un test du rapport de vraisemblance. Nous
modèles permet de répondre à la première question.
appliquons ici la méthode de test de l’existence d’un

121
second régime d’Ang et Bekaert (1999), qui repose avec T le nombre d’observations et p i , t la probabilité
sur l’utilisation de simulations de Monte-Carlo. du régime i à la période t. Dans cette étude, il s’agit
Ainsi, dans une première étape nous estimons le des probabilités lissées, c’est-à-dire des probabilités
modèle multivarié à régime unique sur l’ensemble de calculées à partir de l’information disponible sur
la période. Dans un second temps, nous simulons, à l’ensemble de la période. La formule (21) s’écrit
l’aide des paramètres estimés à l’étape précédante, pour les modèles à deux états :
500 échantillons de 216 observations chacun. Les
termes d’erreurs sont obtenus à partir d’une loi 1 T
normale de moyenne nulle et de variance unitaire.
(22) RCM (2) = 400 ∑ p t (1 − p t )
T t =1
Dans une troisième étape, nous estimons pour
chacun de ces échantillons simulés les trois modèles. La constante sert à normaliser la statistique entre 0 et
Cette procédure coûteuse en temps de calcul nous 100. En règle générale, le découpage de la période est
permet ainsi d’obtenir 500 valeurs de la fonction de sans ambiguïté lorsque la probabilité affectée à
vraisemblance pour chacune des spécifications, ce l’occurrence d’un état, pour une date donnée, est
qui nous autorise à construire la distribution à proche de l’unité ou de zéro. Dans ce cas, le modèle à
distance finie de la statistique du rapport de chaîne de Markov produit un résultat qui peut
vraisemblance pour notre échantillon. Les résultats sembler robuste. Au contraire, lorsque le modèle
de cette approche sont reportés dans le tableau 1. n’arrive pas à identifier clairement le régime en
L’hypothèse nulle de la présence d’un seul régime vigueur à la date t, l’utilité d’une telle modélisation
sur la période étudiée est alors fortement rejetée s’en trouve réduite et nous observons des
puisque la valeur la plus élevée du rapport des probabilités proches d’une valeur de 0,5. Dans cette
vraisemblances obtenue à partir des simulations est situation, l’inférence sur l’état du modèle pour la
de 61,840 pour le modèle 2 contre une statistique date en question risque de conduire à un jugement
observée de 263,360 (et de 47,182 contre une erroné. Ainsi, une valeur de 0 pour la statistique
statistique observée de 258,9 pour le modèle 3). RCM traduira une classification parfaite des
observations entre les deux régimes autorisés. Par
Tableau 1 : qualité d’identification des régimes contre, une valeur de 100 correspondra à une
incapacité du modèle à identifier deux régimes
Modèle 1 Modèle 2 Modèle 3 distincts à partir des données utilisées, et sera
LogL -330,45 -198,77 -201 caractéristique d’une absence d’information
RV observé _ 263,36 258,9 délivrée par la modélisation à chaîne de Markov à ce
Moyenne _ 27,403 20,264 sujet. Cette statistique permet ainsi de porter un autre
Minimum _ 9,539 6,478 jugement sur l’utilité des modélisations à
Maximum _ 61,84 47,182 changement de régime relativement à l’approche
5% _ 13,391 9,757 linéaire proposée par Campbell et Shiller (1987,
50% _ 25,842 19,654 1991). Les valeurs de 5,630 et de 7,069 obtenues
95% _ 49,331 33,806 respectivement pour les modèles 2 et 3 sont très
RCM _ 5,63 7,069 proches de zéro, ce qui traduit la capacité de ces
Test RV 236,36 _ 4,46 spécifications à identifier clairement la présence de
(12 / 0) (4 / 0,347) deux régimes distincts sur la période considérée. Ce
Note : LogL indique la valeur de la fonction de vraisemblance résultat s’explique en partie par une persistance très
observée. La seconde partie du tableau reporte les résultats obtenus importante du régime 2, comme la probabilité
par simulations de Monte Carlo d’un échantillon de 216 observations
à partir du modèle à un régime. Les modèles à chaîne de Markov sont associée à ce régime l’indique dans le tableau 2
alors estimés sur les données simulées, ce qui permet de calculer la (0,979 et 0,977 pour les modèles 2 et 3).
statistique RV. Cette procèdure est répétée 500 fois. La statistique
RCM est définie à l’équation (22). La statistique relative au “test RV”
est décrite dans la présente section. Estimation des modèles
Le résultat de l’estimation des trois modèles est
Nous reportons aussi dans le tableau 1 la statistique reporté dans le tableau 2, avec les écart-types
RCM (pour Regime Classification Measure) indiqués entres parenthèses. Le choix d’un retard a
proposée par Ang et Bekaert (1998), et qui permet été effectué sur la base du critère BIC. Nous pouvons
d’apporter un autre jugement sur la qualité des ainsi remarquer la proximité importante des
estimations obtenues. Elle est définit pour les coefficients des modèles 2 et 3. Les résultats des tests
modèles à q états par la formule suivante : de spécification conduits pour chacun des modèles
sont présentés dans le tableau 3. Concernant le
1 T  q  modèle 1, il s’agit de la statistique de Ljung-Box
(21) RCM ( q ) =100q 2 ∑  ∏ pi, t
T t = 1  i = 1
 pour l’autocorrélation et du test LM pour
 l’hétéroscédasticité, chacun pour un retard de six

122
Tableau 2 : résultat de l’estimation des modèles chaîne de Markov. Ces tests constituent une
adaptation de ceux proposés par Hamilton (1996)
Modèle 1 Modèle 2 Modèle 3 pour les modèles univariés à partir des scores
Coef. σ(. ) Coef. σ(. ) Coef. σ(. ) conditionnels. Ils suivent une loi de Fisher de type
µ1(1) _ _ 0,141 (0,435) _ _ F ( q 2 ,T −1 − np − nq ) pour les deux premiers, et avec
(1)
µ 2 _ _ -0,159 (0,568) _ _ 2q restrictions pour le dernier (soit 4 restrictions pour
µ1( 2 ) _ _ -0,054 (0,03) _ _ chacun de ces tests). Une spécification inadéquate se
µ (22 ) _ _ 0,053 (0,038) _ _ traduit alors par le rejet de l’hypothèse nulle. Dans
a (1) l’ensemble, ils n’indiquent pas la présence d’une
0,058 (0,068) 0,067 (0,287) 0,099 (0,294)
1
spécification inadaptée.
b1(1) 0,075 (0,027) 0,37 (0,155) 0,28 (0,209)
c1(1) -0,031 (0,074) -0,04 (0,211) 0,068 (0,074) Les trois modèles estimés ne sont pas indépendants
d1(1) 0,897 (0,029) 0,652 (0,184) 0,735 (0,087) les uns des autres. Ainsi, le modèle 2 représente la
a1( 2 ) _ _ 0,077 (0,074) 0,089 (0,074)
formulation la plus générale, contrairement au
(2)
modèle 1 qui est la représentation la plus restrictive.
b _ _ -0,002 (0,023) -0,005 (0,087)
1 Il convient alors de tester quels sont les paramètres
c1( 2 ) ) _ _ -0,028 (0,089) -0,043 (0,023) qui peuvent être considérés constants sur les deux
d1( 2 ) _ _ 0,959 (0,026) 0,961 (0,025) régimes. Pour ce faire, nous reportons à la dernière
σ11(1) 0,666 (0,032) 1,689 (1,146) 1,816 (0,693)
ligne du tableau 1 le résultat d’un test du rapport de
vraisemblance (“ test RV ”). Il consiste en un test de
σ12(1) -0,595 (0,04) -1,578 (1,107) -1,695 (0,503)
chaque spécification par rapport au modèle 2 et la
σ(221) 0,412 (0,02) 2,012 (1,076) 2,111 (0,493) statistique calculée suit une loi du χ 2 , où le nombre
σ11( 2 ) _ _ 0,086 (0,008) 0,085 (0,009) de degrés de liberté et la probabilité marginale
σ12( 2 ) _ _ -0,069 (0,01) -0,067 (0,009) associée sont reportés entre parenthèses. Le résultat
σ(222) _ _ 0,148 (0,015) 0,145 (0,014) de ce test souligne l’utilité du modèle 2 relativement
p _ _ 0,867 (0,061) 0,864 (0,06)
au modèle 1, mais identifie aussi la spécification 3
q _ _ 0,979 (0,012) 0,977 (0,013)
comme étant la plus adaptée (7). Par conséquent, sur
la base de l’ensemble des tests conduits jusqu’à
Note : les écart-types sont reportés dans les colonnes F(.). présent, l’utilité de l’introduction d’un second
régime pour l’examen de la dynamique du vecteur
autorégressif bivarié sur l’échantillon étudié est
périodes. Ces tests suivent une loi du χ 2 à six degrés avérée. De plus, il semblerait que la prime de risque
de liberté. Les probabilités marginales associées à puisse être considérée constante sur les deux
l’hypothèse nulle d’absence de ces phénomènes sont régimes.
indiquées dans la colonne “ Prob ”. Les résultats de la
première ligne correspondent à l’équation du taux
court en différences premières et ceux de la seconde à
l’équation du spread de taux. Le rejet de l’hypothèse Tableau 4 : statistiques de test
nulle intervient pour 3 des 4 tests, ce qui constitue
une limite importante de cette spécification(6). Nous Modèle 1 Modèle 2 Modèle 3
reportons aussi trois tests de spécification dans le Wald 6,750 2,375 0,782
cadre des modèles à chaîne de Markov pour tester la (0,034) (0,667) (0,941)
présence éventuelle d’autocorrélation et γ S ', S 0,818 1,083 0,912
d’hétéroscédasticité des résidus, ainsi que pour (0,040) (0,002) (0,011)
tester l’hypothèse d’indépendance du processus à ρS ' , S 0,997 0,984 0,986
(0,003 / 0 / 0,080) (0,029 / 0 / 0) (0,009 / 0 / 0)
Tableau 3 : tests de spécification σS 1,476 1,476 1,476
σS ' 1,209 1,629 1,365
Modèle 1 Modèle 2 Modèle 3 σS / σS ' 1,220 0,908 1,081
Stat. Prob. Stat. Prob. Stat. Prob. (0,205 / 0 / 0,186) (0,790 / 0 / 0) (0,634 / 0 / 0)
Autoc. 5,166 (0,523) 1,035 (0,390) 0,572 (0,683) σS − S ' 0,282 0,318 0,264
12,918 (0,044) 1,002 (0,408) 1,671 (0,158)
Arch 20,961 (0,002) 3,780 (0,005) 3,989 (0,004)
18,086 (0,006) 1,598 (0,176) 0,877 (0,479) Note : Les écart-types sont indiqués entre parenthèses. Pour le
coefficient de corrélation et le rapport des écart-types, le premier
Markov _ _ 1,512 (0,200) 1,320 (0,264) chiffre est l’écart-type asymptotique calculé par la méthode delta. Les
_ _ 1,697 (0,152) 0,627 (0,644) deux suivants sont issus de simulations de Monte Carlo. Le premier
indique la proportion de 1000 simulations où la différence entre le
coefficient obtenu et un est supérieure à ce qui est observé. Le second
Note : Les tests de l’autocorrélation et de l’hétéroscédasticité sont reporte la proportion où cette différence, divisée par l’écart type
effectués à partir des statistiques Ljung-Box et LM. Elles sont asymptotique de la statistique, est supérieure à ce qui observé.
distribuées selon une loi du χ 2 à six degrés de liberté. Les tests de
spécification pour les modèles à chaîne de Markov sont des tests de
Fisher proposés par Hamilton (1996). Les probabilités marginales
associées à l’hypothèse nulle d’absence de ces phénomènes sont
indiquées entre parenthèses.

123
Graphique 1 : évolution des spreads observé et
Le test de la théorie des anticipations théorique
rationnelles
3

De manière similaire à Gerlach (1996), l’étude de la 1


pertinence de la théorie va s’effectuer à partir de trois
types d’approches que sont l’analyse graphique, le
0

test des restrictions qu’elle implique à partir des -1

statistiques de Wald et l’analyse économique. Cette -2

dernière regroupe notamment l’examen des


Spread observé
-3 Spread théorique

coefficients de corrélation et du rapport des -4


écart-types. La combinaison de ces critères, plutôt
que le simple recours à une statistique unique, -5

devrait permettre de porter un jugement plus robuste -6


1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
sur la pertinence du cadre d’analyse proposé par la
théorie des anticipations rationnelles.
3

La construction des spreads théoriques est effectuée 2

à partir de l’équation (7) pour le modèle 1 et de 1

l’équation (15) pour les modèles 2 et 3. À ce stade de 0

l’analyse, il faut remarquer que les résultats ne -1

dépendent que des valeurs estimées pour les -2

coefficients de la partie autorégressive des trois -3

modèles utilisés et de la matrice des probabilités de -4


Spread observé

transition (14), ce qui rend les résultats très sensibles


Spread théorique

-5
à la qualité d’estimation de ces paramètres et justifie
l’analyse comparative que nous poursuivons dans
-6

cette étude. L’évolution du spread observé par -7


1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998

rapport aux trois spreads théoriques construits est


alors représentée sur le graphique 1. L’emploi des 3
trois modèles conduit à une correspondance
satisfaisante entre les spreads théorique et observé, 2

même si la qualité de la prévision apparaît supérieure 1

pour le modèle 3. 0

-1
Le test des restrictions sur les paramètres des
modèles VAR linéaire et à chaîne de Markov est
-2
Spread observé
Spread théorique
effectué à partir de la statistique de Wald, qui -3

présente l’avantage de nécessiter uniquement -4

l’estimation des modèles non contraints. Sous -5

l’hypothèse nulle, et en posant θ le vecteur des -6


“ véritables ” valeurs des paramètres, de dimension 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998

(d×1), et θ$ l’estimation de ces paramètres par


maximum de vraisemblance, nous avons : par (17) pour les modèles à chaîne de Markov. Pour
ces derniers, la matrice des variances - covariances
(23) T (θ$ − θ ) 
d → N d (0,Σ θ ) est calculée à partir des scores conditionnels. La loi
asymptotique suivie est un χ 2 à r degrés de liberté.
Soit g (θ ) =0, le vecteur des restrictions sur θ de Pour les modèles à un seul régime, nous avons ainsi
dimension (r×1). La matrice G(θ) de dimension (r×d) une loi du χ 2 à 2p degrés de libertés. Pour les
peut s’écrire : modèles à changement de régime 2 et 3, le nombre
∂g ( θ ) des degrés de liberté est de 2pq.
(24) G (θ ) =
∂θ ' Les résultats du test de Wald sont reportés dans le
tableau 4. La valeur indiquée entre parenthèses est la
Sous ces conditions, le test de Wald est de la forme : probabilité marginale associée à l’hypothèse nulle.
Comme nous pouvons le constater, l’hypothèse nulle
(25) W = g (θ$ )'[G (θ$ ) Σ θ$ G (θ$ )]' −1 g (θ$ ) ~ χ 2 ( r ) n’est pas rejetée pour les deux modèles à chaîne de
Markov, et l’est au seuil de 5% pour le modèle 1. De
avec H 0 : g (θ ) = 0. Le vecteur des restrictions est plus, une nouvelle fois les résultats les plus
donné par l’équation (8) pour le modèle linéaire et favorables à la théorie sont obtenus à partir du
modèle 2.

124
L’analyse économique est conduite à partir de quatre cette caractéristique disparaît pour le modèle 2). Ce
statistiques reportées dans le tableau 4. La statistique phénomène souvent observé à partir de l’estimation
γ S ', S indique la valeur du coefficient de pente de la de modèles à un seul régime (voir Froot (1989) par
régression du spread théorique sur le spread observé exemple) renvoi à l’explication avancée notamment
et σ S − S ' l’écart type de la différence entre les deux par Campbell et Shiller (1984, 1991) et Hardouvelis
spreads. Les coefficients de corrélation entre les (1994). Dans ce cas, le taux long semble sur-réagir
deux spreads, notés ρ S ', S , ainsi que les rapports des aux fluctuations anticipées du taux court durant sa
écart types, σ S / σ S ' , sont aussi reportés. Pour durée de vie et sous-réagir aux mouvements du taux
l’ensemble de ces statistiques, la validité de la court actuel. En effet, Campbell et Shiller (1991)
théorie des anticipations rationnelles impose une notent que le spread dépend d’une distribution des
valeur de un. Les chiffres entre parenthèses sont les retards des taux courts passés et présent, avec un
écart-types associés. En ce qui concerne le poids négatif pour ce dernier et des poids positifs
coefficient de corrélation ainsi que le rapport des pour les premiers, distribution pour laquelle
écart-types, le premier chiffre correspond à l’ensemble des pondérations s’annule.
l’écart-type asymptotique obtenu par la méthode L’observation d’une sur-réaction du spread observé,
delta et les deux suivants à deux expérimentations de par rapport aux enseignements de la théorie des
Monte-Carlo selon l’approche développée par anticipations rationnelles, est donc le signal d’un
Campbell et Shiller (1991). Le premier indique la poids insuffisant accordé au taux court présent et de
proportion de 1000 simulations pour laquelle la poids excessifs attribués aux taux courts passés.
statistique obtenue est plus éloignée de l’unité, dans Ainsi, le taux long sous-réagit au niveau présent du
la même direction, que la statistique obtenue. La taux court (9). L’utilisation de modèles à deux états,
seconde correspond à un test symétrique où nous permet ainsi, dans le cas français, de corriger ce
indiquons la proportion des simulations pour phénomène et d’obtenir une meilleure
laquelle cet écart, divisé par l’écart type représentation des anticipations des agents,
asymptotique calculé, est supérieur à ce qui est favorisant ainsi l’hypothèse de rationalité des
observé dans la réalité (8). Pour l’ensemble de ces anticipations.
statistiques, les résultats les plus favorables sont
obtenus pour le modèle 3 et permettent de valider la En résumé, les trois modèles estimés démontrent que
théorie des anticipations rationnelles. Mais des les fluctuations des taux d’intérêt de long terme sont
résultats en faveur de la théorie sont aussi observés expliquées principalement par les anticipations des
pour les modèles 1 et 2. Et même si nous constatons agents concernant les mouvements à venir du taux
toujours une sur-réaction du spread observé au court. Plus généralement, la similitude importante
comportement prédit par la théorie pour les modèles des résultats obtenus pour les différents tests
1 et 3, comme les valeurs supérieures à l’unité du conduits constitue une validation importante de la
rapport des écart-types en témoignent, ce théorie des anticipations, même s’il est nécessaire
phénomène souvent constaté dans la littérature est ici d’utiliser des modèles à chaîne de Markov pour
faiblement présent par son ampleur. De plus, même obtenir une validation statistique. En effet,
si l’écart type asymptotique semble sous-évaluer l’avantage de ces derniers consiste en une meilleure
légèrement l’incertitude pour le modèle 1, ce n’est prise en compte de la dynamique des séries intégrées
plus le cas pour les modèles à chaîne de Markov. dans le VAR, comme en témoignent les résultats des
tests de spécification du tableau 3.
Trois conclusions peuvent ainsi être formulées à
partir du test de la théorie des anticipations. En
premier lieu, l’emploi des modèles à chaîne de
Markov s’accompagne d’une meilleure validation
statistique de la théorie. Mais pour l’ensemble des
Analyse statistique des changements de
modèles, les anticipations concernant le taux court à régime et interprétation économique
venir représentent le principal facteur de
détermination du taux d’intérêt de long terme. Ainsi, Les résultats de la section précédente indiquent que
nous retrouvons les conclusions positives de le modèle 3 est celui qui retrace le plus fidèlement la
Colletaz et Gourlaouen (1990). Ce résultat peut dynamique du vecteur z t . C’est la raison pour
s’expliquer aussi en partie par la qualité des séries laquelle nous nous basons sur cette spécification
utilisées. Deuxièmement, la comparaison des pour la suite de l’analyse. Cependant, le découpage
performances obtenues par les modèles 2 et 3 révèle obtenu apparaît robuste puisqu’il est identique à
la présence de changements dans la dynamique celui observé pour le modèle 2 (10) . Ainsi, le
stochastique des taux d’intérêt non liés à l’existence graphique 2 reporte la probabilité lissée, c’est-à-dire
d’une prime de risque variable dans le temps. En estimée à partir de l’information disponible sur
effet, cette dernière semble constante sur les deux l’ensemble de la période, d’occurrence de l’état 1.
régimes. Troisièmement, nous ne constatons qu’une Cet état se caractérise par le degré d’incertitude le
sur-réaction d’ampleur nettement plus limitée du plus important. La question qui nous intéresse ici est
spread observé par rapport à l’évolution prédite par alors de savoir s’il existe une correspondance entre le
la théorie, pour le modèle 3 à chaîne de Markov (et découpage statistique de la période produit par le

125
modèle à chaîne de Markov et une quelconque l’incertitude au niveau de la dynamique des taux
information économique. En d’autres termes, nous d’intérêt s’explique par le change. Ainsi le 30 janvier
vérifions si les non linéarités constatées dans la 1993, la livre irlandaise est dévaluée de 10%, suivie
dynamique des taux d’intérêt coïncident avec des en cela par la peseta le 14 mai, avec une dévaluation
épisodes économiques clairement identifiés. de 8%. Les tensions perdurent alors jusqu’à la
décision prise le 2 août d’élargir les marges de
Graphique 2 : modèle 3. Prob ( s t = 1) fluctuations de ±2,25% à ±15% (à l’exception du
cours deutschemark - florin). Cet accord met fin aux
tensions sur les marchés de change et correspond
Probabilité
1,0
aussi à une réapparition du régime 2 pour la seconde
0,9
moitié de l’année, marquée par une détente des taux
0,8
d’intérêt (le taux d’escompte allemand diminue d’un
0,7
point à 5,75% entre le premier juillet et le 21
octobre). Cependant, l’accalmie n’est que de courte
durée, ce qui explique le retour du régime 1. L’année
0,6

0,5
1995 voit ainsi le remplacement des pensions à 5 et
0,4
10 jours par des pensions à 24 heures à deux reprises :
0,3
entre le 8 mars et le 21 juin et entre le 4 octobre et le 9
0,2
novembre. Par contre, depuis le second trimestre
0,1 1996, la présence ininterrompue du régime 2
0,0 témoigne de la relative quiétude de la période et
1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
d’une préparation réussie au passage à l’euro.

Entre le mois de mars 1981 et la fin de l’année 1998,


soit 214 observations, le régime 1 apparaît 35 mois
au cours de quatre épisodes, deux sur chaque Conclusion
décennie, avec un cumul de 21 mois entre 1981 et la
fin de l’année 1989. De plus, seulement deux de ces
périodes d’instabilité dépassent une durée de quatre Les résultats de cette étude sont de trois ordres. En
mois ( 11 ) . Ainsi, la période étudiée apparaît premier lieu, l’emploi des modèles à chaîne de
relativement stable quant à la dynamique des taux Markov s’accompagne d’une meilleure validation
d’intérêt puisque le régime 1 ne représente que statistique de la théorie des anticipations rationnelles
16,36% de la période. Cette domination importante pour la France entre 1981 et 1998. Nous avons ainsi
du régime 2 explique aussi la relative bonne montré que le modèle 3 était la représentation la plus
performance du modèle 1 qui présuppose l’absence adaptée et conduisait à une acceptation statistique de
de changements de régime. la théorie. Nous soulignons ainsi la dépendance de la
méthodologie de test proposée par Campbell et
Le premier épisode débute avec cette étude et se Shiller (1987, 1991) au modèle statistique employé
poursuit jusqu’au mois de juillet 1982. Cette période pour représenter la rationalité des anticipations,
est marquée par une succession de trois même si les disparités constatées entre les différentes
réalignements des cours pivots du SME concernant spécifications utilisées sont inférieures à ce qui est
le franc, le 5 octobre 1981, le 14 juin 1982 et le 21 observé aux États-Unis par exemple. De plus, les
mars 1983 (12). La seconde apparition du régime 1 trois modèles soulignent le rôle premier des
coïncide avec le krach financier d’octobre 1987. anticipations concernant le taux d’intérêt de court
Ainsi, d’octobre à décembre, cet état de forte terme à venir dans la dynamique du taux d’intérêt à
incertitude domine. Mais des tensions sont apparues dix ans en France. Ce constat conduit au second
pendant l’été, ce qui est aussi détectée par les résultat, à savoir la présence de non linéarités dans la
modèles à chaîne de Markov, puisque la probabilité dynamique stochastique des taux d’intérêt, qui
associée à l’occurrence du régime 1 est de 20% puis interfèrent au niveau de la relation entre les taux à un
de 28% en juillet et en août. mois et dix ans. Ce phénomène explique la qualité
supérieure des estimations obtenues à partir des
La première moitié de la décennie quatre vingt dix modèles à chaîne de Markov relativement au modèle
concentre les deux derniers épisodes de résurgence 1 à un seul régime, soulignant ainsi l’utilité des
de l’incertitude, toujours en relation avec les crises premiers. Finalement, une interprétation
de change du Système Monétaire Européen. Il s’agit économique des changements de régime a mis en
tout d’abord d’une période de 12 mois entre octobre évidence l’influence exercée par l’évolution du
1992 et septembre 1993 (mais la probabilité du cours de change entre le franc et le deutschemark sur
régime 1 est de 29% dès le mois de septembre 1992). les non linéarités constatées dans la dynamique des
Un tel phénomène se retrouve d’ailleurs au niveau taux français. L’influence de la politique monétaire
des structures par terme allemande et suisse (13). La et des éventuels changements dans sa mise en oeuvre
dernière apparition du régime 1 a alors lieu au cours n’exerce ainsi aucun rôle significatif dans le
des mois de mars et d’avril 1995. Une nouvelle fois, découpage de la période en deux régimes distincts.

126
Cette situation contraste avec ce qui est observé aux
États-Unis et, dans une moindre mesure, en Notes
Allemagne. Elle confirme aussi les conclusions de
Gerlach et Smets (1998), selon lesquelles la
prévision des taux d’intérêt est facilitée pour les pays (1) Cette hypothèse est cohérente avec les données utilisées
appartenant à un système de change fixe dont la dans cette étude puisque les taux d’intérêt de court et de long
monnaie bénéficie d’un cours d’ancrage. Ce dernier terme sont respectivement de 1 mois et 10 ans, ce qui
effet compense ainsi une éventuelle diminution de la correspond à un taux long (et un horizon de prévision pour le
prévisibilité des taux d’intérêt provoquée par une cheminement du taux court) de 120 périodes.
politique monétaire nationale discrétionnaire visant (2) Ce modèle se distingue de celui proposé par Hamilton
à lisser les fluctuations des taux d’intérêt. Ce résultat (1988, 1989, 1990) au niveau de la dynamique de Zt .
se traduit alors par une meilleure validation Cependant, le modèle de Warne facilite l’estimation du VAR
statistique de la théorie des anticipations et présente la particularité que tous les coefficients dépendent
rationnelles. du régime actuel alors que le modèle de Hamilton est
asymétrique au sens où il intègre simultanément des
coefficients correspondant aux régimes présent et passés.
Warne (1996) note toutefois qu’il n’est pas possible de
hiérarchiser ces modèles d’un point de vue économique.
(3) Étant donné l’échéance éloignée du taux d’intérêt de long
terme (120 mois), nous ne pouvons pas utiliser l’expression du
spread théorique développée par Kugler (1996) pour la
relation entre les taux à un et trois mois.
(4) Les données pour le marché monétaire ne sont disponibles
qu’à partir de cette date sur Datastream.
(5) Les estimations sont conduites à partir du programme
Gauss d’Anders Warne (1996), par la méthode du maximum
de vraisemblance et à l’aide de l’algorithme EM, développé
initialement par Dempster et alii (1977). Six combinaisons de
valeurs de départ ont été utilisées pour l’estimation des
modèles à chaîne de Markov.
(6) L’ajout de plusieurs retards n’a pas permis d’obtenir une
spécification validant l’hypothèse de normalité des résidus. En
particulier, ces tests révèlent la présence d’hétéroscédasticité
dans l’équation du taux court (présence qui demeure, à un
degré moindre cependant, pour les modèles 2 et 3).
(7) Une limite à ce test vient du fait que l’hypothèse de
normalité des résidus est rejetée pour le modèle 1.
(8) Voir Campbell et Shiller (1991), pp. 509-510.
(9) Comme Hardouvelis (1994) le remarque, cette explication
suppose la constance de la prime de terme dans le temps mais la
violation de l’hypothèse de rationalité des agents. Cette
sur-réaction peut aussi valider l’hypothèse d’une asymétrie
d’information entre le public et la Banque centrale sur la
conduite de la politique monétaire, comme Romer et Romer
(1989) l’ont formulée pour les États-Unis. Dans ce cadre, toute
annonce de la Réserve Fédérale est supposée révéler aux
marchés une information qu’ils ne connaissaient pas. Elle
provoque alors un mouvement du taux long, dirigé par les
anticipations, supérieur à l’amplitude prévue par la théorie des
anticipations rationnelles. Ce type de comportement a
d’ailleurs été démontré pour les États-Unis par Cook et Hahn
(1989), Peek et alii (1998) et Kuttner (2000) notamment.

127
(10) De plus, un découpage presque similaire a été obtenu à
partir de données trimestrielles et d’une relation entre le taux à Bibliographie
trois mois et à dix ans. La seule différence consiste en la
classification des années 1985 et 1986 parmi les périodes à
risque (cela en raison de deux réalignements du franc, le 22 Ang A. et Bekaert G. (2002). “Regime Switches in Interest
juillet 1985 et le 7 avril 1986, ainsi que de la dévaluation de la Rates”, Journal of Business and Economic Statistics, vol. 20,
livre irlandaise de 8% le 4 août 1986, et des réalignements qui n° 2, pp. 163-182
ont eu lieu concernant le deutschemark, le florin et les francs Ang A. et Bekaert G. (2002). “International Asset Allocation
luxembourgeois et belge le 12 janvier 1987). Les modèles 2 et With Time-Varying Correlations”, Review of Financial
3 détectent bien cette incertitude, mais estiment son ampleur Studies, vol. 15, n° 4, pp. 1137-1187.
plus limitée. De plus, à partir des données trimestrielles, une
Blix M. (1997a). “Rational Expectations in a VAR with
courte période d’incertitude de deux trimestres apparaît
Markov Switching”, Working Paper Series, n° 42, Sveriges
immédiatement après la réunification allemande. Ces légères
Riksbank.
différences s’expliquent en partie par l’utilisation d’un taux à
trois mois sélectionné à la fin de chaque trimestre, Blix M. (1997b). “Term Premia Under Switching Regimes”,
contrairement aux données mensuelles utilisées, ce qui conduit mimeo, Institute for International Economic Studies, Stockolm
à un lissage des fluctuations des taux d’intérêt. University.
(11) L’échantillon couvre 216 mois, mais les deux premières Bourguinat H. (1997). Finance Internationale, éd. 3, Presses
données sont utilisées pour construire la série du taux court en Universitaires de France.
différence première, ainsi que pour estimer chaque VAR avec Campbell J.Y. et Shiller R.J. (1984). “A Simple Account of
un retard. the Behavior of Long-Term Interest Rates”, American
(12) Les dates des différents réalignements au sein du Système Economic Review Papers and Proceedings, vol. 74, n° 2, pp.
Monétaire Européen entre 1979 et 1990 sont présentes dans 44-48.
Bourguinat (1997), p. 604. Campbell J.Y. et Shiller R.J. (1987). “Cointegration and
(13) Ces épisodes sont détaillés dans Rautureau (2001). Tests of Present Value Models”, Journal of Political Economy,
vol. 95, n° 5, pp. 1062-1088.
Campbell J.Y. et Shiller R.J. (1991). “Yield Spreads and
Interest Rate Movements: a Bird’s Eye View”, Review of
Economic Studies, vol. 58, pp. 495-514.
Chesnay F. et Jondeau E. (2001). “Does Correlation Between
Stock Returns Really Increase During Turbulent Periods?”,
Economic Notes, vol. 30, n° 1, pp. 53-80.
Colletaz G. et Gourlaouen J.P. (1990). “Coïntégration et
structure par terme des taux d’intérêt”, Revue Economique, n°
4, pp. 687-712.
Cook T. et Hahn T. (1989). “Interest Rate Expectations and
the Slope of the Money Market Yield Curve”, Review of the
Federal Reserve Bank of Richmond, vol. 76/5, pp. 3-26.
Cuthbertson K., Hayes S. et Nitzsche D. (2000). “Are
German Money Market Rates Well Behaved”, Journal of
Economic Dynamics and Control, vol. 24, pp. 347-360.
Dempster A.P., Laird N.M. et Rubin D.B. (1977).
“Maximum Likelihood from Incomplete Data Via the EM
Algorithm”, Journal of the Royal Statistical Society. Series B,
vol. 39, pp.1-38.
Driffill J. (1992). “Changes in Regime and the Term
Structure”, Journal of Economic Dynamics and Control, vol.
16, pp. 165-173.
Evans M.D.D. et Lewis K.K. (1994). “Do Stationary Risk
Premia Explain it all? Evidence from the Term Structure”,
Journal of Monetary Economics, vol. 33, pp. 285-318.
Froot K.A. (1989). “New Hope for the Expectations
Hypothesis of the Term Structure of Interest Rates”, Journal of
Finance, vol. 44, pp. 283-305.
Gerlach S. (1996). “Monetary Policy and the Behavior of
interest Rates: are Long Rates Excessively Volatile?”,
Working Paper, n° 34, BIS.

128
Gerlach S. et Smets F. (1997). “The Term Structure of Kuttner K.N. (2001). “Monetary Policy Surprises and
Euro-Rates: Some Evidence in Support of the expectations Interest Rates: Evidence from the Fed Funds Futures
Hypothesis”, Journal of International Money and Finance, Markets”, Journal of Monetary Economics, vol. 47, n° 3, pp.
vol. 16, n° 2, pp. 305-321. 523-544.
Gerlach S. et Smets F. (1998). “Exchange Rate Regimes and Mankiw N.G. et Miron J.A. (1986). “The Changing
the Expectations Hypothesis of the Term Structure”, in Behavior of the Term Structure of Interest Rates”, Quarterly
Monetary policy and interest rates, pp. 11-36. Journal of Economics, vol. 101, pp. 211-228.
Hamilton J.D. (1988). “Rational-Expectations Econometric Peek J., Rosengren E.S. et Tootell G.M.B. (2003). “Does the
Analysis of Changes in Regime. An Investigation of the Term Federal Reserve Have an Informational Advantage? you can
Structure of Interest Rates”, Journal of Economic Dynamics bank on it.”, Journal of Monetary Economics, vol. 50, n° 4, pp.
and Control, vol. 12, pp. 385-423. 817-83.
Hamilton J.D. (1989). “A New Approach to the Economic Rautureau N. (2001). La théorie des anticipations de la
Analysis of Nonstationarity Time Series and the Business structure par terme des taux d’intérêt et la politique
Cycle”, Econometrica, vol. 57, n° 2, pp. 357-84. monétaire, thèse de doctorat, Université Montesquieu
Hamilton J.D. (1994). Time Series Analysis, Princeton Bordeaux IV.
University Press, Princeton N.J. Rautureau N. (2002). “Dynamique des taux monétaires et
Hamilton J.D. (1996). “Specification Testing in création de la Banque Centrale Européenne - Une analyse
Markov-Switching Time-Series Models”, Journal of fondée sur la théorie des anticipations de la structure par
Econometrics, vol. 70, pp. 127-157. terme”, document de travail, GRAPE.

Hansen B.E. (1992). “The Likelihood Ratio Test Under Romer C.D et Romer D.H. (1989). “Does Monetary Policy
Nonstandard Conditions: Testing the Markov Switching Matter? a New Test in the Spirit of Friedman and Schwartz”,
Model of GNP”, Journal of Applied Econometrics, vol. 7, pp. NBER Macroeconomics Annual, pp. 121-183.
61-82. Sola M. et Driffill J. (1994). “Testing the Term Structure of
Hardouvelis G.A. (1994). “The Term Structure Spread and Interest Rates Using a Stationary Vector Autoregression with
Future Changes in Long and Short Rates in the G7 Countries”, Regime Switching”, Journal of Economic Dynamics and
Journal of Monetary Economics, vol. 33, pp. 255-283. Control, vol. 18, pp. 601-28.

Huizinga J. et Mishkin F.S. (1986). “Monetary Policy Sutton G.D. (2000). “Is there Excess Comovement of bond
Regime Shifts and the Unusual Behavior of Real Interest Yields Between Countries?”, Journal of International Money
Rates”, Carnegie-Rochester Conference Series on Public and Finance, vol.19, n° 3, pp. 363-376.
Policy, vol. 24, pp. 231-274. Sutton G.D. (1998). “Spread Overreaction in International
Jondeau E. (1998). “Représentation VAR et test de la théorie Bond Markets”, Working Papers, n° 55, BIS.
des anticipations de la structure par terme”, Journal de la Sutton G.D. (2000). “A Defence of the Expectations Theory
Société de Statistique de Paris, n° 1, tome 139, pp. 49-71. as a Model of US Long-Term Interest Rates”, Working
Jondeau E. (2001). “La théorie des anticipations de la Papers, n° 85, BIS.
structure par terme permet-elle de rendre compte de Warne A. (1996). “Autocovariance Functions and Maximum
l’évolution des taux d’intérêt sur euro-devise ?”, Annales Likelihood in a VAR Model Under Markov Switching”,
d’Economie et de Statistique, n° 62, pp. 139-174. mimeo, Institute for International Economic Studies,
Jondeau E. et Ricart R. (1998). “La théorie des anticipations Stockolm University.
de la structure par terme : test à partir des titres publics
français”, Annales d’Economie et de Statistique, vol. 52, pp.
1-22.
Jondeau E. et Ricart R. (1999a). “Le contenu en information
de la pente des taux : application au cas des titres publics
français”, Économie et Prévision, n° 140-141, pp.1-20.
Jondeau E. et Ricart R. (1999b). “The Expectations
Hypothesis of the Term Structure: Tests on the US, German,
French and UK Euro-rates”, Journal of International Money
and Finance, vol. 18, pp. 725-50.
Jondeau E. et Ricart R. (1999c). “The Information Content
of the French and German Government Bond Yield Curves :
Why Such Differences”, Notes d’Etudes et de Recherche,
n° 61, Banque de France.
Kugler P. (1990). “The Term Structure of Euro Interest Rates
and Rational Expectations”, Journal of International Money
and Finance, vol. 9, n° 2, pp. 234-244.
Kugler P. (1996). “The Term Structure of interest Rates and
Regime Shifts: Some Empirical Results”, Economics Letters,
vol. 50, pp. 121-26.

129