Vous êtes sur la page 1sur 12

Corrigé

 de  l’examen  d’avril  2014  (fichier  “Partiel_v0.pdf”)  


 
Exercice  1.    
 
1.  Le  R2  (coefficient  de  détermination)  est  très  élevé,  au-­‐dessus  de  0,99  (il  convient  de  
regarder  ici  le  R2  ajusté,  car  un  modèle  AR(4)  correspond  évidemment  à  une  régression  
linéaire  multiple).  L’ajustement  linéaire  du  modèle  est  très  bon,  la  variable  est  presque  
parfaitement  «  expliquée  »  par  /  corrélée  à  ses  quatre  premiers  retards.  
 
Avec  une  p-­‐valeur  inférieure  à  2,2  x  10-­‐16,  le  test  de  Fisher  est  très  significatif.  On  rejette  
donc   au   seuil   de   1‰   l’hypothèse   nulle   que   les   coefficient   associés   au   quatre   premiers  
retards  sont  tous  nuls.  L’un  d’eux  au  moins  est  non  nul.  
 
En   regardant   les   coefficients,   on   vérifie   en   effet   que   les   deux   premiers   retards   ont   un  
effet   significatif   au   seuil   de   1‰,   le   premier   coefficient   étant   égal   à   2,20   et   le   second  
à  -­‐1,59.  Les  troisième  et  quatrième  retards  n’ont  pas  d’effet  sur  la  variable.  
 
L’écart-­‐type  des  résidus  est  calculé  sur  34  degrés  de  libertés,  et  le  test  de  Fisher  a  4  et  34  
degrés   de   liberté.   L’estimation   a   donc   porté   sur   39   observations   (34   d.l.   +   4   d.l.  
«  perdus  »  pour  les  coefficients  des  retards  +  1  d.l.  «  perdu  »  pour  la  constante).  Comme  
le   modèle   AR(4)   utilise   4   retards,   on   perd,   de   surcroit,   4   observations   par   rapport   à  
l’échantillon  de  départ,  qui  en  comptait  donc  39  +  4  =  43.  
 
2.   Il   s’agit   d’un   test   de   Durbin-­‐Watson,   qui   teste   l’hypothèse   nulle   H0   d’absence  
d’autocorrélation   des   résidus   du   modèle   AR(4)   contre   l’hypothèse   alternative   H1   que  
l’autocorrélation  des  résidus  est  non-­‐nulle.  
 
Ici,  le  prévisionniste  a  commis  une  erreur  en  utilisant  ce  test,  qui  est  invalide  pour  une  
régression   linéaire   comportant   des   variables   dépendantes   retardées,   et   a  fortiori   pour  
un  modèle  autorégressif.  
 
3.  Les  deux  réponses  suivantes  (A  et  B)  étaient  acceptées  :  
 
A.     Le   prévisionniste   aurait   pu   faire   un   test   de   Breusch-­‐Godfrey,   qui   teste   également  
l’autocorrélation   du   terme   d’erreur   du   modèle   mais   qui,   contrairement   au   Durbin-­‐
Watson,   est   valide   pour   un   modèle   autorégressif.   Si   le   test   conclut   que   le   terme   d’erreur  
est  autocorrélé,  on  peut  en  pratique  faire  disparaître  en  jouant  sur  le  nombre  de  retards  
du  modèle,  par  ex.  en  passant  d’un  AR(4)  à  un  AR(5)  ou  AR(6).  
 
B.   Le   prévisionniste   aurait   pu   faire   un   test   de   White   ou   de   Breusch-­‐Pagan   pour   tester  
l’hypothèse  nulle  d’homoscédasticité  (variance  constante  du  terme  d’erreur  du  modèle)  
contre  l’hypothèse  alternative  d’hétéroscédasticité  (déformation  de  la  variance  du  terme  
d’erreur  dans  le  temps).  Si  le  test  conclut  à  la  présence  d’hétéroscédasticité,  il  convient  
d’utiliser  la  formule  des  erreurs  standard  robustes  à  l’hétéroscédasticité.    
 
4.  Le  prévisionniste  pourrait  utiliser  le  «  pseudo  out-­‐of-­‐sample  forecast  ».  Cette  méthode  
consiste  à  estimer  le  modèle  sur  un  sous-­‐échantillon  des  données  allant  jusqu’à  la  date  S  
au  lieu  de  la  date  T    (avec  S  <  T).  Avec  cette  estimation,  on  peut  faire  une  prévision  sur  la  
valeur   de   la   variable   à   la   date   S+1,   prévision   que   l’on   peut   comparer   avec   la   valeur  
réellement  observée  dans  l’échantillon  à  cette  date  afin  de  calculer  l’erreur  de  prévision.  
En   itérant   ce   processus   de   S+1   jusqu’à   T,   on   obtient   p   =   T   –   S   erreurs   de   prévisions   à  
partir   desquelles   on   peut   calculer   une   erreur   moyenne   de   prévision.   Cette   erreur  
moyenne   de   prévision   peut   permettre   de   comparer   différentes   spécifications   d’un  
modèle  (AR(4)  contre  AR(5)  par  exemple).  
 
Exercice  2.  
 
Il   s’agit   d’un   modèle   ADL(2,2),   c’est-­‐à-­‐dire   un   modèle   à   retards   échelonnés   avec,   pour  
variables  explicatives,  les  deux  premiers  retards  de  la  variable  dépendante  Yt  et  les  deux  
premiers  retards  d’une  autre  variable  Xt.  
 
Le  test  conduit  ici  est  un  test  de  causalité  de  Granger  visant  à  tester  si  les  deux  retards  
de  Xt  ont  un  pouvoir  explicatif  pour  prédire  Yt.  L’hypothèse  nulle  est  «  γ1  =  γ2  =  0  »  (pas  
de  pouvoir  explicatif)  et  l’hypothèse  alternative  est  qu’au  moins  un  des  deux  coefficients  
est  non  nul.  Le  test  est  significatif  au  seuil  de  5%,  l’hypothèse  nulle  est  rejetée  au  seuil  de  
5%  et  l’on  conclut  que  les  retards  de  Xt  expliquent  Yt  (au  sens  de  Granger).  

Exercice  3  

1.  Il  faudrait  que  la  variable  mesurant  les  fluctuations  boursières  soit  exogène  ou  
strictement  exogène  par  rapport  à  celle  mesurant  le  taux  de  crises  cardiaques  (c’est-­‐dire  
qu’il  n’y  ait  pas  de  facteurs  confondants  expliquant  les  deux  variables).  

2.  Le  modèle  serait  un  modèle  DL  à  l’ordre  p  :  

Yt  =β0  +β1Xt  +  β2Xt-­‐1  +  …  +  βp+1  Xt-­‐p  +  εt  

où  Yt  représente  le  taux  de  crises  cardiaques  et  Xt  la  variable  mesurant  les  fluctuations  
boursières.  Le  paramètre  β1  mesure  l’impact  de  Xt  sur  Yt  et  les  paramètres  β2  à  βp+1  sont  
les  multiplicateurs  dynamiques  mesurant  l’effet  des  retards  de  Xt.  

3. Il faut l’estimer en utilisant des erreurs standards HAC (robustes à l’autocorrélation et à


l’hétéroscédasticité).

Exercice  4  

1.  Ce  test  est  un  test  de  racine  unité  qui  permet  de  tester  la  stationnarité  des  variables  
Y1t   et   Y2t.   Pour   j  =   1,   2,   l’hypothèse   nulle   H0   est   «  Yjt   est   non   stationnaire  »   et   l’hypothèse  
alternative   H1   est   «  Yjt   est   stationnaire  ».   Ici,   pour   chaque   série,   la   p-­‐valeur   est  
supérieure   à   tous   les   seuils   de   significativité   conventionnels   et   on   ne   peut   donc   pas  
rejeter  l’hypothèse  nulle  de  non-­‐stationnarité.  On  conclut  donc  que  les  deux  séries  sont  
non-­‐stationnaires.  

2.   Cette   fois,   les   p-­‐valeurs   des   tests   de   Dickey-­‐Fuller   augmentés   sont   inférieures   au   seuil  
de   1%   pour   les   deux   séries.   On   rejette   donc,   pour   chaque   série   ΔYjt,   avec   j  =   1,   2,  
l’hypothèse   nulle   de   non-­‐stationnarité.   On   conclut   que   les   séries   différenciées   (en  
différences   premières)   sont   stationnaires,   alors   que   les   séries   elles-­‐mêmes   sont   non-­‐
stationnaires.  Cette  propriété  caractérise  des  séries  intégrées  à  l’ordre  1.  Les  séries  Y1t  et  
Y2t  sont  donc  toutes  deux  intégrées  à  l’ordre  1.    
3.   Le   statisticien   aurait   pu   utiliser   un   test   de   Dickey-­‐Fuller   par   les   MCG   (DF-­‐MCG).   Le  
principal   avantage   de   ce   test   est   qu’il   est   plus   puissant   que   le   test   de   Dickey-­‐Fuller  
augmenté.  

 
Corrigé  de  l’examen  de  mai  2015  (fichier  “Partiel_mai15.pdf”)  
 
Exercice  1.    
 
1.   Ce   test   (Dickey-­‐Fuller   augmenté)   est   un   test   de   racine   unité   qui   permet   de   tester   la  
stationnarité   de   la   variable   Yt.   L’hypothèse   nulle   H0   est   «  Yt   est   non   stationnaire  »   et  
l’hypothèse   alternative   H1   est   «  Yt   est   stationnaire  ».   Ici,   la   p-­‐valeur   du   test   est  
supérieure   à   tous   les   seuils   de   significativité   conventionnels   et   on   ne   peut   donc   pas  
rejeter   l’hypothèse   nulle   de   non-­‐stationnarité.   On   conclut   donc   que   la   série   Yt   est   non-­‐
stationnaire.  
Le   statisticien   aurait   pu   également   utiliser   un   test   de   Dickey-­‐Fuller   par   les   MCG   (DF-­‐
MCG).  Le  principal  avantage  de  ce  test  est  qu’il  est  plus  puissant  que  le  test  de  Dickey-­‐
Fuller  augmenté.  
 
2.   Le   R2   (coefficient   de   détermination)   est     assez   faible,   autour   de   0,27   (il   convient   de  
regarder   ici   le   R2   ajusté,   car   un   modèle   AR(3)   correspond   à   une   régression   linéaire  
multiple).   L’ajustement   linéaire   du   modèle   est   correct,   mais   sans   plus.   Il   est   à   noter   qu’il  
est   plus   difficile   d’établir   des   corrélations   sur   des   variables   mises   en   différences   que   sur  
des  variables  en  niveau.  
 
Avec   une   p-­‐valeur   à   3,6   x   10-­‐7,   le   test   de   Fisher   est   très   significatif.   On   rejette   donc   au  
seuil  de  1‰  l’hypothèse  nulle  que  les  coefficient  associés  au  trois  premiers  retards  de  la  
variable  dépendante  sont  tous  nuls.  L’un  d’eux  au  moins  est  non  nul.  
 
En   regardant   les   coefficients,   on   vérifie   en   effet   que   le   premier   retard   a   un   effet  
significatif   au   seuil   de   1‰,   le   premier   coefficient   étant   égal   à   0,47   environ.   Les   autres  
retards  n’ont  pas  d’effet  sur  la  variable.  
 
L’écart-­‐type  des  résidus  est  calculé  sur  96  degrés  de  libertés,  et  le  test  de  Fisher  a  3  et  96  
degrés   de   liberté.   L’estimation   a   donc   porté   sur   100   observations   (96   d.l.   +   3   d.l.  
«  perdus  »  pour  les  coefficients  des  retards  +  1  d.l.  «  perdu  »  pour  la  constante).  Comme  
le   modèle   AR(3)   utilise   3   retards,   on   perd,   de   surcroit,   3   observations   par   rapport   à  
l’échantillon  de  la  série  différenciée,  qui  comptait  donc  103  observations.  Enfin,  comme  
la  série  a  été  différenciée  avant  l’estimation,  on  a  perdu  une  observation  par  rapport  à  
l’échantillon  de  départ,  qui  en  comptait  donc  104.  
 
3.   Il   s’agit   d’un   test   d’hétéroscédasticité,   qui   permet   de   tester   l’hypothèse   nulle  
d’homoscédasticité   (variance   constante   du   terme   d’erreur   du   modèle)   contre  
l’hypothèse   alternative   d’hétéroscédasticité   (déformation   de   la   variance   du   terme  
d’erreur   dans   le   temps).   Comme   la   p-­‐valeur   du   test   est   inférieure   à   10%,   on   conclut   à   la  
présence   d’hétéroscédasticité.   Même   si   la   significativité   du   test   est   faible,   il   est   plus  
prudent  d’utiliser  la  formule  des  erreurs  standard  robustes  à  l’hétéroscédasticité.    
 
4.   Le   test   de   Breusch-­‐Godfrey   teste   l’autocorrélation   du   terme   d’erreur   du   modèle  
(hypothèse  nulle  H0  «  absence  d’autocorrélation  »,  hypothèse  alternative  H1  «  présence  
d’autocorrélation  »).   Ici,   la   p-­‐valeur   du   test   est   supérieure   à   tous   les   seuils   de  
significativité   conventionnels,   on   ne   peut   donc   pas   rejeter   l’hypothèse   nulle.   Le   test  
conclut   que   le   terme   d’erreur   n’est   pas   autocorrélé,   il   n’y   a   donc   aucune   mesure  
particulière  à  prendre  pour  améliorer  la  régression  réalisée.  
 
Exercice  2  
 
1.  La  relation  entre  dépenses  de  marketing  et  taille  de  l’entreprise  est  non-­‐linéaire,  car  la  
dérivée  de  Yit  par  rapport  à  Xit  dépend  de  Xit.  Plus  précisément,  on  a  :    

∂Yit  /  ∂Xit  =  β1_chapeau+  2.β2_chapeau  Xit  =  0.66  -­‐  0.36  Xit  

La   dérivée   de   Yit   par   rapport   à   Xit   est   donc   positive   pour   de   faibles   valeurs   de   Xit,   puis  
devient  négative  au-­‐delà  d’un  certain  seuil.  Autrement  dit,  Yit  croît  puis  décroit  avec  Xit.  
La  relation  entre  Yit  et  Xit  (entre  dépenses  de  marketing  et  taille  de  l’entreprise)  a  donc  la  
forme  d’une  parabole  «  en  U  inversé  ».  

2.   Le   modèle   (1)   a   visiblement   été   estimé   par   les   MCO,   estimateur   qui   ne   contrôle   pas  
pour  l’hétérogénéité  non  observée.  Il  serait  plus  judicieux  d’utiliser  l’estimateur  within,  
qui   contrôle   pour   l’hétérogénéité   non   observée   tout   en   restant   parcimonieux   dans   le  
nombre  de  paramètres  à  estimer.  On  le  trouve  ainsi  :    

On  commence  par  écrire  le  Modèle  (1)  comme    

(2)  Yit  =  β0  +  β1Xit  +  β2(Xit)  +  ui  +  vt  +  wit  en  posant  εit  =  ui  +  vt  +  wit  dans  le  modèle  (1).  
2

On  écrit  ensuite  la  relation  «  between  »  entre  les  moyennes  des  variables  dans  le  temps  

(3)  Yi•  =  β0  +  β1Xi•  +  β2(Xi•)  +  ui  +  v•  +  wi•  


2

On  obtient  la  transformation  within  en  retranchant  (3)  à  (2)  

(4)  Yit  -­‐  Yi•  =  β1(Xit  -­‐  Xi•)  +  β2(X2it  –  X2i•)  +  (vt  -­‐  v•)  +  (wit  -­‐  wi•)  

Le  terme  ui  (hétérogénéité  individuelle  non  observée)  disparaît  dans  la  différenciation,  
mais  les  coefficients  β1  et   β2  des  variables  d’intérêt  demeurent.  En  estimant  (4)  par  les  
MCO   (estimateur   dit   «  within  »),   on   estime   ces   coefficients   nets   de   l’hétérogénéité   non  
observée.  

Exercice  3  

1.  Ce  test  est  un  test  de  racine  unité  qui  permet  de  tester  la  stationnarité  de  la  variable  Yt  
avec   pour   hypothèse   nulle   H0   «  Yt   est   non   stationnaire  »   et   pour   hypothèse   alternative  
H1   «  Yt   est   stationnaire  ».   Ici,   la   p-­‐valeur   à   0,50   est   supérieure   à   tous   les   seuils   de  
significativité   conventionnels   et   on   ne   peut   donc   pas   rejeter   l’hypothèse   nulle   de   non-­‐
stationnarité.  On  conclut  donc  que  la  série  est  non-­‐stationnaire.  

2.  Cette  fois,  la  p-­‐valeur  du  test  de  Dickey-­‐Fuller  augmenté  est  inférieure  au  seuil  de  1%.  
On  rejette  donc,  pour  la  série  ΔYt,  l’hypothèse  nulle  de  non-­‐stationnarité.  On  conclut  que  
la  série  différenciée  (en  différences  premières)  est  stationnaire,  alors  que  la  série  Yt  elle-­‐
même  est  non-­‐stationnaire.  Cette  propriété  caractérise  les  séries  intégrées  à  l’ordre  1.  La  
séries  Yt  est  donc  intégrée  à  l’ordre  1.    

3.  On  peut  en  déduire  que  les  séries  sont  cointégrées  avec  un  coefficient  de  cointégration  
égal  à  0,90  environ.  

 
Corrigé  de  l’examen  de  mai  2016  (fichier  “Partiel_GFFFE_Mai16.pdf”)  
 
Exercice  1.    
 
1.  Le  R2  (coefficient  de  détermination)  est  très  élevé,  au-­‐dessus  de  0,98  (il  convient  de  
regarder  ici  le  R2  ajusté,  car  un  modèle  AR(5)  correspond  évidemment  à  une  régression  
linéaire  multiple).  L’ajustement  linéaire  du  modèle  est  très  bon,  la  variable  est  presque  
parfaitement  «  expliquée  »  par  /  corrélée  à  ses  cinq  premiers  retards.  
 
Avec  une  p-­‐valeur  inférieure  à  2,2  x  10-­‐16,  le  test  de  Fisher  est  très  significatif.  On  rejette  
donc   au   seuil   de   1‰   l’hypothèse   nulle   que   les   coefficient   associés   aux   cinq   premiers  
retards  sont  tous  nuls.  L’un  d’eux  au  moins  est  non  nul.  
 
En   regardant   les   coefficients,   on   vérifie   que   les   deux   premiers   retards   ont   un   effet  
significatif  sur  Yt.  Dans  le  volet  I,  ces  retards  sont  significatifs  aux  seuils  de  1‰  pour  le  
premier   et   de   5%   pour   le   second.   Dans   le   volet   II,   les   seuils   de   significativité   sont  
respectivement   de   1‰   et   de   10%.   Dans   les   deux   volets,   le   coefficient   du   premier   retard  
est  égal  à  1,054  et  celui  du  second  à  -­‐0,61.  Les  troisième  et  quatrième  retards  n’ont  pas  
d’effet  sur  la  variable.  
 
Dans  le  premier  volet,  les  erreurs  standard  des  coefficients  estimés  sont  calculées  avec  
la  formule  valide  uniquement  sous  l’hypothèse  d’homoscédasticité  (variance  constante  
du  terme  d’erreur).  Dans  le  second  volet,  elles  sont  calculées  avec  la  formule  de  White,  
robuste  à  l’hétéroscédasticité  (variance  du  terme  d’erreur  non  constante).  Cette  formule  
étant   plus   générale,   les   résultats   du   Volet   II   sont   plus   fiables.   On   constate   que   la  
significativité   du   premier   coefficient   reste   peu   ou   prou   la   même,   alors   que   celle   du  
second  coefficient  devient  moindre  (on  passe  du  seuil  de  5%  au  seuil  de  10%).  
 
2.   Il   s’agit   d’un   test   d’autocorrélation   du   terme   d’erreur.   Ce   test   est   valide   pour   les  
modèles   autorégressif,   contrairement   à   celui   de   Durbin-­‐Watson.   L’hypothèse   H0   est  
«  absence   d’autocorrélation   des   erreurs  »   et   l’hypothèse   alternative   H1   est   «  présence  
d’autocorrélation   des   erreurs  ».   Ici,   la   p-­‐valeur   du   test   est   supérieure   à   tous   les   seuils   de  
significativité   conventionnels,   on   ne   peut   donc   pas   rejeter   H0.   Les   termes   d’erreurs   ne  
sont  donc  pas  autocorrélés.    
 
3.   Le   BIC   est   le   critère   d’information   bayésien,   qui,   pour   un   modèle   AR(p),   dépend   du  
nombre  de  retards  p.  Si  l’on  hésite  entre  plusieurs  valeurs  de  p  (et  donc  entre  plusieurs  
AR(p)   avec   un   nombre   de   retards   différent),   on   peut   retenir   celle   qui   minimise   la   valeur  
du   BIC(p).   Ici,   cette   valeur   est   minimale   pour   un   BIC(26),   il   conviendrait   donc   de  
préférer,  sur  la  base  de  ce  critère,  un  AR(26)  aux  autres  modèles  AR(p)  estimés.  
 
4.  Il  s’agit  de  tests  de  racine  unité  de  type  ADF  (Dickey-­‐Fuller  Augmenté).  Le  second  test  
se  base  sur  un  modèle  incluant  une  tendance  déterministe,  alors  que  le  premier  test  se  
base  sur  un  modèle  qui  n’inclut  pas  de  tendance  déterministe.  
 
Dans   les   deux   cas,   l’hypothèse   nulle   H0   est   «  non   stationnarité   de   Yt  »   et   l’hypothèse  
alternative   est   «  stationnarité   de   Yt  ».   Le   test   se   fait   toujours   de   manière   unilatérale   à  
gauche.   Le   premier   test   conduit   à   rejeter   H0   au   seuil   de   1%   (et   donc   à   conclure   à   la  
stationnarité   de   Yt)   car   la   statistique   de   test   est   −3,58,   ce   qui   est   inférieur   à   la   valeur  
critique  correspondante  de  -­‐3,43.  Le  second  test,  en  revanche,  ne  permet  de  rejeter  H0  
qu’au   seuil   de   5%,     car   la   statistique   de   test   est   −3,85,   et   les   valeurs   critiques   sont   de  
−3,96  pour  le  seuil  de  1%  et  −3,41  pour  le  seuil  de  5%.  
 
Les  taux  de  change  étant  des  séries  financières  sans  tendance  déterministe,  il  convient  
ici  de  retenir  le  premier  test.  On  peut  alors  conclure  à  la  stationnarité  de  la  série  Yt.  
 
Exercice  2  
 
La   fonction   d’autocorrélation   de   la   série   décroît   exponentiellement   vers   0,   et   la   fonction  
d’autocorrélation   partielle   est   nulle   au-­‐delà   de   1   retard.   Cela   caractérise   un   processus  
AR(p).  
 
Exercice  3  

1.   Il   s’agit   de   données   de   panel,   car   les   variables   et   le   terme   d’erreur   du   Modèle   (1)   sont  
indicées   en   i   et   en   t.   Pour   estimer   ce   modèle,   il   serait   judicieux   d’utiliser   l’estimateur  
within,   qui   contrôle   pour   l’hétérogénéité   individuelle   non   observée   tout   en   restant  
parcimonieux  dans  le  nombre  de  paramètres  à  estimer.  Pour  obtenir  l’écriture  within,  on  
commence   par   poser   εit   =   ui   +   vt   +   wit   dans   le   Modèle   (1).   Le   terme   ui   représente  
l’hétérogénéité  individuelle  non  observée.  On  obtient  alors  l’écriture  within  du  modèle  
en  retranchant  terme  à  terme  au  Modèle  (1)  la  même  équation  dans  laquelle  toutes  les  
variables   sont   des   moyennes   dans   le   temps   (indicées   i•   au   lieu   de   it).   L’estimateur   within  
consiste   à   estimer   l’équation   ainsi   obtenue   par   les   MCO.   Le   terme   ui   disparaît   dans   la  
différenciation  mais  les  coefficients  des  variables  d’intérêt  demeurent.  Avec  l’estimateur  
within,  on  estime  ces  coefficients  nets  de  l’hétérogénéité  non  observée.  

2.  Un  test  d’autocorrélation  du  terme  d’erreur  peut  être  pertinent  ici,  car  la  dimension  
temporelle   du   panel   est   longue   (41   ans)   par   rapport   à   la   dimension   individuelle   (20  
secteurs).   Le   modèle   comportant   une   variable   dépendante   retardée   (IDB),   il   convient  
d’utiliser  le  test  de  Breusch-­‐Godfrey.  

Corrigé  de  l’examen  d’avril  2017  (fichier  “Partiel_GFFFAM_Avr17.pdf”)  


 
Exercice  1  
 
1.  Il  s’agit  du  modèle  CAPM,  dont  l’écriture  théorique  pour  un  actif  A  est  :  
 
PRAt  =  β.PRMt  
 
L’écriture  économétrique  du  modèle  étant  :  
 
PRAt  =  β0  +  β1PRMt  +  εt,  
 
on   voit   que   le   paramètre   β1  correspond   au   β  du   modèle   théorique,   lequel   ne   comporte  
pas  de  constante.  Pour  que  le  CAPM  théorique  soit  validé,  il  faut  donc  que  le  paramètre  
β0   ne   soit   pas   significativement   différent   de   zéro,   et   que   le   paramètre   β1   soit  
significativement  différent  de  zéro.  Ces  deux  conditions  peuvent  se  tester  à  l’aide  d’une  
régression  linéaire  simple,  en  estimant  le  modèle  (1)  par  les  MCO.  
 
2.   Avec   un   R2   de   0,68   environ,   le   modèle   est   plutôt   bien   ajusté   linéairement   aux  
données.   Comme   le   Modèle   (1)   ne   comporte   que   deux   paramètres   et   aucun   retard,   et  
comme  le  nombre  de  degrés  de  liberté  utilisé  pour  calculer  l’écart-­‐type  des  estimateurs  
est  de  1276,  on  conclut  que  l’échantillon  compte  1278  observations.  
Dans  le  tableau  de  résultats,  on  constate  que  la  constante   β0  n’est  pas  significativement  
différente   de   zéro,   et   que   le   paramètre   β1  est   significativement   différent   de   zéro   au   seuil  
de  1‰.  Les  conditions  de  validation  du  CAPM  théorique  sont  donc  remplies.    
 
3.  Le  paramètre  β1  est  estimé  à  1,39.  Or,  si  le  beta  d’un  titre  est  supérieur  à  1,  ce  titre  est  
considéré   comme   risqué   avec   de   plus   hauts   rendements   potentiels.   L’investisseur   va  
donc  acheter  de  l’actif  considéré.  
 
4.   Le   test   de   White   permet   de   tester   pour   la   présence   d’hétéroscédasticité   (déformation  
de   la   variance   du   terme   d’erreur   dans   le   temps)   dans   les   données   utilisées   pour  
l’estimation.   L’hétéroscédasticité   affecte   les   erreurs   standard   des   paramètres   estimés   et  
rend   ainsi   l’inférence   invalide.   L’hypothèse   nulle   H0   est   l’homoscédasticité   (variance  
constante  du  terme  d’erreur  du  modèle)  et  l’hypothèse  alternative  l’hétéroscédasticité.  
Ici,  le  test  conclut  à  la  présence  d’hétéroscédasticité,  car  sa  p-­‐valeur  est  inférieure  à  1‰  
(l’hypothèse  nulle  d’homoscédasticité  est  donc  rejetée  au  seuil  de  1‰).  Il  convient  donc  
d’utiliser  la  formule  des  erreurs  standard  robustes  à  l’hétéroscédasticité  développée  par  
White  (1980).  
 
5.  L’opérateur  pourrait  vouloir  tester  l’autocorrélation  du  terme  d’erreur  du  Modèle  (1).  
Ce   phénomène   induit   une   perte   d’efficacité   de   l’estimateur   des   MCO   (qui   n’est   plus   le  
BLUE),   et   le   rend   invalide   si   les   régresseurs   incluent   un   ou   plusieurs   retards   de   la  
variable   dépendante   (autrement   dit,   si   le   modèle   inclut   une   composante  
autorégressive).  Les  tests  d’autocorrélation  du  terme  d’erreur  incluent  le  test  de  Durbin-­‐
Watson   (qui   n’est   valable   que   pour   tester   une   autocorrélation   à   l’ordre   1   dans   un  
modèle  sans  composante  autorégressive)  et  le  test  de  Breusch-­‐Godfrey  (qui  est  valable  
pour   tester   une   autocorrélation   d’ordre   supérieur   à   1,   même   dans   un   modèle   avec  
composante   autorégressive).   Dans   les   deux   tests,   l’hypothèse   nulle   H0   est   l’absence  
d’autocorrélation   du   terme   d’erreur,   et   l’hypothèse   alternative   H1   est   la   présence  
d’autocorrélation  de  l’erreur  (autocorrélation  non-­‐nulle,  test  bilatéral).  
 
Exercice  2  
 
1.  L’estimateur  des  MCO  consiste  simplement  à  estimer  l’équation  :  
 
yit  =  α.xit  +  εit  
par  les  Moindres  Carrés  Ordinaires,  sans  contrôler  pour  l’hétérogénéité  individuelle  non  
observée  (effet  des  caractéristiques  individuelles  non  mesurées  par  xit  et  stables  dans  le  
temps,  au  moins  sur  la  durée  du  panel).  
 
L’estimateur  within  consiste  à  estimer  par  les  MCO  la  transformation  within  du  modèle.  
Pour   l’obtenir,   on   pose   commence   par   poser   εit   =   ui   +   vt   +   wit   dans   le   Modèle   (1).   Le  
terme  ui  représente  l’hétérogénéité  individuelle  non  observée.  Le  modèle  devient  :  
   
(2)  yit  =   α.xit    +  ui  +  vt  +  wit    

On  ré-­‐écrit  ensuite  l’équation  (2)  en  prenant  les  moyennes  de  chaque  variable  dans  le  
temps  (relation  «  between  »)  :  

(3)  yi•  =   α.xi•  +  ui  +  v•  +  wi•  

On  obtient  la  transformation  within  en  retranchant  (3)  à  (2)  

(4)  yit  -­‐  yi•  =  α  (xit  -­‐  xi•)  +  (vt  -­‐  v•)  +  (wit  -­‐  wi•)  

Le  terme  ui  (hétérogénéité  individuelle  non  observée)  disparaît  dans  la  différenciation,  
mais   le   coefficient   α   de   la   variable   d’intérêt   demeure.   En   estimant   (4)   par   les   MCO  
(estimateur  dit  «  within  »),  on  estime  ce  coefficient  net  de  l’hétérogénéité  non  observée.  

L’estimateur   des   différences   premières   consiste   à   estimer   par   les   MCO   la   différence  
entre  le  modèle  (2)  et  le  même  modèle  observé  à  la  date  t  -­‐  1,  soit  :  

(5)  yit  -­‐  yit-­‐1  =  α  (xit  -­‐  xit-­‐1)  +  (vt  -­‐  vt-­‐1)  +  (wit  -­‐  wi  t-­‐1)  

Comme   avec   le   within,   l’hétérogénéité   individuelle   non   observée)   disparaît   dans   la  


différenciation,   mais   on   perd   une   observation   en   raison   de   la   différentiation   temporelle.  
L’estimateur   des   différences   premières   donne   des   résultats   très   proches   de   ceux   du  
within,  mais  identiques  uniquement  quand  le  panel  ne  compte  que  deux  dates.    
 
Parmi   les   trois   estimateurs   décrits   ici,   le   plus   fiable   est   sans   nul   doute   le   within,   car   il  
contrôle  pour  l’hétérogénéité  individuelle  non  observée  (contrairement  aux  MCO)  sans  
induire  de  perte  d’observation  (contrairement  aux  différences  premières).  

Exercice  3  

1.  Ce  test  est  un  test  de  racine  unité  de  type  Dickey-­‐Fuller  Augmenté.  Il  permet  de  tester  
la   stationnarité   de   la   variable   Yt   avec   pour   hypothèse   nulle   H0   «  Yt   est   non   stationnaire  »  
et   pour   hypothèse   alternative   H1   «  Yt   est   stationnaire  ».   Ce   type   de   test   est   toujours  
unilatéral   à   gauche.   Ici,   la   p-­‐valeur   à   0,50   est   supérieure   à   tous   les   seuils   de  
significativité   conventionnels   et   on   ne   peut   donc   pas   rejeter   l’hypothèse   nulle   de   non-­‐
stationnarité.   On   conclut   donc   que   la   série   est   non-­‐stationnaire,   ce   qui   ne   permet   pas   de  
faire  des  prévisions  sur  la  base  de  modèles  autorégressifs  estimés  par  les  MCO.  

2.  Cette  fois,  la  p-­‐valeur  du  test  de  Dickey-­‐Fuller  augmenté  est  inférieure  au  seuil  de  1%.  
On  rejette  donc,  pour  la  série  Wt,  l’hypothèse  nulle  de  non-­‐stationnarité.  On  conclut  que  
la   série   formée   par   la   différence   première   des   log-­‐rendements   est   stationnaire   et   que  
l’investisseur  peut  se  livrer  à  des  prévisions  sur  Wt.  La  limite  de  ces  prévisions  est  qu’il  
est   beaucoup   difficile   de   les   interpréter,   de   leur   donner   un   sens   économique   ou  
financier.    

3.  Le  modèle  (1)  est  un  AR(p),  le  modèle  (2)  un  ARMA(p,  q).  Le  fait  que  l’ACF  et  la  PACF  
de  Wt  soient  toutes  deux  exponentiellement  décroissantes  vers  zéro  suggère  que  la  série  
suit   un   processus   ARMA(p,   q).   L’investisseur   devrait   donc   faire   ses   prévisions   avec   le  
modèle  (2).  

4.   L’investisseur   a   estimé   un   ARMA(4,3).   Les   quatre   premiers   paramètres   sont   les  


estimations   des   βj   de   l’AR(4)   et   les   trois   derniers   sont   celles   des   bj   du   MA(3).   Les  
paramètres   β2,   β3,   b2   et   b3   sont   significativement   différents   de   zéro,   car   le   ratio   du  
coefficient   estimé   à   son   erreur   standard   dépasse   les   valeurs   critiques   de   1,96  
(significativité  à  5%)  et/ou    2,58  (significativité  à  1%).  

5.   Ce   graphique   est   caractéristique   de   la   présence   d’hétéroscédasticité   conditionnelle  


dans  les  données.  L’hétéroscédasticité  conditionnelle  appelle  une  modélisation  de  type  
ARCH  ou  GARCH.  Ces  modèles  sont  estimés  par  Maximum  de  Vraisemblance.  

Corrigé  de  l’examen  d’avril  2018  (fichier  “Examen  M2  GFF  FAM  2018.pdf”)  
 
Exercice  1  
 
1.  Il  y  a  :  le  R2  (coefficient  de  détermination),  l’écart-­‐type  des  estimateurs  Sest  et  la  
statistique  F  de  Fisher.    
Le  R2  est  toujours  supérieur  à  0,50,  ce  qui  traduit  un  bon  ajustement  linéaire  de  chaque  
modèle.  On  remarque  que  le  R2  augmente  avec  le  décile,  passant  de  0,58  dans  le  modèle  
estimé  sur  le  premier  décile  à  0,94  dans  celui  estimé  sur  le  dernier  décile.  
On  remarque  de  même  que  Sest  diminue  avec  le  décile,  ce  qui  suggère  que  la  précision  de  
l’estimation  augmente  à  mesure  que  l’on  utilise  des  déciles  plus  élevés.  
Enfin,   la   statistique   F   augmente   avec   le   décile,   le   test   de   Fisher   étant   toujours   très  
significatif   avec   une   p-­‐valeur   inférieure   à   1‰,   ce   qui   signifie   que   le   beta   des   actifs  
considérés   est   toujours   significativement   différent   de   zéro   (comme   les   régressions  
présentées   ici   sont   des   régressions   simples,   le   test   de   Fisher   se   ramène   au   test   de  
Student  sur  β1).      
 
Concernant   les   coefficients   estimés,   on   constate   effectivement   que   la   p-­‐valeur   du   test   de  
Student  sur   β1  est  inférieure  à  1‰  dans  les  quatre  modèles  présentés,  c’est-­‐à-­‐dire  que  
β1  est  toujours  significativement  différent  de  zéro  à  ce  seuil.  Sa  valeur  est  supérieure  à  1  
pour  les  portefeuilles  1,  3  et  6,  et  inférieure  à  1  (mais  proche)  pour  le  portefeuille  10.    
La  constante  β0  en  revanche  n’est  jamais  significativement  différente  de  zéro.  
 
2.  L’écriture  théorique  du  modèle  CAPM  pour  un  actif  A  est  :  
 
PRAt  =  β.PRMt  
 
L’écriture  économétrique  du  modèle  est  :  
 
PRAt  =  β0  +  β1PRMt  +  εt,  
 
où   le   paramètre   β1   correspond   au   β   du   modèle   théorique,   lequel   ne   comporte   pas   de  
constante.  Pour  que  le  CAPM  théorique  soit  validé,  il  faut  donc  que  le  paramètre   β0  ne  
soit  pas  significativement  différent  de  zéro,  et  que  le  paramètre  β1  soit  significativement  
différent  de  zéro.  D’après  la  question  1,  ces  deux  conditions  sont  vérifiées  dans  chacun  
des  quatre  modèles  estimés  ici.  
 
3.  Plus  la  valeur  de  β1  est  élevée,  plus  le  titre  est  risqué.  Le  classement  demandé  est  donc  
Portefeuille  3,  Portefeuille  6,  Portefeuille  1  et  Portefeuille  10.  
 
4.   Cette   nouvelle   série   d’estimations   fait   appel,   pour   l’inférence,   aux   erreurs   standard  
robustes  à  l’hétéroscédasticité  (variance  du  terme  d’erreur  non  constante).  La  formule  
de  ces  erreurs  standard  robustes  est  due  à  White  (1980).  L’utilisation  de  cette  formule  
permet  de  se  prémunir  du  risque  d’hétéroscédasticité,  phénomène  qui  vient  biaiser  les  
erreurs  standard  et  rend  de  ce  fait  l’inférence  inexacte.  
Les  résultats  empiriques  ne  sont  pas  affectés  par  l’utilisation  de  cette  formule  :   β1  reste  
significativement   différent   de   zéro   au   seuil   de   à   1‰   dans   les   quatre   modèles.   La  
constante   β0   n’est   jamais   significativement   différente   de   zéro,   là   aussi   comme   dans   les  
estimations  précédentes.  
Pour   vérifier   si   cette   seconde   estimation   était   nécessaire,   on   aurait   pu   recourir   à   un   test  
d’   hétéroscédasticité   de   White   ou   de   Breusch-­‐Pagan.   Pour   ces   deux   tests,   l’hypothèse  
nulle   H0   est   toujours   l’homoscédasticité   (variance   constante   du   terme   d’erreur   du  
modèle)  et  l’hypothèse  alternative  l’hétéroscédasticité.  
 
5.   Le   R2   (ajusté)   est   maintenant   supérieur   à   0,92,   ce   qui   traduit   un   bon   ajustement  
linéaire  de  chaque  modèle.  On  remarque  que  le  R2  augmente  avec  le  décile,  passant  de  
0,92  dans  le  modèle  estimé  sur  le  premier  décile  à  0,99  dans  celui  estimé  sur  le  dernier  
décile.  
On  remarque  de  même  que  Sest  diminue  avec  le  décile,  ce  qui  suggère  que  la  précision  de  
l’estimation  augmente  à  mesure  que  l’on  utilise  des  déciles  plus  élevés.  
Enfin,   la   statistique   F   augmente   avec   le   décile,   le   test   de   Fisher   étant   toujours   très  
significatif   avec   une   p-­‐valeur   inférieure   à   1‰,   ce   qui   signifie   qu’au   moins   un   des   beta    
(en-­‐dehors  de  la  constante)  est  significativement  différent  de  zéro.    
 
Concernant   les   coefficients   estimés,   on   constate   effectivement   que   la   p-­‐valeur   du   test   de  
Student  sur   β1  est  inférieure  à  1‰  dans  les  quatre  modèles  présentés,  c’est-­‐à-­‐dire  que  
β1   est   toujours   significativement   différent   de   zéro   à   ce   seuil.   Sa   valeur   estimée   est  
proche   de   1,   légèrement   supérieure   pour   les   portefeuilles   3   et   6,   et   légèrement  
inférieure  à  1  pour  les  portefeuilles  1  et  10.    
La  constante   β0  en  revanche  n’est  jamais  significativement  différente  de  zéro,  sauf  pour  
le  portefeuille  10  où  son  coefficient  est  estimé  à  0,07.  
 
Les  variables  additionnelles  smb  et  hml  sont  significativement  différentes  de  zéro,  avec  
un   effet   parfois   positif,   parfois   négatif.   La   variable   umd   n’est   jamais   significative,   sauf  
pour  le  portefeuille  3,  où  elle  est  significative  au  seuil  de  5%  avec  un  coefficient  estimé  
négatif.  

 
L’ajout  de  ces  variables  a  modifié  les  résultats  des  modèles  simples,  le  paramètre   β1  est  
inférieur  à  1  dans  deux  sous-­‐échantillons  (Portefeuille  1  et  Portefeuille  10)  au  lieu  d’un  
seul,  et  même  quand  il  est  supérieur  à  1  (Portefeuille  3  et  Portefeuille  6),  il  est  plus  faible  
en  valeur  absolue  que  le  coefficient  obtenu  avec  un  modèle  simple.  

Exercice  2  

1.  Ce  test  est  un  test  de  racine  unité  de  type  Dickey-­‐Fuller  Augmenté.  Il  permet  de  tester  
la   stationnarité   de   la   série   considérée   avec   pour   hypothèse   nulle   H0   «     non  
stationnarité  »   et   pour   hypothèse   alternative   H1   «     stationnarité  ».   Ce   type   de   test   est  
toujours   unilatéral   à   gauche.   Ici,   la   p-­‐valeur   est   inférieure   à   1‰,   on   peut   donc   rejeter  
l’hypothèse  nulle  de  non-­‐stationnarité.  On  conclut  donc  que  la  série  est  stationnaire,  ce  
qui   permet   de   faire   des   prévisions   sur   la   base   de   modèles   autorégressifs   estimés   par   les  
MCO.  

2.   Le   BIC   est   le   critère   d’information   bayésien,   qui,   pour   un   modèle   AR(p),   dépend   du  
nombre  de  retards  p.  Si  l’on  hésite  entre  plusieurs  valeurs  de  p  (et  donc  entre  plusieurs  
AR(p)   avec   un   nombre   de   retards   différent),   on   peut   retenir   celle   qui   minimise   la   valeur  
du  BIC(p).  Ici,  cette  valeur  est  minimale  pour  un  BIC(15),  et  il  convient  donc  de  préférer,  
sur  la  base  de  ce  critère,  un  AR(15)  à  un  AR(30).  
 
3.   Le   premier   test   est   un   test   de   White,   qui   permet   de   tester   pour   la   présence  
d’hétéroscédasticité  (déformation  de  la  variance  du  terme  d’erreur  dans  le  temps)  dans  
les  données  utilisées  pour  l’estimation.  L’hétéroscédasticité  affecte  les  erreurs  standard  
des   paramètres   estimés   et   rend   ainsi   l’inférence   invalide.   L’hypothèse   nulle   H0   est  
l’homoscédasticité   (variance   constante   du   terme   d’erreur   du   modèle)   et   l’hypothèse  
alternative   l’hétéroscédasticité.   Ici,   le   test   conclut   à   la   présence   d’hétéroscédasticité,   car  
sa  p-­‐valeur  est  inférieure  à  5%  (l’hypothèse  nulle  d’homoscédasticité  est  donc  rejetée  au  
seuil   de   5%).   Il   convient   donc   d’utiliser   la   formule   des   erreurs   standard   robustes   à  
l’hétéroscédasticité  développée  par  White  (1980).  
 
Le   second   test   est   un   test   de   Breusch-­‐Godfrey,   qui   permet   de   tester   l’autocorrélation   du  
terme   d’erreur   du   modèle   autorégressif.     Le   test   de   Breusch-­‐Godfrey   est   valable   pour  
tester   une   autocorrélation   d’ordre   supérieur   à   1,   même   dans   un   modèle   avec  
composante   autorégressive.   L’hypothèse   nulle   H0   est   l’absence   d’autocorrélation   du  
terme   d’erreur,   et   l’hypothèse   alternative   H1   est   la   présence   d’autocorrélation   de  
l’erreur   (autocorrélation   non-­‐nulle,   test   bilatéral).   L’autocorrélation   du   terme   d’erreur  
induit  une  perte  d’efficacité  de  l’estimateur  des  MCO  (qui  n’est  plus  le  BLUE),  et  le  rend  
invalide   si   les   régresseurs   incluent   un   ou   plusieurs   retards   de   la   variable   dépendante  
(autrement  dit,  si  le  modèle  inclut  une  composante  autorégressive).  Ici,  on  ne  peut  pas  
rejeter   l’hypothèse   nulle   (p-­‐valeur   à   0,50)   et   on   conclut   à   l’absence   d’autocorrélation   du  
terme  d’erreur.  
 
4.  Il  faudrait  vérifier  que  l’ACF  et  la  PACF  de  la  variable  d’intérêt  décroissent  toutes  deux  
exponentiellement   vers   0.   Parmi   les   variables   susceptibles   d’être   incluses   dans   un  
modèle  ADL,  on  pourrait  imaginer  des  variables  mesurant  la  vitesse  et  la  direction  des  
courants   marins,   des   mesures   du   vent   et   des   tempêtes,   ou   encore   une   mesure   de   la  
consommation  de  plastique  des  pays  avoisinant.  
 
 
 

Vous aimerez peut-être aussi