Vous êtes sur la page 1sur 11

Normalité des rendements ?

Daniel Herlemont

31 mars 2011

Table des matières


1 Introduction 1

2 Test de Normalité des rendements 2

3 Graphiques quantile-quantile 2

4 Estimation par maximum de vraisemblance pour une loi de Student 5

5 Test statistiques de normalité 9

6 Convergence vers la loi normale 10

7 References 11

1 Introduction
L’objectif de ce TP est de tester les hypothèses de (non) normalité des rendements :

ˆ rappels sur le Théorème Central Limite,

ˆ apprendre à utiliser les graphiques quantile-quantile,

ˆ effectuer des tests statistiques (Kolmogorov Smirnov, Shapiro, Jarque Bera),

ˆ applications à différents type d’actifs : indices, devises, fonds, ... Ces applications
mettent en évidence les queues épaisses des actifs financiers, donc des risques plus

1
3 GRAPHIQUES QUANTILE-QUANTILE

élevés que dans un modèle normal. Nous constaterons également que les rendements
deviennent de plus en plus gaussien lorsque les intervalles d’observation augmentent :
un autre fait stylisé connu, sous le terme de ”gaussianité” par aggrégation”.

Le modèle normal n’est que l’expression du Théorème Central Limite (TCL) : le rende-
ment sur une période T peut être considéré comme la somme de rendements aux sous périodes
de durée T /n, avec n le nombre de sous périodes. Si ces rendements sont identiquement dis-
tribués et indépendants, alors le Théorème Central Limite s’applique et la distribution du
rendement converge vers une loi normale. Il est donc logique de tester cette hypothèse.
Nous verrons que les rendements sont à peu près gaussiens au centre de distribution (à 1
σ autour de la moyenne), et en diverge au delà, avec des queues épaisses.

2 Test de Normalité des rendements


Il existe tout une batterie de tests de Normalité. Le premier des tests est graphique :

ˆ Histogramme : nous avons déjà affiché l’histogramme des rendements avec un fit gaus-
sien estimé par la moyenne et l’écart type : voir TP sur l’exploration des données
financières.

ˆ Une façon plus adaptée est de construire un graphique quantile-quantile :

Viennent ensuite les tests statistiques spécifiques : test de Kolmogorov Smirnov, du Chi2.
de Shapiro Wilk, de Jarque Bera.

3 Graphiques quantile-quantile
Désigné aussi par le terme ”qq-plot”. Un qqplot permet de voir rapidement l’adéquation
d’un échantillon à une distribution, ou comparer deux échantillons. Ci après le graphique du
premier exercice : on compare un échantillon d’une loi de tStudent à 3 degrés de liberté, à
la loi normale.

y=rt(1000,3)
qqnorm(y,main="t student df=3")
qqline(y)

Daniel Herlemont 2
3 GRAPHIQUES QUANTILE-QUANTILE

Il est construit de la manière suivante : soient F, la fonction de répartition estimée construite à


partir des observations, représentée sur l’axe des y, et G la fonction de répartition théorique,
représentée sur l’axe x. A chaque observation y, on fait correspondre l’abscisse x, tel que
x = G−1 F (y). Si F provient de G, alors x = G−1 F (y) ≈ y : on devrait observer une
droite. Dans le cas contraire, en cas de déviations évidentes, on pourra rejeter l’hypothèse
de l’adéquation de l’échantillon à la distribution théorique.
R permet de créer des qqplots à l’aide des fonctions qqplot pour le cas général et qqnorm
pour une comparaison avec une distribution normale. qqnorm utilise une variable centrée
réduite sur l’axe des x qui représente donc les écarts à la moyenne en nombre de sigma’s.
A faire : comparer des distributions connues à la distribution normale à l’aide de qqnorm,
faire des commentaires sur les queues de distribution.

Daniel Herlemont 3
3 GRAPHIQUES QUANTILE-QUANTILE

ˆ distribution de t student avec un degré de liberté à 7 : utiliser la fonction rt

ˆ distribution exponentielle : si on souhaite utiliser la fonction exponentielle pour modé-


liser des rendements négatifs, on utilisera -rexp

ˆ distribution de cauchy, cf rcauchy, la pire, avec moyenne et variance infinies, mais pas
si éloigné de la réalité en très haute fréquence.

ˆ distribution uniforme, cf runif, une distribution qui n’a pas de queues épaisses.

ˆ distribution normale utiliser la fonction rnorm, ne présente pas grand interêt, si ce


n’est de voir à quoi ressemble un graphe lorsqu’il y a adéquation a une gaussienne.
On pourra constater que même dans le cas d’un échantillon issu d’une loi normale, il
peut y avoir des déviations aux extrêmes. Il ne faut donc pas être trop hatif dans ses
conclusions de rejet.

note : utiliser la génération pseudo aléatoire en préfixant le nom de la distribution par r :


exemple rt, pour la distribution de Student. Après avoir tracé le graphique qqnorm, on
pourra ajouter la droite d’adéquation.
Application aux rendements :

ˆ tracer le qqnorm pour le CAC40.

ˆ zoomer sur la queue de plus fortes baisses (avec xlim et ylim)

ˆ lire directement sur le graphique les rendements théoriques et empiriques à −3σ :


ajouter la droite par abline(v=-3), lire les intersections avec la diagonale (valeur
theorique) et la courbe des valeurs empiriques.

ˆ Tracer les qqplots pour les taux de change Euro/USD, du package VaR (à charger
si besoin), charger les données data(exchange.rates) extraire les taux de change
EURUSD et tacer le qqnorm des rendements.

ˆ Idem pour les indices de hedge funds vus au TP précédent (utiliser la fonction hf.read())

ˆ commenter ...

Conclusion : Il apparaı̂t que les rendements semblent gaussiens au centre de la distribution


(de 1 à 3 sigmas en fonction de l’actif et la période), mais s’en écartent aux extrêmes avec
des queues de distribution plus épaisses.

Daniel Herlemont 4
4 ESTIMATION PAR MAXIMUM DE VRAISEMBLANCE POUR UNE LOI DE
STUDENT

4 Estimation par maximum de vraisemblance pour une


loi de Student
Tracer le qqplot avec une loi de student en distribution théorique (abscisse) ... On déterminera
le degré de liberté de la loi de student qui semble le mieux adapté. Pour ce faire, on pourra
visualiser les qqplot pour différents degrés de liberté.
Déterminer le meilleur degré de liberté à l’aide de la vraisemblance (ou plutot le loga-
rithme) : X
log L(r1 , ...rn ; θ) = log f (rt |theta)
t=1,T

La densité d’une loi de student est


1 Γ((n + 1)/2) 1
fn (t) = √
2πn Γ(n/2) (1 + t2 /n)−(n+1)/2
Attention, la variance de cette distribution est n/(n − 2) La kurtosis en excès est Ke =
6/(n − 4)
Pour obtenir une
p student de moyenne nulle et variance 1, il faut effectuer un changement
de variable x = t (n − 2)/n et donc considérer la densité
1 Γ((n + 1)/2) 1
2π(n − 2) Γ(n/2) (1 + t /(n − 2))−(n+1)/2
p 2

> r = diff(log(closes))
> r0 = (r - mean(r))/sd(r)
> f = function(r, n) ((n - 2) * pi)^-0.5 * (gamma((n + 1)/2)/gamma(n/2))/(1 +
+ r^2/(n - 2))^((n + 1)/2)
> logLik = function(n) sum(log(f(r0, n)))
> ns = seq(3, 10, len = 100)
> plot(ns, sapply(ns, logLik), type = "l", main = "log vrais. CAC40",
+ xlab = "degre de liberte", ylab = "log(vrais)")
> res = optimize(logLik, lower = 3, upper = 100, maximum = TRUE)
> res

$maximum
[1] 4.098034

$objective
[1] -7147.764

Daniel Herlemont 5
4 ESTIMATION PAR MAXIMUM DE VRAISEMBLANCE POUR UNE LOI DE
STUDENT

log vrais. CAC40


−7160
−7180
log(vrais)

−7200
−7220
−7240

3 4 5 6 7 8 9 10

degre de liberte

> df = round(res$maximum)
> x = rt(1000, df) * sqrt((df - 2)/df)
> qqplot(x, r0)
> qqline(r0)

Daniel Herlemont 6
4 ESTIMATION PAR MAXIMUM DE VRAISEMBLANCE POUR UNE LOI DE
8 STUDENT


6


4





●●●

●●

●●●
2

●●
●●


●●●

●●●


● ●


●●

●●

●●


●●


●●


●●

●●




●●

●●
r0



●●

●●



●●

●●

●●
0



●●


●●

●●


●●


●●
●●


●●

●●


●●


●●


●●

●●


●●

● ●
●●


●●●




●●
−2

●●●
● ●




●●●


●●

●●


−4


−6

−4 −2 0 2 4

ˆ quel est le quantile à 0.01 de la student correspondante (c’est a dire de même variance
que le données), comparer au quantile empirique

ˆ vérifier les adéquations à l’aide des qqplots. em Que penser de cette estimation au
niveau des queues de distribution ? a droite (perte) et à gauche ?

ˆ Effectuer la même estimation en ne conservant que les données de queue de distribution.


On pourra prendre les données du premier décile pour les pertes, et du dernier décile
pour les gains.

ˆ On estimera également le degré de liberté a partir de l’excès de kurtosis à l’aide de la


relation kurtosis = 6/(d − 4). Comparer et commenter les résultats.

Daniel Herlemont 7
4 ESTIMATION PAR MAXIMUM DE VRAISEMBLANCE POUR UNE LOI DE
STUDENT

On pourra vérifier que le degré de liberté correspond à l’exposant de la queue de la


distribution en utilisant l’estimateur de Hill (voir aussi TP sur les valeurs extrèmes).

> rstar1 = sort(r[r <= quantile(r, 0.01)])


> ps = (1:length(rstar1))/length(r)
> x = log(ps)
> y = log(-rstar1)
> plot(x, y)
> reg = lm(y ~ x)
> summary(reg)

Call:
lm(formula = y ~ x)

Residuals:
Min 1Q Median 3Q Max
-0.063245 -0.010579 -0.001822 0.014802 0.052536

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -4.223620 0.018284 -231.0 <2e-16 ***
x -0.224181 0.003263 -68.7 <2e-16 ***
---
Signif. codes: 0 Ś***Š 0.001 Ś**Š 0.01 Ś*Š 0.05 Ś.Š 0.1 Ś Š 1

Residual standard error: 0.02124 on 52 degrees of freedom


Multiple R-squared: 0.9891, Adjusted R-squared: 0.9889
F-statistic: 4720 on 1 and 52 DF, p-value: < 2.2e-16

Daniel Herlemont 8
5 TEST STATISTIQUES DE NORMALITÉ


−2.4


−2.6

● ●



−2.8
y

●●


●●
●●

●●●
●●●
−3.0


●●●●●
●●●

●●●
●●●
●●
●●
●●
●●
−3.2

●●
●●
●●

−8 −7 −6 −5

Effectuer ces memes estimations pour les differents hedge funds (du moins l’estimation
de Hill).

5 Test statistiques de normalité


Il existe plusieurs tests de normalité :

ˆ test de Shapiro Wilk, voir ?shapiro.test, plus utilisé, et semble aussi plus puissant,
car utilisable pour des échantillons de faible taille.

ˆ test de Jarque Bera, voir ?jarque.bera.test, il est basé sur une statistique relative
aux moments d’ordre 3 et 4, normalement nul et égaux à 3 dans le cas gaussien.

Daniel Herlemont 9
6 CONVERGENCE VERS LA LOI NORMALE

ˆ test de Kolmogorov Smirnov, voir ?ks.test est la traduction statistique des qqplots :
il est basé sur les écarts entre les fonctions de répartition. ks.test est très général
car il permet de comparer deux échantillons, cependant R n’inclut pas les corrections
nécessaires dans le cas d’une distribution normale dont la variance est inconnue : il
faudrait utiliser les corrections de Lilliefors. On pourra tout de même l’utiliser avec un
échantillon théorique générer par rnorm avec la moyenne et la variance empiriques.
Ces tests renvoient une probabilité critique, la p-value. La p-value est la probabilité
d’obtenir ce type d’échantillon sous l’hypothese nulle. C’est aussi la probabilité de faire une
erreur si on rejette l’hypothèse nulle.
Dans le cas des tests de normalité, l’hypothèse nulle est : ”l’échantillon est issue d’une
loi normale”, une p-value de 0.02 signifie que la probabilité de faire une erreur en rejetant
le modèle normal est de 2%. Par exemple, on rejète l’hyptohèse nulle au seuil de 5% car
5% est supérieur à la p-value. Par contre, on ne rejète pas au seuil de 1% car la p-value est
supérieure a 1%
A faire : Appliquer les tests de Shapiro Wilk et Jarque Bera
ˆ aux rendements du CAC40

ˆ aux rendementss des Hedge Funds


Effectuer un test de Kolmogorov Smirnov sur le CAC40 en utilisant la loi de Student et
le degre de liberté trouvés précédemment.

6 Convergence vers la loi normale


Dans cette partie, nous montrons, à l’aide de quelques exemples, que les rendements finissent
par devenir gaussiens lorsque les durées entre les observations augmentent.
A faire :
ˆ Afficher sur un même graphique les qqnorm pour le CAC40 en rendements journaliers,
mensuels, trimestriels, et semestriels. Constater que les rendements sur 3 mois sont
assez proches d’une gaussienne. Inversement, plus on réduit la fréquence et plus les
queues de distribution seront épaisses.

ˆ Effectuer un test de Shapiro Wilk sur les differents rendements pour les différentes
fréquences. Conclusions ?
Pour calculer les rendements mensuels, trimestriels, semestriels, on pourra utiliser la
méthode suivante :

Daniel Herlemont 10
closes=rev(read.csv("^FCHI.csv")[,"Close"])
rday=diff(log(closes))
n=length(closes)
ind=seq(1,n,by=20)
rmonth=diff(log(closes[ind]))

On peut également prendre les prix tous les 20 jours en commençant par la fin :

rev(seq(n,1,by=-60))

On peut également utiliser la fonction window (voir aide).

7 References

[1] CONT, R. ”Empirical properties of asset returns - stylized facts and statistical
issues” . QUANTITATIVE FINANCE, 2000. ...

Daniel Herlemont 11