Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Daniel Herlemont
31 mars 2011
3 Graphiques quantile-quantile 2
7 References 11
1 Introduction
L’objectif de ce TP est de tester les hypothèses de (non) normalité des rendements :
applications à différents type d’actifs : indices, devises, fonds, ... Ces applications
mettent en évidence les queues épaisses des actifs financiers, donc des risques plus
1
3 GRAPHIQUES QUANTILE-QUANTILE
élevés que dans un modèle normal. Nous constaterons également que les rendements
deviennent de plus en plus gaussien lorsque les intervalles d’observation augmentent :
un autre fait stylisé connu, sous le terme de ”gaussianité” par aggrégation”.
Le modèle normal n’est que l’expression du Théorème Central Limite (TCL) : le rende-
ment sur une période T peut être considéré comme la somme de rendements aux sous périodes
de durée T /n, avec n le nombre de sous périodes. Si ces rendements sont identiquement dis-
tribués et indépendants, alors le Théorème Central Limite s’applique et la distribution du
rendement converge vers une loi normale. Il est donc logique de tester cette hypothèse.
Nous verrons que les rendements sont à peu près gaussiens au centre de distribution (à 1
σ autour de la moyenne), et en diverge au delà, avec des queues épaisses.
Histogramme : nous avons déjà affiché l’histogramme des rendements avec un fit gaus-
sien estimé par la moyenne et l’écart type : voir TP sur l’exploration des données
financières.
Viennent ensuite les tests statistiques spécifiques : test de Kolmogorov Smirnov, du Chi2.
de Shapiro Wilk, de Jarque Bera.
3 Graphiques quantile-quantile
Désigné aussi par le terme ”qq-plot”. Un qqplot permet de voir rapidement l’adéquation
d’un échantillon à une distribution, ou comparer deux échantillons. Ci après le graphique du
premier exercice : on compare un échantillon d’une loi de tStudent à 3 degrés de liberté, à
la loi normale.
y=rt(1000,3)
qqnorm(y,main="t student df=3")
qqline(y)
Daniel Herlemont 2
3 GRAPHIQUES QUANTILE-QUANTILE
Daniel Herlemont 3
3 GRAPHIQUES QUANTILE-QUANTILE
distribution de cauchy, cf rcauchy, la pire, avec moyenne et variance infinies, mais pas
si éloigné de la réalité en très haute fréquence.
distribution uniforme, cf runif, une distribution qui n’a pas de queues épaisses.
Tracer les qqplots pour les taux de change Euro/USD, du package VaR (à charger
si besoin), charger les données data(exchange.rates) extraire les taux de change
EURUSD et tacer le qqnorm des rendements.
Idem pour les indices de hedge funds vus au TP précédent (utiliser la fonction hf.read())
commenter ...
Daniel Herlemont 4
4 ESTIMATION PAR MAXIMUM DE VRAISEMBLANCE POUR UNE LOI DE
STUDENT
> r = diff(log(closes))
> r0 = (r - mean(r))/sd(r)
> f = function(r, n) ((n - 2) * pi)^-0.5 * (gamma((n + 1)/2)/gamma(n/2))/(1 +
+ r^2/(n - 2))^((n + 1)/2)
> logLik = function(n) sum(log(f(r0, n)))
> ns = seq(3, 10, len = 100)
> plot(ns, sapply(ns, logLik), type = "l", main = "log vrais. CAC40",
+ xlab = "degre de liberte", ylab = "log(vrais)")
> res = optimize(logLik, lower = 3, upper = 100, maximum = TRUE)
> res
$maximum
[1] 4.098034
$objective
[1] -7147.764
Daniel Herlemont 5
4 ESTIMATION PAR MAXIMUM DE VRAISEMBLANCE POUR UNE LOI DE
STUDENT
−7200
−7220
−7240
3 4 5 6 7 8 9 10
degre de liberte
> df = round(res$maximum)
> x = rt(1000, df) * sqrt((df - 2)/df)
> qqplot(x, r0)
> qqline(r0)
Daniel Herlemont 6
4 ESTIMATION PAR MAXIMUM DE VRAISEMBLANCE POUR UNE LOI DE
8 STUDENT
●
6
●
4
●
●
●
●
●●●
●
●●
●
●●●
2
●●
●●
●
●
●●●
●
●●●
●
●
● ●
●
●
●●
●
●●
●
●●
●
●
●●
●
●
●●
●
●
●●
●
●●
●
●
●
●
●●
●
●●
r0
●
●
●●
●
●●
●
●
●
●●
●
●●
●
●●
0
●
●
●●
●
●
●●
●
●●
●
●
●●
●
●
●●
●●
●
●
●●
●
●●
●
●
●●
●
●
●●
●
●
●●
●
●●
●
●
●●
●
● ●
●●
●
●
●●●
●
●
●
●
●●
−2
●●●
● ●
●
●
●
●
●●●
●
●
●●
●
●●
●
●
−4
●
−6
−4 −2 0 2 4
quel est le quantile à 0.01 de la student correspondante (c’est a dire de même variance
que le données), comparer au quantile empirique
vérifier les adéquations à l’aide des qqplots. em Que penser de cette estimation au
niveau des queues de distribution ? a droite (perte) et à gauche ?
Daniel Herlemont 7
4 ESTIMATION PAR MAXIMUM DE VRAISEMBLANCE POUR UNE LOI DE
STUDENT
Call:
lm(formula = y ~ x)
Residuals:
Min 1Q Median 3Q Max
-0.063245 -0.010579 -0.001822 0.014802 0.052536
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -4.223620 0.018284 -231.0 <2e-16 ***
x -0.224181 0.003263 -68.7 <2e-16 ***
---
Signif. codes: 0 Ś***Š 0.001 Ś**Š 0.01 Ś*Š 0.05 Ś.Š 0.1 Ś Š 1
Daniel Herlemont 8
5 TEST STATISTIQUES DE NORMALITÉ
●
−2.4
●
−2.6
● ●
●
●
−2.8
y
●●
●
●
●●
●●
●
●●●
●●●
−3.0
●
●
●●●●●
●●●
●
●●●
●●●
●●
●●
●●
●●
−3.2
●●
●●
●●
−8 −7 −6 −5
Effectuer ces memes estimations pour les differents hedge funds (du moins l’estimation
de Hill).
test de Shapiro Wilk, voir ?shapiro.test, plus utilisé, et semble aussi plus puissant,
car utilisable pour des échantillons de faible taille.
test de Jarque Bera, voir ?jarque.bera.test, il est basé sur une statistique relative
aux moments d’ordre 3 et 4, normalement nul et égaux à 3 dans le cas gaussien.
Daniel Herlemont 9
6 CONVERGENCE VERS LA LOI NORMALE
test de Kolmogorov Smirnov, voir ?ks.test est la traduction statistique des qqplots :
il est basé sur les écarts entre les fonctions de répartition. ks.test est très général
car il permet de comparer deux échantillons, cependant R n’inclut pas les corrections
nécessaires dans le cas d’une distribution normale dont la variance est inconnue : il
faudrait utiliser les corrections de Lilliefors. On pourra tout de même l’utiliser avec un
échantillon théorique générer par rnorm avec la moyenne et la variance empiriques.
Ces tests renvoient une probabilité critique, la p-value. La p-value est la probabilité
d’obtenir ce type d’échantillon sous l’hypothese nulle. C’est aussi la probabilité de faire une
erreur si on rejette l’hypothèse nulle.
Dans le cas des tests de normalité, l’hypothèse nulle est : ”l’échantillon est issue d’une
loi normale”, une p-value de 0.02 signifie que la probabilité de faire une erreur en rejetant
le modèle normal est de 2%. Par exemple, on rejète l’hyptohèse nulle au seuil de 5% car
5% est supérieur à la p-value. Par contre, on ne rejète pas au seuil de 1% car la p-value est
supérieure a 1%
A faire : Appliquer les tests de Shapiro Wilk et Jarque Bera
aux rendements du CAC40
Effectuer un test de Shapiro Wilk sur les differents rendements pour les différentes
fréquences. Conclusions ?
Pour calculer les rendements mensuels, trimestriels, semestriels, on pourra utiliser la
méthode suivante :
Daniel Herlemont 10
closes=rev(read.csv("^FCHI.csv")[,"Close"])
rday=diff(log(closes))
n=length(closes)
ind=seq(1,n,by=20)
rmonth=diff(log(closes[ind]))
On peut également prendre les prix tous les 20 jours en commençant par la fin :
rev(seq(n,1,by=-60))
7 References
[1] CONT, R. ”Empirical properties of asset returns - stylized facts and statistical
issues” . QUANTITATIVE FINANCE, 2000. ...
Daniel Herlemont 11