Vous êtes sur la page 1sur 8

Notes de cours sur les copules

1 Introduction
La thorie des copules permet de construire des modles paramtriques pour la loi jointe de d
variables alatoires relles (X1 , ..., Xd ). Dans les cours prcdents, on supposait soit que les
variables alatoires taient indpendantes soit qu'elles suivaient une loi normale multivarie. En
pratique ces hypothses sont souvent restrictives et la thorie des copules est de plus en plus
utilise en nance et en assurance pour modliser de manire plus raliste la loi jointe de
plusieurs "risques".
Dans ce cours on se restreindra au cas de d = 2 variables mais les mthodes peuvent aisment se
gnraliser en dimension suprieure (au moins en thorie).

Rfrences
[1] R.B. Nielsen. An introduction to copulas, second edition. Springer, 2005.

2 Principe de construction
La construction des copules repose sur les proprits des fonctions de rpartition et on rappelle
ci-dessous quelques proprits importantes des fonctions de rpartition bivaries.
Soit (X, Y ) un couple de variables alatoires relles. La loi bivarie de (X, Y ) est caractrise
par la fonction de rpartition bivarie FX,Y dnie pour (x, y) R2 par
FX,Y (x, y) = P [X x, Y y]

On appelle lois marginales les lois de X ou de Y prises sparment. On peut exprimer les
fonctions de rpartition des lois marginales en fonction de FX,Y . Par exemple, pour X on obtient :
FX (x) = P [X x] = limy+ P [X x, Y y] = limy+ FX,Y (x, y)

On rappelle que les variables alatoires X et Y sont indpendantes si et seulement si (x, y) R2


FX,Y (x, y) = FX (x)FY (y)

On notera dans la suite

qX (p) = inf {x R|FX (x) p}

pour p [0, 1], la fonction quantile qui est l'inverse (gnralis) de la fonction de rpartition
FX . On rappelle le lemme d'inversion qui est couramment utilis pour gnrer des chantillons
d'une loi dont la fonction quantile est connue : si U suit une loi uniforme sur l'intervalle [0, 1]
alors qX (U ) suit la mme loi que X .
Dans la suite du cours, on suppose que la loi de (X, Y ) possde une densit fX,Y (x, y) par
rapport la mesure de Lebesgue. On a alors (x, y) R2

FX,Y (x, y) =
fX,Y (u, v)dudv
],x]],y]

fX,Y (x, y) =

2 FX,Y
(x, y)
xy

On vrie alors que les lois marginales possdent galement une densit par rapport la mesure
de Lebesgue. Par exemple, la densit de la loi de X est donne pour x R par

fX (x) =
fX,Y (x, y)dy
R

Les fonctions de rpartition des lois marginales sont alors des fonctions continues et les variables
alatoires FX (X) et FY (Y ) suivent des lois uniformes sur [0, 1]. En eet, on a FX (qX (p)) = p (qX
est un inverse droite de FX ) puis
P [FX (X) p] = P [FX (X) FX (X)(qX (p))] = P [X p] = p

On est alors ramen modliser un couple de variables alatoires dont les lois marginales sont
des lois U ([0, 1]). La fonction de rpartition d'un tel couple est appele "copule". Ceci est
formalis plus prcisment ci-dessous.

Dnition.

copule

On appelle
de dimension 2 une fonction de rpartition bivarie dont les lois
marginales sont des lois U ([0, 1]).

Thorme.

(Thorme de Sklar, 1959) Si FX,Y est la fonction de rpartition de (X, Y ) alors il


existe une copule C telle que pour tout (x, y) R2 on ait
P [X x, Y y] = FX,Y (x, y) = C (FX (x), FY (y))

(2.1)

Si de plus FX et FY sont continues, alors C est unique.


Le thorme de Sklar suggre donc de modliser la loi jointe d'un couple de variables alatoires
en 2 tapes :
 modlisation des lois marginales
 modlisation de la structure de dpendance aprs transformation des lois marginales en lois
uniformes

Exercice 2.1.

Soit (X, Y ) un couple de variable alatoire et C la copule associe. Donner la


copule associe (f (X), g(Y )) lorsque f et g sont continues avec
1. f et g strictement croissantes
2. f et g strictement dcroissantes
3. f strictement croissante et g strictement dcroissante

3 Copules usuelles
De nombreuses familles de copules ont t proposes dans la littrature. Certaines, parmi les plus
couramment utilises, sont rapidement introduites dans ce chapitre. Elles sont toutes disponibles
dans le package R copula. Une liste plus complte peut tre trouve dans [1].
3.1

Copules particulires

Notons tout d'abord que les copules vrient certaines proprits.

Proposition.

Une fonction C : R2 R est une copule si et seulement si

1. C est continue droite.

2. C est 2-croissante : (x1 , x2 , y1 , y2 ) R4 vriant x1 x2 et y1 y2 on a


C(x2 , y2 ) C(x1 , y2 ) C(x2 , y1 ) + C(x1 , y1 ) 0

3. Les marges suivent des lois U ([0, 1]) :


 C(x, y) = 0 si x 0 ou y 0
 C(x, y) = 1 si x 1 et y 1
 C(x, y) = x si y 1 et C(x, y) = y si x 1

Exercice 3.1.

Montrer qu'une copule vrie les points 1., 2. et 3. ci-dessus.

On en dduit en particulier que si C est une copule, alors (x, y) [0, 1]2 on a (borne
Frchet-Hoeding) :

de

W (x, y) = max(x + y 1, 0) C(x, y) min(x, y) = M (x, y)


M et W sont des copules puisque (faire la dmonstration en exercice)
 M est la fonction de rpartition du couple (U, U ) avec U U ([0, 1])
 W est la fonction de rpartition du couple (U, U ) avec U U ([0, 1])
Un autre cas particulier est celui des variables indpendantes : la copule associe est la copule
dnie par
(x, y) = xy
(x, y) [0, 1]2 .

Exercice 3.2.

On considre un couple de variables alatoires (X, Y ) qui vrie Y = f (X) avec


f : R R une fonction continue strictement croissante.
1. Montrer que FX (x) = FY (f (x)).
2. Montrer que M est la copule associe au couple (X, Y ).
3. Que se passe-t-il si f est strictement dcroissante ?
3.2

Copule gaussienne

Il s'agit de la copule la plus couramment utilise. On note (x, y) la fonction de rpartition d'un
couple (X, Y ) gaussien de loi marginale N (0, 1) et de coecient de corrlation et la fonction
de rpartition de la loi N (0, 1). La copule associe (X, Y ) est appele copule gaussienne .
Elle est donne pour (x, y) [0, 1]2 par
C (x, y) = (1 (x), 1 (y))

Utiliser une copule gaussienne revient supposer que le couple suit une loi normale bivarie aprs
transformations marginales pour se ramener un couple dont les marges sont des lois N (0, 1).
On retrouve les cas particuliers suivants comme cas limites (faire la dmonstration en exercice) :
C1 = W , C0 = et C1 = M
De la mme manire, on peut dnir la copule de Student base sur la loi de Student multivarie.
3.3

La

Copules de Plackett

copule de Plackett est de la forme


C (x, y) =

[1 + ( 1)(x + y)]

pour > 0 et = 1 et le cas limite


2
[1 + ( 1)(x + y)] 4xy( 1)
2( 1)

C1 (x, y) = xy

pour (x, y) [0, 1] . Il s'agit d'une famille de copule assez souple qui donne de bons rsultats
pour de nombreuses applications.
On retrouve les cas particuliers suivants comme cas limites : C0 = W , C1 = et C = M
3

3.4

Copules archimdiennes

Dnition.

Une copule archimdienne est de la forme


C(x, y) = 1 ((x) + (y))

(3.1)

avec : [0, 1] [0, +[ une fonction continue, strictement dcroissante et convexe vriant
(1) = 0 et la convention 1 (y) = 0 pour y (0)

Exercice 3.3. Montrer que C dni par (3.1) est bien une copule lorsque : [0, 1] [0, +[ est
une fonction continue, strictement dcroissante et convexe vriant (1) = 0.
Quelques exemples classiques :
 Copule de Clayton. Pour [1, 0[]0, +[ :
(t) =

t 1


1/
C (x, y) = max(x + y 1, 0)

On retrouve les cas particuliers suivants comme cas limites : C1 = W , C0 = et C = M


Copule de Gumbel. Pour [1, +[ :
 
1/ 
(t) = ( ln(t))
C (x, y) = exp ( ln x) + (ln(y))
On retrouve les cas particuliers suivants comme cas limites : C1 = et C = M
Copule de Franck. Pour R :


exp(t) 1
(exp(tx) 1)(exp(y) 1)
1
(t) = ln
C (x, y) = ln 1 +
exp() 1

exp() 1
On retrouve les cas particuliers suivants comme cas limites : C = W , C0 = et C = M

3.5

Copules extrmes

On a vu dans le cours sur les valeurs extrmes qu'il est naturel d'utiliser une loi des valeurs
extrmes gnralise (GEV) lorsqu'on cherche modliser la loi de X = max(R1 , ..., Rn ) avec n
grand et (R1 , ..., Rn ) un chantillon de v.a. i.i.d. La justication thorique est que ces lois ont la
proprit d'tre "max-stable" : si (X1 , ..., Xn ) est une chantillon i.i.d. d'une loi GEV, alors il
(x)
(x)
(x)
(x)
existe des constantes n , n telles que la loi de n max(X1 , ..., Xn ) + n est similaire celle
de Xi . Si FX dsigne la fonction de rpartition de Xi , le proprit de max-stabilit se traduit par
l'quation fonctionnelle
FX (n(x) x + n(x) ) = FX (x)n

(3.2)

dont la fonction de rpartition de la GEV est solution.


La thorie des valeurs extrmes bivaries s'intresse modliser la loi jointe du couple (X, Y )
avec X = max(R1 , ..., Rn ) et Y = max(S1 , ..., Sn ). Lorsqu'on tend la notion de max-stabilit au
cas bivari, on obtient l'quation fonctionnelle
(y)
n
F (n(x) x + n(x) , (y)
n y + n ) = F (x, y)
(x)

(x)

(y)

(3.3)

(x)

avec des constantes n , n , n et n .


Ceci implique que les lois marginales doivent vrier (3.2) et suivent donc des lois GEV. De plus,
la copule C associe F (cf (2.1)) vrie alors
C(xn , y n ) = C(x, y)n

(3.4)

Une copule qui vrie (3.4) pour n > 0 est appele copule extrme.
La copule de Gumbel est un exemple de copule extrme (exercice) mais ce n'est pas la seule
copule extrme. Contrairement au cas unidimensionnel o la loi GEV est l'unique loi limite
possible, il n'existe pas d'criture unie des lois limites possibles dans le cas bidimensionnel. En
pratique, cela signie que l'utilisateur doit choisir une famille de copule extrme partir des
informations dont il dispose.

4 Mesures de dpendance et de concordance


De manire informelle, deux variables alatoires X et Y sont dites concordantes lorsque les
variables alatoires X et Y prennent des fortes (resp. faibles) valeurs simultanment. Direntes
mesures de concordance ont t proposes dans la littrature.

Dnition.

Le

coecient de Spearman entre deux variables alatoires X et Y est dni par


S (X, Y ) = corr(FX (X), FY (Y ))

Le

coecient de Kendall entre deux variables alatoires X et Y est dni par


(X, Y ) = P [(X1 X2 )(Y1 Y2 ) > 0] P [(X1 X2 )(Y1 Y2 ) < 0]

avec (X1 , Y1 ) et (X2 , Y2 ) deux copies indpendantes de (X, Y ).

Proposition.
1.
2.
3.
4.

5.

Les coecients S de Spearman et de Kendall vrient les proprits ci-dessous :


: (X, Y ) = (Y, X)
: 1 (X, Y ) 1
si X et Y sont indpendantes, alors (X, Y ) = 0
:
 (X, Y ) = 1 si et seulement si M est la copule associe (X, Y )
 (X, Y ) = 1 si et seulement si W est la copule associe (X, Y )

Symtrie
Normalisation
Indpendance :
Cas extrmes

Invariance par transformation monotone

 Si f est strictement croissante alors (f (X), Y ) = (X, Y )


 Si f est strictement dcroissante alors (f (X), Y ) = (X, Y )

Exercice 4.1.

Dmontrer la proposition prcdente.

Le coecient de corrlation (ou "coecient r de Pearson") vrie seulement les trois premiers
points. Il s'agit d'une mesure de la relation linaire entre deux variables et les points 4. et 5. sont
vries si on suppose en plus que f est linaire.
En pratique, on peut estimer ces coecients lorsqu'on dpose d'un chantillon bivari i.i.d.
(X1 , Y1 ),..., (Xn , Yn ) de mme loi que (X, Y ).
 L'estimateur usuel de S (X, Y ) est le coecient de corrlation rS (X, Y ) entre les vecteurs
rangs associs aux deux chantillons. Plus prcisment, dans le cas particulier des variables
continus (on suppose alors que les observations sont distinctes deux deux puisque
P [Xi = Xj ] = 0 pour i = j ), le vecteur rang (RX (1), ..., RX (n)) de (X1 , ..., Xn ) vrie
XRX (1) < .. < XRX (n)

et on dnit rS (X, Y ) comme le coecient de corrlation empirique entre RX et RY .


 L'estimateur usuel de (X, Y ) est
t(X, Y ) =

1
(C D)
n(n 1)

avec
5



 C = ni=1 nj=i 1l[(Xi Xj )(Yj Yi )>0] le nombre de paires "concordantes"
n n
 D = i=1 j=1 1l[(Xi Xj )(Yi Yj )<0] le nombre de paires "discordantes"

Exercice 4.2.

Montrer que rS (X, Y ) = 1

(RX (i)RY (j))2


n(n2 1)

Remarque.

Ces estimateurs peuvent tre obtenus avec la fonction R cor en modiant


l'argument method

Une mesure qui est invariante par transformation monotone (5.) dpend uniquement de la
fonction copule associe : si C est la copule associe deux couples de variables alatoires (X1 , Y1 )
et (X2 , Y2 ) (qui peuvent donc avoir des lois marginales direntes) alors (X1 , Y1 ) = (X2 , Y2 ).
Les formules ci-dessous expriment les coecients S et en fonction de la copule.

Proposition. Si(X, Y ) est un couple de variables alatoires et C est une copule associe, alors
 S (X, Y ) = 12 [0,1]2 (C(x, y) xy)dxdy

 (X, Y ) = 4 [0,1]2 C(x, y)dC(x, y) 1
On peut en dduire des formules analytiques pour les coecients S et pour certaines copules
usuelles. Ceci peut servir :
 Guider le choix de la famille de copule utiliser. Par exemple pour certaines familles de
copules (Gumbel par exemple) on a forcment > 0 et elles ne sont alors pas appropries pour
modliser des donnes avec t < 0.
 Estimer les paramtres de la copule par une mthode des moments (on choisit de telle
manire que le coecient S ou concide avec le coecient empirique calcul sur les
observations). Cette approche est propose par la fonction tCopula du package R copula
(option method ).
Il existe d'autres mesures de dpendance, notamment pour mesurer la dpendance entre le
comportement extrme de deux variables alatoires. Ces coecients peuvent galement tre utiles
pour choisir une copule adapte : par exemple, avec les copules gaussiennes on obtient des
variables alatoires avec une faible dpendance aux niveaux levs et ceci peut conduire
sous-estimer la probabilit de co-occurrence de certains risques. Il y a une littrature abondante
sur le sujet en actuariat/nance !

5 Infrence statistique
Cadre probabiliste : on dispose d'observations (xi , yi )i{1,...,n} qu'on suppose tre une
ralisation d'un chantillon de variables alatoires i.i.d. (Xi , Yi )i{1,...,n} .
On cherche modliser la loi jointe de (Xi , Yi ). Les tapes de la modlisation consistent en :
1. choisir des formes paramtriques pour les lois marginales et la copule
2. estimer les paramtres
3. valider le modle ajust
5.1

Choix des modles paramtriques

Lois marginales. En ce qui concerne les marges, le choix est gnralement bas sur des outils
graphiques :
 fonction de rpartition empirique (ecdf sous R)
 histogramme (hist sous R)
 estimateurs non-paramtriques de densit (density sous R)
Il faut ensuite trouver une famille de loi qui permet de dcrire la loi empirique. Une fois la famille
de loi chosie, l'ajustement (i.e. l'estimation des paramtres) est gnralement fait avec la mthode
du maximum de vraisemblance (ou ventuellement une mthode des moments). Sous R la
6

fonction tdistr du package MASS permet d'ajuster les lois usuelles par la mthode du maximum
de vraisemblance.
Fonction copule. Dirents graphiques peuvent galement aider pour le choix de la copule :
 Nuage de points (Xi , Yi )i{1...n} .
 Il est gnralement plus simple d'interprter un nuage de point avec des marges
approximativement uniforme et on trace alors le nuage de points (FX (Xi ), FY (Yi ))i{1...n} avec
FX (resp. FY ) un estimateur de FX (resp. FY ). Dirents estimateurs des fonctions de
rpartition marginales peuvent tre utilises : estimateur obtenu aprs la premire tape dcrite
ci-dessus qui consiste ajuster une loi paramtrique aux marges, estimateur empirique usuel
ou estimateur non-paramtrique noyau. . Lorsqu'on utilise l'estimateur empirique usuelle :
1
FX (x) =
1l[Xi x]
n i=1
n

on obtient la densit associe la

copule empirique. On a alors (dans le cas continu)


FX (Xi ) = RX (i)/n

avec RX (i) la variable rang associe la ime observation (cf paragraphe 4) et on trace donc le
nuage de points
(RX (i)/n, RY (i)/n)i{1...n}


Copule empirique. La copule empirique est la fonction de rpartition empirique bivarie


associe au nuage de points prcdent

1

C(i/n,
j/n) =
1l[Xk XR (i) Yk YR (j) ]
X
Y
n
n

k=1

A nouveau, il faut ensuite trouver une famille de copule adapte la copule empirique. On peut
par exemple utiliser les nuages de points simuls avec les copules usuelles (cf feuilles distribues)
et chercher une famille qui permet de reproduire la forme du nuage de points associ la copule
empirique.
5.2

Estimation des paramtres

Une fois le modle spci (lois marginales et copule) on peut utiliser les techniques d'infrence
usuelles en statistique paramtrique : mthode du maximum de vraisemblance ou mthode des
moments. En pratique, la mthode du maximum de vraisemblance est asymptotiquement ecace
(donc privilgier lorsque n est grand) mais la mthode des moments peut fournir une bonne
initialisation pour l'optimisation numrique de la fonction de log-vraisemblance qui s'crit
l() =

n


log(fX,Y (xi , yi ; ))

i=1

avec l'ensemble des paramtres inconnus et


fX,Y (xi , yi ; )

la densit associe la copule de paramtre . La densit se dduit de la fonction de rpartition


via :
2
FX,Y (x, y; )
fX,Y (x, y; ) =
xy
En remplaant FX,Y par (2.1), on obtient
fX,Y (x, y; ) = fX (x; )fY (y; )c(FX (x; ), FY (y; ); )

avec

2
C(x, y; )
xy
la densit associe la copule C . Finalement, la fonction de log-vraisemblance s'crit
c(x, y; ) =

l() =

n

i=1

log(fX (xi ; )) +

n


log(fY (yi ; )) +

i=1

n


log(fX,Y (FX (xi ; ), FY (yi ; ); ))

(5.1)

i=1

Maximiser la fonction de vraisemblance permet d'estimer simultanment les paramtres associs


aux marges et ceux associs la fonction copule. On peut aussi procder en deux tapes
(mthode "IFM") : estimation des paramtres lis aux marges (ce qui correspond aux deux
premiers termes de (5.1)) puis estimation des paramtres lis la copule (troisime terme de
(5.1) en xant les paramtres associs aux marges).
5.3

Validation de modle

Une mthode graphique permettant de valider la copule ajuste consiste simuler des
ralisations du modle ajust et comparer la forme du nuage de points simul avec celle du
nuage de points observ. On peut galement comparer les lignes de niveau d'estimateurs
non-paramtriques de densit associes ces nuages de point (attention aux "eets de bords").
De manire plus formelle, on peut faire des tests d'adquation. Une implmentation rigoureuse
des tests d'adquation conduit des temps de calculs importants (cf fonction gofCopula du
package Copula).

6 Exercices avec R
Exercice 6.1.
2.

3.
4.

5.
6.
7.

1. Simuler un chantillon de taille n = 200 d'une copule de Gumbel de


paramtre 3 (on pourra utiliser la fonction rcopula du package copula.
Appliquer les transformations appropries sur les lois marginales permettant de simuler une
chantillon de taille n = 200 d'une loi bivarie avec
(a) la premire marge qui suit une loi N (0, 1)
(b) la deuxime marge qui suit une loi (1, 2)
(c) la copule associe qui est une copule de Gumbel de paramtre 3.
Tracer le nuage de points associ et les lignes de niveau de l'estimateur non-paramtrique
de densit propos dans la fonction R kde2d.
Reprsenter graphiquement les lois marginales l'aide des fonctions R hist, ecdf et
density. Ajuster les lois appropries aux lois marginales l'aide de la fonction tdistrib du
package MASS. On vriera la qualit de l'ajustement l'aide d'outils graphiques et de la
fonction ks.test.
Tracer le nuage de point associ la copule empirique et comparer au nuage de points
simul initialement. On regardera galement les lignes de niveau obtenues avec kde2d et on
comparera celles de la copule thorique (noter les "eets de bords" !).
Ajuster une copule de Gumbel au nuage de points associ la copule empirique l'aide de
la fonction tCopula.
Ajuster simultanment les lois marginales et la copule l'aide de la fonction tMvdc.

Exercice 6.2.

Utiliser la thorie des copules pour modliser la loi jointe de deux actifs nancier
de votre choix. On pourra par exemple considrer les "log-returns" des cours du CAC40 et du
DAX (disponibles dans EuStockMarkets sous R). Aprs avoir modlis les marges, on
commencera par ajuster une copule gaussienne et on discutera les ventuelles limitations de ce
modle. On testera ensuite d'autres modles de copules vus en cours.
8