Académique Documents
Professionnel Documents
Culture Documents
Philippe Soulier
1 Objectif
Définition
Soit F une fonction de répartition sur R. On dit que F appartient au domaine d’attraction
du maximum d’une loi G si il existe des suites an et bn telles que
lim F n (bn + an x) = G(x) , (1)
n→∞
Les lois limites possibles sont les lois de valeurs extrêmes généralisées (GEV) Gγ,µ,σ , γ, µ ∈ R,
σ > 0, définies par
Gγ,µ,σ (x) = exp{−(1 + γ(x − µ)/σ)−1/γ } , si γ 6= 0 ,
−(x−µ)/σ
G0 (x) = e−e ,
définies pour x tel que 1 + γ(x − µ)/σ > 0. On note Gγ = Gγ,0,1 et la loi G0 est appelée loi
de Gumbel. Si X suit la loi Gγ,µ,σ , alors (X − µ)/σ suit la loi Gγ .
Les lois de valeurs extrêmes sont aussi les lois max-stables. Soit G une fonction de répartition
telle qu’il existe des suites {an } et {bn } vérifiant
Gn (bn + an x) = G(x)
pour tout x, alors G est une loi GEV.
1
Caractérisation des domaines d’attraction
Soit F une fonction de répartition. On dit que F est dans le domaine d’attraction du maximum
de la loi Gγ , noté F ∈ M DA(Gγ ) si (1) a lieu avec G = Gγ .
Soit U la fonction croissante définie sur [1, ∞[ par
←
→ 1
U (t) = F (1 − 1/t) = (t) .
1−F
Alors F est dans le domaine d’attraction de la loi Gγ si et seulement si il existe une fonction
ψ telle que
U (tx) − U (t)
lim∗ = hγ (x) (2)
t→t ψ ◦ U (t)
où t∗ = sup{t ∈ R , F (t) < 1} et
(
x tγ −1
si γ 6= 0 ,
Z
γ−1 γ
hγ (x) = t dt =
1 log(t) si γ = 0 .
La fonction ψ est appelée fonction auxiliaire et est définie à équivalence asymptotique près,
i.e. si ψ̃ vérifie limt→∞ ψ(t)/ψ̃(t) = 1, alors on peut remplacer ψ par ψ̃ dans (2). Les suites
normalisantes de la condition (1) peuvent être choisies de la façon suivante :
La condition (1) est équivalente à la convergence des excès conditionnels qui peut s’exprimer
de façon équivalente par l’une ou l’autre des limites suivantes
La fonction 1 − log Gγ (x) est une fonction de répartition. Pour µ ∈ R et σ > 0, on définit la
loi de Pareto généralisée Pγ,µ,σ par Pγ,µ,σ (x) = 1 − log Gγ ((x − µ)/σ)
2
Convergence des moments
Si γ ≥ 0 et p < 1/γ,
∞ ∞
E[(X − x)p | X > x]
Z Z
p
lim = x d{− log Gγ (x)} = p xp−1 {− log Gγ (x)} dx
x→∞ ψ(x)p
(0 0
p! si γ = 0 ,
= R∞
p 0 xp−1 (1 + γx)−1/γ dx si γ > 0 .
Pour 0 ≤ γ < 1 et p = 1, on a
E[X − x | X > x] 1
lim = . (5)
x→∞ ψ(x) 1−γ
Statistiques d’ordre
Soit X1 , . . . , Xn des variables aléatoires i.i.d. de loi F . Les statistiques d’ordre de l’échantillon,
notées X(n:1) , . . . , X(n:n) , sont les observations ordonnées en croissant.
Si F appartient au domaine d’attraction d’une loi de valeurs extrêmes Gγ , alors on peut
étudier le comportement asymptotique de la k-ème plus grande observation X(n:n−k+1) dans
le cas où k est fixe et dans le cas où k → ∞ pas trop vite.
• Pour tout entier k fixé,
Z (1+γx)−1/γ
1
lim P(X(n:n−k+1) ≤ U (n) + ψ ◦ U (n)x) = uk−1 e−u du
n→∞ (k − 1)! 0
• Si kn est une suite croissante d’entiers telle que kn → ∞ et kn /n → 0 (une telle suite est
appelée suite intermédiaire), alors
X(n:n−kn ) − U (n/kn )
→0,
ψ ◦ U (n/kn )
Exemples
La limite (3) est donc une égalité stricte pour tout t. C’est la propriété caractéristique de
la loi exponentielle. la fonction auxiliaire est donc ψ ≡ 1.
• La loi normale centrée réduite est dans le domaine d’attraction de la loi de Gumbel. On
peut choisir pour fonction auxiliaire ψ(x) = 1/x.
3
• Loi de Pareto. Une variable aléatoire positive X est dite de type Pareto si sa fonction de
survie F̄ (x) = P(X > x) est de la forme
F̄ (tx)
lim = x−α
t→∞ F̄ (t)
pour un α > 0 et pour tout x > 0. On dit que F̄ est à variation régulière à l’infini d’indice
−α. Le réel α est appelé l’indice de Pareto ou de queue de la loi de X, et X est dans le
domaine d’attraction de la loi Gγ avec γ = 1/α > 0. Il suffit de vérifier (3) en choisissant
pou fonction auxiliaire ψ(x) = γx :
F̄ (t + tx)
lim = (1 + γx)−1/γ .
t→∞ F̄ (t)
• Loi uniforme. La loi uniforme sur [0, 1] est dans le domaine d’attraction de la loi G−1 . On
peut calculer directement
lim P n{ max Ui − 1} ≤ x = ex
n→∞ 1≤i≤n
On a donc la limite (1) avec an = 1/n et bn = 1 − 1/n. On peut aussi voir que 51 − U )−1
est une loi de type Pareto d’indice −1.
3 Estimation
4
Méthode des excès
Etant données n observations i.i.d. de la loi F ∈ M DA(Gγ ), cette méthode dite méthode
POT (peaks over threshold) consiste à ne conserver que les observations dépassant un cer-
tain seuil (threshold), soit déterministe et le nombre d’observation conservées est aléatoire,
soit une statistique d’ordre X(n:n−k) et le nombre d’observations conservées est k. Pour ces
observations, on utilise la limite (3) qui justifie l’approximation pour x grand et y > x,
P(X > y)
≈ (1 + γ(y − x)/σ)−1/γ (6)
P(X > x)
avec σ = ψ(x). La loi des observations plus grande que x étant précisément la loi conditionnelle
sachant X > x, on applique la méthode du maximum de vraisemblance à ces observations
considérées comme suivant la loi de Pareto généralisée Pγ,x,σ . Si l’on a choisit le seuil X(n:n−k)
les observations sont donc Yj = X(n:n−j+1) − X(n:n−k) , 1 ≤ j ≤ k. La log-vraisemblance est
donc
k
X
1 γYj
`(γ, σ) = −k log σ − +1 log 1 + , (γ 6= 0) ,
γ σ
j=1
k
1X
`(0, σ) = −k log σ − Yj .
σ
j=1
Estimateur de Hill
Cet estimateur est consistant pour toute suite intermediaire k, et asymptotiquement normal
si l’on peut convenablement choisir la suite k, en fonction de conditions dites du second ordre.
Soit p ∈]0, 1[. Le quantile x(p) d’ordre 1 − p est défini par 1 − F (x(p)) = p. Si p est très petit
par rapport au nombre d’observations, i.e. p 1/n, une estimation empirique est impossible.
Un modèle semi-paramétrique est nécessaire. Ceci signifie que l’on va modéliser la queue de
distribution par une loi de valeurs extrêmes, tandis que des probabilités non extrêmes seront
estimées empiriquement, soit avec la fonction de répartition empirique Fn définie par
n
X
Fn (x) = n−1 1{Xi ≤x} . (7)
i=1
5
Si la loi des observations est dans le domaine d’attraction d’une loi de valeurs extrêmes, on
peut utiliser la méthode des excès. On utilise l’approximation (6)
On estime les paramètres γ et σ de la loi de Pareto généralisée avec les plus grandes observa-
tions, et pour un seuil x choisi en fonction des observations (et donc aléatoire) x = X(n:n−k) ,
on estime la probabilité de dépassement du seuil par
\ k
P(X > x) = 1 − Fn (X(n:n−k) ) = .
n
Pour des estimateurs γ̂ et σ̂ de γ et σ, l’estimateur du quantil extrême x̂(p) est caractérisé
par
k
p= (1 + γ̂(x̂(p) − X(n:n−k) )/σ̂)−1/γ̂ ,
n
soit
σ̂ n o
x̂(p) = X(n:n−k) + (k/np)γ̂ − 1 .
γ̂
Dans le cas γ > 0, on peut choisir ψ(x) = γx. On prend donc σ̂ = γ̂X(n:n−k) et
où x+ = max(x, 0). Si la loi F des sinistres appartient au domaine d’attraction d’une loi de
valeurs extrêmes, Pour R grand et 0 ≤ γ < 1, la relation (5) suggère l’approximation
ψ(R)
Π(R) ≈ P(X > R) . (9)
1−γ
Si F ∈ M DA(Gγ ) avec γ > 0, on a ψ(R) = γR. On choisit pour seuil R = X(n:n−k) , on estime
la probabilité P(X > R) empiriquement comme en (8) et on remplace γ par un estimateur γ̂
dans (9). On obtient alors un estimateur de la prime nette pour R = X(n:n−k) défini par
\ γ̂ k
Π(X(n:n−k) ) = X .
1 − γ̂ n (n:n−k)
6
3.4 Lois de type Weibull
Le domaine d’attraction de la loi de Gumbel est très vaste et l’approximation peut-être très
mauvaise. Pour obtenir de meilleures approximations, on peut se restreindre aux lois de type
Weibull.
Une fonction de répartition F est dite de type Weibull si
β +o(xβ )
F̄ (x) = e−cx , c, β > 0 .
Le paramètre β est appelé paramètre de forme. Une loi de type Weibull est dans le domaine
d’attraction de la loi de Gumbel avec pour fonction auxiliaire
1 1−β
ψ(x) = x .
cβ
Un estimateur de β est donné par
Pk
i=1 {log X(n:n−i+1) − log X(n:n−k) }
β̂ = Pk
i=1 {log log(n/i) − log log(n/(k + 1))}
Soit X1 , . . . , Xn , . . . une suite de variables de même loi F ∈ M DA(Gγ ). Si les variables sont de
plus indépendantes, il existe des suites an et bn telles que (max1≤i≤n Xi −bn )/an converge vers
la loi Gγ . Que peut-on dire si les observations ne sont pas indépendantes ? Dans certains cas,
il existe un réel θ ∈]0, 1] appelé indice extrémal de la suite {Xi } tel que (max1≤i≤n Xi −bn )/an
converge vers la loi Gθγ , i.e.
lim P max Xi ≤ bn + an x = Gθγ (x) .
n→∞ 1≤i≤n
7
Exemple Soit Yi une suite i.i.d. de loi F ∈ M DA(Gγ ) et soit Xi = max(Yi , Yi+1 ). Alors
l’indice extrémal de la suite {Xi } est 1/2.
Soit (X (1) , . . . , X (d) ) un vecteur aléatoire de loi F . On dit que F est dans le domaine d’at-
(i)
traction du maximum d’une loi de valeurs extrêmes multivariée G si il existe des suites an ,
(i)
bn , 1 ≤ i ≤ d telles que
(1) (1) (d) (i)
!
max1≤i≤n Xi − bn max1≤i≤n Xi − bn
lim P (1)
≤ x1 , . . . , (i)
≤ xd = G(x1 , . . . , xd ) ,
n→∞ an an
(1) (d)
pour une suite i.i.d. (Xi , . . . , Xi ) de vecteurs aléatoires de loi F .
Par transformation marginale, on peut en théorie toujours se ramener au cas où les lois
marginales de F sont identiques et dans le domaine d’attraction d’une loi Gγ avec γ > 0. On
peut alors caractériser les lois limites multivariées G possibles. Pour simplifier les notations,
on se restreint au cas d = 2.
Théorème Soit F la fonction de répartition bivariée d’un couple (X, Y ) de lois marginales
égales H ∈ M DA(Gγ ) avec γ > 0. Soit an une suite vérifiant limn→∞ nP(X > an ) = 1. La
loi F est dans un domaine d’attraction du maximum si et seulement si il existe une mesure ν
sur Rd+ telle que
max1≤i≤n Xi max1≤i≤n Yi
lim P ≤ x, ≤ y = exp{−ν[([0, x] × [0, y])c ]} ,
n→∞ an an
ou de façon équivalente
X Y P (X > tx ou Y > ty)
lim nP > x ou > y = lim = ν[([0, x] × [0, y])c ] ,
n→∞ an an t→∞ P(X > t)
et la mesure ν a les propriétés suivantes :
ν(A) < ∞ si A est séparé de 0, (10)
∀t > 0 , ν(tA) = t−1/γ ν(A) . (11)
Plus généralement, on a, pour tout ensemble A séparé de 0,
(X, Y ) P ((X, Y ) ∈ tA)
lim nP ∈ A = lim = ν(A) , (12)
n→∞ an t→∞ P(X > t)
Exemples
• Si X et Y sont indépendantes, alors
X Y X Y X Y
nP > x ou > y = nP > x + nP > y − nP > x et >y
an an an an an an
→ x−1/γ + y −1/γ .
8
La mesure νind est donc portée par les axes [0, ∞] × {0} et {0} × [0, ∞], c’est-à-dire que pour
tout A ⊂ R2+ , séparé de 0, si l’on pose A1 = A ∩ [0, ∞[×{0} et A2 = A ∩ {0} × [0, ∞[,
Z Z
1 1
νind (A) = x−1/γ−1 dx + y −1/γ−1 dy .
γ A1 γ A2
Applications
• Probabilité de défaut simultané. Soit X et Y deux variables aléatoires représentés des risques
(actifs financiers, coûts de sinistres, etc.) On s’intérésse à la probabilité de défaut simultané :
P(X > D1 et Y > D2 ) lorsque les seuils D1 et D2 sont grands, ce que l’on formalise en
considérant des seuils dilatés an D1 et an D2 , avec nP(X > an ) ∼ 1. On a alors
Il reste donc à calculer ν(]D1 , ∞[×]D2 , ∞[) dans chacun des trois exemples précédents.
– Indépendance. On a vu que ν(]D1 , ∞[×]D2 , ∞[) = 0 et donc
– Cas X = U + V , Y = V + W , U, V, W i.i.d.
1
lim nP(X > an D1 et Y > an D2 ) = ν(]D1 , ∞[×]D2 , ∞[) = (D1 ∨ D2 )−α .
n→∞ 2
• Portefeuille. Soit X et Y les coûts unitaires de deux contrats détenus en quantité a et b
dans un portefeuille. Le coût total du portefeuille est aX + bY . On s’intéresse à la probabilité
9
que le coût total dépasse un seuil D : P(aX + bY > D). Soit A = {(x, y) ∈ R2+ | ax + by > 1}.
On a alors
On va déterminer dans les trois exemples précédents la valeur de ν(A) pour quantifier l’influ-
ence de la dépendance.
– Indépendance.
– Comonotonie.
νc (A) = (a + b)1/γ .
– Cas X = U + V , Y = V + W , U, V, W i.i.d.
1
ν(A) = {a1/γ + b1/γ + (a + b)1/γ } .
2
• Prime nette. Si γ < 1, on peut calculer la prime nette pour un contrat où le réassureur
intervient si X + Y dépasse la rétention R, soit
Z ∞ Z ∞
Π(R) = E[(X + Y − R)+ ] = P(X + Y > x) dx = R P(X + Y > Rt) dt
R 1
En posant At = {(x, y) ∈ R2+ | x + y > t}, la limite (12) et la propriété d’homogénéité (11)
permettent l’approximation
Z
P(X + Y > Rt)
Π(R) = RP(X > R) dt
1 P(X > R)
Z Z
RP(X > R)
∼ RP(X > R) ν(At ) dt = RP(X > R)ν(A1 ) t−1/γ dt = ν(A1 ) .
1 1 1−γ
νind (A1 ) = 2 .
– Comonotonicité.
νc (A1 ) = 21/γ .
– Cas X = U + V , Y = V + W , U, V, W i.i.d.
ν(A1 ) = 1 + 21/γ−1 .
10