Vous êtes sur la page 1sur 166

Processus stochastiques

M2 Mathématiques

Jean-Christophe Breton
Université de Rennes 1
Octobre–Décembre 2020

Version du 20 octobre 2019


2
Table des matières

I Processus stochastiques 1
1 Processus stochastiques 3
1.1 Loi d’un processus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Régularité des trajectoires . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Convergence faible des lois de processus . . . . . . . . . . . . . . . . . . . . 10
1.3.1 Rappels sur la convergence faible . . . . . . . . . . . . . . . . . . . 11
1.3.2 Équitension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Processus gaussiens 17
2.1 Lois des processus gaussiens . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Régularité gaussienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Espace gaussien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4 Exemples de processus gaussiens . . . . . . . . . . . . . . . . . . . . . . . . 23

3 Mouvement brownien 29
3.1 Historique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 Définition, premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.1 Propriétés immédiates . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 Propriétés en loi du mouvement brownien . . . . . . . . . . . . . . . . . . 33
3.4 Propriétés trajectorielles du mouvement brownien . . . . . . . . . . . . . . 35
3.4.1 Loi du 0/1 de Blumenthal . . . . . . . . . . . . . . . . . . . . . . . 35
3.4.2 Conséquences trajectorielles de la loi du 0/1 de Blumenthal . . . . . 39
3.4.3 Régularité trajectorielle brownienne . . . . . . . . . . . . . . . . . . 40
3.5 Variation quadratique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.6 Propriété de Markov forte . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.6.1 Temps d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.6.2 Propriété de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.6.3 Principe de réflexion . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.7 Équation de la chaleur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.7.1 Origine physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.7.2 Origine mathématique . . . . . . . . . . . . . . . . . . . . . . . . . 51

i
ii Table des matières

II Martingales 55
4 Martingales en temps continu 57
4.1 Filtration et processus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.2 Filtrations et temps d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.3 Martingales en temps continu . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.1 Définition, exemples . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.2 Inégalités pour martingales en temps continu . . . . . . . . . . . . . 65
4.3.3 Régularisation de trajectoires . . . . . . . . . . . . . . . . . . . . . 67
4.3.4 Théorèmes de convergence . . . . . . . . . . . . . . . . . . . . . . . 69
4.3.5 Théorème d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4 Processus de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

5 Semimartingales continues 77
5.1 Processus à variation bornée . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.1.1 Fonctions à variation finie . . . . . . . . . . . . . . . . . . . . . . . 77
5.1.2 Intégrale de Stieltjes . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.1.3 Extension de l’intégration de Stieltjes à R+ . . . . . . . . . . . . . . 81
5.1.4 Processus à variation finie . . . . . . . . . . . . . . . . . . . . . . . 81
5.2 Martingales locales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.3 Variation quadratique d’une martingale locale . . . . . . . . . . . . . . . . 87
5.4 Semimartingales continues . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

III Intégration stochastique 103


6 Intégration stochastique 105
6.1 Par rapport à une martingale bornée dans L2 . . . . . . . . . . . . . . . . 105
6.2 Par rapport à une martingale locale . . . . . . . . . . . . . . . . . . . . . . 112
6.3 Par rapport à une semimartingale . . . . . . . . . . . . . . . . . . . . . . . 117
6.4 Cas non continu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

7 Formule d’Itô et conséquences 121


7.1 Formule d’Itô . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.2 Théorème de Lévy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
7.3 Dubins-Schwarz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.4 Inégalités de Burkholder-Davis-Gundy . . . . . . . . . . . . . . . . . . . . 134
7.5 Représentation des martingales browniennes . . . . . . . . . . . . . . . . . 140
7.6 Formule de Tanaka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Introduction

Ces notes de cours ont pour but de présenter le mouvement brownien et l’intégration sto-
chastique. Elles sont principalement destinées aux étudiants du Master 2 00 Mathématiques
et applications00 de l’Université de Rennes 1. Ces notes ont plusieurs sources d’inspiration,
dont principalement [LG1] mais aussi les notes de cours [Gué], [EGK], [Mal]. Par ailleurs,
des références standards conseillées sur le sujet sont les livres [KS], [RY] (en anglais) et
[Gal], [CM] (en français).
Le contenu de ces notes est le suivant : On commence par quelques rappels gaussiens en
introduction. La notion générale de processus stochastique est présentée au Chapitre 1. Le
Chapitre 2 introduit la classe des processus gaussiens. Ces chapitres s’inspirent de [Dav] et
des références classiques sont [Bil2], [Kal].
Au Chapitre 3, on présente le mouvement brownien, processus stochastique central, dont
on discute de nombreuses propriétés.
Au Chapitre 4, on introduit la notion de martingale en temps continu. On revisite les prin-
cipales propriétés connues dans le cas des martingales discrètes.
La notion de semimartingale, essentielle dans la théorie de l’intégration stochastique, est
présentée au Chapitre 5.
Le Chapitre 6 est consacré à la construction des intégrales stochastiques et à ses principales
propriétés.
On achève ces notes avec la formule d’Itô dans le Chapitre 7. Ce résultat est essentiel et
constitue le point de départ du calcul stochastique qui est la suite natuelle de cours et pour
laquelle on renvoie à [JCB-stoch].

Les prérequis de ce cours sont des probabilités de base (des fondements des probabilités
aux conséquences de la LGN et du TCL – niveau L3) pour lesquelles on pourra consulter
[JCB-proba], les martingales en temps discret (niveau M1), voir [JCB-martingale].

iii
iv ©JCB – M2 Math. – Université de Rennes 1
Rappels gaussiens

Dans ce chapitre, on rappelle les principaux résultats sur les variables aléatoires gaus-
siennes et sur les vecteurs aléatoires gaussiens. Ces rappels seront utiles pour généraliser le
cadre gaussien aux processus au Chapitre 2 et présenter la notion de processus gaussien.

Variables gaussiennes
Définition 0.1 Une variable aléatoire X suit la loi normale standard N (0, 1) si elle admet
pour densité
1
t ∈ R 7→ √ exp − t2 /2 .


De façon générale, une variable aléatoire X suit la loi normale N (m, σ 2 ) (m ∈ R, σ 2 > 0)
si elle admet pour densité

(t − m)2
 
1
t ∈ R 7→ √ exp − .
2πσ 2 2σ 2

Si σ 2 = 0, la loi est dégénérée, la variable aléatoire X est constante égale à m. Sa loi est
une mesure de Dirac en m : PX = δm .

Proposition 0.1 Une variable aléatoire X ∼ N (m, σ 2 ) peut se voir comme la translatée et
la dilatée de X0 ∼ N (0, 1) par X = m + σX0 .

Autrement dit si X ∼ N (m, σ 2 ), σ 2 > 0, on définit la variable aléatoire centrée réduite


e = (X−m)/σ. Elle suit la loi N (0, 1). Cette action s’appelle 00 centrer, réduire00 .
X

Proposition 0.2 Une variable aléatoire X de loi N (m, σ 2 ) a pour


— espérance : E[X] = m ;
— variance : Var(X) = σ 2 ; 
— fonction caractéristique : ϕX (t) = exp imt − σ 2 t2 /2 .
Si X ∼ N (0, σ 2 ) alors les moments de X sont donnés pas

 (2n)!
E X 2n = n σ 2n E X 2n+1 = 0.
  
et (1)
2 n!

v
vi ©JCB – M2 Math. – Université de Rennes 1

Démonstration :[Esquisse] Centrer, réduire pour se ramener à X ∼ N (0, 1). Calculs simples
pour E[X], Var(X). Pour la fonction caractéristique, identifier les fonctions holomorphes
2
E[ezX ] et ez /2 pour z ∈ R et considérer z = ix. Pour les moments de tous ordres faire des
intégrations par parties successives. 

L’estimation de la queue normale suivante s’avère utile : pour N ∼ N (0, 1) et x ≥ 1, on a


Z +∞ Z +∞
1 −t2 /2 1 2 1 2
P(N ≥ x) = √ e dt ≤ √ te−t /2 dt ≤ √ e−x /2 . (2)
2π x 2π x 2π
En fait, on a une estimation valable pour tout x > 0 et meilleure si x ≥ 1 :
Proposition 0.3 Soit N ∼ N (0, 1) et x > 0 alors
1
P(N ≥ x) ≤ √ exp(−x2 /2).
2πx2
Démonstration : En notant f (x) = √1 exp(−x2 /2), on a
x 2π

exp(−x2 /2) 1 exp(−x2 /2) exp(−x2 /2)


f 0 (x) = − √ − 2 √ ≤− √ .
2π x 2π 2π
D’où
Z +∞ Z +∞
1 +∞
√ exp(−u2 /2)du ≤ − f 0 (u)du = − f (u) x = f (x).

P(N ≥ x) =
x 2π x

Proposition 0.4 Soient N1 ∼ N (m1 , σ12 ) et N2 ∼ N (m2 , σ22 ) indépendantes. Alors N1 +


N2 ∼ N (m1 + m2 , σ12 + σ22 ).

Démonstration : Par les fonctions caractéristiques, avec l’indépendance, on a :

ϕN1 +N2 (t) = ϕN1 (t)ϕN2 (t) = exp im1 t − σ12 t2 /2 exp im2 t − σ22 t2 /2
 

= exp i(m1 + m2 )t − (σ12 + σ22 )t2 /2 = ϕN (m1 +m2 ,σ12 +σ22 ) (t)


ce qui prouve le résultat. 


Proposition 0.5 Soit (Xn )n≥1 une suite de variables normales de loi N mn , σn2 .
1. La suite (Xn )n≥1 converge en loi ssi mn → m ∈ R et σn2 → σ 2 ∈ R+ . La loi limite
est alors N (m, σ 2 ).
2. Si la suite (Xn )n≥1 converge en probabilité vers X, la convergence a lieu dans tous
les espaces Lp , p < +∞.
vii

Démonstration : 1) D’après le théorème de Paul Lévy, la convergence en loi Xn =⇒ X est


équivalente à avoir pour tout t ∈ R :
σn2 2
 
ϕXn (t) = exp imn t − t → ϕX (t), n → +∞. (3)
2

Comme ϕX est continue et ϕX (0) = 1, il existe t 6= 0 tel que |ϕX (t)| 6= 0. Pour ce t, en
2
prenant le module dans (3), on a exp(− σ2n t2 ) → |ϕX (t)|. On déduit alors que limn→+∞ σn2 =
− t22 ln |ϕX (t)| := σ 2 existe. Par suite, on a aussi

exp imn t → exp σ 2 t2 /2 ϕX (t).


 

Supposons que (mn )n≥1 est non bornée. On construit alors une sous-suite mnk → +∞,
k → +∞ (ou −∞ ce qui mène à un raisonnement analogue). Alors pour tout η > 0,
1
P(X ≥ η) ≥ lim sup P(Xnk ≥ η) ≥
k→+∞ 2

puisque, pour k assez grand, P(Xnk ≥ η) ≥ P(Xnk ≥ mk ) = 1/2 (la moyenne mk étant
aussi la médiane). En faisant η → +∞, on a P(X = +∞) ≥ 1/2, ce qui est absurde car
P(X ∈ R) = limn→+∞ P(Xn ∈ R) = 1.
On a donc (mn )n≥1 bornée. Dès lors, si m et m0 sont deux valeurs d’adhérence de (mn )n≥1 ,
0
en passant à la limite sur les bonnes sous-suites, on doit avoir eimt = eim t pour tout t ∈ R,
ce qui exige m = m0 . Il y a donc unicité de la valeur d’adhérence, c’est à dire existence de
la limite m de mn .
Finalement, mn → m et σn → σ (n → +∞) et en passant à la limite dans (3), on a :
 σ2 
ϕX (t) = exp imt − t2
2
ce qui assure X ∼ N (m, σ 2 ).
2) On écrit Xn = σn Nn + mn avec Nn ∼ N (0, 1). Comme Xn converge en loi, les suites
(mn )n≥1 et (σn )n≥1 sont bornées d’après la partie 1). Par convexité pour q ≥ 1

|σn N + mn |q ≤ 2q−1 (|σn |q ||N |q + |mn |q )

et l’expression des moments de Nn , donnée en (1) assure alors

sup E |Xn |q < +∞ ∀q ≥ 1.


 
n≥1

Comme la convergence en probabilité donne la convergence ps d’une sous-suite Xnk , par le


lemme de Fatou, on a :
h i
E |X| = E lim |Xnk | ≤ lim inf E[Xnk |q ] ≤ sup E |Xnk |q ≤ sup E |Xn |q < +∞.
 q q
   
k→+∞ k→+∞ k≥1 n≥1
viii ©JCB – M2 Math. – Université de Rennes 1

Soit p ≥ 1, la suite |Xn − X|p converge vers 0 en probabilité et est uniformément intégrable
car bornée dans L2 (d’après ce qui précède avec q = 2p). Elle converge donc dans L1 vers
0, ce qui prouve 2) dans la Prop. 0.5. 

Le caractère universel de la loi normale est illustré par le résultat suivant. Il montre que la
loi normale standard contrôle les fluctuations par rapport à leur moyenne des effets cumulés
d’un phénomène aléatoire répété avec des répétitions indépendantes.
Dans la suite, iid signifiera indépendant(e)s et identiquement distribué(e)s, c’est à dire
de même loi. Souvent, on notera aussi vaiid pour variables aléatoires indépendantes et
identiquement distribuées.

Théorème 0.1 (TCL) Soit (Xn )n≥1 une suite de variables aléatoires iid, d’espérance m et
de variance finie σ 2 > 0. Soit Sn = X1 + · · · + Xn la somme partielle. Alors

Sn − nm
√ =⇒ N (0, 1), n → +∞.
σ2n

Remarque 0.1 — Le TCL complète la loi des grands nombres : en effet, la LGN donne
Sn /n → m, c’est à dire
√ Sn − nm ≈ 0. Le TCL donne la vitesse de cette convergence
(en loi) : elle est en n. Noter que la convergence est presque sûre dans la LGN et
en loi (donc beaucoup plus faible) dans le TCL.
— La loi N (0, 1) apparaı̂t à la limite dans le TCL alors que les variables aléatoires Xi
sont de lois arbitraires (de carré intégrable) : ce résultat justifie le rôle universel de
la loi normale. Elle modélise les petites variations de n’importe quelle loi (avec un
moment d’ordre 2) par rapport à sa moyenne.

Démonstration : D’après le théorème de Paul Lévy, il suffit de montrer la convergence


des fonctions caractéristiques. Posons Yi = (Xi − m)/σ, si bien que les variables aléatoires
Yi sont indépendantes de même loi avec E[Yi ] = 0, Var(Yi ) = Var(Xi )/σ 2 = 1. Notons
0
Sn
Sn0 = Y1 + · · · + Yn et Zn = Sn√−nm
n
=√ n
. On a

Sn0
       
t 0 t
ϕZn (t) = E exp it √ = E exp i √ Sn = ϕSn0 √
n n n
      n
t t t
= ϕY1 √ . . . ϕYn √ = ϕ Y1 √
n n n

en utilisant ϕY1 +···+Yn = ϕY1 . . . ϕYn = ϕnY1 par indépendance et identique distribution des
variables aléatoires Yi .
Comme Y1 a un moment d’ordre 2, ϕY1 est dérivable 2 fois avec ϕY1 (0) = 1, ϕ0Y1 (0) =
iE[Y1 ] = 0 et ϕ00Y1 (0) = i2 E[Y12 ] = −1. La formule de Taylor à l’ordre 2 en 0 donne alors

x2 00 x2
ϕY1 (x) = ϕY1 (0) + xϕ0Y1 (0) 2
+ ϕY1 (0) + x (x) = 1 − + x2 (x)
2 2
ix

où la fonction  vérifie limx→0 (x) = 0. On a donc

n !n  n
t2 √ t2 √
 
t t 1
ϕZn (t) = ϕY1 √ = 1 − √ 2 + √ 2 (t/ n) = 1− + (1/ n)
n 2 n n 2n n
t2 √  t2 √ 
    
 1 1
= exp n ln 1 − + (1/ n) = exp n − + (1/ n)
2n n 2n n

 2 
t
= exp − + (1/ n) .
2

(Noter que la fonction reste (·) dans ϕY1 est à valeurs complexes si bien qu’il est un peu
rapide de prendre directement le logarithme comme précédemment. Cependant l’argument
peut être précisé sans passer par la forme exponentielle avec les logarithmes ; on renvoie à
un (bon) cours de L3 ou de M1.) On a donc pour chaque t ∈ R,

lim ϕZn (t) = exp − t2 /2 = ϕN (0,1) (t).



n→+∞

Le théorème de Paul Lévy donne alors la convergence en loi de Zn vers N (0, 1), ce qui
prouve le TCL. 

Remarque 0.2 En général, lorsque n est grand, on approxime la loi d’une somme de va-
riables aléatoires iid de L2 (Ω) par une loi normale grâce au TCL de la façon suivante : Soit
Sn = X1 + · · · + Xn la somme de variables aléatoires iid Xi avec σ 2 < +∞, on a d’après le
TCL
X1 + · · · + Xn − nE[X1 ]
√ =⇒ N (0, 1).
σ n
−nE[X1 ]
Quand n est grand, on approxime alors la loi de X1 +···+X√n
σ n
par celle de N ∼ N (0, 1).
Si bien que la loi de la somme Sn = X1 + · · · + Xn est approximée par celle de

nE[X1 ] + σ nN ∼ N nE[X1 ], σ 2 n .


Règle d’approximation : La somme Sn d’une suite de vaiid L2 de moyenne m et de variance


σ 2 s’approxime par Sn ≈ N (nm, nσ 2 ).

Application (Moivre-Laplace). Comme une variable aléatoire Xn de loi binomiale B(n, p)


peut se voir comme la somme de n variables aléatoires i 1 ≤ i ≤ n, indépendantes de loi
de Bernoulli b(p), Xn = 1 + · · · + n , la remarque précédente montre qu’on peut approcher
la loi B(n, p) par la loi normale N np, np(1 − p) .
x ©JCB – M2 Math. – Université de Rennes 1

Vecteurs gaussiens
On considère des vecteurs aléatoires dans Rn . Muni de son produit scalaire canonique,
Rn est un espace n
Pn euclidien. Pour deux vecteurs a = (a1 , . . . , an ), b = (b1 , . . . , bn ) ∈ R , on
note ha, bi = i=1 ai bi leur produit scalaire. On peut généraliser cette section à un espace
E euclidien (si dim(E) = n alors E ∼ Rn ).

Définition 0.2 (Vecteur gaussien) Un vecteur aléatoire X = (X1 , . . . , Xn ) est gaussien si


et seulement si toutes les combinaisons linéaires de ses coordonnées ha, Xi = a1 X1 + · · · +
an Xn suivent une loi gaussienne dans R (pour tout a = (a1 , . . . , an ) ∈ Rn ).
Dans un cadre euclidien E, X vecteur à valeurs dans E est gaussien ssi pour tout a ∈ E,
ha, Xi suit une loi gaussienne.

En particulier, chaque marginale Xi suit une loi normale et a donc un moment d’ordre 2
fini. Les moments joints E[Xi Xj ], 1 ≤ i, j ≤ n, sont donc bien définis (par l’inégalité de
Cauchy-Schwarz) et on peut définir licitement la matrice de covariance :

Définition 0.3 La matrice de covariance d’un vecteur gaussien X = (X1 , . . . , Xn ) est la


matrice carrée symétrique, positive

K = Cov(Xi , Xj ) 1≤i,j≤n .

Si det K = 0, le vecteur est dit dégénéré.


L’espérance de X = (X1 , . . . , Xn ) est le vecteur des espérances de ses marginales

E[X] = E[X1 ], . . . , E[Xn ] .

Si E[X] = 0, le vecteur X est dit centré.

Fonction caractéristique gaussienne en dimension n


Pn
Si X = (X1 , . . . , Xn ) est un vecteur gaussien alors ha, Xi = i=1 ai Xi suit une loi
normale de paramètres
 
E ha, Xi = E[a1 X1 + · · · + an Xn ] = a1 E[X1 ] + · · · + an E[Xn ] = ha, E[X]i,
Xn
ai aj Cov(Xi , Xj ) = at Cov(X)a.

Var ha, Xi = Var(a1 X1 + · · · + an Xn ) =
i,j=1


La variable aléatoire ha, Xi suit donc la loi N ha, E[X]i, at Cov(X)a , sa fonction caracté-
ristique est donnée par
 
1 t  2
ϕha,Xi (x) = exp ixha, E[X]i − a Cov(X)a x .
2
xi

D’après la définition des fonctions caractéristiques d’une variable aléatoire et d’un vecteur
aléatoire
ϕX (x) = E eihx,Xi = ϕhx,Xi (1).
 

On en déduit :

Proposition 0.6 La fonction caractéristique d’un vecteur gaussien X = (X1 , . . . , Xn ) est


donnée par
 
1 t
ϕX (x) = exp ihx, E[X]i − (x Cov(X)x)
2
 
1
= exp ihx, E[X]i − hx, Cov(X)xi . (4)
2

Remarque 0.3 — La loi d’un vecteur gaussien est connue dès qu’on a le vecteur moyenne
E[X] et la matrice de covariance Cov(X).
— On parle du vecteur gaussien standard en dimension n lorsque E[X] = 0 et Cov(X) =
In . Sa fonction caractéristique se simplifie en

ϕX (x) = exp − hx, xi/2 = exp − kxk2 /2 .


 

— Pour un vecteur gaussien centré, on a E[X] = 0 et on montre que

hx, Cov(X)xi = E[hx, Xi2 ],

si bien que dans le cas centré la fonction caractéristique se réécrit :


   
1 1  2

ϕX (x) = exp − hx, Cov(X)xi = exp − E hx, Xi .
2 2

— En prenant x = (x1 , 0, . . . , 0), on a

ϕX1 (x1 ) = ϕX (x) = exp iE[X1 ]x1 − Var(X1 )x21 /2 .





On retrouve que X1 ∼ N E[X  1 ], Var(X1 ) . Plus généralement, pour tout 1 ≤ i ≤ n,
on a Xi ∼ N E[Xi ], Var(Xi ) .

Comme pour les variables aléatoires gaussiennes, on peut se ramener à un vecteur gaussien
standard en centrant et en réduisant un vecteur gaussien quelconque non dégénéré. On a
en effet :

Proposition 0.7 Soit X ∼ N (m, K) un vecteur gaussien non dégénéré (ie. det K =
6 0)
avec m ∈ Rn et K sa matrice de covariance. Alors
√ −1
K (X − m) ∼ N (0, In ). (5)
xii ©JCB – M2 Math. – Université de Rennes 1

Si X ∼ N (m, K) est dégénéré, c’est que le vecteur X vit dans un sous-espace vectoriel
strict de Rn . Il faut l’étudier dans ce sous-espace vectoriel.
Démonstration : Comme le vecteur X est non dégénéré, sa matrice√ de covariance K est
définie (c’est à dire inversible). Il existe donc une matrice A = K inversible telle que
K = AAt . (Par la méthode de Cholesky, A peut être choisie triangulaire inférieure.) Il est
√ −1
donc légitime d’utiliser K dans (5).

On montre maintenant que X e = K −1 (X − m) est gaussien, standard :
h i
ϕXe (x) = E exp(ihx, Xi) e
h √ −1 i
= E exp(ihx, K (X − m)i)
h √ −1 i
= E exp(ih( K )t x, X − mi)
h √ −1 t i  √ −1 t 
= E exp(ih( K ) x, Xi) × exp −ih( K ) x, mi
 √ −1   √ −1 
= ϕX ( K )t x × exp −ih( K )t x, mi
√ −1 t 1 √ −1 t √ −1 t √ −1
   
= exp ihm, ( K ) xi − h( K ) x, K( K ) xi × exp −ih( K )t x, mi
2
1 √ −1 t √ −1 t
 
= exp − h( K ) x, K( K ) xi
2
1 √ −1 √ −1 t 1 √ −1 √ √ t √ −1 t
   
= exp − hx, K K( K ) xi = exp − hx, K K( K) ( K ) xi
2 2
   
1 1 2
= exp − hx, xi = exp − kxk .
2 2

e ∼ N (0, In ).
On a donc bien X 

Remarque 0.4 Comme pour les variables aléatoires normales, un vecteur aléatoire X ∼
N (m, K) avec K inversible peut se voir comme la translatée et dilatée du vecteur gaussien
standard N ∼ N (0, In ) : √
X ∼ KN + m.

Indépendance de variables gaussiennes


Proposition 0.8 Soient (X, Y ) un couple gaussien. Alors X et Y sont indépendantes si et
seulement si Cov(X, Y ) = 0.

Démonstration : Le sens direct est vrai quelque soit la loi de X et de Y et suit de E[XY ] =
E[X]E[Y ] lorsque X ⊥⊥ Y . Pour la réciproque, on sait que, lorsque (X, Y ) est un coupluie
xiii

gaussien, X et Y sont indépendantes si et seulement si ϕ(X,Y ) (t1 , t2 ) = ϕX (t1 )ϕY (t2 ).


Supposons le couple centré pour simplifier. Le vecteur gaussien (X, Y ) a une matrice de
covariance diagonale :  2 
σX 0
0 σY2
car les termes diagonaux sont Cov(X, Y ) = Cov(Y, X) = 0. On déduit de l’expression (4)
de la fonction caractéristique de (X, Y ) que, pour tout t1 , t2 ∈ R, on a
 1   1   1 
ϕ(X,Y ) (t1 , t2 ) = exp − 2
t21 σX + t2 σY2 2
= exp − t21 σX × exp − t22 σY2
2 2 2
= ϕX (t1 )ϕY (t2 ),
ce qui justifie l’indépendance de X et de Y et prouve la Prop. 0.8. 

Il est aisé de généraliser de la même façon le résultat pour des vecteurs. Attention, il faut
bien veiller à ce que, considérés ensemble, les vecteurs forment encore un vecteur gaussien,
sinon l’exemple ci-dessous montre que le résultat est faux (cf. aussi un autre exemple ci-
dessous).

Exemple 0.1 On considére une variable aléatoire X ∼ N (0, 1) et une seconde variable
aléatoire ε indépendante de X et telle que P(ε = 1) = P(ε = −1) = 1/2. Alors X1 =
X, X2 = εX sont deux variables aléatoire N (0, 1). De plus, Cov(X1 , X2 ) = E[X1 X2 ] =
E[ε]E[X 2 ] = 0. Cependant X1 et X2 ne sont évidemment pas indépendantes (par exemple
parce que |X1 | = |X2 |). Dans cet exemple, le couple (X1 , X2 ) n’est pas un vecteur gaussien
dans R2 bien que ses coordonnées soient des variables gaussiennes.
Proposition 0.9 Soit (X1 , . . . , Xn , Y1 , . . . , Yp ) un vecteur gaussien de dimension n + p. Les
deux vecteurs aléatoires X = (X1 , . . . , Xn ) et Y = (Y1 , . . . , Yp ) sont indépendants si et
seulement si toutes les covariances Cov(Xi , Yj ), 1 ≤ i ≤ n, 1 ≤ j ≤ p sont nulles.

Densité gaussienne en dimension n


Soit X ∼ N (0, In ) un vecteur gaussien standard en dimension n. Comme Cov(X) = In ,
les marginales X1 , . . . , Xn sont toutes indépendantes. La loi du vecteur X = (X1 , . . . , Xn )
est donc la loi produit de ses marginales PX = PX1 ⊗ · · · ⊗ PXn . En terme de densité, la
densité de X est alors donnée par le produit tensoriel des densités marginales
fX (x1 , . . . , xn ) = fX1 (x1 ) × · · · × fXn (xn )
   
1 2 1 2
= √ exp(−x1 /2) × · · · × √ exp(−xn /2)
2π 2π
1
exp − (x21 + · · · + x2n )/2 .

= n/2
(2π)
On a justifié :
xiv ©JCB – M2 Math. – Université de Rennes 1

Proposition 0.10 La densité d’un vecteur gaussien X ∼ N (0, In ) standard en dimension n


est
1
exp − 1/2(x21 + · · · + x2n ) .

fX (x) = n/2
(2π)

Pour passer au cas général d’un vecteur gaussien X ∼ N (m, K) non dégénéré (ie. K =
Cov(X) inversible), on√ utilise la représentation donnée en (5) avec le vecteur gaussien réduit
N ∼ N (0, In ) : X ∼ KX0 + m. Cela permet d’utiliser la densité déjà justifiée dans la
proposition précédente : Soit A ∈ B(Rn )
√ 
P(X ∈ A) = P KX0 + m ∈ A
√ −1 
= P X0 ∈ K (A − m)
exp(−kxk2 /2)
Z
= √ −1 dx
K (A−m) (2π)n/2
√ −1
exp(−k K (y − m)k2 /2)
Z
dy
= n/2

A (2π) det K

(avec le changement de variable y = Kx + m)
exp − h(x − m), K −1 (x − m)i/2
Z 
= dx.
A ((2π)n det K)1/2
On a obtenu la forme générale de la densité d’un vecteur gaussien non dégénéré :
Proposition 0.11 La densité d’un vecteur gaussien X ∼ N (m, K) non dégénéré est

exp − h(x − m), K −1 (x − m)i/2



fX (x) = .
((2π)n det K)1/2

Variables gaussiennes et vecteurs non gaussiens


On a déjà vu que si un vecteur X = (X1 , . . . , Xn ) est gaussien alors ses marginales Xi le
sont aussi, de même les combinaisons linéaires de ses marginales le sont. La réciproque est
fausse : si des variables aléatoires sont gaussiennes alors le vecteur formé par ces variables
n’est pas nécessairement gaussien. En effet, prenons X une variable aléatoire de loi N (0, 1)
et Y de loi donnée, pour a > 0 fixé, par

X si |X| ≤ a,
Y =
−X si |X| > a.

Alors Y est de loi N (0, 1) en effet

ϕY (t) = E[eitY ] = E[eitX 1|X|≤a ] + E[e−itX 1{|X|>a} ]


= E[eitX 1{|X|≤a} ] + E[eitX 1{|−X|>a} ] = E[eitX 1{|X|≤a} ] + E[eitX 1{|X|>a} ]
2 /2
= E[eitX (1{|X|≤a} + 1{|X|>a} )] = E[eitX ] = e−t
xv

car la loi de X est symétrique : L(X) = L(−X). Puis, la variable X + Y est donnée par

X + X = 2X si |X| ≤ a
X +Y =
X −X =0 si |X| > a
= 2X1{|X|≤a} .

La combinaison linéaire X + Y a un atome en 0 car P(X + Y = 0) ≥ P(|X| > a) > 0.


Elle ne suit donc pas une loi gaussienne. Le couple aléatoire (X, Y ) n’est donc pas gaussien
(sinon on devrait avoir X + Y de loi gaussienne !).
De plus, cet exemple montre aussi que dans la Proposition 0.8, l’hypothèse (X, Y ) gaussien
est nécessaire et il ne suffit pas de supposer que X et Y sont des variables aléatoires
gaussiennes. En effet,

Cov(X, Y ) = E[XY ] = E[X 2 1|X|≤a ] − E[X 2 1{|X|>a} ]


= E[X 2 ] − E[X 2 1{|X|>a} ] − E[X 2 1{|X|>a} ]
= 1 − 2E[X 2 1{|X|>a} ].

La fonction u(a) = E[X 2 1{|X|>a} ] tend vers 0 en +∞ par convergence dominée, est continue
et vaut E[X 2 ] = 1 en 0. Par le théorème des varleurs intermédiaires, il existe donc a ∈ R+
tel que u(a) = 1/2 et Cov(X, Y ) = 0. Pourtant, X et Y sont non indépendantes sinon la loi
du couple (X, Y ) serait
   
0 1 0
P(X,Y ) = PX ⊗ PY = N (0, 1) ⊗ N (0, 1) = N ,
0 0 1

qui est gaussienne, ce qui est faux. On a donc des variables aléatoires gaussiennes X et Y
non corrélées mais non indépendantes.
xvi ©JCB – M2 Math. – Université de Rennes 1
Première partie

Processus stochastiques

1
Chapitre 1

Processus stochastiques

Ce chapitre présente la notion générale de processus stochastique. On décrit d’abord les


lois des processus, leurs propriétés (Section 1.1), les trajectoires des processus (Section 1.2)
et la notion de convergence faible des processus (Section 1.3).
Définition 1.1 (Processus stochastique) Un processus stochastique X = (Xt )t∈T est une
famille de variables aléatoires Xt indexée par un ensemble T .
En général T = R ou R+ et on considère que le processus est indexé par le temps t.
Si T est un ensemble fini, le processus est un vecteur aléatoire. Si T = N alors le processus
est une suite de variables aléatoires. Plus généralement quand T ⊂ Z, le processus est dit
discret. Pour T ⊂ Rd , on parle de champ aléatoire (drap quand d = 2).
Un processus dépend de deux paramètres : Xt (ω) dépend de t (en général le temps) et de
l’aléatoire ω ∈ Ω :
— Pout t ∈ T fixé, ω ∈ Ω 7→ Xt (ω) est une variable aléatoire sur l’espace de probabilité
(Ω, F, P) ;
— Pour ω ∈ Ω fixé, t ∈ T 7→ Xt (ω) est une fonction à valeurs réelles, appelée trajectoire
du processus. C’est un enjeu que de savoir si un processus admet des trajectoires
mesurables, continues, dérivables ou encore plus régulières.
Dans la suite, sauf mention contraire, on prendra T = R+ ou [0, 1].

1.1 Loi d’un processus


Définition 1.2 (Lois fini-dimensionnelles) On appelle lois fini-dimensionnelles d’un pro-
cessus l’ensemble des lois
L(Xt1 , . . . , Xtp ) : t1 , . . . , tp ∈ T, p ∈ N∗ .

(1.1)

Un processus X = (Xt )t∈T est à valeurs dans RT . On munit RT de la tribu cylindrique


σ(Cyl) engendrée par la famille des cylindres :
Cyl = {x : T → R : x(t1 ) ∈ A1 , . . . , x(tp ) ∈ Ap }, A1 , . . . , Ap ∈ B(R), p ∈ N∗ .


3
4 Chapitre 1. ©JCB – M2 Math. – Université de Rennes 1

Il s’agit de la tribu sur RT rendant mesurables les applications coordonnées Πt : x ∈ RT 7→


x(t) ∈ R. Il est légitime de regarder un processus X comme une fonction aléatoire à valeurs
dans (RT , σ(Cyl)) : 
RT , σ(Cyl)

(Ω, F) →
X: (1.2)
ω 7→ X(ω) = Xt (ω) t∈T .

On définit bien une variable aléatoire à valeurs dans RT , σ(Cyl) . T En effet pour tout
cylindre C = {x ∈ R : x(t1 ) ∈ A1 , . . . , x(tp ) ∈ Ap }, on a X (C) = pi=1 Xt−1
T −1
i
(Ai ). Mais
−1 −1
chaque Xti étant une variable aléatoire, on a X ti (Ai ) ∈ F et X (C) ∈ F. Comme Cyl
engendre σ(Cyl), on a bien la F, σ(Cyl) -mesurabilité de (1.2).

On peut alors considérer la loi PX du processus sur RT , σ(Cyl) comme mesure image P
par la variable aléatoire (1.2). En fait les lois fini-dimensionnelles (1.1) de X définissent
une loi sur RT , σ(Cyl) par extension :

Théorème 1.1 (Extension de Kolmogorov) Soit Q = {Qt1 ,...,tp : t1 , . . . , tp ∈ T, p ∈ N∗ }


une famille de lois fini-dimensionnelles vérifiant les conditions de compatibilité :
— si s = (ti1 , . . . , tip ) est une permutation de t = (t1 , . . . , tp ) alors pour tout Ai ∈ B(R),
i = 1, . . . , p, on a

Qt (A1 × · · · × Ap ) = Qs (Ai1 × · · · × Aip );

— si t = (t1 , . . . , tp ) avec p ≥ 1, s = (t1 , . . . , tp−1 ) et A ∈ B(Rp−1 ) alors

Qt (A × R) = Qs (A).

Alors il existe une mesure de probabilité P sur RT , σ(Cyl) qui admet Q = {Qt1 ,...,tp :
t1 , . . . , tp ∈ T, p ∈ N∗ } pour famille de lois fini-dimensionnelles.

Démonstration : Admis, cf. [Kal] ou [KS]. 

Comme les lois fini-dimensionnelles d’un processus X = (Xt )t∈T satisfont immédiatement
les relations de compatibilité, le théorème d’extension de Kolmogorov (Th. 1.1) permet
effectivement de considérer la loi PX d’un processus X sur RT , σ(Cyl) . De plus :

Proposition 1.1 La loi PX d’un processus  stochastique X = (Xt )t∈T est entièrement carac-
térisée par ses lois fini-dimensionnelles L(Xt1 , . . . , Xtp ) : t1 , . . . , tp ∈ T, p ∈ N∗ .

Démonstration : Considérons deux processus X (1) et X (2) partageant les mêmes lois fini-
dimensionnelles.
 Nous montrons que leur loi P1 := PX (1) et P2 := PX (2) sont égales sur
RT , σ(Cyl) .
Remarquons que l’ensemble Cyl des cylindres est un π-système (stable par intersection
finie : l’intersection de deux cylindres est encore un cylindre). Notons M = {A ∈ σ(Cyl) :
P1 (A) = P2 (A)}. Il s’agit d’une classe monotone (RT ∈ M ; M est stable par différence
1.1. Loi d’un processus 5

ensembliste, M est stable par réunion croissante) et M contient Cyl (puisque X (1) et X (2)
ont mêmes lois fini-dimensionnelles) : pour un cylindre C,
(1) (1)  (2) (2) 
P1 (C) = P Xt1 ∈ A1 , . . . , Xtp ∈ Ap = P Xt1 ∈ A1 , . . . , Xtp ∈ Ap = P2 (C).

Le théorème de classe monotone assure alors que σ(Cyl) ⊂ M, ce qui prouve la Prop. 1.1. 

Il y a plusieurs façons pour des processus stochastiques X et Y d’être égaux :

Définition 1.3 (Égalités de processus)


— Deux processus X et Y ont même lois s’ils ont même lois fini-dimensionnelles : pour
tout p ∈ N∗ et t1 , . . . , tp ∈ T ,
 L 
Xt1 , . . . , Xtp = Yt1 , . . . , Ytp .
L
On écrira X = Y .
— On dira que Y est une version (ou une modification) du processus X si pour tout
t ∈ T , on a P(Xt = Yt ) = 1.
— Deux processus X et Y sont dit indistinguables s’il existe N ∈ F négligeable tels
que, pour tout ω 6∈ N , on a Xt (ω) = Yt (ω) pour tout t ∈ T ; de façon un peu abusive
(parce que {Xt = Yt : ∀t ∈ T } n’est pas nécessairent un évènement), on écrit :
P(Xt = Yt : ∀t ∈ T ) = 1.

Il est facile de voir que pour deux processus stochastiques X et Y , les notions d’égalité des
lois de processus s’ordonnent logiquement de la façon suivante :

Proposition 1.2 indistinguable ⇒ modification ⇒ même lois fini-dimensionnelles.

Les implications sont strictes, comme indiqué dans les exemples ci-dessous :

Exemple 1.1 1. Soit N ∼ N (0, 1) et pour tout t : Xt = N , Yt = −N . Alors (Xt )t≥0 et


(Yt )t≥0 ont même lois fini-dimensionnelles tandis que P(Xt = Yt ) = P(2N = 0) = 0,
ie. X, Y ne sont pas version l’un de l’autre.

2. Soit l’espace de probabilité [0, 1], B([0, 1]), λ et T = [0, 1]. Considérons D la diago-
nale de [0, 1] × [0, 1] et définissons

X(t, ω) = 0 ∀(t, ω), Y (t, ω) = 1D (t, ω).

Pour t fixé, on a X(t, ω) = 0 et Y (t, ω) = 1{t} (ω). On a donc X(t, ω) = Y (t, ω) pour
tout ω 6= t, c’est à dire presque sûrement : les processus
 X, Y sont versions l’un de
l’autre. Pourtant, P {ω : X(t, ω) = Y (t, ω), ∀t ∈ [0, 1]} = 0 : les processus X et Y
ne sont pas indistinguables.
6 Chapitre 1. ©JCB – M2 Math. – Université de Rennes 1

Dans l’exemple 2) ci-dessus, on observe que les trajectoires de X sont continues tandis que
celles de Y ne le sont pas. En fait, c’est ce qu’il manque pour avoir une réciproque :
Proposition 1.3 Soient T séparable (ie. T contient une partie dense dénombrable) et X, Y
modifications avec des trajectoires continues presque sûrement alors ils sont indistinguables.
Remarque 1.1 Si T ⊂ R alors on peut supposer seulement la continuité à droite ou à
gauche des trajectoires.
Démonstration : On choisit D une partie dénombrable dense dans T . Pour tout t ∈ D, on
a P(Xt = Yt ) = 1 et par dénombrabilité de D, l’ensemble A = {Xt = Yt : t ∈ D} ∈ F
est de probabilité 1. L’ensemble B = {X et Y sont à trajectoires continues} est aussi de
probabilité 1. Soit ω ∈ A∩B tel que t 7→ Xt (ω), t 7→ Yt (ω) sont continues. On a P(A∩B) = 1
et pour ω ∈ A ∩ B :
— si t ∈ D, on a Xt = Yt ;
— si t 6∈ D, il existe tn ∈ D avec tn → t, n → +∞. On a Xtn = Ytn (tn ∈ D, ω ∈ A)
et Xtn → Xt , Ytn → Yt (continuité des deux trajectoires pour ω ∈ B). On a donc
Xt = Yt sur A ∩ B.
Finalement pour ω ∈ A ∩ B : Xt = Yt pour tout t ∈ T ; ce qui signifie que X, Y sont des
processus indistinguables. 

Exemples de propriétés en loi des processus


Il existe de nombreuses classes de processus particuliers : les processus de Markov (en
particulier les chaı̂nes de Markov quand T = N), les martingales, les processus gaussiens, les
processus de Poisson, les processus stables ou encore les processus de Lévy (qui contiennent
les trois exemples précédents). Ces types de processus sont caractérisés par des propriétés
remarquables de leurs lois fini-dimensionnelles. Nous donnons ici quelques exemples de
telles propriétés en loi des processus. Ces propriétés sont souvent fort utiles pour modéliser
des phénomènes réels.
L
Définition 1.4 Un processus est dit (strict) stationnaire si pour tout h ≥ 0, (Xt+h )t≥0 =
(Xt )t≥0 ne dépend pas de h > 0, c’est à dire pour tout h > 0 et tout t1 , . . . , tp ≥ 0, on a
L
(Xt1 +h , . . . , Xtp +h ) = (Xt1 , . . . , Xtp ).
Un processus est dit à accroissements stationnaires si la loi des accroissements Xt+h − Xt
L
ne dépend pas de t > 0, ie. Xt+h − Xt = Xh .
Un processus X est dit à accroissements indépendants si pour tout p ≥ 1 et 0 < t1 < t2 <
· · · < tp , les variables aléatoires Xt1 , Xt2 − Xt1 , . . . , Xtp − Xtp−1 sont indépendantes.

Exemple 1.2 (T P = N) Soit (Xn )n≥1 une suite de variables aléatoires indépendantes. On
considère Sn = ni=1 Xi le processus discret des sommes partielles. On parle de marche
aléatoire. Alors (Sn )n≥1 est un processus à accroissements indépendants. Si en plus les
variables aléatoires Xn , n ≥ 1, sont de même loi (les variables aléatoires sont iid), le
processus est à accroissements indépendants et stationnaires.
1.2. Régularité des trajectoires 7

1.2 Régularité des trajectoires


D’après l’Exemple 1.1, les versions d’un processus stochastiques n’ont pas toujours la
même régularité de leurs trajectoires. Aussi, il est intéressant de chercher si un processus X
admet des versions X e dont les trajectoires ont de bonnes propriétés de régularité et d’avoir
des conditions le garantissant. Dans cette section, on s’attache à trouver des versions à
trajectoires continues d’un processus.

Théorème 1.2 (Kolmogorov-Čentsov) Soit (Xt )t∈T un processus indexé par un intervalle
T de R et à valeurs dans (E, d) espace métrique complet. On suppose qu’il existe a, b, C > 0
vérifiant pour tout s, t ∈ T :
E d(Xt , Xs )a ≤ C|t − s|1+b .
 
(1.3)

Alors il existe une version X


e de X dont les trajectoires sont localement höldériennes d’ex-

posant γ pour tout γ ∈]0, b/a[, ie. pour tout s, t ∈ T : d X es (ω) ≤ Cγ (ω)|t − s|γ .
es (ω), X
En particulier, Xe est une version continue de X.

Remarque 1.2 — La condition du théorème porte sur les lois de dimension 2 :


Z
a
|x − y|a P(Xt ,Xs ) (dx, dy),
 
E d(Xt , Xs ) =
R2

ce qui est une condition légère sur la loi, caractérisée par toutes les loi fini-dimension-
nelles. En pratique, pour vérifier (1.3), il faut donc calculer des moments pour des
vecteurs de dimension 2.
— Quand (E, d) = (R, | · |), a priori, dans le théorème, a et b sont non liés. En réalité,
on peut toujours prendre a ≥ 1 + b. En effet, si a < 1 + b, alors (1.3) se réécrit
d(Xt , Xs ) a
 
E ≤ c|t − s|1+b−a
t−s
avec 1 + b − a > 0. En faisant s → t, la dérivée dans le sens La de (Xt )t∈T est
nulle et (Xt )t∈T est donc constant. Ce n’est donc pas très intéressant d’utiliser le
Théorème 1.2 dans un tel cas : puisque le processus initial est en fait constant, il
est évident qu’il est aussi continu.
— La condition b > 0 est essentielle : le processus de Poisson compensé (Πt − t)t≥0
fournit un contre-exemple quand b = 0. Soit Xt = Πt − t où (Πt )t≥0 est un pro-
cessus de Poisson (processus à accroissements indépendants, stationnaires avec des
marginales de loi de Poisson, cf. Section 4.4). On a
Πt ∼ P(t), E[Πt ] = t, Var(Πt ) = t,
soit pour X :
E |Xt − Xs |2 = Var Πt − Πs = Var Πt−s = t − s.
   
8 Chapitre 1. ©JCB – M2 Math. – Université de Rennes 1

On a donc (1.3) avec a = 2, b = 0 et C = 1. Or les trajectoires du processus de


Poisson sont càdlàg (et même constantes par morceaux avec des sauts +1) or d’après
la Prop. 1.3 et la Rem. 1.1, il devrait coı̈ncider avec sa version continue !

Démonstration : (Th. 1.2, Kolmogorov-Čenstov) Nous supposons que T est l’intervalle


borné [0, 1]. Si l’intervalle T est non borné (par exemple si T = R+ ), on peut appliquer
le cas borné à T = [0, 1], [1, 2], [2, 3] etc et on trouve encore que X a une modification
continue définie sur T , qui est localement höldérienne d’exposant γ pour tout γ ∈]0, b/a[.
Pour simplifier la présentation, on prend dans la suite T = [0, 1].
Il suffit de montrer que pour γ ∈]0, b/a[ fixé, X a une modification dont les trajectoires sont
höldériennes d’exposant γ. En effet, on appliquera alors ce résultat à une suite γn % b/a
en observant que les processus obtenus sont des versions continues du même processus X
donc indistinguables par la Prop. 1.3.
On note D l’ensemble (dénombrable) des nombres dyadiques t ∈ [0, 1[ qui s’écrivent sous
la forme
p
X
t= k 2−k avec k ∈ {0, 1}, 1 ≤ k ≤ p.
k=1

Le point clef est le résultat suivant dû au lemme de Borel-Cantelli :

Lemme 1.1 Pour tout γ ∈]0, b/a[, ps il existe une constante Cγ (ω) < +∞ telle que pour
tout s, t ∈ D :
d Xs , Xt ≤ Cγ (ω)|t − s|γ .


Preuve du lemme. Avec l’inégalité de Markov, l’hypothèse (1.3) du Théorème 1.2 entraı̂ne
que, pour a > 0 et s, t ∈ T , u > 0

P d(Xs , Xt ) ≥ u ≤ u−a E d(Xs , Xt )a ≤ Cu−a |t − s|1+b .


  

En appliquant cette inégalité avec s = (i−1)2−n , t = i2−n (pour i = 1, . . . , 2n ) et u = 2−nγ ,


on a :
P d(X(i−1)2−n , Xi2−n ≥ 2−nγ ) ≤ C2naγ 2−(1+b)n .


En sommant sur i ∈ [1, 2n ], on trouve


2n
[ 
d(X(i−1)2−n , Xi2−n ) ≥ 2−nγ ≤ 2n C2naγ−(1+b)n = C2−n(b−aγ) .

P
i=1

Comme b − aγ > 0, on a
2n n
+∞  [
X 
P d(X(i−1)2−n , Xi2−n ) ≥ 2−nγ < +∞
n=1 i=1
1.2. Régularité des trajectoires 9

et le lemme de Borel-Cantelli assure que presque sûrement il existe n0 (ω) ∈ N tel que dès
que n ≥ n0 (ω) pour tout i ∈ {1, . . . , 2n }, on a

d X(i−1)2−n , Xi2−n ≤ 2−nγ .



(1.4)

A fortiori, ps  
d(X(i−1)2−n , Xi2−n )
Kγ (ω) := sup sup < +∞
n≥1 1≤i≤2n 2−nγ
(pour n ≥ n0 (ω), le terme entre parenthèses est majoré par 1 par (1.4), et il y a un nombre
fini de terme n ≤ n0 (ω) : le supn≥1 ci-dessus est bien fini !).
On obtient alors le résultat du Lemme 1.1 avec

γ+1 1 − 2−γ + 21−γ


Cγ (ω) = 2 Kγ (ω).
1 − 2−γ

En effet, considérons s, t ∈ D avec s < t. Soit p ≥ 1 tel que 2−p−1 < t − s ≤ 2−p . Il existe
m ≥ 1 tel qu’on puisse écrire s, t ∈ D sous la forme :

s = k2−p + 0 2−p + 1 2−p−1 + · · · + m 2−p−m


t = k2−p + 00 2−p + 01 2−p−1 + · · · + 0m 2−p−m

oú j , 0j ∈ {0, 1}. On note pour j = 0, . . . , m

sj = k2−p + 0 2−p + 1 2−p−1 + · · · + j 2−p−j


tj = k2−p + 00 2−p + 01 2−p−1 + · · · + 0j 2−p−j

de sorte que s = sm et t = tm . Par l’inégalité triangulaire, on a

d(Xs , Xt ) = d(Xsm , Xtm )


m
X m
X
≤ d(Xs0 , Xt0 ) + d(Xsj−1 , Xsj ) + d(Xtj−1 , Xtj )
j=1 j=1
m
X m
X
≤ Kγ (ω)2−pγ + Kγ (ω)2−(p+j)γ + Kγ (ω)2−(p+j)γ
j=1 j=1
−γ
2 2−γ
≤ Kγ (ω)2−pγ + Kγ (ω)2−pγ + K γ (ω)2−pγ
1 − 2−γ 1 − 2−γ
 m
X 
car 2−(p+j)γ ≤ 2−pγ 2−γ /(1 − 2−γ )
j=1

+ 1 − 2−γ −pγ
2 1−γ
≤ Kγ (ω) 2
1 − 2−γ
≤ Cγ (ω)(t − s)γ
10 Chapitre 1. ©JCB – M2 Math. – Université de Rennes 1

où la dernière ligne vient de 2−p ≤ 2(t − s) et prouve le Lemme 1.1. 

On termine la preuve du Théorème 1.2 de la façon suivante : d’après le Lemme 1.1, la


fonction t 7→ Xt (ω) est ps γ-höldérienne sur D, donc uniformément continue sur D. Comme
(E, d) est complet, il existe ps un unique prolongement continu de cette fonction à T = [0, 1].
Le prolongement reste γ-höldérien. Plus précisément, on pose pour tout t ∈ [0, 1] :

X
et (ω) = lim Xs (ω)
s→t
s∈D

sur l’ensemble presque sûr {ω ∈ Ω : Kγ (ω) < +∞} où s 7→ Xs (ω) est γ-höldérienne sur
D et on pose X et (ω) = x0 sur l’ensemble {ω ∈ Ω : K(ω) = +∞} négligeable où x0 est
un point fixé quelconque de E. Par construction, le processus X
e a alors des trajectoires
höldériennes d’exposant γ sur [0, 1].
Il reste à voir que X
e est bien une version de X. Or l’hypothèse (1.3) assure avec l’inégalité
de Markov :  
 E d(Xs , Xt )a |t − s|1+b
P d(Xs , Xt ) ≥ ε ≤ ≤ . (1.5)
εa εa
Ainsi, pour tout t ∈ T fixé,
P
Xs −→ Xt , s → t.
Comme par construction Xs → X et ps quand s → t, s ∈ D, on conclut que Xt = X et ps par
unicité ps de la limite en probabilité. 

1.3 Convergence faible des lois de processus


On a vu qu’un processus X = (Xt )t∈T définit en (1.2) une variable aléatoire sur
T
R , σ(Cyl) . Cependant avec
 de bonnes propriétés trajectorielles, on peut améliorer l’es-
T
pace d’arrivée R , σ(Cyl) , typiquement si X est à trajectoires continues alors X est à
valeurs dans C(T, R) (ou si ce n’est X, une de ses versions en utilisant le Théorème 1.2).
Quand T = [0, 1] (ou T borné), C(T, R) est normé par

kx − yk∞ = sup |x(t) − y(t)|, x, y ∈ C(T, R), (1.6)


t∈T

qui définit la topologie de la convergence uniforme. Il s’agit alors d’un espace de Banach.
Quand T = R+ (ou T borné), C(R+ , R) admet pour distance
+∞
X
2−n min kx − yk∞,n , 1 ,

d(x, y) = (1.7)
n=1
où on note kx − yk∞,n = sup |x(t) − y(t)|, x, y ∈ C(R+ , R),
t∈[0,n]
1.3. Convergence faible des lois de processus 11

qui métrise la convergence uniforme sur tous les compacts.


L’intérêt de considérer X à valeurs dans C(T, R) (ou un autre espace fontionnel, souvent
D(R+ , R), l’espace des fonctions càdlàg –continue à droite avec des limites à gauche– dit
espace de Skorohod, cf. [Bil2]) est alors que X est à valeurs dans un espace métrique (et
même souvent un espace métrique complet, séparable, dit espace polonais) et que dans ce
cadre la notion de convergence faible est bien développée, cf. Section 1.3.1.
On commence par s’assurer que le processus X = (Xt )t∈T reste bien une variable aléatoire
sur C(T, R) :  
(Ω, F) → C(T, R), B C(T, R)
X:  (1.8)
ω 7→ X(ω) = Xt (ω) t∈T .
L’espace C(T, R) est muni de deux tribus naturelles
 : la trace de la tribu cylindrique σ(Cyl)∩
C(T, R) et sa propre tribu borélienne B C(T, R) . En fait ces deux tribus coı̈ncident :
Proposition 1.4 Sur C(R+ , R), la tribu cylindrique trace coı̈ncide avec la tribu borélienne :

σ(Cyl) ∩ C(R+ , R) = B C(R+ , R) .
Démonstration : D’abord, Πt0 est continue sur (C(R+ , R), d) pour d en (1.7) puisque
|Πt0 (x) − Πt0 (y)| = |x(t0 ) − y(t0 )| ≤ kx − yk∞,n
pour tout n ≥ t0 dont on déduit
 aisément la continuité pour d. Dès
Tp lors−1Πt0 est mesurable
 C = i=1 Πti (Ai ), Ai ∈ B(R),
sur C(R+ , R), B C(R+ , R) . Comme tout cylindre s’écrit
on a bien C ∈ B C(R+ , R) et donc Cyl ⊂ B C(R+ , R) puis σ(Cyl) ⊂ B C(R+ , R) .

Réciproquement, si A = {y ∈ C(R+ , R)T: kx − yk[0,n] < η} est ouvert pour la convergence


uniforme sur les compacts, on a A = t∈[0,n]∩Q Π−1 t (]x(t) − η, x(t) + η[) car la condition
|y(t) − x(t)| < η pour tout t ∈ [0, n] ∩ Q est complétée pour tout t ∈ [0, n] par continuité.
L’ouvert A s’écrit alors comme une intersection
 (dénombrable) de cylindres, ie. A ∈ σ(Cyl).
Puisque de tels A engendrent B C(R+ , R) , on a B C(R+ , R) ⊂ σ(Cyl). 

Finalement d’après la Prop. 1.4, le processus X vu comme en (1.8) définit bien une variable
alátoire sur C(T, R) et PX est alors une loi sur C(T, R).

1.3.1 Rappels sur la convergence faible


On rappelle la notion de convergence faible de variables aléatoires à valeurs dans un
espace métrique S. Quand S est un espace fonctionnel, typiquement C(T, R), la variable
aléatoire est en fait un processus stochastique à trajectoires continues.
Définition 1.5 (Convergence faible) Soit (Xn )n≥1 et X à valeurs dans S espace métrique
de lois Pn et P , on a Xn ⇒ X (ou Pn ⇒ P ) ssi pour toute fonction f : S → R continue
et bornée    
lim E f (Xn ) = E f (X) .
n→+∞
12 Chapitre 1. ©JCB – M2 Math. – Université de Rennes 1

Nous utiliserons les formulations équivalentes suivantes de la convergence faible. Pour plus
de détails on renvoie à [Bil2].
Théorème 1.3 (Porte-manteau) Les assertions suivantes sont équivalentes quand n →
+∞ pour des variables aléatoires Xn à valeurs dans un espace métrique S.
1. Xn ⇒ X, ie. pour toute fonction f : S → R continue et bornée
   
lim E f (Xn ) = E f (X) .
n→+∞

2. Pour toute fonction f : S → R uniformément continue et bornée


   
lim E f (Xn ) = E f (X) ;
n→+∞

3. Pour tout fermé F , lim supn→+∞ P(Xn ∈ F ) ≤ P(X ∈ F ) ;


4. Pour tout ouvert G, lim inf n→+∞ P(Xn ∈ G) ≥ P(X ∈ G) ;
5. Pour tout A ∈ B(S) tel que P X ∈ A \ A◦ = 0, limn→+∞ P(Xn ∈ A) = P(X ∈ A).


Démonstration : 1)⇒ 2) est évident.


2)⇒ 3). On considère F fermé et δ > 0. Pour ε > 0 assez petit, Gε =T{x : d(x, F ) < ε}
vérifie P(X ∈ Gε ) ≤ P(X ∈ F ) + δ puisque (comme F est fermé) ε>0 Gε = F . On
considère f (x) = ϕ(d(x, F )/ε) avec

 1 si t ≤ 0
ϕ(t) = 1 − t si 1 ≤ t ≤ 1
0 si 1 ≤ t

Alors, on montre que f est uniformément continue sur S, f (x) = 1 si x ∈ F et f (x) = 0


si x ∈ Gcε . De plus, 0 ≤ f (x) ≤ 1 pour tout x ∈ S. D’après 2), on a E[f (Xn )] → E[f (X)],
n → +∞. Puis comme 1F (x) = f (x)1F (x) et f (x) = f (x)1Gε (x),

P(Xn ∈ F ) = E[f (Xn )1F (Xn )] ≤ E[f (Xn )]


E[f (X)] = E[f (X)1Gε (X)] ≤ P(X ∈ Gε ) ≤ P(X ∈ F ) + δ.

Finalement,

lim sup P(Xn ∈ F ) ≤ lim E[f (Xn )] = E[f (X)] ≤ P(X ∈ F ) + δ.


n→+∞ n→+∞

Comme δ > 0 est arbitraire, cela établit 3).


3)⇔ 4) s’obtient facilement par passage au complémentaire.
3), 4) ⇒ 5). Soit A tel que X 6∈ A \ A◦ ps. On a P X ∈ A = P(X ∈ A◦ ). Avec 3) et 4)


on déduit

lim sup P(Xn ∈ A) ≤ lim sup P Xn ∈ A ≤ P X ∈ A = P(X ∈ A◦ ) ≤ lim inf P(Xn ∈ A◦ ).


 
n→+∞ n→+∞ n→+∞
1.3. Convergence faible des lois de processus 13

Finalement lim supn→+∞ P(Xn ∈ A) = P(X ∈ A) = lim inf n→+∞ P(Xn ∈ A) ce qui montre
limn→+∞ P(Xn ∈ A) = P(X ∈ A).
5)⇒ 3). Soit F fermé et Fε = {x ∈ S : d(x, F ) ≤ ε}. Comme les ensembles ∂Fε = {x ∈
S : d(X, F ) = ε} sont disjoints, on a X ∈
6 ∂Fε pour presque tout ε > 0. Pour un tel ε > 0,
d’après 5) on a

P(Xn ∈ F ) ≤ P(Xn ∈ Fε )
lim sup P(Xn ∈ F ) ≤ lim P(Xn ∈ Fε ) = P(X ∈ Fε )
n→+∞ n→+∞

T
ce qui prouve 3) car F = ε>0 Fε et P(X ∈ Fε ) → P(X ∈ F ), ε → 0 (convergence
monotone).
4)⇒ 1). Soit f ≥ 0 une fonction continue. Avec le lemme de Fatou, on a
Z +∞ Z +∞
E[f (X)] = P(f (X) > t)dt ≤ lim inf P(f (Xn ) > t)dt
0 0 n→+∞
Z +∞
≤ lim inf P(f (Xn ) > t)dt = lim inf E[f (Xn )]. (1.9)
n→+∞ 0 n→+∞

Pour f continue et bornée par M , on applique (1.9) à M + f et M − f pour obtenir


limn→+∞ E[f (Xn )] = E[f (X)], ce qui prouve 1). 

Proposition 1.5 Soient X et Xn , n ≥ 1 des variables aléatoires à valeurs dans un espace


métrique S. Les propriétés suivantes sont faciles à vérifier :
P
1. La convergence en proba Xn −→ X implique la convergence faible Xn ⇒ X.
2. (Continuous mapping theorem) Soit f : S → S 0 une application entre espaces mé-
triques. Alors si Xn ⇒ X et f est continue PX -ps, on a aussi f (Xn ) =⇒ f (X).
3. Si Xn , X sont des processus à trajectoires continues (ie. S = C(R+ , R) avec Xn ⇒ X,
on a la convergence faible des lois fini-dimensionnelles : pour tout p ≥ 1 et t1 , . . . , tp
 
Xn (t1 ), . . . , Xn (tp ) =⇒ X(t1 ), . . . , X(tp ) , n → +∞.

Le continuous mapping theorem montre que la convergence en loi se conserve par les
applications continues : de la même façon que si xn → x alors f (xn ) → f (x) quand f est
continue, le résultat reste vrai pour des variables (ou processus aléatoires) qui convergent
faiblement.
Démonstration : 1) Le premier point se justifie comme pour les variables aléatoires.
2) Le deuxième point est une conséquence facile du théorème porte-manteau (Th. 1.3) :
Soit F un ensemble fermé de S. Observons que f −1 (F ) ⊂ f −1 (F ) ∪ Df où Df désigne
l’ensemble des points de discontinuité de f . En effet, soit x ∈ f −1 (F ) limite d’une suite
(xn )n≥1 de f −1 (F ). Alors si f est continue en x, on a f (x) = limn→+∞ f (xn ) ∈ F car F
14 Chapitre 1. ©JCB – M2 Math. – Université de Rennes 1

est fermé et f (xn ) ∈ F , sinon c’est que x ∈ Df . Par le théorème porte-manteau (Th. 1.3)
pour Xn ⇒ X, on a :

lim sup P(f (Xn ) ∈ F ) ≤ lim sup P(Xn ∈ f −1 (F )) ≤ lim sup P Xn ∈ f −1 (F )



n→+∞ n→+∞ n→+∞

≤ P X ∈ f (F ) ≤ P X ∈ f −1 (F ) + P(X ∈ Df )
 
−1

= P X ∈ f −1 (F )


c’est à dire, encore par le théorème porte-manteau (Th. 1.3) : f (Xn ) =⇒ f (X).
3) Le troisième point est une conséquence du deuxième point avec l’application continue
Πt1 ...,tp : C(T, R) → Rp définie par Πt1 ...,tp (x) = (x(t1 ), . . . , x(tp )). 

La convergence faible de processus à trajectoires continues entraı̂ne la convergence des lois


fini-dimensionnelles. La réciproque est fausse : la convergence des lois fini-dimensionnelles
n’entraı̂ne pas la convergence faible des processus. Il peut y avoir un phénomène de perte
de masse vers l’infini comme illustré dans l’exemple suivant pour des variables aléatoires
réelles. De plus l’affirmation est fausse pour des processus qui ne sont pas à valeurs dans
C(T, R) : par exemple pour des processus càdlàg, Xn ⇒ X entraı̂ne X(t) ⇒ X(t) seulement
si X est continu en t.

Exemple 1.3 Sur C([0, 1], R), on considère les fonctions



2nt si t ∈ [0, 1/2n]
xn (t) =
2 − 2nt si t ∈ [1/2n, 1/n].
La suite de fonction xn converge simplement vers x = 0. On considère alors la suite de loi
Pn = δxn et P = δx et on observe que
— On n’a pas Pn ⇒ P car pour la fonction continue bornée f (y) = supt∈[0,1] y(t), on a
f (xn ) = 1, f (x) = 0, soit
Z Z
f dPn = f (xn ) = 1 6→ 0 = f (x) = f dP, n → +∞;

— Pour tout 0 < t1 < · · · < tp , avec Πt1 ,...,tp (y) = (y(t1 ), . . . , y(tp )) on a Πt1 ,...,tp (x) =
(0, . . . , 0) et pour n > 1/t1 aussi Πt1 ,...,tp (xn ) = (0, . . . 0), c’est à dire la convergence
des lois fini-dimensionnelles

Pn Π−1 −1
t1 ,...,tp ⇒ P Πt1 ,...,tp , n → +∞.

La convergence des lois fini-dimensionnelles n’entraı̂ne donc pas la convergence en loi de


tout le processus.

Pour éviter une telle pathologie, il faut une condition supplémentaire, c’est l’objet de la
section suivante.
1.3. Convergence faible des lois de processus 15

1.3.2 Équitension
L’équitension est la condition qui empêche la perte de masse probabiliste. C’est la condi-
tion qui avec la convergence des lois fini-dimensionnelles donnera la convergence faible, cf.
Théorème 1.6. On renvoie à [Bil2] pour plus de détails sur cette notion.

Définition 1.6 (Équitension) Soit (Pn )n≥1 une suite de mesures de probabilité sur un espace
métrique. La suite est dite équitendue si pour tout ε > 0, il existe un compact Kε tel que
pour tout n ≥ 1 on a Pn (Kε ) > 1 − ε.

En fait, l’équitension s’exprime aussi par une propriété de relative compacité (dans les bons
espaces métriques : ceux qui sont séparables et complets, ie. polonais).

Définition 1.7 (Relative compacité) Une suite de mesures (Pn )n≥1 est dite relativement
compacte si pour toute sous suite (n0 ) ⊂ N, il existe (n00 ) ⊂ (n0 ) telle que Pn00 converge
faiblement vers une mesure de probabilité.

Théorème 1.4 (Prohorov) Soit (Pn )n≥1 une suite de mesures dans un espace métrique sé-
parable complet. Alors (Pn )n≥1 est équitendue si et seulement si (Pn )n≥1 est relativement
compacte.

Démonstration : Admis, cf. [Bil2]. 

En général–dans ce cours–, les processus qu’on considère sont à trajectoires continues et


leurs lois sont donc des mesures de probabilité sur l’espace des fonctions continues C(T, R),
complet et séparable pour la topologie uniforme associée à la norme uniforme kf k∞ =
supx∈T |f (x)|, donc polonais. Dans ce cas, on a un critère d’équitension plus explicite :

Théorème 1.5 Soit (Pn )n≥1 la suite des lois de processus Xn à trajectoires continues. On
suppose qu’il existe a, b, C > 0 tels que pour tout s, t ∈ [0, 1],

sup E |Xn (t) − Xn (s)|a ≤ C|t − s|1+b .


 
n≥1

Alors la suite (Pn )n≥1 est équitendue.

Noter la ressemblance avec le Th. 1.2 (Kolmogorov-Čentsov).


Démonstration : Admis, cf. [Bil2]. 


Théorème 1.6 Soit P (n) n≥1
une suite équitendue dans C(T, R) telle que les lois fini-
(n) (n)
dimensionnelles Pt1 ,...,tm convergent faiblement pour tout t1 , . . . , tp ∈ T : Pt1 ,...,tp =⇒ Pt1 ,...,tp .
Alors il existe P de lois fini-dimensionnelles Pt1 ,...,tp : t1 , . . . , tp ∈ T, p ∈ N∗ telle que


P (n) ⇒ P .
16 Chapitre 1. ©JCB – M2 Math. – Université de Rennes 1

En fait, la vraie condition supplémentaire nécessaire dans le Th. 1.6 est la relative compacité
de la suite (Pn )n≥1 mais d’après le théorème de Prohorov (Th. 1.4), c’est équivalent à
l’équitension de la suite pour laquelle on dispose de critères explicites.
Démonstration : Pour montrer que P (n) ⇒ P , il suffit de voir que pour toute (n0 ) ⊂ N, il
00
existe (n00 ) ⊂ (n0 ) tel que P (n ) ⇒ P . R R
(n)
En effet, on montre qu’alors pour f continue bornée, R on (n)
a f dP
R → f dP . Si ce n’était
pas le cas, il existerait f continue bornée telle que f dP 6→ f dP , ie. il existerait ε > 0
et (n0 ) ⊂ (n) tels que Z Z
(n0)
f dP
− f dP > ε.
(1.10)

Or par l’équitension (en fait par relative compacité mais d’après le le théorème de Prohorov
00
(Th. 1.4), c’est équivalent), il existe (nR00 ) ⊂ (n0 ) tel que P (n ) ⇒ P . EnR particulier, d’après
00 R 00
le théorème porte-manteau(Th. 1.3) f dP (n ) → f dP . Comme f dP (n ) )n00 est une
R 0
suite extraite de f dP (n ) n0 , il y a une contradiction avec (1.10). La contradiction justifie
finalement la convergence cherchée.
Soit donc (n0 ) ⊂ (n) une sous-suite. Par équitension (relative compacité), il existe (n00 ) ⊂
00
(n0 ) et Q tels que P (n ) ⇒ Q. En particulier, la convergence des lois fini-dimensionnelles
(n00 ) (n)
exige que Pt1 ,...,tp ⇒ Qt1 ,...,tp . Mais par hypothèse Pt1 ,...,tp ⇒ Pt1 ,...,tp et donc en particu-
(n00 )
lier Pt1 ,...,tp ⇒ Pt1 ,...,tp . On doit donc avoir Qt1 ,...,tp = Pt1 ,...,tp , pour tout t1 , . . . , tp ∈ T . La
00
Prop. 1.1 assure alors P = Q. Finalement, P (n ) ⇒ P = Q ce qui conclut car la première
partie de la preuve. 
Chapitre 2

Processus gaussiens

Dans ce chapitre, on commence par présenter la classe des processus gaussiens dont
on introduit d’abord la loi en Section 2.1. La régularité des trajectoires est considérée en
Section 2.2. La notion d’espace gaussien est décrite en Section 2.3. Enfin, on donne plusieurs
exemples de processus gaussiens en Section 2.4.

2.1 Lois des processus gaussiens


Définition 2.1 (Processus gaussien) Un processus stochastique (Xt )t∈T est gaussien si toutes
ses lois fini-dimensionnelles L(Xt1 , . . . , Xtp ) sont gaussiennes (pour tout p ∈ N∗ et t1 , . . . , tp ∈
T ).
Autrement dit X = (Xt )t∈T est gaussien ssi toute combinaison linéaire de ses margi-
nales a1 Xt1 + · · · + ap Xtp suit une loi gaussienne (pour tout p ∈ N∗ , t1 , . . . , tp ∈ T et
a1 , . . . , ap ∈ R).

Remarque 2.1 Les conséquences suivantes sont immédiates :


— Toutes les marginales d’un processus gaussien sont gaussiennes.
— Toute combinaison linéaire de marginales d’un processus gaussien est encore gaus-
sienne.

Il est connu que la loi d’un vecteur gaussien (Xt1 , . . . , Xtp ) est déterminée (par  exemple via
sa fonction caractéristique) par le vecteur
 moyenne mX = E[Xt1 ], . . . , E[Xtp ] et la matrice
de covariance ΣX = Cov(Xti , Xtj 1≤i,j≤p ). On comprend dès lors que toutes les lois fini-
dimensionnelles d’un processus gaussien (donc la loi du processus, cf. Prop. 1.1) est connue
dès qu’on se donne la fonction moyenne m(t) = E[Xt ] et l’opérateur de covariance K(s, t) =
Cov(Xs , Xt ). En effet, la loi fini-dimensionnelle de (Xt1 , . . . , Xtp ) est alors la loi gaussienne
N (mp , Kp ) de dimension p avec mp = (m(t1 ), . . . , m(tp )) et Kp = (K(ti , tj ))1≤i,j≤p . Les
fonctions m et K définissent donc toutes les lois fini-dimensionnelles de X et donc aussi sa
loi en tant que processus, cf. Prop. 1.1. Observons en plus que
— K est symétrique : K(s, t) = K(t, s) ;

17
18 Chapitre 2. ©JCB – M2 Math. – Université de Rennes 1

— K est de type positif, ie. si c : T → R est une fonction à support fini alors :
 !2 
X X
c(s)c(t)K(s, t) = Var  c(s)Xs  ≥ 0. (2.1)
s,t∈T s∈T

Réciproquement, étant donnés une fonction m sur T et un opérateur K sur T × T , existe-


t-il un processus gaussien X admettant m pour fonction moyenne et K pour opérateur de
covariance ? La réponse est donnée par le résultat suivant :
Théorème 2.1 Soit K une fonction symétrique de type positif sur T × T . Il existe alors un
processus gaussien (centré) dont la fonction de covariance est K.
Démonstration : Quitte à considérer ensuite le processus X(t) + m(t), on considère pour
simplifier le cas d’un processus centré (m = 0). Il s’agit alors d’une application simple
du théorème d’extension de Kolmogorov
 (Th. 1.1). On construit une probabilité P (K) sur
l’espace mesurable RT , σ(Cyl) de telle sorte que sous P (K) le processus des coordonnées
Xt (ω) = ω(t) (dit processus canonique) est un processus gaussien de fonction de cova-
riance K.
Pour cela, si {t1 , . . . , tp } est une partie finie de T , on construit d’abord une probabilité
(K)
P{t1 ,...,tp } sur R{t1 ,...,tp } ∼ Rp comme la loi du vecteur gaussien de matrice de covariance
(K(ti , tj ))1≤i,j≤p (qui existe d’après les rappels gaussiens puisque la matrice est symétrique
positive).
(K)
On vérifie aisément que les lois P{t1 ,...,tp } satisfont les propriétés de compatibilité du théo-
rème d’extension de Kolmogorov (Th. 1.1) qui s’applique donc.

La loi P (K) ainsi construite sur RT , σ(Cyl) est bien celle d’un processus gaussien puisque
par construction toutes ses lois fini-dimensionnelles sont gaussiennes avec pour fonction de
covariance K. 

Exemple 2.1 (Processus stationnaire) On considère le cas T = R et on se donne une


mesure finie symétrique (ie. ν(−A) = ν(A)) sur R. On pose alors
Z
K(s, t) = eiu(t−s) ν(du). (2.2)
R

On vérifie aisément que K est un opérateur réel symétrique K(t, s) = K(s, t) (car ν est
symétrique) et de type positif :
X Z X 2
c(s)c(t)K(s, t) = c(s)eius ν(du) ≥ 0.

s,t∈T s∈T

La fonction K possède la propriété supplémentaire de dépendre seulement de la différence


t − s. On parle de stationnarité faible (ou de deuxième ordre) et on écrit alors K(t, s) =
2.1. Lois des processus gaussiens 19

K(|t − s|). On en déduit aussitôt que le processus (centré) X associé à K par le théorème
précédent est stationnaire (au sens strict), c’est à dire pour tout choix de p ∈ N∗ et
t1 , . . . , tp ≥ 0, h ∈ R, on a
 L 
Xt1 +h , . . . , Xtp +h = Xt1 , . . . , Xtp .

Réciproquement, il est vrai aussi que si (Xt )t≥0 est un processus gaussien stationnaire,
continu dans L2 (ie. lims→t E[(Xt − Xs )2 ] = 0) la fonction de covariance de X est de la
forme (2.2) (théorème de Bochner). La mesure ν s’appelle la mesure spectrale du processus.
Elle véhicule beaucoup d’informations décrivant le processus. Par exemple, on a K(0) =
Var(Xt ) = ν(R).

De façon générale pour un processus stationnaire, on a

Proposition 2.1 (Processus stationnaire) Soit X processus stationnaire L2 centré et de


fonction de covariance K. On a équivalence entre :
1. la fonction K continue en 0 ;
2. le processus X est L2 -continu : lims→t E[(Xt − Xs )2 ] = 0 ;
3. la fonction K est continue partout.

Démonstration : 1) ⇔ 2) Comme X est centré, on a

E |Xt − Xs |2 = E Xt2 + E Xs2 − 2E Xt Xs


       

= K(t, t) + K(s, s) − 2K(t, s)


= 2K(0) − 2K(|t − s|),

ce qui justifie l’équivalence 1) ⇔ 2). Comme 3) ⇒ 1) est clair, on conclut avec 2) ⇒ 3) qui
vient de
   
K(t + h) = E Xt+h X0 = E (Xt+h − Xt )X0 + K(t)
avec par l’inégalité de Cauchy-Schwarz
  q 
E (Xt+h − Xt )X0 ≤ E (Xt+h − Xt )2 E[X02 ] = K(0)1/2 kXt+h − Xt k2 .


Au passage, on a utilisé que la stricte stationnarité d’un processus gaussien est équivalente
à la stationnarité faible :

Proposition 2.2 Un processus gaussien X est stationnaire ssi t 7→ E[Xt ] est constante et
K(s, t) = K(s − t) (on parle de stationnarité faible).
20 Chapitre 2. ©JCB – M2 Math. – Université de Rennes 1

Démonstration : Il est clair que ces conditions sont nécessaires, que le processus soit gaus-
sien ou pas : comme par stationnarité, on a L(Xt ) = L(Xs ) pour tout t, s, on a E[Xt ] =
E[Xs ] et donc la fonction moyenne est constante ; de même L(Xt , Xs ) = L(Xt+h , Xs+h ) pour
tout t, s, h, alors on a Cov(Xt , Xs ) = Cov(Xt+h , Xs+h ) et donc la covariance ne dépend que
de la différence t − s.
Elles sont suffisantes seulement dans le cas gaussien puisque dans ce cas, la loi est caracté-
risée par t 7→ E[Xt ] et par K(s, t). Il est facile alors de voir dans ce cas qu’une translation
dans les paramètres de temps ne modifie pas ces fonctions sous les hypothèses de la pro-
position donc pas non plus la loi. 

2.2 Régularité gaussienne


Des bonnes conditions pour avoir une version assez régulière d’un processus gaussien
sont données dans le résultat suivant, conséquence facile du Théorème 1.2 (Kolmogorov-
Čentsov) dans le cadre gaussien.
Théorème 2.2 (Kolmogorov-Čentsov gaussien) Soit X un processus gaussien centré (E[Xt ] =
0), de fonction de covariance K(s, t). On suppose qu’il existe α > 0 et 0 < C < +∞ tels
que pour tout s, t ≥ 0 :
K(t, t) + K(s, s) − 2K(s, t) ≤ C|t − s|α .
Alors il existe une version continue X
e de X. De plus, pour tout 0 < γ < α/2, les trajectoires
de X
e sont ps höldériennes de coefficient γ.

Démonstration : À partir de E[|Xt − Xs |2 ] = E[Xt2 ] + E[Xs2 ] − 2E[Xt Xs ] ≤ C|t − s|α , on


ne peut pas appliquer directement le Théorème 1.2 (Kolmogorov-Čentsov) car α > 1 n’est
pas garanti alors que c’est requis pour le Th. 1.2. On s’intéresse plutôt à E[|Xt − Xs |2m ].
On rappelle que d’après la Prop. 0.2, pour X variable aléatoire normale centrée, on a :
E[X 2m ] = 2(2m)! m
m m! Var(X) . Il vient alors pour tout m ≥ 1 :

(2m)!
E |Xt − Xs |2m ≤ C m m |t − s|mα .
 
2 m!
Comme cela est valable pour tout m ≥ 1, on choisit l’entier m tel que mα > 1. D’après le
Théorème 1.2 (Kolmogorov-Čentsov) avec
b mα − 1
b = mα − 1, a = 2m, et = ,
a 2m
il existe une version mα−1
2m
-höldérienne de X, pour tout m > 1/α. Comme limm→+∞ mα−1
2m
=
α
2
, il existe une version γ-höldérienne de X pour tout γ < α/2.
Finalement, les versions höldériennes pour des exposants γ 6= γ 0 coı̈ncident nécessairement
par indistinguabilité (Prop. 1.3). 
2.3. Espace gaussien 21

2.3 Espace gaussien


On rappelle que L2 (Ω, F, P) est un espace de Hilbert pour le produit scalaire hX, Y i =
E[XY ].

Définition 2.2 (Espace gaussien) Un espace gaussien (centré) est un sous-espace fermé de
L2 (Ω, F, P) formé de variables gaussiennes centrées.

Par exemple, si X = (X1 , . . . , Xp ) est un vecteur gaussien centré dans Rp , alors Vect(X1 , . . . , Xp )
est un espace gaussien. (Vect(X1 , . . . , Xp ) est constitué des combinaisons linéaires d’un vec-
teur gaussien, elles sont donc gaussiennes).

Proposition 2.3 Si X = (Xt )t∈T est un processus gaussien, le sous-espace vectoriel fermé
de L2 (Ω, F, P) engendré par les variables aléatoires Xt , t ∈ T , est un espace gaussien,
appelé espace gaussien engendré par le processus X.
L2 (Ω,F ,P)
Démonstration : Le sous-espace vectoriel fermé Vect (Xt : t ∈ T ) est formé des
2
limites dans L (Ω, F, P) des combinaisons linéaires finies de marginales Xti de (Xt )t∈T .
Ces limites sont gaussiennes car
— comme (Xt )t∈T est gaussien, les combinaisons linéaires ni=1 ai Xti le sont aussi ;
P
— les limites L2 de variables gaussiennes sont gaussiennes, cf. Prop. 0.5.


Si H est un sous-ensemble de L2 (Ω, F, P), on note σ(H) la tribu engendrée par les variables
aléatoires Y ∈ H.

Théorème 2.3 Soit H un espace gaussien et soit {Hi , i ∈ I} une famille de sous-espaces
vectoriels de H. Alors les sous-espaces Hi , i ∈ I, sont orthogonaux dans L2 (Ω, F, P) si et
seulement si les tribus σ(Hi ), i ∈ I, sont indépendantes.

Ce résultat est une généralisation des Prop. 0.8 et 0.9 pour les variables et vecteurs gaus-
siens. Comme dans ces cas, il est crucial que les espaces Hi soient contenus tous dans un
même espace gaussien.
Démonstration : Si on suppose les tribus σ(Hi ), i ∈ I, indépendantes, alors pour i 6= j et
X ∈ Hi , Y ∈ Hj , on a
E[XY ] = E[X]E[Y ] = 0,
ce qui signifie que les espaces Hi sont deux à deux orthogonaux (le produit scalaire étant
donné dans ce contexte par la covariance : hX, Y i = E[XY ]).
Réciproquement, supposons les espaces Hi , i ∈ I, deux à deux orthogonaux. Par dé-
finition de l’indépendance d’une famille infinie de tribus, il suffit de montrer que pour
tous indices distincts i1 , . . . , ip ∈ I, les tribus σ(Hi1 ), . . . , σ(Hip ) sont indépendantes. Pour
cela, il suffit de montrer que, si Y11 , . . . , Yn11 ∈ Hi1 , . . . , Y1p , . . . , Ynpp ∈ Hip les vecteurs
(Y11 , . . . , Yn11 ), . . . , (Y1p , . . . , Ynpp ) sont indépendants. En effet, pour chaque j, les ensembles
22 Chapitre 2. ©JCB – M2 Math. – Université de Rennes 1

de la forme {Y1j ∈ A1 , . . . , Ynjj ∈ Anj } forment une classe stable par intersection finie qui en-
gendre la tribu σ(Hj ), et on peut ensuite utiliser un argument classique de classe monotone.
Pour chaque j ∈ {1, . . . , p}, on considère Z1j , . . . , Zm j
j
une base orthonormée de Vect(Y1j , . . . , Ynjj ).
La matrice de covariance du vecteur

Z11 , . . . , Zm
1
, Z12 , . . . , Zm
2
, . . . , Z1p , . . . , Zm
p

1 2 p

est alors la matrice identité (car pour i 6= j E[Zli Zkj ] = 0 à cause de l’orthogonalité de Hi et
Hj , et pour i = j, c’est dû au choix de Zli , 1 ≤ l ≤ mi , base orthonormée de Hi ). Ce vecteur
est gaussien car ses composantes sont dans H, espace gaussien. D’après la Proposition 0.9,
les composantes sont indépendantes. On conclut alors que les vecteurs

Z11 , . . . , Zm
1
, . . . , Z1p , . . . , Zm
p
 
1 p

sont indépendants. Comme pour chaque j ∈ {1, . . . , p} le vecteur (Y1j , . . . , Ynj1 ) est une
combinaison linéaire des coordonnées de (Z1j , . . . , Zm j
1
), de manière équivalente les vecteurs

Y11 , . . . , Yn11 , . . . , Y1p , . . . , Ynpp


 

sont indépendants, ce qui prouve le Théorème 2.3. 

Corollaire 2.1 Soient H un espace gaussien et K un sous-espace vectoriel fermé de K. On


note pK la projection orthogonale sur K. Soit X ∈ H.
1. On a  
E X|σ(K) = pK (X).
 
2. Soit σ 2 = E (X − pK (X))2 . Alors, pour tout borélien B de R,

P X ∈ B|σ(K) = Q(ω, B),

où Q(ω, ·) est la loi N pK (X)(ω), σ 2 , ie.

1
Z  (y − p (X)2 ) 
K
Q(ω, B) = √ exp − dy
σ 2π B 2σ 2

(et avec Q(ω, B) = 1B (pK (X)) si σ = 0).

Remarque 2.2 1. D’une manière générale, la loi conditionnelle d’une variable aléatoire
réelle X sachant une sous-tribu G est un noyau Q(ω, ·) G-mesurable, ie. une applica-
tion Q : Ω × B(R) → [0, 1] telle que
— pour tout ω, B 7→ Q(ω, B) est une mesure de probabilité sur (R, B(R)),
— pour tout B ∈ B(R), ω 7→ Q(ω, B) est G-mesurable,
2.4. Exemples de processus gaussiens 23

avec la propriété
P(X ∈ B|G) = Q(ω, B), ∀B ∈ B(R),
R
et plus généralement E[f (X)|G] = f (y) Q(ω, dy). La partie 2) du corollaire explique
alors que dans le cas gaussien, la loi conditionnelle
 de X sachant la tribu σ(K) est
2
explicite, il s’agit de la loi N pK (X), σ .
2. En général, pour une variable aléatoire X dans L2 (Ω, F, P), l’espérance conditionnelle
est donné par une projection orthogonale, ie. E[X|σ(K)] = pL2 (Ω,σ(K),P) (X). Dans le
cadre gaussien, l’assertion 1) du corollaire montre que la projection orthogonale est
à faire directement sur l’espace K, bien plus petit que L2 (Ω, σ(K), P) où il faut en
général projeter.
3. L’assertion 1) porte aussi le principe de la régression linéaire. Par exemple, si (X1 , X2 , X3 )
est un vecteur gaussien, la meilleure approximation de X3 connaissant X1 et X2 s’écrit
λ1 X1 + λ2 X2 où λ1 et λ2 sont déterminés en disant que X3 − (λ1 X1 + λ2 X2 ) est or-
thogonal à Vect(X1 , X2 ).

Démonstration : 1) Soit Y = X − pK (X). Alors Y est orthogonal à K et d’après le


Théorème 2.3, Y est indépendante de σ(K). On a donc
   
E X|σ(K) = E pK (X)|σ(K) + E[Y |σ(K)] = pK (X) + E[Y ] = pK (X).
2) On écrit, pour toute fonction f mesurable positive sur R+ ,
Z
   
E f (X)|σ(K) = E f (pK (X) + Y )|σ(K) = f (pK (X) + y)PY (dy)

où PY est la loi de Y qui est une loi N (0, σ 2 ) puisque Y est une variable gaussienne (cen-
trée) de variance σ 2 . (On a utilisé le fait général suivant : si Z est
R une variable aléatoire
G-mesurable et si Y est indépendante de G alors E[g(Y, Z)|G] = g(y, Z)PY (dy).) Le ré-
sultat annoncé en 2) découle aussitôt de la formule précédente. 

2.4 Exemples de processus gaussiens


Avant d’étudier en détails le mouvement brownien au Chapitre 3, on décrit brièvement ce
processus ainsi que quelques autres processus qui lui sont associés.

Mouvement brownien
Soit T = R+ , le mouvement brownien (standard) (Bt )t≥0 est le processus gaussien
défini par E[Bt ] = 0 et K(s, t) = min(s, t) (et à trajectoires presque sûrement continues).
On l’appelle aussi processus de Wiener. Noter que RK(t, s) = min(t, s) est bien de type
positif au sens de (2.1) puisqu’en écrivant K(t, s) = R 1[0,t] (x)1[0,s] (x) dx, on a
X Z X Z X 2
c(s)c(t)K(s, t) = c(s)1[0,s] (x)c(t)1[0,t] (x) dx = c(t)1[0,t] (x) dx ≥ 0.
s,t∈T R s,t∈T R t∈T
24 Chapitre 2. ©JCB – M2 Math. – Université de Rennes 1

Propriétés immédiates

1) B0 = 0 car la loi de B0 est N (0, 0) = δ0 , la loi dégénérée en 0.


2) (Bt )t≥0 est un processus à accroissements indépendants. En effet soit 0 ≤ t1 < t2 < t3 <
t4 , on a
Cov(Bt2 − Bt1 , Bt4 − Bt3 ) = E[(Bt2 − Bt1 )(Bt4 − Bt3 )]
= E[Bt2 Bt4 ] − E[Bt2 Bt3 ] − E[Bt1 Bt4 ] + E[Bt1 Bt3 ]
= t2 − t2 − t1 + t1 = 0.
Les variables aléatoires Bt2 − Bt1 et Bt4 − Bt3 sont donc non corrélées. Comme elles sont
gaussiennes, elles sont indépendantes. On justifie de même l’indépendance de n accroisse-
ments.
3) Bt ∼ N (0, t) car E[Bt ] = 0 et Var(Bt ) = K(t, t) = t.
4) Si s ≤ t, on a Bt − Bs ∼ Bt−s . En effet E[Bt − Bs ] = E[Bt ] − E[Bs ] = 0 et
Var(Bt − Bs ) = Cov(Bt − Bs , Bt − Bs )
= Cov(Bt , Bt ) − 2 Cov(Bt , Bs ) + Cov(Bs , Bs )
= t − 2s + s = t − s.
Comme Bt − Bs est de loi normale (combinaison linéaire des marginales d’un processus
gaussien), on a Bt − Bs ∼ N (0, t − s) ∼ Bt−s .
et = √1 Bct , t ≥ 0, définit encore un mouvement brownien (standard).
5) Autosimilarité : B c

6) Comportement analogue en 0 et en +∞ : B̃t = tB1/t t ≥ 0, définit encore un mouvement


brownien standard.
Le processus (Bt )t≥0 a donc des comportements liés au voisinage de 0 et en +∞
7) Localisation : pour tout t0 > 0, B̃t = Bt+t0 − Bt0 , t ≥ 0, définit encore un mouvement
brownien standard.
Le processus (Bt )t≥0 a donc le même comportement en 0 et en tout t0 > 0.
8) (Bt )t≥0 a des trajectoires ps holdériennes d’ordre γ pour tout γ ∈]0, 1/2[ mais ps non
dérivables.
En effet, E[|Bt − Bs |2 ] = |t − s|, donc la continuité höldérienne suit du Théorème 2.2.
On admet la non-dérivabilité des trajectoires, cf. Chapitre 3 et théorème de Kolmogorov-
Čentsov (Th. 2.2).
[Graphe typique des trajectoires.]

Pont Brownien
Soit T = [0, 1], le pont brownien (Bt◦ )t∈[0,1] est le processus gaussien centré défini par la
fonction de covariance K(s, t) = min(s, t) − st.
[Graphe typique des trajectoires.]
2.4. Exemples de processus gaussiens 25

Proposition 2.4 On peut définir directement un pont brownien B ◦ à partir d’un mouvement
brownien B par
Bt◦ = Bt − tB1 , t ≥ 0.

Démonstration : En effet, d’abord (Bt −tB1 )t∈[0,1] est gaussien, centré puis pour s, t ∈ [0, 1],
on a

Cov(Bt − tB1 , Bs − sB1 )


= Cov(Bt , Bs ) − t Cov(B1 , Bs ) − t Cov(Bs , B1 ) + ts Cov(B1 , B1 )
= min(t, s) − ts − st + ts
= min(t, s) − ts.

Comme le processus (Bt − tB1 )t∈[0,1] est gaussien, centré avec la bonne covariance, il s’agit
d’un pont brownien. 

Réciproquement, on peut construire le mouvement brownien B sur T = [0, 1] à partir du


pont brownien B ◦ et d’une loi normale N ∼ N (0, 1) indépendante de B ◦ par

Bt = Bt◦ + tN.

Exercice 2.1 Vérifier par un calcul de covariance qu’on définit ainsi un mouvement brow-
nien.

Propriétés immédiates
1. Bet◦ = B1−t◦
, t ≥ 0, définit encore un pont brownien. Le pont brownien est donc
symétrique en 0 et en 1 par retournement du temps.
2. (Bt◦ )t≥0 a des trajectoires ps holdériennes d’ordre γ pour tout γ ∈]0, 1/2[ mais ps non
dérivables.
L’argument est le même que pour le mouvement brownien avec E[(Bt◦ )2 ] = t − t2 .
3. Un pont brownien B ◦ est un mouvement brownien B conditionné à valoir 0 à la date
t = 1 (conditionnement singulier).

Processus d’Ornstein-Uhlenbeck
Soit T = R, le processus d’Ornstein-Uhlenbeck est le processus gaussien centré défini par

Ut = e−t/2 B(et )

où B est un mouvement brownien. On montre facilement que Ut ∼ N (0, 1) car Var(Ut ) = 1,
ce processus est donc stationnaire. Sa fonction de covariance est donnée par

K(s, t) = exp − |t − s|/2 .
26 Chapitre 2. ©JCB – M2 Math. – Université de Rennes 1

Elle ne dépend que de la différence (t − s), il s’agit bien d’un processus stationnaire de
fonction de covariance plus simplement donnée par K(t) = e−|t|/2 (exercice). Elle est donnée
du
sous forme intégrale (2.2) avec la mesure spectrale ν(du) = .
π(1 + u2 )

Brownien géométrique
Ce n’est pas un processus gaussien mais l’exponentiel d’un processus gaussien. Il s’agit de

St = x exp µt + σBt − σ 2 t/2 ,



t ≥ 0. (2.3)

Un tel processus modélise le cours d’un actif St soumis à un taux d’intérêt µ ≥ 0 et à une
volatilité σ > 0 et qui vaut x au temps 0.

On le trouve en supposant comme Samuelson qui l’a introduit que les rendements entre
deux périodes sont mesurés par les logarithmes des cours St .

On suppose de plus que les rendements entre 0 et t suivent un mouvement brownien de


tendance (drift) µ − σ 2 /2 et de coefficient de diffusion (volatilité) σ. Cela se traduit par les
propriétés suivantes sur les prix (St )t≥0 :
— S0 = x.
— Les rendements log St −log Ss suivent une loi gaussienne de moyenne (µ−σ 2 /2)(t−s)
et de variance σ 2 (t − s).
— Pour tout t0 = 0 ≤ t1 ≤ · · · ≤ tp , les accroissements relatifs Sti+1 /Sti , 0 ≤ i ≤ p − 1,
sont indépendants.
On en déduit qu’il existe un mouvement brownien (Bt )t≥0 tel que en t, St = x exp(µt +
σBt − σ 2 t/2).

Bruit blanc gaussien


Soit (A, µ) un espace mesuré et U = {A ∈ A : µ(A) < +∞}.

Le bruit blanc est un processus gaussien (XA )A∈A indexé par l’ensemble des mesurables A
défini par E[XA ] = 0 et Cov(XA , XB ) = µ(A ∩ B).

Il faut appréhender le buit blanc comme une mesure aléatoire A 7→ XA (ω). Elle est
aléatoire car XA dépend de ω. On connaı̂t quand même la loi de X(A) ∼ N (0, µ(A)).

Attention cependant, un bruit blanc n’est pas une vraie mesure car A 7→ XA n’est pas
σ-additif.
2.4. Exemples de processus gaussiens 27

Mouvement brownien fractionnaire


Soit T = R+ . Le mouvement brownien fractionnaire (mBf) (B H (t))t≥0 est le processus
gaussien centré défini par la fonction de covariance
1
|s|2H + |t|2H − |s − t|2H .

K(s, t) =
2
Le paramètre H s’appelle indice de Hurst.

Propriétés immédiates
1. Pour H = 1/2, le mBf devient le mouvement brownien standard.
 
2. On a E |B H (t) − B H (s)|2 = |t − s|2H .
3. Autosimilarité : B H (t) = c−H B H (ct), t ≥ 0, définit encore un mBf d’indice H.
4. Les accroissements du mBf ne sont indépendants que lorsque H = 1/2 (c’est à dire
dans le cas du mouvement brownien).
 
Cas H = 1. On a E B H (t)B H (s) = st. On montre alors qu’il s’agit d’un processus
dégénéré de la forme B H (t) = tB H (1). Il s’agit en fait d’une droite aléatoire. (Dans ce cas,
la dépendance est très forte dans la trajectoire !)
Cas H = 0. On a

 1 1/2 si s 6= t
E B H (t)B H (s) = |s|0 + |t|0 − |s − t|0 =
 
2 1 si s = t.

Dans le cas H = 0, on peut construire le mBf de la façon suivante : soit (Yt )t≥0 une suite de
variables aléatoires indépdendantes et Z une variable aléatoire indépendante de (Yt )t≥0 . On

les prend de loi Yt ∼ Z ∼ N (0, 1). Considérons alors Xt = (Yt +Z)/ 2. On montre facilement
que Xt a bien la covariance cherchée. On constate alors que les trajectoires de (Xt )t≥0 sont
complètement discontinues.
[Graphe typique des trajectoires.]
De façon générale, pour 0 < H < 1, les trajectoires du mBf (B H (t))t≥0 sont β-höldériennes
pour tout ordre β ∈]0, H[. Cela est dû au Théorème 2.2 de régularité des processus gaussiens
(Kolmogorov-Čentsov).
28 Chapitre 2. ©JCB – M2 Math. – Université de Rennes 1
Chapitre 3

Mouvement brownien

Dans ce chapitre, on présente le mouvement brownien (mB). Nous renvoyons à [LG0]


pour une introduction générale de ce processus, à [KS], [RY] pour une description détaillée
des principales propriétés du mouvement brownien.
On commence par quelques dates marquantes de l’histoire du mouvement brownien en
Section 3.1 avant de définir le mouvement brownien en Section 3.2. On en étudie les
propriétés en loi en Section 3.3, propriétés des trajectoires en Section 3.4, la variation
quadratique en Section 3.5. On étudie enfin la propriété de Markov forte en Section 3.6 avec
notamment le principe de réflexion. On revient à l’équation de la chaleur en Section 3.7.
Historiquement, le mouvement brownien a été exhibé pour représenter des mouvements
qui évoluent au cours du temps de façon particulièrement désordonnée, par exemple en
physique pour représenter des particules microscopiques soumises aux multiples chocs de
leur environnement ou en finance pour représenter des cours de bourses très volatiles.
Le mouvement brownien joue un rôle central dans la théorie des processus stochastiques
(comme la loi normale standard N (0, 1) pour les lois de probabilités sur R). Il apparaı̂t
dans de nombreuses situations aussi bien théoriques qu’appliquées et il offre un cadre assez
simple où de nombreux calculs peuvent être menés.

3.1 Historique
En 1827, la première description (heuristique) du mouvement brownien est due au bota-
niste écossais Robert Brown (qui lui a donc donné son nom). Il observe de fines particules
organiques en suspension dans un gaz ou un fluide et en décrit les mouvements particu-
lièrement erratiques, au point que plusieurs physiciens estiment ensuite pendant le 19ème
siècle que ce mouvement ne semble pas admettre de tangente. On ne pourrait donc pas
parler de vitesse, ni lui appliquer les lois classiques de la mécanique !
En 1900, la première approche mathématique du mouvement brownien est due au français
Louis Bachelier (dans sa Théorie de la spéculation). Il l’introduit pour modéliser la dyna-
mique des prix des actions à la bourse. Sa démarche sera cependant oubliée jusque vers les
années 1960.

29
30 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

En 1905, l’allemand Albert Einstein (dans sa Théorie de la relativité restreinte) construit


un modèle probabiliste pour décrire le mouvement d’une particule qui diffuse : il montre
notamment que la loi de la position à l’instant t de la particule, sachant que l’état initial
est x, admet une densité qui vérifie l’équation de la chaleur et de ce fait est gaussienne.
Davantage d’explications sur les relations entre mouvement brownien et équation de la
chaleur sont données en Section 3.7.
La même année qu’Einstein, le physicien polonais Marian von Smoluchowki utilise des pro-
menades aléatoires pour décrire le mouvement brownien dont il en est les limites.
En 1923, l’américain Norbert Wiener donne une première construction mathématique ri-
goureuse du mouvement brownien en tant que processus stochastique. Il établit en parti-
culier la continuité de ses trajectoires.
Dans la période 1930–1960, de nombreuses propriétés du mouvement brownien sont ensuite
établies notamment par le français Paul Lévy. La notion d’équation différentielle stochas-
tique est introduite. Le japonais Kiyoshi Itô les généralisera et les analysera avec son traité
de 1948. Cette démarche très féconde établit des liens importants entre analyse et proba-
bilité et fonde l’analyse et le calcul stochastiques.
Les relations entre probabilités et physique sont, elles, explorées via le mouvement brow-
nien et ses généralisations dès 1930 par les néerlandais Leonard Ornstein et George Eugene
Uhlenbeck en suivant une idée du français Paul Langevin. Ils montrent que le processus
d’Ornstein-Uhlenbeck décrit la situation d’équilibre d’un modèle dirigé par le mouvement
brownien.
Depuis, de nombreux tavaux sont consacrés au mouvement brownien, à ses généralisations
et au calcul stochastique. Citons pour terminer Wolfgang Döblin, mathématicien franco-
allemand dont les travaux précurseurs en analyse stochastique (fin des années 30) sont
restés méconnus jusqu’à l’ouverture de son célèbre pli cacheté en 2000 à l’académie des
sciences de Paris (Döblin, mobilisé pendant la deuxième guerre mondiale avait envoyé ses
travaux depuis le front, par crainte de ne pas revenir de la guerre. Il n’en est pas revenu.
Son courrier est resté oublié jusqu’en 2000).

Dans le cadre déterministe, de nombreux phénomènes sont régis par des équations
différentielles (ou équations aux dérivées partielles). Pour les phénomènes modélisés par
un mouvement brownien, on s’attend à avoir des équations différentielles faisant interve-
nir le mouvement brownien. Malheureusement, ce processus a des trajectoires nulle part
dérivables (cf. Prop. 3.6 et Th. 3.1) et il n’est pas possible de considérer des équations diffé-
rentielles le faisant vraiment intervenir. Plutôt que de le dériver, on cherchera dans la suite,
à intégrer contre ce processus, ce qui permettra de contourner le problème en considérant
des équations intégrales (il est d’usage de se ramener à l’écriture symbolique de dérivées
et on parlera alors d’équation différentielle stochastique). Dans les prochains chapitres (cf.
Chapitre 6), on définit l’intégrale stochastique pour une large classe de processus (les semi-
martingales, cf. Chapitre 5). Si on se contente du cadre brownien (intégrale et équation
différentielle stochastique pour le mouvement brownien), on parle de calcul d’Itô. Dans ce
cadre simplifié, la contruction est plus directe. On pourra consulter les notes cours [Tud]
ou le livre [Gal] pour cette approche réservée au mouvement brownien.
3.2. Définition, premières propriétés 31

Dans ce chapitre, nous en donnons les principales propriétés (en loi en Section 3.3, tra-
jectorielles en Section 3.4, variation quadratique en Section 3.5) notamment les propriétés
de Markov faible et forte (Section 3.6). À la fin du chapitre en Section 3.7, nous explorons
les liens entre le mouvement brownien et l’équation de la chaleur, ce qui correspond à la
démarche d’Einstein pour appréhender le mouvement brownien.

3.2 Définition, premières propriétés


Le caractère très erratique des trajectoires qui caractérise le mouvement brownien est en
général associé à l’observation que le phénomène, bien que très désordonné, présente une
certaine homogénéité dans le temps, au sens où la date d’origine des observations n’a pas
d’importance. Ces propriétés sont reprises dans la définition qui suit.

Définition 3.1 (Mouvement brownien) Un mouvement brownien (standard) réel est un


processus gaussien centré (Bt )t≥0 à trajectoires continues de fonction de covariance

K(s, t) = min(s, t) := s ∧ t.

On l’appelle aussi processus de Wiener.

L’opérateur K(s, t) = min(s, t) est symétrique et de type positif. En effet si c : R → R est


à support borné alors
X X
c(s)c(t)K(s, t) = c(s)c(t)(s ∧ t)
s,t∈R s,t∈R
X Z
= c(s)c(t) 1[0,s] (x)1[0,t] (x) dx
s,t∈R
Z X
= c(s)c(t)1[0,s] (x)1[0,t] (x) dx
s,t∈R
Z !2
X
= c(t)1[0,t] (x) dx ≥ 0.
t∈R

Par le Théorème 2.1, il existe alors un processus gaussien centré de covariance K. Par
contre, il n’est pas immédiat que ce processus admette une version à trajectoires conti-
nues ps. Mais cela sera justifié en début de Section ?? avec le théorème de régularité de
Kolmogorov-Čentsov pour les processus gaussiens (Th. 2.2).

3.2.1 Propriétés immédiates


1) B0 = 0 car la loi de B0 est N (0, 0) = δ0 , la loi dégénérée en 0.
2) Bt ∼ N (0, t) car E[Bt ] = 0 et Var(Bt ) = K(t, t) = t.
32 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

3) (Bt )t≥0 est un processus à accroissements indépendants. En effet soit 0 ≤ t1 < t2 < t3 <
t4 , on a
  
Cov Bt2 − Bt1 , Bt4 − Bt3 = E (Bt2 − Bt1 )(Bt4 − Bt3 )
       
= E Bt2 Bt4 − E Bt2 Bt3 − E Bt1 Bt4 + E Bt1 Bt3
= t2 − t2 − t1 + t1 = 0.

Les variables Bt2 − Bt1 et Bt4 − Bt3 sont donc non corrélées. Comme le vecteur (Bt2 −
Bt1 , Bt4 − Bt3 ) est gaussien, Bt2 − Bt1 et Bt4 − Bt3 sont indépendantes. On justifie de même
l’indépendance mutuelle de n accroissements, n ≥ 1.
4) Si s ≤ t, on a Bt − Bs ∼ Bt−s . En effet E[Bt − Bs ] = E[Bt ] − E[Bs ] = 0 et

Var(Bt − Bs ) = Cov(Bt − Bs , Bt − Bs )
= Cov(Bt , Bt ) − 2 Cov(Bt , Bs ) + Cov(Bs , Bs )
= t − 2s + s = t − s.

Donc Bt − Bs ∼ N (0, t − s) ∼ Bt−s .

Remarque 3.1 Les propriétes 3) et 4) s’énoncent comme suit : le mouvement brownien a


des accroissements indépendants et stationnaires.

Définition 3.2 (Définition équivalente du mouvement brownien) Soit B = (Bt )t≥0 une
famille de variables aléatoires indéxées par le temps. On dit que B est un mouvement
brownien si c’est un processus à trajectoires continues tel que
i) pour tout t ≥ 0 : Bt ∼ N (0, t).
ii) pour tout 0 ≤ t1 ≤ t2 ≤ · · · ≤ tn , les variables aléatoires Bt1 , Bt2 − Bt1 , . . . Btn − Btn−1
sont indépendantes.

Preuve de l’équivalence. On sait déjà qu’un mB .’efini par la Déf. 3.1 vérifie i) et ii)
donc la déf. 3.2. Il reste à prouver la réciproque. En écrivant Bt = Bs + Bt − Bs pour
s ≤ t, par indépendance des accroissements, en utilisant la fonction caractéristique, on a :
ϕBt = ϕBs ϕBt −Bs . D’où

ϕBt −Bs (x) = ϕBt (x)ϕBs (x)−1 = exp(−tx2 /2) exp(sx2 /2) = exp(−(t − s)x2 /2) = ϕBt−s (x).

Les accroissements sont donc stationnaires, en particulier ils sont gaussiens. Comme les
accroissements sont indépendants, un vecteur d’accroissements (Bt1 , Bt2 − Bt1 , . . . Btn −
Btn−1 ) a pour loi la loi produit de ses lois marginales qui sont gaussiennes. Un vecteur
d’accroissements est donc gaussien. Mais comme (Bt1 , Bt2 , . . . , Btn ) est une transformation
linéaire de (Bt1 , Bt2 − Bt1 , . . . , Btn − Btn−1 ) cela reste gaussien. Les lois fini-dimensionnelles
étant gaussiennes, le processus est gaussien. Puis pour s ≤ t, on a

Cov(Bt , Bs ) = E[Bt Bs ] = E[(Bt − Bs + Bs )Bs ] = E[Bt − Bs ]E[Bs ] + E[Bs2 ] = 0 + s = s,


3.3. Propriétés en loi du mouvement brownien 33

ce qui confirme que le processus défini par la définition alternative Déf. 3.2 est bien le
mouvement brownien (Déf. 3.1) 

[Graphe des trajectoires typiques du MB]


La probabilité que Bt appartienne à un petit intervalle [x, x + dx] est donc donnée par la
densité gaussienne centrée de variance t

1
exp − x2 /2t dx.
 
P Bt ∈ [x, x + dx] = √
2πt

En particulier, la variable aléatoire Bt qui√est une variable √


aléatoire gaussienne de variance t
est comprise entre les nombres f1 (t) = 2 t et f2 (t) = −2 t avec une probabilité (d’à peu
près) 95% (cf. table de la loi N (0, 1)).
On peut montrer que cette propriété est vraie pour toute la trajectoire brownienne qui est
donc comprise entre les deux courbes de f1 et de f2 avec une probabilité comparable (c’est
vrai globalement et pas seulement 00 t par t00 ).
Mais en général, les phénomènes observés ne sont pas aussi bien normalisés.

Définition 3.3 (Mouvement brownien avec dérive) On appelle encore mouvement brow-
nien issu de x, de dérive (ou drift) b et de coefficient de diffusion σ, le processus Xt =
x + σBt + µt (où B est un mouvement brownien standard).

Proposition 3.1 Le mouvement brownien (général) X est encore un processus à accroisse-


ments indépendantsstationnaires et gaussiens. Il est non centré et tel que X0 = x. De plus
Xt ∼ N x + µt, σ 2 t .

Sauf mention contraire, par défaut, quand on parlera du mouvement brownien, il s’agira
du mouvement brownien standard B.

3.3 Propriétés en loi du mouvement brownien


On se fixe dans cette section un mouvement brownien standard B. Systématiquement, pour
vérifier qu’on a un mouvement brownien, il s’agit de vérifier qu’on a un processus gaussien,
centré, à trajectoires continues et avec la bonne fonction de covariance. Dans les propriétés
qui suivent, il est facile (et omis) de constater que le processus est gaussien, centré et à
trajectoires continues ; on se contente de calculer l’opérateur de covariance.
1) Symétrie. −B est un mouvement brownien.
(c)
2) Autosimilarité (propriété d’échelle). Pour tout c > 0, Bt = √1 Bct définit un mouve-
c
ment brownien (standard).
34 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

(c)
En effet : Bt est un processus gaussien car ses lois fini-dimensionnelles en sont de B ; le
processus est centré, à trajectoires continues (car B l’est) et de fonction de covariance
 (c) h 1 1 i 1
E Bt Bs(c) = E √ Bct √ Bcs = min(ct, cs) = min(t, s).

c c c
Conséquence : Cette propriété montre que c fois Bt se comporte comme un mouvement
brownien lu en c2 t : le changement de temps se lit en espace (et réciproquement).
3) Inversion du temps. Le processus B e défini par Bet = tB1/t si t 6= 0 et B
e0 = 0 est un
mouvement brownien standard.
En effet, Be est gaussien car à nouveau ses lois fini-dimensionnelles sont des transformations
linéaires de celles de B ; le processus est centré et de covariance,
 
Cov B et , B
es = ts Cov B1/t , B1/s = ts min(1/t, 1/s) = min(t, s).

De plus, ses trajectoires sont continues sur ]0, +∞[ car celles de B le sont sur R+ . Il reste
s’assurer de la continuité des trajectoires de B
e en 0 et cela vient de
 
  \[ \ 
P lim Bet = 0 = P  |B
et | ≤ 1/n 
t→0
n≥1 p≥1 t∈]0,1/p]∩Q
 
et )t>0 f=
dd
\[ \ 
= P |Bt | ≤ 1/n  car (B (Bt )t>0
n≥1 p≥1 t∈]0,1/p]∩Q
 
= P lim Bt = 0 = 1.
t→0

Conséquence : le processus B a donc le même type de comportement en 0 et en +∞


4) Retournement du temps. Le processus retourné à l’instant T , B bt(T ) = BT − BT −t est
encore un mouvement brownien sur [0, T ].
Il est clair que B b (T ) est un processus gaussien, centré à trajectoires continues et sa covariance
est donnée par
bt(T ) , B
b (T ) = Cov(BT − BT −t , BT − BT −s )

Cov B s
= Cov(BT , BT ) − Cov(BT , BT −s ) − Cov(BT −t , BT ) + Cov(BT −t , BT −s )
= T − (T − s) − (T − t) + T − max(t, s) = min(t, s).

5) Propriété de Markov faible (ou invariance par translation). Le mouvement brownien


(t0 )
translaté de t0 > 0 B t = Bt+t0 − Bt0 est encore un mouvement brownien standard ; de
(t0 )
plus, il est indépendant du mouvement brownien arrêté en t0 (Bt )0≤t≤t0 , ie. B ⊥ FtB0 :=

σ(Bs : s ≤ t0 ).
En effet, pour t0 ≤ s ≤ t :
(t0 ) (t0 )  
Cov B t , B s = Cov Bt+t0 − Bt0 , Bs+t0 − Bt0
3.4. Propriétés trajectorielles du mouvement brownien 35

= K(t + t0 , s + t0 ) − K(t + t0 , t0 ) − K(t0 , s + t0 ) + K(t0 , t0 )


= s + t0 − t0 − t0 + t0 = s = min(s, t).

La deuxième partie est due à l’indépendance des accroissements de B : Soit 0 ≤ s1 < · · · <
(t0 )
sn ≤ t0 , par indépendance des accroissements de B, B t = Bt+t0 − Bt0 est indépendant de
(Bs1 , Bs2 − Bs1 , . . . , Bsn − Bsn−1 ), donc par transformation linéaire de (Bs1 , . . . , Bsn ). Cela
(t0 ) (t0 )
est encore vrai pour tout vecteur de marginales de B . On a donc B indépendant de
{Bs1 ∈ A1 , . . . , Bsn ∈ An }, 0 ≤ s1 < · · · < sn ≤ t0 et A1 , . . . , An ∈ B(R). Comme il s’agit
(t0 )
d’un mesurable typique de FtB0 , on a B t ⊥ ⊥ FtB0 = σ(Bt : t ≤ t0 ). 
De la même façon, on montre que pour t1 < t2 , Bt1 +t0 −Bt0 , Bt2 +t0 −Bt1 +t0 est indépendant
de FtB0 . Mais comme

(t0 ) (t0 )  
B t1 , B t2 = Bt1 +t0 − Bt0 , Bt2 +t0 − Bt0

(t0 ) (t0 ) 
en est une image linéaire, cela reste donc vrai pour B t1 , B t2 et plus généralement pour
(t0 ) (t0 ) 
toutes les lois fini-dimensionnelles de B : B t t≥0 ⊥ ⊥ FtB0 .
Conséquence : le processus (Bt )t≥0 a donc le même comportement localement en 0 et en
t0 , donc en tout point.
Cette propriété se réécrit dans le cadre classique de la théorie de Markov : indépendance
du futur et du passé conditionnellement au présent : en notant Wx la loi du mouvement
brownien issu de x ∈ R, ie. de x+B où B est un mouvement brownien habituel, on réécrit :

Proposition 3.2 (Propriété de Markov faible) Soit t ≥ 0 fixé. Posons Bs0 = Bt+s , x ∈ R.
Alors conditionnellement à Bt = x, le processus B 0 est indépendant de σ(Bu : u ≤ t) = FtB
et a pour loi Wx .

(t) (t)
Démonstration : Pour cela, il suffit de remarquer que Bs0 = B s + Bt où B s = Bt+s − Bt
est un mouvement brownien indépendant de FtB et Bt est une variable FtB -mesurable. 

3.4 Propriétés trajectorielles du mouvement brownien


3.4.1 Loi du 0/1 de Blumenthal
On définit d’abord la notion de filtration en temps continu qui sera essentielle pour consi-
dérer les martingales au Chapitre 4.

Définition 3.4 (Filtration) Une filtration sur un espace de probabilité (Ω, F, P) est une
famille (Ft )t≥0 de sous-tribus telle que pour s ≤ t, on a Fs ⊂ Ft .
36 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

Si on considère un processus (Xt )t≥0 , on considère souvent la filtration qu’il engendre :


FtX = σ(Xs : s ≤ t). Dans ce cas, il est utile d’interpréter une filtration comme une quan-
tité d’information disponible jusqu’à une date donnée : FtX représente ainsi l’information
véhiculée par le processus X jusqu’à la date t.
Une filtration est P-complète pour une mesure de probabilité P si F0 contient tous les
évènements de mesure nulle, ie. N = {N ∈ F tel que P(N ) = 0}⊂ F0 .
À une filtration (Ft )t≥0 on associe
\ _
Ft+ = Ft+ε et Ft− = Ft−ε .
ε>0 ε>0

(On rappelle que A ∨ B = σ(A ∪ B).) La filtration (Ft )t≥0 est dite continue à droite (resp.
continue à gauche) si pour tout t, on a Ft = Ft+ (resp. Ft = Ft− ).
Dans la suite, on dira qu’une filtration satisfait les conditions habituelles si elle est complète
et continue à droite.

Proposition 3.3 La filtration brownienne (FtB )t≥0 est continue à droite.

Corollaire 3.1 (Loi du 0/1 de Blumenthal) La tribu F0B+ est triviale, ie. pour tout A ∈
F0B+ , on a P(A) = 0 ou 1.

Remarque
W 3.2B — En fait, la filtration brownienne est aussi continue à gauche : FtB =
s<t Fs .
C’est le cas de toute filtration (FtX )t≥0 engendrée par un processus à trajectoires
continues à gauche. En effet, FtX est engendrée par les ensembles A = {(Xt1 , . . . , Xtp ) ∈
Γ} avec 0 = t1 < · · · < tp ≤ t et Γ ∈ B(Rp ). Lorsque tp < t alors A ∈ FtXp ⊂ FtX− .
Lorsque tp = t, comme Xt = limm→+∞ Xsm pour toute suite sm ∈ [0, t) avec sm % t,
on a A ∈ FtX− . Finalement, FtX− = FtX .
— Une filtration (Ft+ )t≥0 est toujours continue à droite.
— Attention : si X est à trajectoires continues, (FtX )t≥0 peut ne pas être continue à
droite, ni (FtX+ )t≥0 à gauche, cf. contre-exemples p. 89 et 122 dans [KS].

Preuve de la continuité à droite de la filtration brownienne.


i) La tribu F0B+ est triviale (ie. Blumenthal).
On considère le processus Xn défini sur [0, 2−n ] par Xn = B2−n +t − B2−n , 0 ≤ t ≤ 2−n .


La suite (Xn )n≥1 est une suite de processus indépendants (par l’indépendance des accrois-
sements du mouvement brownien). On remarque que l’on peut retrouver la trajectoire
brownienne à partir des Xk , k ≥ n, par
+∞
X
B2−n +t = Xn (t) + Xn+k (2−n−k ), 0 ≤ t ≤ 2n
k=1
3.4. Propriétés trajectorielles du mouvement brownien 37

car B2−n → 0, n → +∞. Soit pour t > 0 et 2−p ≤ t < 2−p+1 , en écrivant t = 2−p + s,
s ∈ [0, 2−p ] (ie. p = [−t/ ln 2] + 1) :
X
Bt = B2−p +s = Xp (t − 2−p ) + Xk (2−k )
k>p

En particulier pour 0 < t ≤ 2−n , on a p ≥ n et Bt ∈ σ Xn+1 , . . . , Xn+k , . . . . On en déduit




F2B−n = σ Xn+1 , . . . , Xn+k , . . .




et comme F0B+ = n≥0 F2B−n , F0B+ est la tribu asymptotique engendrée par les processus
T

indépendants Xn . D’après la loi du 0/1 (classique) de Kolmogorov, F0B+ est alors triviale.
i’) Autre preuve de la loi de Blumenthal. Soient 0 < t1 < t2 < · · · < tk , g : Rk → R une
fonction continue bornée et aussi A ∈ F0B+ . Par continuité et convergence dominée, on a
   
E 1A g(Bt1 , . . . , Btk ) = lim E 1A g(Bt1 − Bε , . . . , Btk − Bε ) .
ε→0

Mais dès que ε < t1 , les variables aléatoires Bt1 − Bε , . . . , Btk − Bε sont T
indépendantes de
Fε (par la propriété de Markov simple) et donc aussi de la tribu F0+ (= ε>0 FεB ). Il vient
B B

   
E 1A g(Bt1 , . . . , Btk ) = lim P(A) E g(Bt1 − Bε , . . . , Btk − Bε )
ε→0
= P(A) E[g(Bt1 , . . . , Btk )].
On a donc F0B+ ⊥ ⊥ σ(Bt1 , . . . , Btk ). Comme c’est vrai pour tout 0 < t1 < · · · < tk , on a
aussi F0B+ ⊥
⊥ σ(Bt , t > 0). Puis B0 étant la limite simple de Bt (continuité de t 7→ Bt en
0), on a σ(Bt , t ≥ 0) = σ(Bt , t > 0) et F0B+ ⊂ σ(Bt , t ≥ 0), si bien que F0B+ ⊥
⊥ F0B+ , ce qui
assure que F0B+ est triviale.
ii) Continuité à droite de la filtration brownienne (Prop. 3.3).
(B) (B) (B)
Pour t ≥ 0 fixé, on montre Ft+ = Ft en prouvant que toute variable aléatoire Ft+ -
(B)
mesurable est Ft -mesurable. Pour cela, nous utilisons le théorème de classe monotone
(version fonctionnelle)
Lemme 3.1 (Théorème de classe monotone fonctionnel) Soit E un espace vectoriel fonc-
tionnel monotone (ie. f ∈ E est bornée, les constantes sont dans E, si fn ∈ E et fn % f
bornée alors f ∈ E). On suppose que C ⊂ E où C est un ensemble de fonctions stable par
multiplication. Alors E contient toutes les fonctions σ(C)-mesurables.

On rappelle que t ≥ 0 est fixé. On considère la tribu



Gt = σ Bt+s − Bt : s ≥ 0 .
On commence par prouver que Gt est indépendante de FtB+ . Pour tout ε > 0, par la
B
propriété de Markov (faible), Gt+ε est indépendante de Ft+ε et donc indépendante de FtB+ =
B
T
ε>0 Ft+ε :
⊥ FtB+ .
Gt+ε ⊥ (3.1)
38 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

Si t1 ≤ t2 , on observe que Gt2 ⊂ Gt1 car

Bt2 +s − Bt2 = Bt1 +(t2 +s−t1 ) − Bt1 − (Bt1 +(t2 −t1 ) − Bt1 )

W Gt1 -mesurables. La famille Gt+ε , ε > 0, est donc


s’exprime en fonction de deux variables
croissante quand ε décroit, de limite ε>0 Gt+ε .
Par ailleurs, par continuité des trajectoires de B, pour tout s ≥ 0, Bt+s −Bt = limε→0 Bt+s+ε −
Wt , donc Bt+s − Bt estWlimite de Gt+ε -mesurable donc aussi mesurable par rapport à
B
ε>0 Gt+ε . Il vient Gt = ε>0 Gt+ε et (3.1) assure

⊥ FtB+ .
Gt ⊥ (3.2)

Considérons une variable aléatoire Y positive, Gt -mesurable. On va appliquer le Théorème


de classe monotone fonctionnel (Lemme 3.1) avec E l’espace des variables aléatoires bornées
Z ∈ L∞ (F) qui vérifie
   (B) 
E ZY = E ZE[Y |Ft ] .
Par le théorème de convergence monotone (avec Y ≥ 0), on s’assure aisément que E est
un espace vectoriel fonctionnel monotone.
Notons
M = XZ : X ∈ L∞ (FtB ) et Z ∈ L∞ (Gt ) .


On vérifie aisément que M est une classe multiplicative. De plus M ⊂ E car avec (3.2),
on a :

E XZY = E XY E[Z] (car FtB ⊂ FtB+ ⊥


   
⊥ Gt )
B
 
= E XE[Y |Ft ] E[Z]
= E XZE[Y |FtB ] (car FtB ⊥
 
⊥ Gt ).

D’après le Lemme 3.1 (théorème fonctionnel de classe monotone), l’espace vectoriel E


contient toutes les variables aléatoires bornées et mesurables par rapport à Gt ∨ FtB = F B
où F B est la tribu engendrée par tout le mouvement brownien.
Par conséquent, pour tout W ∈ L∞ (F B ) on a

E[W Y ] = E W E[Y |FtB ] .


 

En particulier, cela exige Y = E[Y |FtB ] ps. Comme la tribu est complète, Y coı̈ncide avec
une variable FtB -mesurable.
Finalement, on peut faire de même pour Y de signe quelconque en écrivant Y = Y + − Y − .
Ainsi toute les fonctions bornées FtB+ sont FtB -mesurables et cela prouve FtB+ = FtB . 
3.4. Propriétés trajectorielles du mouvement brownien 39

3.4.2 Conséquences trajectorielles de la loi du 0/1 de Blumenthal


Proposition 3.4 (sup et inf browniens)
(1) On a ps pour tout ε > 0

sup Bs > 0, inf Bs < 0.


0≤s≤ε 0≤s≤ε

(2) Pour tout η > 0, on a ps


sup Bt ≥ η, inf Bt ≤ −η.
t≥0 t≥0

(3) Pour tout a ∈ R, soit Ta = inf t ≥ 0 : Bt = a (avec inf ∅ = +∞). Alors ps Ta < +∞.
(4) Par conséquent, presque sûrement

lim sup Bt = +∞, lim inf Bt = −∞, (3.3)


t→+∞ t→+∞

Remarque 3.3 — La mesurabilité de sup/inf est assurée par la continuité du mouve-


ment brownien (si bien que le sup est un max, l’inf un min, donc sont mesurables).
— Comme les trajectoires du mouvement brownien sont continues et inf 0<t≤ε Bt < 0 <
sup0<t≤ε Bt , par le théorème des valeurs intermédiaires, il existe un zero tε ∈]0, ε[ de
B. On en déduit que ps {t ≥ 0 : Bt = 0} admet 0 comme point d’accumulation.
— Par translation (Markov simple), toute valeur du mouvement brownien est un point
d’accumulation de sa trajectoire ps.
— En utilisant la propriété de Markov simple, on constate aussi facilement que ps la
fonction t 7→ Bt n’est monotone sur aucun intervalle non-trivial.

Démonstration : 1) Soit (εp )p≥1 une suite de réels strictement positifs décroissants vers 0
et soit ( )
\
A= sup Bs > 0 .
0≤s≤εp
p≥1

Comme sup0≤s≤εp Bs est FεBp -mesurable, on a A ∈ p≥1 FεBp = F0B+ . Puis, comme l’intersec-
T
tion définissant A est décroissante, on a
 
P(A) = lim P sup Bs > 0
p→+∞ 0≤s≤εp

mais comme   1
P sup Bs > 0 ≥ P(Bεp > 0) = ,
0≤s≤εp 2
on a P(A) ≥ 1/2 et la loi de Blumenthal exige alors P(A) = 1. Comme A ⊂ {sup0≤t≤ε Bt >
0}, on a le résultat pour le sup. L’assertion concernant inf 0≤s≤ε Bs est obtenue par symétrie
en loi en remplaçant B par −B.
40 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

2) Par convergence monotone des probabilités, on a


   
1 = P sup Bs > 0 = lim P sup Bs > δ .
0≤s≤1 δ→0 0≤s≤1

Avec le changement s = tδ 2 , puis comme par autosimilarité Bδ2 t /δ définit encore un mou-
vement brownien,
     
P sup Bs > δ = P sup (Bδ2 t /δ) > 1 = P sup Bs > 1 .
0≤s≤1 0≤t≤1/δ 2 0≤s≤1/δ 2

En faisant tendre δ → 0, par convergence monotone des probabilités, on obtient ainsi


P sups≥0 Bs > 1 = 1. Puis, à nouveau, comme par autosimilarité, Bη2 u /η définit un
mouvement brownien standard, pour tout η > 0, on a
     
P sup Bs > η = P sup(Bη2 u /η) > 1 = P sup Bu > 1 = 1.
s≥0 u≥0 u≥0


Avec le changement B → −B, on a aussi P inf s≥0 Bs < −η = 1.
3) Comme {Ta > t} = {sups≤t Bs < a}, avec tp % +∞, on a
! !
\
P(Ta = +∞) = P {Ta > tp } = lim P(Ta > tp ) = lim P sup Bs < a
p→+∞ p→+∞ s≤tp
p≥1
!  
\
= P sup Bs < a = P sup Bs < a = 0
s≤tp s≥0
p≥1

d’après 2), si bien que Ta < +∞ ps.


4) Puis la dernière assertion est une conséquence du fait qu’une fonction continue f : R+ →
R ne peut visiter tous les réels que si lim supt→+∞ f (t) = +∞ et lim inf t→+∞ f (t) = −∞. 

Remarque 3.4 Le mouvement brownien oscille ps entre +∞ et −∞ lorsque t → +∞ mais


avec une vitesse d’oscillation sous-linéaire puisque |Bt /t| → 0, quand t → +∞.
En effet, il suffit de se rappeler par inversion du temps que B et = tB1/t est encore un
mouvement brownien. Si bien que Bt /t = B e1/t → B̃0 = 0 quand t → +∞ (on peut aussi
jusifier ce fait par la LGN).

3.4.3 Régularité trajectorielle brownienne


Proposition 3.5 Le mouvement brownien (Bt )t≥0 a des trajectoires ps localement holdé-
riennes de tout ordre γ ∈]0, 1/2[.
3.4. Propriétés trajectorielles du mouvement brownien 41

En particulier, on montre qu’un processus gaussien centré de covariance t∧s admet donc une
modification à trajectoires continues, c’est à dire une version est un mouvement brownien.
Démonstration : En effet, on a
K(t, t) + K(s, s) − 2K(s, t) = t + s − 2 min(t, s) = |t − s|.
Donc le Théorème 2.2 (Kolmogorov-Čentsov dans le cas gaussien) s’applique avec α = C =
1 pour B sur [0, 1]. Il donne l’existence de version avec la continuité höldérienne pour tout
γ < α/2 = 1/2. Comme le mouvement brownien et ces versions sont continues, elles sont
toutes indistinguables. C’est bien le mouvement brownien qui a ces propriétés de régula-
rité. Le résultat reste vrai pour B sur tout intervalle [0, T ] borné et on a donc la locale
Hölder-régularité sur R+ . 

Proposition 3.6 En chaque t ≥ 0, les trajectoires du mouvement brownien sont ps non


dérivables.
Démonstration : Par la propriété de translation (Markov simple), il suffit de montrer la
non dérivabilité en 0, c’est à dire montrer que
Bt − B0 Bt
lim = lim
t→0 t − 0 t→0 t

n’existe pas. Or par inversion du temps Bt /t = B e1/t où B


e est encore un mouvement
brownien. Mais d’après la Prop. 3.4 pour le mouvement brownien B e (cf. (3.3)), on a

lim sup B
es = +∞, es = −∞
lim inf B
s→+∞ s→+∞

avec s = 1/t, ce qui montre que la limite cherchée n’existe pas. 

En fait, on a bien mieux : le résultat suivant montre que : ps, les trajectoires browniennes
sont nulle part dérivables.
Théorème 3.1 (Dvoretsky, 1963) Il existe une constante C > 0 telle que
 
|Bs − Bt |
P ∃t > 0 : lim sup √ < C = 0. (3.4)
s→t+ s−t
Avant la preuve, on mentionne la conséquence concrète pour les trajevtoires browniennes :
Corollaire 3.2 (Dvoretsky) Presque sûrement, t 7→ Bt est dérivable nulle part.
Démonstration : D’après le Th. 3.1, ps ∀t ∈ [0, 1], lim sups→t+ |B√ss−t −Bt |
≥ C > 0. Soit t
arbitrairement fixé. Si B était dérivable en t de dérivée `, on aurait quand s & t
|Bs − Bt | |Bs − Bt | √ √
√ = × s − t ∼ ` s − t → 0,
s−t s−t
ce qui contredit (3.4) donc B n’est pas dérivable en tout t ∈ R. 
42 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

3.5 Variation quadratique


Définition 3.5 (Variation) Soit f : [0, 1] → R. On définit la α-variation de f par
f (tk+1 ) − f (tk ) α
X
V ar(f, α) = lim sup
ε→0 {t }:ρ({t })≤ε
k k k

où ρ({tk }) = max1≤k≤p |tk − tk−1 | est le pas de la subdivision de [0, 1] et le sup est pris sur
l’ensemble de ces subdivisions.
Pour α = 1, on parle de la variation. On dit que f est à variations bornées si V ar(f, 1) <
+∞. Pour α = 2, on parle de la variation quadratique.

Remarque 3.5 Pour une fonction f de classe C 1 , la variation quadratique tend vers 0 sur
tout intervalle [0, t], en effet, avec une partition 0 = t0 < t1 < · · · < tp = t, on a avec le
théorème des accroissements finis :
p p
X X
Vf (t0 , t1 , . . . , tp ) := 2
(f (ti ) − f (ti−1 )) = (f 0 (t∗i )(ti − ti−1 ))2
j=1 j=1
p
X
≤ δkf 0 k2∞ |ti − ti−1 | = δkf 0 k2∞ t
j=1

où t∗i ∈]ti , ti+1 [ est donné par le théorème des accroissements finis appliqué à la fonction
dérivable f .

Proposition 3.7 (Variation quadratique brownienne) Soit P t > 0 et {0 = t0 < t1 < · · · <
tp = t} une subdivision de [0, t], notons VB (t0 , t1 , . . . , tp ) = pj=1 (Btj − Btj−1 )2 . Alors
(1) VB (t0 , t1 , . . . , tp ) converge dans L2 vers t lorsque le pas de la subdivision δ := max1≤j≤p (tj −
tj−1 ) tend vers 0.
(2) De plus, si la subdivision est uniforme, la convergence est presque sûre.

Heuristiquement : la variation quadratique du mouvement brownien sur [0, t] est donc t.


Démonstration : Notons d’abord que le carré d’une variable gaussienne X centrée de
variance σ 2 est une variable aléatoire d’espérance σ 2 et de variance Var(X 2 ) = 3σ 4 − σ 4 =
2σ 4 (calculs par ipp).
1) On a pour la convergence dans L2 :
n
h X 2 i Xn
2 2
Var (Btj −Btj−1 )2
  
E (VB (t0 , t1 , . . . , tn )−t) = E (Btj −Btj−1 ) −(tj −tj−1 ) =
j=1 j=1

car les variables (Btj − Btj−1 )2 − (tj − tj−1 ) sont centrées et indépendantes. On a donc
n
X
E (VB (t0 , t1 , . . . , tn ) − t)2 = 2 (tj − tj−1 )2 ≤ 2tδ → 0,
 
δ → 0.
j=1
3.5. Variation quadratique 43

Pn−1  
(k+1)t
2) Notons Vn = VB 0, nt , . . . , nt
 2
n
. On a Vn = k=0 ∆k (B) avec ∆k (B) = B n

kt
 Pn t
B n . On a Vn − t = k=0 Yn,k avec Yn,k = ∆k (B)2 − n .
Notons Z = B12 − 1. On a E[Z] = 0 et
 2
2 t t t L t 2 t t
Yn,0 = ∆0 (B) − = B − = B1 − = Z.
n n n n n n
On a
— Pour k = 0, . . . , n, les variables aléatoires Yn,k sont iid (indépendance et stationnarité
des
 accroissements
   de B) ; 
— EYn,k  = EYn,0  = EtZ/n = 0 ;  
2 2
— E Yn,k = E Yn,0 = E t2 Z 2 /n2 = (t2 /n2 ) E Z 2 ;
 4   4     
— E Yn,k = E Yn,0 = E Z 4 /n4 = (t4 /n4 ) E Z 4 .
On utilise maintenant le Lemme ?? :
 !4 
n−1
X
E Yn,k  ≤ Cn2 E[Yn,0
4
].
k=0

Par l’inégalité de Markov, on a alors


 Pn−1   
 E ( k=0 Yn,k )4 Cn2 E Z 4 C0
P |vn − t| ≥ δn ≤ ≤ = .
δn4 n4 δn4 n2 δn4
Avec le choix δn = 1/ ln n, on a
+∞
X 
P |vn − t| ≥ δn < +∞.
n=2

Le lemme de Borel-Cantelli s’applique et donne : ps, pour n assez grand on a |vn − t| ≤


δn → 0. D’où ps limn→+∞ vn = t. 

Proposition 3.8 Presque sûrement, les trajectoires du mouvement brownien sont à trajec-
toires à variations non bornées.

Ce résultat justifie que, si les trajectoires browniennes sont continues, elles oscillent quand
même beaucoup. . . tellement que les trajectoires sont ps à variations non bornées. Ce
phénomène explique les difficultés qu’il y aura à construire une intégrale (de type Stieltjes)
par rapport au mouvement brownien.
Démonstration : Il suffit de justifier la remarque générale suivante : si f est continue sur
[0, 1] et
n−1     2
X k+1 k
lim f − f = a ∈]0, +∞[
n→+∞
k=0
n n
44 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

alors V ar(f, 1) = +∞. Pour cela, supposons que V ar(f, 1) < +∞ et notons ρf (u) =
sup|x−y|<u |f (x) − f (y)| le module de continuité de f . Alors
n     2  X n    
X k + 1 k 1 k+1 k
f − f ≤ ρ f
f − f
k=0
n n n k=0 n n
 
1
≤ ρf V ar(f, 1) → 0
n

quand n → +∞ puisque par continuité de f : limn→+∞ ρf (1/n) = 0. Il est donc nécessaire


d’avoir V ar(f, 1) = +∞. 

3.6 Propriété de Markov forte


Le but dans cette section est d’étendre la propriété de Markov simple (invariance par
translation, cf. Prop. 3.2) au cas où l’instant déterministe s est remplacé par un temps
aléatoire T . On commence par préciser la classe des temps aléatoires pour lesquels cela est
possible.

3.6.1 Temps d’arrêt


Définition 3.6 (Temps d’arrêt) Étant donnée une filtration (Ft )t≥0 , une variable aléatoire
T à valeurs dans [0, +∞] est un temps d’arrêt si pour tout t ≥ 0 on a {T ≤ t} ∈ Ft .

Les propriétés suivantes sont simples :

Proposition 3.9 Soient T et S deux (Ft )-temps d’arrêt alors T ∧ S et T ∨ S sont des
(Ft )-temps d’arrêt.

Démonstration : Cela vient facilement de pour t ≥ 0 :

{T ∧ S ≤ t} = {T ≤ t} ∪ {S ≤ t} ∈ Ft

et
{T ∨ S ≤ t} = {T ≤ t} ∩ {S ≤ t} ∈ Ft
puisque S, T sont de (Ft )-temps d’arrêt et la tribu Ft est stable par intersection et réunion.


Proposition 3.10 Si (Ft )t≥0 est une filtration continue à droite alors T est un (Ft )-temps
d’arrêt ssi pour tout t ≥ 0, {T < t} ∈ Ft .
3.6. Propriété de Markov forte 45

Démonstration : C’est suffisant car


\ \
{T ≤ t} = {T < t + ε} ∈ Ft+ε = Ft+ = Ft .
ε>0 ε>0

Et c’est nécessaire car [


{T < t} = {T ≤ t − ε} ∈ Ft
ε>0

puisque {T ≤ t − ε} ∈ Ft−ε ⊂ Ft . 

Cette proposition s’applique par exemple pour la filtration brownienne F B = (FtB )t≥0
(Prop. 3.3, généralisation de la loi de Blumenthal).

Proposition 3.11 1. Si (Tn )n∈N est une suite croissante de (Ft )-temps d’arrêt alors T =
limn→+∞ Tn est un (Ft )-temps d’arrêt.
2. Si (Tn )n∈N est une suite décroissante de (Ft )-temps d’arrêt alors T = limn→+∞ Tn
est un (Ft+ )-temps d’arrêt.

Démonstration : 1) Soit Tn % T alors pour tout t ≥ 0 :


\
{T ≤ t} = {Tn ≤ t} ∈ Ft
n≥1

2) Soit Tn & T alors pour tout t ≥ 0 :


[
{T < t} = {Tn < t}.
n≥1

Mais [
{Tn < t} = {Tn ≤ t − 1/p} ∈ Ft
p≥1

puisque {Tn ≤ t − 1/p} ∈ Ft−1/p ⊂ Ft . On a donc {T < t} ∈ Ft ⊂ Ft+ ce qui suffit d’après
la Prop. 3.10 puisque Ft+ est continue à droite. 

Exemple 3.1 — Un temps T = t (constant) est un temps d’arrêt.


— Un temps d’atteinte Ta := inf{t ≥ 0 : Bt = a} est un temps d’arrêt pour la filtration
browienne F B . S
En effet, {Ta ≤ t} = {sup0≤s≤t Bs ≥ a} = s∈[0,t]∩Q {Bs ≥ a} ∈ Ft pour a ≥ 0.
— En revanche, T = sup{s ≥ 1 : Bs = 0} n’est pas un temps d’arrêt.
46 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

— Soit O un ouvert alors TO = inf{t ≥ 0 : Bt ∈ O} est un (Ft )-temps d’arrêt si la


filtration est continue à droite.
En effet :
  
TO < t = ∃s < t : Bs ∈ O = ∃s ∈ [0, t] ∩ Q : Bs ∈ O (trajectoires continues)
[  _
= Bs ∈ O ∈ Fs ⊂ Ft .
s∈[0,t]∩Q s∈[0,t]∩Q

Comme la filtration est continue à droite, {TO < t} ∈ Ft suffit.


— Soit F un fermé alors TF = inf{t ≥ 0 : Bt ∈ F } est un (Ft )-temps d’arrêt.
En effet :
 
TF ≤ t = ω ∈ Ω : inf d(Bs (ω), F ) = 0
0≤s≤t

= ω ∈ Ω : inf d(Bs (ω), F ) = 0
s∈[0,t]∩,Q

car B est à trajectoires continues et donc la distance aussi. Par ailleurs, un inf
dénombrable de fonctions mesurables reste mesurable. Par conséquent, {TF ≤ t} ∈
Ft et TF est bien un (Ft )-temps d’arrêt.

Définition 3.7 (Temps d’arrêt simple) Soit T un (Ft )-temps d’arrêt. On dit que T est un
(Ft )-temps d’arrêt simple si l’ensemble des valeurs prises par TP est au plus dénombrable,
ie. il existe une suite (tn )n∈N de temps positifs dans R telle que n≥0 P(T = tn ) = 1.

Proposition 3.12 (Approximation de temps d’arrêt) Soit T un (Ft )-temps d’arrêt. Alors
il existe une suite décroissante (Tn )n∈N de (Ft )-temps d’arrêt simples tels que ps limn→+∞ Tn =
T.

Démonstration : On pose Tn = ([T 2n ] + 1)2−n sur {T < +∞}, ie. Tn = (j + 1)2−n sur
l’évènement {T ∈ [j2−n , (j + 1)2−n [} et Tn = +∞ sur {T = +∞}. On vérifie que Tn est
un (Ft )-temps d’arrêt :
p−1
[
Tn = (j + 1)2−n avec p2−n ≤ t < (p + 1)2−n

Tn ≤ t =
j=0
p−1
[
T ∈ [j2−n , (j + 1)2−n [

=
j=0

T ∈ [0, p2−n [ ∈ Fp2−n ⊂ Ft



=

où on a utilisé T < p2−n = ε>0 T ≤ p2−n − ε ∈ Fp2−n . Puis, par construction, on a
 S 

facilement Tn → T ps et Tn ≥ T , ie. Tn & T . 


3.6. Propriété de Markov forte 47

Définition 3.8 Soit T un temps d’arrêt. La tribu des évènements antérieurs à T est
n o
FT = A ∈ F∞ : ∀t ≥ 0, A ∩ {T ≤ t} ∈ Ft .

Si T = t est déterministe, alors FT = Ft .

Proposition 3.13 Soit T un temps d’arrêt fini ps. Les variables aléatoires T et BT sont
FT -mesurables.

Démonstration : Il s’agit de voir que pour tout s ≥ 0, T −1 (] − ∞, s]) = {T ≤ s} ∈ FT .


Pour cela, soit t ≥ 0, on a

{T ≤ s} ∩ {T ≤ t} = {T ≤ t ∧ s} ∈ Ft∧s ⊂ Ft

en utilisant le fait que T est un temps d’arrêt. Pour BT , il suffit de remarquer que par
continuité presque sûre des trajectoires
+∞
X
BT = lim 1{i2−n <T ≤(i+1)2−n } Bi2−n
n→+∞
i=0

puis que Bs 1{s<T } est FT -mesurable. En effet pour tout u ∈ R, on montre que {Bs 1{s<T } ≤
u} ∈ FT . Pour cela, on établit que, pour tout t ≥ 0, {Bs 1{s<T } ≤ u} ∩ {T ≤ t} ∈ Ft .
— si t < s alors {Bs 1{s<T } ≤ u} ∩ {T ≤ t} = {0 ≤ u} ∩ {T ≤ t} = (∅ ou Ω) ∩ Ft ∈ Ft ;
— si t ≥ s alors {Bs 1{s<T } ≤ u} ∩ {T ≤ t} = ({Bs ≤ u} ∩ {s < T ≤ t}) ∪ ({0 ≤
u} ∩ {T ≤ s}) mais {Bs ≤ u} ∈ Fs et {s < T ≤ t} = {T ≤ s}c ∩ {T ≤ t} ∈ Ft et
{T ≤ s} ∈ Fs .


Cette notion est développée en Section 4.2, en particulier les relations entres les diverses
filtrations FT .

3.6.2 Propriété de Markov


Le résultat suivant généralise la Prop. 3.2 à un changement de temps donné par un
temps d’arrêt.

Théorème 3.2 (Propriété de Markov forte) Soit T un temps d’arrêt. Alors conditionnel-
lement à {T < +∞}, le processus B (T ) défini par
(T )
Bt = BT +t − BT

est un mouvement brownien indépendant de FT .


48 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

Démonstration : On suppose d’abord que T < +∞ ps. On prouve alors la propriété de


Markov en montrant que pour A ∈ FT , 0 ≤ t1 ≤ · · · ≤ tp et F une fonction continue
bornée sur Rp , on a
 (T ) (T )   
E 1A F (Bt1 , . . . , Btp ) = P(A) E F (Bt1 , . . . , Btp ) . (3.5)

En effet, avec A = Ω, on obtient que B (T ) a les mêmes lois fini-dimensionnelles que B


et il est facile de voir que B (T ) a des trajectoires presque sûrement continues. Autrement
dit B (T ) est un mouvement brownien. Puis pour A quelconque, (3.5) assure que pour tout
(T ) (T )
choix 0 ≤ t1 ≤ · · · ≤ tp , le vecteur (Bt1 , . . . , Btp ) est indépendant de FT , d’où par un
argument de classe monotone B (T ) ⊥ ⊥ FT .
Pour montrer (3.5), on écrit, par continuité presque sûre des trajectoires de B :
(T ) (T ) 
F Bt1 , . . . , Btp
+∞
X 
= lim 1{(k−1)2−n <T ≤k2−n } F Bk2−n +t1 − Bk2−n , . . . , Bk2−n +tp − Bk2−n .
n→+∞
k=0

Comme F est bornée, par convergence dominée, il vient :


 (T ) (T ) 
E 1A F (Bt1 , . . . , Btp )
+∞
X  
= lim E 1A 1{(k−1)2−n <T ≤k2−n } F Bk2−n +t1 − Bk2−n , . . . , Bk2−n +tp − Bk2−n .
n→+∞
k=0

Pour A ∈ FT , l’évènement A ∩ {(k − 1)2−n < T ≤ k2−n } = A ∩ {T ≤ k2−n } ∩ {T ≤


(k − 1)2−n }c est F(k2−n ) -mesurable donc par la propriété de Markov simple (Prop. 3.2), on
a
⊥ σ(Br : r ≤ k2−n )

Bk2−n +t1 − Bk2−n , . . . , Bk2−n +tp − Bk2−n ⊥
et donc
 
E 1A 1{(k−1)2−n <T ≤k2−n } F Bk2−n +t1 − Bk2−n , . . . , Bk2−n +tp − Bk2−n
= P A ∩ {(k − 1)2−n < T ≤ k2−n } E F Bk2−n +t1 − Bk2−n , . . . , Bk2−n +tp − Bk2−n
  

= P A ∩ {(k − 1)2−n < T ≤ k2−n } E F (Bt1 , . . . , Btp )


  

puisque par stationnarité des accroissements de B :



Bk2−n +t1 − Bk2−n , . . . , Bk2−n +tp − Bk2−n ∼ (Bt1 , . . . , Btp ).
Finalement, on obtient (3.5) en sommant sur k ∈ N.
Lorsque P(T = +∞) > 0, on obtient de la même façon
 (T ) (T )    
E 1A∩{T <+∞} F Bt1 , . . . , Btp = P A ∩ {T < +∞} E F (Bt1 , . . . , Btp )
et le résultat cherché suit. 
3.6. Propriété de Markov forte 49

3.6.3 Principe de réflexion


Une application importante de la propriété de Markov forte est le principe de réflexion.

Théorème 3.3 (Principe de réflexion) Pour tout t > 0, notons St = sups≤t Bs . Alors si
a ≥ 0 et b ≤ a on a  
P St ≥ a, Bt ≤ b = P Bt ≥ 2a − b . (3.6)
En particulier, pour chaque t ≥ 0,
St ∼ |Bt |. (3.7)

Remarque 3.6 — À chaque trajectoire brownienne dépassant le seuil a et terminant


en deça de b ≤ a, on peut associer la trajectoire brownienne (fictive) obtenue par
symétrie autour de la droite y = a à partir de la date inf(t ≥ 0 : Bt = a). Cette
trajectoire termine alors au délà de 2a − b. Il y a ainsi une 00 bijection00 entre les
trajectoires browniennes vérifiant {St ≥ a, Bt < b} et celles vérifiant {Bt ≥ 2a − b}.
Le principe de réflexion (3.6) est une formalisation de cette 00 bijection00 .
[Dessin typique illustant le principe de réflexion].
L
— Le principe (3.6) implique que pour ∀t ≥ 0, St = |Bt |. Toutefois, attention : l’égalité
tient pour les marginales mais ne s’étend pas aux processus : l’un est croissant,
l’autre pas.

Démonstration : Il s’agit d’appliquer la propriété de Markov forte au temps d’arrêt Ta =


inf t ≥ 0 : Bt = a . On a déjà vu que Ta < +∞ ps. On a aussi
 
(T )
P(St ≥ a, Bt ≤ b) = P(Ta ≤ t, Bt ≤ b) = P Ta ≤ t, Bt−Ta a ≤ b − a

(T )
puisque Bt−Ta a = Bt−Ta +Ta − BTa = Bt − a. Pour simplifier, notons B 0 = B (Ta ) . Le Théo-
rème 3.2 (propriété de Markov forte) assure que B 0 est un mouvement brownien indépen-
dant de FTa , donc de Ta . Comme B 0 a même loi que −B 0 , on a
  Z t Z t
(T ) 0 0
P Ta ≤ t, Bt−Ta a ≤b−a = P(Bt−u ≤ b − a) PTa (du) = P(−Bt−u ≤ b − a) PTa (du)
Z0 t 0
 
0 (T )
= ≥ a − b) PTa (du) = P Ta ≤
P(Bt−u t, Bt−Ta a ≥a−b
0

= P Ta ≤ t, Bt − a ≥ a − b
= P(Bt ≥ 2a − b)

car l’évènement {Bt ≥ 2a − b} est contenu dans {Ta ≤ t} (b ≤ a).


Pour (3.7), on utilise le principe de réflexion et la symétrie (en loi) du mouvement brownien :
 
P(St ≥ a) = P St ≥ a, Bt ≥ a + P St ≥ a, Bt < a
50 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

Comme {Bt ≥ a} ⊂ {St ≥ a}, on a P St ≥ a, Bt ≥ a = P(Bt ≥ a). Puis le principe de
réflexion (3.6) avec a = b donne

P St ≥ a, Bt < a = P(Bt ≥ a) = P(−Bt ≥ a) = P(Bt ≤ −a)

en utilisant la symétrie de B. Finalement,



P(St ≥ a) = P |Bt | ≥ a ,

ce qui prouve (3.7). 

Remarque 3.7 On déduit facilement du principe de réflexion que le temps d’atteinte Ta =


inf t ≥ 0 : Bt = a d’un mouvement brownien du niveau a n’est pas déterministiquement
borné : pour tout C > 0, on a
   
P(Ta ≤ C) = P sup Bt ≥ a = P |BC | ≥ a = 2P(N ≥ a/C 2 ) < 1 (3.8)
t∈[0,C]

où N ∼ N (0, 1).

Soit Z une variable aléatoire réelle. Un processus (Xt , t ≥ 0) est appelé mouvement brow-
nien réel issu de Z si on peut écrire Xt = Z + Bt où B est un mouvement brownien issu
de 0 indépendant de Z.

3.7 Équation de la chaleur


Cette section reprend la présentation de cette équation par [EGK].

3.7.1 Origine physique


L’équation de la chaleur est l’EDP qui décrit la propagation de la chaleur en donnant la
température T (t, x) dans un milieu en fonction du temps t et du lieu x.
Le flux d’énergie thermique J qui traverse une surface unitaire par unité de temps est
donné par la loi de Fourier :
∂T
J = −k
∂x
où k est le coefficient de conductivité thermique du milieu (en mkgs−3 K −1 ). Cette loi
stipule qu’une différence de température engendre un flux d’énergie dans la direction des
températures décroissantes.
Si on calcule le gain d’énergie par unité de temps d’un volume d’épaisseur dx et de section
S, on remarque que cette puissance est égale à la différence entre le flux entrant et le flux
sortant :
∂J
P = J(x)S − J(x + dx)S c’est à dire P = − Sdx.
∂x
3.7. Équation de la chaleur 51

Cette puissance assimilée à cet élément de volume Sdx est supposée élever sa température
T . On pose une relation linéaire simple
∂T
P = cm
∂t
où c est la chaleur spécifique de la matière considérée. Comme m = ρSdx (où ρ est la masse
volumique du milieu), on a alors
∂T ∂J
ρc =−
∂t ∂x
qui est l’équation de continuité d’un flux thermique d’énergie. En la combinant avec la loi
de Fourier, on obtient l’équation de la chaleur
∂T k ∂ 2T
= .
∂t ρc ∂x2
Cette EDP se généralise facilement en dimension supérieure.

3.7.2 Origine mathématique


Les premières propriétés du mouvement brownien mises en évidence par Bachelier et Ein-
stein concernent le lien entre la loi du mouvement brownien issu de x et l’équation de
la chaleur. On note pt (x, ·) la densité de la variable aléatoire qui modélise le phénomène
x + Bt à la date t et qui part de x à la date 0. Par stationnarité du phénomène, pt (x, y)
ne dépend de x, y que par la différence y − x. Puis, ces auteurs déduisent de la propriété
d’accroissements indépendants que la densité pt (x, ·) de la loi de x + Bt (qui n’est pas
supposée gaussienne a priori) vérifie l’équation de convolution
Z
pt (x, y)ph (y, z) dy = pt+h (x, z). (3.9)
R

En effet, on écrit x + Bt+h = x + Bt + Bt+h − Bt et on note que


— Bt = Bt − B0 est indépendant de Bh0 = Bt+h − Bt ,
— si x + Bt = y, la loi de x + Bt + Bt+h − Bt est la même que celle de y + B eh de densité
ph (y, ·),
— on récupère la densité du tout, en intégrant par rapport à la loi de x + Bt de densité
pt (x, ·).
Bachelier conclut en montrant que l’équation (3.9) est vérifiée par les fonctions de la forme
2 2
At e−πAt x pour lesquelles A2t est proportionelle au temps t. Il n’envisage pas a priori d’autre
type de fonctions. Ce résultat montre la grande généralité des situations qui peuvent être
modélisées par un mouvement brownien.
Revenons à la densité gaussienne
1
exp − (y − x)2 /(2t)

g(t, x, y) := g(t, y − x) = √
2πt
52 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

qui traduit que x + Bt+h est la somme des variables gaussiennes indépendantes x + Bt et
Bt+h − Bh . Un calcul direct montre que le noyau gaussien est solution de l’équation de la
chaleur, c’est à dire de l’EDP
 0 00
gt (t, x, y) = 12 gyy (t, x, y)
0 1 00 (3.10)
gt (t, x, y) = 2 gxx (t, x, y).
La densité gaussienne standard satisfait donc l’équation de la chaleur par rapport aux
variables x et y. Cette propriété est étendue à une vaste classe de fonctions construites à
partir du mouvement brownien.
Théorème 3.4 1. Considérons la fonction
Z
u(t, x, f ) = E[f (x + Bt )] = g(t, x, y)f (y) dy
R

où f est une fonction borélienne bornée. La fonction u est C ∞ en espace et en temps
pour t > 0 et vérifie l’équation de la chaleur
1
u0t (t, x, f ) = u00xx (t, x, f ), u(0, x) = f (x). (3.11)
2
2. Lorsque le point de départ du mouvement X0 est aléatoire avec une loi de densité
π(x), indépendante
R du mouvement brownien, la densité de la loi de X0 + Bt est égale
à q(t, y) = R g(t, y − x)π(x)dx et vérifie l’équation de la chaleur
1 00
qt0 (t, y) = qyy (t, y),q(0, y) = π(y).
2
R
Démonstration : 1) La fonction u(t, x, f ) = E[f (x + Bt )] = R g(t, x, y)f (y) dy est très
régulière pour t > 0, car la densité gaussienne (le noyau de la chaleur) est C ∞ , à dérivées
bornées pour t > a. Par dérivation sous le signe intégral, on a aisément :
Z Z
0 0 00 00
ut (t, x, f ) = gt (t, x, y)f (y) dy, uxx (t, x) = gxx (t, x, y)f (y) dy.
R R

L’équation de la chaleur (3.11) pour u(t, ·, f ) suit alors facilement de celle pour g(t, x, y).
2) Supposons que la condition initiale soit aléatoire et indépendante du mouvement brow-
nien et donc de Bt . La loi de X0 + Bt admet une densité qui est la convolée de π(x) et de
g(t, x). 

La formule précédente peut être étendue sous certaines conditions à d’autres fonctions
que les fonctions bornées, par exemple pour les fonctions f (x) = eλx , λ > 0. La fonc-
tion u(t, x, eλ· ) est la transformée de Laplace de x + Bt . Des calculs gaussiens (classiques)
montrent que
1 2
u t, x, eλ· = E eλ(x+Bt ) = eλx+ 2 λ t .
  

Lorsque la fonction considérée est régulière, une autre formulation peut être donnée à cette
relation qui jouera un rôle important dans la suite :
3.7. Équation de la chaleur 53

Proposition 3.14 Si f est une fonction Cb1 en temps et Cb2 en espace (c’est à dire à dériveés
bornées en temps et en espace), on a
1 00 
u0t (t, x, f ) = u t, x, ft0 + fxx
2
soit, en intégrant, sous une forme probabiliste :
Z t
 1 00
(s, x + Bs ) + ft0 (s, x + Bt ) ds.

E[f (t, x + Bt )] = f (0, x) + E fxx (3.12)
0 2
Démonstration : On représente la fonction u(t, x, f ) de la façon suivante
Z Z
u(t, x, f ) = E[f (t, x + Bt )] = g(t, y)f (t, x + y) dy = g(t, x, z)f (t, z) dz
R R

où g(t, y) est la densité de Bt ∼ N (0, t) et g(t, x, z) = g(t, z − x) est la densité de x + Bt ∼


N (x, t). Par convergence dominée, on dérive sous le signe intégral, pour une fonction f
deux fois dérivable, à dérivées bornées.
Z
00 00 00
uxx (t, x, f ) = g(t, y)fxx (t, x + y)dy = u(t, x, fxx )
ZR
00
= gxx (t, x, z)f (t, z)dz (avec deux ipp)
Z R Z
0
ut (t, x, f ) = g(t, x, z)ft (t, z) dz + gt0 (t, x, z)f (t, z) dz
0
R Z R
1 1
= u(t, x, ft0 ) + 00
gxx 00
(t, x, z)f (t, z)dz = u(t, x, ft0 ) + u(t, x, fxx )
2 R 2
en utilisant que g satisfait l’équation de la chaleur. Pour avoir l’équation intégrale (3.12), il
suffit d’intégrer par rapport à t et d’expliciter les fonctions u(t, x, ft0 ) et u(t, x, fxx
00
) comme
des espérances. 

Le mouvement brownien décentré Xtx = x + bt + σBt joue un rôle important dans les appli-
cations. Les équations aux dérivées partielles (EDP) précédentes s’étendent sans difficulté
à partir de l’EDP satisfaite par la densité de Xtx
(y − x − bt)2
 
1
gb,σ2 (t, x, y) = √ exp − 2
= g(σ 2 t, x + bt, y) = g(σ 2 t, x, y − bt).
2
2πσ t 2σ t
Nous introduisons le générateur associé à ce processus, c’est à dire l’opérateur du 2nd
ordre défini par
1
Lb,σ2 φ(x) = σ 2 φ00xx (x) + bφ0x (x).
2
Puisque g(t, x, y) satisfait l’équation de la chaleur, la fonction x 7→ gb,σ2 (t, x, y) vérifie
1 2 00 2
∂t gb,σ2 (t, x, y) = σ gxx (σ t, x + bt, y) + bgx0 (σ 2 t, x + bt, y)
2
54 Chapitre 3. ©JCB – M2 Math. – Université de Rennes 1

= Lb,σ2 gb,σ2 (t, x, y). (3.13)

Dans ce contexte, l’équation (3.13) remplace l’équation de la chaleur (3.10).

Proposition
R 3.15 1. Soit f : R → R. Les fonctions u(t, x, f ) = E[f (x + bt + σBt )] =
g 2 (t, x, y)f (y) dy satisfont l’EDP
R b,σ
 0
ut (t, x, f ) = Lb,σ2 u(t, x, f ) = 21 σ 2 u00xx (t, x, f ) + bu0x (t, x, f )
(3.14)
u(0, x, f ) = f (x).

2. De plus, si f : R+ × R → R est une fonction de classe Cb1 en temps sur R+ \ {0} et


Cb2 en espace, alors
Z t
x
E Lb,σ2 f (s, Xsx ) + ft0 (s, Xsx ) ds.
 
E[f (t, Xt )] = f (0, x) + (3.15)
0

Démonstration : L’équation (3.14) s’obtient en intégrant par rapport à f (y)dy l’EDP sa-
tisfaite par la densité gb,σ2 (t, x, y) considérée comme fonction de x. Puis (3.15) suit avec
des intégrations par parties comme précédemment. 

Remarque 3.8 La représentation de la solution de l’équation de la chaleur comme E[f (x +


Bt )] montre que la trajectoire brownienne joue pour cette équation le même rôle que les
caractéristiques, solutions d’équations différentielles du premier ordre, pour la résolution
des EDP du premier ordre. L’équation (3.14) montre que ce résultat peut être étendu aux
EDP elliptiques à coefficients constants à condition de se référer à un MB décentré.
Un objectif important est de passer de cette formule, vraie en moyenne (en espérance), à
une formule trajectorielle. Cette étape a été amorcée par Paul Lévy dans les années 30 et
complétée par Kiyoshi Itô dans les années 50. Plus précisément, Itô interprète la quantité
Z t
1 00
Tt (f ) = f (t, x + Bt ) − f (0, x) − fxx (s, x + Bs ) + f 0 (s, x + Bs )ds
0 2

qui mesure la différence trajectorielle entre les deux termes de l’équation (3.12) sans prendre
l’espérance E comme une intégrale stochastique. Ce faisant, il introduit un calcul différentiel
stochastique, le calcul d’Itô, vrai sur les trajectoires et non plus seulement en moyenne.
C’est l’objet des chapitres suivants (Chapitre ??).
Deuxième partie

Martingales

55
Chapitre 4

Martingales en temps continu

Dans ce chapitre, on présente les rudiments sur la théorie des martingales en temps
continu. Il s’agit de la généralisation au temps continu des martingales en temps discrètes
étudiées par exemple dans [JCB-martingale]. Ce sont des processus définis sur des espaces
(Ω, F, (Ft )t≥0 , P) filtrés, c’est à dire muni d’une filtration (Ft )t≥0 . On rappelle qu’une fil-
tration sur un espace de probabilité (Ω, F) est une famille (Ft )t≥0 de sous-tribus telles que
pour s ≤ t, on a Fs ⊂ Ft .
On rappelle qu’on associe à chaque Ft les tribus Ft+ et Ft− et la filtration est dite conti-
nue à droite (resp. à gauche) si pour tout t ≥ 0, on a Ft = Ft+ (resp., pour tout t > 0,
Ft = Ft− ). Elle est dite satisfaire les conditions habituelles si elle est continue à droite et
complète (ie. contient tous les négligeables de F).
Dans tout ce chapitre, on considère (Ω, F, (Ft )t≥0 , P) un espace filtré. On commence par
des généralités sur les filtrations en Section 4.1 et sur les temps d’arrêts en Section 4.2
puis on présente la notion de martingale en temps continu en Section 4.3. On généralise
les principaux résultats rencontrés dans le cadre discret (inégalités de Doob, théorèmes de
convergence, théorème d’arrêt, martingales arrêtées) et on régularise les trajectoires des
martingales. On termine avec un mot sur le processus de Poisson en Section 4.4.

4.1 Filtration et processus


Définition 4.1 (Filtration) Une filtration sur un espace de probabilité (Ω, F) est une famille
(Ft )t≥0 de sous-tribus telle que pour s ≤ t, on a Fs ⊂ Ft .

Si on considère un processus (Xt )t≥0 , on considère souvent la filtration canonique qu’il


engendre : FtX = σ(Xs : s ≤ t), t ≥ 0. Dans ce cas, il est utile d’interpréter une filtration
comme une quantité d’information disponible à une date donnée : FtX représente l’infor-
mation véhiculée par le processus X jusqu’à la date t.
Une filtration est P-complète pour une mesure de probabilité P si F0 contient tous les
évènements de mesure nulle, ie. N = {N ⊂ Ω : ∃A ∈ F tel que N ⊂ Ω et P(A) = 0}⊂ F0 .

57
58 Chapitre 4. ©JCB – M2 Math. – Université de Rennes 1

Remarque 4.1 L’intérêt d’une tribu complète vient du fait suivant : soit X = Y ps où Y
est une variable aléatoire G-mesurable, avec G complète. Alors X est G-mesurable.
Preuve : En effet notons N = {X 6= Y }, négligeable, donc dans G. Soit A ∈ B(R), on a :

X −1 (A) = {Y ∈ A} ∩ N c ∪ {X ∈ A} ∩ N .
 

 
On a {X ∈ A}  ∩ N ∈ G car {X ∈ A} ∩ N ⊂ N et G est une tribu complète. Puis
{Y ∈ A} ∩ N c ∈ G car {Y ∈ A} ∈ G et N c ∈ G.

T W
À une filtration, on associe Ft+ = ε>0 Ft+ε et Ft− = ε>0 Ft−ε .
La filtration (Ft )t≥0 est dite continue à droite si pour tout t ≥ 0, on a Ft = Ft+ , continue
à gauche si pour tout t > 0, on a Ft = Ft− .
Dans la suite, on dira qu’une filtration satisfait les conditions habituelles si elle est complète
et continue à droite. C’est le cas de la filtration brownienne (FtB )t≥0 donnée par FtB =
σ(Bs : s ≤ t), cf. Prop. 3.3. Étant donnée une filtration quelconque (Ft )t≥0 , on peut
toujours en considérer une satisfaisant les conditions habituelles en ajoutant à Ft+ la classe
des P-négligeables de F. Il s’agit de l’augmentation habituelle de (Ft )t≥0 .

Définition 4.2 Un processus (Xt )t≥0 est dit mesurable si l’application définie sur (R+ ×
Ω, B(R+ ) ⊗ F) par (t, ω) 7→ Xt (ω) est mesurable.

Cette propriété est plus forte que de demander à Xt d’être Ft -mesurable pour tout t ≥ 0.
Cependant, si les trajectoires de X sont presque sûrement continues, les deux propriétés
deviennent équivalentes.

Définition 4.3 (Adapté) Un processus (Xt )t≥0 est dit adapté si pour tout t ≥ 0, Xt est
Ft -mesurable.
(Progressif ) Un processus (Xt )t≥0 est dit progressif (ou progressivement mesurable) si pour
tout t ≥ 0, (s, ω) 7→ Xs (ω) est mesurable sur [0, t] × Ω muni de B([0, t]) ⊗ Ft .
(Tribu progressive) La famille des A ∈ B(R+ ) ⊗ F telle que le processus Xt (ω) = 1A (t, ω)
est progressif est appelée la tribu progressive. On la note Prog.

Remarque 4.2 — Un processus X est adapté par rapport à sa filtration naturelle F X .


— Un processus progressif est adapté et mesurable.
Il est adapté car Xt = X ◦ it où it : ω ∈ (Ω, Ft ) 7→ (t, ω) ∈ ([0, t] × Ω, B([0, t]) ⊗ Ft )
est mesurable.
Il est mesurable car un processus est mesurable si et seulement si pour tout t ≥ 0,
(s, ω) 7→ Xs (ω) est mesurable sur [0, t] × Ω muni de B([0, t]) ⊗ F.
— Un processus mesurable et adapté admet une version progressive (Chung et Doob,
cf. [DM]).
4.1. Filtration et processus 59

Exemple 4.1 — Soit 0 < t1 < · · · < tn et h1 , . . . , hn des variables aléatoires


Pntelles que hi
est Fti -mesurable.
Pn On pose t0 = 0 et tn+1 = +∞. Les processus X = i=0 hi 1[ti ,ti+1 [
et Y = i=0 hi 1]ti ,ti+1 ] sont progressifs.
En effet, montrons le pour X : soit B ∈ B(R), on a

n
[
  
(s, ω) ∈ [0, t] × Ω : Xs (ω) ∈ B = [ti , ti+1 [∩[0, t] × ω ∈ Ω : hi (ω) ∈ B
i=0
∈ B([0, t]) ⊗ Ft .

— Si la filtration est complète, un processus adapté à trajectoires continues à gauche


est progressif.
(n)
En effet, on approche le processus X par Xt = Xk2−n pour t ∈ [k2−n , (k +1)2−n [ et
k ∈ {0, . . . , 2n − 1}. Le processus X (n) est progressif (exemple précédent) et comme
(n)
X est continu à gauche, Xt −→ Xt pour tout t ≥ 0. Cela garantit que le processus
X est progressif (la mesurabilité se conserve à la limite).

Proposition 4.1 Soit X un processus adapté et à trajectoires continues à droite. Alors X


est progressif.

(n)
Démonstration : On considère X (n) donné par Xt = X(k+1)2−n pour t ∈ [k2−n , (k+1)2−n [.
D’après l’exemple ci-dessus, le processus X (n) est progressif avec la filtration (Ft+2−n )t≥0
(n)
et comme X est continu à droite, pour tout t ≥ 0, Xt → Xt .
(n) (n)
Fixons t ≥ 0 et considérons X es = Xs 1{s<t−2−n } + Xt 1{s=t} . Ce processus est mesurable
(n)
par rapport à B([0, t]) ⊗ Ft . En effet, Xs 1s<t−2−n est B([0, t]) ⊗ Ft -mesurable d’après ce
qui précède. Puis, si on note Ys = Xt 1{s=t} , alors

Y −1 (A) = {(s, ω) ∈ [0, t] × Ω : Xt (ω)1{s=t} ∈ A}.

Si s = t alors il faut ω ∈ Xt−1 (A) et si s 6= t, il faut 0 ∈ A, ie. on a ∅ ou Ω. On a donc


   
Y −1 (A) = [0, t) × (Ω ou ∅) ∪ {t} × Xt−1 (A) ∈ B([0, t]) ⊗ Ft .

Par ailleurs, quand n → +∞, X es(n) −→ Xs pour s ≤ t. La restriction de X à [0, t] est donc
mesurable par rapport à B([0, t]) ⊗ Ft , ie. le processus X est progressif. 

Un processus est progressif s’il est mesurable par rapport à la tribu progressive Prog.
L’intérêt d’un processus progressif vient de ce que, estimé en un temps d’arrêt, il est
mesurable pour la tribu associé au temps d’arrêt, cf. Proposition 4.4. Avant de voir cela,
on revient sur les principales propriétés des temps d’arrêt.
60 Chapitre 4. ©JCB – M2 Math. – Université de Rennes 1

4.2 Filtrations et temps d’arrêt


Dans cette section, on rappelle et développe la notion de temps d’arrêt du cadre discret
(T = N) au cadre continue (T = R+ )

Définition 4.4 (Temps d’arrêt) Une variable aléatoire T à valeurs dans [0, +∞] est un
temps d’arrêt si pour tout t ≥ 0 on a {T ≤ t} ∈ Ft .

On associe à un temps d’arrêt T les tribus suivantes



FT = A ∈ F∞ : ∀t ≥ 0, A ∩ {T ≤ t} ∈ Ft

FT + = A ∈ F∞ : ∀t ≥ 0, A ∩ {T < t} ∈ Ft

FT − = σ A ∩ {T > t} : t ≥ 0, A ∈ Ft .

Les propriétés suivantes sont satisfaites :

Proposition 4.2 1. On a toujours FT − ⊂ FT ⊂ FT + . Si la filtration est continue à


droite FT = FT + .
2. Une variable aléatoire T : Ω → R+ est un (Ft+ )t temps d’arrêt si et seulement si
pour tout t ≥ 0, {T < t} ∈ Ft . Cela équivaut encore à dire que T ∧ t est Ft -mesurable
pour tout t ≥ 0.
3. Si T = t alors FT = Ft , FT + = Ft+ et FT − = Ft− .
4. Pour A ∈ F∞ , posons T A (ω) = T (ω) si ω ∈ A, +∞ sinon. Alors A ∈ FT si et
seulement si T A est un temps d’arrêt.
5. Le temps d’arrêt T est FT -mesurable.
6. Si S ≤ T sont deux temps d’arrêt alors FS ⊂ FT . Pour S, T des temps d’arrêt,
S ∧ T et S ∨ T sont des temps d’arrêt et FS∧T = FS ∩ FT . De plus {S ≤ T } ∈ FS∧T ,
{S = T } ∈ FS∧T .
7. Si Sn est une suite croissante
W de temps d’arrêt alors S = limn→+∞ Sn est aussi un
temps d’arrêt et FS − = ng eq1 FSn− .
8. Si Sn est une suite décroissante de temps
T d’arrêt alors S = limn→+∞ Sn est aussi un
temps d’arrêt de (Ft+ )t≥0 et FS + = n≥1 FSn+ .
9. Si Sn est une suite décroissante stationnaire de temps d’arrêt (ie. ∀ω, ∃N (ω), ∀n ≥
N (ω),TSn (ω) = S(ω)) alors S = limn Sn est aussi un temps d’arrêt pour (Ft )t≥0 et
FS = n FSn (comparer avec 8)).

Démonstration :
1) Soit A ∩ {T > t} ∈ FT − avec A ∈ Ft . Alors A ∩ {T > t} ∈ F∞ et pour s ≥ 0

(A ∩ {T > t}) ∩ {T ≤ s} = A ∩ ({t < T ≤ s}) ∈ Ft


4.2. Filtrations et temps d’arrêt 61

car si s ≤ t alors {t < T ≤ s} = ∅ tandis que si s > t alors {t < T ≤ s} = {T ≤ t}c ∩ {T ≤


s} ∈ Fs et A ∈ Ft ⊂ Fs . Ainsi A ∩ {T > t} ∈ FT . Soit maintenant A ∈ FT alors
[ _
A ∩ {T < t} = (A ∩ {T ≤ t − 1/n}) ∈ Ft−1/n ⊂ Ft
n n

Puis si la filtration est continue à droite et A ∈ FT + alors


\ \
A ∩ {T ≤ t} = A ∩ {T < t + 1/n} ∈ Ft+1/n = Ft+ = Ft .
n n

2) Soit T est un (Ft+ )t -temps d’arrêt alors


[ _
{T < t} = {T ≤ t − 1/n} ∈ F(t−1/n)+ ⊂ Ft
n n

car pour chaque on a n : F(t−1/n)+ ⊂ Ft . Réciproquement, si {T < t} ∈ Ft alors


\ \
{T ≤ t} = {T < t + 1/n} ∈ Ft+1/n = Ft+ .
n n

Puis si T ∧t est Ft -mesurable alors pour tout s, {T ∧t ≤ s} = {T ≤ s}∪{t ≤ s} ∈ Ft . Mais


pour s < t, cela garantit donc {T ≤ s} ∈ Ft pour tout s < t, ie. {T ≤ s} ∈ Fs+ , c’est à
dire T est un temps d’arrêt pour (Ft+ )t≥0 . Réciproquement, si T est un temps d’arrêt pour
(Ft+ )t≥0 , alors pour tout s ≥ 0, on a {T ∧t ≤ s} = {T ≤ s}∪{t ≤ s} = {T ≤ s} ∈ Fs+ ⊂ Ft
si s < t et = Ω ∈ Ft+ si t ≤ s et donc T ∧ t est Ft -mesurable.
3) Soit T = t alors A ∈ FT si et seulement si pour tout s ≥ 0 on a A ∩ {t ≤ s} ∈ Fs . Pour
s < t on a bien ∅ ∈ Fs et pour t ≤ s, il faut A ∈ Fs . En particulier, il faut A ∈ Ft . La
réciproque est claire.
Si A ∈ FT + si et seulement si pour tout s ≥ 0 on a A ∩ {t < s} ∈ Fs . Pour s ≤ t on a
bien ∅ ∈ Fs et pour t < s, il faut A ∈ Fs . En particulier, il faut A ∈ ∩s>t Fs = Ft+ . Pour
la réciproque, observer que quand t < s, on a A ∩ {t < s} = A ∈ Ft+ ⊂ Fs .
La tribu FT − est constituée des A ∩ {T > s} pour A ∈ Fs . Comme T = t : si s ≥ t, cet
ensemble est vide ; si s < t, cet ensemble est A ∈ Fs . On a donc FT − = σ(∪s<t Fs ) = Ft− .
4) A ∈ FT si et seulement si pour tout t ≥ 0 : A ∩ {T ≤ t} ∈ Ft . Mais A ∩ {T ≤ t} =
{T A ≤ t} ce qui permet de conclure.
5) On a {T ≤ s} ∈ FT pour tout s car

{T ≤ s} ∩ {T ≤ t} = {T ≤ t ∧ s} ∈ Ft∧s ⊂ Ft .

6) Si S ≤ T et A ∈ FS alors

A ∩ {T ≤ t} = (A ∩ {S ≤ t}) ∩ {T ≤ t} ∈ Ft .
62 Chapitre 4. ©JCB – M2 Math. – Université de Rennes 1

D’où A ∈ FT . Pour S, T quelconques, on a

{S ∧ T ≤ t} = {S ≤ t} ∪ {T ≤ t} ∈ Ft
{S ∨ T ≤ t} = {S ≤ t} ∩ {T ≤ t} ∈ Ft .

Comme S ∧ T ≤ T, S, on a facilement FS∧T ⊂ FS ∩ FT . De plus, si A ∈ FS ∩ FT , alors

A ∩ {S ∧ T ≤ t} = (A ∩ {S ≤ t} ∪ (A ∩ {T ≤ t}) ∈ Ft ,

d’où A ∈ FS∧T . Puis pour t ≥ 0, on a

{S ≤ T } ∩ {T ≤ t} = ({S ≤ t} ∩ {T ≤ t}) ∩ {S ∧ t ≤ T ∧ t} ∈ Ft
{S ≤ T } ∩ {S ≤ t} = {S ∧ t ≤ T ∧ t} ∩ {S ≤ t} ∈ Ft

car S ∧ t et T ∧ t sont Ft -mesurables d’après 5) et 6) déjà vus (S ∧ t ≤ t donc S ∧ t qui est


FS -mesurable est aussi Ft -mesurable) donc {S ∧ t ≤ T ∧ t} ∈ Ft . Finalement, cela garantit
{S ≤ T } ∈ FS ∩ FT = FS∧T . L’argument est analogue pour {S = T }.
T
7) On a {S ≤ t} = n≥1 {Sn ≤ t} ∈ Ft . De plus, on a FSn− ⊂WFS − (car pour A ∈ FSn− ,
on a A ∩ {Sn > t} = (A ∩ {Sn > t}) ∩ {S > t} ∈ FS − ). Donc n FSn− ⊂ FS − . Puis pour
A ∈ FS − , on a [
A ∩ {S > t} = (A ∩ {Sn > t}),
n
W W
ce qui montre que A ∩ {S > t} ∈ n FSn− et FS − ⊂ n FSn− .
S
8) On a {S < t} = n {Sn < t} ∈ Ft ⊂ Ft+ . Comme Ft+ )t≥0 est continue à droite, S est
bien un (Ft+ -temps d’arrêt. De plus, on voit aisément que FS + ⊂ FSn+ pour tout n car
pour A ∈ FS +

A ∩ {Sn < t} = A ∩ ({Sn < t} ∩ {S < t}) = (A ∩ ({S < t}) ∩ {Sn < t} ∈ Ft .
T
Réciproquement si A ∈ n≥1 FSn+ alors
[
A ∩ {S < t} = (A ∩ {Sn < t}) ∈ Ft ,
n
T
d’où A ∈ FS + et FS + = n FSn+ .
S T
on a en plus {S ≤ t} = n≥1 {Sn ≤ t} ∈ Ft et pour A ∈ n≥1 FSn ,
9) Dans ce cas, S
A ∩ {S ≤ t} = n≥1 (A ∩ {Sn ≤ t}) ∈ Ft . D’où A ∈ FS . Puis si A ∈ FS alors comme
S tout n ≥ N et on a A ∈ ∩n≥N FSn . mais comme FSn ⊂ FSp pour n ≥ p, on a
T = Sn pour T
n≥N FSn = n≥0 FSn . 

Proposition 4.3 Soient T un temps d’arrêt et S une variable aléatoire FT -mesurable telle
que S ≥ T . Alors S est aussi un temps d’arrêt.
4.2. Filtrations et temps d’arrêt 63

En particulier, si T est un temps d’arrêt, Tn = ([2n T ] + 1)2−n , ie.


+∞
X k+1
Tn = 1{k2−n <T ≤(k+1)2−n } + (+∞)1{T =+∞} (4.1)
k=0
2n

est une suite de temps d’arrêt qui décroı̂t vers T .


Démonstration : On écrit {S ≤ t} = {S ≤ t} ∩ {T ≤ t} ∈ Ft car {S ≤ t} ∈ FT (S
est FT -mesurable). La deuxième partie en découle facilement puisque Tn ≥ T et Tn est
FT -mesurable. En effet, Tn est FT -mesurable si pour tout u ≥ 0, on a {Tn ≤ u} ∈ FT .
Pour cela, il faut voir que pour tout t ≥ 0, on a {Tn ≤ u} ∩ {T ≤ t} ∈ Ft . Mais
 [2n[u]−1 
[2n u]
 
k+1
{Tn ≤ u} = Tn ≤ n = Tn =
2 k=0
2n
[2n u]−1 
[2n u]
   
[ k k+1
= T ∈ n, n = T ≤ n .
k=0
2 2 2

On a
[2n u]
 
{Tn ≤ u} ∩ {T ≤ t} = T ≤t∧ n ∈ Ft∧[2n u]/2n ⊂ Ft .
2


Le résultat suivant sera utile :


Proposition 4.4 Soit X progressif et T un temps d’arrêt. Alors XT 1{T <+∞} est FT -mesurable.

Démonstration : On utilise le lemme suivant


Lemme 4.1 Une variable aléatoire Y : Ω → R est FT -mesurable si et seulement si, pour
tout t ≥ 0, Y 1{T ≤t} est Ft -mesurable.
Démonstration :[Lemme 4.1] En effet si la condition est vérifiée alors pour A ∈ B(R), on
a {Y ∈ A} ∩ {T ≤ t} = {Y 1{T ≤t} ∈ A} ∩ {T ≤ t} ∈ Ft donc {Y ∈ A} ∈ FT . Puis si Y est
FT -mesurable, alors {Y 1{T ≤t} ∈ A} = ({Y ∈ A} ∩ {T ≤ t}) ∪ ({0 ∈ A} ∩ {T > t}) ∈ Ft . 

On vérifie alors la FT -mesurabilité de Y = XT 1{T <+∞} en montrant que pour tout t ≥ 0


Y 1{T ≤t} = XT 1{T ≤t} = XT ∧t 1{T ≤t}
est Ft -mesurable. Mais XT ∧t est la composition des deux applications mesurables
   
Ω, Ft ) → ([0, t] × Ω, B([0, t]) ⊗ F t [0, t] × Ω, B([0, t]) ⊗ F t → B(R)
 et
ω 7→ T (ω) ∧ t, ω (s, ω) 7→ Xs (ω)
(respectivement car T est un temps d’arrêt et X est progressif). On conclut que XT ∧t donc
aussi XT ∧t 1{T ≤t} est Ft -mesurable. 
64 Chapitre 4. ©JCB – M2 Math. – Université de Rennes 1

Remarque 4.3 Il est nécessaire de considérer XT 1{T <+∞} plutôt que XT tant que X∞ n’est
pas défini. Par contre si X∞ est défini et est F∞ -mesurable alors XT est FT -mesurable.
En effet, comme XT = XT 1{T <+∞} + XT 1{T =+∞} avec XT 1{T <+∞} FT -mesurable par la
Prop. 4.4, il reste à voir que XT 1{T =+∞} est aussi FT -mesurable, ie. pour tout A ∈ B(R) :
 
{XT 1{T =+∞} ∈ A} = {X∞ ∈ A} ∩ {T = +∞} ∪ {0 ∈ A} ∩ {T < +∞} ∈ FT .

Pour cela, on a {XT 1{T =+∞} ∈ A} ∩ {T ≤ t} = {0 ∈ A} ∩ {T ≤ t} ∈ Ft quand t < +∞


tandis que pour t = +∞,
 
{XT 1{T =+∞} ∈ A}∩{T ≤ +∞} = {X∞ ∈ A}∩{T = +∞} ∪ {0 ∈ A}∩{T < +∞} ∈ F∞ .

4.3 Martingales en temps continu


4.3.1 Définition, exemples
Définition 4.5 (Martingale) Un processus (Xt )t≥0 adapté par rapport une filtration (Ft )t≥0
et tel que pour tout t ≥ 0, Xt ∈ L1 est appelé
— une martingale si pour s ≤ t : E[Xt |Fs ] = Xs ;
— une sur-martingale si pour s ≤ t : E[Xt |Fs ] ≤ Xs ;
— une sous-martingale si pour s ≤ t : E[Xt |Fs ] ≥ Xs .

Une martingale est, en moyenne, constante, tandis qu’une sur-martingale est, en moyenne,
décroissante et une sous-martingale, en moyenne, croissante. Ainsi, on peut considérer
qu’une sur-martingale est une généralisation aléatoire d’une fonction décroissante tandis
qu’une sous-martingale est une généralisation d’une fonction croissante. Dans la suite, on
considère souvent des martingales à trajectoires continues à droite, d’après la Prop. 4.1
elles seront progressivement mesurables.

Proposition 4.5 Soit (Xt )t≥0 une martingale (resp. une sous-martingale) et soit ϕ : R → R
une fonction convexe (resp. convexe croissante). On suppose que ϕ(Xt ) ∈ L1 pour tout
t ≥ 0. Alors (ϕ(Xt ))t≥0 est une sous-martingale.

Démonstration : En effet, d’après l’inégalité de Jensen (pour l’espérance conditionnelle),


on a, pour s < t,
E[ϕ(Xt )|Fs ] ≥ ϕ(E[Xt |Fs ]) ≥ ϕ(Xs ).


En appliquant cette remarque à la fonction convexe croissante x 7→ x+ , on montre que si


(Xt )t≥0 est une sous-martingale alors (Xt+ )t≥0 aussi. En particulier, on a pour s ∈ [0, t] :
E[Xs+ ] ≤ E[Xt+ ]. D’autre part, puisque X est une sous-martingale, on a pour s ∈ [0, t],
4.3. Martingales en temps continu 65

E[Xs ] ≥ E[X0 ]. En combinant ces deux inégalités et en utilisant |x| = 2x+ − x, on trouve
la borne
sup E[|Xs |] ≤ 2E[Xt+ ] − E[X0 ].
s∈[0,t]

On peut alors énoncer un résultat utile :

Proposition 4.6 Si (Xt )t≥0 est une sous-martingale (ou en fait sur-martingale,
  ou martin-
gale en changeant X en −X), on a pour tout t ≥ 0 : sups∈[0,t] E |Xs | < +∞.

4.3.2 Inégalités pour martingales en temps continu


Dans cette section, on généralise au cadre continu plusieurs inégalités déjà connues dans
le cadre discret (T = N) quand les (sur/sous)-martingales sont à trajectoires continues à
droite (T = R+ ). Pour cela, l’idée est de considérer un ensemble dénombrable dense D
qu’on voit comme limite de parties finies croissantes {t1 , . . . , tn }. On applique les résultats
discrets aux restrictions à {t1 , . . . , tn }. En passant à la limite (convergence monotone avec
{t1 , . . . , tn } % D), le résultat s’obtient pour les restrictions à D. Comme D est dense dans
R+ , la continuité (à droite) permet de lever la restriction t ∈ D et d’obtenir le résultat
pour tout t ∈ R+ .
Systématiquement, on commence par rappeler les résultats principaux pour des martingales
discrètes pour lesquels on renvoie à [JCB-martingale].
Inégalité maximale. Soit (Yn )n∈N une sur-martingale discrète. Alors pour tout x > 0 et
n ≥ 0, on a
  E[|Y |] + 2E[|Y |]
0 n
P sup |Yk | ≥ x ≤ .
k≤n x
Si on considère maintenant une sur-martingale (Xt )t≥0 en temps continu, on peut appliquer
cette inégalité à la sur-martingale en temps discret Yk = Xtk∧n , k ≥ 0, pour toute partie
finie {0 = t0 < t1 < t2 < · · · < tn = t} de [0, t]. Elle donne
  E[|X0 |] + 2E[|Xt |]
P sup |Xtk | ≥ x ≤ .
k≤n x

Si D est un sous-ensemble dénombrable de R+ (contenant t), en écrivant D comme une


limite croissante de parties finies {0 ≤ t1 < t2 · · · < tn = t}, on obtient avec la monotonie
séquentielle des probabilités :
  E[|X |] + 2E[|X |]
0 t
P sup |Xs | ≥ x ≤ . (4.2)
s∈[0,t]∩D x

Si on suppose en plus que les trajectoires de X sont continues à droite alors en prenant D
dense contenant t, on a sups∈[0,t]∩D |Xs | = sups∈[0,t] |Xs | ce qui montre qu’on peut prendre
sups∈[0,t] dans (4.2) et on a alors montré :
66 Chapitre 4. ©JCB – M2 Math. – Université de Rennes 1

Proposition 4.7 (Inégalité maximale de Doob) Soit (Xt )t≥0 une sur-martingale dont les
trajectoires sont continues à droite. Alors
  E[|X |] + 2E[|X |]  3 sup E[|X |] 
0 t s≤t s
P sup |Xs | ≥ x ≤ ≤ . (4.3)
s∈[0,t] x x

L’inégalité de Doob affirme que si (Yn )n∈N est une martingale en temps discret telle que
Yn ∈ Lp pour p > 1 alors pour tout n ≥ 0 on a, pour q conjugué de p (ie. p1 + 1q = 1) :

sup |Yk | ≤ qkYn kp .

k≤n p

On en déduit comme précédemment, avec le théorème de convergence monotone, que si


(Xt )t≥0 est une martingale en temps continu bornée dans Lp

sup |Xs | ≤ qkXt kp . (4.4)

s∈[0,t]∩D p

À nouveau, si X a des trajectoires continues à droite, on peut remplacer sups∈[0,t]∩D par


sups∈[0,t] dans (4.4) et obtenir :
Proposition 4.8 (Inégalité de Doob) Soit (Xt )t≥0 une martingale dont les trajectoires sont
continues à droite avec Xt ∈ Lp pour tout t ≥ 0 alors, avec p1 + 1q = 1,

sup |Xs | ≤ qkXt kp . (4.5)

s∈[0,t] p

Si f est une fonction définie sur une partie T de R+ et si a < b, le nombre de montées de
f
f le long de [a, b], noté Ma,b (T ), est le supremum des entiers k tels que l’on puisse trouver
une suite croissante de T , s1 < t1 < s2 < t2 · · · < sk < tk , avec f (si ) < a, f (ti ) > b.
[Dessin typique des montées]
Pour une sur-martingale discrète (Yn )n≥0 , on a :
1
E (Yn − a)− .
 Y   
E Ma,b ([0, n]) ≤ (4.6)
b−a
On en déduit comme précédemment le résultat suivant dans le cadre continu :
Proposition 4.9 (Nombre de montées) Soit (Xt )t≥0 une sur-martingale. Si D est un sous-
ensemble dénombrable de R+ , on a :
1
E (Xt − a)− .
 X   
E Ma,b ([0, t] ∩ D) ≤ (4.7)
b−a
Démonstration : Considérer d’abord D fini puis passer à la limite par convergence mono-
tone. Attention pour ce résultat, on ne peut pas prolonger la borne par continuité puisque
X
Ma,b ([0, t]) est à valeurs entières et donc non continue. 
4.3. Martingales en temps continu 67

4.3.3 Régularisation de trajectoires


Avant de donner des théorèmes de convergence pour les martingales en temps continu dans
la Section 4.3.4, on rappelle les résultats du cadre en temps discret (voir [JCB-martingale]).
Ils permettent d’abord de donner dans cette section des conditions de régularisation des
martingales (existence de versions à trajectoires continues ou càdlàg).

Proposition 4.10 (Convergence des martingales discrètes)


1. Si (Yn )n∈N est une sur-martingale bornée dans L1 (en particulier si elle est positive)
alors Yn → Y∞ ps et Y∞ ∈ L1 .
2. Si (Yn )n∈−N est une sur-martingale rétrograde (ie. indéxée par −N : Fn ⊂ Fn+1 et
Yn ≥ E[Yn+1 |Fn ] pour n ≤ 0) et telle que supn≤0 E[|Yn |] < +∞ alors la suite (Yn )n≤0
est uniformément intégrable et converge ps et dans L1 quandTn → −∞ vers une
variable Z telle que Z ≥ E[Yn |F−∞ ] (où par définition F−∞ = n≤0 Fn ).

En appliquant ces résultats en temps discret à des (sur)martingales en temps continu, on a :


Théorème 4.1 (Limites à droite et à gauche) Soit (Xt )t≥0 une sur-martingale et D un sous-
ensemble dénombrable dense dans R+ .
1. Pour presque tout ω ∈ Ω, l’application s ∈ D 7→ Xs (ω) ∈ R admet en tout t ∈ R+
une limite à droite Xt+ (ω) finie et en tout point t ∈ R∗+ , une limite à gauche Xt− (ω).
2. De plus, pour tout t ∈ R+ , on a Xt+ ∈ L1 et Xt ≥ E[Xt+ |Ft ] avec égalité si la fonction
t 7→ E[Xt ] est continue à droite (par exemple, si (Xt )t≥0 est une martingale).
3. De plus, le processus (Xt+ )t≥0 est alors une sur-martingale par rapport à la filtration
(Ft+ )t≥0 et une martingale si X en est une.
Démonstration : 1) C’est une conséquence de l’inégalité sur le nombre de montées et de
celle de Doob. En effet, pour T > 0 fixé, on a d’abord, sups∈[0,T ]∩D |Xs | < +∞ ps car
l’inégalité maximale de Doob assure
 
lim P sup |Xs | ≥ x = 0.
x→+∞ s∈[0,T ]∩D

Ensuite, l’inégalité sur le nombre de montées montre que pour tous a < b rationnels, on a
X X
ps Ma,b ([0, T ]∩D) < +∞. On a donc aussi ps pour tous a < b rationnels, Ma,b ([0, T ]∩D) <
+∞. Finalement, s 7→ Xs (ω) est bornée sur [0, T ] ∩ D et pour tous a < b rationnels, ne
fait qu’un nombre fini de montées le long de [a, b]. La partie 1) s’en déduit puisque si, par
exemple une fonction f : [0, T ] ∩ D → R n’a pas de limite à gauche finie en t ∈]0, T ], on
peut choisir a < b rationnels de sorte que

lim inf f (s) < a < b < lim sup f (s).


s∈D→t s∈D→t

2) Pour que Xt+ (ω) soit défini pour tout ω et pas seulement sur l’ensemble de probabilité
1 où la limite existe, on prend Xt+ (ω) = 0 sur l’ensemble Ft+ -mesurable et de probabilité
68 Chapitre 4. ©JCB – M2 Math. – Université de Rennes 1

nulle où la limite en t le long de D n’existe pas. De cette façon, Xt+ (ω) est bien défini pour
tout ω et reste (Ft+ )t≥0 -mesurable (car la filtration est complète).
On fixe t ≥ 0 et on choisit une suite tn ∈ D qui décroit vers t. Par construction, on a
Xt+ = limn→+∞ Xtn ps. En posant Yk = Xt−k pour k ≤ 0, comme la suite (tn )n≥0 décroit,
on a
E[Yk+1 |Gk ] = E[Xt−k+1 |Ft−k ] ≤ Xt−k = Yk .
La suite (Yk )k∈−N est donc une sur-martingale indéxée par −N par rapport à la filtration
Gk = Ft−k , k ≤ 0. Comme on a

sup E[|Yk |] ≤ sup E[|Xs |] < +∞,


k≤0 s∈[0,t1 ]∩D

le résultat discret (cf. 2) de la Prop. 4.10) assure que la suite Xtn converge dans L1 néces-
sairement vers Xt+ . En particulier, Xt+ ∈ L1 .
Grâce à la convergence L1 , on peut passer à la limite dans l’inégalité Xt ≥ E[Xtn |Ft ] pour
obtenir Xt ≥ E[Xt+ |Ft ].
Toujours grâce à la convergence dans L1 , on a E[Xt+ ] = limn→+∞ E[Xtn ] et donc si la fonc-
tion s 7→ E[Xs ] est continue à droite, on doit avoir E[Xt+ ] = E[Xt ]. L’inégalité précédente
n’est alors possible que si Xt = E[Xt+ |Ft ].
3) Ensuite, on remarque d’abord que Xt+ est Ft+ -mesurable : en effet, Xt+ = lims&t Xs et
Xs est Fu -mesurable pour tout uT≥ s mais alors on en déduit la Fu -mesurabilité de Xt+
pour tout u > t et donc aussi sa u>t Fu = Ft+ -mesurabilité.
Soit maintenant s < t et (sn )n≥0 une suite de D qui décroit vers s. On peut supposer
sn ≤ tn . Alors Xsn converge vers Xs+ dans L1 , et donc, si A ∈ Fs+ ,
 
E[Xs+ 1A ] = lim E[Xsn 1A ] ≥ lim E[Xtn 1A ] = E[Xt+ 1A ] = E E[Xt+ |Fs+ ]1A
n→+∞ n→+∞

 
ce qui entraı̂ne Xs+ ≥ E Xt+ |Fs+ . Enfin, si X est une martingale, on peut remplacer dans
le calcul précédent l’inégalité ≥ par une égalité =. 

Théorème 4.2 (Régularisation) On suppose que la filtration (Ft )t≥0 satisfait les conditions
habituelles. Si X = (Xt )t≥0 est une sur-martingale et si la fonction t 7→ E[Xt ] est continue
à droite alors X admet une modification qui est aussi une (Ft )-sur-martingale et dont les
trajectoires sont continues à droite avec des limites à gauche en tout point (càdlàg).

Démonstration : On fixe D un ensemble dénombrable dense dans R+ . Soit, d’après le


Théorème 4.1, N l’ensemble négligeable tel que si ω 6∈ N , l’application s 7→ Xs (ω) admet
des limites le long de D à droite en tout t ≥ 0 et à gauche en tout t > 0. On pose

Xt+ (ω) si ω 6∈ N
Yt =
0 si ω ∈ N.
4.3. Martingales en temps continu 69

Les trajectoires de Y sont continues à droite : en effet si ω ∈


6 N alors pour t ≥ 0 et ε > 0,
on a
Yt+ = lim Yt+h = lim X(t+h)+ = lim lim Xt+h+δ = lim Xt+h = Xt+ = Yt
h&0 h&0 h&0 δ&0 h&0

et
Yt− = lim Yt−h = lim X(t−h)+ = lim lim Xt−h+δ = lim Xt−u existe
h&0 h&0 h&0 δ&0 u&0

car la limite itérée limh&0 limδ&0 revient à prendre limu&0 avec u = h − δ & 0 car δ → 0
avant h. Ou alors

sup Ys (ω) ≤ sup Xs (ω)


s∈[t,t+ε[ s∈]t,t+ε[∩D

inf Ys (ω) ≥ inf Xs (ω)


s∈[t,t+ε[ s∈]t,t+ε[∩D

et avec des limites à gauche


!  
lim sup Xs (ω) = lim inf Xs (ω) = Xt+ (ω) = Yt (ω).
ε→0 s∈]t,t+ε[∩D ε→0 s∈]t,t+ε[∩D

De la même façon, on montre que les trajectoires de Y ont des limites à gauche.
Enfin, comme Ft+ = Ft (conditions habituelles vérifiées par la filtration (Ft )t≥0 ), on a
d’après le 2) du théorème précédent
   
Xt = E Xt+ |Ft = E Xt+ |Ft+ = Xt+ = Yt ps

puisque Xt+ est Ft+ -mesurable. On voit ainsi que Y est une modification de X. Puisque la
filtration (Ft )t≥0 est complète, il est clair que Yt est Ft -mesurable et il est immédiat aussi
que Y est une (Ft )-sur-martingale (cf. 3) dans le Th. 4.1). 

4.3.4 Théorèmes de convergence


Dans cette section, la notion d’uniforme intégrabilité est importante. On renvoie à un cours
de probabilités de base pour la définition de cette notion, cf. par exemple [JCB-proba].

Théorème 4.3 (Convergence ps) Soit X = (Xt )t≥0 une sur-martingale continue à droite
et bornée dans L1 . Alors il existe une variable aléatoire X∞− ∈ L1 telle que

lim Xt = X∞− ps.


t→+∞

Remarque 4.4 — Un énoncé adapté donne la convergence des sous-martingales conti-


nues à droite.
70 Chapitre 4. ©JCB – M2 Math. – Université de Rennes 1

— Une sur-martingale (Xt )t≥0 est bornée dans L1 si et seulement si supt≥0 E[Xt− ] <
+∞. En effet, comme E[Xt ] ≤ E[X0 ], on a E[Xt+ ] ≤ E[Xt− ] + E[X0 ]. Il vient

E[Xt− ] ≤ E[|Xt |] = E[Xt+ ] + E[Xt− ] ≤ 2E[Xt− ] + E[X0 ]

et donc
sup E[|Xt |] ≤ E[X0 ] + 2 sup E[Xt− ].
t≥0 t≥0

L’autre sens est évident puisque Xt− ≤ |Xt |.


— En particulier, une sur-martingale positive est bornée dans L1 et d’après le Théorème
4.3 ci-dessus elle converge ps.

Démonstration : Soit D un sous-ensemble dénombrable dense de R+ . On déduit de la


Proposition 4.9 (inégalité du nombre de montées) que pour tous a < b, on a

supt≥0 E (Xt − a)−


 
 X   X  E[(Xt − a)− ]
E Ma,b (D) = lim E Ma,b ([0, t]∩D) ≤ lim ≤ < +∞.
t→+∞ t→+∞ b−a b−a
X X
On a donc Ma,b (D) < +∞ presque sûrement, pour tout rationnels a < b et aussi Ma,b (D) <
+∞ pour tout rationnels a < b presque sûrement. En raisonnant comme dans le Théorème
4.1, on en déduit que X∞− := limt∈D→+∞ Xt existe presque sûrement (sinon, il existerait
a < b rationnels tels que lim inf t∈D→+∞ Xt < a < b < lim supt∈D→+∞ Xt , ce qui exige un
nombre infini de montées de a vers b le long de D). De plus, le lemme de Fatou permet de
voir que cette limite est dans L1 : d’abord, on a
  h i h i
E |X∞− | = E lim |Xs | = E lim inf |Xs | ≤ lim inf E[|Xs |] ≤ sup E[|Xs |] < +∞.
s→+∞ s→+∞ s→+∞ s≥0

Pour finir, la continuité à droite des trajectoires de X permet de lever la restriction t ∈ D


dans la limite précédente. 

Définition 4.6 (Martingale fermée) Une sur-martingale (Xt )t≥0 est dite fermée par une
variable aléatoire X∞ ∈ L1 si pour tout t ≥ 0, on a Xt ≥ E[X∞ |Ft ].
Une martingale (Xt )t≥0 est dite fermée (comme martingale) par une variable aléatoire
X∞ ∈ L1 si pour tout t ≥ 0, on a Xt = E[X∞ |Ft ].

Attention : une martingale peut être fermée en tant que sur-martingale mais pas en tant que
martingale : considérer par exemple une martingale positive (non nulle), elle est fermée par
0 en tant que sur-martingale pourtant elle n’est pas fermée en tant que martingale puisque
non nulle.
Dans le cadre discret une martingale (Yn )n≥0 est fermée (ie. il existe Y∞ tel que Yn =
E[Y∞ |Fn ]) si et seulement si elle est uniformément intégrable ou si et seulement si Yn
converge ps et dans L1 . On a l’analogue dans le cadre continu :
4.3. Martingales en temps continu 71

Proposition 4.11 Soit X = (Xt )t≥0 une martingale continue à droite. Alors il y a équiva-
lence entre les assertions suivantes :
(1) X est fermée (par X∞ ) ;
(2) la famille (Xt )t≥0 est uniformément intégrable ;
(3) Xt converge ps et dans L1 vers X∞− .
W S 
De plus X∞− = X∞ si F = t≥0 Ft := σ t≥0 Ft .

1
Démonstration : L’implication
 (1) ⇒ (2) est facile
puisque si Z ∈ L alors la famille de
variables aléatoires E[Z|G] : G sous-tribu de F est uniformément intégrable.

Si (2) est vrai, le Théorème 4.3 (convergence ps) entraı̂ne que Xt converge ps vers X∞− ∈ L1
donc aussi dans L1 par uniforme intégrabilité (Théorème de Vitali), ce qui donne (3).

Enfin, si (3) est vérifié, on peut passer à la limite t → +∞ dans L1 dans l’égalité Xs =
E[Xt |Fs ] et on trouve Xs = E[X∞− |Fs ], ie. X est fermée, c’est à dire (1).
Pour la dernière partie, en notant Z = X∞ − X∞− , on déduit de Xt = E[X∞ |Ft ] =
E[X∞− |Ft ] que
[
E[Z1A ] = 0 pour tout A ∈ Ft .
t≥0
 S
Notons M = A ∈ F : E[Z1A ] = 0 . Il s’agit d’une classe monotone et t≥0 Ft
est stable
S par intersection
 finie (π-système). D’après le théorème des classes monotones,
F = σ t≥0 Ft est inclus dans M. On a donc E[Z1A ] = 0 pour tout A ∈ F. Mais, comme
Z est F-mesurable, on a donc Z = 0 presque sûrement, ie. X∞ = X∞− . 

Pour une sur-martingale fermée, on a la convergence presque sûre :

Proposition 4.12 Une sur-martingale continue à droite X = (Xt )t≥0 est fermée (par X∞ )
si et seulement si Xt converge ps vers X∞− .

Démonstration : Soit (Xt )t≥0 une sur-martingale continue à droite et fermée par X∞ .
Par un argument de convexité (inégalité de Jensen appliquée à la sous-martingale −X
et à x+ ) donne E[(Xt )− ] ≤ E[(X∞ )− ]. Le Théorème 4.3 assure alors que Xt converge
presqueWsûrement vers une limite X∞− (la réciproque va garantir que X∞− = X∞ quand
F∞ = t≥0 Ft ).
Réciproquement, si Xt converge presque sûrement vers X∞− , pour s ≤ t on a
 
Xs − E[X∞− |Fs ] ≥ E[Xt |Fs ] − E E[X∞− |Ft ]Fs
 
= E Xt − E[X∞− |Ft ]|Fs .
72 Chapitre 4. ©JCB – M2 Math. – Université de Rennes 1

En passant à la limite t → +∞ par le lemme de Fatou, on a


 

Xs − E[X∞− |Fs ] ≥ E lim inf Xt − E[X∞− |Ft ] |Fs . (4.8)
t→+∞


Mais lim inf t→+∞ Xt = limt→+∞ Xt = X∞− ps et comme E[X∞− |Ft ] t≥0 est une martin-
gale fermée donc convergente ps, on a aussi,  la Prop 4.11, lim supt→+∞ E[X∞− |Ft ] =
Sd’après
X∞− (ici il est immédiat que F∞− = σ t≥0 Ft ). Finalement, la minoration dans (4.8)
est nulle et elle donne Xs ≥ E[X∞− |Fs ] : la sur-martingale (Xt )t≥0 est fermée. 

4.3.5 Théorème d’arrêt


Le théorème d’arrêt pour une sur-martingale discrète (Yk )k∈N par rapport à une filtration
(Gk )k≥0 , fermée par Y∞ , énonce que si S et T sont deux temps d’arrêt tels que S ≤ T on
a YS , YT ∈ L1 et YS ≥ E[YT |GS ] (avec la convention YT = Y∞ sur {T = +∞}). Le résul-
tat s’applique encore à une sur-martingale quelconque si S, T sont (déterministiquement)
bornés. L’analogue continu de ce théorème est un résultat essentiel pour la suite.
Rappelons qu’une martingale X à trajectoires continues à droite est progressivement me-
surable, cf. Prop. 4.1. En particulier, la Prop. 4.4 s’appliquera à XT 1{T <+∞} et la Re-
marque 4.3 à XT si elle est fermée (qui sont FT -mesurables).

Théorème 4.4 (Arrêt de Doob)


1. Soit X = (Xt )t≥0 une sur-martingale continue à droite et fermée par X∞ , variable
aléatoire F-mesurable. Soient S et T deux temps d’arrêt avec S ≤ T . Alors XS et
XT sont dans L1 et  
XS ≥ E XT |FS
avec la convention XT = X∞ sur {T = +∞}.
2. Soit X une martingale continue à droite fermée par X∞ , variable aléatoire F-mesurable.
Alors, si S et T sont deux temps d’arrêt avec S ≤ T on a
 
XS = E XT |FS
 
avec la même convention que ci-dessus. En particulier, XS = E X∞ |FS .

Démonstration : 1) Pour tout n ≥ 1, posons Dn = {k2−n : k ∈ N} ∪ {+∞} et comme en


(4.1) o pose Tn = ([2n T ] + 1)2−n , soit

Tn = inf t ∈ Dn : t > T
+∞
X k+1
= 1{k2−n <T ≤(k+1)2−n } + (+∞)1{T =+∞} .
k=0
2n
4.3. Martingales en temps continu 73

D’après la Prop. 4.3, les Tn forment une suite de temps d’arrêt qui décroı̂t vers T .
Considérons pour n fixé les deux variables aléatoires Tn et Tn+1 . Ce sont deux temps d’arrêt
pour la filtration discrète (Ft )t∈Dn+1 car
 −n−1 c 
< T ≤ (k + 1)2−n−1 = T ≤ k2−n−1 ∩ T ≤ (k + 1)2−n−1 ∈ Fk2−n−1 .

k2
Puisque Tn+1 ≤ Tn , le théorème d’arrêt (discret) appliqué à la sur-martingale discrète
(Xt )t∈Dn+1 (qui est fermée par X∞ ) pour la filtration discrète (Ft )t∈Dn+1 entraı̂ne que
XTn+1 ≥ E[XTn |FTn+1 ].
Notons, pour k ≤ 0, Yk = XT−k . On a alors
 
Yk−1 = XT−k+1 ≥ E[XT−k |FT−k+1 ] = E Yk |FT−k .
La suite (Yk )k∈−N est donc une sur-martingale indexée par −N pour la filtration (FT−k )k∈−N .
De plus, on a aussi supk≤0 E[Yk ] = supn≥0 E[XTn ] ≤ E[X0 ] (on utilise ici encore le théorème
d’arrêt discret).
D’après le résultat discret de convergence de sur-martingale (Prop. 4.10), on conclut que
XTn converge ps et dans L1 . Comme Tn & T , par continuité à droite, la limite presque sûre
est nécessairement XT , ce qui donne en particulier XT ∈ L1 car il y a aussi convergence
dans L1 .
Au temps d’arrêt S, on associe de même la suite Sn & S vérifiant aussi (quitte à réindéxer
Sn ) Sn ≤ Tn , et XSn converge vers XS ps et dans L1 . Puisque Sn ≤ Tn le théorème d’arrêt
discret donne XSn ≥ E[XTn |FSn ] ainsi, pour A ∈ FS ⊂ FSn ,
   
E XSn 1A ≥ E XTn 1A .
En passant à la limite L1 quand n → +∞, il vient
   
E X S 1A ≥ E X T 1A
pour tout A ∈ FS . Comme d’après la Prop. 4.4 et la Remarque 4.3, XS est FS -mesurable,
cette inégalité assure alors que XS ≥ E[XT |FS ], ce qui conclut le 1).
2) Il suffit d’appliquer la partie 1) à X et à −X. 

Corollaire 4.1 Soit X une sur-martingale (resp. une martingale) continue à droite et soient
S ≤ T deux temps d’arrêt (déterministiquement) bornés. Alors
XS ≥ E[XT |FS ] (resp. XS = E[XT |FS ]).

Démonstration : Soit a ≥ 0 tel que T ≤ a. On applique le théorème précédent (Th. 4.4) à


la martingale X a = (Xt∧a )t≥0 qui est fermée par Xa . Puis on remarque que XTa = XT et
XSa = XS . 
74 Chapitre 4. ©JCB – M2 Math. – Université de Rennes 1

Remarque 4.5 Le théorème d’arrêt (Th. 4.4) ne s’applique que pour des (sur)martingales
uniformément intégrables (fermées) ou pour des temps d’arrêt (déterministiquement) bor-
nés. Par exemple si B est un mouvement brownien, c’est bien une martingale (mais non
uniformément intégrable sinon le Théorème 4.3 (de convergence ps) exigerait la conver-

gence ps Bt → B∞ ce qui est faux). Si pour a > 0, on pose Ta = inf t ≥ 0 : Bt = a alors
on a bien un temps d’arrêt mais il est non (déterministiquement) borné, cf. (3.8) dans la
Remarque 3.7. Le théorème d’arrêt (Th. 4.4) ne s’applique effectivement pas dans ce cas
puisque E[B0 ] = 0 6= E[BTa ] = a malgré 0 ≤ Ta .

Définition 4.7 (Martingale arrêtée) Étant donné un temps d’arrêt T , on définit le proces-
sus arrêté X T = (XtT )t≥0 par XtT = Xt∧T , c’est le processus qui vaut Xt tant que t ≤ T
puis qu’on arrête à sa valeur en T , XT , pour les dates ultérieures à T .

Corollaire 4.2 Soit X une martingale continue à droite uniformément intégrable et soit
T un temps d’arrêt. Alors le processus (XtT )t≥0 est aussi une martingale uniformément
intégrable, et
XtT = E[XT |Ft ] (4.9)
avec la convention XT = X∞− sur {T = +∞}.

Démonstration : Il suffit d’établir (4.9) : on aura alors une martingale fermée donc unifor-
mément intégrable. Rappelons que XT ∈ L1 d’après le Théorème 4.4 (Arrêt). D’après ce
théorème avec S = t ∧ T ≤ T , on a aussi

XtT = XS = E[XT |FS ] = E[XT |Ft∧T ].

Il reste à voir que E[XT |Ft∧T ] = E[XT |Ft ].


Puisque XT 1{T <+∞} est FT -mesurable (cf. Prop. 4.4), le Lemme 4.1 assure que XT 1{T ≤t}
est Ft -mesurable et aussi FT -mesurable, donc Ft∧T -mesurable. Il en découle que

E[XT 1{T ≤t} |Ft∧T ] = XT 1{T ≤t} = E[XT 1{T ≤t} |Ft ]. (4.10)

Pour compléter la preuve, il reste à voir que

E[XT 1{T >t} |Ft∧T ] = E[XT 1{T >t} |Ft ]. (4.11)

Or si A ∈ Ft , on a
— A ∩ {T > t} ∈ Ft car A, {T > t} = {T ≤ t}c ∈ Ft ;
— puis A ∩ {T > t} ∈ FT car A ∩ {T > t} ∩ {T ≤ s} = ∅ ∈ Fs si s ≤ t et
A ∩ {T > t} ∩ {T ≤ s} ∈ Fs si t ≤ s car A, {T > t} = {T ≤ t}c ∈ Ft ⊂ Fs et
{T ≤ s} ∈ Fs .
Finalement, A ∩ {T > t} ∈ FT ∩ Ft = Ft∧T et donc pour tout A ∈ Ft :
   
E[1A 1{T >t} XT ] = E E[1A 1{T >t} XT |Ft∧T ] = E 1A 1{T >t} E[XT |Ft∧T ]
 
= E 1A E[XT 1{T >t} |Ft∧T ]
4.4. Processus de Poisson 75

car {T > t} ∈ FT ({T > t} = {T ≤ t}c et {T ≤ t} ∩ {T ≤ s} = {T ≤ t ∧ s} ∈ Ft∧s ⊂ Fs ).


Par ailleurs
     
E 1A 1{T >t} XT = E E[1A 1{T >t} XT |Ft ] = E 1A E[1{T >t} XT |Ft ] .

On a donc    
E 1A E[1{T >t} XT |Ft ] = E 1A E[XT 1{T >t} |Ft∧T ] (4.12)
avec E[XT 1{T >t} |Ft∧T ] qui est Ft -mesurable.
Mais rappelons que Y = E[Z |G] si et seulement si Y est G-mesurable et E[1A Z] = E[1A Y ]
pour tout A ∈ G. Finalement (4.12) assure
   
E XT 1{T >t} |Ft∧T = E XT 1{T >t} |Ft ,

ie. (4.11) est obtenue, ce qui compte tenu de (4.10), termine la preuve du Corollaire 4.2. 

Remarque 4.6 Si on suppose seulement que X est une martingale continue à droite, alors
on peut appliquer le corollaire ci-dessus à la martingale uniformément intégrable X (a) =
(Xt∧a )t≥0 . On trouve que pour tout temps d’arrêt T , X a = (Xt∧T ∧a )t≥0 est une martingale.
Comme on peut prendre a aussi grand qu’on le désire, cela signifie que (Xt∧T )t≥0 est une
martingale : avec a ≥ t ≥ s, la propriété de martingale pour (Xt∧T ∧a )t≥0 , E[Xt∧T ∧a |Fs ] =
Xs∧T ∧a , s’écrit E[Xt∧T |Fs ] = Xs∧T ie. (Xt∧T )t≥0 est bien une martingale.

On a donc
Corollaire 4.3 (Martingale arrêtée) Si X est une martingale et T un temps d’arrêt, X T
définie bien une martingale appelée martingale arrêtée. Elle est uniformément intégrable
si X l’est ou si T est (déterministiquement) borné.

4.4 Processus de Poisson


Si le mouvement brownien est le processus à trajectoires continues typique, le processus
à saut typique est le processus de Poisson qu’on décrit (très) sommairement dans cette
section. Ce type de processus est utilisé par exemple pour modéliser les files d’attente
comme les arrivées des appels téléphoniques à un central.

Définition 4.8 (Processus de Poisson) Soit λ > 0 et (Sn )n≥1 une suite de variables aléa-
toires indépendantes de même loi exponentielle E(λ). On pose Tn = S1 + · · · + Sn . On
définit alors le processus de comptage N = (Nt )t≥0 à valeurs dans N ∪ {+∞} par
X
Nt = 1{Tn ≤t} .
n≥1

Ce processus s’appelle le processus de Poisson d’intensité λ.


76 Chapitre 4. ©JCB – M2 Math. – Université de Rennes 1

Définition 4.9 On définit (FtN )t≥0 la filtration naturelle complétée du processus de Poisson.

Remarque 4.7 Le processus se réécrit aussi sous la forme Nt = sup n ≥ 0 : Tn ≤ t .
Réciproquement, on remarque que Tn = inf t ≥ 0 : Nt = n est un (FtN )-temps d’arrêt.
P
Comme pour t > s, on a Nt − Ns = n≥1 1{s<Tn ≤t} , N est un processus à accroisssements
indépendants et stationnaires (PAIS) et à trajectoires càdlàg. On montre qu’il vérifie alors
la propriété de Markov forte : soit T un (FtN )-temps d’arrêt fini presque sûrement ; on
note N 0 le processus défini pour s ≥ 0 par Ns0 = NT +s − NT . Alors le processus N 0 est
indépendant de FTN et a même loi que N .

Définition 4.10 (équivalente du processus de Poisson) Un processus de Poisson N = (Nt )t≥0


d’intensité λ est un processus de comptage à trajectoires continues à droite tel que
— N (0) = 0 ;
— N est un processus à accroissements indépendants et stationnaires ;
— pour tout t ≥ 0, Nt suit la loi de Poisson P(λt).

Démonstration : Fastidieux. . . , cf. [BC]. 

Théorème 4.5 Soit N un processus de Poisson d’intensité λ. Alors les processus suivants
sont des martingales :
e = (Nt − λt, t ≥ 0) ;
1. le processus de Poisson compensé : N

2. (Nt − λt)2 − λt t≥0 .

Remarque 4.8 — On peut voir le processus de Poisson comme une mesure aléatoire
sur (R, B(R)) : la mesure de l’intervalle ]s, t] est N (]s, t]) = Nt − Ns .
— Le mouvement brownien et le processus de Poisson sont deux représentant d’une
classe plus vaste de processus dit de Lévy (processus càdlàg à accroissements indé-
pendants et stationnaires).
Chapitre 5

Semimartingales continues

Les semimartingales continues forment la classe générale de processus à trajectoires


continues pour laquelle on peut développer une théorie de l’intégration stochastique qui
sera l’objet du chapitre suivant. Par définition, une semimartingale est la somme d’une
martingale (locale) et d’un processus à variation finie. Dans ce chapitre nous étudions
séparément ces deux classes de processus. En particulier, nous introduisons la notion de
variation quadratique d’une martingale qui jouera un rôle fondamental pour l’intégration
stochastique.
Dans ce chapitre, on considère un espace de probabilité filtré (Ω, F, (Ft )t≥0 , P) satisfaisant
les conditions habituelles. On considère d’abord des processus à variation finie en Section 5.1
puis des martingales locales en Section 5.2 dont on étudie la variation quadratique en
Section 5.3. On résume les résultats obtenus pour les semimartingales en Section 5.4.

5.1 Processus à variation bornée


5.1.1 Fonctions à variation finie
Soit T > 0 fixé. On rappelle qu’il y a une bijection entre les fonctions croissantes continues
àe droite g : [0, T ] → R+ et les mesures ν positives finies sur [0, T ]. Elle est donnée par
g(t) = ν([0, t]) où ν(]s, t]) = g(t) − g(s). La donnée de ν sur les intervalles ]s, t] déterminent
uniquement la mesure ν sur B([0, T ]) (par un argument de classe monotone). Si g est en
plus supposée continue alors ν est sans atome (ie. ν({t}) = 0 pour tout t ∈ [0, T ]).
Exemples : si g(x) = x alors ν est la mesure de Lebesgue λ ; si g(x) = 1[a,+∞[ (x) alors ν
est la mesure de Dirac δa .

Définition 5.1 (Mesure signée) Une mesure finie est dite signée si elle est différence de
deux mesures positives finies.

L’écriture d’une mesure µ signée sous la forme d’une différence de deux mesures positives
finies n’est pas unique, cependant il existe une seule décomposition canonique :

77
78 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

Proposition 5.1 (Décomposition canonique d’une mesure signée) Il existe une seule dé-
composition µ = µ+ − µ− minimale dans le sens où µ+ et µ− sont deux mesures positives
finies portées par des boréliens disjoints. Il s’agit de la décomposition canonique de µ.

Dans la suite, pour une fonction h à valeurs réelles, on note h+ = h ∨ 0 et h− = h ∧ 0.


Démonstration : Pour obtenir l’existence d’une telle décomposition, on considère une dé-
composition quelconque µ = µ1 − µ2 de µ, on pose ν = µ1 + µ2 . Comme µ1  ν et µ2  ν,
on écrit par le théorème de Radon-Nikodym :

µ1 (dt) = h1 (t)ν(dt), µ2 (dt) = h2 (t)ν(dt).

Avec h(t) = h1 (t) − h2 (t) on a

µ(dt) = h(t)ν(dt) = h(t)+ ν(dt) − h(t)− ν(dt)

ce qui donne la décomposition µ = µ+ −µ− avec µ+ (dt) = h(t)+ ν(dt), µ− (dt) = h(t)− ν(dt).
Notons que les mesures µ+ et µ− sont bien à supports disjoints puisqu’elles sont portées
respectivement par D+ = {t ∈ [0, T ] : h(t) > 0} et D− = {t ∈ [0, T ] : h(t) < 0}. L’unicité
de la décomposition µ = µ+ − µ− vient du fait que l’on a nécessairement

µ+ (A) = sup{µ(C) : C ⊂ A, C borélien}.

En effet µ(C) ≤ µ+ (C) ≤ µ+ (A) quand C ⊂ A et

µ+ (A) = µ+ (A ∩ D+ ) = µ(A ∩ D+ ) ≤ sup{µ(C) : C ⊂ A, C borélien}.

On note |µ| la mesure positive |µ| = µ+ + µ− . Il s’agit de la variation totale de µ. Remar-


quons que la dérivée de Radon-Nikodym de µ par rapport à |µ| est


= 1D+ − 1D−
d|µ|

où D+ ∪ D− est une partition de l’espace.

Définition 5.2 Soit T > 0. Une fonction continue F : [0, T ] → R telle que F (0) = 0 est
dite à variation finie s’il existe une mesure signée (ie. différence de deux mesures positives
finies) µ telle que F (t) = µ([0, t]) pour tout t ∈ [0, T ].

La mesure µ est alors déterminée de façon unique : l’expression µ(]s, t]) = F (t) − F (s) la
détermine uniquement sur la famille des intervalles ]s, t] puis, par un argument de classe
monotone, sur B([0, T ]). De plus, F étant continue, µ est sans atome.
5.1. Processus à variation bornée 79

Proposition 5.2 Une fonction F est à variation finie si et seulement si F est différence de
deux fonctions croissantes continues nulles en 0.
Démonstration : Si F est à variation finie, F (t) = µ([0, t]) et avec la décomposition cano-
nique de µ de la Proposition 5.1, F est différence de deux fonctions croissantes continues
et nulles en 0 : F (t) = µ+ ([0, t]) − µ− ([0, t]) (si µ+ et µ− ont des atomes, ils doivent néces-
sairement coı̈ncider pour s’annuler (µ n’en ayant pas). Mais comme µ+ et µ− sont censés
avoir des supports disjoints, c’est que de tels atomes n’existent pas : µ+ et µ− sont bien
sans atome. Réciproquement, si F = F1 − F2 avec F1 , F2 fonctions croissantes continues et
nulles en 0 alors on associe µ1 et µ2 des mesures positives finies à F1 , F2 et F s’écrit alors
F (t) = µ([0, t]) pour la mesure signée µ = µ1 − µ2 . 

Dans la suite, on note µ la mesure associée à F et µ+ −µ− la décomposition canonique de µ.


La fonction définie par µ+ ([0, t]) + µ− ([0, t]) s’appelle la variation totale de F . D’habitude,
les fonctions à variation finie sont plutôt définies par la propriété suivante :
Proposition 5.3 (Variation finie – ou bornée) Pour tout t ∈ [0, T ], on a
( p )
X
|µ|([0, t]) = sup |F (ti ) − F (ti−1 )|
{ti }i=1,...,p i=1

où le supremum porte sur toutes les subdivisions 0 = t0 < t1 < · · · < tp = t de [0, t].
Démonstration : Il suffit clairement de traiter le cas t = T . L’inégalité ≥ s’obtient facile-
ment puisque
|F (ti ) − F (ti−1 )| = |µ(]ti−1 , ti ])| ≤ |µ|(]ti−1 , ti ])
et donc i=1 |F (ti )−F (ti−1 )| ≤ pi=1 |µ|(]ti−1 , ti ]) = |µ|(]0, T ]) = |µ|([0, T ]) par additivité.
Pp P
Pour l’autre inégalité, on montre le résultat plus fort suivant : pour toute suite 0 = tn0 <
tn1 < · · · < tnpn de subdivisions emboı̂tées de [0, T ] de pas tendant vers 0, on a
pn
X
lim |F (tni ) − F (tni−1 )| = |µ|([0, T ]).
n→+∞
i=1

Pour simplifier, on considère les subdivisions dyadiques tni = i2−n T , 0 ≤ i ≤ 2n , de [0, T ].


On utilise un argument de martingales en introduisant l’espace de probabilité Ω = [0, T ]
muni de la tribu borélienne B([0, T ]) et de la probabilité P(ds) = (|µ|([0, T ])−1 )|µ|(ds). Sur
cet espace, on considère la filtration discrète (Bn )n≥n où Bn est la tribu engendrée par les
intervalles ](i − 1)2−n T, i2−n T ], avec 1 ≤ i ≤ 2n . On pose alors

X(s) = (s) = 1D+ (s) − 1D− (s)
d|µ|
où D+ ∪ D− est une partition de l’espace et on considère pour chaque n ≥ 0

Xn = E[X|Bn ].
80 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

Il s’agit d’une (Bn )n≥0 -martingale. Comme Xn est Bn -mesurable, Xn est constante sur
chaque intervalle ](i − 1)2−n T, i2−n T ]. D’après les propriétés de l’espérance conditionnelle,
sa valeur αi sur ](i − 1)2−n T, i2−n T ] vérifie

|µ|(](i − 1)2−n T, i2−n T ])


 
  dµ
αi = E E[X|Bn ]1](i−1)2−n T,i2−n T ] = E 1](i−1)2−n T,i2−n T ]
|µ|([0, T ]) d|µ|
µ(](i − 1)2−n T, i2−n T ])
Z
dµ d|µ|
= = .
](i−1)2−n T,i2−n T ] d|µ| |µ|([0, T ]) |µ|([0, T )]

On a donc
µ(](i − 1)2−n T, i2−n T ]) F (i2−n T ) − F ((i − 1)2−n T )
αi = = .
|µ|(](i − 1)2−n T, i2−n T ]) |µ|(](i − 1)2−n T, i2−n T ])

Puis comme, par définition, la martingale


W discrète (Xn )n≥0 est fermée et comme X est
mesurable par rapport à B([0, T ]) = n≥0 Bn cette martingale converge ps et dans L1
vers X. En particulier,
lim E[|Xn |] = E[|X|] = 1,
n→+∞

où on utilise |X(s)| = 1, µ-pp. Le résultat suit facilement puisque


2n
X
E[|Xn |] = (|µ|([0, T ])−1 ) |F (i2−n T ) − F ((i − 1)2−n T )|.
i=1

5.1.2 Intégrale de Stieltjes


R
Soit f : [0, T ] → R une fonction mesurable telle que [0,T ]
|f (s)||µ|(ds) < +∞. On note
Z t Z Z t Z
f (s) dF (s) = f (s) µ(ds), f (s) |dF (s)| = f (s) |µ|(ds).
0 [0,t] 0 [0,t]

On vérifie facilement l’inégalité


Z t Z t

f (s) dF (s) ≤ |f (s)| |dF (s)|.

0 0
Rt
Remarquons de plus que la fonction t 7→ 0 f (s) dF (s) est aussi à variation finie. La mesure
associée est alors simplement µ0 (ds) = f (s)µ(ds) et sa décomposition canonique est
Z t Z t  Z t Z t 
+ + − − − + + −
f (s) dF (s) + f (s) dF (s) − f (s) dF (s) + f (s) dF (s) .
0 0 0 0
5.1. Processus à variation bornée 81

On a aussi une écriture en terme d’intégrales par rapport à des mesures positives
Z t Z t Z t
f (s) dF (s) = +
f (s) dF (s) − f (s) dF − (s).
0 0 0

On a encore l’associativité de l’intégrale : si F est une fonctionRà variation bornée et si h, g


t
sont des fonctions mesurables bornées alors en notant Fe(t) = 0 h(s) dF (s), on a
Z t Z t
g(s)dFe(s) = g(s)h(s) dF (s).
0 0

Le résultat suivant généralise les sommes de Riemann à l’intégrale de Stieltjes et donne


donc un moyen d’approcher les intégrales de Stieltjes par des sommes.

Proposition 5.4 Si f : [0, T ] → R est une fonction continue et si 0 = tn0 < tn1 < · · · < tnpn =
T est une suite de subdivisions (emboı̂tées) de [0, T ] de pas tendant vers 0 on a
Z T pn
X
f (s)dF (s) = lim f (tni−1 )(F (tni ) − F (tni−1 )).
0 n→+∞
i=1

Démonstration : Soit fn la fonction constante par morceaux définie par fn (s) = f (tni−1 ) si
s ∈]tni−1 , tni ]. Alors,
pn Z
X
f (tni−1 )(F (tni ) − F (tni−1 )) = fn (s)µ(ds)
i=1 [0,T ]

et le résultat suit par convergence dominée (f continue sur [0, T ] est bornée). 

5.1.3 Extension de l’intégration de Stieltjes à R+


Définition 5.3 (Variation finie sur R+ ) Une fonction continue F : R+ → R est dite à
variation finie sur R+ si, pour tout T > 0, la restriction de F à [0, T ] est à variation finie.

Il est alors facile d’étendre les définitions précédentes


R +∞ des intégrales à R+ en supposant f
dF -intégrable. En particulier, on peut définir 0 f (s) dF (s) pour toute fonction f telle
R +∞ RT
que 0 |f (s)| |dF (s)| = supT >0 0 |f (s)| |dF (s)| < +∞.

5.1.4 Processus à variation finie


On rappelle qu’on considère un espace de probabilité filtré (Ω, F, (Ft )t≥0 , P) satisfaisant
les conditions habituelles.

Définition 5.4 (Processus à variation finie et processus croissant)


82 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

— Un processus à variation finie A = (At )≥0 est un processus adapté dont toutes les
trajectoires sont à variation finie au sens de la Définition 5.2.
— Le processus A est appelé processus croissant si de plus les trajectoires de A sont
croissantes.

Remarque 5.1 — En particulier, d’après la Définition 5.2 d’une fonction à variation


finie, on a A0 = 0 et les trajectoires de A sont continues.
— Le mouvement brownien n’est pas à variation bornée, cf. Prop. 3.8 : on ne pourra
donc pas utiliser cette section pour construire l’intégrale contre un mouvement brow-
nien.

Proposition 5.5 Soit A un processus à variation finie et H un processus progressif tel que
Z t
∀t ≥ 0, ∀ω ∈ Ω, |Hs (ω)| |dAs (ω)| < +∞.
0

Alors le processus H · A défini par


Z t
(H · A)t = Hs (ω) dAs (ω)
0

est aussi un processus à variation finie.

Remarque 5.2 Quand on intègre contre un processus à variation finie, on définit une inté-
grale trajectorielle : l’intégrale se définit ω par ω (ie. trajectoire par trajectoire).

Démonstration : D’après les observations de la section précédente, les trajectoires de H · A


sont à variations finies. Il ne reste donc qu’à justifier que H · A est adapté. Pour cela, il
suffit Rde voir que, si h : [0, t] × Ω → R est mesurable pour la tribu
R t produit B([0, t]) ⊗ Ft
t
et si 0 |h(s, ω)| |dAs (ω)| est fini pour tout ω, alors la variable 0 h(s, ω) dAs (ω) est Ft -
mesurable.
D’abord, pour h(s, ω) = 1]u,v] (s)1Γ (ω) avec ]u, v] ⊂ [0, t] et Γ ∈ Ft , on a
Z t
h(s, ω) dAs (ω) = (Av (ω) − Au (ω))1Γ (ω)
0

qui est clairement Ft -mesurable puisque (At )t≥0 est adapté et Γ ∈ Ft .


Par un argument de classe monotone, comme {]u, v] × Γ, ]u, v] ⊂ [0, t] R: Γ ∈ Ft } engendre
t
B([0, t]) ⊗ Ft , on justifie alors que pour h = 1G , G ∈ B([0, t]) ⊗ Ft , 0 h(s, ω) dAs (ω) est
encore Ft -mesurable.
5.2. Martingales locales 83

Enfin, on passe au cas général en écrivant h fonction B([0, t]) ⊗ Ft -mesurable, dAs (ω)-
intégrable, comme limite simple d’une suite de fonctions étagées hn telles que pour tout n
on ait |hn | ≤ |h|. Par convergence dominée (pour l’intégrale de Stieltjes), on a
Z t Z t
hn (s, ω) dAs (ω) → h(s, ω) dAs (ω).
0 0
Rt
Comme 0 hn (s, ω) dAs (ω) est Ft -mesurable et que la Ft -mesurabilité se conserve en passant
à la limite, on obtient la Proposition 5.5. 

Remarque 5.3 — Souvent, on sera dans la situation où l’hypothèse plus faible est
satisfaite Z t
ps ∀t ≥ 0, |Hs ||dAs | < +∞.
0
Dans ce cas, on peutR encore définir H · A en convenant que, sur l’ensemble de
t
probabilité nulle où 0 |Hs ||dAs | devient infini, on prend (H · A)t (ω) = 0 pour
tout t. Le processus (H ·A) ainsi défini reste adapté lorsque la filtration est supposée
complète (conditions habituelles).
— Sous des hypothèses convenables d’intégrabilité de H et de K, on a la propriété
d’associativité :
K · (H · A) = (KH) · A.
Un cas particulier important est celui où At = t : si H = (Ht )t≥0 est un processus progressif
tel que Z t
ps ∀t ≥ 0 |Hs | ds < +∞,
0
Rt
le processus 0
Hs ds est un processus à variation finie.

5.2 Martingales locales


Si T est un temps d’arrêt et X = (Xt )t≥0 un processus, on rappelle que X T désigne le
processus arrêté : pour tout t ≥ 0, XtT = Xt∧T . On a vu que si X est une martingale alors
X T l’est aussi (il s’agit de la martingale arrêtée), cf. Remarque 4.6.
Définition 5.5 (Martingale locale) Un processus M = (Mt )t≥0 est appelé une martingale
locale (continue) s’il s’écrit Mt = M0 + Nt où
— M0 est une variable aléatoire F0 -mesurable et
— (Nt )t≥0 est un processus adapté à trajectoires continues avec N0 = 0 et tel qu’il
existe une suite croissante (Tn )n≥0 de temps d’arrêt avec Tn % +∞ et pour tout n
le processus arrêté N Tn est une martingale uniformément intégrable.
On dit que la suite de temps d’arrêt Tn % +∞ réduit M si pour tout n le processus arrêté
N Tn est une martingale uniformément intégrable.
Lorsque M0 = 0, on parle de martingale locale issue de 0.
84 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

Remarque 5.4 On n’impose pas dans la définition d’une martingale locale que les va-
riables Mt soient dans L1 (c’est une différence essentielle avec les martingales). En par-
ticulier, d’après la définition précédente, M0 peut être n’importe quelle variable aléatoire
F0 -mesurable.

Dans les propriétés qui suivent, la plupart des justifications viennent des propriétés des
martingales arrêtées énoncées dans le Corollaire 4.2.
Exemple : Une martingale à trajectoires continues est une martingale locale (et la suite
Tn = n réduit M ).
En effet, cela suit par exemple du Corollaire 4.2 et de ses conséquences avec les temps
d’arrêt Tn = n % +∞, plus simplement, il est immédiat que pour s < t :
 
Ms∧n = E Mt∧n |Fs
et (Mt∧n )t≥0 est fermée par Mn donc uniformément intégrable.

Proposition 5.6 Dans la définition d’une martingale locale (issue de 0) on peut remplacer
00
martingale uniformément intégrable00 par 00 martingale00 (en effet, on peut ensuite remplacer
Tn par Tn ∧ n pour récupérer l’uniforme intégrabilité).

Démonstration : Si M Tn est une martingale alors (M Tn )n = M Tn ∧n l’est aussi et elle est


fermée par Mn donc uniformément intégrable. De plus, il est évident que (Tn ∧ n) % +∞
lorsque Tn % +∞. 

Proposition 5.7 Si M est une martingale locale, pour tout temps d’arrêt T , M T est une
martingale locale.
Démonstration : Si Tn réduit M alors M Tn est une martingale et (M T )Tn = M T ∧Tn =
(M Tn )T l’est aussi d’après le Corollaire 4.2. 

Proposition 5.8 Si (Tn )n≥0 réduit M et si (Sn )n≥0 est une suite de temps d’arrêt telle que
Sn → +∞, alors la suite (Tn ∧ Sn )n≥0 réduit encore M .
Démonstration : On a (Tn ∧ Sn ) % +∞ et M Tn ∧Sn = (M Tn )Sn est une martingale unifor-
mément intégrable en tant que martingale uniformément intégrable M Tn arrêtée (Corol-
laire 4.2). 

Proposition 5.9 L’espace des martingales locales est un espace vectoriel.


Démonstration : Si M, N sont des martingales locales réduites respectivement par (Tn )n≥0
et (Sn )n≥0 alors d’après la Prop. 5.8, elles le sont encore toutes les deux par (Tn ∧ Sn )n≥0 .
Mais alors (M + N )Tn ∧Sn = N Tn ∧Sn + N Tn ∧Sn est une martingale, comme somme de mar-
tingales. 
5.2. Martingales locales 85

Proposition 5.10 Une martingale locale positive M telle que M0 ∈ L1 est une sur-martingale.
D’après le Théorème 4.3 (convergence ps des sur-martingales) et la remarque qui le suit,
une martingale locale positive converge donc ps.
Démonstration : Écrivons Mt = M0 + Nt et soit (Tn )n≥0 une suite de temps d’arrêt qui
réduit N . Alors, si s ≤ t, on a pour tout n,
 
Ns∧Tn = E Nt∧Tn |Fs .
En ajoutant des deux côtés la variable M0 (qui est F0 -mesurable et dans L1 ), on trouve
 
Ms∧Tn = E Mt∧Tn |Fs . (5.1)
Puisque M est positive, on peut appliquer le lemme de Fatou pour les espérances condi-
tionnelles en faisant n → +∞. Comme Tn % +∞, on a alors
 
Ms = lim Ms∧Tn = lim inf Ms∧Tn = lim inf E Mt∧Tn |Fs
n→+∞ n→+∞ n→+∞
   
≥ E lim inf Mt∧Tn |Fs = E Mt |Fs .
n→+∞

En particulier, en prenant s = 0 et l’espérance, on a E[Mt ] ≤ E[M0 ] < +∞, donc comme


M est positive, Mt ∈ L1 pour tout t ≥ 0. L’inégalité précédente assure alors que M est
bien une sur-martingale. 

Proposition 5.11 Soit M une martingale locale. S’il existe une variable Z ∈ L1 telle que,
pour tout t ≥ 0, |Mt | ≤ Z, alors M est une martingale. En particulier, une martingale
locale bornée est une martingale.
Démonstration : Si M est dominée par une variable aléatoire Z intégrable, on obtient
comme pour la Proposition 5.10 pour s ≤ t :
 
Ms∧Tn = E Mt∧Tn |Fs .
Puis, par convergence dominée la suite Mt∧Tn converge dans L1 vers Mt . On peut donc
passer à la limite n → +∞ pour trouver
     
Ms = lim Ms∧Tn = lim E Mt∧Tn |Fs = E lim Mt∧Tn |Fs = E Mt |Fs .
n→+∞ n→+∞ n→+∞

Remarque 5.5 Attention, il n’est donc pas facile d’affaiblir les conditions de le Prop. 5.11 :
si M est une martingale locale uniformément intégrable, en général M n’est pas une mar-
tingale (cf. le contre-exemple 2.13 p. 182 dans [RY], cf. aussi le contre-exemple page ??
pour le processul de Bessel Rt en dimension 3 : la martingale locale 1/Rt est uniformé-
ment intégrable car bornée dans L2 mais n’est pas une martingale). Par contre si on a une
condition d’uniforme intégrabilité pour tous les temps d’arrêt, on a un résultat positif :
86 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

Proposition 5.12 Si M est une martingale locale à trajectoires continues avec M0 = 0,


alors M est réduite par la suite de temps d’arrêt

Tn = inf t ≥ 0 : |Mt | = n .

Démonstration : Comme M Tn est une martingale locale bornée, c’est aussi une martingale
uniformément intégrable par la Prop. 5.11. De plus M est à trajectoires continues, on a bien
Tn % +∞. En effet, soit A > 0, comme M est à trajectoires continues, {Mt : t ∈ [0, A]}
est compact donc borné par R(A) < +∞. On a alors pour tout n ≥ R(A), Tn ≥ A, ie.
Tn % +∞. 

Dans la suite, on utilise abondamment le résultat immédiat suivant :

Lemme 5.1 Pour une martingale de carré intégrable, on a pour 0 ≤ s ≤ t :

E (Mt − Ms )2 |Fs = E Mt2 |Fs − E Ms2 |Fs ,


     

E (Mt − Ms )2 = E Mt2 − E Ms2 .


     

Démonstration : La deuxième partie découle de la première en y prenant l’espérance. Pour


la première, on a

E (Mt −Ms )2 |Fs = E (Mt2 −2Mt Ms +Ms2 ) |Fs = E Mt2 |Fs −2E Mt Ms |Fs +E Ms2 |Fs .
         

Mais par la propriété de martingale, on a

E Mt Ms |Fs = Ms E[Mt |Fs ] = Ms2 = E Ms2 |Fs


   

ce qui conclut. 

Le résultat suivant montre qu’une martingale locale continue qui n’est pas triviale est à
variations non bornées. L’ensemble des martingales locales est donc un ensemble vraiment
différent de celui des processus à variation finie.

Théorème 5.1 Soit M une martingale locale (continue) issue de 0. Alors si M est un
processus à variation finie, M est indistinguable de 0.

Démonstration : Supposons que M est un processus à variation finie et posons pour tout
n∈N: Z t
 
τn = inf t ≥ 0 : |dMs | ≥ n .
0

Les temps τn sontR t des temps d’arrêt d’après l’Exemple 3.1 (pour cela, il faut remarquer
que le processus 0 |dMs | est continu et adapté, ce qui se voit par l’approximation donnée
par la Prop. 5.4). Fixons n ≥ 1 et posons N = M τn . Alors N est une martingale locale
5.3. Variation quadratique d’une martingale locale 87
R +∞ R t∧τ R t∧τ
telle que 0 |dNs | ≤ n, en particulier |Nt | = 0 n dMs ≤ 0 n |dMs | ≤ n. D’après la
Proposition 5.11, N est alors une vraie martingale bornée.
Ensuite, soit t > 0 et soit 0 = t0 < t1 < · · · < tp = t une subdivision de [0, t]. Alors, avec
le Lemme 5.1, on a :
p p
X  X
E[Nt2 ]
 2 2
E (Nti − Nti−1 )2
 
= E Nti − Nti−1 =
i=1 i=1
"  p #  
X
≤ E sup Nti − Nti−1
|Nti − Nti−1 | ≤ nE sup Nti − Nti−1

1≤i≤p 1≤i≤p
i=1

en utilisant la Proposition 5.3. On applique l’inégalité précédente à une suite 0 = tk0 < tk1 <
· · · < tkpk = t de subdivisions de [0, t] de pas tendant vers 0. En utilisant la continuité des
trajectoires, et le fait que N est bornée par n (fixé dans cette partie de l’argument), on a
par convergence dominée :
 

lim E sup Ntki − Ntki−1 = 0.
k→+∞ 1≤i≤pk

2
On conclut alors que E[Nt2 ] = 0 c’est à dire E[Mt∧τ n
] = 0. En faisant ensuite tendre
n → +∞, comme τn → +∞, on obtient par le lemme de Fatou :
   
 2 2 2
 2 
E Mt = E lim Mt∧τn = E lim inf Mt∧τn ≤ lim inf E Mt∧τ n
= 0.
n→+∞ n→+∞ n→+∞

Finalement pour tout t ≥ 0, Mt = 0 ps. La martingale locale M admet donc 0 comme


version. Pour conclure, comme 0 et M sont à trajectoires continues, le processus M est en
fait indistinguable de 0. 

5.3 Variation quadratique d’une martingale locale


Le théorème ci-dessous définit le crochet (ou variation quadratique) d’une martingale locale.
Cette notion est clef dans le calcul stochastique qui va être développé dans la suite.

Théorème 5.2 (Crochet d’une martingale locale) Soit M = (Mt )t≥0 une martingale locale
à trajectoires continues.
1. Il existe un processus croissant, noté hM, M i = (hM, M it )t≥0 unique à indistingua-
bilité près, tel que
Mt2 − hM, M it (5.2)
est une martingale locale continue.
88 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

2. De plus, pour tout t > 0, si 0 = tn0 < tn1 < · · · < tnpn = t est une suite de subdivisions
emboı̂tées de [0, t] de pas tendant vers 0, on a, au sens de la convergence en probabilité,
pn
X 2
hM, M it = P- lim Mtni − Mtni−1 . (5.3)
n→+∞
i=1

Le processus hM, M i est appelé la variation quadratique ou crochet de M .

Remarque 5.6
— Pour les martingales, on a mieux : si M est une martingale de carré intégrable alors
Mt2 − hM, M it est une martingale aussi, cf. plus bas Théorème 5.3.
— Si M = B est un mouvement brownien, on a vu que hB, Bit = t, cf. Prop. 3.7.
— Pour la dernière assertion, il n’est pas nécessaire de supposer que les subdivisions
sont emboı̂tées.

Démonstration : L’unicité découle du Théorème 5.1. En effet, si A et A0 sont deux processus


croissants satisfaisant la condition (5.2), le processus At − A0t = (Mt2 − A0t ) − (Mt2 − At ) doit
être à la fois une martingale locale (car différence de martingales locales) et un processus
à variation finie (car différence de tels processus), ce qui exige sa nullité à indistinguabilité
près (cf. Th. 5.1).
Pour l’existence, on considère d’abord le cas où M0 = 0 et M est bornée. D’après la
Prop. 5.11, M est alors une vraie martingale. On se fixe t > 0 et 0 = tn0 < tn1 < · · · < tnpn = t
une suite de subdivisions emboı̂tées de [0, t] de pas tendant vers 0. Pour chaque n ≥ 1, on
considère le processus X (n) défini par
pn
X
Xs(n)

= Mtni−1 Mtni ∧s − Mtni−1 ∧s .
i=1

Lemme 5.2 Le processus X (n) est une martingale à trajectoires continues.


Démonstration : Le processus X est adapté et à trajectoires continues car la martingale
M l’est, il est intégrable car M est bornée. Pour la propriété de martingale, pour s ≤ r,
on a

E Xr(n) |Fs
 
pn
X  
= E Mtni−1 (Mtni ∧r − Mtni−1 ∧r ) |Fs
i=1
X  
= E Mtni−1 (Mtni ∧r − Mtni−1 ∧r ) |Fs
i:tn
i−1 ≤r
X   X  
= E Mtni−1 (Mtni ∧r − Mtni−1 ∧r ) |Fs + E Mtni−1 (Mtni ∧r − Mtni−1 ∧r ) |Fs
i:s≤tn
i−1 ≤r i:tn
i−1 ≤s≤r
5.3. Variation quadratique d’une martingale locale 89
X    X  
= E Mtni−1 E (Mtni ∧r − Mtni−1 ∧r ) |Fti−1 ]|Fs + Mtni−1 E (Mtni ∧r − Mtni−1 ∧r ) |Fs
i:s≤tn
i−1 ≤r i:tn
i−1 ≤s≤r
X   X
= E Mtni−1 (Mti−1 − Mti−1 ) |Fs + Mtni−1 (Mtni ∧s − Mtni−1 ∧s )
i:s≤tn n
≤r
| {z } i:t ≤s≤r
i−1 =0 i−1
X
= Mtni−1 (Mtni ∧s − Mtni−1 ∧s ) = Xs(n) .
i:tn
i−1 ≤s


On a ensuite :

(n)
Lemme 5.3 Les variables aléatoires Xt , n ≥ 1, vérifient une propriété de Cauchy dans
L2 :
 (n) (m) 
lim E (Xt − Xt )2 = 0.
n,m→+∞

Démonstration : Notons que, les subdivisions étant emboı̂tées, on peut écrire lorsque n ≤ m
pn pn
X X X
Mtni−1 (Mtni − Mtni−1 ) = Mtni−1 (Mtm
j
− Mtm
j−1
),
i=1 i=1 tm n m
j ∈]ti−1 ,ti ]
pm pn
X X X
Mtm
j−1
(Mtm
j
− Mtm
j−1
) = Mtnj−1 (Mtm
j
− Mtm
j−1
).
j=1 i=1 tm n m
j ∈]ti−1 ,ti ]

Avec des calculs (fastidieux. . . ) qui utilisent la propriété de martingale sous la forme du
Lemme 5.1, pour n ≤ m on a :
 (n) (m) 
E (Xt − Xt )2
 !2 
pn pm
X X
= E Mtni−1 (Mtni − Mtni−1 ) − Mtm
j−1
(Mtm
j
− Mtm
j−1
) 
i=1 j=1
 2 
pn pn
X X X X
= E  Mtni−1 (Mtm
j
− Mtm
j−1
)− Mtnj−1 (Mtm
j
− Mtm
j−1
) 
i=1 tm n m
j ∈]ti−1 ,ti ]
i=1 tm n m
j ∈]ti−1 ,ti ]

(les partitions sont emboı̂tées)


 2 
pn
X X
= E  (Mtni−1 − Mtmj−1
)(Mtm
j
− Mtm
j−1
) 
i=1 tm n n
j ∈]ti−1 ,ti ]
 2 
pn
X X
= E  (Mtni−1 − Mtm
j−1
)(Mtm
j
− Mtm
j−1
) 
i=1 tm n n
j ∈]ti−1 ,ti ]
90 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

car la propriété de martingale annule les termes croisés du carré de la somme : en effet
pour i1 < i2
  
X X
E  (Mtni −1 − Mtm
j −1
)(Mtm − Mtm
j j −1
) (Mtni −1 − Mtmj −1
)(Mtm
j
− Mtm
j −1
)
1 1 1 1 2 2 2 2
tm n n
j ∈]ti −1 ,ti ] tm n n
j ∈]ti −1 ,ti ]
1 1 1 2 2 2
  
X
= E E  (Mtni −1 − Mtm
j −1
)(Mtm
j
− Mtm
j −1
)
1 1 1 1
tm n n
j ∈]ti −1 ,ti ]
1 1 1
  
X
(Mtni −1 − Mtm )(Mtm − Mtm ) Ftni 

2 j −1 j 2 2 j2 −1 1
tm n n
j ∈]ti −1 ,ti ]
2 2 2
 
X
= E  (Mtni −1 − Mtm
j −1
)(Mtm
j
− Mtm
j −1
)
1 1 1 1
tm n n
j ∈]ti −1 ,ti ]
1 1 1
  
X
(Mtni −1 − Mtm )(Mtm − Mtm ) Ftni 

E  j −1 j j2 −1
2 2 2 1
tm n n
j2 ∈]ti2 −1 ,ti2 ]
 
X
= E  (Mtni −1 − Mtm
j −1
)(Mtm
j
− Mtm
j −1
)
1 1 1 1
tm n n
j1 ∈]ti1 −1 ,ti1 ]
 
X h i
E (Mtni −1 − Mtm )(Mtm − Mtm ) F Fti1
m n 
E j −1 j j2 −1
tj2 −1
2 2 2
tm n n
j2 ∈]ti2 −1 ,ti2 ]
 
X
= E  (Mtni −1 − Mtm
j −1
)(Mtm
j
− Mtm
j −1
)
1 1 1 1
tm n n
j ∈]ti −1 ,ti ]
1 1 1
 
X h i
(Mtni −1 − Mtm ) E (Mtm − Mtm ) Ftm Fti1  .
 n 
E j2 −1 j2 j2 −1 j2 −1
2
tm n n
j ∈]ti −1 ,ti ]
| {z }
2 2 2
=0

On a donc
 2 
pn
 (n) (m)
X X
E (Xt − Xt )2 =

E  (Mtni−1 − Mtm
j−1
)(Mtm
j
− Mtm
j−1
) 
i=1 tm n n
j ∈]ti−1 ,ti ]
pn h i
X X
2 2
= E (Mtni−1 − Mtm
j−1
) (M m
tj − M m
tj−1 ) (5.4)
i=1 tm n n
j ∈]ti−1 ,ti ]

car à nouveau la propriété de martingale annule les termes croisés du carré de la somme :
5.3. Variation quadratique d’une martingale locale 91

pour j1 < j2
h i
E (Mtni−1 − Mtm
j1 −1
)(M m
tj − M m
tj −1 )(M n
ti−1 − M m
tj −1 )(M m
tj − M m
tj −1 )
1 1 2 2 2
h h ii
= E E (Mtni−1 − Mtm )(M m − Mtm )(M − M )(M m − Mtm ) F
n m
m
j1 −1 t j1 j1 −1 ti−1 tj2 −1 t j2 j2 −1
tj2 −1
 
h i
= E (Mtni−1 − Mtm )(Mtm − Mtm )(Mtni−1 − Mtm ) E (Mtm − Mtm ) Ftm
 
j1 −1 j1 j1 −1 j2 −1 j2 j2 −1 j2 −1

| {z }
=0
= 0.

Et donc à partir de (5.4), on a


 (n) (m) 
E (Xt − Xt )2
  
pn
X X
≤ sup (Mtni−1 − Mtm )2  (Mtm − Mtm )2 
  
E  j−1 j j−1
i=1 tm n n tm n n
j ∈]ti−1 ,ti ]
j ∈]ti−1 ,ti ]
1≤i≤pn
  
pm
!
X
2
= E  sup (Mtni−1 − Mtm ) (Mtm − Mtm )2 
 
j−1 j j−1

tm n n
j ∈]ti−1 ,ti ] j=1
1≤i≤pn
 1/2 
pm
!2 1/2
X
≤ E sup (Mtni−1 − Mtm )4  (Mtm − Mtm )2 (5.5)
 
j−1
E j j−1

tm n n
j ∈]ti−1 ,ti ] j=1
1≤i≤pn
(par l’inégalité de Cauchy-Schwarz)

Comme M est à trajectoires continues, on a

lim sup (Mtni−1 − Mtm


j−1
)=0
n,n→+∞ tm ∈]tn ,tn ]
j i−1 i
1≤i≤pn

et comme M est bornée, disons par K :





sup (Mtni−1 − Mtm ) ≤ 2K

j−1
tm ∈]tn ,tn ]
j 1≤i≤p
i−1 i
n

si bien que, par convergence dominée, on a


 

lim sup (Mtni−1 − Mtm )4  = 0. (5.6)


 
E j−1
n,m→+∞ tm n n
j ∈]ti−1 ,ti ]
1≤i≤pn
92 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

Pour conclure, il suffit de montrer qu’il existe une constante C telle que
 !2 
pm
X
E (Mtm j
− Mtmj−1
)2  ≤ C. (5.7)
j=1

En effet, en combinant (5.5), (5.6) et (5.7), on aura


 (n) (m) 
lim E (Xt − Xt )2 = 0.
n,m→+∞

Pour voir (5.7) (avec C = 8K 4 ), on développe les carrés en utilisant le Lemme 5.1 :
 !2 
pm
X
E (Mtmj
− Mtmj−1
)2 
j=1
"p #
m
X X
= E (Mtm
j
− Mtm
j−1
)4 + 2 (Mtm
j
− Mtm
j −1
)2 (Mtm
j
− Mtm
j −1
)2
1 1 2 2
j=1 1≤j1 <j2 ≤pm
"p #
m h h ii
X X
≤ (2K)2 E (Mtm
j
− Mtm
j−1
)2 + 2 E E (Mtm
j
− M m
tj −1 )2
(M m
tj − M m
tj −1 )2
|F m
tj
1 1 2 2 1
j=1 1≤j1 <j2 ≤pm
pm h i h h ii
X X
2 2 2 2
≤ (2K) E (Mtj − Mtj−1 ) + 2
m m E (Mtj − Mtj −1 ) E (Mtj − Mtj −1 ) |Ftj
m m m m m
1 1 2 2 1
j=1 1≤j1 <j2 ≤pm

On estime les deux termes en utilisant le Lemme 5.1 : pour le premier terme, on a
pm h i Xpm h i
X
2 2 2
 2 2
E (Mtm
j
− M m
tj−1 ) = E M m
tj − Mtj−1 = E Mt ] ≤ K .
m

j=1 j=1

Puis h i h i
2 2 2
E (Mtm
j
− M m
tj −1 ) |F m
tj = E M m
tj − M m
tj −1 |F m
tj
2 2 1 2 2 1

si bien que
X h h ii
2 2
E (Mtm
j
− Mtm
j −1
) E (Mtm
j
− Mtm
j −1
) |Ftm
j
1 1 2 2 1
1≤j1 <j2 ≤pm
pm pm
" #
X X h i
= E (Mtm
j
− Mtm
j −1
)2 E Mt2m
j
− Mt2m
j
|Ftm
j
1 1 2 1 1
j1 =1 j2 =j1 +1
pm h h ii
X
2 2 2
= E (Mtm
j
− M m
tj −1 ) E Mt − M m
tj −1 |F m
tj
1 1 1 1
j1 =1
pm h i pm h i
X X
2 2 2 2 2
≤ E (Mtm
j
− M m
tj −1 ) (2K ) = (2K ) E Mtm
j
− Mtm
j −1
1 1 1 1
j1 =1 j1 =1
5.3. Variation quadratique d’une martingale locale 93

= (2K 2 )E Mt2 ≤ 2K 4 .
 

Finalement, 
pm
!2 
X
E (Mtm
j
− Mtm
j−1
)2  ≤ 8K 4 .
j=1

À partir du Lemme 5.2, l’inégalité de Doob (Proposition 4.8 avec p = q = 2) donne alors
h 2 i
lim E sup Xs(n) − Xs(m) = 0. (5.8)
n,m→+∞ s≤t

On peut alors extraire une sous-suite (nk )k≥0 telle que


h i
(nk+1 ) 2
(nk )
E sup Xs − Xs ≤ 2−2k .
s≤t

Avec l’inégalité de Cauchy-Schwarz, il vient alors


" +∞ # +∞  1/2 X+∞
X X
2−k < +∞.
(n ) (n )
(n ) (n ) 2
E sup Xs k − Xs k+1 ≤ E sup(Xs k − Xs k+1 ) ≤
s≤t s≤t
k=1 k=1 k=0

On en déduit que ps
+∞
X
sup Xs(nk ) − Xs(nk+1 ) < +∞.
s≤t
k=1
(n ) 
Presque sûrement, la suite Xs k s∈[0,t] converge donc uniformément sur [0, t] vers une
limite qu’on note (Ys )s∈[0,t] . Sur l’ensemble négligeable où il n’y a pas la convergence, on
impose Ys ≡ 0. Le processus limite (Ys )s∈[0,t] a alors des trajectoires continues.
(n)
Comme d’après (5.8) (Xs )s∈[0,t] est une suite de Cauchy dans L2 , on a aussi la convergence
(n)
Xs → Ys dans L2 quand n → +∞. En passant à la limite L2 dans l’égalité de martingale
pour X (n) aux dates s et r,

Xs(n) = E Xr(n) |Fs , s ≤ r,


 

on voit alors que Y est une martingale sur [0, t] :


 
Ys = E Yr |Fs , s ≤ r.

Finalement, X (nk ) converge ps uniformément sur [0, t] vers un Y = (Ys )0≤s≤t qui est à
trajectoires continues. Le processus Y est donc une martingale continue.
94 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

Puis par un calcul simple, pour tout n ≥ 1 et j ∈ {1, . . . , pn }, on a

j
X
Mt2nj − 2Xtnnj = (Mtni − Mtni−1 )2 . (5.9)
i=1

(n) Pj
Mtni−1 Mtni − Mtni−1 = ji=1 Mtni−1 Mtni − Mt2ni−1 et donc
 P
En effet Xtnj = i=1

j j
(n)
X X
Mt2nj − 2Xtnj = Mt2nj +2 Mt2ni−1 −2 Mtni−1 Mtni
i=1 i=1
j j j
X X X
= Mt2ni + Mt2ni−1 −2 Mtni−1 Mtni
i=1 i=1 i=1
j
X
Mt2ni + Mt2ni−1 − 2Mtni−1 Mtni

=
i=1
j
X 2
= Mtni − Mtni−1 .
i=1

Le processus M 2 − 2X (n) est donc croissant le long de la subdivision {tni : 0 ≤ i ≤ pn }.


En passant à la limite avec la sous-suite nk → +∞ trouvée précédemment (pour laquelle
il y a convergence presque sûre), par continuité, la fonction s ∈ [0, t] 7→ Ms2 − 2Ys est ps
croissante sur [0, t].
On pose alors, pour s ∈ [0, t], hM, M is = Ms2 − 2Ys (avec, par convention, hM, M is ≡ 0
sur l’ensemble de probabilité nulle où la fonction t 7→ Mt2 − 2Yt n’est pas croissante).
Ainsi, hM, M i est un processus croissant et Ms2 − hM, M is = 2Ys est une martingale, sur
l’intervalle de temps [0, t].
Rappelons que t est fixé depuis le début de l’argument. Pour étendre la définition de
hM, M is à tout s ∈ R+ , on applique ce qui précède avec t = k pour tout entier k ≥ 1 et on
note A(k) le processus ainsi construit. Par unicité (à l’indistinguabilité près), on remarque
que le processus obtenu avec t = k doit être la restriction à [0, k] de celui obtenu avec
(k+1)
t = k + 1 : A(k) = A . On définit alors un processus hM, M it , t ≥ 0, croissant vérifiant
[0,k]
(5.2) en prenant
(k)
hM, M it = At pour k ≥ t.
L’égalité des restrictions des A(k) assure la cohérence de la définition ci-dessus. De plus,
hM, M i ainsi construit est même une martingale L2 sur R+ .

La partie unicité montre aussi que le processus hM, M i = hM, M it t≥0 ne dépend pas de
la suite de subdivisions choisies pour le construire. On déduit alors de (5.9) (avec j = pn )
5.3. Variation quadratique d’une martingale locale 95

que pour tout t > 0, pour n’importe quelle suite de subdivisions emboı̂tées de [0, t] de pas
tendant vers 0, on a
pn
X
2
L - lim (Mtnj − Mtnj−1 )2 = hM, M it
n→+∞
j=1

dans L2 . Cela achève la preuve du théorème dans le cas borné.


Considérons maintenant une martingale locale générale qu’on écrit sous la forme Mt =
M0 + Nt . On a donc Mt2 = M02 + 2M0 Nt + Nt2 .
On remarque que (M0 Nt )t≥0 est une martingale locale. En effet, en notant Tn la suite qui
réduit la martingale locale N et Sn = inf n ≥ 0 : |M0 Nt | ≥ n , alors Sn est un temps
d’arrêt (M0 Nt est adaptée) et Sn % +∞ (continuité de t 7→ M0 Nt , comme en Prop. 5.12).
Tn ∧Sn
Comme M0 Nt t≥0 est bornée et vérifie la propriété de martingale, (M0 Nt )t≥0 est bien
une martingale locale réduite par la suite de temps d’arrêt Tn ∧ Sn .
Sans perte de généralité, on suppose donc que M0 = 0 et on pose alors

Tn = inf t ≥ 0 : |Mt | ≥ n ,
et on applique le résultat vu dans le cas borné aux martingales bornées M Tn . Notons
(n+1)
A(n) = hM Tn , M Tn i le processus associé à M Tn . D’après l’unicité, les processus At∧Tn et
(n)
At sont indistinguables. On en déduit qu’il existe un processus croissant A tel que, pour
(n)
tout n ≥ 1, At∧Tn et At sont indistinguables. De plus, par construction du cas borné,
2
Mt∧T n
− At∧Tn = (Mt2 − At )Tn est une martingale, c’est à dire Mt2 − At est une martingale
locale pusique Tn % +∞.
On prend alors hM, M it = At et cela termine la preuve de la partie existence.
Enfin, la deuxième partie du théorème reste vraie dans le cas d’une martingale locale : en
effet, si on remplace M et hM, M it par M Tn et hM Tn , M Tn it = hM, M iTt n (en anticipant la
proposition suivante), alors le cas borné assure :
pn
X 2
hM, M it∧Tn = P- lim MtTnin − MtTni−1
n
n→+∞
i=1

(même avec convergence dans L2 plutôt qu’en probabilité). On conclut en observant que,
pour tout t > 0, on a P(t ≤ Tn ) → 1, quand n → +∞, ce qui affaiblit la convergence L2
en une convergence en probabilité : soit ε > 0, posons
( pn
)
X
An (ε) = hM, M it − (Mtni − Mtni−1 )2 ≥ ε


i=1
   
alors P An (ε) = P An (ε), t ≤ Tn + P An (ε), Tn < t avec P An (ε), Tn < t ≤ P(Tn <
t) → 0 et
( pn
)
X
An (ε) ∩ {t ≤ Tn } = hM, M it∧Tn − (MtTnin − MtTni−1
n
)2 ≥ ε ∩ {t ≤ Tn }.


i=1
96 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

Il vient
pn
!
X
(MtTnin − MtTni−1 )2 ≥ ε = 0

lim P An (ε) ≤ lim P(Tn < t)+ lim P hM, M it∧Tn − n

n→+∞ n→+∞ n→+∞
i=1

Ppn 2
ie. P- limn→+∞ i=1 Mtni − Mtni−1 = hM, M it . 

Proposition 5.13 (Crochet et arrêt) Si T est un temps d’arrêt, alors on a

hM T , M T it = hM, M iTt .

Démonstration : Cela vient de ce que

(MtT )2 − hM, M iTt = Mt∧T


2
− hM, M it∧T = (M 2 − hM, M i)Tt

est une martingale locale comme martingale locale arrêtée. Par conséquent le crochet ar-
rêté hM, M iT vérifie la propriété/définition de hM T , M T i du Théorème 5.2. Par unicité du
crochet, on doit avoir hM T , M T i = hM, M iT à indistinguabilité près. 

Le théorème suivant montre comment les propriétés d’une martingale locale M sont liées à
celles de sa variation quadratique hM, M i. Ainsi, les intervalles sur lesquels M est constante
sont exactement ceux sur lesquels hM, M i est constant. Si A est un processus croissant, on
note A∞ la limite croissante de At quand t → +∞.

Théorème 5.3 Soit M une martingale locale (continue) avec M0 = 0.


 
1. Si M est une (vraie) martingale bornée dans L2 , alors E hM, M i∞ < +∞, et Mt2 −
hM, M it est une martingale uniformément intégrable.
 
2. Réciproquement, si E hM, M i∞ < +∞, alors M est une (vraie) martingale bornée
dans L2 (donc uniformément intégrable).
3. Il y a équivalence entre :
 
(a) M est une (vraie) martingale de carré intégrable (ie. E Mt2 < +∞ pour tout
t ≥ 0).
 
(b) E hM, M it < +∞ pour tout t ≥ 0.
De plus si ces conditions sont satisfaites, Mt2 − hM, M it est une martingale.

Remarque 5.7 Dans la partie 1) de l’énoncé, il est essentiel de supposer que M est une
martingale, et pas seulement une martingale locale car on utilise l’inégalité de Doob et elle
n’est pas valable pour une martingale locale.
5.3. Variation quadratique d’une martingale locale 97

Démonstration : 1) Si M est une martingale (continue) bornée dans L2 , l’inégalité de Doob


(Proposition 4.8 avec p = q = 2) assure
h i
E sup Mt2 ≤ 4 sup E Mt2 < +∞.
 
t≥0 t≥0

En particulier, M est une martingale uniformément intégrable qui converge (ps et, par
convergence dominée, dans L2 ) vers une limite M∞ ∈ L2 quand t → +∞. Pour tout entier
n ≥ 1, on pose 
Sn = inf t ≥ 0 : hM, M it ≥ n .
Alors Sn est un temps d’arrêt et hM, M it∧Sn ≤ n. On en déduit que la martingale locale
2
Mt∧S n
− hM, M it∧Sn est dominée par la variable intégrable n + supt≥0 Mt2 . D’après la Pro-
position 5.11, cette martingale locale est donc une vraie martingale. Comme elle est nulle
en 0, la propriété de martingalen assure
 2   2 
E Mt∧S n
− hM, M it∧Sn = E M0∧S n
− hM, M i0∧Sn = 0,

soit    2 
E hM, M it∧Sn = E Mt∧Sn
.
En faisant tendre t → +∞ (avec le théorème de convergence monotone pour le terme de
gauche, le théorème de convergence dominée pour celui de droite), on trouve

E hM, M iSn = E MS2n .


   

Puis comme Sn % +∞, en faisant tendre n → +∞, on trouve de la même façon (conver-
gences monotone et dominée)
   2
E hM, M i∞ = E M∞ < +∞.

De plus comme la martingale locale Mt2 − hM, M it est dominée par la variable intégrable
supt≥0 Mt2 +hM, M i∞ , c’est donc une (vraie) martingale uniformément intégrable (toujours
par la Prop. 5.11)).
  
2) On suppose maintenant E hM, M i∞ < +∞. Avec Tn = inf t ≥ 0 : |Mt | ≥ n ,
M Tn est bornée donc c’est une vraie martingale bornée. De plus, la martingale locale
2
Mt∧T n
− hM, M iTt n est aussi une vraie martingale uniformément intégrable, car elle est
dominée par la variable aléatoire intégrable n2 + hM, M i∞ (cf. encore Prop. 5.11)).
Soit S un temps d’arrêt fini ps. D’après le Théorème 4.4 (théorème d’arrêt), appliqué à la
martingale uniformément intégrable Mt∧T 2
n
− hM, M iTt n avec S ≥ 0, on a
 2   
E MS∧T n
= E hM, M iS∧Tn .

Par le lemme de Fatou, on a alors (en utilisant S fini ps) :

E MS2 = E lim inf MS∧T


2
     2     
n
≤ lim inf E MS∧T n
= lim inf E hM, M iS∧Tn ≤ E hM, M i∞ .
n n n
98 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

La famille {MS : S temps d’arrêt fini} est donc bornée dans L2 et par conséquent unifor-
mément intégrable. En particulier avec la suite
 des temps d’arrêt bornés Tn , en passant à
1 Tn
la limite L quand n → +∞ dans l’égalité E Mt∧Tn |Fs = Ms (pour s ≤ t) on en déduit
que M est une vraie martingale. De plus, M est bornée dans L2 car {Ms , s ≥ 0} est une
sous-famille de {MS : S temps d’arrêt fini} qui est bornée dans L2 .
 
3) Soit a > 0. D’après 1) et 2), on a E hM, M ia < +∞ si et seulement si Mta est une vraie
martingale de carré intégrable. L’équivalence de (a) et (b) suit alors facilement. Enfin, si
2
ces conditions sont remplies, 1) montre que Mt∧a − hM, M it∧a est une vraie martingale, ce
qui prouve le 3) car a est quelconque et peut être choisi arbitrairement grand. 

Corollaire 5.1 Soit M une martingale locale continue telle que M0 = 0. Alors on a hM, M it =
0 ps pour tout t ≥ 0 si et seulement si M est indistinguable de 0.

Démonstration : Supposons hM, M it = 0 ps pour tout t ≥ 0. D’après les parties 1) et


2) du théorème ci-dessus, Mt2 est une martingale uniformément intégrable, d’où E[Mt2 ] =
E[M02 ] = 0. Le processus nul est une modification de M . Commes les deux sont à trajec-
toires continues, ils sont indistingables. 

Crochet de deux martingales locales


Si M et N sont deux martingales locales, on définit leur crochet par polarisation en posant :

1 
hM, N it = hM + N, M + N it − hM, M it − hN, N it .
2

Proposition 5.14
1. hM, N i est l’unique (à indistinguabilité près) processus à variation finie tel que Mt Nt −
hM, N it soit une martingale locale.
2. Si 0 = tn0 < tn1 < · · · < tnpn = t est une suite de subdivisions emboı̂tées de [0, t] de pas
tendant vers 0, on a, au sens de la convergence en probabilité,
pn
X
P- lim (Mtni − Mtni−1 )(Ntni − Ntni−1 ) = hM, N it .
n→+∞
i=1

3. L’application (M, N ) 7→ hM, N i est bilinéaire symétrique.


4. (arrêt) Pour tout temps d’arrêt T ,

hM T , N T it = hM T , N it = hM, N it∧T . (5.10)


5.3. Variation quadratique d’une martingale locale 99

Démonstration : 1) découle de la caractérisation analogue dans le Théorème 5.2 avec la


polarisation du produit réel (et l’unicité découle du Théorème 5.1).
2) est de même une conséquence de l’affirmation analogue dans le Théorème 5.2 par pola-
risation.
3) découle, par exemple, de l’expression 2).
Enfin, on peut voir 4) comme une conséquence de la propriété 2), en observant que cette
propriété entraı̂ne ps
hM T , N T it = hM T , N it = hM, N it sur {T ≥ t},
hM T , N T it − hM T , N T is = hM T , N it − hM T , N is = 0 sur {T ≤ s < t}.


Proposition 5.15 Soit M1 , M2 deux martingales locales à trajectoires continues issues de


0. On a M1 = M2 (à indistinguabilité près) si et seulement si pour toute martingale locale
N , on a hM1 , N i = hM2 , N i.
Démonstration : Il suffit de choisir N = M1 − M2 pour avoir hM1 − M2 , M1 − M2 i = 0,
c’est à dire M1 − M2 est constante donc nulle. 

Le résultat suivant est une sorte de généralisation de l’inégalité de Cauchy-Schwarz aux


intégrales par rapport à un crochet de martingales locales.
Proposition 5.16 (Inégalité de Kunita-Watanabe) Soit M et N deux martingales locales
et H et K deux processus progressivement mesurables. Alors pour tout t ≥ 0 :
Z t Z t 1/2 Z t 1/2
2 2
|Hs | |Ks | |dhM, N is | ≤ Hs dhM, M is Ks dhN, N is . (5.11)
0 0 0

Conséquence : Avec H = K = 1, on a |hM, N i|2 ≤ hM, M ihN, N i.


Démonstration : Par le théorème de convergence monotone, il suffit de voir le résultat
pour H, K processus mesurables bornés. Quitte à remplacer K par gKsgn(HK), où g =
d(hM, N i)/d|hM,
R +∞ N i| est la densité de Radon-Nikodym à valeurs dans {−1, +1}, on peut
R +∞
remplacer 0 |Hs | |Ks | |dhM, N is | à gauche dans (5.11) par 0 Hs Ks dhM, N is .
Notons hM, N is,t = hM, N it −hM, N is . On commence par remarquer que presque sûrement
pour tous s < t rationnels (donc aussi par continuité pour tous s < t) on a
q q
|hM, N is,t | ≤ hM, M is,t hN, N is,t . (5.12)

En effet, cela découle des approximations en probabilité de hM, M i et hM, N i données


respectivement dans le Théorème 5.2 et la Proposition 5.14, ainsi que de l’inégalité de
Cauchy-Schwarz (classique pour les sommes) :
pn
!2 pn pn
X X X
2
(Mtni − Mtni−1 )(Ntni − Ntni−1 ) ≤ (Mtni − Mtni−1 ) (Ntni − Ntni−1 )2
i=1 i=1 i=1
100 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

où (tni )i=1,...,n est une partition de [t, s]. À la limite n → +∞, on obtient bien (5.12).
Dans la suite on fixe un ω ∈ Ω pour lequel (5.12)
R t est vraie pour tout s < t et on raisonne
pour ce ω presque sûr. L’interprétation de s |dhM, N iu | comme variation finie par la
Proposition 5.3 donne aussi
Z t q q
|dhM, N iu | ≤ hM, M is,t hN, N is,t . (5.13)
s

En effet, pour une subdivision s = t0 < t1 < · · · < tp = t, on a


p p q q
X X
|hM, N iti−1 ,ti | ≤ hM, M iti−1 ,ti hN, N iti−1 ,ti
i=1 i=1
p
!1/2 p
!1/2
X X
≤ hM, M iti−1 ,ti hN, N iti−1 ,ti
i=1 i=1
q q
≤ hM, M is,t hN, N is,t .

Soit maintenant H, K des processus progressifs simples. Quitte à raffiner les partitions
définissant H et K, on peut trouver 0 = t0 < t1 < · · · < tn < +∞ et h0 , . . . , hn , k0 , . . . , kn
telles que hi , ki ∈ L∞ (Fti ), et pour lesquels
n−1
X n−1
X
H = h0 1{0} + hi 1]ti ,ti+1 ] , K = k0 1{0} + ki 1]ti ,ti+1 ] .
i=0 i=0

On a alors
Z t n−1 Z ti+1 n−1 Z ti+1
X X
Hs Ks dhM, N is =

hi k i dhM, N is

≤ |hi | |ki | dhM, N i s


0
i=0 ti
i=0 ti
n−1
X Z ti+1 1/2 Z ti+1 1/2
≤ |hi | |ki | dhM, M is dhN, N is
i=0 ti ti
n−1 Z ti+1
X 1/2 Z ti+1 1/2
= h2i dhM, M is ki2 dhN, N is
i=0 ti ti

n−1 Z
!1/2 n−1 Z
!1/2
X ti+1 X ti+1
≤ h2i dhM, M is ki2 dhN, N is
i=0 ti i=0 ti
Z t 1/2 Z t 1/2
= Hs dhM, M is Ks dhN, N is .
0 0

Quand H et K sont des processus progressifs bornés, on peut les approximer par deux
suites de processus simples (Hn )n≥1 et (Kn )n≥1 qui convergent vers H et K en restant
bornées. On conclut alors par le théorème de convergence dominée. 
5.4. Semimartingales continues 101

5.4 Semimartingales continues


Les semimartingales forment la classe la plus générale de processus considérés pour construire
une intégrale stochastique.
Définition 5.6 (Semimartingale) Un processus X = (Xt )t≥0 est une semimartingale conti-
nue s’il s’écrit sous la forme Xt = X0 + Mt + At où M est une martingale locale (issue de
0) et A est un processus à variation finie.
Toujours grâce au Théorème 5.1, la décomposition ci-dessus est unique à indistinguabilité
près. Si Yt = Y0 + Mt0 + A0t est une autre semimartingale continue, on pose par définition
hX, Y it := hM, M 0 it .
En particulier, hX, Xit = hM, M it .

Proposition 5.17 Soit X, Y deux semimartingales et 0 = tn0 < tn1 < · · · < tnpn = t une suite
de subdivisions emboı̂tées de [0, t] de pas tendant vers 0. Alors, au sens de la convergence
en probabilité :
pn
X  
P- lim Xtni − Xtni−1 Ytni − Ytni−1 = hX, Y it .
n→+∞
i=1

Remarque 5.8 En particulier, si X ou Y est à variation bornée, alors hX, Y i ≡ 0. En effet,


si par exemple X est à variation bornée, on a
p pn
X n X
(Xtni − Xtni−1 )(Ytni − Ytni−1 ) ≤ |Xtni − Xtni−1 | sup |Ytni − Ytni−1 |

i=1,...,pn
i=1 i=1
 Z t
≤ sup |Ytni − Ytni−1 | |dXs | → 0
i=1,...,pn 0
Rt
car 0 |dXs | est bornée (processus à variations bornées) et supi=1,...,pn |Ytni − Ytni−1 | → 0 par
continuité des trajectoires de Y .

Démonstration : Pour simplifier, on suppose X = Y . Le cas général s’obtient ensuite


facilement par polarisation. Alors,
pn pn pn
X 2 X 2 X 2
X −X
tn
i tn
i−1
= M −M tn
i tn
i−1
+ Atni − Atni−1
i=1 i=1 i=1
pn
X 
+2 Mtni − Mtni−1 )(Atni − Atni−1 .
i=1

Le Théorème 5.2 donne déjà pour la martingale locale M :


pn
X 2
lim Mtni − Mtni−1 = hM, M it = hX, Xit .
n→+∞
i=1
102 Chapitre 5. ©JCB – M2 Math. – Université de Rennes 1

Puis comme A est à variation finie (et M est continue), la Remarque 5.8 s’applique pour
donner
pn
X 
lim Mtni − Mtni−1 )(Atni − Atni−1 = hM, Ait = 0,
n→+∞
i=1
pn
X 2
lim Atni − Atni−1 = hA, Ait = 0.
n→+∞
i=1

Les principaux résultats d’intégration contre un crochet de martingales locales restent vrais
contre un crochet de semimartingales, en particulier :

Proposition 5.18 (Inégalité de Kunita-Watanabe) Soit X, Y deux semimartingales et H, K


deux processus localement bornés (pour tout t, sups≤t |Hs | < +∞, idem pour K). Alors ps
pour t ≥ 0 :
Z +∞ Z +∞ 1/2 Z +∞ 1/2
|Hs | |Ks | |dhX, Y is | ≤ Hs2 dhX, Xis Ks2 dhY, Y is .
0 0 0
Troisième partie

Intégration stochastique

103
Chapitre 6

Intégration stochastique

On considère à nouveau dans ce chapitre un espace de probabilité filtré (Ω, F, (Ft )t≥0 , P)
muni d’une filtration (Ft )t≥0 satisfaisant les conditions habituelles. Le but est de construire
une théorie de l’intégration contre les processus stochastiques. La bonne classe de processus
à considérer est celle des semimartingales (à trajectoires continues) introduites dans le
Chapitre 5.
On commence par intégrer par rapport à des martingales (à trajectoires continues) bornées
dans L2 en Section 6.1, cette construction est fondée sur une théorie L2 . On étend cette
construction par propriété d’arrêt en Section 6.2 à des martingales locales à trajectoires
continues. On achève la construction en Section 6.3 avec l’intégration contre des semimar-
tingales. On conclut le chapitre par quelques commentaires sur le cas des semimartingales
non continues en Section 6.4.

6.1 Par rapport à une martingale bornée dans L2


Définition 6.1 (Espace Hc2 ) On note Hc2 l’espace des martingales M (à trajectoires conti-
nues) bornées dans L2 (Ω) et telles que M0 = 0.
Le Théorème 5.3 montre qu’on a E[hM, M i∞ ] < +∞ pour M ∈ Hc2 . D’après la Proposi-
tion 5.16 (inégalité de Kunita-Watanabe), si M, N ∈ Hc2 on a E[|hM, N i∞ |] < +∞. En
effet :
Z +∞ 
E[|hM, N i∞ |] ≤ E |dhM, N is | ≤ E[hM, M i∞ ]1/2 E[hN, N i∞ ]1/2 < +∞.
0

On définit alors un produit scalaire sur Hc2 par (M, N )Hc2 := E[hM, N i∞ ] et on note k · kHc2
la norme sur Hc2 associée à ce produit scalaire :
1/2  1/2
kM kHc2 = (M, M )Hc2 = E hM, M i∞ .
D’après le Corollaire 5.1, en identifiant les processus indistinguables, on a bien une norme
car (M, M )Hc2 = 0 si et seulement si M = 0 (ie. le produit scalaire considéré est bien défini
positif).

105
106 Chapitre 6. ©JCB – M2 Math. – Université de Rennes 1

Proposition 6.1 L’espace Hc2 muni du produit scalaire (M, N )Hc2 est un espace de Hilbert.

Démonstration : Il s’agit de vérifier que Hc2 est complet pour la norme k · kHc2 . Pour cela,
on considère une suite de Cauchy (M n )n≥0 pour cette norme : d’après le Théorème 5.3,
(M n −M m )2 −hM n −M m , M n −M m i est une martingale uniformément intégrable. L’égalité
de martingale assure

E (M n − M m )2t − hM n − M m , M n − M m it
 

= E (M n − M m )20 − hM n − M m , M n − M m i0 = 0
 

c’est à dire

E (M n − M m )2t = E hM n − M m , M n − M m it
   

≤ E hM n − M m , M n − M m i∞ .
 

Par la propriété de Cauchy de la suite (M n )n≥0 pour Hc2 , on a donc

lim sup E (Mtn − Mtm )2 = lim E hM n − M m , M n − M m i∞ = 0.


   
m,n→+∞ t≥0 m,n→+∞

L’inégalité de Doob (Prop. 4.8) donne alors


 
n m 2
sup E (Mtn − Mtm )2 = 0.
 
lim E sup(Mt − Mt ) ≤ lim
m,n→+∞ t≥0 m,n→+∞ t≥0

On peut alors extraire une sous-suite (nk )k≥0 telle que pour tout k ≥ 0
 1/2
nk nk+1 2 1
E sup(Mt − Mt ) ≤ k.
t≥0 2

Avec l’inégalité de Cauchy-Schwarz, on a alors


" +∞ # +∞  1/2 X+∞
X n n
k+1
X nk nk+1 2 1
E sup Mt − Mt
k
≤ E sup(Mt − Mt ) ≤ < +∞.
k=0
t≥0
k=0
t≥0
k=0
2k

On en déduit que ps
+∞
n
X
sup Mtnk − Mt k+1 < +∞.

t≥0
k=0

Presque sûrement, la suite (Mtnk )t≥0 est de Cauchy dans C 0 (R+ , R) muni de k · k∞ et donc
elle converge uniformément sur R+ vers une limite qu’on note (Mt )t≥0 . Sur l’ensemble né-
gligeable où il n’y a pas convergence, on impose Mt ≡ 0. Le processus limite (Mt )t≥0 a alors
des trajectoires continues. Comme, pour chaque t ≥ 0, la suite (Mtnk )k≥0 est évidemment
de Cauchy dans L2 (Ω), (Mtnk )k≥0 converge aussi dans L2 (Ω) vers Mt pour tout t ≥ 0. On
peut donc passer à la limite (dans L1 (Ω)) dans la propriété de martingale de (Mtnk )t≥0 et
6.1. Par rapport à une martingale bornée dans L2 107

on obtient celle de (Mt )t≥0 qui est donc aussi une martingale. La suite M n étant de Cauchy
dans Hc2 , elle est bornée dans Hc2 pour k · kHc2 , on a alors pour tout n ≥ 1, t ≥ 0

E (Mtn )2 = E hM n , M n it ≤ E hM n , M n i∞ = kM n kHc2 ≤ sup kM n kHc2


     
n≥0

 
soit supn supt≥0 E (Mtn )2 < +∞. Les variables aléatoires Mtn , n ≥ 1, t ≥ 0, sont donc
uniformément bornées dans L2 (Ω). Par conséquent, la martingale M est aussi bornée dans
L2 (Ω), ce qui assure M ∈ Hc2 . Enfin, comme (M − M nk )2 − hM − M nk , M − M nk i est une
martingale convergente (lorsque k → +∞), on a

lim E hM nk − M, M nk − M i∞ = lim E (M∞


 n
− M∞ )2 = 0,
  
k
k→+∞ k→+∞

ce qui montre que la sous-suite (M nk )k≥0 converge vers M dans Hc2 . Finalement, comme la
suite de Cauchy (M n )n≥0 a une sous-suite convergeant vers M , elle converge entièrement
vers M dans Hc2 . 

Rappelons que Prog désigne la tribu progressive sur R+ × Ω (Déf. 4.3) et que les processus,
vus comme fonctions sur (R+ × Ω, Prog) sont appelés progressifs.

Définition 6.2 (Espace L2 (M )) Pour M ∈ Hc2 , on note

L2 (M ) = L2 R+ × Ω, Prog, dP ⊗ dhM, M i


l’espace des processus progressifs H = (Hs )s≥0 tels que


Z +∞ 
2
E Hs dhM, M is < +∞.
0

L’espace L2 (M ) est un espace de Hilbert pour le produit scalaire


Z +∞ 
(H, K)L2 (M ) = E Hs Ks dhM, M is .
0

Définition 6.3 (Processus simple) On note S le sous-espace vectoriel de L2 (M ) formé des


processus H (dits simples) de la forme
p−1
X
Hs (ω) = H(i) (ω)1]ti ,ti+1 ] (s) (6.1)
i=0

où 0 < t0 < t1 < t2 < · · · < tp et pour chaque 0 ≤ i ≤ p, H(i) est une variable aléatoire
Fti -mesurable et bornée.

Proposition 6.2 (Densité) Pour tout M ∈ Hc2 , l’espace S est dense dans L2 (M ).
108 Chapitre 6. ©JCB – M2 Math. – Université de Rennes 1

Démonstration : Il suffit de montrer que si K ∈ L2 (M ) est orthogonal à S alors K = 0.


Supposons donc K orthogonal à S. Soient 0 ≤ s < t et soit F une variable aléatoire
Fs -mesurable bornée. Avec H = F 1]s,t] ∈ S, on a
 Z t 
E F Ku dhM, M iu = (H, K)L2 (M ) = 0. (6.2)
s

En posant Z t
Xt = Ku dhM, M iu , t ≥ 0,
0
 
l’égalité (6.2) se réécrit E F (Xt − Xs ) = 0 pour tous s < t et toute variable aléatoire
Fs -mesurable F bornée, ie. X = (Xt )t≥0 est en fait une martingale car en plus Xt ∈ L1 (Ω)
pour tout t ≥ 0, l’intégrale définissant Xt étant ps absolument convergente lorsque M ∈ Hc2
et K ∈ L2 (M ) (appliquer par exemple l’inégalité de Cauchy-Schwarz).
D’autre part, par la Proposition 5.5, X étant une intégrale contre un processus croissant
est aussi un processus à variation finie avec X0 = 0. Le Théorème 5.1 exige alors d’avoir
X = 0, ie. Z t
Ku dhM, M iu = 0 ∀t ≥ 0 ps.
0
Rt R
Comme 0 = 0 Ku dhM, M iu = R Ku 1[0,t] (u) dhM, M iu , Ku dhM, M iu coı̈ncide avec la
mesure nulle sur la famille des intervalles [0, t], donc par un argument de classe monotone
sur tout B(R+ ), c’est à dire K est ps orthogonal à L2 (M ) ou encore K = 0 dans L2 (M ).
Cela établit la densité de S dans L2 (M ). 

Définition 6.4 Soient M ∈ Hc2 et H ∈ S de la forme (6.1). On définit H · M par


p−1
X
(H · M )t = H(i) (Mti+1 ∧t − Mti ∧t ).
i=0

Proposition 6.3 Soient M ∈ Hc2 et H ∈ S. On a H · M ∈ Hc2 et pour tout N ∈ Hc2 :


Z t
hH · M, N it = Hs dhM, N is = H · hM, N it . (6.3)
0

Remarque 6.1 — En général, on utilise la notation intégrale :


Z t
(H · M )t = Hs dMs .
0

— L’intégrale H · hM, N i qui figure dans le terme de droite de (6.3) est une intégrale
de Stieltjes par rapport à un processus à variation finie hM, N i, comme défini dans
la Section 5.1.4.
6.1. Par rapport à une martingale bornée dans L2 109

(i) (i)
Démonstration : Pour H ∈ S de la forme (6.1), on écrit H · M = p−1
P
i=0 Mt où Mt :=
(i)
H(i) (Mti+1 ∧t − Mti ∧t ). On commence par observer que (Mt )t≥0 est une martingale pour
chaque 0 ≤ i ≤ p − 1. En effet : pour s ≤ t,
— si s ≥ ti :
 (i)    
E Mt |Fs ] = E H(i) (Mti+1 ∧t − Mti ∧t )|Fs = H(i) E (Mti+1 ∧t − Mti ∧t )|Fs
= H(i) (Mti+1 ∧s − Mti ∧s ) = Ms(i) ;

— puis si s < ti :
 (i)    
E Mt |Fs ] = E H(i) (Mti+1 ∧t − Mti ∧t ) Fs = E E[H(i) (Mti+1 ∧t − Mti ∧t )|Fti ]|Fs
   
= E H(i) E (Mti ∧t − Mti ∧t )|Fti Fs
= 0 = Ms(i) .
(i) (i) Pp−1 (i)
On a donc E[Mt |Fs ] = Ms pour tout t ≥ s et H ·M = i=0 M est bien une martingale.
De plus, comme H est bornée et M ∈ Hc2 , on a aussi H · M ∈ Hc2 .
Pour la deuxième partie, d’abord, si H = H(i) 1]ti ,ti+1 ] , comme M N − hM, N i est une
martingale (car martingale locale bornée dans L2 d’après la Prop. 5.14), alors

M ti+1 N − hM, N iti+1 et M ti N − hM, N iti

sont des martingales. Par conséquent la différence

(M ti+1 − M ti )N − (hM, N iti+1 − hM, N iti )

est aussi une martingale. Comme cette martingale est nulle en t ≤ ti et comme H(i) ∈ Fti

H(i) M ti+1 − M ti N − H(i) hM, N iti+1 − hM, N iti


 


est encore une martingale puis en sommant sur 0 ≤ i ≤ p − 1, (H · M )N − 0 Hs dhM, N is
reste aussi une martingale. D’après la Prop. 5.14, on identifie le crochet de (H · M ) et de
N :
h(H · M ), N i = H · hM, N i.
Noter en particulier que hH · M, H · M i = H 2 · hM, M i. 

Théorème 6.1 (Existence de l’intégrale stochastique L2 ) Soit M ∈ Hc2 . L’application H ∈


S 7→ H · M s’étend en une isométrie de L2 (M ) dans Hc2 . De plus,
1. la martingale H · M est caractérisée par la relation

hH · M, N i = H · hM, N i, ∀N ∈ Hc2 ; (6.4)

2. puis, si T est un temps d’arrêt, on a une propriété d’arrêt :

(1[0,T ] H) · M = (H · M )T = H · M T . (6.5)
110 Chapitre 6. ©JCB – M2 Math. – Université de Rennes 1

Avec des notations intégrales, cette dernière propriété s’écrit de façon naturelle :
Z t Z t∧T Z t
1[0,T ] H dM = H dM = H dM T .
0 0 0

Démonstration : L’application H 7→ H · M est clairement linéaire. Puis pour H ∈ S, on a


vu que H · M est une martingale avec la propriété caractéristique (6.3) (Prop. 6.3). On a

kH · M k2Hc2 = E[hH · M, H · M i∞ ]
= E[H 2 · hM, M i∞ ] (par (6.3))
Z +∞ 
2
= E Hs dhM, M is
0
2
= kHkL2 (M ) .

L’application H 7→ H · M est donc une isométrie de S dans Hc2 .


Comme Hc2 est un espace de Hilbert (Proposition 6.1) et comme S est dense dans L2 (M )
(Proposition 6.2), on peut alors prolonger de manière unique cette application en une
isométrie de L2 (M ) dans Hc2 .
1) On vérifie maintenant la propriété d’arrêt caractéristique (6.4). On sait déjà par (6.3)
qu’elle est vraie si H ∈ S. Pour la généraliser, notons que pour N ∈ Hc2 , l’application
X 7→ hX, N i∞ est continue de Hc2 dans L1 (Ω) : en effet, par les inégalités de Kunita-
Watanabe et Cauchy-Schwarz,
1/2
hN, N i1/2
   
E |hX, N i∞ | ≤ E hX, Xi∞ ∞ (Kunita-Watanabe)
 1/2  1/2
= E hX, Xi∞ E hN, N i∞ (Cauchy-Schwarz)
 1/2
= E hN, N i∞ kXkHc2 .

Soit alors H ∈ L2 (M ) et (H n )n≥0 suite de S qui converge vers H dans L2 (M ) (densité cf.
Prop. 6.2). Par l’isométrie, on a alors H n · M → H · M dans Hc2 . Puis par la continuité de
X ∈ Hc2 7→ hX, N i∞ ∈ L1 (Ω) :

hH · M, N i∞ = lim hH n · M, N i∞ = lim (H n · hM, N i)∞ = (H · hM, N i)∞ ,


n→+∞ n→+∞

où les convergences ont lieu dans L1 (Ω) avec pour la dernière égalité l’utilisation, encore,
de l’inégalité de Kunita-Watanabe :
 Z +∞ 

E (Hs − Hs ) dhM, N is ≤ E[hN, N i∞ ]1/2 kH n − HkL2 (M ) .
n
0

(On justifie de la même façon que (H ·hM, N i)∞ est bien défini.) On a donc établi (6.4) pour
t = +∞. Pour conclure, il faut l’obtenir pour tout t ≥ 0. Pour cela, il suffit de remplacer N
par N t , la martingale arrêtée en t ≥ 0, dans l’égalité hH · M, N i∞ = (H · hM, N i)∞ et on
6.1. Par rapport à une martingale bornée dans L2 111

trouve hH · M, N it = (H · hM, N i)t , ce qui achève de prouver la propriété caractéristique


(6.4).
Il faut encore justifier que (6.4) caractérise effectivement H ·M . Pour cela, soit X une autre
martingale de Hc2 qui satisfait la même propriété (6.4), on a pour tout N ∈ Hc2 ,
hH · M − X, N i = 0.
Le choix particulier N = H · M − X donne alors hH · M − X, H · M − Xi = 0 donc
kH · M − XkHc2 = 0, ie. X = H · M . Cela termine la preuve de 1).
2) Pour terminer, on utilise les propriétés du crochet de deux martingales (Prop. 5.14) pour
prouver la dernière propriété. Si N ∈ Hc2 , on a
h(H · M )T , N it = hH · M, N it∧T = (H · hM, N i)t∧T = (H1[0,T ] · hM, N i)t
où l’avant dernière égalité vient de la Proposition 6.3 et la dernière égalité est évidente
puisqu’il s’agit de l’intégrale de Stieltjes. La martingale arrêtée (H · M )T vérifie donc la
propriété caractéristique de l’intégrale (1[0,T ] H)·M . Cela justifie la première partie de (6.5).
On obtient la seconde partie en procédant de même :
hH · M T , N i = H · hM T , N i = H · hM, N iT = (H1[0,T ] ) · hM, N i
où à nouveau la dernière égalité est due au fait qu’il s’agit de l’intégrale de Stieltjes. 

Le résultat suivant est une propriété d’associativité de l’intégrale stochastique sous


réserve de conditions convenables d’intégrabilité des processus à intégrer.
Proposition 6.4 (Associativité de l’intégrale stochastique L2 ) Soit M ∈ Hc2 . Si K ∈ L2 (M )
et H ∈ L2 (K · M ) alors HK ∈ L2 (M ) et
(HK) · M = H · (K · M ). (6.6)
Démonstration : D’après le Théorème 6.1, on a
hK · M, K · M i = K · hM, K · M i = K 2 · hM, M i,
et donc
Z +∞  Z +∞ 
E Hs2 Ks2 dhM, M is = E Hs2 dhK · M, K · M is < +∞
0 0

ce qui garantit HK ∈ L2 (M ). Pour (6.6), on montre la propriété caractéristique (6.4) : si


N ∈ Hc2 , on a :
h(HK) · M, N i = HK · hM, N i = H · (K · hM, N i) = H · hK · M, N i = hH · (K · M ), N i
où la deuxième égalité utilise l’associativité de l’intégrale de Stieltjes. Comme l’égalité est
vraie pour toute N ∈ Hc2 , elle exige (HK) · M = H · (K · M ). 
112 Chapitre 6. ©JCB – M2 Math. – Université de Rennes 1

Remarque 6.2 La proposition précédente légitime les écritures informelles suivantes


Z t Z t
Hs (Ks dMs ) = Hs Ks dMs .
0 0

De même (6.4) s’écrit


Z ·  Z t
Hs dMs , N = Hs dhM, N is .
0 t 0

En appliquant deux fois cette relation, on obtient aussi :


Z · Z ·  Z t
Hs dMs , Ks dNs = Hs Ks dhM, N is . (6.7)
0 0 t 0

En particulier, on a
Z · Z ·  Z t
Hs dMs , Hs dMs = Hs2 dhM, M is .
0 0 t 0

Soient M ∈ Hc2 , N ∈ Hc2 et H ∈ L2 (M ), K ∈ L2 (N ), comme H · M et (H · M )(K · N ) −


h(H · M ), (K · N )i sont des martingales (en utilisant (6.7)), on a pour tout t ∈ R+ les
moments suivants :
Z t 
E Hs dMs = 0 (6.8)
0
Z t  Z t  Z t 
E Hs dMs Ks dNs = E Hs Ks dhM, N is . (6.9)
0 0 0

Attention : ces relations (6.8), (6.9) ne seront plus forcément vraies pour les extensions de
l’intégrale stochastique qu’on décrit ci-dessous pour les martingales locales.

Remarque 6.3 Le mouvement brownien est bien une martingale continue mais n’est pas
borné dans L2 (par exemple avec le Théorème 5.3 parce que son crochet hB, Bit = t →
+∞). Cette section ne permet donc toujours pas de construire une intégrale contre le
mouvement brownien. Les derniers obstacles sont levés dans la section suivante.

6.2 Par rapport à une martingale locale


En utilisant la propriété d’arrêt (6.5), on étend maintenant dans cette section la définition
de H · M au cas où M est une martingale locale continue. Dans cette section, on considère
M une martingale locale issue de 0.

Définition 6.5 (Espaces L2loc (M )) On note L2loc (M ) l’espace des processus progressifs H tels
que pour tout t ≥ 0, Z t
Hs2 dhM, M is < +∞ ps.
0
6.2. Par rapport à une martingale locale 113

Pour une martingale locale M , on continue à noter L2 (M ) l’espace des processus progressifs
H tels que Z +∞ 
E Hs2 dhM, M is < +∞.
0

Théorème 6.2 (Existence de l’intégrale stochastique générale) Soit M une martingale lo-
cale issue de 0. Pour tout H ∈ L2loc (M ), il existe une unique martingale locale issue de 0,
notée H · M . De plus
1. la martigale locale H · M est caractérisée par :

hH · M, N i = H · hM, N i, (6.10)

pour toute martingale locale N ;


2. la propriété d’arrêt (6.5) reste vraie : si T est un temps d’arrêt, on a

(1[0,T ] H) · M = (H · M )T = H · M T . (6.11)

Rt
Remarque 6.4 — On note habituellement (H · M )t = 0 Hs dMs .
— Cette définition étend celle du Théorème 6.1 : si M ∈ Hc2 et H ∈ L2 (M ), alors les
définitions de ce théorème et du Théorème 6.1 coı̈ncident.
En effet, si M ∈ Hc2 et H ∈ L2 (M ), l’égalité hH · M, H · M i = H 2 · hM, M i entraı̂ne
d’abord que H · M ∈ Hc2 , et ensuite les propriétés caractéristiques (6.4) et (6.10)
montrent que les définitions des Théorèmes 6.1 et 6.2 coı̈ncident.
— La propriété d’associativité de la Proposition 6.4 reste vraie aussi sous des hypo-
thèses convenables d’intégrabilité.
— Le mouvement brownien B est une Rmartingale locale pour laquelle le Théorème 6.2
t
définit donc l’intégrale (H · B)t = 0 Hs dBs pour H ∈ L2loc (B). Les intégrales sto-
chastiques par rapport au mouvement brownien B s’appellent les intégrales d’Itô.
Le calcul stochastique lié à ces intégrales est le calcul d’Itô.
Démonstration : On définit
 Z t 
2
Tn = inf t ≥ 0 : (1 + Hs ) dhM, M is ≥ n .
0

Comme pour la Prop. 5.12, il s’agit d’une suite de temps d’arrêt, croissante vers +∞.
Comme on a Z Tn
Tn Tn
hM , M it = hM, M it∧Tn ≤ dhM, M is ≤ n,
0

le Théorème 5.3 s’applique et assure que la martingale arrêtée M Tn est dans Hc2 . De plus,
H ∈ L2 (M Tn ), car par définition de Tn , on a aussi
Z +∞ Z Tn
2 Tn Tn
Hs dhM , M is = Hs2 dhM, M is ≤ n.
0 0
114 Chapitre 6. ©JCB – M2 Math. – Université de Rennes 1

Pour chaque n ≥ 1, on peut donc définir l’intégrale stochastique H · M Tn par le Théo-


rème 6.1 (cas L2 borné). Par la propriété caractéristique (6.4), on vérifie facilement que
nécessairement si m > n alors Tm ≥ Tn et on a

H · M Tn = (H · M Tm )Tn

en effet
Z t∧Tn
Tm Tn Tm
h(H · M ) , N it = h(H · M ), N it∧Tn = Hs dhM Tm , N is
0
Z t∧Tn Z t∧Tn ∧Tm
= Hs dhM, N iTs m = Hs dhM, N is
0 0
Z t∧Tn
= Hs dhM, N is = h(H · M, N iTt n
0
= h(H · M )Tn , N it .

Il existe donc un (unique) processus noté H · M qui étend tous les H · M Tn , ie. pour
tout n ≥ 1,
(H · M )Tn = H · M Tn .
Explicitement, on pose
(H · M )t = H · M Tn

t
(6.12)
pour tout n tel que Tn ≥ t. La discussion précédente justifie que la définition a bien un sens
(elle ne dépend pas de n !). D’après le Théorème 6.1, les processus (H · M )Tn = H · M Tn
sont des martingales de Hc2 , si bien que H · M est en fait une martingale locale.
1) On montre maintenant la propriété caractéristique (6.10). Pour cela, soit N une mar-
tingale locale issue de 0 et soient Tn0 = inf(t ≥ 0 : |Nt | ≥ n) qui réduit N . On pose alors
Sn = Tn ∧ Tn0 . Comme M Sn , N Sn ∈ H2c , on a

hH · M, N iSn = h(H · M )Sn , N Sn i


= h(H · M Tn )Sn , N Sn i (car Sn ≤ Tn )
= hH · M Tn , N Sn i (propriété (5.10) du crochet)
= H · hM Tn , N Sn i (d’après (6.4) du cas L2 borné)
= H · hM Tn , N iSn (propriété (5.10) du crochet)
= H · hM, N iSn ∧Tn = H · hM, N iSn (Sn ≤ Tn )
= (H · hM, N i)Sn (propriété de l’intégrale de Stieltjes). (6.13)

Comme Sn % +∞, en faisant n → +∞, on déduit de (6.13) pour tout t ≥ 0 : hH ·M, N it =


H · hM, N it . Finalement, on a hH · M, N i = H · hM, N i. La caractérisation de H · M par
cette égalité pour toute martingale locale N se justifie exactement comme précédemment
dans le Théorème 6.1 : si pour toute martingale locale N

h(H · M ), N i = H · hM, N i = hX, N i,


6.2. Par rapport à une martingale locale 115

alors avec N = (H · M ) − X, on a h(H · M ) − X, (H · M ) − Xi = 0, et d’après le Th.


5.3 (H · M ) − X est une vraie martingale locale L2 . La propriété de martingale donne
 2 
alors E (H · M )t − Xt = 0, donc (H · M )t − Xt = 0 presque sûrement. Comme il
s’agit de processus à trajectoires continues, on a X = H · M , à indistiguabilité près (cf.
Corollaire 5.1).
2) La propriété d’arrêt (6.11) est obtenue pour les martingales locales par les mêmes argu-
ments que dans la preuve du Théorème 6.1 (noter que ces arguments utilisent seulement
la propriété caractéristique (6.4) qu’on vient d’étendre). 

Remarque 6.5 Discutons maintenant de l’extension des formules de moments (6.8), (6.9)
énoncées en Remarque 6.2. Soient M une martingale locale, H ∈ L2loc (M ) et t ∈ [0, +∞].
Alors, sous la condition
Z t 
2
 
E hH · M, H · M it = E Hs dhM, M is < +∞,
0

on a H ∈ L2 (M t ) et on peut appliquer le Théorème 5.3 à (H · M )t pour obtenir


Z t " Z 2 #
 t Z t 
2
E Hs dMs = 0, E Hs dMs =E Hs dhM, M is .
0 0 0

De façon générale, la propriété d’isométrie de l’intégrale stochastique du cas borné dans


L2 est remplacée par
"Z 2 #
t Z t 
2
E Hs dMs ≤E Hs dhM, M is . (6.14)
0 0

En effet soit le majorant est +∞ et l’inégalité est vraie, soit il est fini et l’estimation de la
variance est valable et donne l’égalité.

L’énoncé suivant établit une approximation par des sommes de Riemann des intégrales
stochastiques (contre une martingale locale) et complète le Lemme 5.4 dans le cas variation
finie.

Proposition 6.5 (Approximation de Riemann) Soit M une martingale locale continue et


H un processus continu adapté. Alors, pour tout t > 0, pour toute suite 0 = tn0 < · · · <
tnpn = t de subdivisions de [0, t] de pas tendant vers 0, on a, au sens de la convergence en
probabilité :
n−1
X Z t
P- lim Htni (Xtni+1 − Xtni ) = Hs dXs . (6.15)
n→+∞ 0
i=0
116 Chapitre 6. ©JCB – M2 Math. – Université de Rennes 1

Démonstration : Pour chaque n ≥ 1, on définit un processus H (n) par


p−1
X
Hs(n) = Htni 1]tni ,tni+1 ] .
i=0

Dans ce cas, (6.15) est clair. Posons enfin pour tout p ≥ 1



Tp = inf s ≥ 0 : |Hs | + hM, M is ≥ p (6.16)
et remarquons que H, H (n) et hM, M i sont bornés sur l’intervalle ]0, Tp ]. D’après la théorie
L2 de l’intégrale stochastique (cf. (6.9) pour une expression du moment d’ordre 2), pour
tout p fixé,
h 2 i h 2 i
E (H (n) · M Tp )t − (H · M Tp )t = E (H (n) 1[0,Tp ] · M )t − (H1[0,Tp ] · M )t
h 2 i
= E ((H (n) − H)1[0,Tp ] ) · M t
Z t 
(n) 2
= E (Hs − Hs ) 1[0,Tp ] (s) dhM, M is
0
Z t∧Tp 
(n) 2
= E (Hs − Hs ) dhM, M is .
0
(n) (n)
Sur [0, Tp ], on a (Hs −Hs )2 ≤ 4p2 et par continuité des trajectoires de H, limn→+∞ Hs =
Hs . Par le théorème de convergence dominée (pour Stieltjes), il vient presque sûrement
Z t∧Tp
lim (Hs(n) − Hs )2 dhM, M is = 0
n→+∞ 0

Puis comme
Z t∧Tp Z t∧Tp
(n) 2


(Hs − Hs ) dhM, M is ≤
4p2 dhM, M is ≤ 4p2 hM, M it∧Tp
0 0
≤ 4p2 hM, M iTp ≤ 4p3
le théorème de convergence dominée (pour E) entraı̂ne
h 2 i
lim E (H (n) · M Tp )t − (H · M Tp )t = 0.
n→+∞

On a donc (H (n) · M Tp )t → (H · M Tp )t dans L2 et en utilisant la propriété d’arrêt (6.11),


on en déduit la convergence dans L2
lim (H (n) · M )t∧Tp = (H · M )t∧Tp .
n→+∞

Pour conclure, on remarque que P(Tp > t) % 1 quand p → +∞, ce qui affaiblit la conver-
gence L2 obtenue en une convergence en probabilité. 

Le résultat suivant est une version du théorème de convergence dominée pour les intégrales
stochastiques :
6.3. Par rapport à une semimartingale 117

Théorème 6.3 Soit X une semimartingale continue. Si H n est une suite de processus loca-
lement bornés telle que limn→+∞ Htn = 0 pour tout t ≥ 0 et telle qu’il existe un processus K
P
borné satisfaisant |H n | ≤ K pour tout n ≥ 1, alors (H n ·X)t → 0, n → +∞, uniformément
sur tout compact.

Démonstration : Il s’agit de voir

P- lim sup |(H n · X)s | = 0


n→+∞ s≤t

ce qui est clair d’après les propriétés de l’intégrale de Stieltjes si X est un processus à
variations finies. Il suffit donc de considérer le cas où X est une martingale locale.
On suppose alors X réduite par la suite de temps d’arrêt (Tp )p≥1 donnée en (6.16) alors
p
(H n )Tp converge vers 0 dans L2 (X T ). D’après l’isométrie du Théorème 6.1, (H n · X)Tp
converge vers 0 dans Hc2 . Comme limp→+∞ P(Tp ≥ t) = 1, on obtient la convergence en
probabilité cherchée. 

6.3 Par rapport à une semimartingale


On achève dans cette section la construction de l’intégrale stochastique en intégrant fi-
nalement par rapport aux semimartingales continues. Pour cela, on dit qu’un processus
progressif H est localement borné si

ps ∀t ≥ 0, sup |Hs | < +∞.


s≤t

En particulier, tout processus continu adapté est localement borné (cf. Prop. 4.1). De plus,
si H est localement borné, pour tout processus V à variation finie on a :
Z t
ps ∀t ≥ 0, |Hs | |dVs | < +∞.
0

De même, pour toute martingale locale M , on a H ∈ L2loc (M ) car


Z t  
Hs2 dhM, M is ≤ sup |Hs | sup hM M is < +∞.
0 s≤t s∈[0,t]

Définition 6.6 (Intégrale par rapport à une semimartingale) Soit X = X0 + M + A une


semimartingale continue, et soit H un processus progressif localement borné. L’intégrale
stochastique H · X est alors définie par

H ·X =H ·M +H ·A
118 Chapitre 6. ©JCB – M2 Math. – Université de Rennes 1

où H · M est définie dans la Section 6.2 et H · A est définie en Section 5.1.4 (intégrale de
Stieltjes). On note traditionnellement
Z t
(H · X)t = Hs dXs .
0

Des propriétés déjà vues pour l’intégrale contre une martingale locale et contre un processus
à variation finie, on déduit facilement :

Proposition 6.6 (Propriétés de l’intégrale stochastique)


1. L’application (H, X) 7→ H · X est bilinéaire.
2. H · (K · X) = (HK) · X, si H et K sont localement bornés.
3. Pour tout temps d’arrêt T , (H · X)T = (H1[0,T ] ) · X = H · X T .
4. Si X est une martingale locale (resp. si X est un processus à variation finie) alors il
en est de même pour H · X.
Pp−1
5. Si H est un processus progressif de la forme Hs = i=0 H(i) 1]ti ,ti+1 ] (s) où, pour
chaque i, H(i) est Fti -mesurable, alors
p−1
X
(H · X)t = H(i) (Xti+1 ∧t − Xti ∧t ).
i=0

6. Soit X une semimartingale continue et soit H un processus continu adapté. Alors,


pour tout t > 0, pour toute suite 0 = tn0 < · · · < tnpn = t de subdivisions de [0, t] de
pas tendant vers 0, on a, au sens de la convergence en probabilité :
n−1
X Z t
P- lim Htni (Xtni+1 − Xtni ) = Hs dXs .
n→+∞ 0
i=0

Remarque 6.6
— Remarquer que dans la propriété 5), on ne suppose pas que les variables aléatoires
H(i) sont bornées.
— Le résultat d’approximation dans 6) généralise dans le cas de l’intégration stochas-
tique l’approximation des intégrales de Riemann. Ce résultat sera utile dans la suite,
notamment pour prouver la formule d’Itô.
— Dans ce résultat, il est essentiel de considérer Htni dans l’approximation de Riemann.
Un autre choix conduit à un autre type d’intégrale stochastique : par exemple Htni+1
mène à une intégrale dite anticipante, et H(tni+1 +tni )/2 mène à l’intégrale de Stra-
tonovich alors que pour le choix Htni , fait dans ce chapitre, on obtient l’intégrale
d’Itô.
6.4. Cas non continu 119

Démonstration : Toutes les propriétés viennent de celles vues en Section 5.1 pour la partie
variation finie et en Section 6.2 pour la partie martingale locale. Par exemple, 6) vient du
Lemme 5.4 et de la Proposition 6.5. 

Le résultat suivant est une version du théorème de convergence dominée pour les intégrales
stochastiques :
Théorème 6.4 Soit X une semimartingale à trajectoires continues. Si H (n) est une suite de
(n)
processus localement bornés telle que limn→+∞ Ht = 0 pour tout t ≥ 0 et telle qu’il existe
 P
un processus K borné satisfaisant |H (n) | ≤ K pour tout n ≥ 1, alors H (n) · X t −→ 0,
n → +∞, uniformément sur tout compact.
Démonstration : Il s’agit de voir
P
sup (H (n) · X)s −→ 0, n → +∞,
s≤t

ce qui est clair d’après les propriétés de l’intégrale de Stieltjes si X est un processus à
variations finies. Il suffit donc de considérer le cas où X est une martingale locale. On
suppose X réduite par la suite de temps d’arrêt (Tp )p≥1 donnée en (6.16) alors (H (n) )Tp
converge vers 0 dans L2 (X Tp ). D’après l’isométrie du Théorème 6.1, (H (n) · X)Tp converge
vers 0 dans Hc2 . Comme limp→+∞ P(Tp ≥ t) = 1, on obtient la convergence en probabilité
cherchée. 

6.4 Cas non continu


La théorie d’intégration stochastique présentée dans ce chapitre s’applique pour des se-
mimartingales à trajectoires continues. On pourrait s’intéresser à des semimartingales à
trajectoires càdlàg (continue à droite et avec des limites à gauche) ou càglàd (continue à
gauche avec des limites à droite). On intègre alors des processus dits prévisibles ((Ft− )t≥0 -
adaptés et continus à gauche) ou optionnels ((Ft )t≥0 - adaptés et continus à droite). Dans
le cadre càdlàg, la décomposition d’une semimartingale en martingale locale + processus à
variation bornée n’est plus unique (heuristiquement : on peut jouer sur les sauts) à moins
d’imposer par exemple que le processus à variation finie soit prévisible (dans ce cas, on
00
fixe00 les sauts).
Il faut cependant introduire deux crochets [M, M ]t et hM, M it (qui est la projection prévi-
sible de [M, M ]t ). Chacun de ces deux crochets hérite d’une des propriétés fondamentales
(5.2), (5.3) de l’unique crochet défini dans le cadre continu (cf. Théorème 5.2), on retrouve
ainsi que
— [M, M ]t = lim|∆|→0 ti ∈∆ (Mti+1 − Mti )2 est la variation quadratique de M où ∆ est
P
une subdivision de [0, t] et |∆| désigne son pas.
— hM, M i est l’unique processus prévisible tel que M 2 − hM, M i est une martingale
locale.
120 Chapitre 6. ©JCB – M2 Math. – Université de Rennes 1

Dans ce contexte, il faut alors porter une attention particulière aux sauts ∆Xt = Xt − Xt−
du processus. On consultera [Pro] pour une introduction au calcul stochastique avec saut
ou, pour le cas spécifique des processus de Lévy, [CT] ou [App].
Chapitre 7

Formule d’Itô et conséquences

Dans ce chapitre, on prouve la formule d’Itô, véritable clef de voûte du calcul stochas-
tique. Celle-ci montre que lorsqu’on applique une application C 2 à une semimartingale, on
conserve une semimartingale ; elle en donne en plus la décomposition (martingale locale +
processus à variation finie). La formule d’Itô est prouvée en Section 7.1. Des conséquences
importantes en sont présentées dans les sections suivantes : théorème de Lévy (caractérisa-
tion du mouvement brownien par son crochet, Section 7.2 ), théorème de Dubins-Schwarz
(Section 7.3), inégalités de Burkholder-Davis-Gundy (BDG, Section 7.4), théorème de re-
présentation des martingales (Section 7.5), formule de Tanaka (Section 7.6).

7.1 Formule d’Itô


La formule d’Itô est l’outil de base du calcul stochastique : elle montre qu’une fonction de
classe C 2 de p semimartingales continues est encore une semimartingale continue, et elle
exprime explicitement la décomposition de cette semimartingale.
Rappelons la formule de changement de variable classique : si F, g sont de classe C 1 alors
(F ◦ g)0 (t) = F 0 (g(t)) g 0 (t) s’écrit
Z t
F (g(t)) = F (g(0)) + F 0 (g(s))g 0 (s) ds.
0
1
Si F est C et g est seulement absolument continue (c’est à dire à variation finie) alors on
a encore avec l’intégrale de Stieltjes :
Z t
F (g(t)) = F (g(0)) + F 0 (g(s)) dg(s).
0

La même formule reste vraie pour un processus X à variation finie en faisant un calcul
trajectoriel (pour chaque ω fixé, la trajectoire t 7→ Xt (ω) est à variation finie et le cas
précédent s’applique) : pour F une fonction de classe C 1 , on a alors
Z t
F (Xt ) = F (X0 ) + F 0 (Xs ) dXs .
0

121
122 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1

La formule d’Itô généralise cette propriété pour des semimartingales lorsque F est C 2 ; la
formule fait alors apparaı̂tre un terme supplémentaire dû au fait que ces processus ne sont
pas à variation finie, cf. (7.1) ci-dessous.

Théorème 7.1 (Formule d’Itô) Soit X une semimartingale et F : R → R une fonction de


classe C 2 . Alors
Z t
1 t 00
Z
0
F (Xt ) = F (X0 ) + F (Xs ) dXs + F (Xs ) dhX, Xis . (7.1)
0 2 0
Si on considère p semimartingales continues X (1) , . . . , X (p) et F : Rp → R de classe C 2
alors,
p Z t
(1) (p) (1) (p)
X ∂F
F (Xt , . . . , Xt ) = F (X0 , . . . , X0 ) + (Xs(1) , . . . , Xs(p) ) dXs(i)
i=1 0 ∂x i
p Z t 2
1X ∂ F
+ (Xs(1) , . . . , Xs(p) ) dhX (i) , X (j) is . (7.2)
2 i,j=1 0 ∂xi ∂xj

Démonstration : On traite d’abord le cas (7.1) c’est à dire p = 1. Considérons une suite
{0 = tn0 < · · · < tnpn = t}n≥1 de subdivisions emboı̂tées de [0, t] de pas tendant vers 0. Alors
en télescopant la somme, on a
pn −1
X 
F (Xt ) = F (X0 ) + F (Xtni+1 ) − F (Xtni ) .
i=0

La formule de Taylor (Lagrange) à l’ordre 2 sur l’intervalle (non ordonné) (Xtni , Xtni+1 )
donne pour chaque ω ∈ Ω :
fn,i (ω)
F (Xtni+1 ) − F (Xtni ) = F 0 (Xtni )(Xtni+1 − Xtni ) + (Xtni+1 − Xtni )2
2
où " #
inf F 00 Xtni + θ(Xtni+1 − Xtni ) , sup F 00 Xtni + θ(Xtni+1 − Xtni ) .
 
fn,i ∈
θ∈[0,1] θ∈[0,1]

D’après 6) dans la Proposition 6.6 (approximation à la Riemann des intégrales stochas-


tiques) avec Hs = F 0 (Xs ), on a au sens de la convergence en probabilité :
pn −1 Z t
X
0
F 0 (Xs ) dXs ,
P
F (Xtni )(Xtni+1 − Xtni ) −→ n → +∞.
i=0 0

Pour prouver la formule d’Itô (7.1), il reste à établir la convergence en probabilité :


pn −1 Z t
X
2
F 00 (Xs ) dhX, Xis ,
P
fn,i (ω)(Xtni+1 − Xtni ) −→ n → +∞, (7.3)
i=0 0
7.1. Formule d’Itô 123

car alors, par unicité presque sûre de la limite en probabilité, on aura pour tout t ≥ 0 :
Z t
1 t 00
Z
0
F (Xt ) = F (X0 ) + F (Xs ) dXs + F (Xs ) dhX, Xis ps.
0 2 0
Les deux termes de l’égalité ci-dessus étant continus en t, les deux processus seront en fait
indistinguables, ce qui donnera (7.1).
Il reste donc à établir (7.3) ; pour cela, on note pour n < m :
pm −1
X
Tm = fm,i (ω)(Xtm
j+1
− Xtm
j
)2
j=0
pn −1
X X
Tn,m = fn,j (ω) (Xtm
j+1
− Xtm
j
)2 .
i=0 {j:tn m n
i ≤tj <ti+1 }

Ppm −1 Ppn −1 P
Comme = {j:tn m n (subdivisions emboı̂tées), on a
j=0 i=0 i ≤tj <ti+1 }

pn −1
X X
Tm = fm,i (ω)(Xtm
j+1
− Xtm
j
)2
i=0 {j:tn m n
i ≤tj <ti+1 }

et on peut écrire
|Tm − Tn,m |

pn −1 pn −1
X X
2
X X
2

= fm,j (ω)(Xtmj+1
− X tm) −
j
f n,i (ω)(X tm
j+1
− X tm)
j
i=0 {i:tni ≤tm n
j <ti+1 }
i=0 {j:tn m n
i ≤tj <ti+1 }


n −1
pX X
 2

= fm,j (ω) − fn,i (ω) (Xtm j+1
− X tm)
j
i=0 {j:tni ≤tm n
j <ti+1 }


pn −1 pm −1
X X
2
X
≤ Zn,m (Xtm
j+1
− X tm)
j

= Z n,m (Xtm j+1
− Xtm j
)2
i=0 {j:tni ≤tm n
j <ti+1 }
j=0

avec !
Zn,m = sup sup |fm,j − fn,i | .
0≤i≤pn −1 {j:tn m n
i ≤tj <ti+1 }

ps
La continuité de F 00 assure que Zn,m −→ 0 quand n, m → +∞. D’après l’interprétation
00
Ppm −1 P
variation quadratique00 du crochet (Proposition 5.17), on a 2
j=0 (Xtj+1 − Xtj ) −→
m m

hX, Xit . Et donc pour ε > 0 donné, il existe n1 ≥ 1 tel que pour tout m > n ≥ n1 ,
pm −1
!
X
)2 ≥ ε/3 ≤ ε/3.

P |Tm − Tn,m | ≥ ε/3 ≤ P Zn,m (Xtm
j+1
− Xtm
j
(7.4)
j=0
124 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1

P m −1
(Comme Zn,m −→ 0 et pj=0
P P
(Xtm
j+1
− Xtm
j
)2 −→ hX, Xit , le lemme de Slutsky assure
P m −1
Zn,m pj=0
P
(Xtm j+1
− Xtmj
)2 −→ 0.) Ensuite, comme les (tm
j )j:tn m n
i ≤tj <ti+1
forment une subdi-
n n
vision de [ti , ti+1 ], la Proposition 5.17 montre aussi qu’en probabilité :
pn −1
X X
P- lim Tn,m = P- lim fn,i (Xtm
j+1
− Xtm
j
)2
m→+∞ m→+∞
i=0 {j:tn m n
i ≤tj <tn+1 }

pn −1  
X
= fn,i hX, Xitni+1 − hX, Xitni
i=0
Z t
= hn (s) dhX, Xis ,
0
Ppn −1
où hn = i=0 fn,i 1[tni ,tni+1 [ . Ainsi il existe n2 ≥ 1 tel que pour m ≥ n2
 Z t 

P Tn,m −
hn (s) dhX, Xis ≥ ε/3 ≤ ε/3.
(7.5)
0

Puis comme F est C 2 , on a limn→+∞ hn (s) = F 00 (Xs ) ps. De plus, on a pour tout s ∈
[tni , tni+1 [
hn (s) − F 00 (Xs ) = fn,i − lim fm,n = lim fn,i − fm,j ≤ lim Zn,m ,

m→+∞ m→+∞ m→+∞

et donc
sup |hn (s) − F 00 (Xs )| −→ 0,
P
n → +∞.
s∈[0,t]

Il existe donc aussi n3 ≥ 1 tel que pour n ≥ n3


 Z t Z t 
00

P hn (s) dhX, Xis − F (Xs ) dhX, Xis ≥ ε/3 ≤ ε/3. (7.6)
0 0

Comme
( p −1 Z t )
Xm
fm,j (Xtm − Xtm )2 − F 00 (Xs ) dhX, Xis ≥ ε

j+1 j

j=0 0
⊂ {|Tm − Tn,m | ≥ ε/3}
 Z t 

∪ Tn,m −
hn (s) dhX, Xis ≥ ε/3

0
 Z t Z t 
00

∪ hn (s) dhX, Xis − F (Xs ) dhX, Xis ≥ ε/3
0 0

en combinant (7.4), (7.5), (7.6), et en prenant m > n > max(n1 , n2 , n3 ), on a :


p −1 Z t !
Xm
fmj (Xtm − Xtm )2 − F 00 (Xs ) dhX, Xis ≥ ε ≤ ε

P j+1 j

j=0 0
7.1. Formule d’Itô 125

ce qui prouve (7.3) puisque ε > 0 est arbitraire. Finalement, la formule d’Itô (7.1) est
prouvée pour p = 1.

Dans le cas où p est quelconque, la formule de Taylor (toujours à l’ordre 2) donne
(1) (p) (1) (p)
F (Xtni+1 , . . . , Xtni+1 ) − F (Xti , . . . , Xtni )
i
p p k,l
X ∂F (1) (p) (k) (k)
X fn,i (k) (k) (l) (l)
= (Xtni , . . . , Xtni )(Xtni+1 − Xtni ) + (Xtni+1 − Xtni )(Xtni+1 − Xtni )
k=1
∂xk k,l=1
2

avec
" #
k,l ∂ 2F (1) (1) (1) ∂ 2
F (1) (1) (1)
fn,i ∈ inf (Xtni + θ(Xtni+1 − Xtni ), . . . ), sup (Xtni + θ(Xti − Xtni ), . . . ) .
θ∈[0,1] ∂xk ∂xl θ∈[0,1] ∂x k ∂x l i+1

Le 6) dans la Proposition 6.6 donne à nouveau la limite cherchée pour les termes faisant
intervenir les dérivées premières :
pi −1 p Z t
X ∂F (1) (p) (k) (k) P
X ∂F
(Xtni , . . . , Xtni )(Xtni+1 − Xtni ) −→ (Xs(1) , . . . , Xs(p) ) dXs(k) .
i=1
∂xk k=1 0
∂xk

En adaptant légèrement les arguments du cas p = 1, on montre que pour tous k, l ∈


{1, . . . , p} :
pn −1 t
∂ 2F
X Z
k,l (k) (k) (l) (l) P
fn,i (Xtni+1 −Xtni )(Xtni+1 −Xtni ) −→ (X (1) , . . . , Xs(p) ) dhX (k) , X (l) is , n → +∞.
i=0 0 ∂xk ∂xl s

Cela achève la preuve de la formule d’Itô dans le cas général (7.2). 

Un cas particulier important de la formule d’Itô est la formule d’intégration par parties.

Corollaire 7.1 (IPP) Si X et Y sont deux semimartingales continues, on a


Z t Z t
Xt Yt = X0 Y0 + Xs dYs + Ys dXs + hX, Y it . (7.7)
0 0

Le terme hX, Y i est nul si X ou Y est à variation finie. Il est présent quand on considère
de (vraies) semimartingales et ce terme supplémentaire témoigne de la différence entre le
calcul stochastique et le calcul différentiel déterministe.
Démonstration : Appliquer la formule d’Itô à F (x, y) = xy qui est bien de classe C 2 en
x, y et noter que
∂ 2F ∂ 2F ∂ 2F
(x, y) = 1, (x, y) = (x, y) = 0.
∂x∂y ∂x2 ∂y 2
126 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1

En particulier, si Y = X on obtient
Z t
Xt2 = X02 +2 Xs dXs + hX, Xit .
0

Remarque 7.1 — Lorsque X = M est une martingale locale, on sait que M 2 − hM, M i
est une martingale locale (définition du crochet du Théorème 5.2). La formule pré-
cédente montre que cette martingale locale est en fait
Z t
2
M0 + 2 Ms dMs ,
0

ce qu’on aurait pu voir directement sur la démonstration donnée en Section 5.2


puisqu’une lecture attentive
Ppn de la démonstration indique que la construction de
hM, M it fait intervenir i=0 Mti (Mti+1 − Mti ) qui sont des approximations (de
n n n
Rt
type Riemann) de l’intégrale stochastique 0 Ms dMs .
(1) (2)
— En prenant Xt = t et Xt = Xt , on a aussi pour toute fonction F de classe C 2
sur R+ × R

F (t, Xt ) = F (0, X0 )
Z t Z t
1 t ∂ 2F
Z
∂F ∂F
+ (s, Xs )dXs + (s, Xs )ds + (s, Xs ) dhX, Xis . (7.8)
0 ∂x 0 ∂t 2 0 ∂x2
| {z } | {z }
martingale locale variation finie

En fait, il suffit de prendre F ∈ C 1,2 (R+ × R, R), ie. F est C 1 en t ∈ R+ et C 2 en


x ∈ R.

Retour au mouvement brownien


Pour un (Ft )-mouvement brownien B, la formule d’Itô s’écrit
Z t Z t
0 1
F (Bt ) = F (B0 ) + F (Bs ) dBs + F 00 (Bs ) ds.
0 2 0

En prenant Xt1 = t et Xt2 = Bt , (7.8) devient : pour toute fonction F de classe C 2 sur
R+ × R, on a :
Z t Z t
1 ∂ 2F

∂F ∂F
F (t, Bt ) = F (0, B0 ) + (s, Bs ) dBs + + (s, Bs ) ds.
0 ∂x 0 ∂t 2 ∂x2
7.1. Formule d’Itô 127

(1) (p)
Si Bt = (Bt , . . . , Bt ) est un (Ft )-mouvement brownien en dimension d alors les B (i) sont
des mouvements browniens indépendants. On a vu au chapitre précédent que dans ce cas
hB (i) , B (j) i = 0 lorsque i 6= j et dhB (i) , B (i) is = ds. La formule d’Itô montre alors que,
pour toute fonction F de classe C 2 sur Rp ,
p Z t
1 p (1) (p)
X ∂F (1)
F (Bt , . . . , Bt ) = F (B0 , . . . , B0 ) + (Bs , . . . , Bs(p) )dBs(i)
i=1 0 ∂x i
Z t
1
+ ∆F (Bs(1) , . . . , Bs(p) )ds
2 0
2 (1) (p)
où ∆F = di=1 ∂∂xF2 est le laplacien de F . On a aussi une formule analogue pour F (t, Bt , . . . , Bt ).
P
i

(1) (p)
En particulier si F est harmonique (ie. ∆F = 0) alors F (Bt , . . . , Bt ) est une martingale
locale.

Exponentielles stochastiques
On définit maintenant l’exponentielle stochastique E(M ) d’une martingale locale M
quelconque. La formule d’Itô justifie qu’il s’agit d’une martingale locale et explique la
terminologie, cf. la Remarque 7.2 ci-dessous. Pour commencer, on dit qu’un processus à
valeurs dans C est une martingale locale si ses parties réelle et imaginaire en sont.

Proposition 7.1 Soit M une martingale locale. On pose pour tout λ ∈ C :


λ2
 
E(λM )t = exp λMt − hM, M it .
2
Le processus E(λM ) = (E(λM )t )t≥0 est une martingale locale.

Démonstration : Si F (x, r) est une fonction de classe C 2 sur R×R+ , la formule d’Itô assure
Z t
 ∂F 
F Mt , hM, M it = F (M0 , 0) + Ms , hM, M is dMs
0 ∂x
Z t
1 ∂ 2F

∂F 
+ + M s , hM, M is dhM, M is .
0 ∂r 2 ∂x2

Le processus F Mt , hM, M it est une martingale locale dès que sa partie à variation finie
s’annule, ie. lorsque F vérifie la condition :
∂F 1 ∂ 2F
+ = 0.
∂r 2 ∂x2
La preuve s’achève en observant que cette condition est satisfaite par la fonction F (x, r) =
2 
exp λx − λ2 r (plus précisément par les parties réelle et imaginaire de cette fonction). 
128 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1

∂F

Remarque 7.2 Avec F (x, r) = exp x − r/2 (prendre λ = 1 précédemment), ∂x
(x, r) =
F (x, r), si bien que l’identité
Z t
 ∂F 
F Mt , hM, M it = F (M0 , 0) + Ms , hM, M is dMs
0 ∂x

s’écrit Z t
E(M )t = E(M )0 + E(M )s dMs (7.9)
0
ou en écriture symbolique d’EDS (cf. Chapitre ??) : dE(M ) = E(M )dM , ce qui généralise
l’équation dy = y dx de solution y(x) = ex avec la condition y(0) = 1 ou l’équation
dyt = yt dgt de solution yt = exp(gt ) si g est à variation finie nulle en 0 et avec la condition
initiale y0 = 1. Cette propriété justifie l’appelation exponentielle stochastique de M pour
E(M ).
Rt
Proposition 7.2R· 1. Soit f ∈ L2loc (B) avec 0 f (s)2 ds ≤ C ps pour une constante C finie
alors E( 0 fs dBs ) estRune vraie martingale de carré intégrable. En particulier pour
·
tout t ≥ 0, on a E[E( 0 fs dBs )t ] = 1.
2. Si f ∈ L2loc (B) est à valeurs complexes, on a
" Z 2 #
Z t
·
 Z · 
2
|f (s)| ds ≤ C =⇒ E E( fs dBs ) < +∞ et E E( fs dBs ) = 1.
0 0 0


Démonstration : 1) Notons Zt = E( 0 f (s)dBs )t . On commence par supposer que |f (s)| ≤ k
pour tout s ∈ [0, t]. Pour l’exponentielle stochastique, la formule d’Itô s’écrit
Z t
Zt = 1 + Zs f (s) dBs .
0

On montre alors que


 Z t  
fZ ∈ L2[0,t] (B) = H : Ω × R+ → R : progressif avec E Hs2 ds < +∞
0
Rt
pour assurer que 0 Zs f (s) dBs est une (vraie) martingale et que E[Zt ] = 1. De (a + b)2 ≤
2(a2 + b2 ), on déduit
Z ! u 2
Zu2 ≤ 2 1 + Zs fs dBs , u ≤ t.
0
Ru
Pour le calcul du moment d’ordre 2 de 0
Zs fs dBs , on utilise l’isométrie d’Itô pour déduire
pour u ≤ t :
 2
 Z u 
E Zs2 fs2 ds
 
E Zu ≤ 2 1 +
0
7.1. Formule d’Itô 129
 Z u 
2
 2
≤ 2 1+k E Zs ds . (7.10)
0

Apriori comme E[Zs2 ] n’est pas finie, on considère les temps d’arrêt Tn = inf t ≥ 0 : Zt ≥
n , n ≥ 1, qui réduisent la martingale locale Z. En faisant comme précédemment, on peut
remplacer (7.10) par
 Z u 
 2   2  2
 2 
E Zu 1{u≤Tn } ≤ E Zu∧Tn ≤ 2 1 + k E Zs 1s≤Tn ds . (7.11)
0
 
On peut alors appliquer le résultat classique suivant à E Zu2 1{u≤Tn } :

Lemme 7.1 (Gronwall) Soit g une fonction positive localement intégrable définie sur R+
telle que pour a, b ≥ 0 Z t
g(t) ≤ a + b g(s) ds. (7.12)
0

Alors g(t) ≤ a exp(bt) pour tout t ≥ 0.

Preuve (Gronwall). En multipliant par e−bt , l’hypothèse (7.12) s’écrit


 Z t 
d
exp(−bt) g(s)ds ≤ a exp(−bt)
dt 0

ce qui, en intégrant, donne


Z t
a
exp(−bt) g(s)ds ≤ (1 − exp(−bt)).
0 b

On obtient le résultat en reportant l’inégalité ci-dessus dans l’hypothèse (7.12) :


a
g(t) ≤ a + b ebt (1 − exp(−bt)) = aebt .
b


Le lemme de Gronwall (Lemme 7.1) assure alors E[Zs2 1{u≤Tn } ] ≤ 2 exp(2k 2 s) et par conver-
gence monotone on obtient E[Zs2 ] ≤ 2 exp(2k 2 s) lorsque n → +∞. On a donc Zs de carré
intégrable et borné dans L2 pour s ∈ [0, t]. Cela garantit f Z ∈ L2[0,t] (B) et E[Zt ] = 1.
Dans le cas général, onRpose fn = (f ∧Rn) ∨ (−n) et on applique le cas précédent à fn . Par
t t
convergence monotone 0 fn (u)2 du % 0 f (u)2 du, n → +∞, et par isométrie et convergence
Rt L2 R t
dominée 0 fn (u)dBu −→ 0 f (u)dBu car
"Z 2 #
t Z t Z t 
2
E fn (u) dBu − f (u) dBu =E (fn (u) − f (u)) du .
0 0 0
130 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1

On a donc
Z t Z t Z t Z t
1 2 P 1
fn (s) dBs − fn (s) ds −→ fn (s) dBs − f (s)2 ds
0 2 0 0 2 0

et, comme la convergence en probabilité se conserve en appliquant une application continue,


P
on a avec des notations évidentes Zn (t) −→ Z(t), n → +∞. Puis
  Z t Z t 
2 2
 
E Zn (t) = E exp 2 fn (s) dBs − (4 − 3) fn (s) ds
0 0
  Z t Z t 1/2
2
≤ E exp 4 fn (s) dBs − 8 fn (s) ds
0 0
  Z t 1/2
2
×E exp 6 fn (s) ds
0
≤ 1 × exp(3C)

en utilisant l’inégalité de Cauchy-Schwarz et le cas précédent pour avoir


  Z t Z t   Z t 
2
E exp 4 fn (s) dBs − 8 fn (s) ds =E E 4fn (s) dBs = 1.
0 0 0

On a donc (Zn (t))n≥1 uniformément intégrable. D’après le Théorème de Vitali, la conver-


P L1
gence Zn (t) −→ Z(t) se renforce en Zn (t) −→ Z(t) et on a en particulier limn→+∞ E[Zn (t)] =
L1
E[Z(t)], ce qui assure E[Z(t)] = 1. On a aussi E[Zn (t)|Fs ] −→ E[Z(t)|Fs ] et E[Zn (t)|Fs ] =
L1
Zn (s) −→ Z(s). D’où E[Z(t)|Fs ] = Z(s) et Z est donc une martingale.
Il reste à voir que cette martingale est L2 . Pour cela, on observe qu’on a mieux que l’uni-
forme intégrabilité dans L1 : en effet
 Z t
3 t
 Z 
3 2
E[Zn (t) ] = E exp 3 fn (s) dBs − fn (s) ds
0 2 0
 Z t
18 − 15 t
 Z 
2
= E exp 3 fn (s) dBs − fn (s) ds
0 2 0
  Z t Z t 1/2
2
≤ E exp 6 fn (s) dBs − 18 fn (s) ds
0 0
  Z t 1/2
2
×E exp 15 fn (s) ds
0
h Z · i
≤ E E 6fn (s) dBs t exp(15C/2) = exp(15C/2)
0

L2
justifie que (Zn (t))n≥1 est uniformément intégrable dans L2 . On en déduit alors que Zn (t) −→
Z(t) et donc Z(t) ∈ L2 .
7.2. Théorème de Lévy 131

2) Pour le cas complexe, on écrit f = Re(f ) + iIm(f ) et on se ramène assez facilement au


cas réel. 

7.2 Théorème de Lévy


Le résultat suivant permet de caractériser le mouvement brownien par son crochet parmi
les martingales locales à trajectoires continues.

Théorème 7.2 (Caractérisation du MB par son crochet) Soit X = X (1) , . . . , X (d) un
processus à trajectoires continues (Ft )-adapté issu de 0. Il y a équivalence entre
1. X est un (Ft )-mouvement brownien en dimension d.
2. Les processus X (1) , . . . , X (d) sont des (Ft )-martingales locales continues et de plus

hX (i) , X (j) it = δi,j t

où δi,j désigne le symbole de Kronecker.


En particulier, une (Ft )-martingale locale continue M issue de 0 est un (Ft )-mouvement
brownien si et seulement si hM, M it = t.

Remarque 7.3 Il est crucial que le processus soit à trajectoires continues. Par exemple le
processus de Poisson (standard) vérifie la même propriété de crochet mais il est à trajec-
toires càdlàg.

Démonstration : Le sens 1) ⇒ 2) est connu, cf. Remarques 5.6 et ??. On montre la


(j)
réciproque. Pour cela, soit u ∈ Rd . Alors u · Xt = dj=1 uj Xt est une martingale locale de
P
processus croissant

X d
d X d
X
(j) (k)
uj uk hX , X it = u2j t = kuk2 t.
j=1 k=1 j=1

D’après la Proposition 7.1 sur les exponentielles stochastiques, E(iuX) = exp iu · Xt +


1
2
kuk2 t est une martingale locale. Comme cette martingale locale est bornée sur les in-
tervalles [0, T ], T > 0, il s’agit en fait d’une vraie martingale. La propriété de martingale
donne alors pour s < t
     
1 2 1 2
E exp iu · Xt + kuk t Fs = exp iu · Xs + kuk s .

2 2

En particulier, pour A ∈ Fs , on a :
h i
E 1A exp iu · (Xt − Xs )
132 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1
h  i
= E E 1A exp (iu · (Xt − Xs )) Fs
      
1 2 1 2
= E 1A exp −iu · Xs − kuk t E exp iu · Xt + kuk t Fs

2 2
    
1 2 1 2
= E 1A exp −iu · Xs − kuk t exp iu · Xs + kuk s
2 2
 
1
= P(A) exp − kuk2 (t − s) . (7.13)
2

Avec A = Ω, (7.13) montre que Xt − Xs ∼ N (0, (t − s)Id ). Ensuite pour A ∈ Fs de


probabilité P(A) > 0, en notant PA (·) = P(·|A), on a
 
h i 1 2
EA exp iu · (Xt − Xs ) = exp − kuk (t − s)
2

ie. L(Xt − Xs |A) = N 0, (t − s)Id . Pour toute fonction mesurable positive f sur Rd , on a
   
EA f (Xt − Xs ) = E f (Xt − Xs )

soit    
E 1A f (Xt − Xs ) = P(A)E f (Xt − Xs ) .
Comme c’est vrai pour tout A ∈ Fs , on a Xt − Xs ⊥ ⊥ Fs (argument de classes monotones).
(i) (i) 
Finalement, pour tout 0 = t0 < t1 < · · · < tp , le vecteur Xtj − Xtj−1 1≤i≤d est un vecteur
1≤j≤p
gaussien (car obtenu en regroupant p vecteurs gaussiens indépendants). Par transformation
linéaire, (Xti )1≤i≤p est encore un vecteur gaussien pour tout (ti )1≤i≤p et donc X est un pro-
(i) (i) 
cessus gaussien. Comme le vecteur Xtj − Xtj−1 1≤i≤d a ses composantes indépendantes,
1≤j≤p
le processus X est finalement gaussien, à accroissements indépendants et stationnaires et
(par hypothèse) à trajectoires continues, achevant de prouver que X (1) , . . . , X (d) sont d
mouvements browniens indépendants. 

7.3 Dubins-Schwarz
Le résultat suivant montre que pour les martingales locales continues, le crochet est
une horloge interne qui permet de retrouver le processus quand on évalue un mouvement
brownien avec cette horloge. C’est une preuve supplémentaire du rôle central du mouvement
brownien dans la classe des martingales locales continues.

Théorème 7.3 (Dubins-Schwarz) Soit M une martingale locale continue issue de 0 et telle
que hM, M i∞ = +∞ ps. Alors, il existe un mouvement brownien β tel que

ps ∀t ≥ 0, Mt = βhM,M it .
7.3. Dubins-Schwarz 133

Remarque 7.4 — En grossissant l’espace de probabilité on peut se débarrasser de la


condition hM, M i∞ = +∞ ps.
— Le mouvement brownien β n’est pas adapté par rapport à la filtration (Ft )t≥0 initiale
de M , mais par rapport à une filtration 00 changée de temps00 .
— Il s’agit d’un résultat existentiel : le résultat est valable pour un certain mouvement
brownien (construit par la preuve du théorème) et pas pour un mouvement brownien
quelconque.

Démonstration : Pour tout r ≥ 0, on définit un temps d’arrêt τr en posant



τr = inf t ≥ 0 : hM, M it > r .

L’hypothèse sur hM, M i assure que τr < +∞ ps. De plus, la fonction r 7→ τr est
— croissante car si r ≤ s alors

{t ≥ 0 : hM, M it > s} ⊂ {t ≥ 0 : hM, M it > r}

et en passant aux inf : τr ≤ τs ;


— continue à droite car si on note α = lims&r τs , on a d’abord α ≥ τr par croissance,
puis si l’inégalité est stricte, on aurait τr < β < α ≤ τs pour tout s > r et
nécessairement r < hM, M iβ ≤ s pour tout s > r ce qui est absurde (car on peut
prendre s arbitrairement proche de r) ;
— avec des limites à gauche en r > 0 avec

lim τs = τr− = inf t ≥ 0 : hM, M it = r .
s%r

La fonction r 7→ τr est donc croissante càdlàg. On pose alors βr = Mτr . Le processus β


est adapté par rapport à la filtration donnée par Gr = Fτr , r ≥ 0. Remarquons que cette
filtration satisfait les conditions habituelles
T (puisque lorsque (Tn )n≥1 est une suite de temps
d’arrêt décroissants vers T on a FT = n≥1 FTn , cf. Prop. 4.2).

Lemme 7.2 Les intervalles de constance de M et de hM, M i sont ps les mêmes. En d’autres
termes, on a ps pour tous a < b,

Mt = Ma , ∀t ∈ [a, b] ⇐⇒ hM, M it = hM, M ia , ∀t ∈ [a, b].

Démonstration : De la gauche vers la droite, utiliser l’approximation habituelle de hM, M it .


De la droite vers la gauche, appliquer le Corollaire 5.1 (hM, M i = 0 : M est indistinguable
de M0 ) au processus M(a+t)∧T − Ma pour un temps d’arrêt T convenable. 

Revenons à la preuve du Théorème 7.3. On a ps pour tout r > 0,

lim βs = lim Mτs = Mτr− = Mτr = βr .


s%r s%r
134 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1

où l’avant dernière égalité vient du Lemme 7.2 et du fait que pour t ∈ [τr− , τr ], on a
hM, M it = r. Par ailleurs, par composition de telles fonctions, les trajectoires de β sont
clairement continues à droite ; on conclut que le processus β est à trajectoires continues.
Nous montrons ensuite que βs et βs2 − s sont des martingales relativement à la filtration
(Gs )s≥0 . Pour tout n ≥ 1, les martingales locales arrêtées M τn et (M τn )2 − hM, M iτn
sont des vraies martingales uniformément intégrables (d’après le Théorème 5.3 puisque
hM τn , M τn i∞ = hM, M iτn = n). Le théorème d’arrêt s’applique pour ces martingales uni-
formément intégrables et donne alors pour r ≤ s ≤ n :
E[βs |Gr ] = E[Mττsn |Fτr ] = Mττrn = βr
et
E[βs2 − s|Gr ] = E (Mττsn )2 − hM τn , M τn iτs |Fτr
 

= (Mττrn )2 − hM τn , M τn iτr
= βr2 − r.
On a donc hβ, βis = s. Le Théorème 7.2 (Théorème de Lévy avec d = 1) assure alors que
β est un (Gr )r≥0 -mouvement brownien. Finalement, par définition de β, on a ps pour tout
t ≥ 0,
βhM,M it = MτhM,M it .
On a 
τhM,M it = inf s ≥ 0 : hM, M is > hM, M it ≥ t,
si l’inégalité est stricte alors hM, M i est constante sur [t, τhM,M it ], et d’après le Lemme 7.2
M aussi, ce qui assure MτhM,M it = Mt et conclut que ps pour tout t ≥ 0 on a Mt = βhM,M it .
Par continuité des trajectoires, les deux processus sont indistinguables. 

7.4 Inégalités de Burkholder-Davis-Gundy


Dans cette section, on prouve les inégalités Burkholder-Davis-Gundy (BDG) qui montrent
que pour une martingale locale M
E hM, M im et E |Mt∗ |2m
   
t

où Mt∗ = max0≤s≤t |Ms | sont de même ordre de grandeur sur [0, +∞[ pour tout m > 0.

Théorème 7.4 (Inégalités de Burkholder-Davis-Gundy) Pour tout réel p ≥ 0, il existe des


constantes cp , Cp telles que pour toute martingale locale M continue issue de 0,
 ∗ p
cp E hM, M ip/2 ) ≤ Cp E hM, M ip/2
   
∞ ≤ E (M∞ ∞ (7.14)
où Mt∗ = sup0≤s≤t |Ms |.
7.4. Inégalités de Burkholder-Davis-Gundy 135

Remarque 7.5 Si T est un temps d’arrêt quelconque, en remplaçant M par la martingale


locale arrêtée M T , on obtient les mêmes inégalités avec T à la place de +∞ ; en particulier,
on a les mêmes inégalités avec t à la place de +∞.

On commence par les résultats préliminaires suivants :

Proposition 7.3 (Inégalités de martingales) Soit M une martingale continue bornée et de


variation quadratique bornée. Pour tout temps d’arrêt T , on a

E |MT |2m ≤ Cm E hM, M im


   
T , m>0 (7.15)
m 2m
   
Bm E hM, M iT ≤ E |MT | , m > 1/2 (7.16)
 m
  ∗ 2m  0
 m

Bm E hM, M iT ≤ E (MT ) ≤ Cm E hM, M iT , m > 1/2 (7.17)
0
où Bm , Cm , Cm sont des constantes universelles (qui dépendent seulement de m mais pas
de la martingale M ni du temps d’arrêt T ).

Remarque 7.6 En localisant correctement, on montre que (7.15) et (7.17) restent valables
pour M
 martingale
 locale continue. Pour que (7.16) reste valable, il faut supposer en plus
m
que E hM, M iT < +∞.

Démonstration :[Inégalités de martingales] On considère le processus

Yt = δ + εhM, M it + Mt2
Z t
= δ + (1 + ε)hM, M it + 2 Ms dMs , t ≥ 0,
0

où δ > 0 et ε > 0 sont des constantes qui seront choisies plus tard et la deuxième expression
vient de la formule d’Itô. En appliquant la formule d’Itô pour f (x) = xm , on a pour t ≥ 0 :
Z t Z t
m m m−1
Yt = δ + m(1 + ε) Ys dhM, M is + 2m(m − 1) Ysm−2 Ms2 dhM, M is
0 0
Z t
+2m Ysm−1 Ms dMs .
0

R t m−1 par hypothèse M , Y et hM, M i sont bornées et Y est bornée de 0, l’intégrale


Comme
Y
0 s
Ms dMs est une (vraie) martingale uniformément intégrable. Le théorème d’arrêt
(Théorème 4.4) s’applique et donne
Z T 
m−1
E Ys Ms dMs = 0.
0

En prenant les espérances dans la formule d’Itô, on a donc


Z T 
 m m m−1
E YT = δ + m(1 + ε)E Ys dhM, M is (7.18)
0
136 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1
Z T 
+2m(m − 1)E Ysm−2 Ms2 dhM, M i .
0

Cas 1 : borne sup pour 0 < m ≤ 1. Comme le dernier terme à droite de (7.18) est négatif
pour m ≤ 1, en faisant δ → 0, on a
Z T 
2 m 2 m−1
 
E (εhM, M iT + MT ) ≤ m(1 + ε)E (εhM, M is + Ms ) dhM, M is
0
Z T 
m−1 m−1
≤ m(1 + ε)ε E hM, M is dhM, M is
0
= (1 + ε)εm−1 E hM, M im
 
T (7.19)

en utilisant la décroissance de xm−1 pour 0 < m ≤ 1. Comme pour ces valeurs de m,


x 7→ xm est concave, on a

2m−1 (xm + y m ) ≤ (x + y)m , x ≥ 0, y ≥ 0, (7.20)

et (7.19) donne

εm E hM, M im 2m
≤ (1 + ε)(ε/2)m−1 E hM, M im
     
T + E |MT | T . (7.21)

On déduit alors

E |MT |2m ≤ (1 + ε)(2/ε)1−m − εm E hM, M im


    
T . (7.22)

Cas 2 : borne inf pour m > 1. Dans ce cas, le dernier terme à droite de (7.18) est positif,
x 7→ xm−1 est croissante et x 7→ xm est convexe. Les inégalités dans (7.19), (7.21), (7.22)
se renversent pour mener à

E |MT |2m ≥ (1 + ε)(2/ε)1−m − εm E hM, M im


    
T .

1
Cas 3 : borne inf pour 2
< m ≤ 1. En faisant ε = 0 et δ → 0 dans (7.18), on a
Z T 
 2m
  1 2(m−1)
E |MT | = 2m m − E |Ms | dhM, M is . (7.23)
2 0

De plus, on déduit de (7.20) et (7.18) et de la décroissance de xm−1


m 
2m−1 εm E[hM, M im 2 m
≤ E εhM, M iT + (δ + MT2 ) = E|YTm ]
 
T ] + E[(δ + MT ) ]
Z T 
m 2 m−1
≤ δ + m(1 + ε)E (δ + Ms ) dhM, M is .
0

En faisant δ & 0, on obtient alors


Z T 
m−1
ε E hM, M im
m 2m 2(m−1)
   
2 T + E |MT | ≤ m(1 + ε)E |Ms | dhM, M is . (7.24)
0
7.4. Inégalités de Burkholder-Davis-Gundy 137

En combinant (7.23) et (7.24), on a la borne inférieure valable pour tout ε > 0 :


−1
(1 + ε)21−m

E |MT |2m ≥ εm E hM, M im
   
−1 T .
2m − 1

Cas 4 : borne sup pour m > 1. Dans ce cas, l’inégalité (7.24) s’inverse et on a
−1
(1 + ε)21−m

E |MT |2m ≤ εm E hM, M im
   
−1 T
2m − 1

où ε doit vérifier ε > (2m − 1)2m−1 − 1.


Les cas 1–4 établissent (7.15) et (7.16). Pour prouver (7.17), on applique l’inégalité maxi-
male de Doob à la (Ft )-martingale (MT ∧t )t≥0 . On a alors pour m > 1/2 :

Bm E hM, M im ≤ E |MT ∧t |2m ≤ E (MT∗ ∧t )2m


     
T ∧t
 2m
2m
E |MT ∧t |2m
 

2m − 1
 2m
2m
E hM, M im
 
≤ Cm T ∧t , t ≥ 0,
2m − 1

ce qui est (7.17) avec T remplacé par T ∧ t. On conclut alors à l’aide du théorème de
convergence monotone en faisant t → +∞. 

La preuve des inégalités BDG du Th. 7.4 utilise également l’inégalité de Lenglart :

Proposition 7.4 (Inégalité de Lenglart) Soit (Xt )t≥0 un processus continu positif partant
de 0 et (At )t≥0 un processus continu croissant tels que

pour tout temps d’arrêt T borné : E[XT ] ≤ E[AT ]. (7.25)

Alors pour tout temps d’arrêt T borné :


 
E[δ ∧ AT ]
P max Xs ≥ ε ≤ + P(AT ≥ δ), ε, δ > 0, (7.26)
s≤T ε
2−p  p
E (XT∗ )p ≤
 
E AT , 0 < p < 1. (7.27)
1−p

Remarque 7.7 1. Noter que la condition (7.25) est remplie si X = M 2 où M est une
martingale continue bornée dans L2 car par définition du crochet de M , on a Xt −
At = Mt2 − hM, M it martingale locale et c’est une vraie martingale carM ∈ L2 .Le
théorème
 2 d’arrêt
 (avec T borné et 0 ≤ T ) donne en prenant l’espérance E MT2 −AT =
E M0 − A0 , ie. E[XT ] = E[AT ].
138 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1

2. La condition (7.25) est encore remplie si M est une martingale locale réduite par Tn :
on peut supposer que M Tn est une martingale L2 pour laquelle d’après 1) (7.25) est
vraie, ie.
E[XT ∧Tn ] = E[AT ∧Tn ] ≤ E[AT ].
Mais comme Tn % +∞ et T est borné, par le lemme de Fatou, il vient :
 
E[XT ] = E lim inf XT ∧Tn ≤ lim inf E[XT ∧Tn ] ≤ lim inf E[AT ∧Tn ] ≤ E[AT ].
n→+∞ n→+∞ n→+∞

Démonstration :[Lenglart] Soit d’abord T un temps d’arrêt borné et ε > 0. On note


R = inf t ≥ 0 : Xt ≥ ε . Sur {XT∗ ≥ ε}, on a R ≤ T ou encore R = R ∧ T . Comme par
continuité des trajectoires XR = ε, on a alors :
   

   XR XR∧T
P XT ≥ ε = E 1{XT∗ ≥ε} = E 1{XT∗ ≥ε} = E 1{XT∗ ≥ε}
ε ε
1 1 1
≤ E[XR∧T ] ≤ E[AR∧T ] ≤ E[AT ] (7.28)
ε ε ε
où on utilise d’abord (7.25) avec T ∧ R borné puis la croissance de A.
Si T est un temps d’arrêt quelconque, alors (7.28) s’applique au temps d’arrêt borné Tn =
T ∧n : P(XTn ≥ ε) ≤ ε E[ATn ]. Mais comme Tn → T , n≥1 {XTn > ε} = {XT∗ > ε} (réunion
∗ 1 ∗
S
croissante), en passant à la limite, on a :
1 1
P XT∗ > ε = lim P XT∗n > ε ≤ lim E[ATn ] = E[AT ].
 
n→+∞ n→+∞ ε ε
On a donc encore P(XT∗ > ε) ≤ 1ε E[AT ].

Finalement, soit ε, δ > 0 et S = inf t ≥ 0 : At ≥ δ . On a

P XT∗ ≥ ε = P XT∗ ≥ ε, AT < δ + P XT∗ ≥ ε, AT ≥ δ


  

≤ P(XT∗ ≥ ε, T < S) + P(AT ≥ δ)


≤ P(XT∗ ∧S ≥ ε) + P(AT ≥ δ)
1  
≤ E AT ∧S + P(AT ≥ δ)
ε
1  
≤ E AT ∧ δ + P(AT ≥ δ)
ε
en utilisant (7.28) avec T ∧ S puis la définition de S, qui assure AT ∧S = AT ∧ δ.
Considérons (M (n) )n≥1 une suite de martingales locales et T un temps d’arrêt tels que
P
hM (n) , M (n) iT −→ 0. D’après la remarque, la borne précédente reste vraie pour X =
(M (n) )2 et At = hM (n) , M (n) it où M (n) est une martingale locale. On a alors
 
1 
P sup |Ms | > ε ≤ E hM (n) , M (n) iT ∧ δ + P hM (n) , M (n) iT ≥ δ .
(n) 2
 
s≤T ε
7.4. Inégalités de Burkholder-Davis-Gundy 139

Le deuxième terme tend vers 0 directement par l’hypothèse. Comme hM (n) , M (n) iT ∧ δ ≤
δ est borné,
 le premier terme tend aussi vers 0 par convergence dominée. Finalement,
(n)
limn→+∞ P sups≤T |Ms |2 > ε = 0, ce qui assure, en probabilité
 
(n)
P- lim sup |Ms | = 0.
n→+∞ s≤T
R +∞
Pour la dernière partie, on utilise E[Z] = 0 P(Z ≥ x)dx valable pour toute variable
aléatoire Z positive. En utilisant ci-dessous (7.26) avec ε = δ = x−1/p , on a
Z +∞
 ∗ p
P (XT∗ )p > x dx

E (XT ) ≤
Z0 +∞
P XT∗ > x1/p dx


Z0 +∞ Z +∞
−1/p 1/p
P AT > x1/p dx
  
≤ x E AT ∧ x +
0 0
"Z p # "Z # Z
AT +∞ +∞
AT x−1/p dx + P ApT > x dx

≤ E dx + E
0 ApT 0
 
p
≤ E[ApT ] + E AT × Ap−1 + E ApT
 
T
1−p
2−p  p
≤ E AT .
1−p


Avec les inégalités de martingales (Prop. 7.3) et l’inégalité de Lenglart (Prop. 7.4), tout
est en place pour prouver les inégalités BDG (Th. 7.4) :
Démonstration des inégalités BDG (Théorème 7.4). D’après les inégalités de martingales
précédentes (Proposition 7.3) et la remarque qui les suit, (7.14) est valable pour p = 2m >
1. Il reste à voir le cas 0 < p = 2m ≤ 1. Quitte à localiser les processus, on suppose que M
et hM, M i sont bornées et on utilise l’inégalité de Lenglart (7.27).
D’après l’inégalité droite dans (7.17) (avec m = 1), on peut appliquer l’inégalité de Lenglart
(7.27) avec
X = (M ∗ )2 , A = C10 hM, M i
et on a pour m ≤ 1/2 :
 2−m
E (MT∗ )2m ≤ (C10 )m E hM, M im
  
T
1−m
pour tout 0 < m < 1. De la même façon, l’inégalité à gauche de (7.17) (avec m = 1) permet
d’appliquer l’inégalité de Lenglart avec
X = B1 hM, M i, A = (M ∗ )2
140 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1

ce qui donne, pour 0 < m < 1,


1−m m   ∗ 2m 
B1 E hM, M im

T ≤ E (MT ) .
2−m
Cela achève la preuve des inégalités BDG (7.14). 

7.5 Représentation des martingales browniennes


Nous montrons que lorsque la filtration est engendrée par un mouvement brownien,
toutes les martingales pour cette filtration peuvent être représentées comme intégrales
stochastiques par rapport à ce mouvement brownien.

Théorème 7.5 (Représentation des martingales browniennes) On suppose que la filtra-


tion (Ft )t≥0 sur Ω est (l’augmentation habituelle de) la filtration canonique d’un mou-
vement brownien B issu de 0. Alors, pour toute variable aléatoire Z ∈ L2 (Ω, F∞ ), il existe
un (unique) processus h ∈ L2 (B) (en particulier progressif donc adapté) tel que
Z +∞
Z = E[Z] + h(s, ω) dBs .
0

Par conséquent, pour toute martingale M continue et bornée dans L2 (respectivement pour
toute martingale locale M continue), il existe un (unique) processus h ∈ L2 (B) (resp.
h ∈ L2loc (B)) et une constante C réelle tels que
Z t
Mt = C + h(s, ω) dBs .
0

La preuve utilise le résultat suivant de densité.


Lemme 7.3 Sous les hypothèses du théorème précédent, l’espace vectoriel engendré par les
variables aléatoires n
 X 
exp i λj (Btj − Btj−1 )
j=1

pour 0 = t0 < t1 < · · · < tn et λ1 , . . . , λn ∈ R est dense dans L2C (Ω, F∞ ).

Démonstration :[Lemme 7.3] Il suffit de montrer que si Z ∈ L2C (Ω, F∞ ) vérifie


" n
#
 X 
E Z exp i λj (Btj − Btj−1 ) = 0 (7.29)
j=1

pour tout choix de 0 = t0 < t1 < · · · < tn et λ1 , . . . , λn ∈ R alors Z = 0.


Soit 0 = t0 < t1 < · · · < tn fixés, on note gm,σ2 (x), x ∈ R, la densité de la loi N (m, σ 2 ),
7.5. Représentation des martingales browniennes 141

m ∈ R, σ 2 > 0. La condition (7.29) assure que pour tous σ12 , . . . , σn2 > 0 et m1 , . . . , mn ∈ R,
on a
Z Y n
" n
#
 X 
0 = gmk ,σk2 (λj )E Z exp i λj (Btk − Btk−1 ) dλ1 . . . dλn
Rn k=1 j=1
" n #
σj2 (Btk − Btk−1 )2
Y 
= E Z exp imk (Btk − Btk−1 ) −
k=1
2

où la deuxième égalité vient du théorème de Fubini et de l’expression de la fonction carac-


téristique d’une loi gaussienne. On obtient pour tous m1 , . . . , mn ∈ R et α1 , . . . , αn > 0 :
" n
#
Y  
E Z exp imk (Btk − Btk−1 ) − αj (Btk − Btk−1 )2 = 0.
k=1

Le théorème de Stone-Weierstrass garantit que les combinaisons linéaires complexes de la


fonction constante égale à 1 et des fonctions de la forme
n
X 
(y1 , . . . , yn ) 7→ exp (imk yk − αk yk2 )
k=1

avec α1 , . . . , αm > 0 et m1 , . . . , mn ∈ R sont denses dans l’espace C` (Rn , C) des fonctions


continues de Rn dans C qui ont une limite à l’infini, muni de la norme de la convergence
uniforme. Par un passage à la limite, on obtient donc, pour toute fonction ϕ ∈ C` (Rn , C),
 
E Z ϕ(Bt1 , Bt2 − Bt1 , . . . , Btn − Btn−1 ) = 0.

On a donc, d’abord par approximation, pour tout ouvert borné U de Rn puis, par un
argument de classe monotone, pour tout borélien U de Rn :
 
E Z 1U (Bt1 , Bt2 − Bt1 , . . . , Btn − Btn−1 ) = 0.

Finalement, on a obtenu l’égalité E[Z1A ] = 0 pour tout A ∈ σ(Bt1 , . . . , Btn ). Avec un


dernier argument de classe monotone, on montre que cette égalité reste vraie pour tout
A ∈ σ(Bt : t ≥ 0) ; puis, par complétion, pour tout A ∈ F∞ . On conclut finalement que
Z = 0 ce qui établit le Lemme 7.3. 

Démonstration :[Théorème 7.5] On montre d’abord la première assertion. Pour cela, on note
H l’espace vectoriel des variables aléatoires Z ∈ L2 (Ω, F∞ ) qui ont la propriété annoncée.
Remarquons que l’unicité de h est facile à établir puisque si h et e
h correspondent à la même
variable aléatoire Z, on a par isométrie d’Itô :
Z +∞ "Z 2 #
2
 +∞ Z +∞
E h(s, ω) − e
h(s, ω) ds = E h(s, ω) dBs − h(s, ω)) dBs
e = 0,
0 0 0
142 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1

h dans L2 (B). Si Z ∈ H correspond à h,


d’où h = e
Z +∞ 
2 2 2
E[Z ] = E[Z] + E h(s, ω) ds .
0

Il en découle facilement que si (Zn )n≥0 est une suite dans H qui converge dans L2 (Ω, F∞ )
vers Z, les processus hn associés à Zn forment une suite de Cauchy dans L2 (B) donc
convergent vers h ∈ L2 (B). D’après Rla propriété d’isométrie de l’intégrale stochastique
+∞
(Théorème ??) on a alors Z = E[Z] + 0 h(s, ω) dBs et donc H est un espace fermé.
Ensuite, pour 0 = t0 < t1 < · · · < tn et λ1 , . . . , λn ∈ R, notons f (s) = nj=1 λj 1]tj−1 ,tj ] (s)
P

et Etf la martingale exponentielle E i 0 f (s) dBs (cf. Proposition 7.1). La formule d’Itô


(7.9) pour l’exponentielle stochastique montre que


n n Z +∞
 X 1X 2 
f
exp i λj (Btj − Btj−1 ) + λj (tj − tj−1 ) = E∞ = 1 + i Esf f (s) dBs
j=1
2 j=1 0

soit
 Xn 
exp i λj (Btj − Btj−1 )
j=1
n Z +∞ n
1X 2
  1X 2 
= exp − λj (tj − tj−1 ) + i exp − λj (tj − tj−1 ) Esf f (s) dBs .
2 j=1 0 2 j=1

On a donc
( n
! )
X
exp i λj (Btj − Btj−1 ) : λj ∈ R, 0 = t0 < t1 · · · < tn , n ∈ N ⊂H
j=1

et d’après le Lemme 7.3,


( n
! )
X
L2 (Ω, F∞ ) = Vect exp i λj (Btj − Btj−1 ) : λj ∈ R, 0 = t0 < t1 · · · < tn , n ∈ N ⊂ H = H.
j=1

On a donc H = L2 (Ω, F∞ ) ce qui prouve la première partie du Théorème 7.5.


Soit maintenant M une martingale continue et bornée dans L2 , alors, d’après la première
partie, M∞ ∈ L2 (Ω, F∞ ) s’écrit, avec h ∈ L2 (B), sous la forme
Z +∞
M∞ = E[M∞ ] + h(s, ω) dBs .
0

Par conditionnement, il vient :


Z t
Mt = E[M∞ |Ft ] = E[M∞ ] + h(s, ω) dBs .
0
7.6. Formule de Tanaka 143

L’unicité de h s’obtient comme dans la première partie.


Enfin, soit M une martingale locale (continue), on a d’abord M0 = C ∈ R parce que F0 est
P-triviale (ce qu’on peut déduire
 soit de la première partie de la preuve soit du Chapitre
3). Si Tn = inf t ≥ 0 : |Mt | ≥ n on peut appliquer ce qui précède à la martingale arrêtée
M Tn et trouver un processus hn ∈ L2 (B) tel que
Z t
MtTn =C+ hn (s, ω) dBs .
0

Par unicité dans la deuxième partie, si m < n, on a hn (s, ω) = hm (s, ω), ds-pp sur [0, Tm ]
ps. Il est alors facile de construire h ∈ L2loc (B) tel que, pour tout m, h(s, ω) = hm (s, ω)
ds-pp sur [0, T
Rm ] ps. La formule annoncée découle ensuite de la construction de l’intégrale
t
stochastique 0 h(s, ω) dBs et l’unicité de h s’obtient aussi facilement par un argument de
localisation. 

Remarque 7.8 Sous les hypothèses du Théorème 7.5, notons N la classe des P-négligeables
de σ(Bt : t ≥ 0) et pour tout t ≥ 0, Gt = σ(Bs : 0 ≤ s ≤ t) ∨ N . A priori, on a Ft = Gt+ . En
fait, le Théorème 7.5 entraı̂ne que Gt = Gt+ = Ft (le cas t = 0 est la loi de Blumenthal !).
En effet, si Z est une variable aléatoire Ft -mesurable bornée, on a
Z t Z t−ε
2
Z= h(s, ω) dBs = (L )- lim h(s, ω) dBs .
0 ε↓0 0

et quitte à prendre une sous-suite, on voit que Z est limite ps de variables (Gt )t -mesurables
(car si ε > 0 : Ft−ε ⊂ Gt ).

7.6 Formule de Tanaka


Théorème 7.6 (Formule de Tanaka) Soit X une semimartingale continue. Il existe (Lat )t≥0 ,
a ∈ R, processus croissant continu, appelé temps local en a de la semimartingale X, tel
que
Z t
+ + 1
(Xt − a) = (X0 − a) + 1{Xs >a} dXs + Lat
2
Z0 t
1
(Xt − a)− = (X0 − a)− − 1{Xs ≤a} dXs + Lat
2
Z t0
|Xt − a| = |X0 − a| + sgn (Xs − a)dXs + Lat
0

où sgn(x) = −1, 1 selon que x ≤ 0, x > 0. De plus, la mesure (de Stieltjes) dLat associée à
Lat est portée par {t ∈ R : Xt = a}.
144 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1

Démonstration : On considère d’abord ϕ une fonction convexe continue. Bien que ϕ ne


soit pas C 2 , on tente d’écrire une formule d’Itô pour ϕ(Xt ).

Soit
R 0 j une fonction positive de classeR C à support compact inclus dans ] − ∞, 0] telle que
0
−∞
j(y)dy = 1. On pose ϕn (x) = n −∞ ϕ(x+y)j(ny)dy. Comme ϕ convexe est localement
bornée, ϕn est bien définie. De plus, ϕn est C ∞ et converge simplement vers ϕ et ϕ0n croı̂t
vers ϕ0− , dérivée à gauche de ϕ.
En appliquant la formule d’Itô à la fonction ϕn de classe C 2 , on a pour chaque n ≥ 1 :
Z t
1
ϕn (Xt ) = ϕn (X0 ) + ϕ0n (Xs )dXs + Ant (7.30)
0 2
Rt
où Ant = 0 ϕ00n (Xs )dhX, Xis .
On a limn→+∞ ϕn (Xt ) = ϕ(Xt ) et limn→+∞ ϕn (X0 ) = ϕ(X0 ). En arrêtant X, on peut
supposer que X et ϕ0n (Xs ) sont bornées (uniformément en n car ϕ01 ≤ ϕ0n ≤ ϕ0− ). Par le
Théorème 6.4 (convergence dominée pour l’intégrale stochastique), on a alors
Z t Z t
ϕ0n (Xs )dXs ϕ0− (Xs )dXs
P
−→
0 0

uniformément sur les compacts. Par conséquent, An converge vers un processus Aϕ croissant
car limite de processus croissants. En passant à la limite dans (7.30), il vient
Z t
1
ϕ(Xt ) = ϕ(X0 ) + ϕ0− (Xs )dXs + Aϕt (7.31)
0 2

puis le processus Aϕ peut être choisi continu (car il s’exprime comme différence de processus
continus).
On applique (7.31) à ϕ(x) = (x − a)+ fonction convexe de dérivée à gauche ϕ0− = 1]a,+∞[ :
il existe un processus croissant A+ tel que
Z t
+ + 1
(Xt − a) = (X0 − a) + 1{Xs >a} dXs + A+ . (7.32)
0 2 t

De la même façon avec ϕ(x) = (x − a)− fonction convexe de dérivée à gauche ϕ0− =
−1]−∞,a] : il existe un processus croissant A− tel que
Z t
− − 1
(Xt − a) = (X0 − a) − 1{Xs ≤a} dXs + A− . (7.33)
0 2 t

Par différence de (7.32) et (7.33), comme x = x+ − x− , on a


Z t
1
X t = X0 + dXs + (A+ − A−
t ). (7.34)
0 2 t
7.6. Formule de Tanaka 145

Il vient A+ = A− et on pose alors Lat := A+t . En sommant (7.32) et (7.33), comme |x| =
+ −
x + x , on a Z t
|Xt − a| = |X0 − a| + sgn (Xs − a)dXs + Lat .
0

Pour la dernière partie, en appliquant la formule d’Itô à la semimartingale |Xt − a| avec


f (x) = x2 , on a en utilisant aussi (7.34)
Z t
2 2
|Xt − a| = |X0 − a| + 2 |Xs − a| d(|Xs − a|)s + h|X − a|, |X − a|it
0
Z t Z t
2
= (X0 − a) + 2 |Xs − a|sgn (Xs − a) dXs + 2 |Xs − a| dLas + hX, Xit .
0 0

En comparant avec la formule d’Itô pour X avec f (x) = (x − a)2 ,


Z t
2 2
(Xt − a) = (X0 − a) + 2 (Xs − a) dXs + hX, Xit ,
0
Rt
il vient 0
|Xs − a| dLas = 0 ps, ce qui est le résultat. 

Exemple 7.1 Pour le mouvement brownien B, la formule de Tanaka (Th. 7.6) s’écrit :
Z t
|Bt | = sgn (Bs )dBs + LB
t
0
= βt + LB
t , (7.35)
où LB = (LB t )t≥0 est le temps
R local du mouvement brownien en 0. Par le théorème de Lévy
t
(Th. 7.2), on observe βt = 0 sgn (Bs )dBs , t ≥ 0, est un (autre) mouvement brownien.
L’identité (7.35) ci-dessus correspond aussi la décomposition de Doob-Meyer de la semi-
martingale (|Bt |)t≥0 .
Remarque 7.9 (Formule d’Itô-Tanaka) Lorsque ϕ : R → R est une fonction convexe, on
peut préciser (7.31) : on montre que
Z +∞
ϕ
At = 2 Lat ϕ00 (da)
−∞
00 00
où ϕ (da) est la mesure associée à ϕ à comprendre dans le sens des distributions. On a
alors la formule d’Itô-Tanaka pour ϕ convexe :
Z t Z +∞
0
ϕ(Xt ) = ϕ(X0 ) + ϕ− (Xs )dXs + Lat ϕ00 (da). (7.36)
0 −∞

La formule (7.36)
Pp se généralise immédiatement à une combinaison linéaire de fonctions
00
convexes ϕ = i=1 αi ϕi . Dans ce cas, ϕ devient une mesure signée.
146 Chapitre 7. ©JCB – M2 Math. – Université de Rennes 1
Bibliographie

[App] David Applebaum. Lévy Processes and Stochastic Calculus. Cambridge series in
advanced mathematics, vol. 93, 2004.
[BC] Bernard Bercu, Djalil Chafaı̈. Modélisation stochastique et simulation. Dunod, 2007.
[JCB-mesure] Jean-Christophe Breton. Intégrale de Lebesgue. Notes de cours, L3 Mathé-
matiques, Université de Rennes 1, 2016.
[JCB-proba] Jean-Christophe Breton. Fondement des Probabilités. Notes de cours, L3 Ma-
thématiques, Université de Rennes 1, 2014.
[JCB-martingale] Jean-Christophe Breton. Probabilités avancées. Notes de cours, M1 Ma-
thématiques, Université de Rennes 1, 2019.
[JCB-stoch] Jean-Christophe Breton. Calcul stochastique. Notes de cours, M2 Mathéma-
tiques, Université de Rennes 1, 2020.
[Bil2] Patrick Billingsley. Convergence of Probability measures. 2nd Edition, Wiley series
in probabilities and mathematical statistics, 1999.
[Chung] Kai Lai Chung. A course in probability theory. 3rd Edition, Academic Press, 2001.
[CM] Francis Comets, Thierry Meyre. Calcul stochastique et modèles de diffusions. Dunod,
2006.
[CT] Rama Cont, Peter Tankov. Financial modelling with Jump Processes. Chapman &
Hall, 2003.
[Dav] Youri Davydov. Cours de DEA ”Processus stochastiques”. Université Lille 1, 1999–
2000.
[DM] Claude Dellacherie, Pierre-André Meyer. Probabilités et potentiels. Hermann, 1975.
[EGK] Nicole El Karoui, Emmanuel Gobet, Etienne Pardoux. Introduction au calcul sto-
chastique. École Polytechnique, 2001.
[Fel] William Feller. An introduction to probability theory and its applications. Vol. 1. 3rd
Edition, Wiley series in probabilities and mathematical statistics, 1968.
[Gal] Léonard Gallardo. Mouvement brownien et calcul d’Itô. Coll. Méthodes mathéma-
tiques. Ed. Hermann. 2008.
[Gué] Hélène Guérin. Processus à temps continu. Notes de cours, M2 Mathématiques, Uni-
versité de Rennes 1, 2009.

147
148 Bibliographie

[Kal] Olav Kallenberg. Foundations of modern probability. 2nd Edition, Springer Series in
Statistics. Probability and its Applications, 2002.
[KS] Ioannis Karatzas, Steven E. Shreve. Brownian motion and stochastic calculus. Sprin-
ger, 1987.
[Kin] John Kingman. Poisson processes. Oxford University Press, 1993.
[LG0] Jean-François Le Gall. Introduction au mouvement brownien. Gazette des Mathé-
maticiens, vol. 40, 1989.
[LG1] Jean-François Le Gall. Mouvement brownien, martingales et calcul stochastique.
Spinger, Coll. Mathématiques et applications, vol. 71, 2013. Voir les notes de cours
M2 Mathématiques de l’Université Paris sud-Orsay.
[Lif] Michel Lifshits. Gaussian random functions, Kluwer, 1995.
[Mal] Florent Malrieu. Processus de Markov et inégalités fonctionnelles. Notes de cours de
Master 2, 2005–2006.
[Pro] Philipp Protter. Stochastic integration and differential equations. Springer, 1995.
[RY] Daniel Revuz, Marc Yor. Continuous martingales and Brownian motion. Springer,
1991.
[Tud] Ciprian Tudor. Cours de calcul stochastique. Notes de cours M2 Mathématiques,
Université Lille 1, 2011.

Vous aimerez peut-être aussi