Vous êtes sur la page 1sur 186

Processus stochastiques

M2 Mathématiques

Jean-Christophe Breton

Université de Rennes 1

Septembre–Octobre 2017

Version du 19 octobre 2017


2
Table des matières

I Processus stochastiques 1
1 Processus stochastiques 3
1.1 Loi d’un processus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Régularité des trajectoires . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Convergence faible des lois de processus . . . . . . . . . . . . . . . . . . . . 10
1.3.1 Rappels sur la convergence faible . . . . . . . . . . . . . . . . . . . 11
1.3.2 Équitension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2 Processus gaussiens 17
2.1 Lois des processus gaussiens . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Régularité gaussienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Espace gaussien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4 Exemples de processus gaussiens . . . . . . . . . . . . . . . . . . . . . . . . 23

3 Bruit blanc et intégration stochastique 29


3.1 Mesure aléatoire (bruit blanc) . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 Intégrale stochastique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3 Approche de l’intégrale de Wiener-Itô . . . . . . . . . . . . . . . . . . . . . 32
3.4 Processus stationnaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4.1 Faible stationnarité . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4.2 Représentation spectrale des processus stationnaires . . . . . . . . . 35
3.4.3 Cas des processus stationnaires discrets . . . . . . . . . . . . . . . . 36

4 Mouvement brownien 39
4.1 Historique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2 Définition, premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2.1 Propriétés immédiates . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.3 Propriétés en loi du mouvement brownien . . . . . . . . . . . . . . . . . . 43
4.4 Propriétés trajectorielles du mouvement brownien . . . . . . . . . . . . . . 45
4.4.1 Loi du 0/1 de Blumenthal . . . . . . . . . . . . . . . . . . . . . . . 45
4.4.2 Conséquences trajectorielles de la loi du 0/1 de Blumenthal . . . . . 48
4.4.3 Régularité trajectorielle brownienne . . . . . . . . . . . . . . . . . . 50
4.5 Variation quadratique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

i
ii Table des matières

4.6 Propriété de Markov forte . . . . . . . . . . . . . . . . . . . . . . . . . . . 53


4.6.1 Temps d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.6.2 Propriété de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.6.3 Principe de réflexion . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.7 Équation de la chaleur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.7.1 Origine physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.7.2 Origine mathématique . . . . . . . . . . . . . . . . . . . . . . . . . 59

II Martingales 65
5 Martingales en temps continu 67
5.1 Filtration et processus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2 Filtrations et temps d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.3 Martingales en temps continu . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.3.1 Définition, exemples . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.3.2 Inégalités pour martingales . . . . . . . . . . . . . . . . . . . . . . . 74
5.3.3 Régularisation de trajectoires . . . . . . . . . . . . . . . . . . . . . 76
5.3.4 Théorèmes de convergence . . . . . . . . . . . . . . . . . . . . . . . 79
5.3.5 Théorème d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.4 Processus de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

6 Semimartingales continues 87
6.1 Processus à variation bornée . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.1.1 Fonctions à variation finie . . . . . . . . . . . . . . . . . . . . . . . 87
6.1.2 Intégrale de Stieltjes . . . . . . . . . . . . . . . . . . . . . . . . . . 90
6.1.3 Extension de l’intégration de Stieltjes à R+ . . . . . . . . . . . . . . 91
6.1.4 Processus à variation finie . . . . . . . . . . . . . . . . . . . . . . . 91
6.2 Martingales locales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
6.3 Variation quadratique d’une martingale locale . . . . . . . . . . . . . . . . 97
6.4 Semimartingales continues . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

III Intégration stochastique 109


7 Intégrale d’Itô 111
7.1 Un premier pas vers la formule d’Itô . . . . . . . . . . . . . . . . . . . . . 111
7.2 Intégrales d’Itô . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
7.3 Propriétés de l’intégrale d’Itô . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.4 Généralisation de l’intégrale stochastique . . . . . . . . . . . . . . . . . . . 127
7.5 Processus d’Itô . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
Table des matières iii

8 Intégration stochastique 133


8.1 Par rapport à une martingale bornée dans L2 . . . . . . . . . . . . . . . . 133
8.2 Par rapport à une martingale locale . . . . . . . . . . . . . . . . . . . . . . 140
8.3 Par rapport à une semimartingale . . . . . . . . . . . . . . . . . . . . . . . 144
8.4 Cas non continu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

9 Formule d’Itô et conséquences 149


9.1 Formule d’Itô . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
9.2 Théorème de Lévy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
9.3 Dubins-Schwarz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
9.4 Représentation des martingales (browniennes) . . . . . . . . . . . . . . . . 159
iv Table des matières
Introduction

Ces notes de cours ont pour but de présenter le mouvement brownien et l’intégration sto-
chastique. Elles sont principalement destinées aux étudiants du Master 2 « Mathématiques
et applications » de l’Université de Rennes 1. Ces notes ont plusieurs sources d’inspiration,
dont principalement [LG1] mais aussi les notes de cours [Gué], [EGK], [CM], [Mal]. Par
ailleurs, des références standard conseillées sur le sujet sont les livres [KS], [RY] (en anglais)
et [Gal], [CM] (en français).
Le contenu de ces notes est le suivant :
On commence par quelques rappels gaussiens en introduction. La notion générale de proces-
sus stochastique est présentée au Chapitre 1. Le Chapitre 2 introduit la classe des processus
gaussiens. Ces chapitres s’inspirent de [Dav] et des références classiques sont [Bil2], [Kal].
Au Chapitre 4, on présente le mouvement brownien, processus stochastique central, dont
on discute de nombreuses propriétés.
Au Chapitre 5, on introduit la notion de martingale en temps continu. On revisite les prin-
cipales propriétés connues dans le cas discret.
La notion de semimartingale, essentielle dans la théorie de l’intégration stochastique, est
présentée au Chapitre 6.
Le Chapitre 8 est consacré à la construction des intégrales stochastiques et à ses principales
propriétés.
Des références valables pour tous les chapitres sont [LG1], [Gué], [EGK], [KS], [RY], [CM]
et [Mal].

Les prérequis de ce cours sont des probabilités de base (des fondements des probabilités
aux conséquences de la LGN et du TCL – niveau L3), les martingales en temps discret
(niveau M1), le mouvement brownien et l’intégration stochastique.

v
vi JCB
c – M2 Math. – Université de Rennes 1
Rappels gaussiens

Dans ce chapitre, on rappelle les principaux résultats sur les variables aléatoires gaus-
siennes et sur les vecteurs aléatoires gaussiens. Ces rappels seront utiles pour généraliser le
cadre gaussien aux processus au Chapitre 2 et présenter la notion de processus gaussien.

Variables gaussiennes
Définition 0.1 Une variable aléatoire X suit la loi normale standard N (0, 1) si elle admet
pour densité
1
t 7→ √ exp − t2 /2 .


De façon générale, une variable aléatoire X suit la loi normale N (m, σ 2 ) si elle admet pour
densité
(t − m)2
 
1
t 7→ √ exp − .
2πσ 2 2σ 2
Si σ 2 = 0, la loi est dégénérée, la variable aléatoire X est constante égale à m. Sa loi est
une mesure de Dirac en m : PX = δm .

Proposition 0.1 Une variable aléatoire X ∼ N (m, σ 2 ) peut se voir comme la translatée
et la dilatée de X0 ∼ N (0, 1) par X = m + σX0 .

X−m
Autrement dit si X ∼ N (m, σ 2 ), σ 2 > 0, on définit la variable centrée réduite X
e=
σ
.
Elle suit la loi N (0, 1). Cette action s’appelle « centrer, réduire ».

Proposition 0.2 Une variable aléatoire X de loi N (m, σ 2 ) a pour


— espérance : E[X] = m ;
— variance : Var(X) = σ 2 ; 
— fonction caractéristique : ϕX (t) = exp imt − σ 2 t2 /2 .
Si X ∼ N (0, σ 2 ) alors les moments de X sont donnés pas

(2n)! 2n
E[X 2n ] = σ et E[X 2n+1 ] = 0. (1)
2n n!

vii
viii JCB
c – M2 Math. – Université de Rennes 1

Démonstration :[Esquisse] Centrer, réduire pour se ramener à X ∼ N (0, 1). Calculs


simples pour E[X], Var(X). Pour la fonction caractéristique, identifier les fonctions holo-
2
morphes E[ezX ] et ez /2 pour z ∈ R et considérer z = ix. Pour les moments de tous ordres
faire des intégrations par parties successives. 

L’estimation de la queue normale suivante s’avère utile : pour N ∼ N (0, 1) et x ≥ 1, on a


Z +∞ Z +∞
1 −t2 /2 1 2 1 2
P(N ≥ x) = √ e dt ≤ √ te−t /2 dt ≤ √ e−x /2 . (2)
2π x 2π x 2π
En fait, on a une estimation valable pour tout x > 0 et meilleure si x ≥ 1 :
Proposition 0.3 Soit N ∼ N (0, 1) et x > 0 alors
1
P(N ≥ x) ≤ √ exp(−x2 /2)
2πx2
Démonstration : En notant f (x) = √1 exp(−x2 /2), on a
x 2π

exp(−x2 /2) 1 exp(−x2 /2) exp(−x2 /2)


f 0 (x) = − √ − 2 √ ≤− √ .
2π x 2π 2π
D’où
Z +∞ Z +∞
1
P(N ≥ x) = √ exp(−u2 /2)du ≤ − f 0 (u)du = −[f (u)]+∞
x = f (x).
x 2π x

Proposition 0.4 Soient N1 ∼ N (m1 , σ12 ) et N2 ∼ N (m2 , σ22 ) indépendantes. Alors N1 +


N2 ∼ N (m1 + m2 , σ12 + σ22 ).

Démonstration : Par les fonctions caractéristiques, avec l’indépendance, on a :

ϕN1 +N2 (t) = ϕN1 (t)ϕN2 (t) = exp im1 t − σ12 t2 /2 exp im2 t − σ22 t2 /2
 

= exp i(m1 + m2 )t − (σ12 + σ22 )t2 /2 = ϕN (m1 +m2 ,σ12 +σ22 ) (t)


ce qui prouve le résultat. 


Proposition 0.5 Soit (Xn )n≥1 une suite de variables normales de loi N mn , σn2 .
1. La suite (Xn )n≥1 converge en loi ssi mn → m ∈ R et σn2 → σ 2 ∈ R+ . La loi limite
est alors N (m, σ 2 ).
2. Si la suite(Xn )n≥1 converge en probabilité vers X, la convergence a lieu dans tous les
espaces Lp , p < +∞.
ix

Démonstration : 1) D’après le théorème de Paul Lévy, la convergence en loi Xn =⇒ X


est équivalente à avoir pour tout t ∈ R :

σn2 2
 
ϕXn (t) = exp imn t − t → ϕX (t), n → +∞. (3)
2

Comme ϕX est continue et ϕX (0) = 1, il existe t 6= 0 tel que |ϕX (t)| 6= 0. Pour ce t, en
2
prenant le module dans (3), on a exp(− σ2n t2 ) → |ϕX (t)|. On déduit alors que limn→+∞ σn2 =
− t22 ln |ϕX (t)| := σ 2 existe. Par suite, on a aussi

exp imn t → exp σ 2 t2 /2 ϕX (t).


 

Supposons que (mn )n≥1 est non bornée. On construit alors une sous-suite mnk → +∞,
k → +∞ (ou −∞ ce qui mène à un raisonnement analogue). Alors pour tout η > 0,
1
P(X ≥ η) ≥ lim sup P(Xnk ≥ η) ≥
k→+∞ 2

puisque, pour k assez grand, P(Xnk ≥ η) ≥ P(Xnk ≥ mk ) = 1/2 (la moyenne mk étant
aussi la médiane). En faisant η → +∞, on a P(X = +∞) ≥ 1/2, ce qui est absurde car
P(X ∈ R) = limn→+∞ P(Xn ∈ R) = 1.
On a donc (mn )n≥1 bornée. Dès lors, si m et m0 sont deux valeurs d’adhérence de (mn )n≥1 ,
0
en passant à la limite sur les bonnes sous-suites, on doit avoir eimt = eim t pour tout t ∈ R,
ce qui exige m = m0 . Il y a donc unicité de la valeur d’adhérence, c’est à dire existence de
la limite m de mn .
Finalement, mn → m et σn → σ (n → +∞) et en passant à la limite dans (3), on a :
 σ2 
ϕX (t) = exp imt − t2
2
ce qui assure X ∼ N (m, σ 2 ).
2) On écrit Xn = σn Nn + mn avec Nn ∼ N (0, 1). Comme Xn converge en loi, les suites
(mn )n≥1 et (σn )n≥1 sont bornées d’après la partie 1). Par convexité pour q ≥ 1

|σn N + mn |q ≤ 2q−1 (|σn |q ||N |q + |mn |q )

et l’expression des moments de Nn , donnée en (1) assure alors

sup E |Xn |q < +∞ ∀q ≥ 1.


 
n≥1

Comme la convergence en probabilité donne la convergence ps d’une sous-suite Xnk , par le


lemme de Fatou, on a :
h i
E |X| = E lim |Xnk | ≤ lim inf E[Xnk |q ] ≤ sup E |Xnk |q ≤ sup E |Xn |q < +∞.
 q q
   
k→+∞ k→+∞ k≥1 n≥1
x JCB
c – M2 Math. – Université de Rennes 1

Soit p ≥ 1, la suite |Xn − X|p converge vers 0 en probabilité et est uniformément intégrable
car bornée dans L2 (d’après ce qui précède avec q = 2p). Elle converge donc dans L1 vers
0 ce qui prouve 2). 

Le caractère universel de la loi normale est illustré par le résultat suivant. Il montre que la
loi normale standard contrôle les fluctuations par rapport à leur moyenne des effets cumulés
d’un phénomène aléatoire répété avec des répétitions indépendantes.
Dans la suite, iid signifiera indépendant(e)s et identiquement distribué(e)s, c’est à dire
de même loi. Souvent, on notera aussi vaiid pour variables aléatoires indépendantes et
identiquement distribuées.

Théorème 0.1 (TCL) Soit (Xn )n≥1 une suite de variables aléatoires iid, d’espérance m
et de variance finie σ 2 > 0. Soit Sn = X1 + · · · + Xn la somme partielle. Alors quand
n → +∞
Sn − nm
√ =⇒ N (0, 1).
σ2n

Remarque 0.1 — Le TCL complète la loi des grands nombres : en effet, la LGN
donne Sn /n → m, c’est à dire √ Sn − nm ≈ 0. Le TCL donne la vitesse de cette
convergence (en loi) : elle est en n. Noter que la convergence est presque sûre dans
la LGN et en loi (donc beaucoup plus faible) dans le TCL.
— La loi N (0, 1) apparaı̂t à la limite dans le TCL alors que les variables aléatoires
Xi sont de lois arbitraires (de carré intégrable) : ce résultat justifie le rôle universel
de la loi normale. Elle modélise les petites variations de n’importe quelle loi (avec
un moment d’ordre 2) par rapport à sa moyenne.

Démonstration : D’après le théorème de Paul Lévy, il suffit de montrer la convergence


des fonctions caractéristiques. Posons Yi = (Xi − m)/σ, si bien que les variables aléatoires
Yi sont indépendantes de même loi avec E[Yi ] = 0, Var(Yi ) = Var(Xi )/σ 2 = 1. Notons
0
Sn
Sn0 = Y1 + · · · + Yn et Zn = Sn√−nm
n
=√ n
. On a

Sn0
       
t 0 t
ϕZn (t) = E exp it √ = E exp i √ Sn = ϕSn0 √
n n n
      n
t t t
= ϕY1 √ . . . ϕYn √ = ϕ Y1 √
n n n

en utilisant ϕY1 +···+Yn = ϕY1 . . . ϕYn = ϕnY1 par indépendance et identique distribution des
variables aléatoires Yi .
Comme Y1 a un moment d’ordre 2, ϕY1 est dérivable 2 fois avec ϕY1 (0) = 1, ϕ0Y1 (0) =
iE[Y1 ] = 0 et ϕ00Y1 (0) = i2 E[Y12 ] = −1. La formule de Taylor à l’ordre 2 en 0 donne alors

x2 00 x2
ϕY1 (x) = ϕY1 (0) + xϕ0Y1 (0) 2
+ ϕY1 (0) + x (x) = 1 − + x2 (x)
2 2
xi

où la fonction  vérifie limx→0 (x) = 0. On a donc

n !n  n
t2 √ t2 √
 
t t 1
ϕZn (t) = ϕY1 √ = 1 − √ 2 + √ 2 (t/ n) = 1− + (1/ n)
n 2 n n 2n n
t2 √  t2 √ 
    
 1 1
= exp n ln 1 − + (1/ n) = exp n − + (1/ n)
2n n 2n n

 2 
t
= exp − + (1/ n) .
2

(Noter que la fonction reste (·) dans ϕY1 est à valeurs complexes si bien qu’il est un peu
rapide de prendre directement le logarithme comme précédemment. Cependant l’argument
peut être précisé sans passer par la forme exponentielle avec les logarithmes ; on renvoie à
un (bon) cours de L3 ou de M1.) On a donc pour chaque t ∈ R,

lim ϕZn (t) = exp − t2 /2 = ϕN (0,1) (t).



n→+∞

Le théorème de Paul Lévy donne alors la convergence en loi de Zn vers N (0, 1), ce qui
prouve le TCL. 

Remarque 0.2 En général, lorsque n est grand, on approxime la loi d’une somme de
variables aléatoires iid de L2 (Ω) par une loi normale grâce au TCL de la façon suivante :
2
Soit Sn = X1 + · · · + Xn la somme de variables aléatoires iid Xi avec σX < +∞, on a
d’après le TCL
X1 + · · · + Xn − nE[X1 ]
√ =⇒ N (0, 1).
σ n
−nE[X1 ]
Quand n est grand on approxime alors la loi de X1 +···+X√n
σ n
par celle de Y = N (0, 1).
Si bien que la loi de la somme Sn = X1 + · · · + Xn est approximée par celle de

nE[X1 ] + σ nY ∼ N nE[X1 ], σ 2 n .


Règle d’approximation : La somme Sn d’une suite de vaiid L2 de moyenne m et de


variance σ 2 s’approxime par Sn ≈ N (nm, nσ 2 ).

Application (Moivre-Laplace). Comme une variable aléatoire Xn de loi binomiale


B(n, p) peut se voir comme la somme de n variables aléatoires i indépendantes de loi
de Bernoulli b(p), Xn = 1 + · · · + n , la remarque précédente montre qu’on peut approcher
la loi B(n, p) par la loi normale N np, np(1 − p) .
xii JCB
c – M2 Math. – Université de Rennes 1

Vecteurs gaussiens
On considère des vecteurs aléatoires dans Rn . Muni de son produit scalaire canonique,
Rn est un espace n
Pn euclidien. Pour deux vecteurs a = (a1 , . . . , an ), b = (b1 , . . . , bn ) ∈ R , on
note ha, bi = i=1 ai bi leur produit scalaire. On peut généraliser cette section à un espace
E euclidien (si dim(E) = n alors E ∼ Rn ).

Définition 0.2 (Vecteur gaussien) Un vecteur aléatoire X = (X1 , . . . , Xn ) est gaussien


ssi toutes les combinaisons linéaires de ses coordonnées ha, Xi = a1 X1 + · · · + an Xn suivent
une loi gaussienne dans R (pour tout a = (a1 , . . . , an ) ∈ Rn ).
Dans un cadre euclidien E, X vecteur à valeurs dans E est gaussien ssi pour tout a ∈ E,
ha, Xi suit une loi gaussienne.
En particulier, chaque marginale Xi suit une loi normale et a donc un moment d’ordre
2 fini. Les moments joints E[Xi Xj ] sont donc bien définis et on peut définir licitement la
matrice de covariance :
Définition 0.3 La matrice de covariance d’un vecteur gaussien X = (X1 , . . . , Xn ) est
la matrice carrée symétrique, positive

K = Cov(Xi , Xj ) 1≤i,j≤n .
L’espérance de X = (X1 , . . . , Xn ) est le vecteur des espérances de ses marginales

E[X] = E[X1 ], . . . , E[Xn ] .
Si E[X] = 0, le vecteur X est dit centré.

Fonction caractéristique gaussienne en dimension n


Pn
Si X = (X1 , . . . , Xn ) est un vecteur gaussien alors ha, Xi = i=1 ai Xi suit une loi
normale de paramètres
 
E ha, Xi = E[a1 X1 + · · · + an Xn ] = a1 E[X1 ] + · · · + an E[Xn ] = ha, E[X]i
Xn
ai aj Cov(Xi , Xj ) = at Cov(X)a.

Var ha, Xi = Var(a1 X1 + · · · + an Xn ) =
i,j=1

La variable aléatoire ha, Xi suit donc la loi N ha, E[X]i, at Cov(X)a , sa fonction caracté-
ristique est donnée par
 
1 t 2
ϕha,Xi (x) = exp ixha, E[X]i − (a Cov(X)a)x .
2
D’après la définition des fonctions caractéristiques d’une variable aléatoire et d’un vecteur
aléatoire
ϕX (x) = E eihx,Xi = ϕhx,Xi (1).
 

On en déduit :
xiii

Proposition 0.6 La fonction caractéristique d’un vecteur gaussien X = (X1 , . . . , Xn ) est


donnée par
 
1 t
ϕX (x) = exp ihx, E[X]i − (x Cov(X)x)
2
 
1
= exp ihx, E[X]i − hx, Cov(X)xi . (4)
2

Remarque 0.3 — La loi d’un vecteur gaussien est connue dès qu’on a le vecteur
moyenne E[X] et la matrice de covariance Cov(X).
— On parle du vecteur gaussien standard en dimension n lorsque E[X] = 0 et
Cov(X) = In . Sa fonction caractéristique se simplifie en

ϕX (x) = exp − hx, xi/2 = exp − kxk2 /2 .


 

— Pour un vecteur gaussien centré, on a E[X] = 0 et on montre que

hx, Cov(X)xi = E[hx, Xi2 ],

si bien que dans le cas centré la fonction caractéristique se réécrit :


   
1 1 2
ϕX (x) = exp − hx, Cov(X)xi = exp − E[hx, Xi ] .
2 2

— En prenant x = (x1 , 0, . . . , 0), on a

ϕX1 (x1 ) = ϕX (x) = exp iE[X1 ]x1 − Var(X1 )x21 /2 .





On retrouve que X1 ∼ N E[X  1 ], Var(X 1 ) . Plus généralement, pour tout 1 ≤ i ≤ n,
on a Xi ∼ N E[Xi ], Var(Xi ) .

Comme pour les variables aléatoires gaussiennes, on peut se ramener à un vecteur gaussien
standard en centrant et en réduisant un vecteur gaussien quelconque non dégénéré. On a
en effet :

Proposition 0.7 Soit X ∼ N (m, K) un vecteur gaussien non dégénéré (ie. det K =
6 0)
avec m ∈ Rn et K sa matrice de covariance. Alors
√ −1
K (X − m) ∼ N (0, In ). (5)

Si X ∼ N (m, K) est dégénéré, c’est que le vecteur X vit dans un sous-espace vectoriel
strict de Rn . Il faut l’étudier dans ce sous-espace vectoriel.
Démonstration : Comme le vecteur X est non dégénéré, sa matrice
√ de covariance K est
définie (c’est à dire inversible). Il existe donc une matrice A = K inversible telle que
K = AAt . (Par la méthode de Cholesky, A peut être choisie triangulaire inférieure.) Il est
xiv JCB
c – M2 Math. – Université de Rennes 1
√ −1
donc légitime d’utiliser K dans (5).

On montre maintenant que X e = K −1 (X − m) est gaussien, standard :
h i
ϕXe (x) = E exp(ihx, Xi)
e
h √ −1 i
= E exp(ihx, K (X − m)i)
h √ −1 i
= E exp(ih( K )t x, X − mi)
h √ −1 i  √ −1 
= E exp(ih( K )t x, Xi) × exp −ih( K )t x, mi
 √ −1   √ −1 t 
t
= ϕX ( K ) x × exp −ih( K ) x, mi
√ −1 t 1 √ −1 t √ −1 t √ −1
   
= exp ihm, ( K ) xi − h( K ) x, K( K ) xi × exp −ih( K )t x, mi
2
√ √
 
1 −1 t −1 t
= exp − h( K ) x, K( K ) xi
2
1 √ −1 √ −1 t 1 √ −1 √ √ t √ −1 t
   
= exp − hx, K K( K ) xi = exp − hx, K K( K) ( K ) xi
2 2
   
1 1 2
= exp − hx, xi = exp − kxk .
2 2

e ∼ N (0, In ).
On a donc bien X 

Remarque 0.4 Comme pour les variables aléatoires normales, un vecteur aléatoire X ∼
N (m, K) avec K inversible peut se voir comme la translatée et dilatée du vecteur gaussien
standard X0 ∼ N (0, In ) :

X ∼ KX0 + m.

Indépendance de variables gaussiennes

Proposition 0.8 Soient (X, Y ) un couple gaussien. Alors X et Y sont indépendantes ssi
Cov(X, Y ) = 0.

Démonstration : Le sens direct est vrai quelque soit la loi de X et de Y et suit de E[XY ] =
E[X]E[Y ]. Pour la réciproque, on sait que X et Y sont indépendantes ssi ϕ(X,Y ) (t1 , t2 ) =
ϕX (t1 )ϕY (t2 ). Supposons le couple centré pour simplifier. Le vecteur gaussien (X, Y ) a une
matrice de covariance diagonale :
 2 
σX 0
0 σY2
xv

car les termes diagonaux sont Cov(X, Y ) = Cov(Y, X) = 0. On déduit de l’expression (4)
de la fonction caractéristique de (X, Y ) que
 1   1   1 
ϕ(X,Y ) (t1 , t2 ) = exp − t21 σX
2
+ t2 σY2 = exp − t21 σX
2
× exp − t22 σY2
2 2 2
= ϕX (t1 )ϕY (t2 ),

ce qui justifie l’indépendance de X et de Y . 

Il est aisé de généraliser de la même façon le résultat pour des vecteurs. Attention, il faut
bien veiller à ce que considérer ensemble les vecteurs forment encore un vecteur gaussien,
sinon l’exemple ci-dessous montre que le résultat est faux (cf. aussi un autre exemple ci-
dessous).
Exemple : Considérons par exemple une variable X ∼ N (0, 1) et une seconde variable ε
indépendante de X et telle que P(ε = 1) = P(ε = −1) = 1/2. Alors X1 = X, X2 = εX sont
deux variables N (0, 1). De plus, Cov(X1 , X2 ) = E[X1 X2 ] = E[ε]E[X 2 ] = 0. Cependant X1
et X2 ne sont évidemment pas indépendantes (par exemple parce que |X1 | = |X2 |). Dans cet
exemple, le couple (X1 , X2 ) n’est pas un vecteur gaussien dans R2 bien que ses coordonnées
soient des variables gaussiennes.

Proposition 0.9 Soit (X1 , . . . , Xn , Y1 , . . . , Yp ) un vecteur gaussien de dimension n + p.


Les deux vecteurs aléatoires X = (X1 , . . . , Xn ) et Y = (Y1 , . . . , Yp ) sont indépendants ssi
toutes les covariances Cov(Xi , Yj ), 1 ≤ i ≤ n, 1 ≤ j ≤ p sont nulles.

Densité gaussienne en dimension n


Soit X ∼ N (0, In ) un vecteur gaussien standard en dimension n. Comme Cov(X) = In ,
les marginales X1 , . . . , Xn sont toutes indépendantes. La loi du vecteur X = (X1 , . . . , Xn )
est donc la loi produit de ses marginales PX = PX1 ⊗ · · · ⊗ PXn . En terme de densité, la
densité de X est aors donnée par le produit tensoriel

fX (x1 , . . . , xn ) = fX1 (x1 ) × · · · × fXn (xn )


   
1 2 1 2
= √ exp(−x1 /2) × · · · × √ exp(−xn /2)
2π 2π
1 2 2

= exp − (x 1 + · · · + x n )/2 .
(2π)n/2

On a justifié :

Proposition 0.10 La densité d’un vecteur gaussien X ∼ N (0, In ) standard en dimension


n est
1
exp − (x21 + · · · + x2n )/2 .

fX (x) = n/2
(2π)
xvi JCB
c – M2 Math. – Université de Rennes 1

Pour passer au cas général d’un vecteur gaussien X ∼ N (m, K) non dégénéré (ie. K =
Cov(X) inversible), on va utiliser
√ la représentation donnée en (5) avec le vecteur gaussien
réduit X0 ∼ N (0, In ) : X ∼ KX0 + m. Cela permet d’utiliser la densité déjà justifiée
dans la proposition précédente : Soit A ∈ B(Rn )
√ 
P(X ∈ A) = P KX0 + m ∈ A
√ −1 
= P X0 ∈ K (A − m)
exp(−kxk2 /2)
Z
= √ −1 dx
K (A−m) (2π)n/2
√ −1
exp(−k K (y − m)k2 /2)
Z
dy
= n/2

A (2π) det K

(avec le changement de variable y = Kx + m)
exp − h(x − m), K −1 (x − m)i/2
Z 
= dx.
A ((2π)n det K)1/2
On a obtenu la forme générale de la densité d’un vecteur gaussien non dégénéré :
Proposition 0.11 La densité d’un vecteur gaussien X ∼ N (m, K) non dégénéré est
exp − h(x − m), K −1 (x − m)i/2

fX (x) = .
((2π)n det K)1/2

Variables gaussiennes et vecteurs non gaussiens


On a déjà vu que si un vecteur X = (X1 , . . . , Xn ) est gaussien alors ses marginales Xi le
sont aussi, de même les combinaisons linéaires de ses marginales le sont. La réciproque
est fausse : si des variables aléatoires sont gaussiennes alors le vecteur formé par ces
variables n’est pas nécessairement gaussien. En effet, prenons X une variable aléatoire de
loi N (0, 1) et Y de loi donnée, pour a > 0 fixé, par

X si |X| ≤ a,
Y =
−X si |X| > a.
Alors Y est de loi N (0, 1) en effet
ϕY (t) = E[eitY ] = E[eitX 1|X|≤a ] + E[e−itX 1{|X|>a} ]
= E[eitX 1{|X|≤a} ] + E[eitX 1{|−X|>a} ] = E[eitX 1{|X|≤a} ] + E[eitX 1{|X|>a} ]
= E[eitX (1{|X|≤a} + 1{|X|>a} )]
2 /2
= E[eitX ] = e−t
car la loi de X est symétrique : L(X) = L(−X). Puis, la variable X + Y est donnée par

X + X = 2X si |X| ≤ a
X +Y =
X −X =0 si |X| > a
xvii

= 2X1{|X|≤a} .

La combinaison linéaire X + Y a un atome en 0 car P(X + Y = 0) ≥ P(|X| > a) > 0.


Elle ne suit donc pas une loi gaussienne. Le couple aléatoire (X, Y ) n’est donc pas gaussien
(sinon on devrait avoir X + Y de loi gaussienne).
De plus, cet exemple montre aussi que dans la Proposition 0.8, l’hypothèse (X, Y ) gaussien
est nécessaire et il ne suffit pas de supposer que X et Y sont des variables gaussiennes. En
effet,

Cov(X, Y ) = E[XY ] = E[X 2 1|X|≤a ] − E[X 2 1{|X|>a} ]


= E[X 2 ] − E[X 2 1{|X|>a} ] − E[X 2 1{|X|>a} ]
= 1 − 2E[X 2 1{|X|>a} ].

La fonction u(a) = E[X 2 1{|X|>a} ] tend vers 0 en +∞ par convergence dominée, est continue
et vaut E[X 2 ] = 1 en 0. Par le théorème des varleurs intermédiaires, il existe donc a tel
que u(a) = 1/2 et Cov(X, Y ) = 0. Pourtant, X et Y sont non indépendantes sinon la loi
du couple (X, Y ) serait
   
0 1 0
P(X,Y ) = PX ⊗ PY = N (0, 1) ⊗ N (0, 1) = N ,
0 0 1

qui est gaussienne, ce qui est faux. On a donc des variables gaussiennes X et Y non corrélées
mais non indépendantes.
xviii JCB
c – M2 Math. – Université de Rennes 1
Première partie

Processus stochastiques

1
Chapitre 1

Processus stochastiques

Ce chapitre présente la notion générale de processus stochastique. On décrit d’abord les


lois des processus, leurs propriétés (Section 1.1), les trajectoires des processus (Section 1.2)
et la notion de convergence faible des processus (Section 1.3).

Définition 1.1 (Processus stochastique) Un processus stochastique X = (Xt )t∈T est


une famille de variables aléatoires Xt indexée par un ensemble T .

En général T = R ou R+ et on considère que le processus est indexé par le temps t.


Si T est un ensemble fini, le processus est un vecteur aléatoire. Si T = N alors le processus
est une suite de variables aléatoires. Plus généralement quand T ⊂ Z, le processus est dit
discret. Pour T ⊂ Rd , on parle de champ aléatoire (drap quand d = 2).
Un processus dépend de deux paramètres : Xt (ω) dépend de t (en général le temps) et de
l’aléatoire ω ∈ Ω.
— Pout t ∈ T fixé, ω ∈ Ω 7→ Xt (ω) est une variable aléatoire sur l’espace de probabilité
(Ω, F, P).
— Pour ω ∈ Ω fixé, t ∈ T 7→ Xt (ω) est une fonction à valeurs réelles, appelée trajectoire
du processus. C’est un enjeu que de savoir si un processus admet des trajectoires
mesurables, continues, dérivables ou encore plus régulières.
Dans la suite, sauf mention contraire, on prendra T = R+ ou [0, 1].

1.1 Loi d’un processus


Définition 1.2 (Lois fini-dimensionnelles) On appelle lois fini-dimensionnelles d’un
processus l’ensemble des lois

L(Xt1 , . . . , Xtn ) : t1 , . . . , tn ∈ T, n ∈ N . (1.1)

Un processus X = (Xt )t∈T est à valeurs dans RT . On munit RT de la tribu cylindrique


σ(Cyl) engendrée par la famille des cylindres :

Cyl = {x : T → R : x(t1 ) ∈ A1 , . . . , x(tp ) ∈ Ap }, A1 , . . . , Ap ∈ B(R), p ∈ N .

3
4 Chapitre 1. JCB
c – M2 Math. – Université de Rennes 1

Il s’agit de la tribu sur RT rendant mesurables les applications coordonnées Πt : x ∈ RT 7→


x(t) ∈ R. Il est légitime de regarder un processus X comme une fonction aléatoire à valeurs
dans (RT , σ(Cyl)) :
(RT , σ(Cyl))

(Ω, F) →
X: (1.2)
ω 7→ X(ω) = Xt (ω) t∈T
On définit bien une variable aléatoire v̀aleurs dans (RT , σ(Cyl)).TEn effet pour tout cylindre
C = {x ∈ RT : x(t1 ) ∈ A1 , . . . , x(tp ) ∈ Ap }, on a X −1 (C) = pi=1 Xt−1i
(Ai ). Mais chaque
Xti étant une variable aléatoire, on a Xt−1
i
(A i ) ∈ F et X −1
(C) ∈ F. Comme Cyl engendre
σ(Cyl), on a bien la F, σ(Cyl) -mesurabilité de (1.2)

On peut alors considérer la loi PX du processus sur RT , σ(Cyl) comme mesure image P
par la variable
 (1.2). En fait les lois fini-dimensionnelles (1.1) de X définissent une loi sur
RT , σ(Cyl) par extension :
Théorème 1.1 (Extension de Kolmogorov) Soit Q = {Qt1 ,...,tn : t1 , . . . , tn ∈ T, n ∈
N∗ } une famille de lois fini-dimensionnelles vérifiant les conditions de compatibilité :
— si s = (ti1 , . . . , tin ) est une permutation de t = (t1 , . . . , tn ) alors pour tout Ai ∈
B(R), i = 1, . . . , n, on a

Qt (A1 × · · · × An ) = Qs (Ai1 × · · · × Ain );

— si t = (t1 , . . . , tn ) avec n ≥ 1, s = (t1 , . . . , tn−1 ) et A ∈ B(Rn−1 ) alors

Qt (A × R) = Qs (A).

Alors il existe une mesure de probabilité P sur RT , σ(Cyl) qui admet Q = {Qt1 ,...,tn :
t1 , . . . , tn ∈ T, n ∈ N∗ } pour famille de lois fini-dimensionnelles.
Démonstration : Admis, cf. [Kal] ou [KS]. 

Comme les lois fini-dimensionnelles d’un processus X = (Xt )t∈T satisfont immédiatement
les relations de compatibilité, le théorème d’extension de Kolmogorov (Th. 1.1) permet
effectivement de considérer la loi P = PX d’un processus X sur RT , σ(Cyl) . De plus :
Proposition 1.1 La loi d’un processus  stochastique X = (Xt )t∈T est entièrement caracté-

risée par ses lois fini-dimensionnelles L(Xt1 , . . . , Xtn ) : t1 , . . . , tn ∈ T, n ∈ N .
Démonstration : Considérons deux processus X (1) et X (2) partageant les mêmeslois fini-
dimensionnelles. Nous montrons que leur loi P1 et P2 sont égales sur RT , σ(Cyl) .
Remarquons que l’ensemble Cyl des cylindres est un π-système (stable par ∩ finie : l’in-
tersection de deux cylindres est encore un cylindre). Notons M = {A ∈ σ(Cyl) : P1 (A) =
P2 (A)}. Il s’agit d’une classe monotone (RT ∈ M ; M est stable par différence ensembliste,
M est stable par réunion croissante) et M contient Cyl (puisque X (1) et X (2) ont mêmes
lois fini-dimensionnelles) : pour un cylindre C,
(1) (1)  (2) (2) 
P1 (C) = P Xt1 ∈ A1 , . . . , Xtn ∈ An = P Xt1 ∈ A1 , . . . , Xtn ∈ An = P2 (C).
1.1. Loi d’un processus 5

Le théorème de classe monotone assure alors que σ(Cyl) ⊂ M, ce qui donne le résultat. 

Il y a plusieurs façons pour des processus stochastiques X et Y d’être égaux :


Définition 1.3 (Égalités de processus)
— Deux processus X et Y ont même lois s’ils ont même lois fini-dimensionnelles :
pour tout n ∈ N et t1 , . . . , tn ∈ T ,
 L 
Xt1 , . . . , Xtn = Yt1 , . . . , Ytn .
L
On écrira X = Y .
— On dira que Y est une version (ou une modification) du processus X si pour tout
t ∈ T , P(Xt = Yt ) = 1.
— Deux processus X et Y sont dit indistinguables s’il existe N négligeable tels que
pour ω 6∈ N on a Xt (ω) = Yt (ω) pour tout t ∈ T ; de façon un peu abusive (parce que
{Xt = Yt , ∀t ∈ T } n’est pas nécessairent un évènement), on écrit : P(Xt = Yt , ∀t ∈
T ) = 1.

Il est facile de voir que pour deux processus stochastiques X et Y , les notions d’égalité des
lois de processus s’ordonnent logiquement de la façon suivante :
Proposition 1.2 indistinguable ⇒ modification ⇒ même lois fini-dimensionnelles.

Les implications sont strictes, comme indiqué dans les exemples ci-dessous :

Exemple 1.1 1) Soit N ∼ N (0, 1) et pour tout t : Xt = N , Yt = −N . Alors (Xt )t≥0 et


(Yt )t≥0 ont même lois fini-dimensionnelles tandis que P(Xt = Yt ) = P(2N = 0) = 0, ie.
X, Y ne sont pas version l’un de l’autre. 
2) Soit l’espace de probabilité [0, 1], B([0, 1]), λ et T = [0, 1]. Considérons D la diagonale
de [0, 1] × [0, 1] et définissons

X(t, ω) = 0 ∀(t, ω), Y (t, ω) = 1D (t, ω).

Pour t fixé, on a X(t, ω) = 0 et Y (t, ω) = 1{t} (ω). On a donc X(t, ω) = Y (t, ω) pour
tout ω 6= t, c’est à dire ps
 : les processus X, Y sont versions l’un de l’autre. Pourtant,
P ω : X(t, ω) = Y (t, ω), ∀t = 0 : les processus X et Y ne sont pas indistinguables.

Dans l’exemple 2) ci-dessus, observons que les trajectoires de X sont continues tandis
que celles de Y ne le sont pas. En fait, c’est ce qu’il manque pour la réciproque puisque
l’implication « indistinguable ⇒ modification » admet la réciproque suivante :
Proposition 1.3 Soient T séparable (ie. T contient une partie dense dénombrable) et
X, Y modifications ont des trajectoires continues ps alors ils sont indistinguables.
6 Chapitre 1. JCB
c – M2 Math. – Université de Rennes 1

Si T ⊂ R alors on peut supposer seulement la continuité à droite ou à gauche des trajec-


toires.
Démonstration : On choisit D une partie dénombrable dense dans T . Pour tout t ∈
D, P(Xt = Yt ) = 1 et par dénombrabilité de D, l’ensemble A = {Xt = Yt , ∀t ∈ D}
est de probabilité 1. L’ensemble B = {X et Y sont à trajectoires continues} est aussi de
probabilité 1. Soit ω ∈ A∩B tel que t 7→ Xt (ω), t 7→ Yt (ω) sont continues. On a P(A∩B) = 1
et pour ω ∈ A ∩ B :
— si t ∈ D, on a Xt = Yt .
— si t 6∈ D, il existe tn ∈ D avec tn → t, n → +∞. On a Xtn = Ytn (tn ∈ D, ω ∈ A)
et Xtn → Xt , Ytn → Yt (continuité des deux trajectoires pour ω ∈ B). On a donc
Xt = Yt sur A ∩ B.
Finalement pour ω ∈ A ∩ B : Xt = Yt ∀t ∈ T ; ce qui signifie que X, Y sont des processus
indistinguables. 

Exemples de propriétés en loi des processus


Il existe de nombreuses classes de processus particuliers : les processus de Markov (en
particulier les chaı̂nes de Markov quand T = N), les martingales, les processus gaussiens, les
processus de Poisson, les processus stables ou encore les processus de Lévy (qui contiennent
les trois exemples précédents). Ces propriétés ont des propriétés remarquables de leurs lois
fini-dimensionnelles. Nous donnons ici quelques exemples de telles propriétés en loi des
processus. Ces propriétés sont souvent fort utiles pour modéliser des phénomènes réels.
L
Définition 1.4 Un processus est dit (strict) stationnaire si pour tout h ≥ 0, (Xt+h )t≥0 =
(Xt )t≥0 ne dépend pas de h > 0, c’est à dire pour tout h et tout t1 , . . . , tn ≥ 0, on a
L
(Xt1 +h , . . . , Xtn +h ) = (Xt1 , . . . , Xtn ).
Un processus est dit à accroissements stationnaires si la loi des accroissements Xt+h −
L
Xt ne dépend pas de t > 0, ie. Xt+h − Xt = Xh .
Un processus X est dit à accroissements indépendants si pour tout 0 < t1 < t2 · · · < tn ,
les variables aléatoires Xt1 , Xt2 − Xt1 , . . . , Xtn − Xtn−1 sont indépendantes.
Exemple.P T = N. Soit (Xn )n≥1 une suite de variables aléatoires indépendantes. On consi-
dère Sn = ni=1 Xi le processus discret de sommes partielles. On parle de marche aléatoire.
Alors (Sn )n∈N∗ est un processus à accroissements indépendants. Si en plus les variables
aléatoires Xn sont de même loi (les variables aléatoires sont iid), le processus est à accrois-
sements indépendants et stationnaires.

1.2 Régularité des trajectoires


D’après l’Exemple 1.1, les versions d’un processus stochastiques n’ont pas toujours la
même régularité de leurs trajectoires. Aussi, il est intéressant de chercher si un processus X
admet des versions X e dont les trajectoires ont de bonnes propriétés de régularité et d’avoir
1.2. Régularité des trajectoires 7

des conditions le garantissant. Dans cette section, on s’attache à trouver des versions à
trajectoires continues d’un processus.

Théorème 1.2 (Kolmogorov-Čentsov) Soit (Xt )t∈T un processus indexé par un inter-
valle T borné de R et à valeurs dans (E, d) espace métrique complet. On suppose qu’il
existe a, b, C > 0 vérifiant pour tout s, t ∈ T :

E d(Xt , Xs )a ≤ C|t − s|1+b .


 
(1.3)

Alors il existe une version X


e de X dont les trajectoires sont höldériennes d’exposant γ pour

tout γ ∈]0, b/a[, ie. pour tout s, t ∈ T : d X es (ω) ≤ Cγ (ω)|t − s|γ . En particulier,
es (ω), X
Xe est une version continue de X.

Remarque 1.1 — La condition du théorème porte sur les lois de dimension 2 :


Z
a
|x − y|a P(Xt ,Xs ) (dx, dy),
 
E d(Xt , Xs ) =
R2

ce qui est une condition légère sur la loi, caractérisée par toutes les loi fini-dimensinnelles.
En pratique, pour vérifier (1.3), il faut donc calculer des moments pour des vecteurs
de dimension 2.
— Quand (E, d) = (R, | · |), a priori, dans le théorème, a et b sont non liés. En réalité,
on peut toujours prendre a ≥ 1 + b. En effet, si a < 1 + b, alors (1.3) se réécrit
d(Xt , Xs ) a
 
E ≤ c|t − s|1+b−a
t−s
avec 1 + b − a > 0. En faisant s → t, la dérivée dans le sens La de (Xt )t∈T est nulle et
(Xt )t∈T est donc constant. Ce n’est donc pas très interéssant d’utiliser le Théorème
1.2 dans un tel cas : puisque le processus initial est en fait constant, il est évident
qu’il est aussi continu.
— La condition b > 0 est essentielle : le processus de Poisson compensé (Πt − t)t≥0
fournit un contre-exemple quand b = 0. Soit Xt = Πt − t où (Πt )t≥0 est un pro-
cessus de Poisson (processus à accroissements indépendants, stationnaires avec des
marginales de loi de Poisson, cf. Section 5.4). On a

Πt ∼ P(t), E[Πt ] = t, Var(Πt ) = t,

soit pour X :

E |Xt − Xs |2 = Var Πt − Πs = Var Πt−s = t − s.


   

On a donc (1.3) avec a = 2, b = 0 et C = 1. Or les trajectoires du processus de


Poisson sont càdlàg (et même constantes par morceaux avec des sauts +1) or d’après
la Prop. 1.3 et la remarque qui la suit, il devrait coı̈ncider avec sa version continue !
8 Chapitre 1. JCB
c – M2 Math. – Université de Rennes 1

Démonstration : (Th. 1.2, Kolmogorov-Čenstov) Nous supposons T intervalle borné. Si


l’intervalle T est non borné (par exemple si T = R+ ), on peut appliquer le cas borné à
T = [0, 1], [1, 2], [2, 3] etc et on trouve encore que X a une modification continue définie
sur T , qui est localement höldérienne d’exposant γ pour tout γ ∈]0, b/a[. Pour simplifier
la présentation, on prend dans la suite T = [0, 1].
Il suffit de montrer que pour γ ∈]0, b/a[ fixé, X a une modification dont les trajectoires sont
höldériennes d’exposant γ. En effet, on appliquera alors ce résultat à une suite γn % b/a
en observant que les processus obtenus sont des versions continues du même processus X
donc indistinguables par la Prop. 1.3.
On note D l’ensemble (dénombrable) des nombres dyadiques t ∈ [0, 1[ qui s’écrivent sous
la forme p
X
t= k 2−k avec k = 0 ou 1.
k=1

Le point clef est le résultat suivant dû au lemme de Borel-Cantelli :


Lemme 1.1 Pour tout γ ∈]0, b/a[, il existe ps une constante Cγ (ω) < +∞ telle que pour
tout s, t ∈ D
d Xs , Xt ≤ Cγ (ω)|t − s|γ .


Preuve du lemme. Avec l’inégalité de Markov, l’hypothèse (1.3) du Théorème 1.2 en-
traı̂ne que, pour a > 0 et s, t ∈ T , u > 0

P d(Xs , Xt ) ≥ u ≤ u−a E d(Xs , Xt )a ≤ Cu−a |t − s|1+b .


  

En appliquant cette inégalité avec s = (i−1)2−n , t = i2−n (pour i = 1, . . . , 2n ) et u = 2−nγ ,


on a :
P d(X(i−1)2−n , Xi2−n ≥ 2−nγ ) ≤ C2naγ 2−(1+b)n .


En sommant sur i ∈ [1, 2n ], on trouve


2n
[ 
d(X(i−1)2−n , Xi2−n ) ≥ 2−nγ ≤ 2n C2naγ−(1+b)n = C2−n(b−aγ) .

P
i=1

Comme b − aγ > 0, on a
2n n
+∞  [
X 
P d(X(i−1)2−n , Xi2−n ) ≥ 2−nγ < +∞
n=1 i=1

et le lemme de Borel-Cantelli assure que ps il existe n0 (ω) tel que dès que n ≥ n0 (ω) pour
tout i ∈ {1, . . . , 2n }, on a
d X(i−1)2−n , Xi2−n ≤ 2−nγ .


A fortiori, ps  
d(X(i−1)2−n , Xi2−n )
Kγ (ω) := sup sup < +∞
n≥1 1≤i≤2n 2−nγ
1.2. Régularité des trajectoires 9

(pour n ≥ n0 (ω), le terme entre parenthèses est majoré par 1, et il y a un nombre fini de
terme n ≤ n0 (ω) : le supn est bien fini !).
On obtient alors le résultat du lemme avec Cγ (ω) = 2γ+1 (1 − 2−γ )Kγ (ω). En effet, considé-
rons s, t ∈ D avec s < t. Soit p ≥ 1 tel que 2−p−1 < t − s ≤ 2−p . Il existe m ≥ 1 tel qu’on
puisse écrire s, t sous la forme :
s = k2−p + 0 2−p + 1 2−p−1 + · · · + m 2−p−m
t = k2−p + 00 2−p + 01 2−p−1 + · · · + 0m 2−p−m
où j , 0j = 0 ou 1. On note pour i = 0, . . . , m
sj = k2−p + 0 2−p + 1 2−p−1 + · · · + j 2−p−j
tj = k2−p + 00 2−p + 01 2−p−1 + · · · + 0j 2−p−j
Comme s = sm et t = tm , on a
d(Xs , Xt ) = d(Xsm , Xtm )
m
X m
X
≤ d(Xs0 , Xt0 ) + d(Xsj−1 , Xsj ) + d(Xtj−1 , Xtj )
j=1 j=1
m
X m
X
≤ Kγ (ω)2−pγ + Kγ (ω)2−(p+j)γ + Kγ (ω)2−(p+j)γ
j=1 j=1
1−γ −γ −1 −pγ
≤ Kγ (ω)(2 + 1)(1 − 2 ) 2
 m
X 
−(p+j)γ −pγ −γ −γ
car 2 ≤ 2 2 /(1 − 2 )
j=1
≤ Cγ (ω)(t − s)γ
où la dernière ligne vient de 2−p ≤ 2(t − s) et prouve le Lemme 1.1. 

On termine la preuve du Théorème 1.2 de la façon suivante : d’après le Lemme 1.1, la


fonction t 7→ Xt (ω) est ps γ-höldérienne sur D, donc uniformément continue sur D. Comme
(E, d) est complet, il existe ps un unique prolongement continu de cette fonction à T = [0, 1].
Le prolongement reste γ-höldérien. Plus précisément, on pose pour tout t ∈ [0, 1] :
X
et (ω) = lim Xs (ω)
s→t,s∈D

sur l’ensemble presque sûr {ω : Kγ (ω) < +∞} où s 7→ Xs (ω) est γ-höldérienne sur D et
on pose X et (ω) = x0 sur l’ensemble {ω : K(ω) = +∞} négligeable où x0 est un point fixé
quelconque de E. Par construction, le processus X e a alors des trajectoires höldériennes
d’exposant γ sur [0, 1].
Il reste à voir que X
e est bien une version de X. Or l’hypothèse (1.3) assure avec l’inégalité
de Markov :  
 E d(Xs , Xt )a |t − s|1+b
P d(Xs , Xt ) ≥ ε ≤ ≤ . (1.4)
εa εa
10 Chapitre 1. JCB
c – M2 Math. – Université de Rennes 1

Ainsi, pour tout t ∈ T fixé,


P
Xs −→ Xt , s → t.
Comme par construction Xs → X et ps quand s → t, s ∈ D, on conclut que Xt = X
et ps par
unicité ps de la limite en probabilité. 

1.3 Convergence faible des lois de processus


On a vu qu’un processus X = (Xt )t∈T définit en (1.2) une variable aléatoire sur
T
R , σ(Cyl) . Cependant avec
 de bonnes propriétés trajectorielles, on peut améliorer l’es-
pace d’arrivée RT , σ(Cyl) , typiquement si X est à trajectoires continues alors X est à
valeurs dans C(T, R) (ou si ce n’est X, une de ses versions en utilisant le Théorème 1.2).
Quand T = [0, 1] (ou est borné), C(T, R) est normé par

kx − yk∞ = sup |x(t) − y(t)|, x, y ∈ C(T, R). (1.5)


t∈T

qui définit la topologie de la convergence uniforme. Il s’agit alors d’un espace de Banach.
Quand T = R+ , C(R+ , R) admet pour distance
+∞
X
d(x, y) = 2−n min(kx − yk∞,n , 1), (1.6)
n=1
où kx − yk∞,n = sup |x(t) − y(t)|, x, y ∈ C(R+ , R),
t∈[0,n]

qui métrise la convergence uniforme sur tous les compacts.


L’intérêt de considérer X à valeurs dans C(T, R) (ou un autre espace fontionnel, souvent
D(R+ , R), l’espace des fonctions càdlàg –continue à droite avec des limites à gauche– dit
espace de Skorohod, cf. [Bil2]) est alors que X est à valeurs dans un espace métrique (et
même souvent un espace métrique complet, séparable, dit polonais) et que dans ce cadre
la notion de convergence en loi est bien développée, cf. Section 1.3.1.
On commence par s’assurer que le processus X = (Xt )t∈T reste bien une variable aléatoire
sur C(T, R) :  
(Ω, F) → C(T, R), B C(T, R)
X:  (1.7)
ω 7→ X(ω) = Xt (ω) t∈T .
L’espace C(T, R) est muni de deux tribus naturelles :la trace de la tribu cylindrique σ(Cyl)∩
C(R+ , R) et sa propre tribu borélienne B C(R+ , R) . En fait ces deux tribus coı̈ncident :

Proposition 1.4 Sur C(R+ , R), la tribu cylindrique trace coı̈ncide avec la tribu boré-
lienne : 
σ(Cyl) ∩ C(R+ , R) = B C(R+ , R) .
1.3. Convergence faible des lois de processus 11

Démonstration : D’abord, Πt0 est continue sur (C(R+ , R), d) pour d en (1.6) puisque

|Πt0 (x) − Πt0 (y)| = |x(t0 ) − y(t0 )| ≤ kx − yk∞,n

pour tout n ≥ t0 dont on déduit


 aisément la continuité pour d. Dès
Tp lors−1Πt0 est mesurable
sur C(R+ , R), B C(R+ , R) . Comme tout cylindre  s’écrit C = i=1 Πti (Ai ), Ai ∈ B(R),
on a bien C ∈ B C(R+ , R) et Cyl ⊂ B C(R+ , R) puis σ(Cyl) ⊂ B C(R+ , R) .

Réciproquement, si A = {y ∈ C(R+ , R)T: kx − yk[0,n] < η} est ouvert pour la convergence


uniforme sur les compacts, on a A = t∈[0,n]∩Q Π−1 t (]x(t) − η, x(t) + η[) car la condition
|y(t) − x(t)| < η pour tout t ∈ [0, n] ∩ Q est complétée pour tout t ∈ [0, n] par continuité.
L’ouvert A s’écrit alors comme une intersection(dénombrable) de cylindres,
 ie. A ∈ σ(Cyl).
Puis comme de tels A engendrent B C(R+ , R) , on a B C(R+ , R) ⊂ σ(Cyl). 

Finalement d’après la Prop. 1.4, le processus X vu comme en (1.7) définit bien une variable
alátoire sur C(T, R) et PX est alors une loi sur C(T, R).

1.3.1 Rappels sur la convergence faible


On rappelle la notion de convergence faible de variables aléatoires à valeurs dans un
espace métrique S. Quand S est un espace fonctionnel, typiquement C(T, R), la variable
aléatoire est en fait un processus stochastique à trajectoires continues.

Définition 1.5 (Convergence faible) Soit (Xn )n≥1 et X à valeurs dans S espace mé-
trique de lois Pn et P , on a Xn ⇒ X (ou Pn ⇒ P ) ssi pour toute fonction f : S → R
continue et bornée    
lim E f (Xn ) = E f (X) .
n→+∞

Nous utiliserons les formulations équivalentes suivantes de la convergence faible, pour plus
de détails on renvoie à [Bil2].

Théorème 1.3 (portemanteau) Les assertions suivantes sont équivalentes quand n →


+∞ pour des variables aléatoires Xn à valeurs dans un espace métrique S.
1. Xn ⇒ X, ie. pour toute fonction f : S → R continue et bornée
   
lim E f (Xn ) = E f (X) .
n→+∞

2. Pour toute fonction f : S → R uniformément continue et bornée


   
lim E f (Xn ) = E f (X) .
n→+∞

3. Pour tout fermé F , lim supn→+∞ P(Xn ∈ F ) ≤ P(X ∈ F ).


12 Chapitre 1. JCB
c – M2 Math. – Université de Rennes 1

4. Pour tout ouvert G, lim inf n→+∞ P(Xn ∈ G) ≥ P(X ∈ G).


5. Pour tout A ∈ B(S) tel que P X ∈ A \ A◦ = 0, limn→+∞ P(Xn ∈ A) = P(X ∈ A).


Démonstration : • 1) ⇒ 2) est évident.


• 2) ⇒ 3). On considère F fermé et δ > 0. Pour ε > 0 assez petit, Gε =T{x : d(x, F ) < ε}
vérifie P(X ∈ Gε ) ≤ P(X ∈ F ) + δ puisque (comme F est fermé) ε>0 Gε = F . On
considère f (x) = ϕ(d(x, F )/ε) avec

 1 si t ≤ 0
ϕ(t) = 1 − t si 1 ≤ t ≤ 1
0 si 1 ≤ t

Alors, on montre que f est uniformément continue sur S, f (x) = 1 si x ∈ F et f (x) = 0


si x ∈ Gcε . De plus, 0 ≤ f (x) ≤ 1 pour tout x ∈ S. D’après 2), on a E[f (Xn )] → E[f (X)],
n → +∞. Puis comme 1F (x) = f (x)1F (x) et f (x) = f (x)1Gε (x),

P(Xn ∈ F ) = E[f (Xn )1F (Xn )] ≤ E[f (Xn )]


E[f (X)] = E[f (X)1Gε (X)] ≤ P(X ∈ Gε ) ≤ P(X ∈ F ) + δ.

Finalement,

lim sup P(Xn ∈ F ) ≤ lim E[f (Xn )] = E[f (X)] ≤ P(X ∈ F ) + δ.


n→+∞ n→+∞

Comme δ > 0 est arbitraire, cela établit 3).


• 3) ⇔ 4) s’obtient facilement par passage au complémentaire.
• 3), 4) ⇒ 5). Soit A tel que X 6∈ A \ A◦ ps. On a P X ∈ A = P(X ∈ A◦ ). Avec 3) et 4)


on déduit

lim sup P(Xn ∈ A) ≤ lim sup P Xn ∈ A ≤ P X ∈ A = P(X ∈ A◦ ) ≤ lim inf P(Xn ∈ A◦ ).


 
n→+∞ n→+∞ n→+∞

Finalement lim supn→+∞ P(Xn ∈ A) = P(X ∈ A) = lim inf n→+∞ P(Xn ∈ A) ce qui montre
limn→+∞ P(Xn ∈ A) = P(X ∈ A).
• 5) ⇒ 3). Soit F fermé et Fε = {x ∈ S : d(x, F ) ≤ ε}. Comme les ensembles ∂Fε = {x ∈
S : d(X, F ) = ε} sont disjoints, on a X 6∈ ∂Fε pour presque tout ε > 0. Pour un tel ε,
d’après 5) on a

P(Xn ∈ F ) ≤ P(Xn ∈ Fε )
lim sup P(Xn ∈ F ) ≤ lim P(Xn ∈ Fε ) = P(X ∈ Fε )
n→+∞ n→+∞
T
ce qui prouve 3) car F = ε>0 Fε et P(X ∈ Fε ) → P(X ∈ F ), ε → 0 (convergence
monotone).
• 4) ⇒ 1). Soit f ≥ 0 une fonction continue. Avec le lemme de Fatou, on a
Z +∞ Z +∞
E[f (X)] = P(f (X) > t)dt ≤ lim inf P(f (Xn ) > t)dt
0 0 n→+∞
1.3. Convergence faible des lois de processus 13
Z +∞
≤ lim inf P(f (Xn ) > t)dt = lim inf E[f (Xn )]. (1.8)
n→+∞ 0 n→+∞

Pour f continue et bornée par M , on applique (1.8) à M + f et M − f pour obtenir


limn→+∞ E[f (Xn )] = E[f (X)], ce qui prouve 1). 

Proposition 1.5 Soienn X et Xn , n ≥ 1 des variables aléatoires à valeurs dans un espace


métrique S. Les propriétés suivantes sont faciles à vérifier :
P
1. La convergence en proba Xn −→ X implique la convergence faible Xn ⇒ X.
2. (Continuous mapping theorem) Soit f : S → S 0 une application entre espaces
métriques. Alors si Xn ⇒ X et f est continue PX -ps, on a aussi f (Xn ) =⇒ f (X).
3. Si Xn , X sont des processus à trajectoires continues (ie. S = C(R+ , R) avec Xn ⇒ X,
on a la convergence faible des lois fini-dimensionnelles : pour tout m ∈ N et t1 , . . . , tm
 
Xn (t1 ), . . . , Xn (tm ) =⇒ X(t1 ), . . . , X(tm ) n → +∞.

Le continuous mapping theorem montre que la convergence en loi se conserve par les
applications continues : de la même façon que si xn → x alors f (xn ) → f (x) quand f est
continue, le résultat reste vrai pour des variables (ou processus aléatoires) qui convergent
faiblement.
Démonstration : Le premier point se justifie comme pour les variables aléatoires.
Le deuxième point est une conséquence facile du théorème portemanteau (Th. 1.3) : Soit
F un ensemble fermé de S. Observons que f −1 (F ) ⊂ f −1 (F ) ∪ Df . En effet, soit x ∈
f −1 (F ) limite d’une suite (xn )n≥1 de f −1 (F ). Alors si f est continue en x, on a f (x) =
limn→+∞ f (xn ) ∈ F car F est fermé et f (xn ) ∈ F , sinon c’est que x ∈ Df . Par le théorème
portemanteau (Th. 1.3) pour Xn ⇒ X, on a :

lim sup P(f (Xn ) ∈ F ) ≤ lim sup P(Xn ∈ f −1 (F )) ≤ lim sup P Xn ∈ f −1 (F )



n→+∞ n→+∞ n→+∞

≤ P X ∈ f −1 (F ) ≤ P X ∈ f −1 (F ) + P(X ∈ Df )
 

= P X ∈ f −1 (F )


c’est à dire, encore par le théorème portemanteau (Th. 1.3) : f (Xn ) =⇒ f (X).
Le troisième point est une conséquence du deuxième point avec l’application continue
Πt1 ...,tm : C(T, R) → Rm définie par Πt1 ...,tm (x) = (x(t1 ), . . . , x(tm )). 

La convergence faible de processus à trajectoires continues entraı̂ne la convergence des lois


fini-dimensionnelles. La réciproque est fausse : la convergence des lois fini-dimensionnelles
n’entraı̂ne pas la convergence faible des processus. Il peut y avoir un phénomène de perte
de masse vers l’infini comme illusté dans l’exemple suivant pour des variables aléatoires
14 Chapitre 1. JCB
c – M2 Math. – Université de Rennes 1

réelles. De plus l’affirmation est fausse pour des processus qui ne sont pas à valeurs dans
C(T, R) : par exemple pour des processus càdlàg, Xn ⇒ X entraı̂ne X(t) ⇒ X(t) si X est
continu en t.
Exemple : Sur C([0, 1], R), on considère les fonctions

2nt si t ∈ [0, 1/2n]
xn (t) =
2 − 2nt si t ∈ [1/2n, 1/n].

La suite de fonction xn converge simplement vers x = 0. On considère alors la suite de loi


Pn = δxn et P = δx et on observe que
— On n’a pas Pn ⇒ P car pour la fonction continue bornée f (y) = supt∈[0,1] y(t), on a
f (xn ) = 1, f (x) = 0, soit
Z Z
f dPn = f (xn ) = 1 6→ 0 = f (x) = f dP, n → +∞;

— Pour tout 0 < t1 < · · · < tp , avec Πt1 ,...,tp (y) = (y(t1 ), . . . , y(tp )) on a Πt1 ,...,tp (x) =
(0, . . . , 0) et pour n > 1/t1 aussi Πt1 ,...,tp (xn ) = (0, . . . 0), c’est à dire la convergence
des lois fini-dimensionnelles

Pn Π−1 −1
t1 ,...,tp ⇒ P Πt1 ,...,tp , n → +∞.

La convergence des loi fini-dimensionnelles n’entraı̂ne donc pas la convergence en loi de


tout le processus.
Pour éviter une telle pathologie, il faut une condition supplémentaire, c’est l’objet de la
section suivante.

1.3.2 Équitension
L’équitension est la condition qui empêche la perte de masse probabiliste. C’est la condi-
tion qui avec la convergence des lois fini-dimensionnelles donnera la convergence faible, cf.
Théorème 1.6. On renvoie à [Bil2] pour plus de détails sur cette notion.

Définition 1.6 (Équitension) Soit (Pn )n≥1 une suite de mesures de probabilité. La suite
est dite équitendue si pour tout ε > 0, il existe un compact Kε tel que pour tout n on a
Pn (Kε ) > 1 − ε.

En fait, l’équitension s’exprime aussi par une propriété de relative compacité (dans les bons
espaces métriques : ceux qui sont séparables et complets, ie. polonais).

Définition 1.7 (Relative compacité) Une suite de mesures (Pn )n≥1 est relativement
compacte si pour toute sous suite (n0 ) ⊂ N, il existe (n00 ) ⊂ (n0 ) telle que Pn00 converge
faiblement vers une mesure de probabilité.
1.3. Convergence faible des lois de processus 15

Théorème 1.4 (Prohorov) Soit (Pn )n≥1 une suite de mesures dans un espace métrique
séparable complet. Alors (Pn )n≥1 est équitendue ssi (Pn )n≥1 est relativement compacte.

Démonstration : Admis, cf. [Bil2]. 

En général–dans ce cours–, les processus qu’on considère sont à trajectoires continues et


leurs lois sont donc des mesures de probabilité sur l’espace des fonctions continues C(T, R),
complet et séparable pour la topologie uniforme associée à la norme uniforme kf k∞ =
supx∈T |f (x)|, donc polonais. Dans ce cas, on a un critère d’équitension plus explicite :

Théorème 1.5 Soit (Pn )n≥1 la suite des lois de processus Xn à trajectoires continues. On
suppose qu’il existe a, b, C > 0 tels que pour tout s, t ∈ [0, 1],

sup E |Xn (t) − Xn (s)|a ≤ C|t − s|1+b .


 
n≥1

Alors la suite (Pn )n≥1 est équitendue.

Noter la ressemblance avec le Th. 1.2 (Kolmogorov-Čentsov).


Démonstration : Admis, cf. [Bil2]. 


Théorème 1.6 Soit P (n) n≥1
une suite équitendue dans un espace métrique complet
(n)
séparable telle que les lois fini-dimensionnelles Pt1 ,...,tm convergent faiblement pour tout
(n)
t1 , . . . , tm : Pt1 ,...,tm =⇒ Pt1 ,...,tm . Alors il existe P de lois fini-dimensionnelles {Pt1 ,...,tm :
t1 , . . . , tm , m ∈ N} telle que P (n) ⇒ P .

En fait, la vraie condition supplémentaire nécessaire dans le Th. 1.6 est la relative compacité
de la suite (Pn )n≥1 mais d’après le théorème de Prohorov, c’est équivalent à l’équitension
de la suite pour laquelle on dispose de critères explicites.
Démonstration : Pour montrer que P (n) ⇒ P , il suffit de voir que pour toute (n0 ) ⊂ N,
00
il existe (n00 ) ⊂ (n0 ) tel que P (n ) ⇒ P . R R
(n)
En effet, on montre qu’alors pour f continue bornée, R on (n)
a f dP
R → f dP . Si ce n’était
pas le cas, il existerait f continue bornée telle que f dP 6→ f dP , ie. il existerait ε > 0
et (n0 ) ⊂ (n) tels que Z Z
0
f dP (n ) − f dP > ε. (1.9)

Or par l’équitension (en fait par relative compacité mais d’après le résultat de Prohorov,
00
c’est l’équitension), il existe (nR00 ) ⊂ (n0 ) tel Rque P (n ) ⇒ RP . En particulier, d’après le théo-
00 00
rème portemanteau (Th. 1.3) f dP (n ) → f dP . Mais f dP (n ) est une suite extraite de
R 0
f dP (n ) , ce qui nie (1.9). L’absurdité exhibée justifie finalement la convergence cherchée.
Soit donc (n0 ) ⊂ (n) une sous-suite. Par équitension (relative compacité), il existe (n00 ) ⊂
00
(n0 ) et Q tels que P (n ) ⇒ Q. En particulier, la convergence des lois fini-dimensionnelles
16 Chapitre 1. JCB
c – M2 Math. – Université de Rennes 1

(n00 ) (n)
exige que Pt1 ,...,tm ⇒ Qt1 ,...,tm . Mais par hypothèse Pt1 ,...,tm ⇒ Pt1 ,...,tm et donc en particulier
(n00 )
Pt1 ,...,tm ⇒ Pt1 ,...,tm . On a donc pour tout t1 , . . . , tm , Qt1 ,...,tm = Pt1 ,...,tm , c’est à dire avec la
00
Prop. 1.1 : P = Q, et P (n ) ⇒ P = Q ce qui conclut d’après l’argument préliminaire. 
Chapitre 2

Processus gaussiens

Dans ce chapitre, on commence par présenter la classe des processus gaussiens dont
on introduit d’abord la loi en Section 2.1. La régularité des trajectoires est considérée en
Section 2.2. La notion d’espace gaussien est décrite en Section 2.3. Enfin, on donne plusieurs
exemples de processus gaussiens en Section 2.4.

2.1 Lois des processus gaussiens


Définition 2.1 (Processus gaussien) Un processus stochastique (Xt )t∈T est gaussien si
toutes ses lois fini-dimensionnelles L(Xt1 , . . . , Xtn ) sont gaussiennes (pour tout n ∈ N et
t1 , . . . , tn ∈ T ).
Autrement dit X = (Xt )t∈T est gaussien ssi toute combinaison linéaire de ses marginales
a1 Xt1 + · · · + an Xtn suit une loi gaussienne (pour tout n ∈ N, t1 , . . . , tn ∈ T et a1 , . . . , an ∈
R).

Remarque 2.1 Les conséquences suivantes sont immédiates :


— Toutes les marginales d’un processus gaussien sont bien sûr gaussiennes.
— Toute combinaison linéaire de marginales d’un processus gaussien est encore gaus-
sienne.

Il est connu que la loi d’un vecteur gaussien (Xt1 , . . . , Xtn ) est déterminée (par  exemple via
sa fonction caractéristique) par le vecteur
 moyenne mX = E[Xt1 ], . . . , E[Xtn ] et la matrice
de covariance CovX = Cov(Xti , Xtj 1≤i,j≤n ). On comprend dès lors que toutes les lois fini-
dimensionnelles d’un processus gaussien (donc la loi du processus, cf. Prop. 1.1) est connue
dès qu’on se donne la fonction moyenne m(t) = E[Xt ] et l’opérateur de covariance K(s, t) =
Cov(Xs , Xt ). En effet, la loi fini-dimensionnelle de (Xt1 , . . . , Xtn ) est alors la loi gaussienne
N (mn , Kn ) de dimension n avec mn = (m(t1 ), . . . , m(tn )) et Kn = (K(ti , tj ))1≤i,j≤n . Les
fonctions m et K définissent donc toutes les lois fini-dimensionnelles de X et donc aussi sa
loi en tant que processus, cf. Prop. 1.1. Observons en plus que
— K est symétrique : K(s, t) = K(t, s) ;

17
18 Chapitre 2. JCB
c – M2 Math. – Université de Rennes 1

— K est de type positif, ie. si c : T → R est une fonction à support fini alors :
 !2 
X X
c(s)c(t)K(s, t) = E  c(s)Xs  ≥ 0. (2.1)
s,t∈T s∈T

Réciproquement, étant donnés une fonction m sur T et un opérateur K sur T × T , existe-


t-il un processus gaussien X admettant m pour fonction moyenne et K pour opérateur de
covariance ? La réponse est donnée par le résultat suivant :

Théorème 2.1 Soit K une fonction symétrique de type positif sur T × T . Il existe alors
un processus gaussien (centré) dont la fonction de covariance est K.

Démonstration : Quitte à considérer ensuite le processus X(t) + m(t), on considère pour


simplifier le cas d’un processus centré (m = 0). Il s’agit alors d’une application simple
du théorème d’extension de Kolmogorov  (Th. 1.1). On construit une probabilité P (K) sur
l’espace mesurable RT , σ(Cyl) de telle sorte que sous P (K) le processus des coordonnées
Xt (ω) = ω(t) (dit processus canonique) est un processus gaussien de fonction de cova-
riance K. Si {t1 , . . . , tn } est une partie finie de T , on construit d’abord une probabilité
(K)
P{t1 ,...,tn } sur R{t1 ,...,tn } ' Rn comme la loi du vecteur gaussien de matrice de covariance
(K(ti , tj ))1≤i,j≤n (qui existe d’après les rappels gaussiens puisque la matrice est symétrique
(K)
positive). On vérifie aisément que les lois P{t1 ,...,tn } satisfont les propriétés de compatibilité
du théorème d’extension de  Kolmogorov (Th. 1.1) qui s’applique donc. La loi P (K) ainsi
construite sur RT , σ(Cyl) est bien celle d’un processus gaussien puisque par construction
toutes ses lois fini-dimensionnelles sont gaussiennes avec pour fonction de covariance K. 

Exemple 2.1 (Processus stationnaire) On considère le cas T = R et on se donne une


mesure finie symétrique (ie. ν(−A) = ν(A)) sur R. On pose alors
Z
K(s, t) = eiu(t−s) ν(du). (2.2)
R

On vérifie aisément que K est réel symétrique K(t, s) = K(s, t) (car ν est symétrique) et
de type positif : Z X
X 2
ius
c(s)c(t)K(s, t) = c(s)e ν(du) ≥ 0.

s,t∈T s∈T

La fonction K possède la propriété supplémentaire de dépendre seulement de la différence


t − s. On parle de stationnarité faible (ou de deuxième ordre) et on écrit alors K(t, s) =
K(|t − s|). On en déduit aussitôt que le processus X associé à K par le théorème précédent
est stationnaire (au sens strict), c’est à dire pour tout choix de n ∈ N∗ et t1 , . . . , tn , h ∈ R,
on a  L 
Xt1 +h , . . . , Xtn +h = Xt1 , . . . , Xtn .
2.1. Lois des processus gaussiens 19

Réciproquement, il est vrai aussi que si (Xt )t∈R est un processus gaussien stationnaire,
continu dans L2 (ie. lims→t E[(Xt − Xs )2 ] = 0) la fonction de covariance de X est de
la forme (2.2) (théorème de Bochner). La mesure ν s’appelle la mesure spectrale du
processus. Elle véhicule beaucoup d’informations décrivant le processus. Par exemple, on
a K(0) = Var(Xt ) = ν(R).

De façon générale pour un processus stationnaire, on a


Proposition 2.1 Soit X processus stationnaire L2 centré et de fonction de covariance.
On a équivalence entre :
1. la fonction K continue en 0 ;
2. le processus est X L2 -continu : lims→t E[(Xt − Xs )2 ] = 0 ;
3. la fonction K est continue partout.
Démonstration : 1)⇔ 2) On a
E |Xt − Xs |2 = E Xt2 + E Xs2 − 2E Xt Xs
       

= K(t, t) + K(s, s) − 2K(t, s)


= 2K(0) − 2K(|t − s|),
ce qui justifie l’équivalence. Comme 3)⇒ 1) est clair, on conclut avec 2)⇒ 3) qui vient de
   
K(t + h) = E Xt+h X0 = E (Xt+h − Xt )X0 + K(t)
avec
  q 
E (Xt+h − Xt )X0 ≤ E (Xt+h − Xt )2 E[X02 ] = K(0)1/2 kXt+h − Xt k2 .


Au passage, on a utilisé que la stricte stationnarité d’un processus gaussien est équivalente
à la stationnarité faible :
Proposition 2.2 Un processus gaussien X est stationnaire ssi E[Xt ] est constante et
K(s, t) = K(s − t) (on parle de stationnarité faible).
Démonstration : Il est clair que ces conditions sont nécessaires, que le processus soit gaus-
sien ou pas : comme par stationnarité, on a L(Xt ) = L(Xs ) pour tout t, s, on a E[Xt ] =
E[Xs ] et donc la fonction moyenne est constante ; de même L(Xt , Xs ) = L(Xt+h , Xs+h )
pour tout t, s, h, on a Cov(Xt , Xs ) = Cov(Xt+h , Xs+h ) et donc la covariance ne dépend que
de la différence t − s.
Elles sont suffisantes seulement dans le cas gaussien puisque dans ce cas, la loi est caracté-
risée par t 7→ E[Xt ] et par K(s, t). Il est facile alors de voir dans ce cas qu’une translation
dans les paramètres de temps ne modifie pas ces fonctions sous les hypothèses de la pro-
position donc pas non plus la loi. 
20 Chapitre 2. JCB
c – M2 Math. – Université de Rennes 1

2.2 Régularité gaussienne


Des bonnes conditions pour avoir une version assez régulière d’un processus gaussien
sont données dans le résultat suivant, conséquence facile du Théorème 1.2 (Kolmogorov-
Centsov) dans le cadre gaussien.

Théorème 2.2 (Kolmogorov-Čentsov gaussien) Soit X un processus gaussien centré


(E[Xt ] = 0), de fonction de covariance K(s, t). On suppose qu’il existe α > 0 et C < +∞
tels que pour tout s, t :

K(t, t) + K(s, s) − 2K(s, t) ≤ C|t − s|α .

Alors il existe une version continue X e de X. De plus, pour tout γ < α/2, les trajectoires
de X
e sont ps höldériennes de coefficient γ.

Démonstration : À partir de E[|Xt − Xs |2 ] = E[Xt2 ] + E[Xs2 ] − 2E[Xt Xs ] ≤ C|t − s|α ,


on ne peut pas appliquer directement le Théorème 1.2 car α > 1 (requis pour le Th. 1.2)
n’est pas garanti. On s’intéresse plutôt à E[|Xt − Xs |2m ]. On rappelle que d’après la Prop.
0.2, pour X variable aléatoire normale centrée, on a : E[X 2m ] = 2(2m)! m
m m! Var(X) . Il vient

alors pour tout m :


(2m)!
E |Xt − Xs |2m ≤ C m m |t − s|mα .
 
2 m!
Comme cela est valable pour tout m, on choisit m tel que mα > 1. D’après le Théorème 1.2
(Kolmogorov-Čentsov) avec

b mα − 1
b = mα − 1, a = 2m, et =
a 2m
on a une version mα−1 2m
-höldérienne de X. Comme limm→+∞ mα−1
2m
= α2 , il existe une version
γ-hölder de X pour tout γ < α/2. Remarquer que les versions höldérienne pour des expo-
sants γ 6= γ 0 coı̈ncident par indistinguabilité (Prop. 1.3). 

2.3 Espace gaussien


On rappelle que L2 (Ω, F, P) est un espace de Hilbert pour le produit scalaire hX, Y i =
E[XY ].

Définition 2.2 (Espace gaussien) Un espace gaussien (centré) est un sous-espace fermé
de L2 (Ω, F, P) formé de variables gaussiennes centrées.

Par exemple, si X = (X1 , . . . , Xn ) est un vecteur gaussien centré dans Rn , alors Vect(X1 , . . . , Xn )
est un espace gaussien. (Vect(X1 , . . . , Xn ) est constitué des combinaisons linéaires d’un vec-
teur gaussien, elles sont donc gaussiennes).
2.3. Espace gaussien 21

Proposition 2.3 Si X = (Xt )t∈T est un processus gaussien, le sous-espace vectoriel fermé
de L2 (Ω, F, P) engendré par les variables aléatoires Xt , t ∈ T , est un espace gaussien,
appelé espace gaussien engendré par le processus X.
L2 (Ω,F ,P)
Démonstration : Le sous-espace vectoriel fermé Vect (Xt : t ∈ T ) est formé des
limites dans L2 (Ω, F, P) des combinaisons linéaires finies de marginales Xti de (Xt )t∈T . Ces
limites sont gaussiennes car
— comme (Xt )t∈T est gaussien, les combinaisons linéaires ni=1 ai Xti le sont aussi ;
P
— les limites L2 de variables gaussiennes sont gaussiennes, cf. Prop. 0.5.


Si H est un sous-ensemble de L2 (Ω, F, P), on note σ(H) la tribu engendrée par les variables
aléatoires ξ ∈ H.
Théorème 2.3 Soit H un espace gaussien et soit (Hi , i ∈ I) une famille de sous-espaces
vectoriels de H. Alors les sous-espaces Hi , i ∈ I, sont orthogonaux dans L2 (Ω, F, P) si et
seulement si les tribus σ(Hi ), i ∈ I, sont indépendantes.
Ce résultat est une généralisation des Prop. 0.8 et 0.9 pour les variables et vecteurs gaus-
siens. Comme dans ces cas, il est crucial que les espaces Hi soient contenus tous dans un
même espace gaussien.
Démonstration : Si on suppose les tribus σ(Hi ), i ∈ I, indépendantes, alors pour i 6= j
et X ∈ Hi , Y ∈ Hj , on a
E[XY ] = E[X]E[Y ] = 0,
ce qui signifie que les espaces Hi sont deux à deux orthogonaux (le produit scalaire étant
donné dans ce contexte par la covariance : hX, Y i = E[XY ]).
Réciproquement, supposons les espaces Hi , i ∈ I, deux à deux orthogonaux. Par défi-
nition de l’indépendance d’une famille infinie de tribus, il suffit de montrer que pour
tous indices distincts i1 , . . . , ip ∈ I, les tribus σ(Hi1 ), . . . , σ(Hip ) sont indépendantes.
Pour cela, il suffit de montrer que, si ξ11 , . . . , ξn11 ∈ Hi1 , . . . , ξ1p , . . . , ξnpp ∈ Hip les vecteurs
(ξ11 , . . . , ξn11 ), . . . , (ξ1p , . . . , ξnpp ) sont indépendants. En effet, pour chaque j, les ensembles de
la forme {ξ1j ∈ A1 , . . . , ξnj j ∈ Anj } forment une classe stable par intersection finie qui en-
gendre la tribu σ(Hj ), et on peut ensuite utiliser un argument classique de classe monotone.
Pour chaque j ∈ {1, . . . , p}, on considère η1j , . . . , ηm j
j
une base orthonormée de Vect(ξ1j , . . . , ξnj j ).
La matrice de covariance du vecteur
η11 , . . . , ηm
1 2
, η12 , . . . , ηm , . . . , η1p , . . . , ηm
p

1 2 p

est alors la matrice identité (car pour i 6= j E[ηli ηkj ] = 0 à cause de l’orthogonalité de Hi et
Hj , et pour i = j, c’est dû au choix de η i base orthonormée). Ce vecteur est gaussien car
ses composantes sont dans H, espace gaussien. D’après la Proposition 0.9, les composantes
sont indépendantes. On conclut que les vecteurs
(η11 , . . . , ηm
1
1
), . . . , (η1p , . . . , ηm
p
p
)
22 Chapitre 2. JCB
c – M2 Math. – Université de Rennes 1

sont indépendants. Comme pour chaque j ∈ {1, . . . , p} le vecteur (ξ1j , . . . , ξnj 1 ) est une
combinaison linéaire des coordonnées de (η1j , . . . , ηm
j
1
), de manière équivalente les vecteurs

(ξ11 , . . . , ξn11 ), . . . , (ξ1p , . . . , ξnpp )

sont indépendants, ce qui prouve le théorème. 

Corollaire 2.1 Soient H un espace gaussien et K un sous-espace vectoriel fermé de K.


On note pK la projection orthogonale sur K. Soit X ∈ H.
1. On a
E[X|σ(K)] = pK (X).
2. Soit σ 2 = E[(X − pK (X))2 ]. Alors, pour tout borélien B de R,

P(X ∈ B|σ(K)) = Q(ω, B),



où Q(ω, ·) est la loi N pK (X)(ω), σ 2 , ie.

(y − pK (X)2 ) 
Z
1
Q(ω, B) = √ exp − dy
σ 2π B 2σ 2

(et avec Q(ω, B) = 1B (pK (X)) si σ = 0).

Remarque 2.2 1. D’une manière générale, la loi conditionnelle d’une variable aléa-
toire réelle X sachant une sous-tribu G est un noyau Q(ω, ·) G-mesurable, ie. une
application Q : Ω × B(R) → [0, 1] telle que
— pour tout ω, B 7→ Q(ω, B) est une mesure de probabilité sur (R, B(R)),
— pour tout B ∈ B(R), ω 7→ Q(ω, B) est G-mesurable,
avec la propriété
P(X ∈ B|G) = Q(ω, B), ∀B ∈ B(R),
R
plus généralement E[f (X)|G] = f (y)Q(ω, dy). La partie 2) du corollaire explique
que dans le cas gaussien, la loi conditionnelle
 de X sachant la tribu σ(K) est explicite,
il s’agit de la loi N pK (X), σ 2 .
2. En général, pour une variable aléatoire X dans L2 (Ω, F, P), l’espérance conditionnelle
est donné par une projection orthogonale, ie. E[X|σ(K)] = pL2 (Ω,σ(K),P) (X). Dans le
cadre gaussien, l’assertion 1) du corollaire montre que la projection orthogonale est
à faire directement sur l’espace K, bien plus petit que L2 (Ω, σ(K), P) où il faut en
général projeté.
3. L’assertion 1) porte aussi le principe de la régression linéaire. Par exemple, si (X1 , X2 , X3 )
est un vecteur gaussien, la meilleure approximation de X3 connaissant X1 et X2 s’écrit
λ1 X1 + λ2 X2 où λ1 et λ2 sont déterminés en disant que X3 − (λ1 X1 + λ2 X2 ) est or-
thogonal à Vect(X1 , X2 ).
2.4. Exemples de processus gaussiens 23

Démonstration : 1) Soit Y = X − pK (X). Alors Y est orthogonal à K et d’après le


Théorème 2.3, Y est indépendante de σ(K). On a donc

E[X|σ(K)] = E[pK (X)|σ(K)] + E[Y |σ(K)] = pK (X) + E[Y ] = pK (X).

2) On écrit, pour toute fonction f mesurable positive sur R+ ,


Z
E[f (X)|σ(K)] = E[f (pK (X) + Y )|σ(K)] = f (pK (X) + y)PY (dy)

où PY est la loi de Y qui est une loi N (0, σ 2 ) puisque Y est une variable gaussienne (cen-
trée) de variance σ 2 . (On a utilisé le fait général suivant
R : si Z est une variable G-mesurable
et si Y est indépendante de G alors E[g(Y, Z)|G] = g(y, Z)PY (dy).) Le résultat annoncé
en 2) découle aussitôt de la formule précédente. 

2.4 Exemples de processus gaussiens


Avant d’étudier en détails le mouvement brownien au Chapitre 4, on décrit brièvement ce
processus ainsi que quelques autres processus associés.

Mouvement brownien
Soit T = R+ , le mouvement brownien (standard) (Bt )t≥0 est le processus gaussien
défini par E[Bt ] = 0 et K(s, t) = min(s, t) (et à trajectoires ps continues). On l’appelle
aussi processus de Wiener. Noter queR K(t, s) = min(t, s) est bien de type positif au sens
de (2.1) puisqu’en écrivant K(t, s) = R 1[0,t] (x)1[0,s] (x) dx, on a
X Z X Z X 2
c(s)c(t)K(s, t) = c(s)1[0,s] (x)c(t)1[0,t] (x) dx = c(t)1[0,t] (x) dx ≥ 0.
s,t∈T R s,t∈T R t∈T

Propriétés immédiates

1) B0 = 0 car la loi de B0 est N (0, 0) = δ0 , la loi dégénérée en 0.


2) (Bt )t≥1 est un processus à accroissements indépendants. En effet soit 0 ≤ t1 < t2 < t3 <
t4 , on a

Cov(Bt2 − Bt1 , Bt4 − Bt3 ) = E[(Bt2 − Bt1 )(Bt4 − Bt3 )]


= E[Bt2 Bt4 ] − E[Bt2 Bt3 ] − E[Bt1 Bt4 ] + E[Bt1 Bt3 ]
= t2 − t2 − t1 + t1 = 0.

Les variables aléatoires Bt2 − Bt1 et Bt4 − Bt3 sont donc non corrélées. Comme elles sont
gaussiennes, elles sont indépendantes. On justifie de même l’indépendance de n accroisse-
ments.
24 Chapitre 2. JCB
c – M2 Math. – Université de Rennes 1

3) Bt ∼ N (0, t) car E[Bt ] = 0 et Var(Bt ) = K(t, t) = t.


4) Si s ≤ t, on a Bt − Bs ∼ Bt−s . En effet E[Bt − Bs ] = E[Bt ] − E[Bs ] = 0 et

Var(Bt − Bs ) = Cov(Bt − Bs , Bt − Bs )
= Cov(Bt , Bt ) − 2 Cov(Bt , Bs ) + Cov(Bs , Bs )
= t − 2s + s = t − s.

Donc Bt − Bs ∼ N (0, t − s) ∼ Bt−s .


5) Autosimilarité : B
et = √1 Bct définit encore un mouvement brownien (standard).
c

6) Comportement analogue en 0 et en +∞ : B̃t = tB1/t définit encore un mouvement


brownien standard.
Le processus Bt a donc le même comportement au voisinnage de 0 et en +∞
7) Localisation : pour tout t0 , B̃t = Bt+t0 − Bt0 définit encore un mouvement brownien
standard.
Le processus Bt a donc le même comportement en 0 et en t0 .
8) (Bt )t≥0 a des trajectoires ps holdériennes d’ordre γ < 1/2 mais non ps dérivables.
En effet, E[|Bt − Bs |2 ] = |t − s|, donc la continuité höldérienne suit du théorème 2.2.
On admet la non-dérivabilité des trajectoires, cf. Chapitre 4 et théorème de Kolmogorov-
Čentsov (Th. 2.2).
[Graphe typique des trajectoires.]

Pont Brownien
Soit T = [0, 1], le pont brownien (Bt◦ )t∈[0,1] est le processus gaussien centré défini par la
fonction de covariance K(s, t) = min(s, t) − st.
[Graphe typique des trajectoires.]

Proposition 2.4 On peut définir directement un pont brownien B ◦ à partir d’un mouve-
ment brownien B par
Bt◦ = Bt − tB1 , t ≥ 0.

Démonstration : En effet, d’abord (Bt − tB1 )t∈[0,1] est gaussien, centré puis pour s, t ∈
[0, 1], on a

Cov(Bt − tB1 , Bs − sB1 )


= Cov(Bt , Bs ) − t Cov(B1 , Bs ) − t Cov(Bs , B1 ) + ts Cov(B1 , B1 )
= min(t, s) − ts − st + ts
= min(t, s) − ts.
2.4. Exemples de processus gaussiens 25

Comme le processus (Bt − tB1 )t∈[0,1] est gaussien, centré avec la bonne covariance, il s’agit
d’un pont brownien. 

Réciproquement, on peut construire le mouvement brownien B sur T = [0, 1] à partir du


pont brownien B ◦ et d’une loi normale X ∼ N (0, 1) indépendante de B ◦ par
Bt = Bt◦ + tX.
Exercice. Vérifier par un calcul de covariance qu’on définit ainsi un mouvement brownien.

Propriétés.
1. B̃t◦ = B1−t

définit encore un pont brownien. Le pont brownien est donc symétrique
en 0 et en 1 par retournement du temps.
2. (Bt◦ )t≥0 a des trajectoires ps holdériennes d’ordre γ < 1/2 mais non ps dérivables.
L’argument est le même que pour le mouvement brownien avec E[(Bt◦ )2 ] = t − t2 .
3. B ◦ est un mouvement brownien B conditionné à valoir 0 à la date t = 1.

Processus d’Ornstein-Uhlenbeck
Soit T = R, le processus d’Ornstein-Uhlenbeck est le processus gaussien centré défini par
Ut = e−t/2 B(et )
où B est un mouvement brownien. On montre facilement que Ut ∼ N (0, 1) car Var(Ut ) = 1,
ce processus est donc stationnaire. Sa fonction de covariance est donnée par
K(s, t) = e−|t−s|/2 .
Elle ne dépend que de la différence (t − s), il s’agit bien d’un processus stationnaire de
fonction de covariance plus simplement donnée par K(t) = e−|t|/2 (exercice). Elle est donnée
du
sous forme intégrale (2.2) avec la mesure spectrale ν(du) = .
π(1 + u2 )

Brownien géométrique
Ce n’est pas un processus gaussien mais l’exponentiel d’un processus gaussien. Il s’agit de
St = x exp µt + σBt − σ 2 t/2 , t ≥ 0.

(2.3)
Un tel processus modélise le cours d’un actif St soumis à un taux d’intérêt µ et à une
volatilité σ et qui vaut x au temps 0.
On le trouve en supposant comme Samuelson que les rendements entre deux périodes sont
mesurés par les logarithmes des cours St .
On suppose de plus que les rendements entre 0 et t suivent un mouvement brownien de
tendance (drift) µ − σ 2 /2 et de coefficient de diffusion (volatilité) σ. Cela se traduit par les
propriétés suivantes sur les prix (St )t≥0 :
26 Chapitre 2. JCB
c – M2 Math. – Université de Rennes 1

— S0 = x.
— Les rendements log St −log Ss suivent une loi gaussienne de moyenne (µ−σ 2 /2)(t−s)
et de variance σ 2 (t − s).
— Pour tout t0 = 0 ≤ t1 ≤ · · · ≤ tn , les accroissements relatifs Sti+1 /Sti , 0 ≤ i ≤ n − 1,
sont indépendants.
On en déduit qu’il existe un mouvement brownien (Bt )t≥0 tel que en t, St = x exp(µt +
σBt − σ 2 t/2).

Bruit blanc gaussien


Soit (A, µ) un espace mesuré et U = {A ∈ A : µ(A) < +∞}.
Le buit blanc est un processus gaussien (XA )A∈A indexé par l’ensemble des mesurables A
défini par E[XA ] = 0 et Cov(XA , XB ) = µ(A ∩ B).
Il faut appréhender le buit blanc comme une mesure aléatoire A 7→ XA (ω). Elle est aléatoire
car XA dépend de ω. On connaı̂t quand même la loi de X(A) ∼ N (0, µ(A)).
Attention cependant, un bruit blanc n’est pas une vraie mesure car A 7→ XA n’est pas
σ-additif.

Mouvement brownien fractionnaire


Soit T = R+ . Le mouvement brownien fractionnaire (mBf) (B H (t))t≥0 est le processus
gaussien centré défini par la fonction de covariance
1
|s|2H + |t|2H − |s − t|2H .

K(s, t) =
2
Le paramètre H s’appelle indice de Hurst.

Propriétés immédiates.
1. Pour H = 1/2, le mBf devient le mouvement brownien standard.
 
2. On a E |B H (t) − B H (s)|2 = |t − s|2H .
3. Autosimilarité : B H (t) = c−H B H (ct) définit encore un mBf d’indice H.
4. Les accroissements du mBf ne sont indépendants que lorsque H = 1/2 (c’est à dire
dans le cas du mouvement brownien).
 
Cas H = 1. On a E B H (t)B H (s) = st. On montre alors qu’il s’agit d’un processus
dégénéré de la forme B H (t) = tB H (1). Il s’agit en fait d’une droite aléatoire (la dépendance
est donc très forte dans la trajectoire).
Cas H = 0. On a

 H H
 1 0 0 0 1/2 si s 6= t
E B (t)B (s) = (|s| + |t| − |s − t| ) =
2 1 si s = t.
2.4. Exemples de processus gaussiens 27

Dans le cas H = 0, on peut construire le mBf de la façon suivante : soit (Yt )t≥0 une suite
de variables aléatoires indépdendantes et Z une variable aléatoire indépendante de (Yt )t≥0 .
On les prend de loi Yt ∼ Z ∼ N (0, 1). Considérons alors Xt = Yt√+Z 2
. On montre facilement
que Xt a bien la covariance cherchée. On constate alors que les trajectoires de (Xt )t≥0 sont
complètement discontinues.
[Graphe typique des trajectoires.]
De façon générale, pour 0 < H < 1, les trajectoires du mBf (B H (t))t≥0 sont β-höldériennes
pour tout ordre β < H. C’est dû au Théorème 2.2 de régularité des processus gaussiens
(Kolmogorov-Čentsov).
28 Chapitre 2. JCB
c – M2 Math. – Université de Rennes 1
Chapitre 3

Bruit blanc et intégration


stochastique

On s’intéresse dans ce chapitre aux mesures aléatoires gaussiennes aussi appelées bruits
blancs gaussiens et définies en Section 3.1. On construit une intégrale par rapport à ces
mesures aléatoires en Section 3.2, ce qui permet une première approche de l’intégrale de
Wiener-Itô en Section 3.3 (pour une construction plus générale, voir le Chapitre ??). Les
mesures aléatoires sont liées aux processus (faiblement) stationnaires : on définit ces pro-
cessus en Section 3.4 et on y étudie notamment leur représentation spectrale.

3.1 Mesure aléatoire (bruit blanc)


On considère µ une mesure finie sur (X , A).
Définition 3.1 Soit M = {M (A), A ∈ A} un processus indéxé par A vérifiant
— E[M (A)] = 0 pour tout A ∈ A,
— E[M (A)2 ] < +∞ pour tout A ∈ A,
— E[M (A)M (B)] = µ(A ∩ B) pour tout A, B ∈ A.
On appelle M une mesure aléatoire de mesure de contrôle (ou compensateur) µ.
Remarque 3.1
— Une mesure aléatoire s’appelle aussi un bruit blanc (BB).
— Souvent, on considère un bruit blanc gaussien en demandant que le processus M
soit gaussien. Dans ce cas, on connaı̂t la loi de M (A) ∼ N (0, µ(A)).
— Même si la mesure de contrôle µ n’est pas finie, on peut quand même définir la
mesure aléatoire M sur U = {A ∈ A : µ(A) < +∞}.
— On dit aussi que la mesure M est orthogonale car si A∩B = ∅, on a E[M (A)M (B)] =
0, c’est à dire M (A) et M (B) sont orthogonaux par rapport au produit scalaire
hX, Y i = Cov(X, Y ).
— On dit que M est une mesure car avec A ∩ B = ∅, on a
M (A ∪ B) = M (A) + M (B) ps (3.1)

29
30 Chapitre 3. JCB
c – M2 Math – Université de Rennes 1

puis par récurrence on a même l’additivité et la σ-additivité.


Preuve de (3.1). On calcule

E |M (A ∪ B) − M (A) − M (B)|2
 

= E M (A ∪ B)2 + E M (A)2 + E M (B)2 − 2E M (A ∪ B)M (A)


       
   
−2E M (A ∪ B)M (B) + 2E M (A)M (B)
= µ(A ∪ B) + µ(A) + µ(B) − 2µ(A) − 2µ(B) + 2µ(A ∩ B)
= µ(A) + µ(B) + µ(A) + µ(B) − 2µ(A) − 2µ(B)
= 0.

On a donc E[|M (A ∪ B) − M (A) − M (B)|2 ] = 0 soit M (A ∪ B) = M (A) + M (B)


ps.
— Attention : dans l’additivité (3.1), le ps dépend de A et de B si bien que pour
ω fixé, on n’a pas une vraie additivité. De même pour la σ-additivité. La mesure
aléatoire n’est donc pas ps une vraie mesure.

Théorème 3.1 (Existence) Pour toute mesure finie µ, il existe M mesure aléatoire
gaussienne contrôlée par µ.

Démonstration : Puisque µ(A ∩ B) = h1A , 1B iL2 (dµ) , K(A, B) = µ(A ∩ B) définit un


opérateur de type positif et d’après le Th. 2.1, il existe un processus gaussien centré de
covariance K(A, B) = µ(A ∩ B).
[Esquisse]
— En supposant l’existence, on trouve les lois fini-dimensionnelles nécessaires.
— On en déduit l’opérateur de covariance nécessaire : K(A, B) = µ(A ∩ B). On vérifie
qu’elle est définie positive (ce qui est immédiat car µ(A ∩ B) = h1A , 1B iL2 (dµ) ).
— On vérifie les conditions de compatibilité de Kolmogorov sur les lois fini-dimension-
nelles trouvées.
— On applique le théorème d’extension de Kolmogorov (Th. 1.1) pour trouver M
comme cherchée.


Dans la section suivante, on construit une intégrale (stochastique) par rapport à ce type
de pseudo-mesure aléatoire.

3.2 Intégrale stochastique


R
Soit M une mesure aléatoire contrôlée par µ. On se propose de définir I(f ) = f dM pour
f ∈ L2 (dµ), c’est à dire pour f satisfaisant
Z
f (x)2 µ(dx) < +∞.
X
3.2. Intégrale stochastique 31

On construit l’intégrale I comme une isométrie de L2 (µ) dans L2 (Ω, F, P). Comme d’ha-
bitude pour la construction d’une intégrale, on commence par les fonctions simples de
L2 (µ) :
— Pour f = P 1A , on pose I(f ) = M (A).
— Pour f = nk=1 ak 1Ak , avec les Ak deux à deux disjoints, on définit I(f ) = nk=1 ak M (Ak ).
P
On vérifie sans problème qu’une autre écriture de la même fonction f (avec d’autes ak et/ou
autres Ak ) conduit à une intégrale qui a la même valeur. La définition est donc cohérente.
On vérifie que pour toutes fonctions simples f = nk=1 ak 1Ak , g = nk=1 bk 1Bk , on a
P P

1. E[I(f )] = 0
2. hI(f ), I(g)iL2 (P) = hf, giL2 (µ)
3. I(af + bg) = aI(f ) + bI(g) ps.
Preuve. Le point 1) est clair car la mesure aléatoire M est centrée (Déf. 3.1). Le point 3)
vient de (3.1). Pour le point 2) :
X
hI(f ), I(g)iL2 (P) = E[I(f )I(g)] = ak bl E[M (Ak )M (Bl )]
k,l
X X
= ak bl µ(Ak ∩ Bl ) = ak bl h1Ak , 1Bl iL2 (µ)
k,l k,l
= hf, giL2 (µ) .

On peut ensuite définir I(f ) pour f ∈ L2 (µ) par prolongement uniforme : pour f ∈ L2 (µ),
il existe (fn )n≥1 suite de fonctions simples qui converge vers f dans L2 (µ). Comme (fn )n≥1
est en particulier une suite de Cauchy dans L2 (µ), par l’isométrie 2), I(f ) est aussi une
suite de Cauchy dans L2 (P). Comme l’espace est complet, cette suite de Cauchy converge
et on pose par définition :
I(f ) = L2 - lim I(fn ). (3.2)
n→+∞

La définition (3.2) ci-dessus est indépendante du choix de la suite fn → f dans L2 (µ), si


bien que la définition est bien licite. Il s’agit de l’intégrale stochastique de f ∈ L2 (µ)
par rapport à M , mesure aléatoire contrôlée par µ. De plus, il est facile de voir que 1), 2),
3) restent encore valables pour I(f ) quand f ∈ L2 (µ). En particulier, on a :
R 2
Proposition 3.1 (Isométrie) Pour f ∈ L2 (µ), on a E[I(f )] = 0 et E[I(f R )2
] =
 f dµ.
En particulier, quand M est un bruit blanc gaussien, on a I(f ) ∼ N 0, f 2 dµ .
Pn
Démonstration : On montre (I(f ))f ∈L2 (µ) est un processus
Pn gaussien. Pour f = i=1 ai 1Ai ,
avec les Ai deux à deux disjoints, on a I(f ) = i=1 ai µ(Ai ) gaussienne car somme
de gaussiennes µ(Ai ) ; pour f ∈ L2 (µ), I(f ) donnée en (3.2) est limite (L2 (P)) de va-
riables aléatoires gaussiennes donc gaussienne ; de même, on montre que toute les lois
fini-dimensionnelles sont gaussiennes (exercice). 

À partir d’une mesure aléatoire, on peut facilement en construire d’autres :


32 Chapitre 3. JCB
c – M2 Math – Université de Rennes 1
R
Proposition 3.2 Soit M une mesure aléatoire et h ∈ L2 (µ). On définit V (A) = h1A dM
pour tout A ∈ B. On obtient V une mesure aléatoire contrôlée par la mesure ν donnée par
dν = |h|2 dµ.

Démonstration
R : V est une mesure aléatoire car V est centrée, E[V (A)2 ] < +∞ puisque
2
h1A dM ∈ L (P) et
 
E V (A)V (B) = hI(h1A ), I(h1B )iL2 (P) = hh1A , h1B iL2 (P)
Z
= h2 1A∩B dµ = ν(A ∩ B).

Pn 
Par les approximations successives standard (1A , puis i=1 αi 1Ai , puis f ≥ 0 mesurable
puis f ∈ L2 (µ)), on a alors :
R R
Proposition 3.3 Avec les notations précédentes, on a f dV = f hdM , c’est à dire
symboliquement dV = h dM .

3.3 Approche de l’intégrale de Wiener-Itô


On considère une mesure aléatoire gaussienne M sur (X , A, µ) = (R+ , B(R+ ), λ), contrôlée
par la mesure de Lebesgue λ (c’est à dire λ([a, b]) = b − a). On définit le processus B sur
R+ par Bt = M ([0, t]).

Proposition 3.4 Le processus B défini sur R+ par Bt = M ([0, t]) est (à une version près)
un mouvement brownien standard.

Démonstration : Il s’agit d’un processus gaussien car M est une mesure gaussienne, cf.
Prop. 3.1. D’après les résultats précédents, Bt ∼ N (0, t).
De plus si 0 ≤ t1 ≤ t2 ≤ t3 ≤ t4 comme Bt2 − Bt1 = M (]t1 , t2 ]) et Bt4 − Bt3 = M (]t3 , t4 ]),
on a bien l’indépendance des accroissements de B car

Cov(Bt2 − Bt1 , Bt4 − Bt3 ) = Cov(M (]t1 , t2 ], M (]t3 , t4 ]) = λ(]t1 , t2 ]∩]t3 , t4 ]) = λ(∅) = 0,

ce qui dans le cas gaussien donne Bt2 −Bt1 ⊥


⊥ Bt4 −Bt3 . De la même façon, n accroissements
sont mutuellement indépendants.
De plus la covariance de B est donnée par

Cov(Bs , Bt ) = Cov(M ([0, s], M ([0, t]) = λ([0, s] ∩ [0, t]) = λ [0, s ∧ t]
= min(s, t).

Le processus B est donc gaussien, centré avec la bonne fonction de covariance. On a déjà
vu que dans ce cas, le théorème de régularité de Kolmogorov-Čentsov (version gaussien, cf
Th. 2.2) s’applique et donne une version de ce processus qui est ps à trajectoires continues.
3.4. Processus stationnaire 33

On retrouve donc le mouvement brownien en prenant (la bonne version de) Bt = M ([0, t]).


On peut maintenant définir une intégrale par rapport à B en considérant qu’il s’agit d’une
intégrale par rapport à un bruit blanc gaussien M associé à B.
Z Z
1[0,t] (s) dBs = Bt − B0 = Bt = M ([0, t]) = 1[0,t] dM.

Par des arguments classiques d’approximation (combinaisons linéaires puis approximation


par convergence monotone), on montre que pour toute fonction f ∈ L2 (R+ , λ)
Z Z
f (s) dBs = f dM. (3.3)

Symboliquement, on a 00 dBs = dM 00 . On appelle cette intégrale l’intégrale de Wiener-


Itô. Noter que l’intégrand dans (3.3) est déterministe. Dans le Chapitre ??, on construit
une théorie d’intégration stochastique beaucoup plus générale : les intégrands seront des
processus et les intégrateurs des semimartingales généralisant le cadre du mouvement brow-
nien.

3.4 Processus stationnaire


Dans cette setion, il est plus simple de considérer des processus à valeurs dans C en
adaptant les définitions précédentes au contexte complexe.

3.4.1 Faible stationnarité


Définition 3.2 (Faible stationnarité) Soit X = (Xt )t∈T un processus L2 . Il est dit fai-
blement stationnaire
  si
— E |Xt |2 < +∞ pour tout t ∈ T (le processus est L2 ) ;
— E[Xt ] = m pour tout t ∈ T (en général m = 0 et le processus est dit centré) ;
— La fonction de covariance K(t, s) ne dépend que de t − s :
 
K(t, s) = E (Xt − m)(Xs − m) = K(t − s).

On peut considérer que le processus est une application X : T −→ L2 (Ω, F, P) et appliquer


des méthodes hilbertiennes. Noter que la fonction de covariance K(t) est définie positive :
∀t1 , . . . , tn ∈ T et ∀z1 . . . , zn ∈ C, on a
n
X
zi z̄j K(ti − tj ) ≥ 0.
i,j=1

Le résultat suivant (admis) donne un expression spectrale (intégrale) de la fonction de


covariance dans le cas stationnaire.
34 Chapitre 3. JCB
c – M2 Math – Université de Rennes 1

Théorème 3.2 (Bochner-Khinchine) Soit X un processus L2 faiblement stationnaire


centré et de fonction de covariance K.
L2
1. On suppose T = R et que le processus X continu dans L2 (Xt −→ Xs quand t → s).
Alors il existe (une unique) mesure ν finie sur R telle que
Z
K(s) = exp(ist) ν(ds).
R
La mesure ν est appelée mesure spectrale. Sa densité f si elle existe est dite
spectrale (ν(dx) = f (x)dx).
2. On suppose T = Z alors ν est définie sur [−π, π] et
Z π
K(n) = exp(int) ν(dt).
−π

Remarque 3.2 La mesure spectrale porte beaucoup d’information sur la loi du processus
X. Par exemple, Var(X) = K(0) = ν(R)(= ν(Z) dans le cas discret).
Théorème 3.3 (Existence) Soit K une fonction définie positive (continue en 0 si T =
R). Alors il existe un processus stationnaire gaussien centré (L2 -continu si T = R) de
fonction de covariance K.
Démonstration : On suppose d’abord que le processus existe et on calcule les lois fini-
dimensionnelles Pt1 ,...,tn nécessaires. Comme on cherche un processus gaussien, Pt1 ,...,tn est
connue par sa matrice de covariance définie positive :

Cov Xti , Xtj = K(ti , tj ).
D’après les résultats généraux sur les vecteurs gaussiens, il existe un vecteur gaussien de
loi Pt1 ,...,tn . On dispose alors de la famille des lois fini-dimensionnelles P = {Pt1 ,...,tn :
t1 , . . . , tn } pour laquelle on vérifie les conditions de compatibilité. Le théorème d’extension
de Kolmogorov (Th. 1.1) s’applique et donne un processus de lois fini-dimensionnelles
données par P. Le processus est gaussien car ses lois fini-dimensionnelles le sont. Enfin,
par construction K est la fonction de covariance du processus. De plus le processus est
continu dans L2 (si T = R), car comme K(t) → K(0) quand t → 0, on a
E |Xt − Xs |2 = E (Xt − Xs )(Xt − Xs )
   

= Cov(Xt , Xt ) + Cov(Xs , Xs ) − Cov(Xt , Xs ) − Cov(Xs , Xt )


= 2K(0) − K(t − s) − K(s − t) −→s→t 2K(0) − K(0) − K(0) = 0.


Remarque 3.3 K continue en 0 ⇔ X est L2 -continu ⇔ K est continu partout.


Exemple : Soit X une suite de variables aléatoires iid centrées avec E[X02 ] = 1. C’est un
processus stationnaire sur N. On a facilement

1 n=0 1
K(n) = ⇒ ν= λ|[−π,π] .
0 n 6= 0 2π
3.4. Processus stationnaire 35

3.4.2 Représentation spectrale des processus stationnaires


Théorème 3.4 Soit X un processus centré stationnaire de fonction de covariance K et
de mesure spectrale F . Alors, il existe une mesure aléatoire M contrôlée par F telle que
Z
Xt = eits M (ds).
R

L2 (P)
Démonstration : Notons HX = Vect(Xt , t ∈ T ) (l’adhérence dans L2 (P) de Vect(X
  t, t ∈
T )). Il s’agit d’un espace prehilbertien pour le produit scalaire hX, Y i = E XY =
Cov(X, Y ). On va construire une isométrie entre L2 (F ) et HX .
Soit J qui associe la variable aléatoire Xt à la fonction (s 7→ eits )

L2 (F ) → HX
J:
(s 7→ eits ) 7→ Xt

Pour les polynômes trigonométriques, on pose alors


n
! n
X X
J ck exp(itk ·) = ck Xtk .
k=1 k=1
 Pn itk s

Ce faisant, on a défini J sur M = k=1 ck e : n ∈ N, tk , ck ∈ R . On vérifie sans peine
que c’est une isométrie :
hf, giL2 (F ) = hJ(f ), J(g)iHX .
En effet, soit f = k ak eitk · et g = l bl eitl · , on a
P P

X Z X
hf, giL2 (F ) = ak bl ei(tk −tl )s F (ds) = ak bl K(tk − tl ) (Th. de Bochner)
k,l k,l
X h i hX X i
= ak bl E Xtk Xtl = E ak Xtk bl Xtl = hJ(f ), J(g)iHX .
k,l k l

On utilise maintenant le résultat suivant, bien connu quand F est remplacée par la mesure
de Lebesgue mais admis pour F :
Lemme 3.1 L’ensemble M est dense dans L2 (F ), ie. M = L2 (F ).
Par extension des applications uniformément continues sur les espaces complets, l’isométrie
J : M −→ HX se prolonge en une isométrie J : M = L2 (F ) −→ HX . On définit alors
M (A) = J(1A ) pour A ∈ B et on vérifie maintenant que M est une mesure aléatoire :
— E[M (A)] = 0 : en effet d’abord pour tout t, E[Xt ] = 0 si bien que par linéarité
E[Y ] = 0 pour tout Y ∈ Vect(Xt , t ∈ T ) ; ensuite par continuité pour tout Y ∈ HX ,
E[Y ] = 0 (autrement dit : le caractère centré est conservé par combinaison linéaire
et passage à la limite).
— M (A) ∈ L2 (F ) par définition.
36 Chapitre 3. JCB
c – M2 Math – Université de Rennes 1
 
— E M (A)M (B) = h1A , 1B iL2 (F ) = F (A ∩ B).
Pour terminer, on montre que pour tout f ∈ L2 (F ) : I(f ) = J(f ). En effet, d’abord pour
f = 1A , I(f ) = M (A) et J(f ) = M (A). Par densité des combinaisons linéaires de 1A dans
L2 (F ) et par continuité des isométries I et J, on a I(f ) = J(f ) pour tout f ∈ L2 (F ). On
a alors Z
eits M (ds) = I(eit· ) = J(eit· ) = Xt ,

ce qui prouve le Théorème 3.4. 

Remarque 3.4 Si X est gaussien alors on montre (facilement) que HX est un espace de
variables gaussiennes et M est une mesure aléatoire gaussienne.

3.4.3 Cas des processus stationnaires discrets


Un processus stationnaire discret X est en fait une suite de variables aléatoires iid Xi ,
i ≥ 1. On la suppose centrée E[X1 ] = 0 et réduite E[X12 ] = 1. Alors la covariance est
donnée par K(n) = 1 si n = 0, 0 sinon. Dans ce cas, la mesure spectrale associée est
F = (1/2π)λ[−π,π] .
Si on suppose en plus que les variables aléatoires Xi sont gaussiennes (le processus X est
gaussien discret), la mesure aléatoire est un bruit blanc gaussien : on retrouve (presque)
un mouvement brownien en prenant Bt = M ([0, t]), en effet
    
E Bt Bs = E M ([0, t])M ([0, s]) = (1/2π)λ [0, t] ∩ [0, s] = (1/2π)(t ∧ s).

Il s’agit (à un facteur près) du mouvement brownien standard.

Définition 3.3 (Moyenne mobile) Étant donnée une suite ζ = (ζn )n≥1 de variables
aléatoires iid centrées,
P E[ζn ] = 0, et réduites Var(ζn ) = E[ζn2 ] = σ 2 < +∞, et (an )n≥1 une
2 2
suite de ` (N) (ie. n∈N |an | < +∞). On appelle processus de moyenne mobile la suite
(Xn )n≥1 donnée par
X
Xn = an−k ζk . (3.4)
k∈Z

Proposition 3.5 Soit (Xn )n≥1 un processus stationnaire discret. On a les équivalences
entre
P
1. Le processus est une moyenne mobile Xn = k∈Z an−k ζk avec ζ = (ζk )k∈Z suite iid
et (an )n∈Z ∈ `2 (Z).
2. La densité spectrale existe et est L2 -intégrable par rapport à la mesure de Lebesgue λ.
σ2
|ϕ|2 dλ où ϕ(s) = k∈Z ak e−iks ∈ L2 ([−π, π], λ).
P
Dans ce cas la mesure spectrale s’écrit 2π
3.4. Processus stationnaire 37

Démonstration : 1) ⇒ 2) Comme les ζk sont iid et (an )n∈Z ∈ `2 (Z), on a pour m1 ≤ m2


 2     
X X X
E  an−k ζk   = E  a2n−k ζk2  + E  an−k ζk an−l ζl 
m1 <|k|≤m2 m1 <|k|≤m2 m1 <|k|6=|l|≤m2
 
X X
a2n−k ζk2  +
 
= E an−k an−l E ζk ζl
m1 <|k|≤m2 m1 <|k|6=|l|≤m2
 
X
= σ2  a2n−k 
m1 <|k|≤m2

P  2
la suite |k|≤m an−k ζk m≥1 est de Cauchy dans L (P) et donc convergente, si bien que
Xn est bien défini dans L2 (P). De plus, on montre aussi facilement que (Xn )n≥1 est un
processus stationnaire car ζ = (ζk )k≥1 est une suite iid. Comme ζ est stationnaire, on a
R π iks σ2
ζk = −π e M (ds) où M est une mesure aléatoire de mesure spectrale 2π λ (cas de variables
aléatoires iid). Par linéarité et convergence dominée (et un changement d’indice), on a
Z π
Xn = eins ϕ(s)M (ds)
−π

ak e−iks ∈ L2 ([−π, π], λ). Comme


P
où ϕ(s) = k∈Z

π π
σ2 σ2
Z Z
−ins i(n+k)s
eiks |ϕ(s)|2

Cov Xn , Xn+k = e e ϕ(s)ϕ(s) λ(ds) = λ(ds),
−π 2π −π 2π
σ2
la mesure spectrale de la moyenne mobile X est donc 2π
|ϕ|2 dλ.
2) ⇒ 1). Réciproquement, si X = (Xn )n≥1 est un processus stationnaire discret avec densité
spectrale de la forme |ϕ|2 où ϕ ∈ L2 ([−π, π], λ). Alors ϕ se décompose en série de Fourier
sous la forme X
ϕ(s) = ak e−iks .
k∈Z

On peut écrire
Z π X Z π X Z π
ins ins −iks
Xn = e ϕ(s)ds = ak e e M (ds) = ak ei(n−k)s M (ds)
−π k∈Z −π k∈Z −π
X X
= ak ξn−k = an−k ξk
k∈Z k∈Z

où ξk = −π eiks M (ds) sont des variables aléatoires iid. Le processus stationnaire discret
X = (X)n≥1 se réécrit donc sous la forme d’une moyenne mobile (3.4). 
38 Chapitre 3. JCB
c – M2 Math – Université de Rennes 1

Théorème 3.5 (LGN pour les processus stationnaires) Soit X = (Xn )n≥1 un pro-
cessus discret stationnaire de fonction de covariance K et de mesure spectrale F . On a les
équivalences :
L2
1. n1 n−1
P
k=0 Xk −→ 0, n → +∞ ;

2. limn→+∞ n1 n−1
P
k=0 K(k) = 0 ;
3. F ({0}) = 0.

Démonstration : On a Xn = −π
eins M (ds) où M est une mesure aléatoire compensée
(contrôlée) par F . On a
n−1 n−1 Z π Z π
1X 1X iks
Xk = e M (ds) = ϕn (s)M (ds)
n k=0 n k=0 −π −π

avec (
n−1
1 X iks 1 si s = 0
ϕn (s) = e = eins −1
n k=0 n(eis −1)
6 0.
si s =

eins −1 2
Comme n(eis −1) ≤ n|eis −1|
, on a

1 si s = 0
lim ϕn (s) = ϕ(s) = = 1{0} (s).
n→+∞ 0 6 0
si s =

Puis comme |ϕn (s)| ≤ n1 n−1 iks


P
k=0 |e | = 1, par convergence dominée, on a ϕn → ϕ, n → +∞,
dans L2 (F ). On a donc, par isométrie (Prop. 3.1), dans L2 (P), en toute généralité :
n−1 Z π Z π
1X L2
Xk = ϕn (s)M (ds) −→ ϕ(s)M (ds) = M ({0}). (3.5)
n k=0 −π −π


Dès lors, 1) ⇔ 3) est immédiate avec (3.5) et F ({0}) = Var M ({0}) = 0.
Puis par le théorème de Bochner (Th. 3.2)
n−1 n−1 Z π Z π Z π
1X 1X iks
K(k) = e dF (s) = ϕn (s) dF −→ ϕ(s)dF = F ({0}),
n k=0 n k=0 −π −π −π

ce qui donne 2) ⇔ 3) et conclut la preuve du Théorème 3.5. 


Chapitre 4

Mouvement brownien

Dans ce chapitre, on présente le mouvement brownien (mB). Nous renvoyons à [LG0]


pour une introduction générale de ce processus, à [KS], [RY] pour une description détaillée
des principales propriétés du mouvement brownien.
On commence par quelques dates marquantes de l’histoire du mouvement brownien en
Section 4.1 avant de définir le mouvement brownien en Section 4.2. On en étudie les
propriétés en loi en Section 4.3, propriétés des trajectoires en Section 4.4, la variation
quadratique en Section 4.5. On étudie enfin la propriété de Markov forte en Section 4.6 avec
notamment le principe de réflexion. On revient à l’équation de la chaleur en Section 4.7.
Historiquement, le mouvement brownien a été exhibé pour représenter des mouvements qui
évoluent au cours du temps de façon particulièrement désordonnée, par exemple en finance
pour représenter des cours de bourses très volatiles ou en physique pour représenter des
particules microscopiques soumises aux multiples chocs de leur environnement. Le mouve-
ment brownien joue un rôle central dans la théorie des processus stochastiques (comme la
loi N (0, 1) pour les lois de probabilités sur R). Il apparaı̂t dans de nombreuses situations
aussi bien théoriques qu’appliquées et il offre un cadre assez simple où de nombreux calculs
peuvent être menés.

4.1 Historique
En 1827, la première description (heuristique) du mouvement brownien est due au bota-
niste écossais Robert Brown (qui lui a donc donné son nom). Il observe de fines particules
organiques en suspension dans un gaz ou un fluide et en décrit les mouvement particulière-
ment erratique, au point que plusieurs physiciens estiment ensuite pendant le 19ème siècle
que ce mouvement ne semble pas admettre de tangente. On ne pourrait donc pas parler de
vitesse, ni appliquer les lois classiques de la mécanique !
En 1900, la première approche mathématique du mouvement brownien est due au français
Louis Bachelier (dans sa Théorie de la spéculation). Il l’introduit pour modéliser la dyna-
mique des prix des actions à la bourse. Sa démarche sera cependant oubliée jusque vers les
années 1960.

39
40 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1

En 1905, l’allemand Albert Einstein (dans sa Théorie de la relativité restreinte) construit


un modèle probabiliste pour décrire le mouvement d’une particule qui diffuse : il montre
notamment que la loi de la position à l’instant t de la particule, sachant que l’état initial
est x, admet une densité qui vérifie l’équation de la chaleur et de ce fait est gaussienne.
Davantage d’explications sur les relations entre mouvement brownien et équation de la
chaleur sont données en Section 4.7.
La même année qu’Einstein, le physicien polonais Marian von Smoluchowki utilise des pro-
menades aléatoires pour décrire le mouvement brownien : il en est les limites.
En 1923, l’américain Norbert Wiener donne une première construction mathématique ri-
goureuse du mouvement brownien en tant que processus stochastique. Il établit en parti-
culier la continuité des trajectoires.
Dans la période 1930–1960, de nombreuses propriétés du mouvement brownien sont en-
suite établies notamment par le français Paul Lévy. La notion d’équation différentielle
stochastique est introduite. Le japonais Kiyoshi Itô les généralisera et les analysera avec
son traité de 1948. Cette démarche très féconde établit des liens importants entre analyse
et probabilité et fonde l’analyse et le calcul stochastiques.
Les relations entre probabilités et physique sont, elles, explorées via le mouvement brow-
nien et ses généralisations dès 1930 par les néerlandais Leonard Ornstein et George Eugene
Uhlenbeck en suivant une idée du français Paul Langevin. Ils montrent que le processus
d’Ornstein-Uhlenbeck décrit la situation d’équilibre d’un modèle dirigé par le mouvement
brownien.
Depuis, de nombreux tavaux sont consacrés au mouvement brownien, à ses généralisations
et au calcul stochastique. Citons pour terminer Wolfgang Döblin, mathématicien franco-
allemand dont les travaux précurseurs en analyse stochastique (fin des années 30) sont
restés méconnus jusqu’à l’ouverture de son célèbre pli cacheté en 2000 à l’académie des
sciences de Paris (Döblin, mobilisé pendant la deuxième guerre mondiale avait envoyé ses
travaux depuis le front, par crainte de ne pas revenir de la guerre. Il n’en est pas revenu.
Son courrier est resté oublié jusqu’en 2000).

Dans le cadre déterministe, de nombreux phénomènes sont régis par des équations
différentielles (ou équations aux dérivées partielles). Pour les phénomènes modélisés par
un mouvement brownien, on s’attend à avoir des équations différentielles faisant interve-
nir le mouvement brownien. Malheureusement, ce processus a des trajectoires nulle part
dérivables (cf. Prop. 4.6 et Th. 4.1) et il n’est pas possible de considérer des équations
différentielles le faisant vraiment intervenir. Plutôt que de le dériver, on cherchera dans
la suite, à intégrer contre ce processus, ce qui permettra de contourner le problème en
considérant des équations intégrales (il est d’usage de se ramener à l’écriture symbolique
de dérivées et on parlera alors d’équation différentielle stochastique). Dans les prochains
chapitres (cf. Chapitre ??), on définit l’intégrale stochastique pour une large classe de pro-
cessus (les semimartingales, cf. Chapitre 6). Si on se contente du cadre brownien (intégrale
et équation différentielle stochastique pour le mouvement brownien), on parle de calcul
d’Itô. Dans ce cadre simplifié, la contruction est plus directe. On consulera les notes cours
[Tud] ou le livre [Gal] pour cette approche réservée au brownien
4.2. Définition, premières propriétés 41

Dans ce chapitre, nous en donnons les principales propriétés (en loi en Section 4.3, tra-
jectorielles en Section 4.4, variation quadratique en Section 4.5) notamment les propriétés
de Markov faible et forte (Section 4.6). À la fin du chapitre en Section 4.7, nous explorons
les liens entre le mouvement brownien et l’équation de la chaleur, ce qui correspond à la
démarche d’Einstein pour appréhender le mouvement brownien.

4.2 Définition, premières propriétés


Le caractère très erratique des trajectoires qui caractérise le mouvement brownien est en
général associé à l’observation que le phénomène, bien que très désordonné, présente une
certaine homogénéité dans le temps, au sens où la date d’origine des observations n’a pas
d’importance. Ces propriétés sont reprises dans la définition qui suit.

Définition 4.1 Un mouvement brownien (standard) réel est un processus gaussien centré
(Bt )t≥0 à trajectoires continues de fonction de covariance

K(s, t) = min(s, t) := s ∧ t.

On l’appelle aussi processus de Wiener.

L’opérateur K(s, t) = min(s, t) est symétrique et de type positif. En effet si c : R → R est


à support borné alors
X X
c(s)c(t)K(s, t) = c(s)c(t)(s ∧ t)
s,t∈R s,t∈R
X Z
= c(s)c(t) 1[0,s] (x)1[0,t] (x)dx
s,t∈R
Z X
= c(s)c(t)1[0,s] (x)1[0,t] (x)dx
s,t∈R
Z !2
X
= c(t)1[0,t] (x) dx ≥ 0.
t∈R

Par le Théorème 2.1, il existe donc un processus gaussien centré de covariance K. Par
contre, il n’est pas évident qu’il admette une version à trajectoires continues ps. Cela sera
justifié en début de Section ?? avec le théorème de régularité de Kolmogorov-Centsov
(Th. 2.2).

4.2.1 Propriétés immédiates


1) B0 = 0 car la loi de B0 est N (0, 0) = δ0 , la loi dégénérée en 0.
2) Bt ∼ N (0, t) car E[Bt ] = 0 et Var(Bt ) = K(t, t) = t.
42 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1

3) (Bt )t≥0 est un processus à accroissements indépendants. En effet soit 0 ≤ t1 < t2 < t3 <
t4 , on a
  
Cov Bt2 − Bt1 , Bt4 − Bt3 = E (Bt2 − Bt1 )(Bt4 − Bt3 )
       
= E Bt2 Bt4 − E Bt2 Bt3 − E Bt1 Bt4 + E Bt1 Bt3
= t2 − t2 − t1 + t1 = 0.

Les variables Bt2 − Bt1 et Bt4 − Bt3 sont donc non corrélées. Comme le vecteur (Bt2 −
Bt1 , Bt4 − Bt3 ) est gaussien, Bt2 − Bt1 et Bt4 − Bt3 sont indépendantes. On justifie de même
l’indépendance mutuelle de n accroissements, n ≥ 1.
4) Si s ≤ t, on a Bt − Bs ∼ Bt−s . En effet E[Bt − Bs ] = E[Bt ] − E[Bs ] = 0 et

Var(Bt − Bs ) = Cov(Bt − Bs , Bt − Bs )
= Cov(Bt , Bt ) − 2 Cov(Bt , Bs ) + Cov(Bs , Bs )
= t − 2s + s = t − s.

Donc Bt − Bs ∼ N (0, t − s) ∼ Bt−s .

Remarque 4.1 Les propriétes 3) et 4) s’énoncent comme suit : le mouvement brownien


a des accroissements indépendants et stationnaires.

Définition 4.2 (Définition équivalente du mB) Soit B = (Bt )t≥0 une famille de va-
riables aléatoires indéxées par le temps. On dit que B est un mouvement brownien si c’est
un processus à trajectoires continues tel que
i) pour tout t ≥ 0 : Bt ∼ N (0, t).
ii) pour tout 0 ≤ t1 ≤ t2 ≤ · · · ≤ tn , les variables aléatoires Bt1 , Bt2 − Bt1 , . . . Btn − Btn−1
sont indépendantes.

Preuve de l’équivalence. On sait déjà qu’un mB vérifie i) et ii). Il reste à voir la réci-
proque. En écrivant Bt = Bs +Bt −Bs pour s ≤ t, on a par indépendance des accroissements
ϕBt = ϕBs ϕBt −Bs . D’où

ϕBt −Bs (x) = ϕBt (x)ϕBs (x)−1 = exp(−tx2 /2) exp(sx2 /2) = exp(−(t − s)x2 /2) = ϕBt−s (x).

Les accroissements sont donc stationnaires, en particulier ils sont gaussiens. Comme les
accroissements sont indépendants, un vecteur d’accroissements (Bt1 , Bt2 − Bt1 , . . . Btn −
Btn−1 ) a pour loi la loi produit de ses lois marginales qui sont gaussiennes. Un vecteur
d’accroissements est donc gaussien. Mais comme (Bt1 , Bt2 , . . . , Btn ) est une transformation
linéaire de (Bt1 , Bt2 − Bt1 , . . . , Btn − Btn−1 ) cela reste gaussien. Les lois fini-dimensionnelles
étant gaussiennes, le processus est gaussien. Puis pour s ≤ t, on a

Cov(Bt , Bs ) = E[Bt Bs ] = E[(Bt − Bs + Bs )Bs ] = E[Bt − Bs ]E[Bs ] + E[Bs2 ] = 0 + s = s,


4.3. Propriétés en loi du mouvement brownien 43

ce qui confirme que le processus défini par la définition alternative Déf. 4.2 est le mouve-
ment brownien. 

[Graphe des trajectoires typiques du MB]


La probabilité que Bt appartienne à un petit intervalle [x, x + dx] est donc donnée par la
densité gaussienne centrée de variance t
1
exp − x2 /2t dx.
 
P Bt ∈ [x, x + dx] = √
2πt
En particulier, la variable aléatoire Bt qui√est une variable √
aléatoire gaussienne de variance t
est comprise entre les nombres f1 (t) = 2 t et f2 (t) = −2 t avec une probabilité (d’à peu
près) 95% (cf. table de la loi N (0, 1)).
On peut montrer que cette propriété est vraie pour toute la trajectoire brownienne qui est
donc comprise entre les deux courbes de f1 et de f2 avec une probabilité comparable (c’est
vrai globalement et pas seulement « t par t »). Mais en général, les phénomènes observés
ne sont pas aussi bien normalisés.
Définition 4.3 (Mouvement brownien avec dérive) On appelle encore mouvement brow-
nien issu de x et de dérive (ou drift) b et de coefficient de diffusion σ, le processus
Xt = x + σBt + µt.
Proposition 4.1 Le mouvement brownien (général) X est encore un processus à accrois-
sements indépendants stationnaires
 et gaussiens. Il est non centré et tel que X0 = x. De
2
plus Xt ∼ N x + µt, σ t .
Sauf mention contraire, par défaut, quand on parlera du mouvement brownien, il s’agira
du mouvement brownien standard B.

4.3 Propriétés en loi du mouvement brownien


On se fixe dans cette section un mouvement brownien B. Systématiquement, pour vérifier
qu’on a un mouvement brownien, il s’agit de vérifier qu’on a un processus gaussien, cen-
tré, à trajectoires continues et avec la bonne fonction de covariance. Dans les propriétés
qui suivent, il est facile (et omis) de constater que le processus est gaussien, centré et à
trajectoires continues ; on se contente de calculer l’opérateur de covariance.
1) Symétrie. −B est un mouvement brownien.
(c)
2) Autosimilarité (propriété d’échelle). Pour tout c > 0, Bt = √1c Bct définit un
mouvement brownien (standard).
(c)
En effet : Bt est un processus gaussien car ses lois fini dimensionnelles en sont de B ; le
processus est centré, à trajectoires continues (car B l’est) et de fonction de covariance
 
 (c) (c)  1 1 1
E Bt Bs = E √ Bct √ Bcs = min(ct, cs) = min(t, s).
c c c
44 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1

Conséquence : Cette propriété montre que c fois Bt se comporte comme un mouvement


brownien lu en c2 t : le changement de temps se lit en espace (et réciproquement).
3) Inversion du temps. Le processus B et = tB1/t si t 6= 0 et B
e défini par B e0 = 0 est un
mouvement brownien standard.
En effet, Be est gaussien car à nouveau ses lois fini-dimensionnelles sont des transformations
linéaires de celles de B ; le processus est centré de covariance,
 
Cov B et , B
es = ts Cov B1/t , B1/s = ts min(1/t, 1/s) = ts/ max(t, s) = min(t, s).

De plus, ses trajectoires sont continues sur ]0, +∞[ car celles de B le sont sur R+ . Il reste
à voir la continuité des trajectoires de B
e en 0 et cela vient de
 
  \[ \ 
P lim B et = 0 = P  |B
et | ≤ 1/n 
t→0
n≥1 p≥1 t∈]0,1/p]∩Q
 
et )t>0 f=
dd
\[ \ 
= P |Bt | ≤ 1/n  car (B (Bt )t>0
n≥1 p≥1 t∈]0,1/p]∩Q
 
= P lim Bt = 0 = 1.
t→0

Conséquence : le processus B a donc le même type de comportement en 0 et en +∞


4) Retournement du temps. Le processus retourné à l’instant T , B bt(T ) = BT − BT −t est
encore un mouvement brownien sur [0, T ].
Il est clair que B b (T ) est un processus gaussien, centré à trajectoires continues et sa covariance
est donnée par
bt(T ) , B
bs(T ) = Cov(BT − BT −t , BT − BT −s )

Cov B
= Cov(BT , BT ) − Cov(BT , BT −s ) − Cov(BT −t , BT ) + Cov(BT −t , BT −s )
= T − (T − s) − (T − t) + T − max(t, s) = min(t, s).

5) Propriété de Markov faible (ou invariance par translation). Le mouvement brownien


(t0 )
translaté de t0 > 0 B t = Bt+t0 − Bt0 est encore un mouvement brownien standard ; de
(t0 )
plus il est indépendant du mouvement brownien arrêté en t0 (Bt )0≤t≤t0 , ie. B ⊥ FtB0 :=

σ(Bs : s ≤ t0 ).
En effet pour t0 ≤ s ≤ t :
(t0 ) (t0 ) 
Cov B t , B s = Cov(Bt+t0 − Bt0 , Bs+t0 − Bt0 )
= K(t + t0 , s + t0 ) − K(t + t0 , t0 ) − K(t0 , s + t0 ) + K(t0 , t0 )
= s + t0 − t0 − t0 + t0 = s = min(s, t).
La deuxième partie est due à l’indépendance des accroissements de B : Soit 0 ≤ s1 < · · · <
(t0 )
sn ≤ t0 , par indépendance des accroissements de B, B t = Bt+t0 − Bt0 est indépendant de
4.4. Propriétés trajectorielles du mouvement brownien 45

(Bs1 , Bs2 − Bs1 , . . . , Bsn − Bsn−1 ), donc par transformation linéaire de (Bs1 , . . . , Bsn ). Cela
(t0 ) (t0 )
est encore vrai pour tout vecteur de marginales de B . On a donc B indépendant de
{Bs1 ∈ A1 , . . . , Bsn ∈ An }, 0 ≤ s1 < · · · < sn ≤ t0 et A1 , . . . , An ∈ B(R). Comme il s’agit
(t0 )
d’un mesurable typique de FtB0 , on a B t ⊥ ⊥ FtB0 = σ(Bt : t ≤ t0 ). 
De la même façon, on montre que pour t1 < t2 , Bt1 +t0 −Bt0 , Bt2 +t0 −Bt1 +t0 est indépendant
de FtB0 . Mais comme

(t0 ) (t0 )  
B t1 , B t2 = Bt1 +t0 − Bt0 , Bt2 +t0 − Bt0

(t0 ) (t0 ) 
en est une image linéaire, cela reste donc vrai pour B t1 , B t2 et plus généralement pour
(t0 ) (t0 ) 
toutes les lois fini-dimensionnelles de B : B t t≥0 ⊥ ⊥ FtB0 .
Conséquence : le processus Bt a donc le même comportement localement en 0 et en t0 ,
donc en tout point.
Cette propriété se réécrit dans le cadre classique de la théorie de Markov : indépendance
du futur et du passé conditionnellement au présent : en notant Wx la loi du mouvement
brownien issu de x ∈ R, ie. de x+B où B est un mouvement brownien habituel, on réécrit :

Proposition 4.2 (Propriété de Markov faible) Soit t ≥ 0 fixé. Posons Bs0 = Bt+s ,
x ∈ R. Alors conditionnellement à Bt = x, le processus B 0 est indépendant de σ(Bu : u ≤
t) = FtB et a pour loi Wx .

(t) (t)
Démonstration : Pour cela, il suffit de remarquer que Bs0 = B s + Bt où B s = Bt+s − Bt
est un mouvement brownien indépendant de FtB et Bt est une variable FtB -mesurable. 

4.4 Propriétés trajectorielles du mouvement brownien


4.4.1 Loi du 0/1 de Blumenthal
On définit d’abord la notion de filtration en temps continu qui sera essentielle pour consi-
dérer les martingales au Chapitre 5.

Définition 4.4 (Filtration) Une filtration sur un espace de probabilité (Ω, F, P) est une
famille (Ft )t≥0 de sous-tribus telle que pour s ≤ t, on a Fs ⊂ Ft .

Si on considère un processus (Xt )t≥0 , on considère souvent la filtration qu’il engendre :


FtX = σ(Xs : s ≤ t). Dans ce cas, il est utile d’interpréter une filtration comme une quan-
tité d’information disponible jusqu’à une date donnée : FtX représente ainsi l’information
véhiculée par le processus X jusqu’à la date t.
Une filtration est P-complète pour une mesure de probabilité P si F0 contient tous les
46 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1

évènements de mesure nulle, ie. N = {N ∈ F tel que P(N ) = 0}⊂ F0 .


À une filtration (Ft )t≥0 on associe
\ _
Ft+ = Ft+ε et Ft− = Ft−ε .
ε>0 ε>0

(On rappelle que A ∨ B = σ(A ∪ B).) La filtration (Ft )tg eq0 est dite continue à droite
(resp. continue à gauche) si pour tout t, on a Ft = Ft+ (resp. Ft = Ft− ).
Dans la suite, on dira qu’une filtration satisfait les conditions habituelles si elle est
complète et continue à droite.

Proposition 4.3 La filtration brownienne (FtB )t≥0 est continue à droite.

Corollaire 4.1 (Loi du 0/1 de Blumenthal) La tribu F0B+ est triviale, ie. pour tout
A ∈ F0B+ , on a P(A) = 0 ou 1.

Remarque 4.2 — En fait, la filtration brownienne est aussi continue à gauche :


FtB = s<t FsB .
W
C’est le cas de toute filtration (FtX )t≥0 engendrée par un processus à trajectoires
continues à gauche. En effet, FtX est engendrée par les ensembles A = {(Xt1 , . . . , Xtp ) ∈
Γ} avec 0 = t1 < · · · < tp = t et Γ ∈ B(Rp ). Comme Xt = limm→+∞ Xsm pour toute
suite sm ∈ [0, t) avec sm % t, on a A ∈ FtX− . Finalement, FtX− = FtX .
— Une filtration (Ft+ )t≥0 est toujours continue à droite.
— Attention : si X est à trajectoires continues, (FtX )t≥0 peut ne pas être continue à
droite, ni (FtX+ )t≥0 à gauche, cf. contre-exemples p. 89 et 122 dans [KS].

Preuve de la continuité à droite de la filtration brownienne.


i) La tribu F0B+ est triviale (ie. Blumenthal).
On considère le processus Xn défini sur [0, 2−n ] par Xn = B2−n +t − B2−n , 0 ≤ t ≤ 2−n .


La suite (Xn )n≥1 est une suite de processus indépendants (par l’indépendance des accrois-
sements du mouvement brownien). On remarque que l’on peut retrouver la trajectoire
brownienne à partir des Xk , k ≥ n, par
+∞
X
B2−n +t = Xn (t) + Xn+k (2−n−k ), 0 ≤ t ≤ 2n
k=1

car B2−n → 0, n → +∞. Soit pour t > 0 et 2−p ≤ t < 2−p+1 , en écrivant t = 2−p + s,
s ∈ [0, 2−p ] (ie. p = [−t/ ln 2] + 1) :
X
Bt = B2−p +s = Xp (t − 2−p ) + Xk (2−k )
k>p

En particulier pour 0 < t ≤ 2−n , on a p ≥ n et Bt ∈ σ Xn+1 , . . . , Xn+k , . . . . On en déduit




F2B−n = σ Xn+1 , . . . , Xn+k , . . .



4.4. Propriétés trajectorielles du mouvement brownien 47

et comme F0B+ = n≥0 F2B−n , F0B+ est la tribu asymptotique engendrée par les processus
T

indépendants Xn . D’après la loi du 0/1 (classique) de Kolmogorov, F0B+ est alors triviale.
i’) Autre preuve de la loi de Blumenthal. Soient 0 < t1 < t2 < · · · < tk , g : Rk → R
une fonction continue bornée et aussi A ∈ F0B+ . Par continuité et convergence dominée, on
a    
E 1A g(Bt1 , . . . , Btk ) = lim E 1A g(Bt1 − Bε , . . . , Btk − Bε ) .
ε→0

Mais dès que ε < t1 , les variables aléatoires Bt1 − Bε , . . . , Btk − Bε sont T
indépendantes de
Fε (par la propriété de Markov simple) et donc aussi de la tribu F0+ (= ε>0 FεB ). Il vient
B B

   
E 1A g(Bt1 , . . . , Btk ) = lim P(A)E g(Bt1 − Bε , . . . , Btk − Bε )
ε→0
= P(A)E[g(Bt1 , . . . , Btk )].

On a donc F0B+ ⊥ ⊥ σ(Bt1 , . . . , Btk ). Comme c’est vrai pour tout 0 < t1 < · · · < tk , on a
aussi F0B+ ⊥
⊥ σ(Bt , t > 0). Puis B0 étant la limite simple de Bt (continuité de t 7→ Bt en
⊥ F0B+ , ce qui
0), on a σ(Bt , t ≥ 0) = σ(Bt , t > 0) et F0B+ ⊂ σ(Bt , t ≥ 0), si bien que F0B+ ⊥
B
assure que F0+ est grossière.
ii) Continuité à droite de la filtration brownienne (Prop. 4.3).
Nous utilisons le théorème de classe monotone (version fonctionnelle) soient C un ensemble
de fonctions stable par multiplication, E un espace vectoriel fonctionnel monotone (ie.
f ∈ E est bornée, les constantes sont dans E, si fn ∈ E et fn % f bornée alors f ∈ E) tel
que C ⊂ E alors E contient toutes les fonctions σ(C)-mesurables.
Soit t ≥ 0 et ε > 0. On considère la tribu

Gt = σ Bt+s − Bt : s ≥ 0 .

Montrons que Gt est indépendante B


de FtB+ . Par construction, Gt+ε est indépendante de Ft+ε
et donc indépendante de FtB+ = ε>0 Ft+ε
B
T
. Si t1 ≤ t2 alors Gt2 ⊂ Gt1 car

Bt2 +s − Bt2 = Bt1 +(t2 +s−t1 ) − Bt1 − (Bt1 +(t2 −t1 ) − Bt1 )

s’exprime en fonction de deux variables W Gt1 -mesurables. La famille Gt+ε , ε > 0, est donc
croissante quand ε décroit, de limite ε>0 Gt+ε .
W tout s ≥ 0, Bt+s −BtW= limε→0 Bt+s+ε −
Par ailleurs, par continuité des trajectoires de B, pour
Bt+ε , donc Bt+s − Bt est mesurable par rapport à ε>0 Gt+ε . D’où Gt = ε>0 Gt+ε et donc
Gt est indépendante de FtB+ .
Soit maintenant des variables aléatoires bornées telles que X soit FtB -mesurable, Y FtB+ -
mesurable (positive) et Z Gt -mesurable. Alors

E[XZY ] = E[XY ]E[Z] car FtB ⊂ FtB+ ⊥


⊥ Gt
B
 
= E XE[Y |Ft ] E[Z]
= E XZE[Y |FtB ] car FtB ⊥
 
⊥ Gt .
48 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1

Considérons
 l’espace
 vectoriel E des variables aléatoires bornées W telles que E[W Y ] =
B
E W E[Y |Ft ] . Il s’agit d’un espace vectoriel monotone (théorème de convergence mono-
tone). Cet espace contient la classe multiplicative M des variables aléatoires de la forme
XZ avec X ∈ L∞ (FtB ) et Z ∈ L∞ (Gt ). D’après le théorème fonctionnel de classe mono-
tone, l’espaceWvectoriel E contient toutes les variables aléatoires bornées et mesurables par
rapport à Gt FtB = F B où F B est la tribu engendrée par tout  le mouvement brownien.
∞ B B

Par conséquent, pour tout W ∈ L (F ) on a E[W Y ] = E W E[Y |Ft ] . En particulier,
Y = E[Y |FtB ] ps. Comme la tribu est complète, Y coı̈ncide avec une variable FtB -mesurable.
On peut faire de même pour Y de signe quelconque en écrivant Y = Y + − Y − . Finalement,
cela exige FtB = FtB+ . 

4.4.2 Conséquences trajectorielles de la loi du 0/1 de Blumenthal


Proposition 4.4 (sup et inf browniens)
1. On a ps pour tout ε > 0

sup Bs > 0, inf Bs < 0.


0≤s≤ε 0≤s≤ε

2. Pour tout η > 0, on a ps

sup Bt ≥ η, inf Bt ≤ −η.


t≥0 t≥0

3. Pour tout a ∈ R, soit Ta = inf{t ≥ 0 : Bt = a} (avec inf ∅ = +∞). Alors ps


Ta < +∞.
4. Par conséquent, presque sûrement

lim sup Bt = +∞, lim inf Bt = −∞, (4.1)


t→+∞ t→+∞

Remarque 4.3 — La mesurabilité de sup/inf est assurée par la continuité du mou-


vement brownien (si bien que le sup est un max, l’inf un min, donc sont mesurables).
— Comme les trajectoires du mouvement brownien sont continues et inf 0<t≤ε Bt <
0 < sup0<t≤ε Bt , par le théorème des valeurs intermédiaires, il existe un zero tε ∈]0, ε[
de B. On en déduit que ps {t ≥ 0 : Bt = 0} admet 0 comme point d’accumulation.
— Par translation (Markov simple), toute valeur du mouvement brownien est un
point d’accumulation de sa trajectoire ps.
— En utilisant la propriété de Markov simple, on constate aussi facilement que ps
la fonction t 7→ Bt n’est monotone sur aucun intervalle non-trivial.
4.4. Propriétés trajectorielles du mouvement brownien 49

Démonstration : 1) Soit (εp )p≥1 une suite de réels strictement positifs décroissants vers
0 et soit ( )
\
A= sup Bs > 0 .
0≤s≤εp
p≥1

Comme sup0≤s≤εp Bs est FεBp -mesurable, on a A ∈ p≥1 FεBp = F0B+ . Puis, comme l’intersec-
T
tion définissant A est décroissante, on a
 
P(A) = lim P sup Bs > 0
p→+∞ 0≤s≤εp

mais comme   1
P sup Bs > 0 ≥ P(Bεp > 0) = ,
0≤s≤εp 2
on a P(A) ≥ 1/2 et la loi de Blumenthal exige alors P(A) = 1. Comme A ⊂ {sup0≤t≤ε Bt >
0}, on a le résultat pour le sup. L’assertion concernant inf 0≤s≤ε Bs est obtenue par symétrie
en loi en remplaçant B par −B.
2) Par convergence monotone des probabilités, on a
   
1 = P sup Bs > 0 = lim P sup Bs > δ .
0≤s≤1 δ→0 0≤s≤1

Avec le changement s = tδ 2 , puis comme par autosimilarité Bδ2 t /δ définit encore un mou-
vement brownien,
     
P sup Bs > δ = P sup (Bδ2 t /δ) > 1 = P sup Bs > 1 .
0≤s≤1 0≤t≤1/δ 2 0≤s≤1/δ 2

En faisant tendre δ → 0, par convergence monotone des probabilités, on obtient ainsi


P sups≥0 Bs > 1 = 1. Puis, à nouveau, avec l’autosimilarité, on a, pour tout η > 0,
P sups≥0 Bs > η = 1 : Bη2 u /η définissant un mouvement brownien standard
     
P sup Bs > η = P sup(Bη2 u /η) > 1 = P sup Bu > 1 = 1.
s≥0 u≥0 u≥0

Avec le changement B → −B, on a aussi P inf s≥0 Bs < −η = 1.
3) Comme {Ta > t} = {sups≤t Bs < a}, avec tp % +∞, on a
! !
\
P(Ta = +∞) = P {Ta > tp } = lim P(Ta > tp ) = lim P sup Bs < a
p→+∞ p→+∞ s≤tp
p≥1
!  
\
= P sup Bs < a = P sup Bs < a = 0
s≤tp s≥0
p≥1

d’après 2), si bien que Ta < +∞ ps.


50 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1

4) Puis la dernière assertion est une conséquence du fait qu’une fonction continue f : R+ →
R ne peut visiter tous les réels que si lim supt→+∞ f (t) = +∞ et lim inf t→+∞ f (t) = −∞. 

Remarque 4.4 Le mouvement brownien oscille ps entre +∞ et −∞ lorsque t → +∞


mais avec une vitesse d’oscillation sous-linéaire puisque |Bt /t| → 0, quand t → +∞.
En effet, il suffit de se rappeler par inversion du temps que B et = tB1/t est encore un
mouvement brownien. Si bien que Bt /t = B e1/t → B̃0 = 0 quand t → +∞ (on peut aussi
jusifier ce fait par la LGN).

4.4.3 Régularité trajectorielle brownienne


Proposition 4.5 Le mouvement brownien (Bt )t≥0 a des trajectoires ps localement holdé-
riennes de tout ordre γ < 1/2.

En particulier, on montre qu’un processus gaussien centré de covariance t∧s admet donc une
modification à trajectoires continues, c’est à dire une version est un mouvement brownien.
Démonstration : En effet, on a

K(t, t) + K(s, s) − 2K(s, t) = t + s − 2 min(t, s) = |t − s|.

Donc le Théorème 2.2 (Kolmogorov-Čentsov dans le cas gaussien) s’applique avec α = C =


1 pour B sur [0, 1]. Il donne l’existence de version avec la continuité höldérienne pour tout
γ < α/2 = 1/2. Comme le mouvement brownien et ces versions sont continues, elles sont
toutes indistinguables. C’est bien le mouvement brownien qui a ces propriétés de régula-
rité. Le résultat reste vrai pour B sur tout intervalle [0, T ] borné et on a donc la locale
Hölder-régularité sur R+ . 

Proposition 4.6 En chaque t ≥ 0, les trajectoires du mouvement brownien sont ps non


dérivables.

Démonstration : Par la propriété de translation (Markov simple), il suffit de montrer la


non dérivabilité en 0, c’est à dire montrer que
Bt − B0 Bt
lim = lim
t→0 t − 0 t→0 t

n’existe pas. Or par inversion du temps Bt /t = B e1/t où B


e est encore un mouvement
brownien. Mais d’après la Prop. 4.4 pour le mouvement brownien B e (cf. (4.1)), on a

lim sup B
es = +∞, es = −∞
lim inf B
s→+∞ s→+∞
4.5. Variation quadratique 51

avec s = 1/t, ce qui montre que la limite cherchée n’existe pas. 

En fait, on a bien mieux : le résultat suivant montre que : ps, les trajectoires browniennes
sont nulle part dérivables.

Théorème 4.1 (Dvoretsky, 1963) Il existe une constante C > 0 telle que
 
|Bs − Bt |
P ∃t > 0 : lim sup √ < C = 0.
s→t+ s−t

Avant la preuve, étudions la conséquence sur la (non) dérivabilité des trajectoires brow-
niennes : d’après Dvoretsky, on a ps ∀t ∈ [0, 1], lim sups→t+ |B√ss−t
−Bt |
≥ C > 0 et si B était
dérivable en t de dérivée `, on aurait quand s & t

|Bs − Bt | |Bs − Bt | √ √
√ = × s − t ∼ ` s − t → 0,
s−t s−t

ce qui nie le résultat de Dvoretsky. Ainsi, ps : en tout t ∈ [0, 1], B est donc non dérivable.
Le résultat s’étend aisément à tout t ≥ 0 pour un mouvement brownien défini sur R+ .

4.5 Variation quadratique


Définition 4.5 (Variation) Soit f : [0, 1] → R. On définit la α-variation de f par

f (tk+1 ) − f (tk ) α
X
V ar(f, α) = lim sup
ε→0 {t }:ρ({t })≤ε
k k k

où ρ({tk }) = maxk |tk − tk−1 | est le pas de la subdivision de [0, 1] et le sup est pris sur
l’ensemble de ces subdivisions.
Pour α = 1, on parle de la variation. On dit que f est à variations bornées si V ar(f, 1) <
+∞. Pour α = 2, on parle de la variation quadratique.

Remarque 4.5 Pour une fonction f de classe C 1 , la variation quadratique tend vers 0 sur
tout intervalle [0, t], en effet, avec une partition 0 = t0 < t1 < · · · < tn = t, on a avec le
théorème des accroissements finis :
n
X n
X
Vf (t0 , t1 , . . . , tn ) := (f (ti ) − f (ti−1 ))2 = (f 0 (t∗i )(ti − ti−1 ))2
j=1 j=1
n
X
≤ δkf 0 k2∞ |ti − ti−1 | = δkf 0 k2∞ t
j=1

où t∗i ∈]ti , ti+1 [ est donné par le théorème des accroissements finis appliqué à la fonction
dérivable f .
52 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1

Proposition 4.7 (Variation quadratique brownienne) SoitPt > 0 et {0 = t0 < t1 <


· · · < tn = t} une subdivision de [0, t], notons VB (t0 , t1 , . . . , tn ) = nj=1 (Btj − Btj−1 )2 . Alors
1. VB (t0 , t1 , . . . , tn ) converge dans L2 vers t lorsque le pas de la subdivision δ := max1≤j≤n (tj −
tj−1 ) tend vers 0.
2. De plus, si la subdivision est uniforme, la convergence est presque sûre.

Heuristiquement : la variation quadratique du mouvement brownien sur [0, t] est donc t.


Démonstration : Notons d’abord que le carré d’une variable gaussienne X centrée de
variance σ 2 est une variable aléatoire d’espérance σ 2 et de variance Var(X 2 ) = 3σ 4 − σ 4 =
2σ 4 (calculs par ipp).
1) On a pour la convergence dans L2 :
n
h X 2 i Xn
2 2
Var (Btj −Btj−1 )2
  
E (VB (t0 , t1 , . . . , tn )−t) = E (Btj −Btj−1 ) −(tj −tj−1 ) =
j=1 j=1

car les variables (Btj − Btj−1 )2 − (tj − tj−1 ) sont centrées et indépendantes. On a donc
n
X
2
(tj − tj−1 )2 ≤ 2tδ → 0,
 
E (VB (t0 , t1 , . . . , tn ) − t) = 2 δ → 0.
j=1

t nt
. On a Vn = n−1 (k+1)t 
 P 2
2) Notons V n = VB 0, n
, . . . , n k=0 ∆k (B) avec ∆k (B) = B n

kt
 P n 2 t
B n . On a Vn − t = k=0 αn,k avec αn,k = ∆k (B) − n .
Notons ζ = B12 − 1. On a E[ζ] = 0 et
t t 2 t L t t t
αn,0 = ∆0 (B)2 − =B − = (B1 )2 − = ζ.
n n n n n n
On a
— Pour k = 0, . . . , n, les variables aléatoires αn,k sont iid (indépendance et stationnarité
des accroissements de B) ;
— E[αn,k ] = E[αn,0 ] = E[tζ/n] = 0 ;
2 2
— E[αn,k ] = E[αn,0 ] = E[t2 ζ 2 /n2 ] = (t2 /n2 ) E[ζ 2 ] ;
4 4
— E[αn,k ] = E[αn,0 ] = E[ζ 4 /n4 ] = (t4 /n4 ) E[ζ 4 ].
On utilise maintenant le Lemme ?? :
n−1
h X 4 i
E αn,k ≤ Cn2 E[αn,0
4
].
k=0

Par l’inégalité de Markov, on a alors


 Pn−1 
 E ( k=0 αn,k )4 Cn2 E[ζ 4 ] C0
P |vn − t| ≥ δn ≤ ≤ = .
δn4 n4 δn4 n2 δn4
4.6. Propriété de Markov forte 53

Avec le choix δn = 1/ ln n, on a +∞
P
n=2 P(|vn − t| ≥ δn ) < +∞. Le lemme de Borel-Cantelli
s’applique donc et donne : ps, pour n assez grand on a |vn − t| ≤ δn → 0. D’où ps
limn→+∞ vn = t. s 

Proposition 4.8 Presque sûrement, les trajectoires du mouvement brownien sont à tra-
jectoires à variations non bornées.

Ce résultat justifie que, si les trajectoires browniennes sont continues, elles oscillent quand
même beaucoup. . . tellement que les trajectoires sont ps à variations non bornées. Ce
phénomène explique les difficultés qu’il y aura à construire une intégrale (de type Stieltjes)
par rapport au mouvement brownien.
Démonstration : Il suffit de justifier la remarque générale suivante : si f est continue sur
[0, 1] et
n−1
X k + 1 k  2
lim f −f = a ∈]0, +∞[
n→+∞
k=0
n n
alors V ar(f, 1) = +∞. Pour cela, supposons que V ar(f, 1) < +∞ et notons ρf (u) =
sup|x−y|<u |f (x) − f (y)| le module de continuité de f . Alors
n n
X k + 1 k  2 1  X k + 1  k  1
f −f ≤ ρf f −f ≤ ρf V ar(f, 1) → 0
k=0
n n n k=0 n n n

quand n → +∞ puisque par continuité de f : limn→+∞ ρf (1/n) = 0. Il est donc nécessaire


d’avoir V ar(f, 1) = +∞. 

4.6 Propriété de Markov forte


Le but dans cette section est d’étendre la propriété de Markov simple (invariance par
translation, cf. Prop. 4.2) au cas où l’instant déterministe s est remplacé par un temps
aléatoire T . On commence par préciser la classe des temps aléatoires pour lesquels cela est
possible.

4.6.1 Temps d’arrêt


Définition 4.6 (Temps d’arrêt) Étant donnée une filtration (Ft )t≥0 , une variable aléa-
toire T à valeurs dans [0, +∞] est un temps d’arrêt si pour tout t ≥ 0 on a {T ≤ t} ∈ Ft .

Les propriétés suivantes sont simples :


Proposition 4.9 — Soient T et S deux (Ft )t≥0 -temps d’arrêt alors T ∧ S et T ∨ S
sont des (Ft )t≥0 -temps d’arrêt.
54 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1

— Si (Tn )n∈N est une suite monotone de (Ft )t≥0 -temps d’arrêt alors T = limn→+∞ Tn
est un (Ft )t≥0 -temps d’arrêt.
Démonstration : 1) On a pour tout t ≥ 0 :
{T ∧ S ≤ t} = {T ≤ t} ∪ {S ≤ t} ∈ Ft
et
{T ∨ S ≤ t} = {T ≤ t} ∩ {S ≤ t} ∈ Ft
2) Si Tn % T alors pour tout t ≥ 0 :
\
{T ≤ t} = {Tn ≤ t} ∈ Ft
n≥1

Puis si Tn & T alors pour tout t ≥ 0 :


[
{T ≤ t} = {Tn ≤ t} ∈ Ft .
n≥1

Remarque 4.6 Si (Ft )t≥0 est une filtration continue à droite alors T est un (Ft )t -temps
d’arrêt ssi pour tout t ≥ 0, {T < t} ∈ Ft . En effet, c’est suffisant car
\ \
{T ≤ t} = {T < t + ε} ∈ Ft+ε = Ft+ = Ft .
ε>0 ε>0

Et c’est nécessaire car [


{T < t} = {T ≤ t − ε} ∈ Ft
ε>0

puisque {T ≤ t − ε} ∈ Ft−ε ⊂ Ft . C’est le cas pour la filtration brownienne F B = (FtB )t≥0


(Prop. 4.3, généralisation de la loi de Blumenthal).

Exemple 4.1 — Un temps T = t (constant) est un temps d’arrêt.


— Un temps d’atteinte Ta := inf{t ≥ 0 : Bt = a} est un temps d’arrêt pour la
filtration browienne F B . S
En effet, {Ta ≤ t} = {sup0≤s≤t Bs ≥ a} = s∈[0,t]∩Q {Bs ≥ a} ∈ Ft pour a ≥ 0.
— En revanche, T = sup{s ≥ 1 : Bs = 0} n’est pas un temps d’arrêt.
— Soit O un ouvert alors TO = inf{t ≥ 0 : Bt ∈ O} est un (Ft )t≥0 -temps d’arrêt si
la filtration est continue à droite.
En effet :
  
TO < t = ∃s < t : Bs ∈ O = ∃s ∈ [0, t] ∩ Q : Bs ∈ O (trajectoires continues)
[  _
= Bs ∈ O ∈ Fs ⊂ Ft .
s∈[0,t]∩Q s∈[0,t]∩Q

Comme la filtration est continue à droite, {T0 < t} ∈ Ft suffit.


4.6. Propriété de Markov forte 55

— Soit F un fermé alors TF = inf{t ≥ 0 : Bt ∈ F } est un (Ft )t≥0 -temps d’arrêt.


En effet :
 
TF ≤ t = ω ∈ Ω : inf d(Bs (ω), F ) = 0
0≤s≤t

= ω ∈ Ω : inf d(Bs (ω), F ) = 0
s∈[0,t]∩,Q

car B est continu et donc la distance aussi. Par ailleurs, un inf dénombrable de
fonctions mesurables reste mesurable. Par conséquent, {TF ≤ t} ∈ Ft et TF est bien
un (Ft )t≥0 -temps d’arrêt.

Définition 4.7 (Temps d’arrêt simple) Soit T un (Ft )t≥0 -temps d’arrêt. On dit que
T est un (Ft )t≥0 -temps d’arrêt simple si l’ensemble des valeurs prises par T Psest au plus
dénombrable, ie. il existe une suite (tn )n∈N de temps positifs dans R telle que n≥0 P(T =
tn ) = 1.

Proposition 4.10 (Approximation de temps d’arrêt) Soit T un (Ft )t≥0 -temps d’ar-
rêt. Alors il existe une suite décroissante (Tn )n∈N de (Ft )t≥0 -temps d’arrêt simples tels que
ps limn→+∞ Tn = T .

Démonstration : On pose Tn = ([T 2n ] + 1)2−n sur {T < +∞}, ie. Tn = (j + 1)2−n sur
l’évènement {T ∈ [j2−n , (j + 1)2−n [} et Tn = +∞ sur {T = +∞}. On vérifie que Tn est
un (Ft )t≥0 -temps d’arrêt :
p−1
[
Tn = (j + 1)2−n avec p2−n ≤ t < (p + 1)2−n

Tn ≤ t =
j=0
p−1
[
T ∈ [j2−n , (j + 1)2−n [

=
j=0

T ∈ [0, p2−n [ ∈ Fp2−n ⊂ Ft



=

où on a utilisé T < p2−n = ε>0 T ≤ p2−n − ε ∈ Fp2−n . Puis, par construction, on a
 S 

facilement Tn → T ps et Tn ≥ T ie Tn & T . 

Définition 4.8 Soit T un temps d’arrêt. La tribu des évènements antérieurs à T est

FT = A ∈ F∞ : ∀t ≥ 0, A ∩ {T ≤ t} ∈ Ft .

Si T = t est déterministe, alors FT = Ft .

Proposition 4.11 Les variables aléatoires T et BT sont FT -mesurables.


56 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1

Démonstration : Il s’agit de voir que pour tout s ≥ 0, T −1 (] − ∞, s]) = {T ≤ s} ∈ FT .


Pour cela, soit t ≥ 0, on a

{T ≤ s} ∩ {T ≤ t} = {T ≤ t ∧ s} ∈ Ft∧s ⊂ Ft

en utilisant le fait que T est un temps d’arrêt. Pour BT , il suffit de remarquer que par
continuité ps des trajectoires
+∞
X
BT = lim 1{i2−n <T ≤(i+1)2−n } Bi2−n
n→+∞
i=0

puis que Bs 1{s<T } est FT -mesurable. En effet pour tout u ∈ R, on montre que {Bs 1{s<T } ≤
u} ∈ FT . Pour cela, on établit que, pour tout t ≥ 0, {Bs 1{s<T } ≤ u} ∩ {T ≤ t} ∈ Ft .
— si t < s alors {Bs 1{s<T } ≤ u} ∩ {T ≤ t} = {0 ≤ u} ∩ {T ≤ t} = (∅ ou Ω) ∩ Ft ∈ Ft ;
— si t ≥ s alors {Bs 1{s<T } ≤ u} ∩ {T ≤ t} = ({Bs ≤ u} ∩ {s < T ≤ t}) ∪ ({0 ≤
u} ∩ {T ≤ s}) mais {Bs ≤ u} ∈ Fs et {s < T ≤ t} = {T ≤ s}c ∩ {T ≤ t} ∈ Ft et
{T ≤ s} ∈ Fs .


Cette notion est développée en Section 5.2, en particulier les relations entres les diverses
filtrations FT .

4.6.2 Propriété de Markov


Le résultat suivant généralise la Prop. 4.2 à un changement de temps donné par un
temps d’arrêt.
Théorème 4.2 (Propriété de Markov forte) Soit T un temps d’arrêt. Alors condi-
tionnellement à {T < +∞}, le processus B (T ) défini par
(T )
Bt = BT +t − BT

est un mouvement brownien indépendant de FT .


Démonstration : On suppose d’abord que T < +∞ ps. On prouve alors la propriété de
Markov en montrant que pour A ∈ FT , 0 ≤ t1 ≤ · · · ≤ tp et F une fonction continue
bornée sur Rp , on a
 (T ) (T )   
E 1A F (Bt1 , . . . , Btp ) = P(A)E F (Bt1 , . . . , Btp ) . (4.2)

En effet, avec A = Ω, on obtient que B (T ) a les mêmes lois fini-dimensionnelles que B et il est
facile de voir que B (T ) a des trajectoires ps continues. Autrement dit B (T ) est un mouvement
brownien. Puis pour A quelconque, (4.2) assure que pour tout choix 0 ≤ t1 ≤ · · · ≤ tp , le
(T ) (T )
vecteur (Bt1 , . . . , Btp ) est indépendant de FT , d’où par un argument de classe monotone
B (T ) ⊥
⊥ FT .
4.6. Propriété de Markov forte 57

Pour montrer (4.2), on écrit, par continuité des trajectoires, ps


(T ) (T ) 
F Bt1 , . . . , Btp
+∞
X 
= lim 1{(k−1)2−n <T ≤k2−n } F Bk2−n +t1 − Bk2−n , . . . , Bk2−n +tp − Bk2−n .
n→+∞
k=0

Comme F est bornée, par convergence dominée, il vient :


 (T ) (T ) 
E 1A F (Bt1 , . . . , Btp )
+∞
X  
= lim E 1A 1{(k−1)2−n <T ≤k2−n } F Bk2−n +t1 − Bk2−n , . . . , Bk2−n +tp − Bk2−n .
n→+∞
k=0

Pour A ∈ FT , l’évènement A ∩ {(k − 1)2−n < T ≤ k2−n } = A ∩ {T ≤ k2−n } ∩ {T ≤


(k−1)2−n }c est F(k2−n ) -mesurable donc coı̈ncide ps avec un évènement de σ(Br : r ≤ k2−n ).
Par la propriété de Markov simple (Prop. 4.2), on a donc
 
E 1A 1{(k−1)2−n <T ≤k2−n } F (Bk2−n +t1 − Bk2−n , . . . , Bk2−n +tp − Bk2−n )
= P A ∩ {(k − 1)2−n < T ≤ k2−n } E F (Bk2−n +t1 − Bk2−n , . . . , Bk2−n +tp − Bk2−n )
  

= P A ∩ {(k − 1)2−n < T ≤ k2−n } E F (Bt1 , . . . , Btp ) .


  

par stationnarité des accroissements de B. Finalement, on obtient (4.2) en sommant sur


k ∈ N.
Lorsque P(T = +∞) > 0, on obtient de la même façon
 (T ) (T )    
E 1A∩{T <+∞} F (Bt1 , . . . , Btp ) = P A ∩ {T < +∞} E F (Bt1 , . . . , Btp )
et le résultat cherché suit. 

4.6.3 Principe de réflexion


Une application importante de la propriété de Markov forte est le principe de réflexion.
Théorème 4.3 (Principe de réflexion) Pour tout t > 0, notons St = sups≤t Bs . Alors
si a ≥ 0 et b ≤ a on a  
P St ≥ a, Bt ≤ b = P Bt ≥ 2a − b . (4.3)
En particulier, pour chaque t ≥ 0, St a même loi que |Bt |.
Remarque 4.7 — À chaque trajectoire brownienne dépassant le seuil a et termi-
nant en deça de b ≤ a, on peut associer la trajectoire brownienne (fictive) obtenue
par symétrie autour de la droite y = a à partir de la date inf(t ≥ 0 : Bt = a).
Cette trajectoire termine alors au délà de 2a − b. Il y a ainsi une ”bijection” entre les
trajectoires browniennes vérifiant {St ≥ a, Bt < b} et celles vérifiant {Bt ≥ 2a − b}.
Le principe de réflexion (4.3) est une formalisation de cette ”bijection”.
[Dessin typique illustant le principe de réflexion].
58 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1

L
— Le principe (4.3) implique que pour ∀t ≥ 0, St = |Bt |. Toutefois, attention :
l’égalité tient pour les marginales mais ne s’étend pas aux processus : l’un est crois-
sant, l’autre pas.

Démonstration : Il s’agit d’appliquer la propriété de Markov forte au temps d’arrêt


Ta = inf{t ≥ 0 : Bt = a}. On a déjà vu que Ta < +∞ ps. On a aussi
(T ) 
P(St ≥ a, Bt ≤ b) = P(Ta ≤ t, Bt ≤ b) = P Ta ≤ t, Bt−Ta a ≤ b − a

(T )
puisque Bt−Ta a = Bt−Ta +Ta − BTa = Bt − a. Pour simplifier, notons B 0 = B (Ta ) . Le Théo-
rème 4.2 (propriété de Markov forte) assure que B 0 est un mouvement brownien indépen-
dant de FTa , donc de Ta . Comme B 0 a même loi que −B 0 , on a
Z t Z t
(T )  0 0
P Ta ≤ t, Bt−Ta a ≤b−a = P(Bt−u ≤ b − a) PTa (du)s = P(−Bt−u ≤ b − a) PTa (du)
Z0 t 0

0 (T ) 
= P(Bt−u ≥ a − b) PTa (du) = P Ta ≤ t, Bt−Ta a ≥ a − b
0
= P(Ta ≤ t, Bt − a ≥ a − b)
= P(Bt ≥ 2a − b)

car l’évènement {Bt ≥ 2a − b} est contenu dans {Ta ≤ t} (b ≤ a).


Pour la deuxième partie, on utilise le principe de réflexion et la symétrie (en loi) du mou-
vement brownien :

P(St ≥ a) = P(St ≥ a, Bt ≥ a) + P(St ≥ a, Bt < a)


= 2P(Bt ≥ a) = P(Bt ≥ a) + P(−Bt ≥ a)
= P(Bt ≥ a) + P(Bt ≤ −a) = P(|Bt | ≥ a).

On déduit facilement du principe de réflexion que le temps d’atteinte Ta = inf(t ≥ 0 :


Bt = a) d’un mouvement brownien du niveau a n’est pas déterministiquement borné :
   
P(Ta ≤ C) = P sup Bt ≥ a = P |BC | ≥ a = 2P(N ≥ a/C 2 ) < 1
t∈[0,C]

où N ∼ N (0, 1).


Soit Z une variable aléatoire réelle. Un processus (Xt , t ≥ 0) est appelé mouvement brow-
nien réel issu de Z si on peut écrire Xt = Z + Bt où B est un mouvement brownien issu
de 0 indépendant de Z.
4.7. Équation de la chaleur 59

4.7 Équation de la chaleur


Cette section reprend la présentation de cette équation par [EGK].

4.7.1 Origine physique


L’équation de la chaleur est l’EDP qui décrit la propagation de la chaleur en donnant la
température T (t, x) dans un milieu en fonction du temps t et du lieu x.
Le flux d’énergie thermique J qui traverse une surface unitaire par unité de temps est
donné par la loi de Fourier :
∂T
J = −k
∂x
où k est le coefficient de conductivité thermique du milieu (en mkgs−3 K −1 ). Cette loi
stipule qu’une différence de température engendre un flux d’énergie dans la direction des
températures décroissantes.
Si on calcule le gain d’énergie par unité de temps d’un volume d’épaisseur dx et de section
S, on remarque que cette puissance est égale à la différence entre le flux entrant et le flux
sortant :
∂J
P = J(x)S − J(x + dx)S c’est à dire P = − Sdx.
∂x
Cette puissance assimilée à cet élément de volume Sdx est supposée élever sa température
T . On pose une relation linéaire simple
∂T
P = cm
∂t
où c est la chaleur spécifique de la matière considérée. Comme m = ρSdx (où ρ est la masse
volumique du milieu), on a alors
∂T ∂J
ρc =−
∂t ∂x
qui est l’équation de continuité d’un flux thermique d’énergie. En la combinant avec la loi
de Fourier, on obtient l’équation de la chaleur

∂T k ∂ 2T
= .
∂t ρc ∂x2
Cette EDP se généralise facilement en dimension supérieure.

4.7.2 Origine mathématique


Les premières propriétés du mouvement brownien mises en évidence par Bachelier et Ein-
stein concernent le lien entre la loi du mouvement brownien issu de x et l’équation de
la chaleur. On note pt (x, ·) la densité de la variable aléatoire qui modélise le phénomène
x + Bt à la date t et qui part de x à la date 0. Par stationnarité du phénomène, pt (x, y)
60 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1

ne dépend de x, y que par la différence y − x. Puis, ces auteurs déduisent de la propriété


d’accroissements indépendants que la densité pt (x, ·) de la loi de x + Bt (qui n’est pas
supposée gaussienne a priori) vérifie l’équation de convolution
Z
pt (x, y)ph (y, z) dy = pt+h (x, z). (4.4)
R

En effet, on écrit x + Bt+h = x + Bt + Bt+h − Bt et on note que


— Bt = Bt − B0 est indépendant de Bh0 = Bt+h − Bt ,
— si x + Bt = y, la loi de x + Bt + Bt+h − Bt est la même que celle de y + B eh de densité
ph (y, ·),
— on récupère la densité du tout, en intégrant par rapport à la loi de x + Bt de densité
pt (x, ·).
Bachelier conclut en montrant que l’équation (4.4) est vérifiée par les fonctions de la forme
2 2
At e−πAt x pour lesquelles A2t est proportionelle au temps t. Il n’envisage pas a priori d’autre
type de fonctions. Ce résultat montre la grande généralité des situations qui peuvent être
modélisées par un mouvement brownien.
Revenons à la densité gaussienne

1
exp − (y − x)2 /(2t)

g(t, x, y) := g(t, y − x) = √
2πt

qui traduit que x + Bt+h est la somme des variables gaussiennes indépendantes x + Bt et
Bt+h − Bh . Un calcul direct montre que le noyau gaussien est solution de l’équation de la
chaleur, c’est à dire de l’EDP

gt0 (t, x, y) = 1 00

g (t, x, y)
2 yy (4.5)
gt0 (t, x, y) = 1 00
g (t, x, y).
2 xx

La densité gaussienne standard satisfait donc l’équation de la chaleur par rapport aux
variables x et y. Cette propriété est étendue à une vaste classe de fonctions construites à
partir du mouvement brownien.

Théorème 4.4 1. Considérons la fonction


Z
u(t, x, f ) = E[f (x + Bt )] = g(t, x, y)f (y) dy
R

où f est une fonction borélienne bornée. La fonction u est C ∞ en espace et en temps
pour t > 0 et vérifie l’équation de la chaleur

1
u0t (t, x, f ) = u00xx (t, x, f ), u(0, x) = f (x). (4.6)
2
4.7. Équation de la chaleur 61

2. Lorsque le point de départ du mouvement X0 est aléatoire avec une loi de densité
π(x), indépendante
R du mouvement brownien, la densité de la loi de X0 + Bt est égale
à q(t, y) = R g(t, y − x)π(x)dx et vérifie l’équation de la chaleur
1 00
qt0 (t, y) = qyy (t, y), q(0, y) = π(y).
2
R
Démonstration : 1) La fonction u(t, x, f ) = E[f (x + Bt )] = R g(t, x, y)f (y) dy est très
régulière pour t > 0, car la densité gaussienne (le noyau de la chaleur) est C ∞ , à dérivées
bornées pour t > a. Par dérivation sous le signe intégral, on a aisément :
Z Z
0 0 00 00
ut (t, x, f ) = gt (t, x, y)f (y) dy, uxx (t, x) = gxx (t, x, y)f (y) dy.
R R

L’équation de la chaleur (4.6) pour u(t, ·, f ) suit alors facilement de celle pour g(t, x, y).
2) Supposons que la condition initiale soit aléatoire et indépendante du mouvement brow-
nien et donc de Bt . La loi de X0 + Bt admet une densité qui est la convolée de π(x) et de
g(t, x). 

La formule précédente peut être étendue sous certaines conditions à d’autres fonctions
que les fonctions bornées, par exemple pour les fonctions f (x) = eλx , λ > 0. La fonc-
tion u(t, x, eλ· ) est la transformée de Laplace de x + Bt . Des calculs gaussiens (classiques)
montrent que
1 2
u t, x, eλ· = E eλ(x+Bt ) = eλx+ 2 λ t .
  

Lorsque la fonction considérée est régulière, une autre formulation peut être donnée à cette
relation qui jouera un rôle important dans la suite :
Proposition 4.12 Si f est une fonction Cb1 en temps et Cb2 en espace (c’est à dire à
dériveés bornées en temps et en espace), on a
1 00 
u0t (t, x, f ) = u t, x, ft0 + fxx
2
soit, en intégrant, sous une forme probabiliste :
Z t
 1 00
(s, x + Bs ) + ft0 (s, x + Bt ) ds.

E[f (t, x + Bt )] = f (0, x) + E fxx (4.7)
0 2
Démonstration : On représente la fonction u(t, x, f ) de la façon suivante
Z Z
u(t, x, f ) = E[f (t, x + Bt )] = g(t, y)f (t, x + y) dy = g(t, x, z)f (t, z) dz
R R

où g(t, y) est la densité de Bt ∼ N (0, t) et g(t, x, z) = g(t, z − x) est la densité de x + Bt ∼


N (x, t). Par convergence dominée, on dérive sous le signe intégral, pour une fonction f
deux fois dérivable, à dérivées bornées.
Z
00 00 00
uxx (t, x, f ) = g(t, y)fxx (t, x + y)dy = u(t, x, fxx )
R
62 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1
Z
00
= gxx (t, x, z)f (t, z)dz (avec deux ipp)
ZR Z
u0t (t, x, f ) = g(t, x, z)ft0 (t, z) dz + gt0 (t, x, z)f (t, z) dz
R Z R
1 1
= u(t, x, ft0 ) + 00
gxx 00
(t, x, z)f (t, z)dz = u(t, x, ft0 ) + u(t, x, fxx )
2 R 2
en utilisant que g satisfait l’équation de la chaleur. Pour avoir l’équation intégrale (4.7), il
suffit d’intégrer par rapport à t et d’expliciter les fonctions u(t, x, ft0 ) et u(t, x, fxx
00
) comme
des espérances. 

Le mouvement brownien décentré Xtx = x + bt + σBt joue un rôle important dans les appli-
cations. Les équations aux dérivées partielles (EDP) précédentes s’étendent sans difficulté
à partir de l’EDP satisfaite par la densité de Xtx
(y − x − bt)2
 
1
gb,σ2 (t, x, y) = √ exp − 2
= g(σ 2 t, x + bt, y) = g(σ 2 t, x, y − bt).
2
2πσ t 2σ t
Nous introduisons le générateur associé à ce processus, c’est à dire l’opérateur du 2nd
ordre défini par
1
Lb,σ2 φ(x) = σ 2 φ00xx (x) + bφ0x (x).
2
Puisque g(t, x, y) satisfait l’équation de la chaleur, la fonction x 7→ gb,σ2 (t, x, y) vérifie
1 2 00 2
∂t gb,σ2 (t, x, y) = σ gxx (σ t, x + bt, y) + bgx0 (σ 2 t, x + bt, y)
2
= Lb,σ2 gb,σ2 (t, x, y). (4.8)
Dans ce contexte, l’équation (4.8) remplace l’équation de la chaleur (4.5).
Proposition
R 4.13 1. Soit f : R → R. Les fonctions u(t, x, f ) = E[f (x + bt + σBt )] =
g
R b,σ
2 (t, x, y)f (y) dy satisfont l’EDP
 0
ut (t, x, f ) = Lb,σ2 u(t, x, f ) = 21 σ 2 u00xx (t, x, f ) + bu0x (t, x, f )
(4.9)
u(0, x, f ) = f (x).

2. De plus, si f : R+ × R → R est une fonction de classe Cb1 en temps sur R+ \ {0} et


Cb2 en espace, alors
Z t
x
E Lb,σ2 f (s, Xsx ) + ft0 (s, Xsx ) ds.
 
E[f (t, Xt )] = f (0, x) + (4.10)
0

Démonstration : L’équation (4.9) s’obtient en intégrant par rapport à f (y)dy l’EDP sa-
tisfaite par la densité gb,σ2 (t, x, y) considérée comme fonction de x. Puis (4.10) suit avec
des intégrations par parties comme précédemment. 
4.7. Équation de la chaleur 63

Remarque 4.8 La représentation de la solution de l’équation de la chaleur comme E[f (x+


Bt )] montre que la trajectoire brownienne joue pour cette équation le même rôle que les
caractéristiques, solutions d’équations différentielles du premier ordre, pour la résolution
des EDP du premier ordre. L’équation (4.9) montre que ce résultat peut être étendu aux
EDP elliptiques à coefficients constants à condition de se référer à un MB décentré.
Un objectif important est de passer de cette formule, vraie en moyenne (en espérance), à
une formule trajectorielle. Cette étape a été amorcée par Paul Lévy dans les années 30 et
complétée par Kiyoshi Itô dans les années 50. Plus précisément, Itô interprète la quantité
Z t
1 00
Tt (f ) = f (t, x + Bt ) − f (0, x) − fxx (s, x + Bs ) + f 0 (s, x + Bs )ds
0 2

qui mesure la différence trajectorielle entre les deux termes de l’équation (4.7) sans prendre
l’espérance E comme une intégrale stochastique. Ce faisant, il introduit un calcul différentiel
stochastique, le calcul d’Itô, vrai sur les trajectoires et non plus seulement en moyenne.
C’est l’objet des chapitres suivants (Chapitre ??).
64 Chapitre 4. JCB
c – M2 Math. – Université de Rennes 1
Deuxième partie

Martingales

65
Chapitre 5

Martingales en temps continu

Dans ce chapitre, on présente les rudiments sur la théorie des martingales en temps
continu. Ce sont des processus définis sur des espaces (Ω, F, (Ft )t≥0 , P) filtrés, c’est à dire
muni d’une filtration (Ft )t≥0 . On rappelle qu’une filtration sur un espace de probabilité
(Ω, F) est une famille (Ft )t≥0 de sous-tribus telles que pour s ≤ t, on a Fs ⊂ Ft .
On rappelle qu’on associe à chaque Ft les tribus Ft+ et Ft− et la filtration est dite continue
à droite (resp. à gauche) si pour tout t ≥ 0, on a Ft = Ft+ (resp., pour tout t > 0,
Ft = Ft− ). Elle est dite satisfaire les conditions habituelles si elle est continue à droite et
complète (ie. contient tous les négligeables de F).
Dans tout ce chapitre, on considère (Ω, F, (Ft )t≥0 , P) un espace filtré. On commence par
des généralités sur les filtrations en Section 5.1 et sur les temps d’arrêts en Section 5.2
puis on présente la notion de martingale en temps continu en Section 5.3. On généralise
les principaux résultats rencontrés dans le cadre discret (inégalités de Doob, théorèmes de
convergence, théorème d’arrêt, martingales arrêtées) et on régularise les trajectoires des
martingales. On termine avec un mot sur le processus de Poisson en Section 5.4.

5.1 Filtration et processus


Définition 5.1 (Filtration) Une filtration sur un espace de probabilité (Ω, F) est une
famille (Ft )t≥0 de sous-tribus telle que pour s ≤ t, on a Fs ⊂ Ft .

Si on considère un processus (Xt )t≥0 , on considère souvent la filtration canonique qu’il


engendre : FtX = σ(Xs : s ≤ t), t ≥ 0. Dans ce cas, il est utile d’interpréter une filtration
comme une quantité d’information disponible à une date donnée : FtX représente l’infor-
mation véhiculée par le processus X jusqu’à la date t.
Une filtration est P-complète pour une mesure de probabilité P si F0 contient tous les
évènements de mesure nulle, ie. N = {N ∈ F tel que P(N ) = 0}⊂ F0 .

Remarque 5.1 L’intérêt d’une tribu complète vient du fait suivant : soit X = Y ps où Y
est une variable aléatoire G-mesurable, avec G complète. Alors X est G-mesurable.

67
68 Chapitre 5. JCB
c – M2 Math. – Université de Rennes 1

Preuve : En effet notons N = {X 6= Y }, négligeable, donc dans G. Soit A ∈ B(R), on a :

X −1 (A) = {Y ∈ A} ∩ N c ∪ {X ∈ A} ∩ N .
 

 
On a {X ∈ A}  ∩ N ∈ G car {X ∈ A} ∩ N ⊂ N et G est une tribu complète. Puis
{Y ∈ A} ∩ N c ∈ G car {Y ∈ A} ∈ G et N c ∈ G.
T W
À une filtration, on associe Ft+ = ε>0 Ft+ε et Ft− = ε>0 Ft−ε .
La filtration (Ft )t≥0 est dite continue à droite si pour tout t ≥ 0, on a Ft = Ft+ ,
continue à gauche si pour tout t > 0, on a Ft = Ft− .
Dans la suite, on dira qu’une filtration satisfait les conditions habituelles si elle est
complète et continue à droite. C’est le cas de la filtration brownienne (FtB )t≥0 donnée par
FtB = σ(Bs : s ≤ t), cf. Prop. 4.3. Étant donnée une filtration quelconque (Ft )t≥0 , on peut
toujours en considérer une satisfaisant les conditions habituelles en ajoutant à Ft+ la classe
des P-négligeables de F. Il s’agit de l’augmentation habituelle de (Ft )t≥0 .

Définition 5.2 Un processus (Xt )t≥0 est dit mesurable si l’application définie sur (R+ ×
Ω, B(R+ ) ⊗ F) par (t, ω) 7→ Xt (ω) est mesurable.

Cette propriété est plus forte que de demander à Xt d’être Ft -mesurable pour tout t ≥
0. Cependant, si les trajectoires de X sont ps continues, les deux propriétés deviennent
équivalentes.

Définition 5.3 (Adapté) Un processus (Xt )t≥0 est dit adapté si pour tout t ≥ 0, Xt est
Ft -mesurable.
(Progressif ) Un processus (Xt )t≥0 est dit progressif (ou progressivement mesurable) si pour
tout t ≥ 0, (s, ω) 7→ Xs (ω) est mesurable sur [0, t] × Ω muni de B([0, t]) ⊗ Ft .
(Tribu progressive) La famille des A ∈ B(R+ ) ⊗ F telle que le processus Xt (ω) = 1A (t, ω)
est progressif est appelée la tribu progressive. On la note Prog.

Remarque 5.2 — Un processus X est adapté par rapport à sa filtration naturelle


X
F .
— Un processus progressif est adapté et mesurable.
Il est adapté car Xt = X ◦ it où it : ω ∈ (Ω, Ft ) 7→ (t, ω) ∈ ([0, t] × Ω, B([0, t]) ⊗ Ft )
est mesurable.
Il est mesurable car un processus est mesurable ssi pour tout t ≥ 0, (s, ω) 7→ Xs (ω)
est mesurable sur [0, t] × Ω muni de B([0, t]) ⊗ F.
— Un processus mesurable et adapté admet une version progressive (Chung et Doob,
cf. [DM]).

Exemples
5.1. Filtration et processus 69

— Soit 0 < t1 < · · · < tn et h1 , . . . , hn des variables aléatoires telles


Pnque hi est Fti -
mesurable.
Pn On pose t0 = 0 et tn+1 = +∞. Les processus X = i=0 hi 1[ti ,ti+1 [ et
Y = i=0 hi 1]ti ,ti+1 ] sont progressifs.
En effet, montrons le pour X : soit B ∈ B(R), on a

n
[
{(s, ω) ∈ [0, t] × Ω : Xs (ω) ∈ B} = ([ti , ti+1 [∩[0, t]) × {ω ∈ Ω : hi (ω) ∈ B}
i=0
∈ B([0, t]) ⊗ Ft .

— Si la filtration est complète, un processus adapté à trajectoires continues à gauche


est progressif.
En effet, on approche le processus X par Xtn = Xk2−n pour t ∈ [k2−n , (k + 1)2−n [ et
k ∈ {0, . . . , 2n −1}. Le processus X n est progressif (exemple précédent) et comme X
est continu à gauche, Xtn → Xt pour tout t ≥ 0. Cela garantit que X est progressif.

Proposition 5.1 Soit X un processus adapté et à trajectoires continues à droite. Alors X


est progressif.

Démonstration : On considère X n donné par Xtn = X(k+1)2−n pour t ∈ [k2−n , (k +1)2−n [.


D’après l’exemple ci-dessus, le processus X n est progressif avec la filtration (Ft+2−n )t≥0 et
comme X est continu à droite, pour tout t ≥ 0, Xtn → Xt .
Fixons t ≥ 0 et considérons X e n = X n 1s<t−2−n + Xt 1s=t . Ce processus est mesurable par
s s
rapport à B([0, t]) ⊗ Ft . En effet, Xsn 1s<t−2−n est B([0, t]) ⊗ Ft -mesurable d’après ce qui
précède. Puis, si on note Ys = Xt 1s=t , alors

Y −1 (A) = {(s, ω) ∈ [0, t] × Ω : Xt (ω)1s=t ∈ A}.

Si s = t alors il faut ω ∈ Xt−1 (A) et si s 6= t, il faut 0 ∈ A, ie. on a ∅ ou Ω. On a donc


   
Y −1 (A) = [0, t) × (Ω ou ∅) ∪ {t} × Xt−1 (A) ∈ B([0, t]) ⊗ Ft .

Par ailleurs, quand n → +∞, X e n → Xs pour s ≤ t.


s
La restriction de X à [0, t] est donc mesurable par rapport à B([0, t]) ⊗ Ft , ie. X est
progressif. 

Un processus est progressif s’il est mesurable par rapport à la tribu progressive Prog.
L’intérêt d’un processus progressif vient de ce que, estimé en un temps d’arrêt, il est
mesurable pour la tribu associé au temps d’arrêt, cf. Prop. 5.4. Avant de voir cela, on
revient sur les principales propriétés des temps d’arrêt.
70 Chapitre 5. JCB
c – M2 Math. – Université de Rennes 1

5.2 Filtrations et temps d’arrêt


Dans cette section, on rappelle et développe la notion de temps d’arrêt.
Définition 5.4 (Temps d’arrêt) Une variable aléatoire T à valeurs dans [0, +∞] est un
temps d’arrêt si pour tout t ≥ 0 on a {T ≤ t} ∈ Ft .
On associe à un temps d’arrêt T les tribus suivantes

FT = {A ∈ F∞ : ∀t ≥ 0, A ∩ {T ≤ t} ∈ Ft }
FT + = {A ∈ F∞ : ∀t ≥ 0, A ∩ {T < t} ∈ Ft }
FT − = σ{A ∩ {T > t} : t ≥ 0, A ∈ Ft }.

Les propriétés suivantes sont satisfaites :


Proposition 5.2 1. On a toujours FT − ⊂ FT ⊂ FT + . Si la filtration est continue à
droite FT = FT + .
2. Une variable aléatoire T : Ω → R+ est un (Ft+ )t temps d’arrêt ssi pour tout t ≥ 0,
{T < t} ∈ Ft . Cela équivaut encore à dire que T ∧ t est Ft -mesurable pour tout t ≥ 0.
3. Si T = t alors FT = Ft , FT + = Ft+ et FT − = Ft− .
4. Pour A ∈ F∞ , posons T A (ω) = T (ω) si ω ∈ A, +∞ sinon. Alors A ∈ FT ssi T A est
un temps d’arrêt.
5. Le temps d’arrêt T est FT -mesurable.
6. Si S ≤ T sont deux temps d’arrêt alors FS ⊂ FT . Pour S, T des temps d’arrêt,
S ∧ T et S ∨ T sont des temps d’arrêt et FS∧T = FS ∩ FT . De plus {S ≤ T } ∈ FS∧T ,
{S = T } ∈ FS∧T .
7. Si Sn est une suite croissante
W de temps d’arrêt alors S = limn→+∞ Sn est aussi un
temps d’arrêt et FS − = ng eq1 FSn− .
8. Si Sn est une suite décroissante de temps
T d’arrêt alors S = limn→+∞ Sn est aussi un
temps d’arrêt de (Ft+ )t≥0 et FS + = n≥1 FSn+ .
9. Si Sn est une suite décroissante stationnaire de temps d’arrêt (ie. ∀ω, ∃N (ω), ∀n ≥
N (ω),TSn (ω) = S(ω)) alors S = limn Sn est aussi un temps d’arrêt pour (Ft )t≥0 et
FS = n FSn (comparer avec 8)).
Démonstration :
1) Soit A ∩ {T > t} ∈ FT − avec A ∈ Ft . Alors A ∩ {T > t} ∈ F∞ et pour s ≥ 0

(A ∩ {T > t}) ∩ {T ≤ s} = A ∩ ({t < T ≤ s}) ∈ Ft

car si s ≤ t alors {t < T ≤ s} = ∅ tandis que si s > t alors {t < T ≤ s} = {T ≤ t}c ∩ {T ≤


s} ∈ Fs et A ∈ Ft ⊂ Fs . Ainsi A ∩ {T > t} ∈ FT . Soit maintenant A ∈ FT alors
[ _
A ∩ {T < t} = (A ∩ {T ≤ t − 1/n}) ∈ Ft−1/n ⊂ Ft
n n
5.2. Filtrations et temps d’arrêt 71

Puis si la filtration est continue à droite et A ∈ FT + alors


\ \
A ∩ {T ≤ t} = A ∩ {T < t + 1/n} ∈ Ft+1/n = Ft+ = Ft .
n n

2) Soit T est un (Ft+ )t -temps d’arrêt alors


[ _
{T < t} = {T ≤ t − 1/n} ∈ F(t−1/n)+ ⊂ Ft
n n

car pour chaque on a n : F(t−1/n)+ ⊂ Ft . Réciproquement, si {T < t} ∈ Ft alors


\ \
{T ≤ t} = {T < t + 1/n} ∈ Ft+1/n = Ft+ .
n n

Puis si T ∧t est Ft -mesurable alors pour tout s, {T ∧t ≤ s} = {T ≤ s}∪{t ≤ s} ∈ Ft . Mais


pour s < t, cela garantit donc {T ≤ s} ∈ Ft pour tout s < t, ie. {T ≤ s} ∈ Fs+ , c’est à
dire T est un temps d’arrêt pour (Ft+ )t≥0 . Réciproquement, si T est un temps d’arrêt pour
(Ft+ )t≥0 , alors pour tout s ≥ 0, on a {T ∧t ≤ s} = {T ≤ s}∪{t ≤ s} = {T ≤ s} ∈ Fs+ ⊂ Ft
si s < t et = Ω ∈ Ft+ si t ≤ s et donc T ∧ t est Ft -mesurable.
3) Soit T = t alors A ∈ FT ssi pour tout s ≥ 0 on a A ∩ {t ≤ s} ∈ Fs . Pour s < t on a
bien ∅ ∈ Fs et pour t ≤ s, il faut A ∈ Fs . En particulier, il faut A ∈ Ft . La réciproque est
claire.
Si A ∈ FT + ssi pour tout s ≥ 0 on a A ∩ {t < s} ∈ Fs . Pour s ≤ t on a bien ∅ ∈ Fs et
pour t < s, il faut A ∈ Fs . En particulier, il faut A ∈ ∩s>t Fs = Ft+ . Pour la réciproque,
observer que quand t < s, on a A ∩ {t < s} = A ∈ Ft+ ⊂ Fs .
La tribu FT − est constituée des A ∩ {T > s} pour A ∈ Fs . Comme T = t : si s ≥ t, cet
ensemble est vide ; si s < t, cet ensemble est A ∈ Fs . On a donc FT − = σ(∪s<t Fs ) = Ft− .
4) A ∈ FT ssi pour tout t ≥ 0 : A ∩ {T ≤ t} ∈ Ft . Mais A ∩ {T ≤ t} = {T A ≤ t} ce qui
permet de conclure.
5) On a {T ≤ s} ∈ FT pour tout s car

{T ≤ s} ∩ {T ≤ t} = {T ≤ t ∧ s} ∈ Ft∧s ⊂ Ft .

6) Si S ≤ T et A ∈ FS alors

A ∩ {T ≤ t} = (A ∩ {S ≤ t}) ∩ {T ≤ t} ∈ Ft .

D’où A ∈ FT . Pour S, T quelconques, on a

{S ∧ T ≤ t} = {S ≤ t} ∪ {T ≤ t} ∈ Ft
{S ∨ T ≤ t} = {S ≤ t} ∩ {T ≤ t} ∈ Ft .
72 Chapitre 5. JCB
c – M2 Math. – Université de Rennes 1

Comme S ∧ T ≤ T, S, on a facilement FS∧T ⊂ FS ∩ FT . De plus, si A ∈ FS ∩ FT , alors

A ∩ {S ∧ T ≤ t} = (A ∩ {S ≤ t} ∪ (A ∩ {T ≤ t}) ∈ Ft ,

d’où A ∈ FS∧T . Puis pour t ≥ 0, on a

{S ≤ T } ∩ {T ≤ t} = ({S ≤ t} ∩ {T ≤ t}) ∩ {S ∧ t ≤ T ∧ t} ∈ Ft
{S ≤ T } ∩ {S ≤ t} = {S ∧ t ≤ T ∧ t} ∩ {S ≤ t} ∈ Ft

car S ∧ t et T ∧ t sont Ft -mesurables d’après 5) et 6) déjà vus (S ∧ t ≤ t donc S ∧ t qui est


FS -mesurable est aussi Ft -mesurable) donc {S ∧ t ≤ T ∧ t} ∈ Ft . Finalement, cela garantit
{S ≤ T } ∈ FS ∩ FT = FS∧T . L’argument est analogue pour {S = T }.
T
7) On a {S ≤ t} = n≥1 {Sn ≤ t} ∈ Ft . De plus, on a FSn− ⊂WFS − (car pour A ∈ FSn− ,
on a A ∩ {Sn > t} = (A ∩ {Sn > t}) ∩ {S > t} ∈ FS − ). Donc n FSn− ⊂ FS − . Puis pour
A ∈ FS − , on a [
A ∩ {S > t} = (A ∩ {Sn > t}),
n
W W
ce qui montre que A ∩ {S > t} ∈ n FSn− et FS − ⊂ n FSn− .
S
8) On écrit {S < t} = n {Sn < t} ∈ Ft . De plus, on voit aisément que FS + ⊂ FSn+ pour
tout n car pour A ∈ FS +

A ∩ {Sn < t} = A ∩ ({Sn < t} ∩ {S < t}) = (A ∩ ({S < t}) ∩ {Sn < t} ∈ Ft .
T
Réciproquement si A ∈ n FSn+ alors
[
A ∩ {S < t} = (A ∩ {Sn < t}) ∈ Ft ,
n
T
d’où A ∈ FS + et FS + = n FSn+ .
9) Dans ce cas, on a en plus {S ≤ t} = ∪n {Sn ≤ t} ∈ Ft et pour A ∈ ∩n FSn , A∩{S ≤ t} =
∪n (A∩{Sn ≤ t}) ∈ Ft . D’où A ∈ FS . Puis si A ∈ FS alors comme S = Sn pour tout n ≥ N
et on a A ∈ ∩n≥N FSn . mais comme FSn ⊂ FSp pour n ≥ p, on a ∩n≥N FSn = ∩n≥0 FSn .


Proposition 5.3 Soient T un temps d’arrêt et S une variable aléatoire FT -mesurable telle
que S ≥ T . Alors S est aussi un temps d’arrêt.
En particulier, si T est un temps d’arrêt,
+∞
X k+1
Tn = 1{k2−n <T ≤(k+1)2−n } + (+∞)1{T =+∞} (5.1)
k=0
2n

est une suite de temps d’arrêt qui décroı̂t vers T .


5.2. Filtrations et temps d’arrêt 73

Démonstration : On écrit {S ≤ t} = {S ≤ t} ∩ {T ≤ t} ∈ Ft car {S ≤ t} ∈ FT (S


est FT -mesurable). La deuxième partie en découle facilement puisque Tn ≥ T et Tn est
FT -mesurable. En effet, Tn est FT -mesurable si pour tout u ≥ 0, on a {Tn ≤ u} ∈ FT .
Pour cela, il faut voir que pour tout t ≥ 0, on a {Tn ≤ u} ∩ {T ≤ t} ∈ Ft . Mais
 [2n[u]−1 
[2n u]
 
k+1
{Tn ≤ u} = Tn ≤ n = Tn =
2 k=0
2n
[2n u]−1 
[2n u]
   
[ k k+1
= T ∈ n, n = T ≤ n .
k=0
2 2 2
On a
[2n u]
 
{Tn ≤ u} ∩ {T ≤ t} = T ≤t∧ n ∈ Ft∧[2n u]/2n ⊂ Ft .
2


Le résultat suivant sera utile :


Proposition 5.4 Soit X progressif et T un temps d’arrêt. Alors XT 1{T <+∞} est FT -
mesurable.
Démonstration : Notons que Y : Ω → R est FT -mesurable ssi, pour tout t ≥ 0, Y 1{T ≤t}
est Ft -mesurable. En effet si la condition est vérifiée alors pour A ∈ B(R), on a {Y ∈
A} ∩ {T ≤ t} = {Y 1{T ≤t} ∈ A} ∩ {T ≤ t} ∈ Ft donc {Y ∈ A} ∈ FT . Puis si Y est
FT -mesurable, alors {Y 1{T ≤t} ∈ A} = ({Y ∈ A} ∩ {T ≤ t}) ∪ ({0 ∈ A} ∩ {T > t}) ∈ Ft .
On vérifie la FT -mesurabilité de Y = XT 1{T <+∞} en montrant que pour tout t
Y 1{T ≤t} = XT 1{T ≤t} = XT ∧t 1{T ≤t}
est Ft -mesurable. Mais XT ∧t est la composition des deux applications mesurables
 
(Ω, Ft ) → ([0, t] × Ω, B([0, t]) ⊗ Ft ) ([0, t] × Ω, B([0, t]) ⊗ Ft ) → B(R)
et
ω 7→ (T (ω) ∧ t, ω) (s, ω) 7→ Xs (ω)
(respectivement car T est un temps d’arrêt et X est progressif). On conclut que XT ∧t donc
aussi XT ∧t 1{T ≤t} est Ft -mesurable. 

Remarque 5.3 Il est nécessaire de considérer XT 1{T <+∞} plutôt que XT tant que X∞
n’est pas défini. Par contre si X∞ est défini et est F∞ -mesurable alors XT est FT -mesurable.
En effet, comme XT = XT 1{T <+∞} + XT 1{T =+∞} avec XT 1{T <+∞} FT -mesurable par la
Prop. 5.4, il reste à voir que XT 1{T =+∞} est aussi FT -mesurable, ie. pour tout A ∈ B(R) :
{XT 1{T =+∞} ∈ A} = ({X∞ ∈ A} ∩ {T = +∞}) ∪ ({0 ∈ A} ∩ {T < +∞}) ∈ FT .
Pour cela, on a {XT 1{T =+∞} ∈ A} ∩ {T ≤ t} = {0 ∈ A} ∩ {T ≤ t} ∈ Ft quand t < +∞
tandis que pour t = +∞,
{XT 1{T =+∞} ∈ A} ∩ {T ≤ +∞} = {X∞ ∈ A} ∩ {T = +∞} ∈ F∞ .
74 Chapitre 5. JCB
c – M2 Math. – Université de Rennes 1

5.3 Martingales en temps continu


5.3.1 Définition, exemples
Définition 5.5 (Martingale) Un processus (Xt )t≥0 adapté par rapport une filtration (Ft )t≥0
et tel que pour tout t ≥ 0, Xt ∈ L1 est appelé
— une martingale si pour s ≤ t : E[Xt |Fs ] = Xs ;
— une surmartingale si pour s ≤ t : E[Xt |Fs ] ≤ Xs ;
— une sous-martingale si pour s ≤ t : E[Xt |Fs ] ≥ Xs .

Une martingale est, en moyenne, constante, tandis qu’une surmartingale est, en moyenne,
décroissante et une sous-martingale, en moyenne, croissante. Ainsi, on peut considérer
qu’une surmartingale est une généralisation aléatoire d’une fonction décroissante tandis
qu’une sous-martingale est une généralisation d’une fonction croissante. Dans la suite, on
considère souvent des martingales à trajectoires continues à droite, d’après la Prop. 5.1
elles seront progressivement mesurables.

Proposition 5.5 Soit (Xt )t≥0 une martingale (resp. une sous-martingale) et soit ϕ : R →
R une fonction convexe (resp. convexe croissante). On suppose que ϕ(Xt ) ∈ L1 pour tout
t ≥ 0. Alors (ϕ(Xt ))t≥0 est une sous-martingale.

Démonstration : En effet, d’après l’inégalité de Jensen (pour l’espérance conditionnelle),


on a, pour s < t,
E[ϕ(Xt )|Fs ] ≥ ϕ(E[Xt |Fs ]) ≥ ϕ(Xs ).

+
En appliquant cette remarque à la fonction convexe croissante x 7→ x , on montre que si
(Xt )t≥0 est une sous-martingale alors (Xt+ )t≥0 aussi. En particulier, on a pour s ∈ [0, t] :
E[Xs+ ] ≤ E[Xt+ ]. D’autre part, puisque X est une sous-martingale, on a pour s ∈ [0, t],
E[Xs ] ≥ E[X0 ]. En combinant ces deux inégalités et en utilisant |x| = 2x+ − x, on trouve
la borne
sup E[|Xs |] ≤ 2E[Xt+ ] − E[X0 ].
s∈[0,t]

On peut alors énoncer un résultat utile :

Proposition 5.6 Si (Xt )t≥0 est une sous-martingale (ou en fait surmartingale, ou mar-
tingale en changeant X en −X), on a pour tout t ≥ 0 : sups∈[0,t] E[|Xs |] < +∞.

5.3.2 Inégalités pour martingales


Dans cette section, on généralise au cadre continu plusieurs inégalités déjà connues dans le
cadre discret quand les (sur/sous)-martingales sont à trajectoires continues à droite. Pour
cela, l’idée est de considérer un ensemble dénombrable dense D qu’on voit comme limite
de parties finies croissantes {t1 , . . . , tn }. On applique les résultats discrets aux restrictions
5.3. Martingales en temps continu 75

à {t1 , . . . , tn }. En passant à la limite (convergence monotone avec {t1 , . . . , tn } % D), le


résultat s’obtient pour les restrictions à D. Comme D est dense dans R+ , la continuité (à
droite) permet de lever la restriction t ∈ D et d’obtenir le résultat pour tout t ∈ R+ .
Systématiquement, on commence par rappeler les résultats principaux pour des martingales
discrètes.
Inégalité maximale. Soit (Yn )n∈N une surmartingale discrète. Alors pour tout λ > 0 et
n ≥ 0, on a
  E[|Y |] + 2E[|Y |]
0 n
P sup |Yk | ≥ λ ≤ .
k≤n λ
Si on considère maintenant une surmartingale (Xt )t≥0 en temps continu, on peut appliquer
cette inégalité à la surmartingale en temps discret Yk = Xtk∧n , k ≥ 0, pour toute partie
finie {0 = t0 < t1 < t2 < · · · < tn = t} de [0, t]. Elle donne
  E[|X |] + 2E[|X |]
0 t
P sup |Xtk | ≥ λ ≤ .
k≤n λ
Si D est un sous-ensemble dénombrable de R+ (contenant t), en écrivant D comme une
limite croissante de parties finies {0 ≤ t1 < t2 · · · < tn = t}, on obtient (avec la monotonie
séquentielle des probabilités)
  E[|X |] + 2E[|X |]
0 t
P sup |Xs | ≥ λ ≤ . (5.2)
s∈[0,t]∩D λ
Si on suppose en plus que les trajectoires de X sont continues à droite alors en prenant D
dense contenant t, on a sups∈[0,t]∩D |Xs | = sups∈[0,t] |Xs | ce qui montre qu’on peut prendre
sups∈[0,t] dans (5.2) et on a alors montré :
Proposition 5.7 (Inégalité maximale de Doob) Soit (Xt )t≥0 une surmartingale dont
les trajectoires sont continues à droite. Alors
  E[|X |] + 2E[|X |]  3 sup E[|X |] 
0 t s≤t s
P sup |Xs | ≥ λ ≤ ≤ . (5.3)
s∈[0,t] λ λ

L’inégalité de Doob affirme que si (Yn )n∈N est une martingale en temps discret telle que
Yn ∈ Lp pour p > 1 alors pour tout n ≥ 0 on a, pour q conjugué de p (ie. p1 + 1q = 1) :

sup |Yk | ≤ qkYn kp .

k≤n p

On en déduit comme précédemment, avec le théorème de convergence monotone, que si


(Xt )t≥0 est une martingale en temps continu bornée dans Lp

sup |Xs | ≤ qkXt kp . (5.4)

s∈[0,t]∩D p

À nouveau, si X a des trajectoires continues à droite, on peut remplacer sups∈[0,t]∩D par


sups∈[0,t] dans (5.4) et obtenir :
76 Chapitre 5. JCB
c – M2 Math. – Université de Rennes 1

Proposition 5.8 (Inégalité de Doob) Soit (Xt )t≥0 une martingale dont les trajectoires
sont continues à droite avec Xt ∈ Lp pour tout t ≥ 0 alors, avec p1 + 1q = 1,

sup |Xs | ≤ qkXt kp . (5.5)

s∈[0,t] p

Si f est une fonction définie sur une partie T de R+ et si a < b, le nombre de montées de
f
f le long de [a, b], noté Ma,b (T ), est le supremum des entiers k tels que l’on puisse trouver
une suite croissante de T , s1 < t1 < s2 < t2 · · · < sk < tk , avec f (si ) < a, f (ti ) > b.
[Dessin typique des montées]
Pour une surmartingale discrète (Yn )n≥0 , on a :

1
E[(Yn − a)− ].
 Y 
E Ma,b ([0, n]) ≤ (5.6)
b−a
On en déduit comme précédemment le résultat suivant dans le cas continu :

Proposition 5.9 (Nombre de montées) Soit (Xt )t≥0 une surmartingale. Si D est un
sous-ensemble dénombrable de R+ , on a :
1
X
E[Ma,b ([0, t] ∩ D)] ≤ E[(Xt − a)− ]. (5.7)
b−a
Démonstration : Considérer d’abord D fini puis passer à la limite par convergence mo-
X
notone. Attention : le résultat ne se prolonge pas par continuité puisque Ma,b ([0, t]) est à
valeurs entières et donc non continue. 

5.3.3 Régularisation de trajectoires


Avant de donner des théorèmes de convergence pour les martingales en temps continu dans
la section 5.3.4, on rappelle les résultats du cas en temps discret. Ils permettent d’abord
de donner dans cette section des conditions de régularisation des martingales (existence de
modifications à trajectoires continues ou càdlàg).

Proposition 5.10 (Convergence des martingales discrètes)


1. Si (Yn )n∈N est une surmartingale bornée dans L1 (en particulier si elle est positive)
alors Yn → Y∞ ps et Y∞ ∈ L1 .
2. Si (Yn )n∈−N est une surmartingale indéxée par −N (ie. Fn ⊂ Fn+1 et Yn ≥ E[Yn+1 |Fn ]
pour n ≤ 0) et telle que supn≤0 E[Yn ] < +∞ alors la suite (Yn )n≤0 est uniformément
intégrable et converge ps et dans L1 quandTn → −∞ vers une variable Z telle que
Z ≥ E[Yn |F−∞ ] (où par définition F−∞ = n≤0 Fn ).
5.3. Martingales en temps continu 77

En appliquant ces résultats en temps discret à des (sur)martingales en temps continu, on a :

Théorème 5.1 (Limites à droite et à gauche) Soit (Xt )t≥0 une surmartingale et D
un sous-ensemble dénombrable dense dans R+ .
1. Pour presque tout ω ∈ Ω, l’application s ∈ D 7→ Xs (ω) ∈ R admet en tout t ∈ R+
une limite à droite Xt+ (ω) finie et en tout point t ∈ R∗+ , une limite à gauche Xt− (ω).
2. De plus, pour tout t ∈ R+ , on a Xt+ ∈ L1 et Xt ≥ E[Xt+ |Ft ] avec égalité si la fonction
t 7→ E[Xt ] est continue à droite (par exemple, si (Xt )t≥0 est une martingale).
3. De plus, le processus (Xt+ )t≥0 est alors une surmartingale par rapport à la filtration
(Ft+ )t≥0 et une martingale si X en est une.
Démonstration : 1) C’est une conséquence de l’inégalité sur le nombre de montée et de
celle de Doob. En effet, pour T > 0 fixé, on a d’abord, sups∈[0,T ]∩D |Xs | < +∞ ps car
l’inégalité maximale de Doob :
 
lim P sup |Xs | ≥ λ = 0.
λ→+∞ s∈[0,T ]∩D

Ensuite, l’inégalité sur le nombre de montées montre que pour tous a < b rationnels, on a
X X
ps Ma,b ([0, T ]∩D) < +∞. On a donc aussi ps pour tous a < b rationnels, Ma,b ([0, T ]∩D) <
+∞. Finalement, s 7→ Xs (ω) est bornée sur [0, T ] ∩ D et pour tous a < b rationnels, ne
fait qu’un nombre fini de montées le long de [a, b]. La partie 1) s’en déduit puisque si, par
exemple une fonction f : [0, T ] ∩ D → R n’a pas de limite à gauche finie en t ∈]0, T ], on
peut choisir a < b rationnels de sorte que

lim inf f (s) < a < b < lim sup f (s)


s∈D→t s∈D→t

2) Pour que Xt+ (ω) soit défini pour tout ω et pas seulement sur l’ensemble de probabilité
1 où la limite existe, on prend Xt+ (ω) = 0 sur l’ensemble Ft+ -mesurable et de probabilité
nulle où la limite en t le long de D n’existe pas. De cette façon, Xt+ (ω) est bien défini pour
tout ω et reste (Ft+ )t≥0 -mesurable (car la filtration est complète).
On fixe t ≥ 0 et on choisit une suite tn ∈ D qui décroit vers t. Par construction, on a
Xt+ = limn→+∞ Xtn ps. En posant Yk = Xt−k pour k ≤ 0, comme la suite (tn )n≥0 décroit,
on a
E[Yk+1 |Gk ] = E[Xt−k+1 |Ft−k ] ≤ Xt−k = Yk .
La suite (Yk )k∈−N est donc une surmartingale indéxée par −N par rapport à la filtration
Gk = Ft−k , k ≤ 0. Comme on a

sup E[|Yk |] ≤ sup E[|Xs |] < +∞,


k≤0 s∈[0,t1 ]∩D

le résultat discret (cf. 2) de la Prop. 5.10) assure que la suite Xtn converge dans L1 néces-
sairement vers Xt+ . En particulier, Xt+ ∈ L1 .
78 Chapitre 5. JCB
c – M2 Math. – Université de Rennes 1

Grâce à la convergence L1 , on peut passer à la limite dans l’inégalité Xt ≥ E[Xtn |Ft ] pour
obtenir Xt ≥ E[Xt+ |Ft ].
Toujours grâce à la convergence dans L1 , on a E[Xt+ ] = limn→+∞ E[Xtn ] et donc si la fonc-
tion s 7→ E[Xs ] est continue à droite, on doit avoir E[Xt+ ] = E[Xt ]. L’inégalité précédente
n’est alors possible que si Xt = E[Xt+ |Ft ].
3) Ensuite, on remarque d’abord que Xt+ est Ft+ -mesurable : en effet, Xt+ = lims&t Xs et
Xs est Fu -mesurable pour Ttout u ≥ s mais alors on a aussi Xt+ Fu -mesurable pour tout
u > t ; finalement, Xt+ est u>t Fu = Ft+ -mesurable.
Soit maintenant s < t et (sn )n≥0 une suite de D qui décroit vers s. On peut supposer
sn ≤ tn . Alors Xsn converge vers Xs+ dans L1 , et donc, si A ∈ Fs+ ,

E[Xs+ 1A ] = lim E[Xsn 1A ] ≥ lim E[Xtn 1A ] = E[Xt+ 1A ] = E[E[Xt+ |Fs+ ]1A ]


n→+∞ n→+∞

ce qui entraı̂ne Xs+ ≥ E[Xt+ |Fs+ ]. Enfin, si X est une martingale, on peut remplacer dans
le calcul précédent l’inégalité ≥ par une égalité =. 

Théorème 5.2 (Régularisation) On suppose que la filtration (Ft )t≥0 satisfait les condi-
tions habituelles. Si X = (Xt )t≥0 est une surmartingale et si la fonction t 7→ E[Xt ] est
continue à droite alors X admet une modification qui est aussi une (Ft )t≥0 -surmartingale
et dont les trajectoires sont continues à droite avec des limites à gauche en tout point
(càdlàg).

Démonstration : On fixe D un ensemble dénombrable dense dans R+ . Soit, d’après le


Théorème 5.1, N l’ensemble négligeable tel que si ω 6∈ N , l’application s 7→ Xs (ω) admet
des limites le long de D à droite en tout t ≥ 0 et à gauche en tout t > 0. On pose

Xt+ (ω) si ω 6∈ N
Yt =
0 si ω ∈ N.

Les trajectoires de Y sont continues à droite : en effet si ω 6∈ N alors pour t ≥ 0 et ε > 0,


on a
Yt+ = lim Yt+h = lim X(t+h)+ = lim lim Xt+h+δ = lim Xt+h = Xt+ = Yt .
h&0 h&0 h&0 δ&0 h&0

et
Yt− = lim Yt−h = lim X(t−h)+ = lim lim Xt−h+δ = lim Xt−u existe
h&0 h&0 h&0 δ&0 u&0

car la limite itérée limh&0 limδ&0 revient à prendre limu&0 avec u = h − δ & 0 car δ → 0
avant h. Ou alors

sup Ys (ω) ≤ sup Xs (ω)


s∈[t,t+ε[ s∈]t,t+ε[∩D

inf Ys (ω) ≥ inf Xs (ω)


s∈[t,t+ε[ s∈]t,t+ε[∩D
5.3. Martingales en temps continu 79

et avec des limites à gauche


!  
lim sup Xs (ω) = lim inf Xs (ω) = Xt+ (ω) = Yt (ω).
ε→0 s∈]t,t+ε[∩D ε→0 s∈]t,t+ε[∩D

De la même façon, on montre que les trajectoires de Y ont des limites à gauche.
Enfin, comme Ft+ = Ft (conditions habituelles vérifiées par (Ft )t≥0 ), on a d’après le 2) du
théorème précédent

Xt = E[Xt+ |Ft ] = E[Xt+ |Ft+ ] = Xt+ = Yt ps

puisque Xt+ est Ft+ -mesurable. On voit ainsi que Y est une modification de X. Puisque la
filtration (Ft )t≥0 est complète, il est clair que Yt est Ft -mesurable et il est immédiat aussi
que Y est une (Ft )t≥0 -surmartingale (cf. 3) dans le Th. 5.1). 

5.3.4 Théorèmes de convergence


Dans cette section, la notion d’uniforme intégrabilité est importante. On renvoie à un cours
de probabilité de base pour la définition de cette notion.

Théorème 5.3 (Convergence ps) Soit X = (Xt )t≥0 une surmartingale continue à droite
et bornée dans L1 . Alors il existe une variable aléatoire X∞− ∈ L1 telle que

lim Xt = X∞− ps.


t→+∞

Remarque 5.4 — Un énoncé adapté donne la convergence des sous-martingales


continues à droite.
— Une surmartingale (Xt )t≥0 est bornée dans L1 ssi supt≥0 E[Xt− ] < +∞. En effet,
comme E[Xt ] ≤ E[X0 ], on a E[Xt+ ] ≤ E[Xt− ] + E[X0 ]. Il vient

E[Xt− ] ≤ E[|Xt |] = E[Xt+ ] + E[Xt− ] ≤ 2E[Xt− ] + E[X0 ]

et donc
sup E[|Xt |] ≤ E[X0 ] + 2 sup E[Xt− ].
t≥0 t≥0

L’autre sens est évident puisque Xt−


≤ |Xt |.
— En particulier, une surmartingale positive est bornée dans L1 et d’après le Théo-
rème 5.3 ci-dessus elle converge ps.

Démonstration : Soit D un sous-ensemble dénombrable dense de R+ . On déduit de la


Proposition 5.9 (inégalité du nombre de montées) que pour tous a < b, on a

X X E[(Xt − a)− ] supt≥0 E[(Xt − a)− ]


E[Ma,b (D)] = lim E[Ma,b ([[0, t]∩D)] ≤ lim ≤ < +∞.
t→+∞ t→+∞ b−a b−a
80 Chapitre 5. JCB
c – M2 Math. – Université de Rennes 1

X
On a donc Ma,b (D) < +∞ ps, pour tout rationnels a < b et aussi pour tout ration-
nels a < b ps. En raisonnant comme dans le Théorème 5.1, on en déduit que X∞− :=
limt∈D→+∞ Xt existe ps (sinon, il existe a < b rationnels tels que lim inf t∈D→+∞ Xt < a <
b < lim supt∈D→+∞ Xt , ce qui exige un nombre infini de montées de a vers b le long de D).
De plus, le lemme de Fatou permet de voir que cette limite est dans L1 : d’abord, on a
E[|X∞− |] = E[ lim |Xs |] = E[lim inf |Xs |] ≤ lim inf E[|Xs |] ≤ sup E[|Xs |] < +∞.
s→+∞ s→+∞ s→+∞ s≥0

Pour finir, la continuité à droite des trajectoires de X permet de lever la restriction t ∈ D


dans la limite précédente. 

Définition 5.6 (Martingale fermée) Une surmartingale (Xt )t≥0 est dite fermée par une
variable aléatoire X∞ ∈ L1 si pour tout t ≥ 0, on a Xt ≥ E[X∞ |Ft ].
Une martingale (Xt )t≥0 est dite fermée (comme martingale) par une variable aléatoire
X∞ ∈ L1 si pour tout t ≥ 0, on a Xt = E[X∞ |Ft ].

Attention : une martingale peut être fermée en tant que surmartingale mais pas en tant
que martingale : considérer par exemple une martingale positive (non nulle), elle est fermée
par 0 en tant que surmartingale pourtant elle n’est pas nulle.
Dans le cas discret une martingale (Yn )n≥0 est fermée (ie. il existe Y∞ tel que Yn =
E[Y∞ |Fn ]) ssi elle est uniformément intégrable ou ssi Yn converge ps et dans L1 . On a
l’analogue dans le cas continu :
Proposition 5.11 Soit X = (Xt )t≥0 une martingale continue à droite. Alors il y a équi-
valence entre les assertions suivantes :
1. X est fermée (par X∞ ) ;
2. la famille (Xt )t≥0 est uniformément intégrable.
3. Xt converge ps et dans L1 vers X∞− ;
W
De plus X∞− = X∞ si F∞ = t≥0 Ft .
Démonstration : L’implication 1) ⇒ 2) est facile puisque si Z ∈ L1 alors la famille de
variables aléatoires {E[Z|G] : G sous-tribu de F} est uniformément intégrable.
Si 2) est vrai, le Théorème 5.3 entraı̂ne que Xt converge ps vers X∞− ∈ L1 donc aussi dans
L1 par uniforme intégrabilité, ce qui donne 3).
Enfin, si 3) est vérifié, on peut passer à la limite t → +∞ dans L1 dans l’égalité Xs =
E[Xt |Fs ] et on trouve Xs = E[X∞− |Fs ], ie. X est fermée, c’est à dire 1).
Pour la dernière partie, en notant Z = X∞ − X∞− , on déduit de Xt = E[X∞ |Ft ] =
E[X∞− |Ft ] que [
E[Z1A ] = 0 pour tout A ∈ Ft .
t≥0
S
Mais M = {A ∈ F∞ : E[Z1A ] = 0} est une classe monotone et t≥0 Ft est stable par in-
S 
tersection finie (π-système). D’après le théorème des classes monotones, F∞ = σ t≥0 Ft
5.3. Martingales en temps continu 81

est inclus dans M. On a donc E[Z1A ] = 0 pour tout A ∈ F∞ . Mais, comme Z est F∞ -
mesurable, on a donc Z = 0 ps, ie. X∞ = X∞− .


Pour une surmartingale fermée, on a la convergence ps :


Proposition 5.12 Une surmartingale continue à droite X = (Xt )t≥0 est fermée (par X∞ )
ssi Xt converge ps vers X∞− .
Démonstration : Soit (Xt )t≥0 une surmartingale continue à droite fermée par X∞ . Par un
argument de convexité (Jensen appliqué à la sous-martingale −X et à x+ ) donne E[(Xt )− ] ≤
E[(X∞ )− ]. Le Théorème 5.3 assure alors que Xt converge
W ps vers une limite X∞− (la
réciproque va garantir que X∞− = X∞ quand F∞ = t≥0 Ft ).
Réciproquement si Xt converge ps vers X∞− . On a pour s ≤ t
Xs − E[X∞− |Fs ] ≥ E[Xt |Fs ] − E[E[X∞− |Ft ]Fs ]
≥ E[Xt − E[X∞− |Ft ]|Fs ].
En passant à la limite t → +∞ par le lemme de Fatou, on a
 
Xs − E[X∞− |Fs ] ≥ E lim inf (Xt − E[X∞− |Ft ])|Fs . (5.8)
t→+∞

Mais lim inf t→+∞ Xt = limt→+∞ Xt = X∞− ps et comme (E[X∞− |Ft ])t≥0 est une martingale
fermée donc convergente, on a aussi, d’après la Prop 5.11, lim supt→+∞ E[X∞− |Ft ] = X∞−
(ici il est immédiat que F∞− = σ(∪t≥0 Ft )). Finalement, la minoration dans (5.8) est nulle
et elle donne Xs ≥ E[X∞− |Fs ] : la surmartingale (Xt )t≥0 est fermée. 

5.3.5 Théorème d’arrêt


Le théorème d’arrêt pour une surmartingale discrète (Yk )k∈N par rapport à une filtration
(Gk )k≥0 , fermée par Y∞ , énonce que si S et T sont deux temps d’arrêt tels que S ≤ T on
a YS , YT ∈ L1 et YS ≥ E[YT |GS ] (avec la convention YT = Y∞ sur {T = +∞}). Le résultat
s’applique encore à une surmartingale quelconque si S, T sont (déterministiquement) bor-
nés. L’analogue continu de ce théorème est un résultat essentiel pour la suite.
Rappelons qu’une martingale X à trajectoires continues à droite est progressivement me-
surable, cf. Prop. 5.1. En particulier, la Prop. 5.4 s’appliquera à XT 1{T <+∞} et la remarque
5.3 à XT si elle est fermée (qui sont FT -mesurables).

Théorème 5.4 (Arrêt)


1. Soit X = (Xt )t≥0 une surmartingale continue à droite et fermée par X∞ , variable
aléatoire F∞ -mesurable. Soient S et T deux temps d’arrêt avec S ≤ T . Alors XS et
XT sont dans L1 et
XS ≥ E[XT |FS ]
avec la convention XT = X∞ sur {T = +∞}.
82 Chapitre 5. JCB
c – M2 Math. – Université de Rennes 1

2. Soit X une martingale continue à droite fermée par X∞ , variable aléatoire F∞ -


mesurable. Alors, si S et T sont deux temps d’arrêt avec S ≤ T on a
XS = E[XT |FS ]
avec la même convention que ci-dessus. En particulier, XS = E[X∞ |FS ].

Démonstration : 1) Pour tout n ≥ 1, posons Dn = { 2kn : k ∈ N} ∪ {+∞} et comme en


(5.1)
Tn = inf{t ∈ Dn : t > T }
+∞
X k+1
= n
1{k2−n <T ≤(k+1)2−n } + (+∞)1{T =+∞}
k=0
2

D’après la Prop. 5.3, les Tn forment une suite de temps d’arrêt qui décroı̂t vers T .
Considérons pour n fixé les deux variables Tn et Tn+1 . Ce sont deux temps d’arrêt pour la
filtration discrète (Ft )t∈Dn+1 car
{k2−n−1 < T ≤ (k + 1)2−n−1 } = {T ≤ k2−n−1 }c ∩ {T ≤ (k + 1)2−n−1 } ∈ Fk2−n−1 .
Puisque Tn+1 ≤ Tn , le théorème d’arrêt (discret) appliqué à la surmartingale discrète
(Xt )t∈Dn+1 (qui est fermée par X∞ ) pour la filtration discrète (Ft )t∈Dn+1 entraı̂ne que
XTn+1 ≥ E[XTn |FTn+1 ].
Notons, pour k ≤ 0, Yk = XT−k . On a alors
Yk−1 = XT−k+1 ≥ E[XT−k |FT−k+1 ] = E[Yk |FT−k ],
La suite (Yk )k∈−N est donc une surmartingale indexée par −N pour la filtration (FT−k )k∈−N .
De plus, on a aussi supk≤0 E[Yk ] = supn≥0 E[XTn ] ≤ E[X0 ] (on utilise ici encore le théorème
d’arrêt discret). D’après le résultat discret de convergence (Prop. 5.10), on conclut que
XTn converge ps et dans L1 . Comme Tn & T , par continuité à droite, la limite ps est
nécessairement XT , ce qui donne en particulier XT ∈ L1 car il y a aussi convegence L1 .
Au temps d’arrêt S, on associe de même la suite Sn & S vérifiant aussi (quitte à réindéxer
Sn ) Sn ≤ Tn , et XSn converge vers XS ps et dans L1 . Puisque Sn ≤ Tn le théorème d’arrêt
discret donne XSn ≥ E[XTn |FSn ] ainsi, pour A ∈ FS ⊂ FSn ,
E[XSn 1A ] ≥ E[XTn 1A ].
En passant à la limite L1 quand n → +∞, il vient
E[XS 1A ] ≥ E[XT 1A ]
pour tout A ∈ FS . Comme d’après la Prop. 5.4 et la Rem. 5.3, XS est FS -mesurable, cette
inégalité assure alors que XS ≥ E[XT |FS ], ce qui conclue le 1).
2) Il suffit d’appliquer la partie 1) à X et à −X. 
5.3. Martingales en temps continu 83

Corollaire 5.1 Soit X une surmartingale (resp. une martingale) continue à droite et
soient S ≤ T deux temps d’arrêt (déterministiquement) bornés. Alors

XS ≥ E[XT |FS ] (resp. XS = E[XT |FS ]).

Démonstration : Soit a ≥ 0 tel que T ≤ a. On applique le théorème précédent à la


martingale (Xt∧a )t≥0 qui est fermée par Xa . Puis on remarque que XTa = XT et XSa = XS .


Remarque 5.5 Le théorème d’arrêt ne s’applique que pour des (sur)martingales unifor-
mément intégrables (fermées) ou pour des temps d’arrêt bornés. Par exemple si B est un
mouvement brownien, c’est bien une martingale (mais non uniformément intégrable sinon
le théorème 5.3 (de convergence ps) exigerait la convergence ps Bt → B∞ ce qui est faux).
Si pour a > 0, on pose Ta = inf(t ≥ 0 : Bt = a) alors on a bien un temps d’arrêt mais il
est non (déterministiquement) borné. Le théorème d’arrêt ne s’applique effectivement pas
dans ce cas puisque E[B0 ] = 0 6= E[BTa ] = a malgré 0 ≤ Ta .

Étant donné un temps d’arrêt T , on définit le processus arrêté X T = (XtT )t≥0 par XtT =
Xt∧T , c’est le processus qui vaut Xt tant que t ≤ T puis qu’on arrête à sa valeur en T , XT ,
pour les dates ultérieures à T .
Corollaire 5.2 Soit X une martingale continue à droite uniformément intégrable et soit
T un temps d’arrêt. Alors le processus (XtT )t≥0 est aussi une martingale uniformément
intégrable, et
XtT = E[XT |Ft ] (5.9)
avec la convention XT = X∞− sur {T = +∞}.
Démonstration : Il suffit d’établir (5.9) : on aura alors une martingale fermée donc
uniforément intégrable Rappelons que XT ∈ L1 d’après le Théorème 5.4 (arrêt). D’après
ce théorème avec S = t ∧ T ≤ T , on a aussi

XtT = XS = E[XT |FS ] = E[XT |Ft∧T ].

Il reste à voir que E[XT |Ft∧T ] = E[XT |Ft ].


Puisque XT 1{T <+∞} est FT -mesurable (cf. Prop. 5.4), on sait que XT 1{T ≤t} est Ft -mesurable
et aussi FT -mesurable, donc Ft∧T -mesurable. Il en découle que

E[XT 1{T ≤t} |Ft∧T ] = XT 1{T ≤t} = E[XT 1{T ≤t} |Ft ].

Pour compléter la preuve, il reste à voir que

E[XT 1{T >t} |Ft∧T ] = E[XT 1{T >t} |Ft ]. (5.10)

Or si A ∈ Ft , on a
84 Chapitre 5. JCB
c – M2 Math. – Université de Rennes 1

— A ∩ {T > t} ∈ Ft car A, {T > t} = {T ≤ t}c ∈ Ft ;


— puis A ∩ {T > t} ∈ FT car A ∩ {T > t} ∩ {T ≤ s} = ∅ ∈ Fs si s ≤ t et
A ∩ {T > t} ∩ {T ≤ s} ∈ Fs si t ≤ s car A, {T > t} = {T ≤ t}c ∈ Ft ⊂ Fs et
{T ≤ s} ∈ Fs .
Finalement, A ∩ {T > t} ∈ FT ∩ Ft = Ft∧T et donc pour tout A ∈ Ft :

E[1A 1{T >t} XT ] = E[E[1A 1{T >t} XT |Ft∧T ]] = E[1A 1{T >t} E[XT |Ft∧T ]] = E[1A E[XT 1{T >t} |Ft∧T ]]

car {T > t} ∈ FT ({T > t} = {T ≤ t}c et {T ≤ t} ∩ {T ≤ s} = {T ≤ t ∧ s} ∈ Ft∧s ⊂ Fs ).


Rappelons que Y = E[Z|G] est caractérisée par E[1A Z] = E[1A Y ] pour tout A ∈ G.
Par ailleurs

E[1A 1{T >t} XT ] = E[E[1A 1{T >t} XT |Ft ]] = E[1A E[1{T >t} XT |Ft ]]

On a donc
E[1A E[1{T >t} XT |Ft ]] = E[1A E[XT 1{T >t} |Ft∧T ]]
avec E[XT 1{T >t} |Ft∧T ] qui est Ft -mesurable.
Mais rappelons que Y = E[Z|G] ssi Y est G-mesurable et E[1A Z] = E[1A Y ] pour tout
A ∈ G.
Finalement
E[XT 1{T >t} |Ft∧T ] = E[1{T >t} XT |Ft ],
ie. (5.10) est obtenue, ce qui termine la preuve du Corollaire 5.2. 

Remarque 5.6 Si on suppose seulement que X est une martingale continue à droite, alors
on peut appliquer le corollaire ci-dessus à la martingale uniformément intégrable (Xt∧a )t≥0 .
On trouve que pour tout temps d’arrêt T , (Xt∧T ∧a )t≥0 est une martingale. Comme on peut
prendre a aussi grand qu’on le désire, cela signifie que (Xt∧T )t≥0 est une martingale : avec
a ≥ t ≥ s, la propriété de martingale pour (Xt∧T ∧a )t≥0 , E[Xt∧T ∧a |Fs ] = Xs∧T ∧a , s’écrit
E[Xt∧T |Fs ] = Xs∧T ie. (Xt∧T )t≥0 est bien une martingale.
Conclusion. Si X est une martingale et T un temps d’arrêt, X T définie bien une martingale
appelée martingale arrêtée. Elle est uniformément intégrable si X l’est ou si T est
(déterministiquement) borné.

5.4 Processus de Poisson


Si le mouvement brownien est le processus à trajectoires continues typique, le processus
à saut typique est le processus de Poisson qu’on décrit (très) sommairement dans cette
section. Ce type de processus est utilisé par exemple pour modéliser les files d’attente
comme les arrivées des appels téléphoniques à un central.
5.4. Processus de Poisson 85

Définition 5.7 (Processus de Poisson) Soit λ > 0 et (Sn )n≥1 une suite de variables
aléatoires indépdendantes de même loi exponentielle E(λ). On pose Tn = S1 + · · · + Sn . On
définit alors le processus de comptage N = (Nt )t≥0 à valeurs dans N ∪ {+∞} par
X
Nt = 1{Tn ≤t} .
n≥1

Ce processus s’appelle le processus de Poisson d’intensité λ.

Définition 5.8 On définit (FtN )t≥0 la filtration naturelle complétée du processus de Pois-
son.

Remarque 5.7 Le processus se réécrit aussi sous la forme Nt = sup(n ≥ 0 : Tn ≤ t).


Réciproquement, on remarque que Tn = inf(t ≥ 0 : Nt = n) est un (FtN )t≥0 temps d’arrêt.
P
Comme pour t > s, on a Nt − Ns = n≥1 1{s<Tn ≤t} , N est un processus à accroisssements
indépendants et stationnaires (PAIS) et à trajectoires càdlàg. On montre qu’il vérifie alors
la propriété de Markov forte : soit T un (FtN )t≥0 -temps d’arrêt fini ps. On note N 0 le
processus défini pour s ≥ 0 par Ns0 = NT +s − NT . Alors le processus N 0 est indépendant
de FTN et a même loi que N .

Définition 5.9 (équivalente du processus de Poisson) Un processus de Poisson N =


(Nt )t≥0 d’intensité λ est un processus de comptage à trajectoires continues à droite tel que
— N (0) = 0 ;
— N est un processus à accroissements indépendants et stationnaires ;
— pour tout t ≥ 0, Nt suit la loi de Poisson P(λt).

Démonstration : Fastidieux. . . , cf. [BC]. 

Théorème 5.5 Soit N un processus de Poisson d’intensité λ. Alors les processus suivants
sont des martingales :
1. le processus de Poisson compensé : Ñ = (Nt − λt, t ≥ 0) ;
2. ((Nt − λt)2 − λt, t ≥ 0).

Remarque 5.8 — On peut voir le processus de Poisson comme une mesure aléatoire
sur (R, B(R)) : la mesure de l’intervalle ]s, t] est N (]s, t]) = Nt − Ns .
— Le mouvement brownien et le processus de Poisson sont deux représentant d’une
classe plus vaste de processus dit de Lévy (processus càdlàg à accroissements
indépendants et stationnaires).
86 Chapitre 5. JCB
c – M2 Math. – Université de Rennes 1
Chapitre 6

Semimartingales continues

Les semimartingales continues forment la classe générale de processus à trajectoires


continues pour laquelle on peut développer une théorie de l’intégration stochastique qui
sera l’objet du chapitre suivant. Par définition, une semimartingale est la somme d’une
martingale (locale) et d’un processus à variation finie. Dans ce chapitre nous étudions
séparément ces deux classes de processus. En particulier, nous introduisons la notion de
variation quadratique d’une martingale qui jouera un rôle fondamental pour l’intégration
stochastique.
Dans ce chapitre, on considère un espace de probabilité filtré (Ω, F, (Ft )t≥0 , P) satisfaisant
les conditions habituelles. On considère d’abord des processus à variation finie en Section 6.1
puis des martingales locales en Section 6.2 dont on étudie la variation quadratique en
Section 6.3. On résume les résultats obtenus pour les semimartingales en Section 6.4.

6.1 Processus à variation bornée


6.1.1 Fonctions à variation finie
Soit T > 0 fixé. On rappelle qu’il y a une bijection entre les fonctions croissantes continues
àe droite g : [0, T ] → R+ et les mesures ν positives finies sur [0, T ]. Elle est donnée par
g(t) = ν([0, t]) où ν(]s, t]) = g(t) − g(s). La donnée de ν sur les intervalles ]s, t] déterminent
uniquement la mesure ν sur B([0, T ]) (par un argument de classe monotone). Si g est en
plus supposée continue alors ν est sans atome (ie. ν({t}) = 0 pour tout t ∈ [0, T ]).
Exemples : si g(x) = x alors ν est la mesure de Lebesgue λ ; si g(x) = 1[a,+∞[ (x) alors ν
est la mesure de Dirac δa .

Définition 6.1 (Mesure signée) Une mesure finie est dite signée si elle est différence
de deux mesures positives finies.

L’écriture d’une mesure µ signée sous la forme d’une différence de deux mesures positives
finies n’est pas unique, cependant il existe une seule décomposition canonique :

87
88 Chapitre 6. JCB
c – M2 Math. – Université de Rennes 1

Proposition 6.1 (Décomposition canonique d’une mesure signée) Il existe une seu-
le décomposition µ = µ+ − µ− minimale dans le sens où µ+ et µ− sont deux mesures
positives finies portées par des boréliens disjoints. Il s’agit de la décomposition canonique
de µ.

Dans la suite, pour une fonction h à valeurs réelles, on note h+ = h ∨ 0 et h− = h ∧ 0.


Démonstration : Pour obtenir l’existence d’une telle décomposition, on considère une
décomposition quelconque µ = µ1 − µ2 de µ, on pose ν = µ1 + µ2 . Comme µ1  ν et
µ2  ν, on écrit par le théorème de Radon-Nikodym :

µ1 (dt) = h1 (t)ν(dt), µ2 (dt) = h2 (t)ν(dt).

Avec h(t) = h1 (t) − h2 (t) on a

µ(dt) = h(t)ν(dt) = h(t)+ ν(dt) − h(t)− ν(dt)

ce qui donne la décomposition µ = µ+ −µ− avec µ+ (dt) = h(t)+ ν(dt), µ− (dt) = h(t)− ν(dt).
Notons que les mesures µ+ et µ− sont bien à supports disjoints puisqu’elles sont portées
respectivement par D+ = {t ∈ [0, T ] : h(t) > 0} et D− = {t ∈ [0, T ] : h(t) < 0}. L’unicité
de la décomposition µ = µ+ − µ− vient du fait que l’on a nécessairement

µ+ (A) = sup{µ(C) : C ⊂ A, C borélien}.

En effet µ(C) ≤ µ+ (C) ≤ µ+ (A) quand C ⊂ A et

µ+ (A) = µ+ (A ∩ D+ ) = µ(A ∩ D+ ) ≤ sup{µ(C) : C ⊂ A, C borélien}.

On note |µ| la mesure positive |µ| = µ+ + µ− . Il s’agit de la variation totale de µ.


Remarquons que la dérivée de Radon-Nikodym de µ par rapport à |µ| est

= 1D+ − 1D−
d|µ|
où D+ ∪ D− est une partition de l’espace.

Définition 6.2 Soit T > 0. Une fonction continue F : [0, T ] → R telle que F (0) = 0 est
dite à variation finie s’il existe une mesure signée (ie. différence de deux mesures positives
finies) µ telle que F (t) = µ([0, t]) pour tout t ∈ [0, T ].

La mesure µ est alors déterminée de façon unique : l’expression µ(]s, t]) = F (t) − F (s) la
détermine uniquement sur la famille des intervalles ]s, t] puis, par un argument de classe
monotone, sur B([0, T ]). De plus, F étant continue, µ est sans atome.
6.1. Processus à variation bornée 89

Proposition 6.2 Une fonction F est à variation finie ssi F est différence de deux fonc-
tions croissantes continues nulles en 0.

Démonstration : Si F est à variation finie, F (t) = µ([0, t]) et avec la décomposition ca-
nonique de µ de la Proposition 6.1, F est différence de deux fonctions croissantes continues
et nulles en 0 : F (t) = µ+ ([0, t]) − µ− ([0, t]) (si µ+ et µ− ont des atomes, ils doivent néces-
sairement coı̈ncider pour s’annuler (µ n’en ayant pas). Mais comme µ+ et µ− sont censés
avoir des supports disjoints, c’est que de tels atomes n’existent pas : µ+ et µ− sont bien
sans atome. Réciproquement, si F = F1 − F2 avec F1 , F2 fonctions croissantes continues et
nulles en 0 alors on associe µ1 et µ2 des mesures positives finies à F1 , F2 et F s’écrit alors
F (t) = µ([0, t]) pour la mesure signée µ = µ1 − µ2 . 

Dans la suite, on note µ la mesure associée à F et µ+ − µ− la décomposition canonique


de µ. La fonction définie par µ+ ([0, t]) + µ− ([0, t]) s’appelle la variation totale de F .
D’habitude, les fonctions à variation finie sont plutôt définies par la propriété suivante :

Proposition 6.3 (Variation finie – ou bornée) Pour tout t ∈ [0, T ], on a


( p )
X
|µ|([0, t]) = sup |F (ti ) − F (ti−1 )|
{ti }i=1,...,p i=1

où le supremum porte sur toutes les subdivisions 0 = t0 < t1 < · · · < tp = t de [0, t].

Démonstration : Il suffit clairement de traiter le cas t = T . L’inégalité ≥ s’obtient


facilement puisque

|F (ti ) − F (ti−1 )| = |µ(]ti−1 , ti ])| ≤ |µ|(]ti−1 , ti ])

et donc pi=1 |F (ti )−F (ti−1 )| ≤ pi=1 |µ|(]ti−1 , ti ]) = |µ|(]0, T ]) = |µ|([0, T ]) par additivité.
P P
Pour l’autre inégalité, on montre le résultat plus fort suivant : pour toute suite 0 = tn0 <
tn1 < · · · < tnpn de subdivisions emboitées de [0, T ] de pas tendant vers 0, on a
pn
X
lim |F (tni ) − F (tni−1 )| = |µ|([0, T ]).
n→+∞
i=1

Pour simplifier, on considère les subdivisions dyadiques tni = i2−n T , 0 ≤ i ≤ 2n , de [0, T ].


On utilise un argument de martingales en introduisant l’espace de probabilité Ω = [0, T ]
muni de la tribu borélienne B([0, T ]) et de la probabilité P(ds) = (|µ|([0, T ])−1 )|µ|(ds). Sur
cet espace, on considère la filtration discrète (Bn )n≥n où Bn est la tribu engendrée par les
intervalles ](i − 1)2−n T, i2−n T ], avec 1 ≤ i ≤ 2n . On pose alors


X(s) = (s) = 1D+ (s) − 1D− (s)
d|µ|
90 Chapitre 6. JCB
c – M2 Math. – Université de Rennes 1

où D+ ∪ D− est une partition de l’espace et on considère pour chaque n ≥ 0


Xn = E[X|Bn ].
Il s’agit d’une (Bn )n≥0 -martingale. Comme Xn est Bn -mesurable, Xn est constante sur
chaque intervalle ](i − 1)2−n T, i2−n T ]. D’après les propriétés de l’espérance conditionnelle,
sa valeur αi sur ](i − 1)2−n T, i2−n T ] vérifie
|µ|(](i − 1)2−n T, i2−n T ])
 
  dµ
αi = E E[X|Bn ]1](i−1)2−n T,i2−n T ] = E 1](i−1)2−n T,i2−n T ]
|µ|([0, T ]) d|µ|
µ(](i − 1)2−n T, i2−n T ])
Z
dµ d|µ|
= = .
](i−1)2−n T,i2−n T ] d|µ| |µ|([0, T ]) |µ|([0, T )]
On a donc
µ(](i − 1)2−n T, i2−n T ]) F (i2−n T ) − F ((i − 1)2−n T )
αi = = .
|µ|(](i − 1)2−n T, i2−n T ]) |µ|(](i − 1)2−n T, i2−n T ])
Puis comme, par définition, la martingale
W discrète (Xn )n≥0 est fermée et comme X est
mesurable par rapport à B([0, T ]) = n≥0 Bn cette martingale converge ps et dans L1
vers X. En particulier,
lim E[|Xn |] = E[|X|] = 1,
n→+∞

où on utilise |X(s)| = 1, µ-pp. Le résultat suit facilement puisque


2 n
X
−1
E[|Xn |] = (|µ|([0, T ]) ) |F (i2−n T ) − F ((i − 1)2−n T )|.
i=1

6.1.2 Intégrale de Stieltjes


R
Soit f : [0, T ] → R une fonction mesurable telle que [0,T ] |f (s)||µ|(ds) < +∞. On note
Z t Z Z t Z
f (s) dF (s) = f (s) µ(ds), f (s) |dF (s)| = f (s) |µ|(ds).
0 [0,t] 0 [0,t]

On vérifie facilement l’inégalité


Z t Z t

f (s) dF (s) ≤ |f (s)| |dF (s)|.

0 0
Rt
Remarquons de plus que la fonction t 7→ 0 f (s) dF (s) est aussi à variation finie. La mesure
associée est alors simplement µ0 (ds) = f (s)µ(ds) et sa décomposition canonique est
Z t Z t  Z t Z t 
+ + − − − + + −
f (s) dF (s) + f (s) dF (s) − f (s) dF (s) + f (s) dF (s) .
0 0 0 0
6.1. Processus à variation bornée 91

On a aussi une écriture en terme d’intégrales par rapport à des mesures positives
Z t Z t Z t
f (s) dF (s) = +
f (s) dF (s) − f (s) dF − (s).
0 0 0

On a encore l’associativité de l’intégrale : si F est une fonctionRà variation bornée et si h, g


t
sont des fonctions mesurables bornées alors en notant Fe(t) = 0 h(s) dF (s), on a
Z t Z t
g(s)dFe(s) = g(s)h(s) dF (s).
0 0

Le résultat suivant généralise les sommes de Riemann à l’intégrale de Stieltjes et donne


donc un moyen d’approcher les intégrales de Stieltjes par des sommes.

Proposition 6.4 Si f : [0, T ] → R est une fonction continue et si 0 = tn0 < tn1 < · · · <
tnpn = T est une suite de subdivisions (emboitées) de [0, T ] de pas tendant vers 0 on a
Z T pn
X
f (s)dF (s) = lim f (tni−1 )(F (tni ) − F (tni−1 )).
0 n→+∞
i=1

Démonstration : Soit fn la fonction constante par morceaux définie par fn (s) = f (tni−1 )
si s ∈]tni−1 , tni ]. Alors,
pn Z
X
f (tni−1 )(F (tni ) − F (tni−1 )) = fn (s)µ(ds)
i=1 [0,T ]

et le résultat suit par convergence dominée (f continue sur [0, T ] est bornée). 

6.1.3 Extension de l’intégration de Stieltjes à R+


Définition 6.3 (Variation finie sur R+ ) Une fonction continue F : R+ → R est dite à
variation finie sur R+ si, pour tout T > 0, la restriction de F à [0, T ] est à variation finie.

Il est alors facile d’étendre les définitions précédentes


R +∞ des intégrales à R+ en supposant f
dF -intégrable. En particulier, on peut définir 0 f (s) dF (s) pour toute fonction f telle
R +∞ RT
que 0 |f (s)| |dF (s)| = supT >0 0 |f (s)| |dF (s)| < +∞.

6.1.4 Processus à variation finie


On rappelle qu’on considère un espace de probabilité filtré (Ω, F, (Ft )t≥0 , P) satisfaisant
les conditions habituelles.

Définition 6.4 (Processus à variation finie et processus croissant)


92 Chapitre 6. JCB
c – M2 Math. – Université de Rennes 1

— Un processus à variation finie A = (At )≥0 est un processus adapté dont toutes les
trajectoires sont à variation finie au sens de la Définition 6.2.
— Le processus A est appelé processus croissant si de plus les trajectoires de A sont
croissantes.

Remarque 6.1 — En particulier, d’après la Définition 6.2 d’une fonction à varia-


tion finie, on a A0 = 0 et les trajectoires de A sont continues.
— Le mouvement brownien n’est pas à variation bornée, cf. Prop. 4.8 : on ne pourra
donc pas utiliser cette section pour construire l’intégrale contre un mouvement brow-
nien.

Proposition 6.5 Soient A un processus à variation finie et H un processus progressif tel


que Z t
∀t ≥ 0, ∀ω ∈ Ω, |Hs (ω)| |dAs (ω)| < +∞.
0
Alors le processus H · A défini par
Z t
(H · A)t = Hs (ω) dAs (ω)
0

est aussi un processus à variation finie.

Remarque 6.2 Quand on intègre contre un processus à variation finie, on définit une
intégrale trajectorielle : l’intégrale se définit ω par ω (ie. trajectoire par trajectoire).

Démonstration : D’après les observations de la section précédente, les trajectoires de


H · A sont à variation finie. Il ne reste donc qu’à justifier que H · A est adapté. Pour cela, il
R t de voir que, si h : [0, t] × Ω → R est mesurable pourRla
suffit
t
tribu produit B([0, t]) ⊗ Ft et si
0
|h(s, ω)||dAs (ω)| est fini pour tout ω, alors la variable 0 h(s, ω)dAs (ω) est Ft -mesurable.
D’abord, pour h(s, ω) = 1]u,v] (s)1Γ (ω) avec ]u, v] ⊂ [0, t] et Γ ∈ Ft , on a
Z t
h(s, ω)dAs (ω) = (Av (ω) − Au (ω))1Γ (ω)
0

qui est clairement Ft -mesurable puisque (At )t≥0 est adapté et Γ ∈ Ft .


Par un argument de classe monotone, comme {]u, v] × Γ, ]u, v] ⊂ [0, t] R: Γ ∈ Ft } engendre
t
B([0, t]) ⊗ Ft , on justifie alors que pour h = 1G , G ∈ B([0, t]) ⊗ Ft , 0 h(s, ω)dAs (ω) est
encore Ft -mesurable.
Enfin, on passe au cas général en écrivant h fonction B([0, t]) ⊗ Ft -mesurable, dAs (ω)-
intégrable, comme limite simple d’une suite de fonctions
Rt étagées hn telles
R t que pour tout
n on ait |hn | ≤ |h|. Par convergence dominée, on a 0 hn (s, ω)dAs (ω) → 0 h(s, ω)dAs (ω).
Rt
Comme 0 hn (s, ω)dAs (ω) est Ft -mesurable et que la Ft -mesurabilité se conserve en passant
à la limite, on obtient le résultat. 
6.2. Martingales locales 93

Remarque 6.3 — Souvent, on sera dans la situation où l’hypothèse plus faible est
satisfaite Z t
ps ∀t ≥ 0, |Hs ||dAs | < +∞.
0
Dans ce cas, on peutR encore définir H · A en convenant que, sur l’ensemble de
t
probabilité nulle où 0 |Hs ||dAs | devient infini, on prend (H · A)t (ω) = 0 pour
tout t. Le processus (H ·A) ainsi défini reste adapté lorsque la filtration est supposée
complète.
— Sous des hypothèses convenables d’intégrabilité de H et de K, on a la propriété
d’associativité :
K · (H · A) = (KH) · A.

Un cas particulier important est celui où At = t : si H = (Ht )t≥0 est un processus progressif
tel que Z t
ps ∀t ≥ 0 |Hs | ds < +∞,
0
Rt
le processus 0
Hs ds est un processus à variation finie.

6.2 Martingales locales


Si T est un temps d’arrêt et X = (Xt )t≥0 un processus on rappelle que X T désigne le
processus arrêté : pour tout t ≥ 0, XtT = Xt∧T . On a vu que si X est une martingale alors
X T l’est aussi (il s’agit de la martingale arrêtée), cf. Remarque 5.6.

Définition 6.5 (Martingale locale) Un processus M = (Mt )t≥0 est appelé une mar-
tingale locale (continue) s’il s’écrit Mt = M0 + Nt où M0 est une variable aléatoire F0 -
mesurable et où (Nt )t≥0 est un processus adapté à trajectoires continues tel qu’il existe une
suite croissante (Tn )n≥0 de temps d’arrêt avec Tn % +∞ et pour tout n le processus arrêté
N Tn est une martingale uniformément intégrable.
On dit que la suite de temps d’arrêt Tn % +∞ réduit M si pour tout n le processus arrêté
N Tn est une martingale uniformément intégrable.
Lorsque M0 = 0, on parle de martingale locale issue de 0.

Remarque 6.4 On n’impose pas dans la définition d’une martingale locale que les va-
riables Mt soient dans L1 (c’est une différence essentielle avec les martingales). En par-
ticulier, d’après la définition précédente, M0 peut être n’importe quelle variable aléatoire
F0 -mesurable.

Dans les propriétés qui suivent, la plupart des justifications viennent des propriétés des
martingales arrêtées énoncées dans le Corollaire 5.2.
Exemple : Une martingale à trajectoires continues est une martingale locale (et la suite
Tn = n réduit M ).
94 Chapitre 6. JCB
c – M2 Math. – Université de Rennes 1

En effet, cela suit par exemple du Corollaire 5.2 et de ses conséquences avec les temps
d’arrêt Tn = n % +∞, plus simplement, il est immédiat que pour s < t :
 
Ms∧n = E Mt∧n |Fs
et (Mt∧n )t≥0 est fermée par Mn donc uniformément intégrable.

Proposition 6.6 Dans la définition d’une martingale locale (issue de 0) on peut remplacer
00
martingale uniformément intégrable00 par 00 martingale00 (en effet, on peut ensuite remplacer
Tn par Tn ∧ n pour récupérer l’uniforme intégrabilité).

Démonstration : Si M Tn est une martingale alors (M Tn )n = M Tn ∧n l’est aussi et elle est


fermée par Mn donc uniformément intégrable. De plus, il est évident que (Tn ∧ n) % +∞
si Tn % +∞. 

Proposition 6.7 Si M est une martingale locale, pour tout temps d’arrêt T , M T est une
martingale locale.
Démonstration : Si Tn réduit M alors M Tn est une martingale et (M T )Tn = M T ∧Tn =
(M Tn )T l’est aussi d’après le Corollaire 5.2. 

Proposition 6.8 Si (Tn )n≥0 réduit M et si (Sn )n≥0 est une suite de temps d’arrêt telle
que Sn → +∞, alors la suite (Tn ∧ Sn )n≥0 réduit aussi M .
Démonstration : On a (Tn ∧ Sn ) % +∞ et M Tn ∧Sn = (M Tn )Sn est une martingale unifor-
mément intégrable en tant que martingale uniformément intégrable M Tn arrêtée (corollaire
5.2). 

Proposition 6.9 L’espace des martingales locales est un espace vectoriel.


Démonstration : Si M, N sont des martingales locales réduites respectivement par (Tn )n≥0
et (Sn )n≥0 alors d’après la Prop. 6.8, elles le sont encore toutes les deux par (Tn ∧ Sn )n≥0 .
Mais alors (M + N )Tn ∧Sn = N Tn ∧Sn + N Tn ∧Sn est une martingale, comme somme de mar-
tingales. 

Proposition 6.10 Une martingale locale positive M telle que M0 ∈ L1 est une surmar-
tingale.
D’après le Théorème 5.3 (convergence ps des surmartingales) et la remarque qui le suit,
une martingale locale positive converge donc ps.
Démonstration : Écrivons Mt = M0 + Nt et soit (Tn )n≥0 une suite de temps d’arrêt qui
réduit N . Alors, si s ≤ t, on a pour tout n,
 
Ns∧Tn = E Nt∧Tn |Fs .
6.2. Martingales locales 95

En ajoutant des deux côtés la variable M0 (qui est F0 -mesurable et dans L1 ), on trouve
 
Ms∧Tn = E Mt∧Tn |Fs . (6.1)

Puisque M est positive, on peut appliquer le lemme de Fatou pour les espérances condi-
tionnelles en faisant n → +∞. Comme Tn % +∞, on a alors
 
Ms = lim Ms∧Tn = lim inf Ms∧Tn = lim inf E Mt∧Tn |Fs
n→+∞ n→+∞ n→+∞
   
≥ E lim inf Mt∧Tn |Fs = E Mt |Fs .
n→+∞

En particulier, en prenant s = 0 et l’espérance, on a E[Mt ] ≤ E[M0 ] < +∞, donc Mt ∈ L1


pour tout t ≥ 0. L’inégalité précédente assure alors que M est bien une surmartingale. 

Proposition 6.11 Soit M une martingale locale. S’il existe une variable Z ∈ L1 telle que,
pour tout t ≥ 0, |Mt | ≤ Z, alors M est une martingale. En particulier, une martingale
locale bornée est une martingale.

Démonstration : Si M est dominée par une variable aléatoire Z intégrable, on obtient


comme au 1) pour s ≤ t :
 
Ms∧Tn = E Mt∧Tn |Fs .
Puis, par convergence dominée la suite Mt∧Tn converge dans L1 vers Mt . On peut donc
passer à la limite n → +∞ pour trouver
     
Ms = lim Ms∧Tn = lim E Mt∧Tn |Fs = E lim Mt∧Tn |Fs = E Mt |Fs .
n→+∞ n→+∞ n→+∞

Remarque 6.5 Attention, il n’est donc pas facile d’affaiblir les conditions de le Prop.
6.11 : si M est une martingale locale uniformément intégrable, en général M n’est pas
une martingale (cf. le contre-exemple 2.13 p. 182 dans [RY], cf. aussi le contre-exemple
page ?? pour le processul de Bessel Rt en dimension 3 : la martingale locale 1/Rt est
uniformément intégrable car bornée dans L2 mais n’est pas une martingale). Par contre si
on a une condition d’uniforme intégrabilité pour tous les temps d’arrêt, on a un résultat
positif :

Proposition 6.12 Si M est une martingale locale avec M0 = 0, alors M est réduite par
la suite de temps d’arrêt

Tn = inf t ≥ 0 : |Mt | = n .
96 Chapitre 6. JCB
c – M2 Math. – Université de Rennes 1

Démonstration : Comme M Tn est une martingale locale bornée, c’est aussi une martin-
gale par la Prop. 6.11. De plus M est à trajectoires continues, on a bien Tn % +∞. En
effet, soit A > 0, comme M est à trajectoires continues, {Mt : t ∈ [0, A]} est compact donc
borné par R(A) < +∞. On a alors pour tout n ≥ R(A), Tn ≥ A, ie. Tn % +∞. 

Le résultat suivant montre qu’une martingale locale continue qui n’est pas triviale est à
variations non bornées. L’ensemble des martingales locales est donc un ensemble vraiment
différent de celui des processus à variation finie.

Théorème 6.1 Soit M une martingale locale (continue) issue de 0. Alors si M est un
processus à variation finie, M est indistinguable de 0.

Démonstration : Supposons que M est un processus à variation finie et posons pour tout
n∈N: Z t
 
τn = inf t ≥ 0 : |dMs | ≥ n .
0

Les temps τn sont R t des temps d’arrêt d’après l’Exemple 4.1 (pour cela, il faut remarquer
que le processus 0 |dMs | est continu et adapté, ce qui se voit par l’approximation donnée
τn
R +∞6.4). Fixons n ≥ 1 et posons N =RM
par la Prop.
t∧τn
. Alors NR est une martingale locale
t∧τ
telle que 0 |dNs | ≤ n, en particulier |Nt | = | 0 dMs | ≤ 0 n |dMs | ≤ n. D’après la
Proposition 6.11, N est alors une vraie martingale bornée.
Ensuite, soit t > 0 et soit 0 = t0 < t1 < · · · < tp = t une subdivision de [0, t]. Alors,
p p
X X
E[Nt2 ] = E[Nt2i − Nt2i−1 ] = E[Nt2i ] + E[Nt2i−1 ] − 2E[Nt2i−1 ]
i=1 i=1
p
X
= E[Nt2i ] + E[Nt2i−1 ] − 2E[Nti−1 E[Nti |Fti−1 ]] (propriété de martingale)
i=1
p p
X X
= E[Nt2i ] + E[Nt2i−1 ] − 2E[Nti−1 Nti ] = E[(Nti − Nti−1 )2 ]
i=1 i=1
p
" X #
≤ E sup |Nti − Nti−1 | |Nti − Nti−1 |
1≤i≤p
i=1
 
≤ nE sup |Nti − Nti−1 |
1≤i≤p

en utilisant la Proposition 6.3. On applique l’inégalité précédente à une suite 0 = tk0 < tk1 <
· · · < tkpk = t de subdivisions de [0, t] de pas tendant vers 0. En utilisant la continuité des
trajectoires, et le fait que N est bornée par n (fixé dans cette partie de l’argument), on a
par convergence dominée :
 
lim E sup |Ntki − Ntki−1 | = 0.
k→+∞ 1≤i≤pk
6.3. Variation quadratique d’une martingale locale 97

2
On conclut alors que E[Nt2 ] = 0 c’est à dire E[Mt∧τ n
] = 0. En faisant ensuite tendre
n → +∞, comme τn → +∞, on obtient par le lemme de Fatou :
   
2 2 2 2
E[Mt ] = E lim Mt∧τn = E lim inf Mt∧τn ≤ lim inf E[Mt∧τ n
] = 0.
n→+∞ n→+∞ n→+∞

Finalement pour tout t ≥ 0, Mt = 0 ps. La martingale locale M admet 0 comme version.


Pour conclure, comme 0 et M sont à trajectoires continues, le processus M est en fait
indistinguable de 0. 

6.3 Variation quadratique d’une martingale locale


Le théorème ci-dessous définit le crochet (ou variation quadratique) d’une martingale locale.
Cette notion est clef dans le calcul stochastique qui va être développé dans la suite.

Théorème 6.2 (Crochet d’une martingale locale) Soit M = (Mt )t≥0 une martingale
locale (continue). Il existe un processus croissant, noté (hM, M it )t≥0 unique à indistingua-
bilité près, tel que
Mt2 − hM, M it (6.2)
est une martingale locale continue. De plus, pour tout t > 0, si 0 = tn0 < tn1 < · · · < tnpn = t
est une suite de subdivisions emboitées de [0, t] de pas tendant vers 0, on a, au sens de la
convergence en probabilité,
pn
X 2
hM, M it = P- lim Mtni − Mtni−1 . (6.3)
n→+∞
i=1

Le processus hM, M i est appelé la variation quadratique ou crochet de M .

Remarque 6.6
— Pour les martingales, on a mieux : si M est une martingale de carré intégrable
alors Mt2 − hM, M it est une martingale aussi, cf. plus bas Théorème 6.3.
— Si M = B est un mouvement brownien, on a vu que hB, Bit = t, cf. Prop. 4.7.
— Pour la dernière assertion, il n’est pas nécessaire de supposer que les subdivisions
sont emboitées.

Démonstration : L’unicité découle du Théorème 6.1. En effet, si A et A0 sont deux


processus croissants satisfaisant la condition (6.2), le processus At − A0t = (Mt2 − A0t ) −
(Mt2 − At ) doit être à la fois une martingale locale (car différence de martingales locales)
et un processus à variation finie (car différence de tels processus), ce qui exige sa nullité
(cf. Th. 6.1).
Pour l’existence, on considère d’abord le cas où M0 = 0 et M est bornée. D’après la Prop.
6.11, M est alors une vraie martingale. On se fixe t > 0 et 0 = tn0 < tn1 < · · · < tnpn = t une
98 Chapitre 6. JCB
c – M2 Math. – Université de Rennes 1

suite de subdivisions emboitées de [0, t] de pas tendant vers 0. Pour chaque n, on considère
le processus X n défini par
pn
X
Xsn = Mtni−1 (Mtni ∧s − Mtni−1 ∧s ).
i=1

Lemme 6.1 Le processus X n est une martingale continue.

Démonstration : La continuité est claire car M l’est. Puis si s ≤ r, on a

E[Xrn |Fs ]
pn
X  
= E Mtni−1 (Mtni ∧r − Mtni−1 ∧r )|Fs
i=1
X  
= E Mtni−1 (Mtni ∧r − Mtni−1 ∧r )|Fs
i:tn
i−1 ≤r
X   X  
= E Mtni−1 (Mtni ∧r − Mtni−1 ∧r )|Fs + E Mtni−1 (Mtni ∧r − Mtni−1 ∧r )|Fs
i:s≤tn
i−1 ≤r i:tn
i−1 ≤s≤r
X    X  
= E Mtni−1 E (Mtni ∧r − Mtni−1 ∧r )|Fti−1 ]|Fs + Mtni−1 E (Mtni ∧r − Mtni−1 ∧r )|Fs
i:s≤tn
i−1 ≤r i:tn
i−1 ≤s≤r
X   X
= E Mtni−1 (Mti−1 − Mti−1 ) |Fs + Mtni−1 (Mtni ∧s − Mtni−1 ∧s )
i:s≤tn i:tn
≤r
| {z }
i−1 =0 i−1 ≤s≤r
X
= Mtni−1 (Mtni ∧s − Mtni−1 ∧s ) = Xsn .
i:tn
i−1 ≤s


On a ensuite

Lemme 6.2 Le processus X n vérifie une propriété de Cauchy dans L2 :

lim E[(Xtn − Xtm )2 ] = 0.


n,m→+∞

Démonstration : Notons que comme les subdivisions sont emboitées, on peut écrire
pn pn
X X X
Mtn
i−1
(M − M
tn
i tn
i−1
)= Mtni−1 (Mtm
j
− Mtm
j−1
).
i=1 i=1 tm n m
j ∈]ti−1 ,tj ]

Avec des calculs (fastidieux. . . ) qui utilisent la propriété de martingale pour n ≤ m :

E (Xtn − Xtm )2
 
6.3. Variation quadratique d’une martingale locale 99
 !2 
pn pm
X X
= E Mtni−1 (Mtni − Mtni−1 ) − Mtm
j−1
(Mtm
j
− Mtm
j−1
) 
i=1 j=1
 2 
pn
X X
= E  (Mtni−1 − Mtm
j−1
)(Mtm
j
− Mtm
j−1
)  (les partitions sont emboitées)
i=1 tm n n
j ∈]ti−1 ,ti ]
 2 
pn
X X
= E  (Mtni−1 − Mtm
j−1
)(Mtm
j
− Mtm
j−1
)  (prop. de martingale)
i=1 tm n n
j ∈]ti−1 ,ti ]

(la propriété de martingale annule les termes croisés du carré de la somme)


pn h i
X X
2 2
= E (Mtni−1 − Mtm
j−1
) (M m
tj − M m
tj−1 ) (prop. de martingale)
i=1 tm n n
j ∈]ti−1 ,ti ]

(à nouveau, la propriéte de martingale annule les termes croisés du carré de la somme)
pn h i
X X
2 2
= E (Mtni−1 − Mtm j−1
) E[(M m
tj − M m
tj−1 ) |F m
tj−1 ]
i=1 tm n n
j ∈]ti−1 ,ti ]

(car Mtni−1 , Mtm


j−1
sont Ftm
j−1
-mesurables avec tni−1 < tm
j )
pn h i
X X
2 2 2
= E (Mti−1 − Mtj−1 ) (Mtm
n m
j
− Mtmj−1
) (prop. de martingale)
i=1 tm n n
j ∈]ti−1 ,ti ]
pn  
X X
2 2 2
≤ E sup{(Mtni−1 − Mtm
j−1
) } (Mtm
j
− Mtm
j−1
)
i,j
i=1 tm n n
j ∈]ti−1 ,ti ]
pm
" #
X
2
= E sup{(Mtni−1 − Mtm
j−1
)} (Mt2m
j
− Mt2m
j−1
)
i,j
j=1
 
2
= E sup{(Mtni−1 − Mtm
j−1
)} Mt2 −→n,m→+∞ 0
i,j

où la dernière convergence vient par convergence dominée en utilisant que M est bornée (par
hypothèse) et limn,m→+∞ sup1≤i≤p, 1≤j≤pm (Mtni−1 −Mtmj−1
) = 0 par continuité des trajectoires
de M . On a donc établi
lim E (Xtn − Xtm )2 = 0.
 
n,m→+∞


L’inégalité de Doob (Proposition 5.8) donne alors
h i
n m 2
lim E sup(Xs − Xs ) = 0. (6.4)
n,m→+∞ s≤t
100 Chapitre 6. JCB
c – M2 Math. – Université de Rennes 1

On peut alors extraire une sous-suite (nk )k≥0 telle que


h
nk nk+1 2
i1/2 1
E sup(Xs − Xs ) ≤ k.
s≤t 2

Avec l’inégalité de Cauchy-Schwarz, il vient alors


" +∞ # +∞  1/2 X+∞
X
nk nk+1
X
nk nk+1 2 1
E sup |Xs − Xs | ≤ E sup(Xs − Xs ) ≤ k
< +∞.
k=1
s≤t
k=1
s≤t
k=0
2

On en déduit que ps
+∞
X
sup |Xsnk − Xsnk+1 | < +∞.
s≤t
k=1

Presque sûrement, la suite (Xsnk )s∈[0,t] converge donc uniformément sur [0, t] vers une limite
qu’on note (Ys )s∈[0,t] . Sur l’ensemble négligeable où il n’y a pas convergence, on impose
Ys ≡ 0. Le processus limite (Ys )s∈[0,t] a alors des trajectoires continues.
Comme d’après (6.4) (Xsn )s∈[0,t] est une suite de Cauchy dans L2 , on a aussi la convergence
Xsn → Ys dans L2 quand n → +∞. En passant à la limite L2 dans l’égalité de martingale
pour X n aux dates s et r,
Xsn = E Xrn |Fs , s ≤ r,
 

on voit alors que Y est une martingale sur [0, t] :

Ys = E[Yr |Fs ], s ≤ r.

Finalement, X nk converge ps uniformément sur [0, t] vers un Y = (Ys )0≤s≤t qui est à
trajectoires continues. Le processus Y est donc une martingale continue.
Puis par un calcul simple, pour tout n ≥ 1 et j ∈ {1, . . . , pn },
j
X
Mt2nj − 2Xtnnj = (Mtni − Mtni−1 )2 . (6.5)
i=1

Pj Pj
En effet Xtnnj = i=1 Mtni−1 (Mtni − Mtni−1 ) = i=1 Mtni−1 Mtni − Mt2ni−1 et donc

j j
X X
Mt2nj − 2Xtnnj = Mt2nj + 2 Mt2ni−1 − 2 Mtni−1 Mtni
i=1 i=1
j j j
X X X
= Mt2ni + Mt2ni−1 −2 Mtni−1 Mtni
i=1 i=1 i=1
j
X
Mt2ni + Mt2ni−1 − 2Mtni−1 Mtni

=
i=1
6.3. Variation quadratique d’une martingale locale 101

j
X 2
= Mtni − Mtni−1 .
i=1

Donc le processus M 2 − 2X n est croissant le long de la subdivision {tni : 0 ≤ i ≤ pn }. En


passant à la limite avec la sous-suite nk → +∞ trouvée précédemment, par continuité, la
fonction s ∈ [0, t] 7→ Ms2 − 2Ys est ps croissante sur [0, t].
On pose alors, pour s ∈ [0, t], hM, M is = Ms2 − 2Ys (avec, par convention, hM, M is ≡ 0
sur l’ensemble de probabilité nulle où la fonction t 7→ Mt2 − 2Yt n’est pas croissante).
Ainsi, hM, M i est un processus croissant et Ms2 − hM, M is = 2Ys est une martingale, sur
l’intervalle de temps [0, t].
Rappelons que t est fixé depuis le début de l’argument. Pour étendre la définition de
hM, M is à tout s ∈ R+ , on applique ce qui précède avec t = k pour tout entier k ≥ 1, en
remarquant que, par unicité, le processus obtenu avec t = k doit être la restriction à [0, k]
de celui obtenu avec t = k + 1. On a ainsi construit un processus hM, M it , t ≥ 0, croissant
vérifiant (6.2) (c’est même une martingale L2 sur R+ ).
La partie unicité montre aussi que le processus hM, M it ne dépend pas de la suite de
subdivisions choisies pour le construire. On déduit alors de (6.5) (avec j = pn ) que pour
tout t > 0, pour n’importe quelle suite de subdivisions emboitées de [0, t] de pas tendant
vers 0, on a
pn
X
2
L - lim (Mtnj − Mtnj−1 )2 = hM, M it
n→+∞
j=1
2
dans L . Cela achève la preuve du théorème dans le cas borné.
Considérons maintenant une martingale locale générale qu’on écrit sous la forme Mt =
M0 + Nt . On a donc Mt2 = M02 + 2M0 Nt + Nt2 et en remarquant que M0 Nt est une
martingale locale (car N en est une et M0 est F0 -mesurable), on ne perd pas en généralité
en supposant (ce qu’on fait) M0 = 0. On pose alors

Tn = inf t ≥ 0 : |Mt | ≥ n ,

et on applique le résultat vu dans le cas borné aux martingales bornées M Tn . Notons


(n+1)
A(n) = hM Tn , M Tn i le processus associé à M Tn . D’après l’unicité, les processus At∧Tn et
(n)
At sont indistinguables. On en déduit qu’il existe un processus croissant A tel que, pour
(n) 2
tout n, At∧Tn et At sont indistinguables. Par construction du cas borné, Mt∧T n
− At∧Tn =
2 Tn 2
(Mt − At ) est une martingale, c’est à dire Mt − At est une martingale locale.
On prend alors hM, M it = At et cela termine la preuve de la partie existence.
Enfin, la deuxième partie du théorème reste vraie dans le cas d’une martingale locale :
en effet, si on remplace M et hM, M it par M Tn et hM Tn , M Tn it = hM, M iTt n (en anticipant
la proposition suivante), alors le cas borné assure :
pn
X 2
hM, M it∧Tn = P- lim MtTnin − MtTni−1
n
n→+∞
i=1
102 Chapitre 6. JCB
c – M2 Math. – Université de Rennes 1

(même avec convergence dans L2 ). On conclut en observant que, pour tout t > 0, on a
P(t ≤ Tn ) → 1, quand n → +∞, ce qui affaiblit la convergence L2 en une convergence en
probabilité : soit ε > 0, posons
( pn
)
X
An (ε) = hM, M it − (Mtni − Mtni−1 )2 ≥ ε


i=1

alors P(An (ε)) = P(An (ε), t ≤ Tn ) + P(An (ε), Tn < t) avec P(An (ε), Tn < t) ≤ P(Tn < t) →
0 et
( pn
)
X
An (ε) ∩ {t ≤ Tn } = hM, M it∧Tn − (MtTnin − MtTni−1
n
)2 ≥ ε ∩ {t ≤ Tn }.


i=1

Il vient
pn
!
X
lim P(An (ε)) ≤ lim P(Tn < t)+ lim P hM, M it∧Tn − (MtTnin − MtTni−1
n
)2 ≥ ε = 0

n→+∞ n→+∞ n→+∞
i=1
Ppn
ie. P- limn→+∞ i=1 (Mti
n − Mtni−1 )2 = hM, M it . 

Proposition 6.13 (Crochet et arrêt) Si T est un temps d’arrêt, alors on a

hM T , M T it = hM, M iTt .

Démonstration : Cela vient de ce que

(MtT )2 − hM, M iTt = Mt∧T


2
− hM, M it∧T = (M 2 − hM, M i)Tt

est une martingale locale comme martingale locale arrêtée. Par conséquent le crochet arrêté
hM, M iT vérifie la propriété/définition de hM T , M T i. Par unicité du crochet, on doit avoir
hM T , M T i = hM, M iT . 

Le théorème suivant montre comment les propriétés d’une martingale locale M sont liées à
celles de sa variation quadratique hM, M i. Ainsi, les intervalles sur lesquels M est constante
sont exactement ceux sur lesquels hM, M i est constant. Si A est un processus croissant, on
note A∞ la limite croissante de At quand t → +∞.

Théorème 6.3 Soit M une martingale locale (continue) avec M0 = 0.


 
1. Si M est une (vraie) martingale bornée dans L2 , alors E hM, M i∞ < +∞, et Mt2 −
hM, M it est une martingale uniformément intégrable.
 
2. Réciproquement, si E hM, M i∞ < +∞, alors M est une (vraie) martingale bornée
dans L2 (donc uniformément intégrable).
3. Il y a équivalence entre :
6.3. Variation quadratique d’une martingale locale 103
 
(a) M est une (vraie) martingale de carré intégrable (ie. E Mt2 < +∞ pour tout
t ≥ 0).
 
(b) E hM, M it < +∞ pour tout t ≥ 0.
De plus si ces conditions sont satisfaites, Mt2 − hM, M it est une martingale.

Remarque 6.7 Dans la partie 1) de l’énoncé, il est essentiel de supposer que M est une
martingale, et pas seulement une martingale locale car on utilise l’inégalité de Doob et elle
n’est pas valable pour une martingale locale.

Démonstration : 1) Si M est une martingale (continue) bornée dans L2 , l’inégalité de


Doob avec p = q = 2 donne
h i
E sup Mt2 ≤ 4 sup E Mt2 < +∞.
 
t≥0 t≥0

En particulier, M est une martingale uniformément intégrable qui converge (ps et, par
convergence dominée, dans L2 ) vers une limite M∞ ∈ L2 quand t → +∞. Pour tout entier
n ≥ 1, on pose 
Sn = inf t ≥ 0 : hM, M it ≥ n .
Alors Sn est un temps d’arrêt et hM, M it∧Sn ≤ n. On en déduit que la martingale locale
2
Mt∧S n
− hM, M it∧Sn est dominée par la variable intégrable n + supt≥0 Mt2 . D’après la Pro-
position 6.11, cette martingale locale est donc une vraie martingale. Par la propriété de
martingale, comme elle est nulle en 0, on a
 2   2 
E Mt∧S n
− hM, M it∧Sn = E M0∧S n
− hM, M i0∧Sn = 0,

soit    2 
E hM, M it∧Sn = E Mt∧Sn
.
En faisant tendre t → +∞ (avec le théorème de convergence monotone pour le terme de
gauche, le théorème de convergence dominée pour celui de droite), on trouve

E hM, M iSn = E MS2n .


   

Puis comme Sn % +∞, en faisant tendre n → +∞, on trouve de la même façon (conver-
gences monotone et dominée)
   2
E hM, M i∞ = E M∞ < +∞.

De plus comme la martingale locale Mt2 − hM, M it est dominée par la variable intégrable
supt≥0 Mt2 +hM, M i∞ , c’est donc une (vraie) martingale uniformément intégrable (toujours
par la Prop. 6.11)).
  
2) On suppose maintenant E hM, M i∞ < +∞. Avec Tn = inf t ≥ 0 : |Mt | ≥ n ,
M Tn est bornée donc c’est une vraie martingale bornée. De plus, la martingale locale
2
Mt∧T n
− hM, M iTt n est aussi une vraie martingale uniformément intégrable, car elle est
104 Chapitre 6. JCB
c – M2 Math. – Université de Rennes 1

dominée par la variable aléatoire intégrable n2 + hM, M i∞ (cf. encore Prop. 6.11)).
Soit S un temps d’arrêt fini ps. D’après le Théorème 5.4 (théorème d’arrêt), appliqué à la
martingale uniformément intégrable Mt∧T 2
n
− hM, M iTt n avec S ≥ 0, on a
 2   
E MS∧T n
= E hM, M i S∧T n .
Par le lemme de Fatou, on a alors (en utilisant S fini ps) :
E MS2 = E lim inf MS∧T
2
     2     
n
≤ lim inf E MS∧T n
= lim inf E hM, M iS∧Tn ≤ E hM, M i∞ .
n n n

La famille {MS : S temps d’arrêt fini} est donc bornée dans L2 et par conséquent unifor-
mément intégrable. En particulier avec la suite
 des temps d’arrêt bornés Tn , en passant à
1 Tn
la limite L quand n → +∞ dans l’égalité E Mt∧Tn |Fs = Ms (pour s ≤ t) on en déduit
que M est une vraie martingale. De plus, M est bornée dans L2 car {Ms , s ≥ 0} est une
sous-famille de {MS : S temps d’arrêt fini} qui est bornée dans L2 .
 
3) Soit a > 0. D’après 1) et 2), on a E hM, M ia < +∞ si et seulement si Mta est une vraie
martingale de carré intégrable. L’équivalence de (a) et (b) suit alors facilement. Enfin, si
2
ces conditions sont remplies, 1) montre que Mt∧a − hM, M it∧a est une vraie martingale, ce
qui prouve le 3) car a est quelconque et peut être choisi arbitrairement grand. 

Corollaire 6.1 Soit M une martingale locale continue telle que M0 = 0. Alors on a
hM, M it = 0 ps pour tout t ≥ 0 si et seulement si M est indistinguable de 0.

Démonstration : Supposons hM, M it = 0 ps pour tout t ≥ 0. D’après les parties


1) et 2) du théorème ci-dessus, Mt2 est une martingale uniformément intégrable, d’où
E[Mt2 ] = E[M02 ] = 0. Le processus nul est une modification de M . Commes les deux
sont à trajectoires continues, ils sont indistingables. 

Crochet de deux martingales locales


Si M et N sont deux martingales locales, on définit leur crochet par polarisation en posant :
1 
hM, N it = hM + N, M + N it − hM, M it − hN, N it .
2
Proposition 6.14
1. hM, N i est l’unique (à indistinguabilité près) processus à variation finie tel que Mt Nt −
hM, N it soit une martingale locale.
2. Si 0 = tn0 < tn1 < · · · < tnpn = t est une suite de subdivisions emboitées de [0, t] de pas
tendant vers 0, on a, au sens de la convergence en probabilité,
pn
X
P- lim (Mtni − Mtni−1 )(Ntni − Ntni−1 ) = hM, N it .
n→+∞
i=1
6.3. Variation quadratique d’une martingale locale 105

3. L’application (M, N ) 7→ hM, N i est bilinéaire symétrique.


4. (arrêt) Pour tout temps d’arrêt T ,

hM T , N T it = hM T , N it = hM, N it∧T . (6.6)

Démonstration : 1) découle de la caractérisation analogue dans le Théorème 6.2 avec la


polarisation du produit réel (et l’unicité découle du Théorème 6.1).
2) est de même une conséquence de l’affirmation analogue dans le Théorème 6.2 par pola-
risation.
3) découle, par exemple, de l’expression 2).
Enfin, on peut voir 4) comme une conséquence de la propriété 2), en observant que cette
propriété entraı̂ne ps

hM T , N T it = hM T , N it = hM, N it sur {T ≥ t},


hM T , N T it − hM T , N T is = hM T , N it − hM T , N is = 0 sur {T ≤ s < t}.

Proposition 6.15 Soient M1 , M2 deux martingales locales issues de 0. On a M1 = M2


ssi pour toute martingale locale N , on a hM1 , N i = hM2 , N i.

Démonstration : Il suffit de choisir N = M1 − M2 pour avoir hM1 − M2 , M1 − M2 i = 0,


c’est à dire M1 − M2 est constante donc nulle. 

Le résultat suivant est une sorte de généralisation de l’inégalité de Cauchy-Schwarz aux


intégrales par rapport à un crochet de martingales locales.

Proposition 6.16 (Inégalité de Kunita-Watanabe) Soient M et N deux martingales


locales et H et K deux processus progressivement mesurables. Alors pour tout t ≥ 0 :
Z t Z t 1/2 Z t 1/2
|Hs | |Ks | |dhM, N is | ≤ Hs2 dhM, M is Ks2 dhN, N is . (6.7)
0 0 0

Conséquence : Avec H = K = 1, on a |hM, N i|2 ≤ hM, M ihN, N i.


Démonstration : Par le théorème de convergence monotone, il suffit de voir le résultat
pour H, K processus mesurables bornés. Quitte à remplacer K par gKsgn(HK), où g =
d(hM, N i)/d|hM,
R +∞ N i| est la densité de Radon-Nikodym à valeurs
R +∞dans {−1, +1}, on peut
remplacer 0 |Hs | |Ks | |dhM, N is | à gauche dans (6.7) par 0 Hs Ks dhM, N is .
Notons hM, N is,t = hM, N it − hM, N is . On commence par remarquer que ps pour tous
s < t rationnels (donc aussi par continuité pour tous s < t) on a
q q
|hM, N is,t | ≤ hM, M is,t hN, N is,t . (6.8)
106 Chapitre 6. JCB
c – M2 Math. – Université de Rennes 1

En effet, cela découle des approximations en probabilité de hM, M i et hM, N i données


respectivement dans le Théorème 6.2 et la Proposition 6.14, ainsi que de l’inégalité de
Cauchy-Schwarz (classique pour les sommes) :
pn
!2 pn pn
X X X
2
(Mti − Mti−1 )(Nti − Nti−1 )
n n n n ≤ (Mti − Mti−1 )
n n (Ntni − Ntni−1 )2
i=1 i=1 i=1

où (tni )i=1,...,n est une partition de [t, s]. À la limite n → +∞, on obtient bien (6.8).
Dans la suite on fixe un ω ∈ Ω pour lequel (6.8)
R t est vraie pour tout s < t et on raisonne
pour ce ω presque sûr. L’interprétation de s |dhM, N iu | comme variation finie par la
Proposition 6.3 donne aussi
Z t q q
|dhM, N iu | ≤ hM, M is,t hN, N is,t . (6.9)
s

En effet, pour une subdivision s = t0 < t1 < · · · < tp = t, on a


p p q q
X X
|hM, N iti−1 ,ti | ≤ hM, M iti−1 ,ti hN, N iti−1 ,ti
i=1 i=1
p
!1/2 p
!1/2
X X
≤ hM, M iti−1 ,ti hN, N iti−1 ,ti
i=1 i=1
q q
≤ hM, M is,t hN, N is,t .

Soient maintenant H, K des processus progressifs simples. Quitte à raffiner les partitions
définissant H et K, on peut trouver 0 = t0 < t1 < · · · < tn < +∞ et h0 , . . . , hn , k0 , . . . , kn
telles que hi , ki ∈ L∞ (Fti ), et pour lesquels
n−1
X n−1
X
H = h0 1{0} + hi 1]ti ,ti+1 ] , K = k0 1{0} + ki 1]ti ,ti+1 ] .
i=0 i=0

On a alors
Z t n−1 Z ti+1 n−1 Z ti+1
X X
Hs Ks dhM, N is =

hi k i dhM, N is

≤ |hi | |ki | dhM, N i s


0
i=0 ti
i=0 ti
n−1
X Z ti+1 1/2 Z ti+1 1/2
≤ |hi | |ki | dhM, M is dhN, N is
i=0 ti ti
n−1
X Z ti+1 1/2 Z ti+1 1/2
= h2i dhM, M is ki2 dhN, N is
i=0 ti ti

n−1 Z
!1/2 n−1 Z
!1/2
X ti+1 X ti+1
≤ h2i dhM, M is ki2 dhN, N is
i=0 ti i=0 ti
6.4. Semimartingales continues 107
Z t 1/2 Z t 1/2
= Hs dhM, M is Ks dhN, N is .
0 0

Quand H et K sont des processus progressifs bornés, on peut les approximer par deux
suites de processus simples (Hn )n≥1 et (Kn )n≥1 qui convergent vers H et K en restant
bornées. On conclut alors par le théorème de convergence dominée. 

6.4 Semimartingales continues


Les semimartingales forment la classe la plus générale de processus considérés pour construire
une intégrale stochastique.

Définition 6.6 (Semimartingale) Un processus X = (Xt )t≥0 est une semimartingale


continue s’il s’écrit sous la forme Xt = X0 + Mt + At où M est une martingale locale (issue
de 0) et A est un processus à variation finie.

Toujours grâce au Théorème 6.1, la décomposition ci-dessus est unique à indistinguabilité


près. Si Yt = Y0 + Mt0 + A0t est une autre semimartingale continue, on pose par définition

hX, Y it := hM, M 0 it .

En particulier, hX, Xit = hM, M it .

Proposition 6.17 Soient X, Y deux semimartingales et 0 = tn0 < tn1 < · · · < tnpn = t
une suite de subdivisions emboitées de [0, t] de pas tendant vers 0. Alors, au sens de la
convergence en probabilité :
pn
X  
P- lim Xtni − Xtni−1 Ytni − Ytni−1 = hX, Y it .
n→+∞
i=1

Remarque 6.8 En particulier, si X ou Y est à variation bornée, alors hX, Y i ≡ 0. En


effet, si par exemple X est à variation bornée, on a
p pn
X n X
(Xti − Xti−1 )(Yti − Yti−1 ) ≤ |Xtni − Xtni−1 | sup |Ytni − Ytni−1 |
n n n n

i=1,...,pn
i=1 i=1
 Z t
≤ sup |Ytni − Ytni−1 | |dXs | → 0
i=1,...,pn 0

Rt
car 0 |dXs | est bornée (processus à variation bornée) et supi=1,...,pn |Ytni − Ytni−1 | → 0 par
continuité des trajectoires de Y .
108 Chapitre 6. JCB
c – M2 Math. – Université de Rennes 1

Démonstration : Pour simplifier, on suppose X = Y . Le cas général s’obtient ensuite


facilement par polarisation. Alors,
pn pn pn
X 2 X 2 X 2
Xtni − Xtni−1 = Mtni − Mtni−1 + Atni − Atni−1
i=1 i=1 i=1
pn
X 
+2 Mtni − Mtni−1 )(Atni − Atni−1 .
i=1

Le Théorème 6.2 donne déjà pour la martingale locale M :


pn
X 2
lim Mtni − Mtni−1 = hM, M it = hX, Xit .
n→+∞
i=1

Puis comme A est à variation finie (et M est continue), la Remarque 6.8 s’applique pour
donner
pn
X 
lim Mtni − Mtni−1 )(Atni − Atni−1 = hM, Ait = 0,
n→+∞
i=1
pn
X 2
lim Atni − Atni−1 = hA, Ait = 0.
n→+∞
i=1

Les principaux résultats d’intégration contre un crochet de martingales locales restent vrais
contre un crochet de semimartingales, en particulier :

Proposition 6.18 (Inégalité de Kunita-Watanabe) Soient X, Y deux semimartingales


et H, K deux processus localement bornés (pour tout t, sups≤t |Hs | < +∞, idem pour K).
Alors ps pour t ≥ 0 :
Z +∞ Z +∞ 1/2 Z +∞ 1/2
|Hs | |Ks | |dhX, Y is | ≤ Hs2 dhX, Xis Ks2 dhY, Y is .
0 0 0
Troisième partie

Intégration stochastique

109
Chapitre 7

Intégrale d’Itô

On introduit dans ce chapitre le calcul stochastique d’Itô. Il s’agit d’un calcul différentiel
trajectoriel (c’est à dire sur les trajectoires des processus) et pas en loi. Dans ce chapitre,
le but est de définir des intégrales par rapport à une trajectoire du mouvement brownien
B = (Bt )t≥0 . On généralisera encore au Chapitre 8.

7.1 Un premier pas vers la formule d’Itô


Pour commencer, rappelons la règle de dérivation des composées lorsque F et g sont
des fonctions de R dans R de classe C 1 (dérivable suffit) :

(F ◦ g)0 (t) = F 0 g(t) g 0 (t)




dont en déduit immédiatement


Z t
F 0 g(s) g 0 (s)ds.
  
F g(t) = F g(0) + (7.1)
0

En fait, en utilisant l’intégrale de Stieltjes, (7.1) est encore valable lorsque g est seulement
à variation finie et se réécrit :
Z t
F 0 g(s) dg(s).
  
F g(t) = F g(0) + (7.2)
0

Malheureusement, la formule (7.2) n’est pas valable pour g(t) = Bt puisque la trajectoire
brownienne t 7→ Bt n’est ps pas à variation finie (voir Prop. 4.8).
Cependant le calcul d’Itô va permettre de donner un sens à une intégrale par rapport à B
et on va donner un sens à (7.2) lorsque f est C 2 en rajoutant un terme (dû au fait que B
est à variation quadratique finie, cf. Prop. 4.7), voir la formule d’Itô (Th. 9.1).
Cas jouet de la fonction F (x) = x2 . Lorsque F (x) = x2 , une version Itô de (7.2) est
donnée par la formule suivante :

111
112 Chapitre 7. JCB
c – M2 Math. – Université de Rennes 1

Proposition 7.1 Soit B un mouvement brownien standard. On a ps, pour tout t :


Z t
2
Bt = 2 Bs dBs + t
0
Rt Pn
où on a posé par définition l’intégrale stochastique 0
Bs dBs comme la limite ps de j=1 Btni−1 (Btni −
Btni−1 ). La convergence a lieu aussi dans L2 .

Ce résultat est à comparer avec les analogues (7.1) pour une fronctin g de classe C 1 ou
(7.2) pour une fonction g à variation finie (nulle en 0) :
Z t Z t
2 0
g(t) = 2 g(s)g (s)ds = 2 g(s)dg(s).
0 0

Dans ces cas, il n’y a pas de terme d’ordre 2 car la variation quadratique de g ∈ C 1 ou à
variation finie est nulle.
Démonstration : On considère la partition {tni ; i = 0, . . . , n} de [0, t] (uniforme avec
tni = it/n pour avoir la convergence uniforme ps, cf. Prop. 4.7). Par une transformation
d’Abel, on a :
n
X
Bt2 Bt2ni − Bt2ni−1

=
j=1
X n n
X
= 2 B tn
i−1
(B − B
tn
i tn
i−1
)+ (Btni − Btni−1 )2 .
j=1 j=1

Le deuxième terme converge (ps et dans L2 ) vers la variation quadratique de B sur [0, t],
soit t.
Par suite, le premier
Rt terme converge ps et dans L2 . Sa limite est par définition l’intégrale
stochastique 0 Bs dBs . 

Remarque 7.1 (Lien avec l’équation de la Chaleur) À partir de l’équation de la cha-


leur (Section 4.7), on a vu que pour toute fonction régulière f , on a l’égalité suivante en
moyenne :
Z t  
1 00 0
E[f (t, x + Bt )] = f (0, x) + E fxx (s, x + Bs ) + ft (s, x + Bs ) ds.
0 2
Comme dans le cas des fonctions à variations finies, nous pouvons obtenir une représenta-
tion vérifiée trajectoriellement, pour presque toute les réalisations possibles des trajectoires.
Nous nous intéressons donc à la description de la fonction aléatoire continue
Z t
1 00
T (f ) = f (t, x + Bt ) − f (0, x) − fxx (s, x + Bs ) + ft0 (s, x + Bs )ds.
0 2
7.1. Un premier pas vers la formule d’Itô 113

Lorsque f est une fonction linéaire par rapport à x, nous avons déjà vu que cette différence
s’interprète comme un objet qu’on a défini comme étant une intégrale stochastique. Dans le
cas général, que nous considérons maintenant, cette différence s’interprète comme l’intégrale
stochastique d’un processus lui même stochastique.

Le calcul différentiel s’étend à d’autres fonctions que la fonction f (x) = x2 pour laquelle la
Prop. 7.1 donne une formule d’Itô (noter bien qu’avec f (x) = x2 , f (Bt ) = Bt2 ). Ce calcul
est nécessaire pour représenter trajectoriellement les variations infinitésimales de f (x+Bt ).
Mais à la formule classique du cas déterministe, il faut ajouter un terme supplémentaire,
dû au fait que la variation quadratique limite n’est pas nulle.

Théorème 7.1 (Formule d’Itô) Soit f ∈ Cb2 (R) une fonction bornée à dérivées pre-
mières et secondes continues et bornées. Alors ps pour tout t ∈ R+ , on a
Z t
1 t 00
Z
0
f (x + Bt ) = f (x) + f (x + Bs ) dBs + f (x + Bs ) ds.
0 2 0
Rt
Le terme 0 f 0 (x + Bs )dBs s’appelle l’intégrale stochastique de f 0 (x + Bs ) par rapport au
mouvement brownien B. C’est un processus stochastique à trajectoires continues. Il est
défini comme la limite dans L2 des sommes de type sommes de Riemann
pn
X
S τ (f, W ) = f 0 (x + Btni−1 )(Btni − Btni−1 )
i=1

lorsque le pas de la subdivision τn = {0 = tn0 < · · · < tnpn = t} tend vers 0.

Démonstration :
a) On considère un temps t > 0 fixé et une partition τn = {tnk : 0 ≤ k ≤ pn } de [0, t].
D’après la formule de Taylor-Lagrange à l’ordre 2, on peut écrire
pn pn
X
0 1 X 00 n
f (x + Bt ) = f (x) + f (x + Btni−1 )(Btni − Btni−1 ) + f (ζi )(Btni − Btni−1 )2 (7.3)
i=1
2 i=1

où ζin ∈]x + Btni , x + Btni−1 [ est un point aléatoire de l’intervalle aléatoire ]x + Btni , x + Btni−1 [.
On étudie d’abord la limite du 3ème terme
p
X n
Xn
00 n 2 00 2
f (ζi )(Btni − Btni−1 ) − f (x + Btni−1 )(Btni − Btni−1 )



i=1 i=1
p
X n
00 n 00 2
= (f (ζi ) − f (x + Btni−1 ))(Btni − Btni−1 )


i=1
114 Chapitre 7. JCB
c – M2 Math. – Université de Rennes 1

pn
X
≤ sup |f 00 (ζin ) − f 00 (x + Btni−1 )| (Btni − Btni−1 )2 .
1≤i≤pn
i=1

Mais par uniforme continuité de f 00

lim sup |f 00 (ζin ) − f 00 (x + Btni−1 )| = 0


n→+∞ 1≤i≤pn

et comme la variation quadratique de B (converge vers t), cette majoration tend vers 0 ps.
La convergence a lieu aussi dans L2 car la variation quadratique converge aussi dans L2
donc est bornée et le théorème de convergence dominée s’applique.
b) D’après a), on se ramène à étudier
pn
X
An = f 00 (x + Btni−1 )(Btni − Btni−1 )2 .
i=1

Pour cela, on compare An à


pn
X
A
en = f 00 (x + Btni−1 )(tni − tni−1 ).
i=1

Notons M = sups∈[0,t] |f 00 (s)| la borne de la dérivée de f . Noter que

An = An−1 + f 00 (x + Btnpn −1 )(Btnpn − Btnpn −1 )2


A en−1 + f 00 (x + Btn )(tn − tn )
en = A
pn −1 pn pn −1
en−1 + f 00 (x + Btn ) (Btn − Btn )2 − (tnp − tnp −1 ) .

An − A
en = An−1 − A
pn −1 pn pn −1 n n

Noter que (Btnpn − Btnpn −1 )2 − (tnpn − tnpn −1 ) est une variable aléatoire centrée, de variance
2(tnpn − tnpn −1 )2 . De plus, par indépendance des accroissements de B, elle est indépendante
de f 00 (x + Btnpn −1 ) et de (An−1 − A en−1 ). On a alors

en )2
 
E (An − A
h 2 i
en−1 )2 + E fxx 00
(x + Btnpn −1 )2 (Btnpn − Btnpn −1 )2 − (tnpn − tnn−1 )
 
= E (An−1 − A
h i
+ 2E f 00 (x + Btnpn −1 )[(Btnpn − Btnpn −1 )2 − (tnpn − tnpn −1 )](An−1 − Aen−1 )
en−1 )2 ] + 2M 2 (tnp − tnp −1 )2
≤ E[(An−1 − A n n

où l’espérance du double produit est nulle par indépendance des variables aléatoires et
centrage de (Btnpn − Btnpn −1 )2 − (tnpn − tnpn −1 ).
Par récurrence sur n, il vient
pn pn
X X
2 2 n n 2 2
(tni − tni−1 ) = 2M 2 tδn → 0
 
E (An − An ) ≤ 2M
e (ti − ti−1 ) ≤ 2M δn
i=1 i=1
7.2. Intégrales d’Itô 115

qui converge vers 0.


en vers t f 00 (x + Bs )ds est une simple conséquence de la convergence
R
c) La convergence de A 0
des sommes de Riemann-Darboux vers l’intégrale de Riemann classique. Cette convergence
est ps d’après les propriétés de l’intégrale de Riemann.
Rt
Finalement, le 3ème terme de (7.3) converge vers 0 f 00 (x + Bs )ds.
d) Pour montrer que la convergence a lieu aussi dans L2 , il suffit de noter que les sommes
en et t f 00 (x + Bs )ds sont majorées en valeurs absolues par M t pour appliquer
R
partielles A 0
le théorème de convergence dominée et conclure à la convergence dans L2 .
2
e) Comme
R t le0 3ème terme de (7.3) converge ps et dans L , le 2ème terme converge aussi.
On note 0 f (x + Bs )dBs ce terme. Il s’agit d’une intégrale stochastique. 

Remarque. Cette formule s’étend sans problème (autre que technique) à des fonctions
f (t, x) dépendant du temps de façon régulière. La formule d’Itô devient
Z t Z t
1 t 00
Z
0 0
f (t, x+Bt ) = f (0, x)+ fx (s, x+Bs )dBs + ft (s, x+Bs )ds+ f (s, x+Bs )ds. (7.4)
0 0 2 0 xx
Remarque 7.2 Les fonctions u(t, x, f ) = E[f (x + Bt )] introduites dans le Chapitre 4 en
relation avec l’équation de la chaleur jouent un rôle très important.

7.2 Intégrales d’Itô


Le but de cette section est d’étendre la notion d’intégrale stochastique par rapport à un
mouvement brownien à une classe plus générale que les fonctions déterministes f de carré
intégrable vue au Chapitre 3 ou de la forme fx0 (s, x + Bs ) (cf. Th. 9.1).

Processus simples
Définition 7.1 Une fonction aléatoire adaptée ϕ est dite en escalier si elle est constante
par intervalles c’est à dire qu’elle s’écrit
n−1
X
ϕ(t, ω) = Xi (ω)1]ti ,ti+1 ] (t) (7.5)
i=0

où Xi est une variable aléatoire Fti -mesurable.


Si en plus pour chaque 0 ≤ i ≤ n − 1, E[Xi2 ] < +∞, ϕ est dite de carré intégrable.
L’ensemble des fonctions aléatoires adaptées, en escalier et carré intégrable est notée S.

On notera L2 (Ω × R+ ) l’ensemble des processus stochastiques adaptés de carré intégrable


au sens de Z 
2
E ϕ (t, ω)dt < +∞. (7.6)
R+
116 Chapitre 7. JCB
c – M2 Math. – Université de Rennes 1

L’ensemble L2 (Ω × R+ ) contient S et c’est un espace de Hilbert pour le produit scalaire


associé à la norme (7.6) :
Z 
hφ, ϕiL2 (Ω×R+ ) = E φ(t, ω)ϕ(t, ω)dt .
R+

Comme dans le cas déterministe les fonctions en escalier jouent un rôle important car elles
sont denses dans L2 (Ω×R+ ). Les preuves se font donc d’abord pour les fonctions en escalier
puis par passage à la limite pour toutes les fonctions de L2 (Ω × R+ ). Pour ϕ ∈ L2 (Ω × R+ ),
on note
pn
X
Pn ϕ(ω, t) = lim ϕtni (ω)1]tni ,tni−1 ] (t).
n→+∞
i=1

On a Pn ϕ ∈ S et Pn ϕ → ϕ dans L2 (Ω × R).

Proposition 7.2 (Densité) L’ensemble S forme un sous-ensemble dense dans l’espace


hilbertien L2 (Ω × R+ ).

Démonstration : Il suffit de montrer que si K ∈ L2 (Ω × R+ ) est orthogonal à S alors


K = 0. Supposons donc K orthogonal à S. Soient 0 ≤ s < t et soit F une variable aléatoire
Fs -mesurable bornée. Avec H = F 1]s,t] ∈ S, on a
 Z t 
E F Ku du = hH, KiL2 (Ω×R+ ) = 0. (7.7)
s

En posant
Z t
Xt = Ku du, t ≥ 0.
0

l’égalité (7.7) se réécrit E[F (Xt − Xs )] = 0 pour tous s < t et toute variable aléatoire
Fs -mesurable F bornée, ie. X = (Xt )t≥0 est en fait une martingale car en plus Xt ∈ L1
pour tout t ≥ 0, l’intégrale définissant Xt étant ps absolument convergente lorsque K ∈
L2 (Ω × R+ ) (appliquer par exemple l’inégalité de Cauchy-Schwarz).
D’autre part, X étant une intégrale contre un processus croissant est aussi un processus à
variation finie avec X0 = 0, le Théorème 6.1 exige alors d’avoir X = 0, ie.
Z t
Ku du = 0 ∀t ≥ 0 ps.
0

Rt R
Comme 0 = 0 Ku du = R Ku 1[0,t] (u) du, on en déduit que la mesure Ku du coı̈ncide avec
avec la mesure nulle sur les intervalles [0, t]. Par un argument de classe monotone, les deux
mesures sont égales et donc K = 0, ce qui établit la densité de S dans L2 (Ω × R+ ). 
7.2. Intégrales d’Itô 117

Intégrale d’Itô
Étant donnée une filtration F = (Ft )t≥0 , on considère un F-mouvement brownien B. En
particulier, B est adapté à la filtration : pour chaque t, Bt est Ft -mesurable. Le mouvement
brownien est indépendant de la tribu initiale F0 . Plus généralement, si la filtration F est
engendrée par un mouvement brownien et un autre processus indépendant, le mouvement
brownien reste un mouvement brownien pour cette grosse filtration.
Nous commencons par introduire l’intégrale de processus en escalier ϕ ∈ S, définie par
Z n
X
ϕ(t)dBt := Xi (Bti − Bti−1 ) (7.8)
i=1

lorsque ϕ = ni=1 Xi 1]ti−1 ,ti ] . La variable aléatoire ainsi définie est une combinaison linéaire
P
à coefficients aléatoires de variables aléatoires gaussiennes indépendantes. Elle n’est pas
gaussienne a priori mais ses moments d’ordre 1 et 2 ont des propriétés remarquables.

Proposition 7.3 Soit ϕ ∈ S une fonction en escalier et de carré intégrable. Alors


hZ i
E ϕ(t)dBt = 0,
h Z 2 i hZ i
2
E ϕ(t)dBt = E ϕ(t) dt . (7.9)

Démonstration : 1) La variable aléatoire Xi (Bti+1 − Bti ) est de carré intégrable comme


produit de deux variables aléatoires de carré intégrable et indépendantes. Elles sont d’es-
pérances nulles car un des termes du produit l’est. Sa variance est donc
h 2 i h 2 i
= E[Xi2 ]E Bti+1 − Bti = E[Xi2 ](ti+1 − ti ).

Var Xi (Bti+1 − Bti ) = E Xi (Bti+1 − Bti )

2) On déduit de suite, par linéarité, que


n
hX i Xn
 
E Xi (Bti+1 − Bti ) = E Xi (Bti+1 − Bti ) = 0.
i=1 i=1

Pn−1
3) Ensuite, pour calculer la variance de i=0 Xi (Bti+1 − Bti ), on a
n
X 
Var Xi (Bti+1 − Bti )
i=1
n h
X 2 i X h  i
= E Xi (Bti+1 − Bti ) +2 E Xi (Bti+1 − Bti ) Xj (Btj+1 − Btj ) .
i=1 1≤i≤j≤n
118 Chapitre 7. JCB
c – M2 Math. – Université de Rennes 1
 
Il faut donc calculer pour i < j les doubles produits E (Xi (Bti+1 − Bti ))(Xj (Btj+1 − Btj ))
qui sont nuls car (Btj+1 − Btj ) est indépendant (indépendance des accroissements de B) de
Ftj tribu par rapport à laquelle Xi Xj (Bti+1 − Bti ) est mesurable pour i < j. Ainsi
h  i
E Xi (Bti+1 − Bti ) Xj (Btj+1 − Btj )
h    i
= E E Xi (Bti+1 − Bti ) Xj (Btj+1 − Btj ) |Ftj
h  i
= E Xi (Bti+1 − Bti )Xj E Btj+1 − Btj |Ftj
h  i
= E Xi (Bti+1 − Bti )Xj E Btj+1 − Btj = 0.

Finalement, on a
h Z 2 i n
X 
E ϕ(t)dBt = Var Xi (Bti+1 − Bti )
i=1
n n
X 2  X
E[Xi2 ](ti+1 − ti )

= E Xi (Bti+1 − Bti ) =
i=1 i=1
n Z
X ti n Z
X ti
= E[Xi2 ]dt = E[ϕ(t)2 ]dt
ti−1 ti−1
Zi=1 hZ
i=1
i
= E[ϕ(t)2 ]dt = E ϕ(t)2 dt .

On peut maintenant définir l’intégrale des fonctions ϕ ∈ L2 (Ω × R+ ). C’est la construction


(à proprement parler) de l’intégrale d’Itô.

Théorème 7.2 (Intégrale d’Itô)


1. Soit B un mouvement brownien réel par rapport à une filtration (Ft )t∈R+ . À tout
processus adapté Rϕ ∈ L2 (Ω×R+ ), on associe de manière unique une variable aléatoire
intégrable notée ϕ(t)dBt telle que
hZ i
E ϕ(t)dBt = 0,
h Z 2 i hZ i
E ϕ(t)dBt = E ϕ(t)2 dt . (7.10)
Pn
Pour les processus aléatoires en escalier i=1 Xi 1]ti−1 ,ti ] , on retrouve
Z n−1
X
ϕ(t)dBt = Xi (Bti+1 − Bti ).
i=0
7.2. Intégrales d’Itô 119

2. Soit B = (B 1 , . . . , B d ) un mouvement brownien standard dans Rd par rapport à une


filtration (Ft )t≥0 . À tout processus aléatoire vectoriel adapté ϕ = (ϕ(1) , . . . , ϕ(d) ) avec
ϕ(i) ∈ RL2 (Ω × R+ ),Pon associe de manière unique une variable aléatoire intégrable
notée ϕ(t)dBt = di=1 ϕi (t)dBti telle que
R

hZ i h Z 2 i hZ i
E ϕ(t)dBt = 0, E ϕ(t)dBt =E kϕ(t)k2 dt .

Remarque 7.3 Noter que cette construction généralise celle de la Section 3.3 au Cha-
pitre 3 par rapport à un bruit blanc (BB). Désormais, on sait intégrer des fonctions aléa-
toires ϕ ∈ L2 (Ω × R+ ) plutôt que seulement des fonctions f ∈ L2 (R+ ) (déterministes). On
fera encore mieux au Chapitre ?? en intégrant contre une semi-martingale.

Démonstration : 1) Par la Prop. 7.2, il existe ϕn ∈ S qui converge vers ϕ dans L2 (Ω×R+ ).
Par l’isométrie (7.9) du cas en escalier, on a :
h Z Z 2 i
E ϕn (t)dBt − ϕm (t)dBt
h Z 2 i
= E (ϕn (t) − ϕm (t))dBt
hZ 2 i
= E ϕn (t) − ϕm (t) dt −→ 0, n, m → +∞
R
car ϕn converge vers ϕ dans L2 (Ω × R+ ). Ainsi, ϕn (t)dB R t est une suite de Cauchy dans
L2 (Ω). Sa limite existe donc et on la note par définition ϕ(t)dBt . R
La convergence dans L2 (Ω) entraı̂ne aussi la convergence des espérances donc ϕ(t)dBt
est centrée : hZ i hZ i
E ϕ(t)dBt = lim E ϕn (t)dBt = 0.
n→+∞

La convergence dans L2 (Ω) entraı̂ne également la convergence des moments d’ordre 2 donc
h Z 2 i h Z 2 i
lim E ϕn (t)dBt =E ϕ(t)dBt ) .
n→+∞

Mais h Z 2 i hZ i hZ i
2 2
E ϕn (t)dBt =E ϕn (t) dt → E ϕ(t) dt .

Il suit h Z 2 i hZ i
E ϕ(t)dBt =E ϕ(t)2 dt .
R
Pour conclure, il reste à noter que la variable aléatoire ϕ(t)dBt ne dépend pas du procédé
de construction utilisé mais seulement de ϕ. Pour cela, on procède comme d’habitude si
ϕn → ϕ et ϕen → ϕ mènent aux limites X et X, e alors on forme la suite ϕ
bn avec ϕb2n = ϕn
et ϕ
b2n+1 = ϕ
en . D’après le raisonnement précédent, il y a une limite X associée à la suite
b
120 Chapitre 7. JCB
c – M2 Math. – Université de Rennes 1

(ϕ̂n )n≥1 . Mais en considérant la suite des indices pairs (ϕb2n )n≥1 , on doit avoir X = X
b ps,
puis celle des indices impairs (ϕ b2n+1 )n≥0 , on doit avoir X
e=X b ps. Finalement, X = X e ps
et il y a bien unicité (ps) de la limite.
2) L’extension au cas vectoriel est immédiate, compte tenu de l’indépendance des accrois-
sements des différentes composantes pour les processus aléatoires simples.
On note que pour des B, B e des mouvements browniens indépendants et des fonctions ϕ et
φ adaptées :
h Z  Z i
E ϕ(t)dBt φ(t)dBt = 0.
e (7.11)

En effet, d’abord dans le cas simple, on a (quitte à raffiner les subdivisions on peut supposer
que les deux intégrales simples s’expriment sur la même) :
n
h X n
 X i
E Xti (Bti − Bti−1 ) et − B
Ytj (B j
et )
j−1
i=1 j=1
X n h i
= E Xti (Bti − Bti−1 )Ytj (B
et − B
j
et )
j−1
i,j=1
X n h  i
= E Xti (Bti − Bti−1 ) et − B
Yti (B i
et )
i−1
i=1
X h  i
+2 E Xti (Bti − Bti−1 ) et − B
Ytj (B j
et ) .
j−1
i<j

La première somme est nulle car Xti , Yti sont Fti−1 -mesurables donc indépendants de (Bti −
et − B
Bti−1 )(B et )
i i−1

h i
E Xti (Bti − Bti−1 )Yti (Bet − B
i
et )
i−1
h i h i
= E Xti Yti E (Bti − Bti−1 )(Bti − Bti−1 )
e e
h i h i h i
= E Xti Yti E (Bti − Bti−1 ) E (B et − B
i
et )
i−1

= 0.

Puis la deuxième est nulle car


h  i
E Xti (Bti − Bti−1 ) et − B
Ytj (B j
et )
j−1
h h   ii
= E E Xti (Bti − Bti−1 ) Ytj (Bet − B
j
et ) |Ft
j−1 j
h  h ii
= E Xti Ytj (Bti − Bti−1 ) E B et − B
j
et |Ft
j−1 j
h h ii
= E Xti Ytj (Bti − Bti−1 )E B et − B
j
et
j−1

= 0
7.3. Propriétés de l’intégrale d’Itô 121
 
car E B et − B
j
et
j−1
= 0. On a donc (7.11) dans le cas simple. La convergence dans L2
R R
d’intégrales simples vers ϕ(t)dBt et φ(t)dB et assure ensuite (7.11) en général.
Ainsi (pour d = 2) :
h Z Z 2 i
(1) (2)
E ϕ1 dBt + ϕ2 dBt
h Z 2  Z 2 Z  Z i
(1) (2) (1) (2)
= E ϕ1 dBt + ϕ2 dBt +2 ϕ1 dBt ϕ2 dBt
h Z 2 i Z 2 i h Z  Z i
(1) (2) (1) (2)
= E ϕ1 dBt +E ϕ2 dBt + 2E ϕ1 dBt ϕ2 dBt
hZ i hZ i
2 2
= E ϕ1 dt + E ϕ2 dt + 0
h Z i
= E kϕk2 dt .

7.3 Propriétés de l’intégrale d’Itô


D’abord notons que comme dans le cas déterministe où on associe une fonction (la
primitive) à l’objet intégrale, on peut associer un processus à l’intégrale stochastique d’une
fonction ϕ. Il suffit de considérer l’intégrale de ϕt = ϕ × 1[0,t] et donc l’intégrale
Z t
Bt (ϕ) := B(ϕt ) = ϕ(s)dBs .
0
Rt 
On cherche maintenant quelles sont les propriétés du processus 0
ϕ(s)dBs t≥0
. L’idée
systématique est de voir ces propriétés dans le cas de fonction ϕ en escalier (7.5) et de
passer à la limite en se servant de l’isométrie L2 donnée par (7.10).
Rt 
Proposition 7.4 Soit ϕ ∈ L2 (Ω × [0, T ]) alors 0 ϕ(s)dBs ; t ∈ [0, T ] est un processus
à trajectoires continues, adapté et tel que pour toute fonction hA (s) = 1A 1]u,v] (s) avec
A ∈ Fu , on a Z t Z t∧v
1A 1]u,v] (s)ϕ(s)dBs = 1A ϕ(s)dBs . (7.12)
0 t∧u
Pn−1
Démonstration : 1) Si ϕ = i=0 Xi 1]ti ,ti+1 ] ∈ S est simple de carré intégrable alors
Z t n−1 Z
X t
1A 1]u,v] (s)ϕ(s)dBs = (1A Xi )1]u,v] (s)1]ti ,ti+1 ] (s)dBs
0 i=0 0
n−1 Z t
X
= (1A Xi )1]u∨ti ,v∧ti+1 ] (s)dBs
i=0 0
122 Chapitre 7. JCB
c – M2 Math. – Université de Rennes 1

n−1
X  
= 1A Xi B t ∧ (v ∧ ti+1 ) − B t ∧ (u ∨ ti )
i=0

car si t ≤ u∧ti tout est nul et comme A ∈ Fu , on a 1A Xi variable aléatoire Fu∨ti -mesurable
et la définition (7.8) s’applique. On a alors
Z t n−1
X  
1A 1]u,v] (s)ϕ(s)dBs = 1A Xi B (t ∧ v) ∧ ti+1 ) − B (t ∧ u) ∨ ti )
0 i=0
Z n−1
t∧v X Z t∧v
= 1A Xi 1]ti ,ti+1 ] (s)dBs = 1A ϕ(s)dBs .
t∧u i=0 t∧u

2) Si ϕ ∈ L2 (Ω × R+ ) alors on applique ce qui précède à ϕn ∈ S qui converge vers ϕ dans


L2 (Ω × R+ ), comme
lim kϕn − ϕkL2 (Ω×R+ ) = 0
n→+∞
on a aussi
lim 1A 1]u,v] (s)ϕn − 1A 1]u,v] (s)ϕ L2 (Ω×R+ ) = 0
n→+∞

et donc par l’isométrie d’Itô (7.10), dans L2 ,


Z t Z t Z t∧v Z t∧v
1A 1]u,v] (s)ϕn (s)dBs → 1A 1]u,v] (s)ϕ(s)dBs et ϕ(s)dBs → ϕ(s)dBs .
0 0 t∧u t∧u

On a donc (7.12) en passant à la limite dans (7.12) pour ϕn ∈ S.


Rt
3) De plus, dans le cas simple, il est clair que 0 ϕ(s)dBs est adapté et cela se conserve à
la limite. Puis si ϕ ∈ L2 (Ω × R+ ) alors
lim 1[t,t+h] ϕ = 0
h→0

et par l’isométrie (7.10)


Z t+h Z t
2
L − lim ϕ(s)dBs = ϕ(s)dBs .
h→0 0 0

Puis comme
h Z t+h 2 i hZ t+h i
E ϕ(s)dBs =E ϕ(s)2 ds ≤ kϕkL2 (Ω×R+ ) < +∞
0 0
R t+h
alors 0
ϕ(s)dBs est UI et il y a aussi convergence en probabilité :
Z t+h Z t
P − lim ϕ(s)dBs = ϕ(s)dBs ,
h→0 0 0

d’où la continuité en probabilité des trajectoires.


4) Pour la continuité presque sûre, on commence par prouver uneinégalité maximale. 
7.3. Propriétés de l’intégrale d’Itô 123

Proposition 7.5 (Propriétés maximales) Soit ϕ ∈ L2 (Ω × R+ ). On a


h Z u 2 i h Z t 2 i h Z t 2 i
E sup ϕ(s)dBs ≤ 4E ϕ(s)dBs = 4E ϕ(s)2 ds . (7.13)
0≤u≤t 0 0 0

Démonstration : Notons St = sups≤t Bs (ϕ) et Set = sups≤t (−Bs (ϕ)).


On commence par considèrer ϕ ∈ S. Les processus S et Se sont continus adaptés et positifs.
On a B0 (ϕ) = 0 et S0 = 0. De plus, S ne croı̂t que sur l’ensemble où St = Bt (ϕ). Ainsi
pour tout ω ∈ Ω
Z t Z t
2
St (ω) = 2 Su (ω) dSu (ω) = 2 Bu (ϕ)(ω) dSu (ω).
0 0

En utilisant l’approximation de Riemann de ces intégrales de Stieltjes, on a pour une


subdivision 0 ≤ tn1 ≤ · · · ≤ tpnn = t de [0, t] :
pn
X
2

St (ω) = 2 lim Btni (ϕ)(ω) Stni+1 (ω) − Stni (ω)
n→+∞
i=1
n
X 
= 2Bt (ϕ)(ω)St (ω) − 2 lim Sti (ω) Btni+1 (ϕ)(ω) − Btni (ϕ)(ω)
n→+∞
i=1


et la somme est majorée par 2 St (ω) + Set (ω) St (ω).
a) Si St2 et Set2 sont intégrables alors le théorème de convergence dominée assure la conver-
gence en espérance. Mais
   
E Sti (ω) Btni+1 (ϕ)(ω) − Btni (ϕ)(ω) = E B(ϕStni 1]tni ,tni+1 ] ) = 0.

On a alors
E St2 = 2E Bt (ϕ)St
   

et l’inégalité de Cauchy-Schwarz conduit à


 2 q  q  2 
E St ≤ 2 E Bt (ϕ) 2 E St

ce qui donne (7.13) après simplification.


b) Si St2 et Set2 ne sont pas intégrables on peut faire le même calcul avec les processus
St ∧ K et Set ∧ K de sorte que les sommes précédentes sont majorées par K et à la fin on
fait K % +∞.
On achève la preuve dans un instant après avoir montrer la continuité. 
124 Chapitre 7. JCB
c – M2 Math. – Université de Rennes 1

Démonstration :[Continuité dans la Prop. 7.4] Soit ϕn ∈ S qui converge vers ϕ dans
L2 (Ω × R+ ). On a par l’isométrie d’Itô (7.10) :

lim E Bt (ϕn − ϕm )2 = 0
 
n,m→+∞

et par (7.13) (dans le cas prouvé : pour ϕn , ϕm ∈ S) :


h i
n m 2
lim E sup |Bs (ϕ − ϕ )| = 0.
n,m→+∞ s≤t

Ainsi, on peut extraire une sous-suite nk telle que


X
sup |Bs (ϕnk − ϕnk )|2
s≤t
k≥1

et on en déduit la convergence uniforme de B(ϕnk ) sur [0, t] vers une limite B(ϕ) qui est
donc continue. 

Démonstration : [fin de la preuve de la Prop. 7.5] Pour terminer la preuve, on réap-


plique le raisonnement précédent pour obtenir maintenant (7.13) pour les intégrales de
ϕ ∈ L2 (Ω × R+ ). 

Propriété de martingale
La propriété de martingale valable pour le mouvement brownien B reste valable pour
l’intégrale d’Itô :

Théorème 7.3 Soit ϕ ∈ L2 (Ω×R+ ). Le processus continu, adapté et intégrable 0 ϕ(s)dBs
est une martingale. De plus si φ et ϕ sont des éléments de L2 (Ω × R+ ) alors
Z t  Z t  Z t
ϕ(s)dBs φ(s)dBs − ϕ(s)φ(s)ds (7.14)
0 0 0

est une martingale. En particulier


Z t 2 Z t
ϕ(s)dBs − ϕ(s)2 ds (7.15)
0 0
Rt
est une martingale de crochet 0
ϕ(s)φ(s)ds.
Démonstration : Nous avons vu que pour hA = 1A 1]t,u] ∈ S, A ∈ Ft on a
 
B(ϕhA ) = 1A [Bu (ϕ) − Bt (ϕ)] c’est à dire E 1A (Bu (ϕ) − Bt (ϕ)) = 0

ce qui est équivalent à E[Bu (ϕ)|Ft ] = Bt (ϕ), ie. il s’agit de la propriété de martingale pour
B(ϕ).
7.3. Propriétés de l’intégrale d’Itô 125

De la même façon, la propriété d’isométrie (7.10) de l’intégrale stochastique assure


h Z u Z u i hZ i Z
E 1A ϕ(s)dBs
φ(s)dBs = E 1A 1]t,u] ϕ(s)dBs 1A 1]t,u] ϕ(s)φ(s)dBs
t t
  hZ i h Z u i
= E B(ϕhA )B(φhA ) = E (ϕhA )(s)(φhA )(s)ds = E 1A ϕ(s)φ(s)ds .
t

Comme cela est vraie pour tout A ∈ Ft , on a


 
E (Bu (ϕ) − Bt (ϕ))(Bu (φ) − Bt (φ)) | Ft
hZ u i
= E ϕ(s)φ(s)ds|Ft
t
hZ u i Z t
= E ϕ(s)φ(s)ds|Ft − ϕ(s)φ(s)ds (7.16)
0 0

On a aussi pour u ≥ t,
 
E (Bu (ϕ) − Bt (ϕ))(Bu (φ) − Bt (φ)) | Ft
   
= E (Bu (ϕ)Bu (φ))|Ft − E (Bt (ϕ)Bu (φ))|Ft
   
−E (Bt (φ)Bu (ϕ))|Ft + E E[(Bt (ϕ)Bu φ))|Ft
 
= E (Bu (ϕ)Bu (φ))|Ft − Bt (ϕ)Bt (φ) (7.17)
   
car E (Bt (ϕ)Bu (φ))|Ft = Bt (ϕ)E
 B u (φ))|Ft Bt (ϕ)B
 t (φ) (propriété de martingale) et de
même que pour l’autre terme E (Bt (φ)Bu (ϕ))|Ft . En combinant (7.16) et (7.17), il vient
(7.14) dont (7.15) est un as particulier. 

Théorème 7.4 (Arrêt) Pour tout temps d’arrêt T , le processus Bt∧T (ϕ) qui est indis-
tinguable du processus Bt (ϕ1]0,T ] ) est aussi une martingale.

Conséquence : Si T est un temps d’arrêt, on a donc


Z t Z t∧T
1]0,T ] (s)ϕ(s)dBs = ϕ(s)dBs .
0 0

Rt 
Pour tout processus 0 ϕ(s)dB
R· s ; t ∈ [0, T ] avec ϕ ∈ L2 (Ω × R+ ), on a aussi par l’inégalité
de Doob pour la martingale 0 ϕ(s)dBs :

h Z u 2 i h Z T 2 i hZ T i
E sup ϕ(s)dBs ≤ 4E ϕ(s)dBs = 4E ϕ(s)2 ds .
u≤t 0 0 0
126 Chapitre 7. JCB
c – M2 Math. – Université de Rennes 1

Variation quadratique
Définition 7.2 (Variation quadratique) 1. Si M = (Mt )t≥0 est une martingale à
trajectoires continues de carré intégrable, on appelle variation quadratique de M (ou
crochet de M ) le processus croissant hM, M i tel que Mt2 − hM, M it définit une mar-
tingale.
2. Si M = (Mt )t≥0 et N = (Nt )t≥0 sont deux martingales à trajectoires continues de
carrés intégrables, on appelle covariation quadratique de M et N (ou crochet de
M, N ), le processus à variation finie hM, N i tel que Mt Nt − hM, N it définit une
martingale.

Exemple 7.1 1. Le mouvement brownien B est une martingale de variation quadra-


tique hB, Bit = t.
2. Une autre interprétation de cette quantité qui justifie davantage le vocabulaire est
donnée par la Prop. 4.7.
3. Si B et B
e sont deux (Ft )t -mouvements browniens standard indépendants, la covaria-
tion de B et Be est hB, Bi
e t = 0 car Bt B
et est une martingale (indépendance).

On montre que la propriété de martingale


R· (7.15), resp. (7.14) caractérise la variation
2
(resp.
R · covariation) quadratique. Ainsi 0 ϕ(s) ds est la variation quadratique du proces-
sus 0 ϕ(s)dBs . Traditionnellement pour un processus X, on note la variation quadratique
t 7→ hX, Xit , on a donc par (7.15)
DZ · Z · E Z t
ϕ(s)dBs , ϕ(s)dBs = ϕ(s)2 ds. (7.18)
0 0 t 0

De plus si B, B
e sont des mouvements browniens indépendants, on a par (7.11) :
DZ · Z · E
ϕ(s)dBs , ϕ(s)d
e Bes = 0. (7.19)
0 0 t

Noter que si ϕ est intégrable alors 0
ϕ(s)ds est à variation finie et sa variation quadratique
est nulle, on a
DZ · Z · E
ϕ(s)ds, ϕ(s)ds = 0. (7.20)
0 0 t

En général, on manipule (7.18), (7.19) et (7.20) sous forme différentielle et on écrit


DZ · Z · E
d ϕ(s)dBs , φ(s)dBs = ϕ(t)φ(t)dt, (7.21)
0 0 t
DZ · Z · E
d ϕ(s)dBs , ϕ(s)d
e Bes = 0, (7.22)
0 0 t
DZ · Z · E
d ϕ(s)ds, ϕ(s)ds = 0. (7.23)
0 0 t
7.4. Généralisation de l’intégrale stochastique 127

Notation symbolique. En pratique, les règles de calcul différentiel formulé ci-dessous


sont bien utiles. Elles reposent sur(7.21), (7.22), (7.23) et s’interprètent comme suit : vu de
t, l’espérance et la variance conditionnelles de l’accroissement infinitésimal du mouvement
brownien dBt = Bt+dt − Bt sont respectivement de l’ordre de 0 et de dt. On résume cela
par la règle symbolique de calcul multiplicatif des accroissements infinitésimaux dt, dBt ,
dBet :
h·, ·i dt dBt dB et
dt 0 0 0
dBt 0 dt 0
dBt 0
e 0 dt
où B
e est un mouvement brownien indépendant de B.

7.4 Généralisation de l’intégrale stochastique


Soit φ ∈ L2 (Ω × R+ ), on considère le processus défini par
Z t
Xt = φ(s)dBs , t ≥ 0.
0

D’aprés ce qui précède, X est un processus à trajectoires continues et de variation quadra-


tique Z t
hX, Xit = φ(s)2 ds.
0

En particulier sous forme différentielle, on a dhX, Xit = φ(t)2 dt. De même qu’on a construit
l’intégrale contre un mouvement
Rt brownien B (de variation quadratique t sur [0, t]), on peut
construire l’intégrale 0 ϕ(s)dXs contre X dés lors que
hZ t i hZ t i
2
E ϕ(s) dhX, Xis =E ϕ(s)2 φ(s)2 ds < +∞
0 0

et on montre qu’il s’agit de intégrale de ϕφ contre B :


Z t Z t
ϕ(s)dXs = ϕ(s)φ(s)dBs .
0 0

Cela est résumé dans le résultat suivant :


RT 
Théorème 7.5 Soit φ ∈ L2 (Ω×R+ ) et ϕ un processus adapté tel que E 0 ϕ(s)2 φ(s)2 ds <
Rt 
+∞. Le processus 0 ϕ(s)φ(s)dBs t≥0 peut être interprété comme l’intégrale stochastique

de ϕ par rapport à la martingale X· = 0 φ(s)dBs . On a donc
Z t Z t 
Z t 
ϕ(s)dXs = ϕ(s) φ(s)dBs = ϕ(s)φ(s) dBs ,
0 0 0
128 Chapitre 7. JCB
c – M2 Math. – Université de Rennes 1

ou sous forme différentielle,



ϕ(s)dBs (φ) = ϕ(s) φ(s)dBs = ϕ(s)φ(s)dBs .

Démonstration : Pour construire une intégrale stochastique, il suffit d’abord de travailler


à partir des processus en escalier et de passer à la limite. Mais l’égalité de l’intégrale entre
0 et T de h1 par rapport à B· (φ) avec BT (h1 ϕ) est une propriété de base de l’intégrale
de Itô. Il suffit ensuite de remarquer que l’hypothèse d’intégrabilité faite assure que cette
identité passe à la limite par rapport aux processus vérifiant l’hypothèse.
Nous avons vu dans la Section 7.1 sur la formule d’Itô que les variables aléatoires de la
forme f (BT ) se repésentent à l’aide d’intégrale stochastique d’une fonction de Bt . Lorsqu’on
étend la classe des intégrands à des fonctions adaptées et de carré intégrable, on atteint
ainsi comme ça toutes les variables aléatoires de carré intégrable et mesurables par rapport
à la tribu du mouvement brownien.

7.5 Processus d’Itô


Définition 7.3 Un processus d’Itô est un processus de la forme
Z t d Z
X t
Xt = X0 + α(s)ds + ϕi (s)dBs(i) (7.24)
0 i=0 0

où
— X0 est une variable aléatoire F0 -mesurable, de carré intégrable : E[X02 ] < +∞,
RT
— α est un processus adapté intégrable sur tout [0, T ] : 0 |α(s)|ds < +∞,
— B = (B (1) , . . . , B (d) ) est un mouvement brownien standard dans Rd à composantes
indépendantes, RT
— ϕ = (ϕ1 , . . . , ϕd ) est un vecteur de processus adaptés vérifiant 0 kϕ(s)k2 ds <
+∞.R
t 
Le terme 0 α(s)ds t≥0 s’appelle la partie à variation finie du processus X.
Rt 
Le terme 0 ϕ(s)dBs t≥0 s’appelle la partie martingale locale du processus X.

On réécrit parfois la définition (7.24) du processus de Itô sous la forme symbolique suivante,
typique des notations usuelles pour les EDS :
d
X
dXt = α(t)dt + ϕi (t)dBti . (7.25)
i=0

Cette formulation différentielle est souvent utilisée mais elle n’est que symbolique. Seule la
formulation (7.24) a un vrai sens mathématique.
Un exemple fameux de processus de Itô est le processus d’OU pour lequel d = 1, α(t) =
−αXt et ϕ(t) = σ. D’après (7.21) (7.22), on a pour un processus d’Itô comme en (7.24)
7.5. Processus d’Itô 129

Proposition 7.6 La variation quadratique d’un processus d’Itô est donnée par
d
X
dhX, Xit = ϕi (t)2 dt.
i=1

En général pour des processus d’Itô X, Y , on calcule la variation quadratique hX, Y i, par
bilinéarité avec la règle de calcul formel suivante :

hdt, dti = 0, hdBt , dBt i = dt,


hdBt , dB
et i = 0, hdB et i = dt.
et , dB

Ainsi
d
X
dhX, Y it = ϕi (t)φi (t)dt.
i=1

La formule d’Itô appliquée au mouvement brownien B et à une fonction f régulière (C 2 )


montre que le processus f (Bt ) t≥0 est encore un processus d’Itô. C’est encore vraie pour
f (t, Bt ) si f ∈ C1,2 . Il en est de même si B est remplacé par un processus d’Itô (7.24).

Théorème 7.6 (Formule d’Itô) Soit (Xt )t≥0 un processus d’Itô et f une fonction de
classe C 1,2 (R). Le processus f (t, Xt ) est un processus d’Itô de décomposition
Z t Z t
0
f (t, Xt ) = f (0, X0 ) + fx (s, Xs )α(s)ds + ft0 (s, Xs )ds (7.26)
0 0
Z t
1 t 00
Z
0
+ fx (s, Xs )ϕ(s)dBs + fxx (s, Xs )ϕ(s)2 ds.
0 2 0

On peut réécrire sous forme différentielle


1 00
df (t, Xt ) = fx0 (t, Xt )dXt + ft0 (t, Xt )dt + fxx (t, Xt )dhX, Xit (7.27)
2
en identifiant
d
X
dXt = α(t)dt + ϕi (t)dBti ,
i=0
dhX, Xit = ϕ(t)2 dt.

Démonstration : On considère un temps t > 0 fixé. Par localisation (c’est à dire en


arrêtant tous les processus qui nous intéressent le long d’une suite croissante de temps
d’arrêt bornés qui tend vers +∞) nous pouvons toujours supposer que le processus X est
à valeurs dans un compact et que les processus α et ϕ appartiennent L2 (Ω × [0, T ]). Il est
130 Chapitre 7. JCB
c – M2 Math. – Université de Rennes 1

donc suffisant de montrer le résultat dans le cas d’une fonction f à support compact et à
dérivées bornées, ce que nous ferons dans la suite.
De plus d’après la Prop. 7.2, il est toujours possible de considérer une suite de processus
en escalier ϕp bornées qui approximent ϕ dans L2 (Ω × [0, T ]) et en probabilité, ainsi qu’une
suite de processus en escalier αp qui approximent α dans H 1 et en probabilité.
Si la formule (7.26) est vraie pour les approximations étagées ϕp , elle sera vraie à la
limite car tous les termes qui apparaissent dans la formule d’Itô convergent en probabilité.
La formule d’Itô que nous avons établie pour le mouvement brownien s’étend sans
difficulté à des processus aléatoires de la forme Ys,t = Hs + Ks (t − s) + Us (Bt − Bs ) où les
variable aléatoire Hs , Ks et Us sont Fs -mesurables. La formule d’Itô devient
Z t Z t
1 t 00
Z
0 0
f (Ys,t ) = f (Hs ) + fx (Ys,u )Ks du + fx (Ys,u )Us dBu + fxx (Ys,u )Us2 du.
s s 2 s

Tout processus d’Itô associé à des P


fonctions en escalier se décompose en une somme finie
d’expressions de cette forme Xt = ni=1 Ytii−1 ∧t,ti ∧t où

Ytii−1 ,ti = α(ti−1 )(ti − ti−1 ) + ϕ(ti−1 )(Bti − Bti−1 ).

Par récurrence rétrograde, on voit de proche en proche que la formule d’Itô est valable
pour de tels processus. Cette remarque suffit à conclure. s 

Proposition 7.7 La décomposition d’un processus d’Itô sous la forme (7.24) (en partie
martingale locale et partie à variation finie) est unique.

Démonstration : Par linéarité de la décomposition, il suffit de montrer que si X est un


processus d’Itô identiquement nul, sa partie à variation finie et sa partie martingale sont
nulles. En utilisant les notations de la définition et la formule d’Itô, on a avec la fonction
exp(−x2 )
Z t Z t
−Xt2 −X02 −Xs2 2
e =e −2 e Xs dXs + e−Xs (2Xs2 − 1)|ϕ(s)|2 ds.
0 0

Si le processus X est identiquement nul, nous avons


Z T
|ϕ(s)|2 ds = 0 ps
0

soit ϕ(s) = 0 ds × dP ps. Rt


Puis comme Xt ≡ 0, ceci implique que 0 α(s)ds = 0 ps, ce qui entraı̂ne que les deux
mesures positives α(s)+ ds et α(s)− ds sont égales ps. Le processus aléatoire α(s) est aussi
ps nul. 
7.5. Processus d’Itô 131

Théorème 7.7 (Formule d’Itô vectorielle) Soit f ∈ C 1,2 (R2 × [0, T ] et (X, Y ) un pro-
cessus d’Itô vectoriel, on a

df (t, Xt , Yt ) = ft0 (t, Xt , Yt )dt (7.28)


0 0
 
+fx (t, Xt , Yt ) α1 (t)dt + ϕ1 (t)dBt + fy (t, Xt , Yt ) α2 (t)dt + ϕ2 (t)dBt
1 00 00 1 00
+ fxx (t, Xt , Yt )ϕ1 (t)2 dt + fxy (t, Xt , Yt )ϕ1 (t)ϕ2 (t)dt + fyy (t, Xt , Yt )ϕ2 (t)2 dt
2 2
ce qui s’écrit encore

df (t, Xt , Yt ) = ft0 (t, Xt , Yt ) + fx0 (t, Xt , Yt )dXt + fy0 (t, Xt , Yt )dYt


1 00 00 1 00
+ fxx (t, Xt , Yt )ϕ1 (t)2 dt + fxy (t, Xt , Yt )ϕ1 (t)ϕ2 (t)dt + fyy (t, Xt , Yt )ϕ2 (t)2 dt.
2 2
Avec la fonction f (t, x, y) = xy, on a facilement la formule d’IPP suivante :

Corollaire 7.1 (IPP) Soit X et Y deux processus d’Itô avec les notations évidentes de
(7.24). Alors, on a la formule d’intégration par parties
Z t Z t Z t
Xs dYs = Xt Yt − X0 Y0 − Ys dXs − ϕ1 (s)ϕ2 (s)ds.
0 0 0

soit
Xt dYt = d(Xt Yt ) − Yt dXt − dhX, Y it .

Démonstration : Il suffit d’appliquer le Th. 7.7 avec F (x, y) = xy pour laquelle


2
∂x F (x, y) = y, ∂y F (x, y) = x, ∂x,y F (x, y) = 1.
132 Chapitre 7. JCB
c – M2 Math. – Université de Rennes 1
Chapitre 8

Intégration stochastique

On considère à nouveau dans ce chapitre un espace de probabilité filtré (Ω, F, (Ft )t≥0 , P)
muni d’une filtration (Ft )t≥0 satisfaisant les conditions habituelles. Le but est de construire
une théorie de l’intégration contre les processus stochastiques. La bonne classe de processus
à considérer est celle des semimartingales introduites dans le Chapitre 6.
On commence par intégrer par rapport à des martingales bornées dans L2 en Section 8.1,
cette construction est fondée sur une théorie L2 . On s’intéresse ensuite en Section 8.2 à
l’intégration contre des martingales locales puis en Section 8.3 contre des semimartingales.
On conclut le chapitre par quelques commentaires sur le cas des semimartingales non
continues en Section 8.4.

8.1 Par rapport à une martingale bornée dans L2


Définition 8.1 (Espace Hc2 ) On note Hc2 l’espace des martingales M continues bornées
dans L2 (Ω) et telles que M0 = 0.

Le Théorème 6.3 montre qu’on a E[hM, M i∞ ] < +∞ pour M ∈ Hc2 . D’après la Proposi-
tion 6.16 (inégalité de Kunita-Watanabe), si M, N ∈ Hc2 on a E[|hM, N i∞ |] < +∞. En
effet :
Z +∞ 
E[|hM, N i∞ |] ≤ E |dhM, N is | ≤ E[hM, M i∞ ]1/2 E[hN, N i∞ ]1/2 < +∞.
0

On définit alors un produit scalaire sur Hc2 par (M, N )Hc2 := E[hM, N i∞ ] et on note k · kHc2
la norme sur Hc2 associée à ce produit scalaire :
1/2  1/2
kM kHc2 = (M, M )Hc2 = E hM, M i∞ .

D’après le Corollaire 6.1, en identifiant les processus indistinguables, on a bien une norme
car (M, M )Hc2 = 0 si et seulement si M = 0 (ie. le produit scalaire considéré est bien défini
positif).

133
134 Chapitre 8. JCB
c – M2 Math. – Université de Rennes 1

Proposition 8.1 L’espace Hc2 muni du produit scalaire (M, N )Hc2 est un espace de Hilbert.

Démonstration : Il s’agit de vérifier que Hc2 est complet pour la norme k · kHc2 . Pour cela,
on considère une suite de Cauchy (M n )n≥0 pour cette norme : d’après le Théorème 6.3,
(M n −M m )2 −hM n −M m , M n −M m i est une martingale uniformément intégrable. L’égalité
de martingale assure

E (M n − M m )2t − hM n − M m , M n − M m it
 

= E (M n − M m )20 − hM n − M m , M n − M m i0 = 0
 

c’est à dire

E (M n − M m )2t = E hM n − M m , M n − M m it
   

≤ E hM n − M m , M n − M m i∞ .
 

Par la propriété de Cauchy de la suite (M n )n≥0 pour Hc2 , on a donc

lim sup E (Mtn − Mtm )2 = lim E hM n − M m , M n − M m i∞ = 0.


   
m,n→+∞ t≥0 m,n→+∞

L’inégalité de Doob (Prop. 5.8) donne alors


 
n m 2
sup E (Mtn − Mtm )2 = 0.
 
lim E sup(Mt − Mt ) ≤ lim
m,n→+∞ t≥0 m,n→+∞ t≥0

On peut alors extraire une sous-suite (nk )k≥0 telle que pour tout k ≥ 0
 1/2
nk nk+1 2 1
E sup(Mt − Mt ) ≤ k.
t≥0 2

Avec l’inégalité de Cauchy-Schwarz, on a alors


" +∞ # +∞  1/2 X+∞
X n n
k+1
X nk nk+1 2 1
E sup Mt − Mt
k
≤ E sup(Mt − Mt ) ≤ < +∞.
k=0
t≥0
k=0
t≥0
k=0
2k

On en déduit que ps
+∞
n
X
sup Mtnk − Mt k+1 < +∞.

t≥0
k=0

Presque sûrement, la suite (Mtnk )t≥0 est de Cauchy dans C 0 (R+ , R) muni de k · k∞ et donc
elle converge uniformément sur R+ vers une limite qu’on note (Mt )t≥0 . Sur l’ensemble né-
gligeable où il n’y a pas convergence, on impose Mt ≡ 0. Le processus limite (Mt )t≥0 a alors
des trajectoires continues. Comme, pour chaque t ≥ 0, la suite (Mtnk )k≥0 est évidemment
de Cauchy dans L2 (Ω), (Mtnk )k≥0 converge aussi dans L2 (Ω) vers Mt pour tout t ≥ 0. On
peut donc passer à la limite (dans L1 (Ω)) dans la propriété de martingale de (Mtnk )t≥0 et
8.1. Par rapport à une martingale bornée dans L2 135

on obtient celle de (Mt )t≥0 qui est donc aussi une martingale. La suite M n étant de Cauchy
dans Hc2 , elle est bornée dans Hc2 pour k · kHc2 , on a alors pour tout n ≥ 1, t ≥ 0

E (Mtn )2 = E hM n , M n it ≤ E hM n , M n i∞ = kM n kHc2 ≤ sup kM n kHc2


     
n≥0

 
soit supn supt≥0 E (Mtn )2 < +∞. Les variables aléatoires Mtn , n ≥ 1, t ≥ 0, sont donc
uniformément bornées dans L2 (Ω). Par conséquent, la martingale M est aussi bornée dans
L2 (Ω), ce qui assure M ∈ Hc2 . Enfin, comme (M − M nk )2 − hM − M nk , M − M nk i est une
martingale convergente (lorsque k → +∞), on a

lim E hM nk − M, M nk − M i∞ = lim E (M∞


 n
− M∞ )2 = 0,
  
k
k→+∞ k→+∞

ce qui montre que la sous-suite (M nk )k≥0 converge vers M dans Hc2 . Finalement, comme la
suite de Cauchy (M n )n≥0 a une sous-suite convergeant vers M , elle converge entièrement
vers M dans Hc2 . 

Rappelons que Prog désigne la tribu progressive sur R+ × Ω (Déf. 5.3) et que les processus,
vus comme fonctions sur (R+ × Ω, Prog) sont appelés progressifs.

Définition 8.2 (Espace L2 (M )) Pour M ∈ Hc2 , on note

L2 (M ) = L2 R+ × Ω, Prog, dP ⊗ dhM, M i


l’espace des processus progressifs H = (Hs )s≥0 tels que


Z +∞ 
2
E Hs dhM, M is < +∞.
0

L’espace L2 (M ) est un espace de Hilbert pour le produit scalaire


Z +∞ 
(H, K)L2 (M ) = E Hs Ks dhM, M is .
0

Définition 8.3 (Processus simple) On note S le sous-espace vectoriel de L2 (M ) formé


des processus H (dits simples) de la forme
p−1
X
Hs (ω) = H(i) (ω)1]ti ,ti+1 ] (s) (8.1)
i=0

où 0 < t0 < t1 < t2 < · · · < tp et pour chaque 0 ≤ i ≤ p, H(i) est une variable aléatoire
Fti -mesurable et bornée.

Proposition 8.2 Pour tout M ∈ Hc2 , l’espace S est dense dans L2 (M ).


136 Chapitre 8. JCB
c – M2 Math. – Université de Rennes 1

Démonstration : Il suffit de montrer que si K ∈ L2 (M ) est orthogonal à S alors K = 0.


Supposons donc K orthogonal à S. Soient 0 ≤ s < t et soit F une variable aléatoire
Fs -mesurable bornée. Avec H = F 1]s,t] ∈ S, on a
 Z t 
E F Ku dhM, M iu = (H, K)L2 (M ) = 0. (8.2)
s

En posant Z t
Xt = Ku dhM, M iu , t ≥ 0,
0
 
l’égalité (8.2) se réécrit E F (Xt − Xs ) = 0 pour tous s < t et toute variable aléatoire
Fs -mesurable F bornée, ie. X = (Xt )t≥0 est en fait une martingale car en plus Xt ∈ L1 (Ω)
pour tout t ≥ 0, l’intégrale définissant Xt étant ps absolument convergente lorsque M ∈ Hc2
et K ∈ L2 (M ) (appliquer par exemple l’inégalité de Cauchy-Schwarz).
D’autre part, par la Proposition 6.5, X étant une intégrale contre un processus croissant
est aussi un processus à variation finie avec X0 = 0. Le Théorème 6.1 exige alors d’avoir
X = 0, ie. Z t
Ku dhM, M iu = 0 ∀t ≥ 0 ps.
0
Rt R
Comme 0 = 0 Ku dhM, M iu = R Ku 1[0,t] (u) dhM, M iu , Ku dhM, M iu coı̈ncide avec la
mesure nulle sur la famille des intervalles [0, t], donc par un argument de classe monotone
sur tout B(R+ ), c’est à dire K est ps orthogonal à L2 (hM, M i) ou encore K = 0 dans
L2 (M ). Cela établit la densité de E dans L2 (M ). 

Définition 8.4 Soient M ∈ Hc2 et H ∈ S de la forme (8.1). On définit H · M par


p−1
X
(H · M )t = H(i) (Mti+1 ∧t − Mti ∧t ).
i=0

Proposition 8.3 Soient M ∈ Hc2 et H ∈ S. On a H · M ∈ Hc2 et pour tout N ∈ Hc2 :


Z t
hH · M, N it = Hs dhM, N is = H · hM, N it . (8.3)
0

Remarque 8.1 — En général, on utilise la notation intégrale :


Z t
(H · M )t = Hs dMs .
0

— L’intégrale H · hM, N i qui figure dans le terme de droite de (8.3) est une intégrale
de Stieltjes par rapport à un processus à variation finie hM, N i, comme défini dans
la Section 6.1.4.
8.1. Par rapport à une martingale bornée dans L2 137

Démonstration : On écrit H·M = pi=0 Mti où Mti := H(i) (Mti+1 ∧t −Mti ∧t ). On commence
P
par observer que, pour chaque 1 ≤ i ≤ p (Mti )t≥0 est une martingale, en effet : pour s ≤ t,
— si s ≥ ti :
   
E H(i) (Mti+1 ∧t − Mti ∧t )|Fs = H(i) E (Mti+1 ∧t − Mti ∧t )|Fs
= H(i) (Mti+1 ∧s − Mti ∧s ) = Msi ;

— puis si s < ti :
   
E H(i) (Mti+1 ∧t − Mti ∧t ) Fs = E E[H(i) (Mti+1 ∧t − Mti ∧t )|Fti ]|Fs
= E H(i) E (Mti ∧t − Mti ∧t )|Fti Fs = 0 = Msi .
   

Pp−1 i
On a donc E[Mti |Fs ] = Msi pour tout t ≥ s et H · M = i=0 M est bien une martingale.
De plus, comme H est bornée et M ∈ Hc , on a aussi H · M ∈ Hc2 .
2

Pour la deuxième partie, d’abord, si H = H(i) 1]ti ,ti+1 ] , comme M N − hM, N i est une
martingale (car martingale locale bornée dans L2 d’après la Prop. 6.14), alors

M ti+1 N − hM, N iti+1 et M ti N − hM, N iti

sont des martingales. Par conséquent la différence

(M ti+1 − M ti )N − (hM, N iti+1 − hM, N iti )

est aussi une martingale. Comme cette martingale est nulle en t ≤ ti et comme H(i) ∈ Fti

H(i) M ti+1 − M ti N − H(i) hM, N iti+1 − hM, N iti


 


est encore une martingale puis en sommant sur 1 ≤ i ≤ p, (H · M )N − 0 Hs dhM, N is
reste aussi une martingale. D’après la Prop. 6.14, on identifie le crochet de (H · M ) et de
N :
h(H · M ), N i = H · hM, N i.
Noter en particulier que hH · M, H · M i = H 2 · hM, M i. 

Théorème 8.1 (Existence de l’intégrale stochastique L2 ) Soit M ∈ Hc2 . L’applica-


tion H ∈ S 7→ H · M s’étend en une isométrie de L2 (M ) dans Hc2 . De plus,
1. la martingale H · M est caractérisée par la relation

hH · M, N i = H · hM, N i, ∀N ∈ Hc2 ; (8.4)

2. puis, si T est un temps d’arrêt, on a une propriété d’arrêt :

(1[0,T ] H) · M = (H · M )T = H · M T . (8.5)
138 Chapitre 8. JCB
c – M2 Math. – Université de Rennes 1

Avec des notations intégrales, cette dernière propriété s’écrit de façon naturelle :
Z t Z t∧T Z t
1[0,T ] H dM = H dM = H dM T .
0 0 0

Démonstration : L’application H 7→ H · M est évidemment linéaire. Puis pour H ∈ S,


avec les notations précédentes H · M est la somme des martingales Mti := H(i) (Mti+1 ∧t −
Mti ∧t ), t ≥ 0. On a

kH · M k2Hc2 = E[hH · M, H · M i∞ ]
= E[H 2 · hM, M i∞ ] (par (8.3))
Z +∞ 
2
= E Hs dhM, M is
0
= kHk2L2 (M ) .

L’application H 7→ H · M est donc une isométrie de S dans Hc2 .


Comme Hc2 est un espace de Hilbert (Proposition 8.1) et comme S est dense dans L2 (M )
(Proposition 8.2), on peut alors prolonger de manière unique cette application en une
isométrie de L2 (M ) dans Hc2 .
1) On vérifie maintenant la propriété caractéristique (8.4). On sait déjà par (8.3) qu’elle est
vraie si H ∈ S. Pour la généraliser, notons que pour N ∈ Hc2 , l’application X 7→ hX, N i∞
est continue de Hc2 dans L1 (Ω) : en effet, par les inégalités de Kunita-Watanabe et Cauchy-
Schwarz,
1/2
hN, N i1/2
   
E |hX, N i∞ | ≤ E hX, Xi∞ ∞ (Kunita-Watanabe)
 1/2  1/2
= E hX, Xi∞ E hN, N i∞ (Cauchy-Schwarz)
 1/2
= E hN, N i∞ kXkHc2 .

Soit alors H ∈ L2 (M ) et (H n )n≥0 suite de S qui converge vers H dans L2 (M ) (densité cf.
Prop. 8.2). Par l’isométrie, on a alors H n · M → H · M dans Hc2 . Puis par la continuité de
X ∈ Hc2 7→ hX, N i∞ ∈ L1 (Ω) :

hH · M, N i∞ = lim hH n · M, N i∞ = lim (H n · hM, N i)∞ = (H · hM, N i)∞ ,


n→+∞ n→+∞

où les convergences ont lieu dans L1 (Ω) avec pour la dernière égalité l’utilisation, encore,
de l’inégalité de Kunita-Watanabe :
 Z +∞ 

E n
(Hs − Hs ) dhM, N is ≤ E[hN, N i∞ ]1/2 kH n − HkL2 (M ) .
0

(On justifie de la même façon que (H ·hM, N i)∞ est bien défini.) On a donc établi (8.4) pour
t = +∞. Pour conclure, il faut l’obtenir pour tout t ≥ 0. Pour cela, il suffit de remplacer
8.1. Par rapport à une martingale bornée dans L2 139

N par N t , la martingale arrêtée en t ≥ 0, dans l’égalité hH · M, N i∞ = (H · hM, N i)∞ et


on trouve hH · M, N it = (H · hM, N i)t , ce qui achève de prouver (8.4).
Il faut encore justifier que (8.4) caractérise effectivement H ·M . Pour cela, soit X une autre
martingale de Hc2 qui satisfait la même propriété (8.4), on a pour tout N ∈ Hc2 ,
hH · M − X, N i = 0.
Le choix particulier N = H · M − X donne alors hH · M − X, H · M − Xi = 0 donc
kH · M − XkHc2 = 0, ie. X = H · M . Cela termine la preuve de 1).
2) Pour terminer, on utilise les propriétés du crochet de deux martingales (Prop. 6.14)
pour prouver la dernière propriété. Si N ∈ Hc2 , on a
h(H · M )T , N it = hH · M, N it∧T = (H · hM, N i)t∧T = (H1[0,T ] · hM, N i)t
où la dernière égalité est évidente puisqu’il s’agit de l’intégrale de Stieltjes. La martingale
arrêtée (H · M )T vérifie donc la propriété caractéristique de l’intégrale (1[0,T ] H) · M . Cela
justifie la première partie de (8.5). On obtient la seconde partie en procédant de même :
hH · M T , N i = H · hM T , N i = H · hM, N iT = (H1[0,T ] ) · hM, N i
où à nouveau la dernière égalité est due au fait qu’il s’agit de l’intégrale de Stieltjes. 

Le résultat suivant est une propriété d’associativité de l’intégrale stochastique sous


réserve de conditions convenables d’intégrabilité des processus à intégrer.
Proposition 8.4 (Associativité de l’intégrale stochastique L2 ) Soit M ∈ Hc2 . Si K ∈
L2 (M ) et H ∈ L2 (K · M ) alors HK ∈ L2 (M ) et
(HK) · M = H · (K · M ). (8.6)
Démonstration : D’après le Théorème 8.1, on a
hK · M, K · M i = K · hM, K · M i = K 2 · hM, M i,
et donc
Z +∞  Z +∞ 
E Hs2 Ks2 dhM, M is = E Hs2 dhK · M, K · M is < +∞
0 0

ce qui garantit HK ∈ L2 (M ). Pour (8.6), on montre la propriété caractéristique (8.4) : si


N ∈ Hc2 , on a :
h(HK) · M, N i = HK · hM, N i = H · (K · hM, N i) = H · hK · M, N i = hH · (K · M ), N i
où la deuxième égalité utilise l’associativité de l’intégrale de Stieltjes. Comme l’égalité est
vraie pour toute N ∈ Hc2 , elle exige (HK) · M = H · (K · M ). 
140 Chapitre 8. JCB
c – M2 Math. – Université de Rennes 1

Remarque 8.2 La proposition précédente légitime les écritures informelles suivantes


Z t Z t
Hs (Ks dMs ) = Hs Ks dMs .
0 0

De même (8.4) s’écrit


Z ·  Z t
Hs dMs , N = Hs dhM, N is .
0 t 0

En appliquant deux fois cette relation, on obtient aussi :


Z · Z ·  Z t
Hs dMs , Ks dNs = Hs Ks dhM, N is . (8.7)
0 0 t 0

En particulier, on a
Z · Z ·  Z t
Hs dMs , Hs dMs = Hs2 dhM, M is .
0 0 t 0

Soient M ∈ Hc2 , N ∈ Hc2 et H ∈ L2 (M ), K ∈ L2 (N ), comme H · M et (H · M )(K · N ) −


h(H · M ), (K · N )i sont des martingales (en utilisant (8.7)), on a pour tout t ∈ R+ les
moments suivants :
Z t 
E Hs dMs = 0 (8.8)
0
Z t  Z t  Z t 
E Hs dMs Ks dNs = E Hs Ks dhM, N is . (8.9)
0 0 0

Attention : ces relations (8.8), (8.9) ne seront plus forcément vraies pour les extensions
de l’intégrale stochastique qu’on décrit ci-dessous pour les martingales locales.
Le mouvement brownien est bien une martingale continue mais n’est pas borné dans L2
(par exemple avec le Théorème 6.3 parce que son crochet hB, Bit = t → +∞). Cette section
ne permet donc toujours pas de construire une intégrale contre le mouvement brownien.
Les derniers obstacles sont levés dans la section suivante.

8.2 Par rapport à une martingale locale


En utilisant la propriété d’arrêt (8.5), on étend maintenant dans cette section la définition
de H · M au cas où M est une martingale locale continue. Dans cette section, on considère
M une martingale locale issue de 0.

Définition 8.5 (Espaces L2loc (M )) On note L2loc (M ) l’espace des processus progressifs H
tels que pour tout t ≥ 0, Z t
Hs2 dhM, M is < +∞ ps.
0
8.2. Par rapport à une martingale locale 141

On rappelle que, pour M une martingale locale, on note toujours L2 (M ) l’espace des
processus progressifs H tels que
Z +∞ 
2
E Hs dhM, M is < +∞.
0

Théorème 8.2 (Existence de l’intégrale stochastique générale) Soit M une mar-


tingale locale issue de 0. Pour tout H ∈ L2loc (M ), il existe une unique martingale locale
issue de 0, notée H · M , telle que pour toute martingale locale N ,

hH · M, N i = H · hM, N i. (8.10)

De plus, la propriété d’arrêt (8.5) reste vraie : si T est un temps d’arrêt, on a

(1[0,T ] H) · M = (H · M )T = H · M T . (8.11)

Rt
Remarque 8.3 — On note habituellement (H · M )t = 0 Hs dMs .
— Cette définition étend celle du Théorème 8.1 : si M ∈ Hc2 et H ∈ L2 (M ), alors
les définitions de ce théorème et du Théorème 8.1 coı̈ncident.
En effet, si M ∈ Hc2 et H ∈ L2 (M ), l’égalité hH · M, H · M i = H 2 · hM, M i entraı̂ne
d’abord que H · M ∈ Hc2 , et ensuite les propriétés caractéristiques (8.4) et (8.10)
montrent que les définitions des Théorèmes 8.1 et 8.2 coı̈ncident.
— La propriété d’associativité de la Proposition 8.4 reste vraie aussi sous des hypo-
thèses convenables d’intégrabilité.
— Le mouvement brownien B est uneR martingale locale pour laquelle le Théorème 8.2
t
définit donc l’intégrale (H · B)t = 0 Hs dBs pour H ∈ L2loc (B). Les intégrales sto-
chastiques par rapport au mouvement brownien B s’appellent les intégrales d’Itô.
Le calcul stochastique lié à ces intégrales est le calcul d’Itô.

Démonstration : On définit
 Z t 
2
Tn = inf t ≥ 0 : (1 + Hs ) dhM, M is ≥ n .
0

Comme pour la Prop. 6.12, il s’agit d’une suite de temps d’arrêt, croissante vers +∞.
Comme on a Z Tn
Tn Tn
hM , M it = hM, M it∧Tn ≤ dhM, M is ≤ n,
0

le Théorème 6.3 s’applique et assure que la martingale arrêtée M Tn est dans Hc2 . De plus,
H ∈ L2 (M Tn ), car par définition de Tn , on a aussi
Z +∞ Z Tn
Hs2 Tn Tn
dhM , M is = Hs2 dhM, M is ≤ n.
0 0
142 Chapitre 8. JCB
c – M2 Math. – Université de Rennes 1

Pour chaque n ≥ 1, on peut donc définir l’intégrale stochastique H · M Tn par le Théo-


rème 8.1 (cas L2 borné). Par la propriété caractéristique (8.4), on vérifie facilement que
nécessairement si m > n alors Tm ≥ Tn et on a

H · M Tn = (H · M Tm )Tn

en effet Tn
(H · M Tm )Tn = (H · M )Tm = (H · M )Tm ∧Tn = (H · M )Tn
Z t∧Tn
Tm Tn Tm
h(H · M ) , N it = h(H · M ), N it∧Tn = Hs dhM Tm , N is
0
Z t∧Tn Z t∧Tn ∧Tm
= Hs dhM, N iTs m = Hs dhM, N is
0 0
Z t∧Tn
= Hs dhM, N is = h(H · M, N iTt n
0
= h(H · M )Tn , N it .

Il existe donc un (unique) processus noté H · M qui étend tous les H · M Tn , ie. pour tout n,

(H · M )Tn = H · M Tn .

D’après le Théorème 8.1, les processus (H · M )Tn sont des martingales de Hc2 , si bien que
H · M est en fait une martingale locale.
Il reste à voir la propriété caractéristique (8.10). Pour cela, soit N une martingale locale
issue de 0 et soient Tn0 = inf(t ≥ 0 : |Nt | ≥ n) qui réduit N . On pose alors Sn = Tn ∧ Tn0 et
on a

hH · M, N iSn = h(H · M )Sn , N Sn i


= h(H · M Tn )Sn , N Sn i (car Sn ≤ Tn )
= hH · M Tn , N Sn i (propriété (6.6) du crochet)
= H · hM Tn , N Sn i (d’après (8.4) du cas L2 borné)
= H · hM Tn , N iSn
= H · hM, N iSn ∧Tn = H · hM, N iSn (Sn ≤ Tn )
= (H · hM, N i)Sn (propriété de l’intégrale de Stieltjes). (8.12)

Comme Sn % +∞, en faisant n → +∞, on déduit de (8.12) : hH · M, N it = H · hM, N it .


Finalement, on a hH · M, N i = H · hM, N i. La caractérisation de H · M par cette égalité
pour toute martingale locale N se justifie exactement comme dans le Théorème 8.1.
La propriété d’arrêt (8.11) est obtenue pour les martingales locales par les mêmes argu-
ments que dans la preuve du Théorème 8.1 (noter que ces arguments utilisent seulement
la propriété caractéristique (8.4) qu’on vient d’étendre). 
8.2. Par rapport à une martingale locale 143

Remarque 8.4 Discutons maintenant de l’extension des formules de moments (8.8), (8.9)
énoncées avant le Théorème 8.2. Soient M une martingale locale, H ∈ L2loc (M ) et t ∈
[0, +∞]. Alors, sous la condition
Z t 
2
 
E hH · M, H · M it = E Hs dhM, M is < +∞,
0

on a H ∈ L2 (M t ) et on peut appliquer le Théorème 6.3 à (H · M )t pour obtenir


Z t " Z 2 #
 t Z t 
2
E Hs dMs = 0, E Hs dMs =E Hs dhM, M is .
0 0 0

De façon générale, la propriété d’isométrie de l’intégrale stochastique du cas borné dans


L2 est remplacée par
"Z 2 #
t Z t 
2
E Hs dMs ≤E Hs dhM, M is . (8.13)
0 0

En effet soit le majorant est +∞ et l’inégalité est vraie, soit il est fini et l’estimation de la
variance est valable et donne l’égalité.

L’énoncé suivant établit une approximation par des sommes de Riemann des intégrales
stochastiques (contre une martingale locale) et complète le Lemme 6.4 dans le cas variation
finie.
Proposition 8.5 (Approximation de Riemann) Soit M une martingale locale conti-
nue et H ∈ L2loc (M ). Alors, pour tout t > 0, pour toute suite 0 = tn0 < · · · < tnpn = t de
subdivisions de [0, t] de pas tendant vers 0, on a, au sens de la convergence en probabilité :
n−1
X Z t
P- lim H (X
tn
i tn
i+1
−X )=
tn
i
Hs dXs . (8.14)
n→+∞ 0
i=0

Démonstration : Pour chaque n ≥ 1, on définit un processus H n par



n Htni si tni < s ≤ tni+1
Hs =
0 si s > t.

Dans ce cas, (8.14) est clair. Posons enfin pour tout p ≥ 1



Tp = inf s ≥ 0 : |Hs | + hM, M is ≥ p (8.15)

et remarquons que H, H n et hM, M i sont bornés sur l’intervalle ]0, Tp ]. D’après la théorie
L2 de l’intégrale stochastique (cf. (8.9) pour une expression du moment d’ordre 2), pour
tout p fixé,
h 2 i h 2 i
n Tp Tp n
E (H · M )t − (H · M )t = E (H 1[0,Tp ] · M )t − (H1[0,Tp ] · M )t
144 Chapitre 8. JCB
c – M2 Math. – Université de Rennes 1
h 2 i
= E ((H n − H)1[0,Tp ] ) · M t
Z t 
n 2
= E (Hs − Hs ) 1[0,Tp ] (s) dhM, M is
0
Z t∧Tp 
n 2
= E (Hs − Hs ) dhM, M is
0

converge vers 0 quand n → +∞ par convergence dominée car (Hsn − Hs )2 est borné sur
[0, Tp ] par (2p)2 , et
Z t∧Tp 
4p dhM, M is = 4p2 E hM, M it∧Tp ≤ 4p2 E hM, M iTp ≤ 4p2 × p = 4p3
2
   
E
0

puis par continuité limn→+∞ Hsn = Hs pour tout s ≥ 0. On a donc (H n ·M Tp )t → (H ·M Tp )t


dans L2 et en utilisant la propriété d’arrêt (8.11), on en déduit la convergence dans L2

lim (H n · M )t∧Tp = (H · M )t∧Tp .


n→+∞

Pour conclure, on remarque que P(Tp > t) % 1 quand p → +∞, ce qui affaiblit la conver-
gence L2 obtenue en une convergence en probabilité. 

Le résultat suivant est une version du théorème de convergence dominée pour les intégrales
stochastiques :
Théorème 8.3 Soit X une semimartingale continue. Si H n est une suite de processus
localement bornés telle que limn→+∞ Htn = 0 pour tout t ≥ 0 et telle qu’il existe un pro-
P
cessus K borné satisfaisant |H n | ≤ K pour tout n ≥ 1, alors (Hn · X)t → 0, n → +∞,
uniformément sur tout compact.
Démonstration : Il s’agit de voir

P- lim sup |(H n · X)s | = 0


n→+∞ s≤t

ce qui est clair d’après les propriétés de l’intégrale de Stieltjes si X est un processus à
variations finies. Il suffit de considérer le cas où X est une martingale locale. On suppose
X réduite par la suite de temps d’arrêt (Tp )p≥1 donnée en (8.15) alors (H n )Tp converge vers
p
0 dans L2 (X T ). D’après l’isométrie du Théorème 8.1, (H n · X)Tp converge vers 0 dans Hc2 .
Comme limp→+∞ P(Tp ≥ t) = 1, on obtient la convergence en probabilité cherchée. 

8.3 Par rapport à une semimartingale


On achève dans cette section la construction de l’intégrale stochastique en intégrant fi-
nalement par rapport aux semimartingales continues. Pour cela, on dit qu’un processus
8.3. Par rapport à une semimartingale 145

progressif H est localement borné si


ps ∀t ≥ 0, sup |Hs | < +∞.
s≤t

En particulier, tout processus continu adapté est localement borné (cf. Prop. 5.1). De plus,
si H est localement borné, pour tout processus V à variation finie on a :
Z t
ps ∀t ≥ 0, |Hs | |dVs | < +∞.
0
Rt
De même, pour toute martingale locale M , on a 0
Hs2 dhM, M is < +∞, ie. H ∈ L2loc (M ).
Définition 8.6 (Intégrale par rapport à une semimartingale) Soit X = X0 + M +
V une semimartingale continue, et soit H un processus progressif localement borné. L’in-
tégrale stochastique H · X est alors définie par
H ·X =H ·M +H ·V
où H · M est définie dans la Section 8.2 et H · V est définie en Section 6.1.4 (intégrale de
Stieltjes). On note traditionnellement
Z t
(H · X)t = Hs dXs .
0

Des propriétés déjà vues pour l’intégrale contre une martingale locale ou contre un processus
à variation finie, on déduit facilement :
Proposition 8.6
1. L’application (H, X) 7→ H · X est bilinéaire.
2. H · (K · X) = (HK) · X, si H et K sont localement bornés.
3. Pour tout temps d’arrêt T , (H · X)T = (H1[0,T ] ) · X = H · X T .
4. Si X est une martingale locale (resp. si X est un processus à variation finie) alors il
en est de même pour H · X.
Pp−1
5. Si H est un processus progressif de la forme Hs (ω) = i=0 H(i) (ω)1]ti ,ti+1 ] (s) où,
pour chaque i, H(i) est Fti -mesurable, alors
p−1
X
(H · X)t = H(i) (Xti+1 ∧t − Xti ∧t ).
i=0

6. Soit X une semimartingale continue et soit H un processus continu adapté. Alors,


pour tout t > 0, pour toute suite 0 = tn0 < · · · < tnpn = t de subdivisions de [0, t] de
pas tendant vers 0, on a, au sens de la convergence en probabilité :
n−1
X Z t
P- lim Htni (Xtni+1 − Xtni ) = Hs dXs .
n→+∞ 0
i=0
146 Chapitre 8. JCB
c – M2 Math. – Université de Rennes 1

Remarque 8.5
— Remarquer que dans la propriété 5), on ne suppose pas que les variables H(i) sont
bornées.
— Le résultat d’approximation dans 6) généralise dans le cas de l’intégration sto-
chastique l’approximation des intégrales de Riemann. Ce résultat sera utile dans la
suite, notamment pour prouver la formule d’Itô.
— Dans ce résultat, il est essentiel de considérer Htni dans l’approximation de Rie-
mann. Un autre choix conduit à un autre type d’intégrale stochastique : par exemple
Htni+1 mène à une intégrale dite anticipante, et H(tni+1 +tni )/2 mène à l’intégrale de
Stratonovich.

Démonstration : Toutes les propriétés viennent de celles vues en Section 6.1 pour la
partie variation finie et en Section 8.2 pour la partie martingale bornée. Par exemple, 6)
vient du Lemme 6.4 et de la Proposition 8.5. 

Le résultat suivant est une version du théorème de convergence dominée pour les intégrales
stochastiques :

Théorème 8.4 Soit X une semimartingale continue. Si H n est une suite de processus
localement bornés telle que limn→+∞ Htn = 0 pour tout t ≥ 0 et telle qu’il existe un pro-
P
cessus K borné satisfaisant |H n | ≤ K pour tout n ≥ 1, alors (Hn · X)t → 0, n → +∞,
uniformément sur tout compact.

Démonstration : Il s’agit de voir

P- lim sup |(H n · X)s | = 0


n→+∞ s≤t

ce qui est clair d’après les propriétés de l’intégrale de Stieltjes si X est un processus à
variations finies. Il suffit de considérer le cas où X est une martingale locale. On suppose
X réduite par la suite de temps d’arrêt (Tp )p≥1 donnée en (8.15) alors (H n )Tp converge vers
p
0 dans L2 (X T ). D’après l’isométrie du Théorème 8.1, (H n · X)Tp converge vers 0 dans Hc2 .
Comme limp→+∞ P(Tp ≥ t) = 1, on obtient la convergence en probabilité cherchée. 

8.4 Cas non continu


La théorie d’intégration stochastique présentée dans ces notes s’applique pour des semimar-
tingales à trajectoires continues. On pourrait s’intéresser à des semimartingales à trajec-
toires càdlàg (continue à droite et avec des limites à gauche) ou càglàd (continue à gauche
avec des limites à droite). On intègre alors des processus dits prévisibles ((Ft− )t≥0 -adaptés
et continus à gauche) ou optionnels ((Ft )t≥0 - adaptés et continus à droite). Dans le cadre
8.4. Cas non continu 147

càdlàg, la décomposition d’une semimartingale en martingale locale + processus à variation


bornée n’est plus unique (heuristiquement : on peut jouer sur les sauts) à moins d’imposer
par exemple que le processus à variation finie soit prévisible (dans ce cas, on 00 fixe00 les
sauts).
Il faut cependant introduire deux crochets [M, M ]t et hM, M it (qui est la projection prévi-
sible de [M, M ]t ). Chacun de ces deux crochets hérite d’une des propriétés fondamentales
(6.2), (6.3) de l’unique crochet défini dans le cadre continu (cf. Théorème 6.2), on retrouve
ainsi que
— [M, M ]t = lim|∆|→0 ti ∈∆ (Mti+1 − Mti )2 est la variation quadratique de M où ∆ est
P
une subdivision de [0, t] et |∆| désigne son pas.
— hM, M i est l’unique processus prévisible tel que M 2 − hM, M i soit une martingale
locale.
Dans ce contexte, il faut alors porter une attention particulière aux sauts ∆Xt = Xt − Xt−
du processus. On consultera [CT] ou [App] pour le cas spécifique des processus de Lévy.
148 Chapitre 8. JCB
c – M2 Math. – Université de Rennes 1
Chapitre 9

Formule d’Itô et conséquences

Dans ce chapitre, on prouve la formule d’Itô, véritable clef de voûte du calcul stochas-
tique. Celle-ci montre que lorsqu’on applique une application C 2 à une semimartingale, on
conserve une semimartingale ; elle en donne en plus la décomposition (martingale locale +
processus à variation finie). La formule d’Itô est prouvée en Section 9.1. Des conséquences
importantes en sont présentées dans les sections suivantes : théorème de Lévy (caractérisa-
tion du mouvement brownien par son crochet, Section 9.2 ), théorème de Dubins-Schwarz
(Section 9.3), inégalités de Burkholder-Davis-Gundy (Section ??), théorème de représen-
tation des martingales (Section 9.4), formule de Tanaka (Section ??).

9.1 Formule d’Itô


La formule d’Itô est l’outil de base du calcul stochastique : elle montre qu’une fonction de
classe C 2 de p semimartingales continues est encore une semimartingale continue, et elle
exprime explicitement la décomposition de cette semimartingale.
Rappelons la formule de changement de variable classique : si F, g sont de classe C 1 alors
(F ◦ g)0 (t) = F 0 (g(t)) g 0 (t) s’écrit
Z t
F (g(t)) = F (g(0)) + F 0 (g(s))g 0 (s) ds.
0

Si F est C 1 et g est seulement absolument continue (c’est à dire à variation finie) alors on
a encore avec l’intégrale de Stieltjes :
Z t
F (g(t)) = F (g(0)) + F 0 (g(s)) dg(s).
0

La même formule reste vraie pour un processus X à variation finie en faisant un calcul
trajectoriel (pour chaque ω fixé, la trajectoire t 7→ Xt (ω) est à variation finie et le cas
précédent s’applique) : pour F une fonction de classe C 1 , on a alors
Z t
F (Xt ) = F (X0 ) + F 0 (Xs ) dXs .
0

149
150 Chapitre 9. JCB
c – M2 Math. – Université de Rennes 1

La formule d’Itô généralise cette propriété pour des semimartingales lorsque F est C 2 et
fait apparaı̂tre un terme supplémentaire dû au fait que ces processus ne sont pas à variation
finie, cf. (9.1) ci-dessous.

Théorème 9.1 (Formule d’Itô) Soient X une semimartingale et F : R → R une fonc-


tion de classe C 2 . Alors
Z t
1 t 00
Z
0
F (Xt ) = F (X0 ) + F (Xs ) dXs + F (Xs ) dhX, Xis . (9.1)
0 2 0

Si on considère p semimartingales continues X 1 , . . . , X p et F : Rp → R de classe C 2 alors,


p Z t
X ∂F
F (Xt1 , . . . , Xtp ) = F (X01 , . . . , X0p ) + (X 1 , . . . , Xsp ) dXsi
i=1 0 ∂xi s
p t
1 XZ ∂ 2F
+ (X 1 , . . . , Xsp ) dhX i , X j is . (9.2)
2 i,j=1 0 ∂xi ∂xj s

Démonstration : On traite d’abord le cas (9.1) pour p = 1. Considérons une suite {0 =


tn0 < · · · < tnpn = t}n≥1 de subdivisions emboitées de [0, t] de pas tendant vers 0. Alors en
télescopant la somme, on a
pn −1
X 
F (Xt ) = F (X0 ) + F (Xtni+1 ) − F (Xtni ) .
i=0

La formule de Taylor à l’ordre 2 sur l’intervalle (Xtni , Xtni+1 ) donne pour chaque ω ∈ Ω :

fn,i (ω)
F (Xtni+1 ) − F (Xtni ) = F 0 (Xtni )(Xtni+1 − Xtni ) + (Xtni+1 − Xtni )2
2
où " #
inf F 00 Xtni + θ(Xtni+1 − Xtni ) , sup F 00 Xtni + θ(Xtni+1 − Xtni ) .
 
fn,i ∈
θ∈[0,1] θ∈[0,1]

D’après 6) dans la Proposition 8.6 (approximation à la Riemann des intégrales stochas-


tiques) avec Hs = F 0 (Xs ), on a au sens de la convergence en probabilité :
pn −1 Z t
X
0
P- lim F (Xtni )(Xtni+1 − Xtni ) = F 0 (Xs ) dXs .
n→+∞ 0
i=0

Pour prouver la formule d’Itô (9.1), il reste à établir la convergence en probabilité :


pn −1 Z t
X
P- lim fn,i (ω)(Xtni+1 − Xtni ) = 2
F 00 (Xs ) dhX, Xis , (9.3)
n→+∞ 0
i=0
9.1. Formule d’Itô 151

car alors, par unicité presque sûre de la limite en probabilité, on aura pour tout t ≥ 0 :
Z t Z t
0 1
F (Xt ) = F (X0 ) + F (Xs ) dXs + F 00 (Xs ) dhX, Xis ps.
0 2 0

Les deux termes de l’égalité ci-dessus étant continus en t, les deux processus sont en fait
indistinguables, ce qui donnera (9.1).
Il reste donc à établir (9.3) ; pour cela, on note pour m < n :
pn −1
X
Tn = fn,i (ω)(Xtni+1 − Xtni )2
i=0
pm −1
X X
Tm,n = fm,j (ω) (Xtni+1 − Xtni )2 .
j=0 {i:tm n m
j ≤ti <tj+1 }

Ppn −1 Ppm −1 P
Comme = {i:tm n m , on a
i=0 j=0 j ≤ti <tj+1 }

|Tn − Tm,n |

m −1 pm −1
pX X X X
2 2

= fn,i (ω)(Xtni+1 − Xtni ) − fm,j (ω)(Xtni+1 − Xtni )
j=0 {i:tm n m
j ≤ti <tj+1 }
j=0 {i:tm n m
j ≤ti <tj+1 }


pm −1
X X  2

= fn,i (ω) − fm,j (ω) (Xtni+1 − Xtni )
j=0 {i:tm n m
j ≤ti <tj+1 }


pm −1
X X
2

≤ Zm,n (Xtni+1 − Xtni )
j=0 {i:tm n m
j ≤ti <tj+1 }

pn −1
!
X
= Zm,n (Xtni+1 − Xtni )2
i=0

avec !
Zm,n = sup sup |fn,i − fm,j | .
0≤j≤pm −1 {i:tm n m
j ≤ti <tj+1 }

La continuité de F 00 assure que Zm,n → 0 ps quand m, n → +∞. D’après l’interpréta-


P n −1
tion 00 variation quadratique00 du crochet (Proposition 6.17), on a pi=0
P
(Xtni+1 − Xtni )2 −→
hX, Xit . Et donc pour ε > 0 donné, il existe m1 tel que pour tout n > m ≥ m1 ,
pn −1
! !
X
(Xtni+1 − Xtni )2

P |Tn − Tm,n | ≥ ε/3 ≤ P Zm,n ≥ ε/3 ≤ ε/3. (9.4)
i=0
152 Chapitre 9. JCB
c – M2 Math. – Université de Rennes 1

P Ppn −1 P
(Comme Zm,n −→ 0 et i=0  (Xtni+1 − Xtni )2 −→ hX, Xit , le théorème de Slutsky as-
P
pn −1 2 P
sure Zm,n i=0 (Xti+1 − Xti ) −→ 0.) Ensuite la Proposition 6.17 montre aussi qu’en
n n

probabilité :
pm −1
X X
P- lim Tm,n = P- lim fm,j (Xtni+1 − Xtni )2
n→+∞ n→+∞
j=0 {i:tm n m
j ≤ti <tj+1 }

pm −1  
X
= fm,j hX, Xitm
j+1
− hX, Xi m
tj
j=0
Z t
= hm (s) dhX, Xis ,
0

où hm est définie par hm (s) = fm,j si tm m


j ≤ s < tj+1 . Ainsi il existe m2 tel que pour n ≥ m2
 Z t 

P Tm,n −
hm (s) dhX, Xis ≥ ε/3 ≤ ε/3.
(9.5)
0

Puis comme F est C 2 , on a limm→+∞ hm (s) = F 00 (Xs ) ps. De plus, on a pour tout s
hm (s) − F 00 (Xs ) = fm,j − lim fn,i = lim

fm,j − fn,i ≤ lim Zn,m ,
n→+∞ n→+∞ n→+∞

et donc
sup |hm (s) − F 00 (Xs )| −→ 0.
P

s∈[0,t]

Il existe donc aussi m3 tel que pour m ≥ m3


 Z t Z t 
00

P hm (s) dhX, Xis − F (Xs ) dhX, Xis ≥ ε/3 ≤ ε/3. (9.6)
0 0

Comme
( p −1 Z t )
Xn
fn,i (Xtni+1 − Xtni )2 − F 00 (Xs ) dhX, Xis ≥ ε



i=0 0
⊂ {|Tn − Tm,n | ≥ ε/3}
 Z t 

∪ Tm,n −
hm (s) dhX, Xis ≥ ε/3

0
 Z t Z t 
00

∪ hm (s) dhX, Xis −
F (Xs ) dhX, Xis ≥ ε/3

0 0

en combinant (9.4), (9.5), (9.6), et en prenant n > m ≥ max(m1 , m2 , m3 ), on a :


p −1 Z t !
Xn
fn,i (Xtni+1 − Xtni )2 − F 00 (Xs ) dhX, Xis ≥ ε ≤ ε

P

i=0 0
9.1. Formule d’Itô 153

ce qui prouve (9.3) et donc la formule d’Itô (9.1) pour p = 1.


Dans le cas où p est quelconque, la formule de Taylor (toujours à l’ordre 2) donne

F (Xt1ni+1 , . . . , Xtpni+1 ) − F (Xt1ni , . . . , Xtpni )


p p k,l
X ∂F 1 p k k
X fn,i
= (Xtni , . . . , Xtni )(Xtni+1 − Xtni ) + (Xtkni+1 − Xtkni )
k=1
∂x k
k,l=1
2

avec
" #
k,l ∂ 2F ∂ 2
F
fn,i ∈ inf (Xt1ni + θ(Xt1ni+1 − Xt1ni ), . . . ), sup (Xt1ni + θ(Xt1ni+1 − Xt1ni ), . . . ) .
θ∈[0,1] ∂xk ∂xl θ∈[0,1] ∂xk ∂xl

Le 6) dans la Proposition 8.6 donne à nouveau la limite cherchée pour les termes faisant
intervenir les dérivées premières :
p Z t p Z t
X ∂F X ∂F
(Xs1 , . . . , Xsp ) dXsi →
P
(X 1 , . . . , Xsp ) dXsi .
i=1 0 ∂xi i=1 0 ∂xi s

En adaptant légèrement les arguments du cas p = 1, on montre que pour tous k, l ∈


{1, . . . , p} :
pn −1 t
∂ 2F
X Z
k,l
P- lim fn,i (Xtkni+1 − Xtkni )(Xtlni+1 − Xtlni ) = (X 1 , . . . , Xsp ) dhX k , X l is .
n→+∞
i=0 0 ∂xk ∂xl s

Cela achève la preuve de la formule d’Itô dans le cas général (9.2). 

Un cas particulier important de la formule d’Itô est la formule d’intégration par parties.

Corollaire 9.1 (IPP) Si X et Y sont deux semimartingales continues, on a


Z t Z t
Xt Yt = X0 Y0 + Xs dYs + Ys dXs + hX, Y it . (9.7)
0 0

Le terme hX, Y i est nul si X ou Y est à variation finie. Il est présent quand on considère
de (vraies) semimartingales et ce terme supplémentaire témoigne de la différence entre le
calcul stochastique et le calcul différentiel déterministe.
Démonstration : Appliquer la formule d’Itô à F (x, y) = xy qui est bien de classe C 2 en
x, y et noter que
∂ 2F ∂ 2F ∂ 2F
(x, y) = 1, (x, y) = (x, y) = 0.
∂x∂y ∂x2 ∂y 2

154 Chapitre 9. JCB
c – M2 Math. – Université de Rennes 1

En particulier, si Y = X on obtient
Z t
Xt2 = X02 +2 Xs dXs + hX, Xit .
0

Remarque 9.1 — Lorsque X = M est une martingale locale, on sait que M 2 −


hM, M i est une martingale locale (définition du crochet du Théorème 6.2). La for-
mule précédente montre que cette martingale locale est en fait
Z t
M02 +2 Ms dMs ,
0

ce qu’on aurait pu voir directement sur la démonstration donnée en Section 6.2


puisqu’une lecture attentive
P n de la démonstration indique que la construction de
hM, M i fait intervenir pi=0 Mtni (Mtni+1 − Mtni ) qui sont des approximations (à la
Rt
Riemann) de l’intégrale stochastique 0 Ms dMs .
— En prenant Xt1 = t et Xt2 = Xt , on a aussi pour toute fonction F de classe C 2
sur R+ × R
Z t Z t
1 t ∂ 2F
Z
∂F ∂F
F (t, Xt ) = F (0, X0 )+ (s, Xs )dXs + (s, Xs )ds + (s, Xs ) dhX, Xis .
0 ∂x 0 ∂t 2 0 ∂x2
| {z } | {z }
martingale locale variation finie

(9.8)
En fait, il suffit de prendre F ∈ C 1,2 (R+ × R, R), ie. F est C 1 en t ∈ R+ et C 2 en
x ∈ R.

Retour au mouvement brownien


Pour un (Ft )t≥0 -mouvement brownien B, la formule d’Itô s’écrit
Z t Z t
0 1
F (Bt ) = F (B0 ) + F (Bs ) dBs + F 00 (Bs ) ds.
0 2 0

En prenant Xt1 = t et Xt2 = Bt , (9.8) devient : pour toute fonction F de classe C 2 sur
R+ × R, on a :
t Z t
1 ∂ 2F
Z 
∂F ∂F
F (t, Bt ) = F (0, B0 ) + (s, Bs ) dBs + + (s, Bs ) ds.
0 ∂x 0 ∂t 2 ∂x2

Si Bt = (Bt1 , . . . , Btp ) est un (Ft )t≥0 -mouvement brownien en dimension d alors les B i sont
des mouvements browniens indépendants. On a vu au chapitre précédent que dans ce cas
9.1. Formule d’Itô 155

hB i , B j i = 0 lorsque i 6= j et dhB i , B i is = ds. La formule d’Itô montre alors que, pour


toute fonction F de classe C 2 sur Rp ,
p Z t Z t
X ∂F 1 1
F (Bt1 , . . . , Btp ) = F (B01 , . . . , B0p ) + (Bs , . . . , Bsp )dBsi + ∆F (Bs1 , . . . , Bsp )ds
i=1 0 ∂xi 2 0

∂2F
Pd
où ∆F = i=1 ∂x2i est le laplacien de F . On a aussi une formule analogue pour F (t, Bt1 , . . . , Btp ).

En particulier si F est harmonique (ie. ∆F = 0) alors F (Bt1 , . . . , Btp ) est une martingale
locale.

Exponentielles stochastiques
On définit maintenant l’exponentielle stochastique E(M ) d’une martingale locale M
quelconque. La formule d’Itô justifie qu’il s’agit d’une martingale locale et explique la
terminologie, cf. la Remarque 9.2 ci-dessous. Pour commencer, on dit qu’un processus à
valeurs dans C est une martingale locale si ses parties réelle et imaginaire en sont.

Proposition 9.1 Soit M une martingale locale. Pour tout λ ∈ C, soit

λ2
 
E(λM )t = exp λMt − hM, M it .
2

Le processus E(λM ) est une martingale locale.

Démonstration : Si F (x, r) est une fonction de classe C 2 sur R × R+ , la formule d’Itô


entraı̂ne que
Z t
 ∂F 
F Mt , hM, M it = F (M0 , 0) + Ms , hM, M is dMs
0 ∂x
Z t
1 ∂ 2F

∂F 
+ + M s , hM, M is dhM, M is .
0 ∂r 2 ∂x2

Le processus F Mt , hM, M it est une martingale locale dès que sa partie à variation finie
s’annule, ie. lorsque F vérifie la condition :

∂F 1 ∂ 2F
+ = 0.
∂r 2 ∂x2
λ2

Il est immédiat que cette condition est satisfaite par la fonction F (x, r) = exp λx − 2
r
(plus précisément par les parties réelle et imaginaire de cette fonction). 
156 Chapitre 9. JCB
c – M2 Math. – Université de Rennes 1

∂F

Remarque 9.2 Avec F (x, r) = exp x − r/2 (prendre λ = 1 précédemment), ∂x
(x, r) =
F (x, r), si bien que l’identité
Z t
 ∂F 
F Mt , hM, M it = F (M0 , 0) + Ms , hM, M is dMs
0 ∂x

s’écrit Z t
E(M )t = E(M )0 + E(M )s dMs (9.9)
0
ou en écriture symbolique d’EDS (cf. Chapitre ??) : dE(M ) = E(M )dM , ce qui généralise
l’équation dy = ydx de solution y(x) = ex avec la condition y(0) = 1 ou l’équation dy = ydg
de solution y(t) = exp(g(t)) si g est à variation finie nulle en 0 et avec la condition initiale
y(0) = 1. Cette propriété justifie l’appelation « exponentielle stochastique » de M pour
E(M ).

9.2 Théorème de Lévy


Le résultat suivant permet de caractériser le mouvement brownien par son crochet parmi
les martingales locales à trajectoires continues.

Théorème 9.2 (Caractérisation du MB par son crochet) Soit X = (X 1 , . . . , X d )


un processus à trajectoires continues (Ft )t≥0 -adapté issu de 0. Il y a équivalence entre
1. X est un (Ft )t≥0 -mouvement brownien en dimension d.
2. Les processus X 1 , . . . , X d sont des (Ft )t≥0 -martingales locales continues et de plus

hX i , X j it = δi,j t

où δi,j désigne le symbole de Kronecker.


En particulier, une (Ft )t≥0 -martingale locale continue M issue de 0 est un (Ft )t≥0 -mouve-
ment brownien si et seulement si hM, M it = t.

Remarque 9.3 Il est crucial que le processus soit à trajectoires continues. Par exemple le
processus de Poisson (standard) vérifie la même propriété de crochet mais il est à trajec-
toires càdlàg.

Démonstration : Le sens 1) ⇒ 2) est connu, cf. P Remarques 6.6 et ??. On montre la


réciproque. Pour cela, soit u ∈ Rd . Alors u · Xt = dj=1 uj Xtj est une martingale locale de
processus croissant
X d Xd d
X
j k
uj uk hX , X it = u2j t = kuk2 t.
j=1 k=1 j=1

D’après la Proposition 9.1 sur les exponentielles stochastiques, E(iuX) = exp iu · Xt +


1
2
kuk2 t est une martingale locale. Cette martingale locale est bornée sur les intervalles
9.3. Dubins-Schwarz 157

[0, T ], T > 0, il s’agit donc d’une vraie martingale. La propriété de martingale donne alors
pour s < t      
1 2 1 2
E exp iu · Xt + kuk t Fs = exp iu · Xs + kuk s .

2 2
En particulier, pour A ∈ Fs , on a :
h i
E 1A exp iu · (Xt − Xs )
h  i
= E E 1A exp (iu · (Xt − Xs )) |Fs
      
1 2 1 2
= E 1A exp −iu · Xs − kuk t E exp iu · Xt + kuk t |Fs
2 2
    
1 2 1 2
= E 1A exp −iu · Xs − kuk t exp iu · Xs + kuk s
2 2
 
1
= P(A) exp − kuk2 (t − s) . (9.10)
2
Avec A = Ω, (9.10) montre que Xt − Xs ∼ N (0, (t − s)Id ). Ensuite pour A ∈ Fs de
probabilité P(A) > 0, en notant PA (·) = P(·|A), on a
 
h i 1 2
EA exp iu · (Xt − Xs ) = exp − kuk (t − s)
2

ie. L(Xt − Xs |A) = N 0, (t − s)Id . Pour toute fonction mesurable positive f sur Rd , on a
   
EA f (Xt − Xs ) = E f (Xt − Xs )
soit    
E 1A f (Xt − Xs ) = P(A)E f (Xt − Xs ) .
Comme c’est vrai pour tout A ∈ Fs , on a Xt − Xs ⊥ ⊥ Fs (argument de classes monotones).

Finalement, pour tout 0 = t0 < t1 < · · · < tp , le vecteur Xtij − Xtij−1 1≤i≤d est un vecteur
1≤j≤p
gaussien (car obtenu en regroupant p vecteurs gaussiens indépendants). Par transforma-
tion linéaire, (Xti )1≤i≤p est encore un vecteur gaussien
 pour tout (ti )1≤i≤p et donc X est un
processus gaussien. Comme le vecteur Xtij −Xtij−1 1≤i≤d a ses composantes indépendantes,
1≤j≤p
le processus X est finalement gaussien, à accroissements indépendants et stationnaires et
(par hypothèse) à trajectoires continues : cela justifie que X 1 , . . . , X d sont d mouvements
browniens indépendants. 

9.3 Dubins-Schwarz
Le résultat suivant montre que pour les martingales locales, le crochet est une horloge
interne qui permet de retrouver le processus quand on évalue un mouvement brownien avec
158 Chapitre 9. JCB
c – M2 Math. – Université de Rennes 1

cette horloge. C’est une preuve supplémentaire du rôle central du mouvement brownien
dans la classe des martingales locales continues.

Théorème 9.3 (Dubins-Schwarz) Soit M une martingale locale continue issue de 0 et


telle que hM, M i∞ = +∞ ps. Alors, il existe un mouvement brownien β tel que

ps ∀t ≥ 0, Mt = βhM,M it .

Remarque 9.4 — En grossissant l’espace de probabilité on peut se débarrasser de


la restriction hM, M i∞ = +∞ ps.
— Le mouvement brownien β n’est pas adapté par rapport à la filtration (Ft )t≥0
initiale de M , mais par rapport à une filtration « changée de temps ».
— Il s’agit d’un résultat existentiel : le résultat est valable pour un certain mouve-
ment brownien (construit par la preuve du théorème) et pas pour un mouvement
brownien quelconque.

Démonstration : Pour tout r ≥ 0, on définit un temps d’arrêt τr en posant



τr = inf t ≥ 0 : hM, M it > r .

L’hypothèse sur hM, M i assure que τr < +∞ ps. De plus, la fonction r 7→ τr est
— croissante car si r ≤ s alors

{t ≥ 0 : hM, M it > s} ⊂ {t ≥ 0 : hM, M it > r}

et en passant aux inf : τr ≤ τs ;


— continue à droite car si on note α = lims&r τs , on a d’abord α ≥ τr par croissance,
puis si l’inégalité est stricte, on aurait τr < β < α ≤ τs pour tout s > r et
nécessairement r < hM, M iβ ≤ s pour tout s > r ce qui est absurde (car on peut
prendre s arbitrairement proche de r) ;
— avec des limites à gauche en r > 0 avec

lim τs = τr− = inf t ≥ 0 : hM, M it = r .
s%r

La fonction r 7→ τr est donc croissante càdlàg. On pose alors βr = Mτr . Le processus β


est adapté par rapport à la filtration donnée par Gr = Fτr , r ≥ 0. Remarquons que cette
filtration satisfait les conditions habituelles
T (puisque lorsque (Tn )n≥1 est une suite de temps
d’arrêt décroissants vers T on a FT = n≥1 FTn , cf. Prop. 5.2).

Lemme 9.1 Les intervalles de constance de M et de hM, M i sont ps les mêmes. En


d’autres termes, on a ps pour tous a < b,

Mt = Ma , ∀t ∈ [a, b] ⇐⇒ hM, M it = hM, M ia , ∀t ∈ [a, b].


9.4. Représentation des martingales (browniennes) 159

Démonstration : De la gauche vers la droite, utiliser l’approximation habituelle de


hM, M it . De la droite vers la gauche, appliquer le Corollaire 6.1 (hM, M i = 0 : M est
indistinguable de M0 ) au processus M(a+t)∧T − Ma pour un temps d’arrêt T convenable. 

Revenons à la preuve du Théorème 9.3. On a ps pour tout r > 0,

lim βs = lim Mτs = Mτr− = Mτr = βr .


s%r s%r

où l’avant dernière égalité vient du Lemme 9.1 et du fait que pour t ∈ [τr− , τr ], on a
hM, M it = r. Par ailleurs, par composition de telles fonctions, les trajectoires de β sont
clairement continues à droite ; on conclut que le processus β est à trajectoires continues.
Nous montrons ensuite que βs et βs2 − s sont des martingales relativement à la filtration
(Gs )s≥0 . Pour tout n ≥ 1, les martingales locales arrêtées M τn et (M τn )2 − hM, M iτn
sont des vraies martingales uniformément intégrables (d’après le Théorème 6.3 puisque
hM τn , M τn i∞ = hM, M iτn = n). Le théorème d’arrêt s’applique pour ces martingales uni-
formément intégrables et donne alors pour r ≤ s ≤ n :

E[βs |Gr ] = E[Mττsn |Fτr ] = Mττrn = βr

et

E[βs2 − s|Gr ] = E (Mττsn )2 − hM τn , M τn iτs |Fτr


 

= (Mττrn )2 − hM τn , M τn iτr
= βr2 − r.

On a donc hβ, βis = s. Le Théorème 9.2 (Théorème de Lévy avec d = 1) assure alors que
β est un (Gr )r≥0 -mouvement brownien. Finalement, par définition de β, on a ps pour tout
t ≥ 0,
βhM,M it = MτhM,M it .
On a 
τhM,M it = inf s ≥ 0 : hM, M is > hM, M it ≥ t,
si l’inégalité est stricte alors hM, M i est constante sur [t, τhM,M it ], et d’après le Lemme 9.1
M aussi, ce qui assure MτhM,M it = Mt et conclut que ps pour tout t ≥ 0 on a Mt = βhM,M it .
Par continuité des trajectoires, les deux processus sont indistinguables. 

9.4 Représentation des martingales (browniennes)


Nous montrons que lorsque la filtration est engendrée par un mouvement brownien,
toutes les martingales pour cette filtration peuvent être représentées comme intégrales
stochastiques par rapport à ce mouvement brownien.
160 Chapitre 9. JCB
c – M2 Math. – Université de Rennes 1

Théorème 9.4 (Représentation des martingales) On suppose que la filtration (Ft )t≥0
sur Ω est (l’augmentation habituelle de) la filtration canonique d’un mouvement brownien
B issu de 0. Alors, pour toute variable aléatoire Z ∈ L2 (Ω, F∞ ), il existe un (unique)
processus h ∈ L2 (B) (en particulier progressif donc adapté) tel que
Z +∞
Z = E[Z] + h(s, ω) dBs .
0

Par conséquent, pour toute martingale M continue et bornée dans L2 (respectivement pour
toute martingale locale M continue), il existe un (unique) processus h ∈ L2 (B) (resp.
h ∈ L2loc (B)) et une constante C réelle tels que
Z t
Mt = C + h(s, ω) dBs .
0

La preuve utilise le résultat suivant de densité.


Lemme 9.2 Sous les hypothèses du théorème précédent, l’espace vectoriel engendré par
les variables aléatoires n
 X 
exp i λj (Btj − Btj−1 )
j=1

pour 0 = t0 < t1 < · · · < tn et λ1 , . . . , λn ∈ R est dense dans L2C (Ω, F∞ ).

Démonstration :[Lemme 9.2] Il suffit de montrer que si Z ∈ L2C (Ω, F∞ ) vérifie


" n
#
 X 
E Z exp i λj (Btj − Btj−1 ) = 0 (9.11)
j=1

pour tout choix de 0 = t0 < t1 < · · · < tn et λ1 , . . . , λn ∈ R alors Z = 0.


Soient 0 = t0 < t1 < · · · < tn fixés et on note gm,σ2 (x), x ∈ R, la densité de la loi N (m, σ 2 ),
m ∈ R, σ 2 > 0. La condition (9.11) assure que pour tous σ12 , . . . , σn2 > 0 et m1 , . . . , mn ∈ R,
on a
Z Y n
" n
#
 X 
0 = gmj ,σj2 (λj )E Z exp i λj (Btj − Btj−1 ) dλ1 . . . dλj
Rn j=1 j=1
" n #
σj2 (Btj − Btj−1 )2
Y 
= E Z exp imj (Btj − Btj−1 ) −
j=1
2

où la deuxième égalité vient du théorème de Fubini et de l’expression de la fonction carac-


téristique d’une loi gaussienne. On obtient pour tous m1 , . . . , mn ∈ R et α1 , . . . , αn > 0 :
" n
#
Y
exp imj (Btj − Btj−1 ) − αj (Btj − Btj−1 )2 = 0.

E Z
j=1
9.4. Représentation des martingales (browniennes) 161

Le théorème de Stone-Weierstrass garantit que les combinaisons linéaires complexes de la


fonction constante égale à 1 et des fonctions de la forme
n
X 
(y1 , . . . , yn ) 7→ exp (imj yj − αj yj2 )
j=1

avec α1 , . . . , αm > 0 et m1 , . . . , mn ∈ R sont denses dans l’espace C` (Rn , C) des fonctions


continues de Rn dans C qui ont une limite à l’infini, muni de la norme de la convergence
uniforme. Par un passage à la limite, on obtient donc, pour toute fonction ϕ ∈ C` (Rn , C),
 
E Z ϕ(Bt1 , Bt2 − Bt1 , . . . , Btn − Btn−1 ) = 0.
On a donc, d’abord par approximation, pour tout ouvert borné U de Rn puis, par un
argument de classe monotone, pour tout borélien U de Rn :
 
E Z 1U (Bt1 , Bt2 − Bt1 , . . . , Btn − Btn−1 ) = 0.
Finalement, on a obtenu l’égalité E[Z1A ] = 0 pour tout A ∈ σ(Bt1 , . . . , Btn ). Avec un
dernier argument de classe monotone, on montre que cette égalité reste vraie pour tout
A ∈ σ(Bt : t ≥ 0) ; puis, par complétion, pour tout A ∈ F∞ . On conclut finalement que
Z = 0 ce qui établit le lemme. 

Démonstration :(du Théorème 9.4) On montre d’abord la première assertion. Pour cela,
on note H l’espace vectoriel des variables aléatoires Z ∈ L2 (Ω, F∞ ) qui ont la propriété
annoncée. Remarquons que l’unicité de h est facile à établir puisque si h et e
h correspondent
à la même variable aléatoire Z, on a par isométrie :
Z +∞ " Z 2 #
 +∞ Z +∞
E h(s, ω))2 ds = E
(h(s, ω) − e h(s, ω) dBs − h(s, ω)) dBs
e = 0,
0 0 0

h dans L2 (B). Si Z ∈ H correspond à h,


d’où h = e
Z +∞ 
2 2 2
E[Z ] = E[Z] + E h(s, ω) ds .
0

Il en découle facilement que si (Zn )n≥0 est une suite dans H qui converge dans L2 (Ω, F∞ )
vers Z, les processus hn associés à Zn forment une suite de Cauchy dans L2 (B) donc
convergent vers h ∈ L2 (B). D’après la propriété d’isométrie de l’intégrale stochastique
R +∞
(Théorème ??) on a alors Z = E[Z] + 0 h(s, ω) dBs et H est donc fermé.
Ensuite, pour 0 = t0 < t1 < · · · < tn et λ1 , . . . , λn ∈ R, notons f (s) = nj=1 λj 1]tj−1 ,tj ] (s)
P

et Etf la martingale exponentielle E i 0 f (s) dBs (cf. Proposition 9.1). La formule d’Itô


pour l’exponentielle stochastique (cf. (9.9)) montre que


n n Z +∞
 X 1X 2 
f
exp i λj (Btj − Btj−1 ) + λj (tj − tj−1 ) = E∞ = 1 + i Esf f (s) dBs
j=1
2 j=1 0
162 Chapitre 9. JCB
c – M2 Math. – Université de Rennes 1

soit
 Xn 
exp i λj (Btj − Btj−1 )
j=1
n Z +∞ n
1X 2
  1X 2 
= exp − λj (tj − tj−1 ) + i exp − λj (tj − tj−1 ) Esf f (s) dBs
2 j=1 0 2 j=1

c’est à dire
( n
! )
X
exp i λj (Btj − Btj−1 ) : λj ∈ R, 0 = t0 < t1 · · · < tn , n ∈ N ⊂H
j=1

et d’après le Lemme 9.2,


( n
! )
X
L2 (Ω, F∞ ) = Vect exp i λj (Btj − Btj−1 ) : λj ∈ R, 0 = t0 < t1 · · · < tn , n ∈ N ⊂ H = H.
j=1

On a donc H = L2 (Ω, F∞ ) ce qui prouve la première partie du théorème.


Soit maintenant M une martingale continue et bornée dans L2 , alors, d’après la première
partie, M∞ ∈ L2 (Ω, F∞ ) s’écrit, avec h ∈ L2 (B), sous la forme
Z +∞
M∞ = E[M∞ ] + h(s, ω) dBs .
0

Par conditionnement, il vient :


Z t
Mt = E[M∞ |Ft ] = E[M∞ ] + h(s, ω) dBs .
0

L’unicité de h s’obtient comme dans la première partie.


Enfin, soit M une martingale locale (continue), on a d’abord M0 = C ∈ R parce que F0 est
P-triviale (ce qu’on peut déduire
 soit de la première partie de la preuve soit du Chapitre
4). Si Tn = inf t ≥ 0 : |Mt | ≥ n on peut appliquer ce qui précède à la martingale arrêtée
M Tn et trouver un processus hn ∈ L2 (B) tel que
Z t
Tn
Mt = C + hn (s, ω) dBs .
0

Par unicité dans la deuxième partie, si m < n, on a hn (s, ω) = hm (s, ω), ds-pp sur [0, Tm ]
ps. Il est alors facile de construire h ∈ L2loc (B) tel que, pour tout m, h(s, ω) = hm (s, ω)
ds-pp sur [0, T
Rm ] ps. La formule annoncée découle ensuite de la construction de l’intégrale
t
stochastique 0 h(s, ω) dBs et l’unicité de h s’obtient aussi facilement par un argument de
localisation. 
9.4. Représentation des martingales (browniennes) 163

Remarque 9.5 Sous les hypothèses du Théorème 9.4, notons N la classe des P-néglige-
ables de σ(Bt : t ≥ 0) et pour tout t ≥ 0, Gt = σ(Bs : 0 ≤ s ≤ t) ∨ N . A priori, on a
Ft = Gt+ . En fait, le Théorème 9.4 entraı̂ne que Gt = Gt+ = Ft (le cas t = 0 est la loi de
Blumenthal). En effet, si Z est une variable aléatoire Ft -mesurable bornée, on a
Z t Z t−ε
2
Z= h(s, ω) dBs = (L )- lim h(s, ω) dBs .
0 ε↓0 0

et quitte à prendre une sous-suite, on voit que Z est limite ps de variables (Gt )t -mesurables
(car si ε > 0 : Ft−ε ⊂ Gt ).
164 Chapitre 9. JCB
c – M2 Math. – Université de Rennes 1
Bibliographie

[App] David Applebaum. Lévy Processes and Stochastic Calculus. Cambridge series in
advanced mathematics, vol. 93, 2004.
[BC] Bernard Bercu, Djalil Chafaı̈. Modélisation stochastique et simulation. Dunod, 2007.
[JCB-L3] Jean-Christophe Breton. Fondement des Probabilités. Notes de cours, L3 Mathé-
matiques, Université de Rennes 1, 2013.
[Bil2] Patrick Billingsley. Convergence of Probability measures. 2nd Edition, Wiley series
in probabilities and mathematical statistics, 1999.
[Chung] Kai Lai Chung. A course in probability theory. 3rd Edition, Academic Press, 2001.
[CM] Francis Comets, Thierry Meyre. Calcul stochastique et modèles de diffusions. Dunod,
2006.
[CT] Rama Cont, Peter Tankov. Financial modelling with Jump Processes. Chapman &
Hall, 2003.
[Dav] Youri Davydov. Cours de DEA ”Processus stochastiques”. Université Lille 1, 1999–
2000.
[DM] Claude Dellacherie, Pierre-André Meyer. Probabilités et potentiels. Hermann, 1975.
[EGK] Nicole El Karoui, Emmanuel Gobet, Etienne Pardoux. Introduction au calcul sto-
chastique. École Polytechnique, 2001.
[Fel] William Feller. An introduction to probability theory and its applications. Vol. 1. 3rd
Edition, Wiley series in probabilities and mathematical statistics, 1968.
[Gal] Léonard Gallardo. Mouvement brownien et calcul d’Itô. Coll. Méthodes mathéma-
tiques. Ed. Hermann. 2008.
[Gué] Hélène Guérin. Processus à temps continu. Notes de cours, M2 Mathématiques, Uni-
versité de Rennes 1, 2009.
[Kal] Olav Kallenberg. Foundations of modern probability. 2nd Edition, Springer Series in
Statistics. Probability and its Applications, 2002.
[KS] Ioannis Karatzas, Steven E. Shreve. Brownian motion and stochastic calculus. Sprin-
ger, 1987.
[Kin] John Kingman. Poisson processes. Oxford University Press, 1993.
[LG0] Jean-François Le Gall. Introduction au mouvement brownien. Gazette des Mathé-
maticiens, vol. 40, 1989.

165
166 Bibliographie

[LG1] Jean-François Le Gall. Mouvement brownien, martingales et calcul stochastique.


Spinger, Coll. Mathématiques et applications, vol. 71, 2013. Voir les notes de cours
M2 Mathématiques de l’Université Paris sud-Orasy.
[Lif] Michel Lifshits. Gaussian random functions, Kluwer, 1995.
[Mal] Florent Malrieu. Processus de Markov et inégalités fonctionnelles. Notes de cours de
Master 2, 2005–2006.
[Pro] Philipp Protter. Stochastic integration and differential equations. Springer, 1995.
[RY] Daniel Revuz, Marc Yor. Continuous martingales and Brownian motion. Springer,
1991.
[Tud] Ciprian Tudor. Cours de calcul stochastique. Notes de cours M2 Mathématiques,
Université Lille 1, 2011.