Vous êtes sur la page 1sur 499

MESURE, INTEGRATION, PROBABILITES

Thierry Gallouët Raphaèle Herbin

July 13, 2009


Contents

1 Motivation et objectifs 5
1.1 Intégrale des fonctions continues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Insuffisance de l’intégrale des fonctions continues . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Les probabilités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2 Tribus et mesures 16
2.1 Introduction... par les probabilités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.1 Cas d’un problème “discret” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.2 Exemple continu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Tribu ou σ−algèbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Mesure, probabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4 mesure signée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5 La mesure de Lebesgue sur la tribu des boréliens . . . . . . . . . . . . . . . . . . . . . . . 28
2.6 Indépendance et probabilité conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.6.1 Probabilité conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.6.2 Evènements indépendants, tribus indépendantes . . . . . . . . . . . . . . . . . . . 37
2.6.3 Probabilités sur (R, B(R)) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.7.1 Tribus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.7.2 Mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.7.3 Probabilités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3 Fonctions mesurables, variables aléatoires 51


3.1 Introduction, topologie sur R+ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2 Fonctions étagées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.3 Fonctions mesurables et variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.4 Mesure image, loi d’une v.a., v.a. indépendantes . . . . . . . . . . . . . . . . . . . . . . . 60
3.5 Convergence p.p., p.s., en mesure, en probabilité . . . . . . . . . . . . . . . . . . . . . . . 62
3.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4 Fonctions intégrables 74
4.1 Intégrale d’une fonction étagée positive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.2 Intégrale d’une fonction mesurable positive . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.3 Théorème de convergence monotone et lemme de Fatou . . . . . . . . . . . . . . . . . . . 79

1
4.4 Mesures et probabilités de densité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.4.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.4.2 Exemples de probabilités de densité . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.5 L’espace L1 des fonctions intégrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.6 L’espace L1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.7 Théorèmes de convergence dans L1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.7.1 Convergence presque partout et convergence dans L1 . . . . . . . . . . . . . . . . . 90
4.7.2 Convergence d’une série absolument R convergente et conséquences . . . . . . . . . . 91
4.8 Continuité et dérivabilité sous le signe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.9 Espérance et moments des variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.10 Espace L1C (E, T, m) et espace L1RN (E, T, m) . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.11 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.11.1 Intégrale des fonctions mesurables positives et espace L1 . . . . . . . . . . . . . . . 99
4.11.2 L’espace L1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.11.3 Espérance et moments des variables aléatoires . . . . . . . . . . . . . . . . . . . . . 109

5 Mesures sur la tribu des boréliens 112


5.1 L’intégrale de Lebesgue et l’intégrale des fonctions continues . . . . . . . . . . . . . . . . . 112
5.2 Mesures abstraites et mesures de Radon . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.3 Changement de variables, densité et continuité . . . . . . . . . . . . . . . . . . . . . . . . 119
5.4 Intégrales impropres des fonctions de R dans R . . . . . . . . . . . . . . . . . . . . . . . . 121
5.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

6 Les espaces Lp 130


6.1 Définitions et premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
6.1.1 Les espaces Lp , avec 1 ≤ p < +∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
6.1.2 L’espace L∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
6.1.3 Quelques propriétés des espaces Lp , 1 ≤ p ≤ +∞ . . . . . . . . . . . . . . . . . . . 139
6.2 Analyse hilbertienne et espace L2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
6.2.1 Définitions et propriétés élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . 141
6.2.2 Projection sur un convexe fermé non vide . . . . . . . . . . . . . . . . . . . . . . . 146
6.2.3 Théorème de Représentation de Riesz . . . . . . . . . . . . . . . . . . . . . . . . . 151
6.2.4 Bases hilbertiennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
6.3 Dualité dans les espaces Lp , 1 ≤ p ≤ ∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
6.3.1 Dualité pour p = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
6.3.2 Dualité pour 1 ≤ p ≤ ∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
6.3.3 Théorème de Radon-Nikodym . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
6.4 Convergence faible, faible-?, étroite, en loi. . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.4.1 Convergence faible et faible-? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.4.2 Convergence étroite et convergence en loi . . . . . . . . . . . . . . . . . . . . . . . 169
6.4.3 Lois des grands nombres, théorème central limite . . . . . . . . . . . . . . . . . . . 170
6.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
6.5.1 Espaces Lp , 1 ≤ p ≤ ∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
6.5.2 Espaces de Hilbert, Espace L2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
6.5.3 Théorème de Radon-Nikodym et Dualité dans les espaces Lp . . . . . . . . . . . . 180
6.5.4 Convergence faible, faible-?, étroite, en loi. . . . . . . . . . . . . . . . . . . . . . . . 185

2
7 Produits d’espaces mesurés 194
7.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
7.2 Mesure produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
7.3 Théorèmes de Fubini-Tonelli et Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
7.4 Mesure de Lebesgue sur la tribu des boréliens de RN . . . . . . . . . . . . . . . . . . . . . 203
7.5 Convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
7.6 Formules de changement de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
7.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
7.7.1 Mesure produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
7.7.2 Fubini-Tonelli et Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
7.7.3 Mesure de Lebesgue sur B(RN ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
7.7.4 Convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
7.7.5 Changement de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217

8 Densité, séparabilité, et compacité dans les espaces Lp (Ω) 221


8.1 Théorèmes de densité pour les espaces Lp (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . 221
8.1.1 Densité des fonctions Cc (Ω, R) dans Lp (Ω) . . . . . . . . . . . . . . . . . . . . . . 221
8.1.2 Régularisation par convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
8.1.3 Densité de Cc∞ (Ω, R) dans Lp (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
8.2 Séparabilité de Lp (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
8.3 Compacité dans les espaces Lp (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
8.4 Propriété de compacité faible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
8.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226

9 Vecteurs aléatoires 230


9.1 Définition, propriétés élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
9.2 Indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
9.3 Vecteurs gaussiens, théorème central limite . . . . . . . . . . . . . . . . . . . . . . . . . . 236
9.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
9.4.1 Définition, propriétés élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
9.4.2 Indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
9.4.3 Vecteurs gaussiens, théorème central limite . . . . . . . . . . . . . . . . . . . . . . 240

10 Transformation de Fourier, fonction caractéristique 242


10.1 Introduction et notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
10.2 Transformation de Fourier dans L1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
10.2.1 Définitions et premières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
10.2.2 Théorème d’inversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
10.2.3 Régularité et décroissance à l’infini . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
10.3 Transformée de Fourier d’une mesure signée . . . . . . . . . . . . . . . . . . . . . . . . . . 246
10.4 Transformation de Fourier dans L2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
10.5 Résolution d’une EDO ou d’une EDP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
10.6 Fonction caractéristique d’un vecteur aléatoire . . . . . . . . . . . . . . . . . . . . . . . . 250
10.7 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
10.7.1 Transformation de Fourier dans L1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
10.7.2 Transformée de Fourier d’une mesure signée . . . . . . . . . . . . . . . . . . . . . . 253
10.7.3 Transformation de Fourier dans L2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
10.7.4 Fonction Caractéristique d’une v.a.r. . . . . . . . . . . . . . . . . . . . . . . . . . . 254

3
11 Espérance conditionnelle et martingales 256
11.1 Espérance conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
11.2 Martingales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
11.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
11.3.1 Espérance conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
11.3.2 Martingales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266

12 Corrigés d’exercices 268


12.1 Exercices du chapitre 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
12.2 Exercices du chapitre 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
12.2.1 Tribus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
12.2.2 Mesures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
12.2.3 Probabilités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
12.3 Exercices du chapitre 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311
12.3.1 Fonctions mesurables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311
12.4 Exercices du chapitre 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
12.4.1 Intégrale sur M+ et sur L1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
12.4.2 Espace L1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
12.4.3 Espérance et moments des variables aléatoires . . . . . . . . . . . . . . . . . . . . . 363
12.5 Exercices du chapitre 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368
12.6 Exercices du chapitre 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382
12.6.1 Espaces Lp , 1 ≤ p ≤ ∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382
12.6.2 Espaces de Hilberts, espace L2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399
12.6.3 Théorème de Radon-Nikodym et Dualité dans les espaces Lp . . . . . . . . . . . . 414
12.6.4 Convergence faible, faible-?, étroite, en loi. . . . . . . . . . . . . . . . . . . . . . . . 423
12.7 Exercices du chapitre 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
12.7.1 Mesure produit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
12.7.2 Fubini-Tonelli et Fubini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447
12.7.3 Mesure de Lebesgue sur B(RN ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451
12.7.4 Convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 460
12.7.5 Changement de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464
12.8 Exercices du chapitre 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471
12.9 Exercices du chapitre 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480
12.9.1 Définition, propriétés élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 480
12.9.2 Indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481
12.9.3 Vecteurs gaussiens, théorème central limite . . . . . . . . . . . . . . . . . . . . . . 485
12.10Exercices du chapitre 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 487
12.10.1 Transformée de Fourier dans L1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 487
12.10.2 Transformée de Fourier d’une mesure signée . . . . . . . . . . . . . . . . . . . . . . 489
12.10.3 Fonction caractéristique d’un v.a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 490
12.11Exercices du chapitre 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493
12.11.1 Espérance conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493
12.11.2 Martingales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497

4
Chapter 1

Motivation et objectifs

Nous commençons par donner ici un aperçu des motivations de la théorie de l’intégration, en montrant
d’abord les limitations de l’intégrale des fonctions continues (sur un intervalle compact de R). L’intégrale
de Riemann possède essentiellement les mêmes limitations.

1.1 Intégrale des fonctions continues


Nous présentons ici quelques rappels sur l’intégrale des fonctions continues sur un intervalle compact de
R. Nous montrons pourquoi cette théorie de l’intégrale des fonctions continues semble insuffisante.
Nous nous limitons à l’étude des fonctions définies sur l’intervalle [0, 1] à valeurs dans R. Nous allons en
fait définir l’intégrale des fonctions réglées (on appelle fonction réglée une fonction qui est limite uniforme
d’une suite de fonctions “en escalier”). Ceci nous donnera l’intégrale des fonctions continues car toute
fonction continue est réglée (voir l’exercice 1.2). La définition de l’intégrale des fonctions réglées (comme
celle de l’intégrale de Riemann, qui sera rappelée dans l’exercice 5.3, et celle de l’intégrale de Lebesgue)
peut être vue en 3 étapes, qui, ici, s’écrivent :
1. Mesurer les intervalles de [0, 1]. Pour 0 ≤ α ≤ β ≤ 1, on pose m(]α, β[) = β − α.
2. Intégrer les fonctions en escalier. Soit f : [0, 1] → R, une fonction en escalier. Ceci signifie qu’il
existe p ∈ N? , une famille (αi )i∈{0,...,p} , avec : α0 = 0, αi < αi+1 , pour tout i ∈ {0, . . . , p − 1},
αp = 1, et une famille (ai )i∈{0,...,p−1} ⊂ R tels que :
f (x) = ai , ∀x ∈]αi , αi+1 [, ∀i ∈ {0, . . . , p − 1}. (1.1)
On pose alors :
Z 1 p−1
X
f (x)dx = ai m(]αi , αi+1 [). (1.2)
0 i=0

On montre que la définition précédente est bien cohérente, c’est-à-dire que l’intégrale de f ne dépend
que du choix de f et non du choix des αi (voir l’exercice 1.2).
3. “Passer à la limite”. Soit f : [0, 1] → R, une fonction réglée, il existe une suite (fn )n∈N de fonctions
en escalier convergeant uniformément vers f . On pose :
Z 1
In = fn (x)dx. (1.3)
0

5
On peut montrer que la suite (In )n∈N est de Cauchy (dans R). On pose :
Z 1
f (x)dx = lim In . (1.4)
0 n→∞

On montre que cette définition est cohérente car limn→∞ In ne dépend que de f et non du choix
de la suite (fn )n∈N (voir l’exercice 1.2).
Remarque 1.1 Un des intérêts de la méthode présentée ci dessus est qu’elle permet aussi de définir
(sans travail supplémentaire) l’intégrale de fonctions continues de [0, 1] (ou d’un intervalle compact de
R) dans E, où E est un espace de Banach (c’est-à-dire un espace vectoriel normé complet sur R ou C).
Les méthodes de Riemann (voir l’exercice 5.3) et de Lebesgue (présentée dans ce cours) sont “limitées” à
des fonctions prenant leurs valeurs dans R car elles utilisent fortement la relation d’ordre dans R (elles
redonnent, dans le cas de fonctions continues de [0, 1] dans R, la même intégrale que ci-dessus). Pour
l’intégrale de Lebesgue, il faut alors un travail supplémentaire pour développer une théorie de l’intégration
pour des fonctions prenant leurs valeurs dans un espace de Banach (lorsque cet espace est de dimension
infinie, le cas où l’espace est de dimension finie reste simple car on est alors amené à considérer un nombre
fini d’intégrales à valeurs dans R).

1.2 Insuffisance de l’intégrale des fonctions continues


R1
On note E l’ensemble des fonctions continues de [0, 1] dans R. On a ainsi défini 0 f (x)dx pour tout
f ∈ E (car l’ensemble des fonctions continues est contenu dans l’ensemble des fonctions réglées).
1. Théorèmes de convergence Un inconvénient important de la théorie de l’intégration exposée ci-
dessus est que les théorèmes “naturels” de convergence pour cette théorie sont peu efficaces. A vrai
dire, le seul théorème “simple” est le théorème suivant : Soient (fn )n∈N ⊂ E et f ∈ E. On a alors :
Z 1 Z 1
fn → f uniformément quand n → ∞ ⇒ fn (x)dx → f (x)dx quand n → ∞. (1.5)
0 0

On rappelle que (fn )n∈N converge simplement vers f si :


∀ε > 0, ∀x ∈ [0, 1], ∃N (ε, x); n ≥ N (ε, x) ⇒ |fn (x) − f (x)| ≤ ε

et que (fn )n∈N converge uniformément vers f si :

∀ε > 0, ∃N (ε); n ≥ N (ε), x ∈ [0, 1] ⇒ |fn (x) − f (x)| ≤ ε.


Ce théorème est assez “faible”. Une conséquence de la théorie de l’intégrale de Lebesgue est le
théorème suivant (beaucoup plus fort que le précédent) : Soient (fn )n∈N ⊂ E, et f ∈ E. On a
alors :

fn → f simplement quand n → ∞, |fn (x)| ≤ 1, ∀x ∈ [0, 1], ∀n ∈ N


R1 R1 (1.6)
⇒ 0 fn (x)dx → 0 f (x)dx quand n → ∞.
Ce résultat est une conséquence immédiate du théorème de “convergence dominée”, il peut être
démontré sans utiliser la théorie de l’intégrale de Lebesgue, mais cela est difficile : c’est l’objet de
l’exercice 1.11. (Noter aussi qu’il est facile de voir que l’on peut remplacer, dans (1.6), |fn (x)| ≤ 1
par |fn (x)| ≤ M pourvu que M soit indépendant de n et x.)

6
2. Espaces non complets. Pour f ∈ E on pose (en remarquant que |f | ∈ E et f 2 ∈ E) :
Z 1
N1 (f ) = |f (x)|dx, (1.7)
0
Z 1 1
N2 (f ) = (f (x))2 dx 2 . (1.8)
0

Les applications N1 et N2 sont des normes sur E (voir l’exercice 1.6). Malheureusement l’espace E,
muni de la norme N1 (ou de la norme N2 ), n’est pas vraiment intéressant en pratique, en particulier
parce que cet espace n’est pas complet (c’est-à-dire qu’une suite de Cauchy n’est pas nécessairement
convergente). Ce n’est pas un espace de Banach (un espace de Banach est un espace vectoriel normé
complet). La norme N2 sur E est induite par un produit scalaire mais, muni de cette norme, E n’est
pas un espace de Hilbert (un espace de Hilbert est un espace de Banach dont la norme est induite
par un produit scalaire, pour tous ces résultats, voir l’exercice 1.6). En fait L’espace vectoriel des
fonctions continues de [0, 1] dans R est intéressant lorsqu’il est muni de la norme de la convergence
uniforme, c’est-à-dire kf ku = supx∈[0,1] |f (x)|, avec laquelle il est complet, c’est donc alors un espace
de Banach.

Si l’on travaille avec l’ensemble des fonctions réglées plutôt que l’ensemble des fonctions continues, on
n’échappe pas vraiment aux inconvénients cités précédemment (N1 et N2 sont d’ailleurs alors des semi-
normes). On peut aussi généraliser la définition de l’intégrale ci-dessus en améliorant un peu l’étape 3
(passage à la limite), cette généralisation se fait en introduisant les “sommes de Darboux” (alors que
l’intégrale des fonctions continues peut être définie en utilisant seulement les “sommes de Riemann”). On
obtient ainsi la définition de l’intégrale des fonctions dites “Riemann-intégrables” (voir l’exercice 5.3). En
fait cette généralisation est assez peu intéressante, et les inconvénients sont les mêmes que pour l’intégrale
des fonctions continues (ou des fonctions réglées).

1.3 Les probabilités


La théorie des probabilités s’est développée dans le but de “modéliser” les phénomènes aléatoires, c’est à
dire de développer un formalisme mathématique pour exprimer les problèmes posés par ces phénomènes.
En particulier, l’un des problèmes est de mesurer “la chance” d’un certain “évènement” de se réaliser. Une
partie importante de ces phénomènes est de nature “discrète”, c’est à dire qu’il existe une injection de
l’ensemble des “cas possibles” dans N. Lorsque de plus l’ensemble des “cas possibles” ou des “éventualités”
est fini, le calcul des probabilités se ramène à des problèmes de dénombrement. Par contre, lorsque
l’ensemble des “éventualités” est de nature infinie non-dénombrable, on aura besoin, pour définir une
probabilité, de la théorie de la mesure. Les liens qui existent entre la théorie des probabilités et la
théorie de la mesure et de l’intégration sont nombreux, mais malheureusement, le vocabulaire est souvent
différent. Nous essaierons ici de montrer clairement les liens entre les deux théories et de donner un
“dictionnaire” probabilités-intégration.

1.4 Objectifs
L’objectif est de construire une théorie de l’intégration donnant des théorèmes de convergence efficaces et
de “bons” espaces fonctionnels, comme, par exemple, l’espace L2R (E, T, m) qui est un espace de Hilbert.
La démarche pour construire cette théorie va être très voisine de celle que l’on a utilisée pour l’intégrale

7
des fonctions réglées (ou pour l’intégrale de Riemann, cf. Exercice 5.3). Elle va suivre 3 étapes, que nous
pouvons (dans le cas, par exemple, des fonctions de R dans R) décrire ainsi :

1. Mesurer “presque toutes” les parties de R (et pas seulement les intervalles).
2. Définir l’intégrale des fonctions étagées, c’est-à-dire des fonctions de R dans R ne prenant qu’un
nombre fini de valeurs (et pas seulement des fonctions en escalier).

3. Par un “passage à la limite”, définir l’intégrale des fonctions limites (en un sens convenable) de
fonctions étagées.

Pour être plus précis, dans l’étape 1 ci-dessus, on cherche une application λ : P(R) → R+ , où P(R)
désigne l’ensemble des parties de R, t.q. :

λ(]α, β[) = β − α, pour tout α, β ∈ R, α ≤ β. (1.9)


X
λ(∪n∈N An ) = λ(An ), pour toute famille (An )n∈N ⊂ P(R) t.q. An ∩ Am = ∅ si n 6= m. (1.10)
n∈N
P P∞
(Dans toute la suite de ce cours, la notation n∈N est identique à n=0 .)
Une telle application sur P(R) n’existe pas (voir l’exercice 2.24), mais elle existe si on se limite à une
partie “convenable” de P(R), par exemple, la tribu de Borel définie dans la suite.
Pour l’étape 2, on intégrera les fonctions prenant un nombre fini de valeurs et pour lesquelles chaque
“étage” est dans la tribu de Borel. De telles fonctions seront dites “étagées”.
Enfin, à l’étape 3, l’idée principale est de définir l’intégrale des fonctions positives qui sont “limites
croissantes” d’une suite de fonctions étagées (on remplace donc la convergence uniforme utilisée pour la
définition de l’intégrale des fonctions réglées par une convergence “simple, en croissant”).

La théorie de l’intégration que nous allons ainsi obtenir contient (pour les fonctions d’un intervalle compact
de R dans R) la théorie de l’intégrale de Riemann (cf. Exercice 5.3) qui contient elle-même la théorie de
l’intégrale des fonctions réglées (et la donc la théorie de l’intégrale des fonctions continues).

Ce cours est divisé en 10 chapitres :

• Le chapitre 2 est une introduction à la théorie de la mesure ; on y définit en particulier l’application λ


nécessaire pour mesurer les parties de R. On y introduit aussi les premières notions de probabilités.
• Dans le chapitre 3, on introduit le concept de fonction mesurable, et son synonyme “probabiliste”,
i.e. le concept de “variable aléatoire”, qui est une notion fondamentale pour le calcul des probabilités.
On y définit les notions de convergence “presque partout” et son synonyme probabiliste “presque
sûre”, et de convergence “en mesure” et son synonyme probabiliste convergence “stochastique”.
• On définit au chapitre 4 l’intégrale sur un espace mesuré (suivant les étapes 1 à 3 définies plus
haut), et l’espérance des variables aléatoires en théorie des probabilités. On définit également dans
ce chapitre la notion de convergence en moyenne.
• On s’intéresse au chapitre 5 aux mesures définies sur les boréliens de R et aux propriétés particulières
de l’intégrale définies sur R. On y étudie les lois probabilités “de densité”.

8
• On étudie au chapitre 6 les espaces “Lp ”, ensembles des (classes de) “fonctions mesurables de puis-
sance p-ième intégrable, et plus particulièrement l’espace L2 , qui est un espace de Hilbert. On
donne des résultats de dualité et on introduit les notions de convergence “faible” et de convergence
“étroite” (pour les probabilités).
• Le chapitre 7 est consacré au produits d’espaces mesurés, à l’intégration de fonctions de plusieurs
variables, au produit de convolution
• Dans le chapitre 8, on revient sur l’étude des espaces Lp dans le cas particulier de la mesure de
Lebesgue sur les boréliens d’un ouvert de RN . On donne des résultats de densité, de séparabilité et
de compacité.
• Le chapitre 9 est consacré aux vecteurs aléatoires. On y généralise des notions vues pour les variables
aléatoires réelles.
• Le chapitre 10 est consacré à l’étude de la transformée de Fourier des fonctions de L1 (classes
de fonctions mesurables intégrables au sens de Lebesgue sur RN ) et de L2 (classes de fonctions
mesurables “de carré intégrable” au sens de Lebesgue sur RN ) et des mesures. On introduit la
“fonction caractéristique” de la théorie des probabilités.
• Le chapitre 11 est conscré à l’espérance conditionnelle et aux martingales.
• Le chapitre 12 contient des corrigés d’exercices.

1.5 Exercices
Exercice 1.1 (Convergences simple et uniforme) Corrigé 1 page 268
Construire une suite (fn )n∈N ⊂ C([0, 1], R) et f ∈ C([0, 1], R) t.q. fn → f simplement, quand n → ∞, et
fn 6→ f uniformément, quand n → ∞.
Exercice 1.2 (Intégrale d’une fonction continue) Corrigé 2 page 268
Une fonction g : [0, 1] → R est dite “en escalier” s’il existe n ≥ 1 et x0 , . . . , xn t.q. 0 = x0 < x1 < ... <
xn−1 < xn = 1 et g constante sur chaque intervalle ]xi , xi+1 [, 0 ≤ i ≤ n − 1.
Z 1 n−1
X
Pour g en escalier et x0 , . . . , xn comme dans la définition ci dessus, on pose g(x)dx = ai (xi+1 −xi ),
0 i=0
où ai est la valeur prise par g sur ]xi , xi+1 [.
1. Montrer que la définition précédente est bien cohérente, c’est-à-dire que l’intégrale de g ne dépend
que du choix de g et non du choix des xi . Montrer que l’application qui à g associe l’intégrale de g
est linéaire de l’ensemble des fonctions en escalier dans R.
2. Soit f ∈ C([0, 1], R).

(a) Construire une suite de fonctions en escalier (fn )n∈N t.q. f soit limite uniforme de (fn )n∈N
lorsque n → +∞.
(b) Soit (fn )n∈N une suite de fonctions en escalier t.q. f soit limite uniforme de (fn )n∈N lorsque
n → +∞. Montrer que la suite (In )n∈N ⊂ R, où In est l’intégrale de la fonction en escalier fn ,
converge. Enfin, montrerZ que la limite I = limn→∞ In ne dépend que de f , et non de la suite
1
(fn )n∈N . On pose alors f (x)dx = I.
0

9
3. Montrer que l’application qui à f associe l’intégrale de f est linéaire de C([0, 1], R) dans R et que,
Z 1 Z 1
pour tout f ∈ C([0, 1], R), on a | f (x)dx| ≤ |f (x)|dx ≤ max |f (x)|.
0 0 x∈[0,1]

Exercice 1.3 (Propriétés de l’intégrale des fonctions continues) Corrigé 3 page 271
Soit (ϕn )n∈N ⊂ C([0, 1], R) et ϕ ∈ C([0, 1], R). On suppose que ϕn → ϕ simplement quand n → ∞.
Z 1 Z 1 Z 1
1. Montrer que si lim |ϕn (x) − ϕ(x)| dx → 0, alors lim ϕn (x) dx = ϕ(x) dx.
n→∞ 0 n→∞ 0 0
Z 1 Z 1
2. Montrer que si (ϕn )n∈N converge uniformément vers ϕ, alors lim ϕn (x) dx = ϕ(x) dx.
n→∞ 0 0

3. Donner un exemple de suite (ϕn )n∈N qui converge vers ϕ simplement, mais non uniformément, t.q.
Z 1 Z 1
lim ϕn (x) dx = ϕ(x) dx.
n→∞ 0 0
Z 1
4. Donner un exemple de suite (ϕn )n∈N qui converge simplement vers ϕ t.q. lim ϕn (x) dx 6=
n→∞ 0
Z 1
ϕ(x) dx.
0

5. Si la suite (ϕn )n∈N satisfait les deux conditions :


(a) Pour tout ε, 0 < ε < 1, (ϕn )n∈N converge uniformément vers ϕ sur [ε, 1],
(b) Les ϕn sont à valeurs dans [−1, +1],
Z 1 Z 1
montrer que lim ϕn (x) dx = ϕ(x) dx.
n→∞ 0 0

x n
6. Vérifier que la suite de fonctions définies par ϕn (x) = satisfait les conditions énoncées à la
1 + nx2
question 5. Donner l’allure générale du graphe de ces fonctions pour des petites valeurs de n; que
devient le graphe lorsque n → ∞?
7. On suppose maintenant que la suite (ϕn )n∈N vérifie l’hypothèse suivante:
Z 1
lim |ϕn (x) − ϕ(x)|2 dx = 0. (1.11)
n→∞ 0

Z 1
A-t-on lim |ϕn (x)−ϕ(x)|dx dx = 0 ? [On pourra par exemple utiliser (après l’avoir démontrée)
n→∞ 0
l’inégalité suivante: pour tout ε > 0, il existe cε ≥ 0, ne dépendant que de ε, t. q. a ≤ ε + cε a2 .]
Z 1
8. Même question que ci dessus en remplaçant l’hypothèse (1.11) par : ∃p > 1; lim |ϕn (x) −
n→∞ 0
ϕ(x)|p dx = 0.

10
9. On suppose qu’il existe C > 0 tel que
Z 1
|ϕn (x)|2 dx ≤ C, ∀n ∈ N, (1.12)
0

et que la suite (ϕn )n∈N converge uniformément sur [ε, 1], pour tout ε > 0. Montrer que
Z 1
lim |ϕn (x) − ϕ(x)|dx = 0.
n→∞ 0

10. Construire un exemple de suite (ϕn )n∈N qui satisfasse aux hypothèses de la question précédente et
qui ne soit pas bornée (donc qui ne satisfasse pas aux hypothèses de la question 5).
Z 1
11. Peut-on remplacer l’hypothèse (1.12) par : il existe p > 1 et C > 0 t.q. |ϕn (x)|p dx ≤ C, pour
0
tout n ∈ N ?
Z 1
12. Peut-on remplacer l’hypothèse (1.12) par : il existe C > 0 t.q. |ϕn (x)|dx ≤ C, pour tout n ∈ N ?
0

Exercice 1.4 (Discontinuités d’une fonction croissante)


Soit f une fonction croissante de R dans R.

1. Montrer que f a une limite à droite et une limite à gauche en tout point. On note f (x+ ) et f (x− )
ces limites au point x.
2. Montrer que l’ensemble des points de discontinuité de f est au plus dénombrable. [On pourra
considérer, pour n ∈ N, les ensembles An = {x ∈ [0, 1], f (x+ ) − f (x− ) ≥ (f (1+ ) − f (0− ))/n}.]

Exercice 1.5 (Fonctions réglées)


Une fonction réelle définie sur [a, b] (−∞ < a < b < +∞) est dite réglée si elle est la limite uniforme
d’une suite de fonctions en escalier sur [a, b].

1. Montrer que l’ensemble des points de discontinuité d’une fonction réglée est au plus dénombrable.
2. Montrer qu’une fonction f : [a, b] −→ R est réglée sur [a, b] si et seulement si elle admet des limites
à droite et à gauche en tout point de ]a, b[, à droite en a, à gauche en b.

Exercice 1.6 (Normes définies par l’intégrale) Corrigé 4 page 274


Soit E = C([−1, 1], R) l’espace vectoriel des fonctions continues de [−1, +1] dans R. Pour ϕ ∈ E, on pose
R +1 R  21
+1
kϕk1 = −1 |ϕ(t)| dt et kϕk2 = −1 |ϕ(t)|2 dt .

1. Montrer que (E, k · k1 ) est un espace normé.


2. Pour n ∈ N, on définit ϕn ∈ E par


 0 si −1 ≤ x ≤ 0



1
ϕn (x) = nx si 0≤x≤ n



 1
1 si ≤x≤1

n

11
(a) Montrer que si (ϕn )n∈N converge vers ϕ dans (E, k · k1 ), alors ϕ(x) = 0 si x < 0 et ϕ(x) = 1
si x > 0.
(b) En déduire que (E, k · k1 ) n’est pas complet.

3. Montrer que (E, k · k2 ) est un espace préhilbertien (c’est-à-dire que sa norme est induite par un
produit scalaire) mais n’est pas complet (ce n’est donc pas un espace de Hilbert).

Exercice 1.7 (Rappels sur la convergence des suites réelles) Corrigé 5 page 276

1. Soit u = (un )n∈N une suite à valeurs dans R. On rappelle que lim supn→∞ un = limn→∞ supp≥n up .
Montrer que lim supn→∞ un est la plus grande valeur d’adhérence de u.
2. Si u = (un )n∈N est une suite à valeurs dans R, on sait (conséquence du résultat de la question
précédente) qu’il existe une suite extraite de u qui converge vers lim supn→∞ un . Donner un exemple
d’une suite de fonctions (fn )n∈N de R dans R t.q. aucune sous suite ne converge simplement vers
lim supn→∞ fn (qui est définie par (lim supn→∞ fn )(x) = lim supn→∞ (fn (x)) pour tout x ∈ R).
3. Trouver l’ensemble des valeurs d’adhérence d’une suite (un )n∈N t.q.:
lim inf n→∞ un = 0, lim supn→∞ un = 1 et limn→∞ |un+1 − un | = 0.
Donner un exemple d’une telle suite.

Exercice 1.8 (Fonctions caractéristiques d’ensembles) Corrigé 6 page 277


Soit E un ensemble. Lorsque A est une partie de E, on définit 1A : E → R par :

1A (x) = 1, si x ∈ A,
(1.13)
1A (x) = 0, si x 6∈ A.
1A est appelée “fonction caractéristique de A” (elle est souvent aussi notée χA ).

1. Montrer que si A et B sont deux sous-ensembles disjoints de E, alors 1A∪B = 1A + 1BP . En déduire
que si (An )n∈N est une suite de sous-ensembles P de E deux à deux disjoints, on a n∈N 1An =
1∪n∈N An (on précisera aussi le sens donné à “ n∈N 1An ”).
2. Montrer que si B ⊂ A ⊂ E, on a 1A\B = 1A − 1B .
3. Montrer que, pour A et B sous-ensembles de E, on a 1A∩B = 1A 1B .
4. Soit f : E → R une fonction ne prenant qu’un nombre fini de valeurs. Montrer que f s’écrit
comme combinaison linéaire de fonctions caractéristiques.

Exercice 1.9 (Intégrale “impropre” de fonctions continues) Ra


Soit f ∈ C(R, R+ ) (fonction continue de R dans R+ ). On suppose que lima→+∞ 0 f (x) dx existe dans
Ra
R (on a utilisé l’intégrale des fonctions continues sur [0, a] pour définir 0 f (x) dx).

1. A-t-on limx→+∞ f (x) = 0 ?


2. Montrer que si f admet une limite en +∞, alors limx→+∞ f (x) = 0.
3. Montrer que si f est uniformément continue, alors f admet une limite en +∞ et donc que :

lim f (x) = 0.
x→+∞

12
4. Donner un exemple de fonction f t.q. f (x) 6→ 0 qand x → ∞ (et qui vérifie les hypothèses de
l’exercice !).
Ra
5. On suppose, dans cette question, que f ∈ C 1 (R, R) et que lima→+∞ 0 f 0 (t) dt existe dans R.
Montrer que limx→+∞ f (x) = 0.
R x+h
6. Montrer que pour tout h > 0, limx→+∞ x f (t) dt = 0.

Exercice 1.10 (Limite uniforme dans R) Corrigé 7 page 278


Soit (fn )n∈N ⊂ C(R+ , R+ ). On suppose que (fn )n∈N converge uniformément vers f (de sorte que f ∈
C(R+ , R+ )).
Ra R +∞
1. On suppose que, pour n ∈ N, lima→+∞ 0 fn (x) dx existe dans R. On note 0 fn (x) dx cette
limite.
Ra
Montrer, en donnant un exemple, que lima→+∞ 0 f (x) dx peut ne pas exister dans R.
R +∞ Ra
2. On suppose de plus que limn→∞ 0 fn (x) dx existe dans R et que lima→+∞ 0 f (x) dx existe dans
R +∞
R. On note alors 0 f (x) dx cette dernière limite. A-t-on
Z +∞ Z +∞
lim fn (x) dx = f (x) dx ?
n→∞ 0 0

Exercice 1.11 (Convergence dominée et intégrale des fonctions continues)


(Cet exercice est extrait de l’examen d’analyse du concours d’entrée à l’ENSL, 1993)
On note E = C([0, 1], R) l’ensemble des fonctions continues sur [0, 1] à valeurs réelles. Pour f ∈ E, on
pose kf k∞ = supx∈[0,1] |f (x)|. Noter que l’application f 7→ kf k∞ est bien une norme.
Pour f : [0, 1] → R, on définit f + par f + (x) = max(f (x), 0) (pour tout x ∈ [0, 1]), et f − = (−f )+ (de
sorte que f (x) = f + (x) − f − (x) et |f (x)| = f + (x) + f − (x)). Soient f et g deux applications de R dans R
(ou dans R ∪ {+∞}), On dit que f ≥ g si f (x) ≥ g(x) pour tout x ∈ [0, 1]. On désigne par 0 la fonction
(définie sur R) identiquement nulle. On pose E + = {f ∈ E, f ≥ 0}. Soit T : E → R une application
linéaire. On dit que T est positive si :

f ∈ E, f ≥ 0 ⇒ T (f ) ≥ 0.

Soit T : E → R une application linéaire positive.

1. Montrer que T est continue de (E, k.k∞ ) dans R. [Indication : On pourra remarquer que, pour tout
f ∈ E, T (f ) ≤ T (1)kf k∞ , où 1 désigne la fonction constante et égale à 1 sur [0, 1].]
2. Soient (fn )n∈N ⊂ E et f ∈ E telles que fn+1 ≥ fn , pour tout n ∈ N, et lim fn (x) = f (x), pour
n→+∞
tout x ∈ [0, 1]. Montrer que fn tend vers f uniformément sur R.
[Indication : Soit ε > 0, on pourra introduire, pour n ∈ N, On = {x ∈ [0, 1] ; f (x) − fn (x) < ε} et
utiliser la compacité de [0, 1].]
En déduire que T (fn ) → T (f ), quand n → +∞.
3. Soient (fn )n∈N ⊂ E et g ∈ E telles que fn+1 ≥ fn , pour tout n ∈ N, et g(x) ≤ lim fn (x)
n→+∞
(∈ R ∪ {+∞}), pour tout x ∈ [0, 1].
Montrer que T (g) ≤ lim T (fn ).
n→+∞

13
4. Soit f : R → R ∪ {+∞}, on dit que f ∈ A+ si il existe (fn )n∈N ⊂ E t.q. fn+1 ≥ fn , pour tout
n ∈ N, lim fn (x) = f (x), pour tout x ∈ [0, 1] et lim T (fn ) < +∞.
n→+∞ n→+∞

+
5. Soit f ∈ A , montrer que sup (T (g)) < +∞.
g∈E, g≤f

On définit T sur A+ par T (f ) = sup (T (g)) (noter que ceci est compatible avec la définition de
g∈E, g≤f
+
T sur E.) Noter aussi que si f, g ∈ A , alors : f ≥ g ⇒ T (f ) ≥ T (g).

6. (“Convergence croissante.”) Soient (fn )n∈N ⊂ A+ et f : R → R ∪ {+∞} telles que fn+1 ≥ fn , pour
tout n ∈ N, lim fn (x) = f (x), pour tout x ∈ [0, 1] et lim T (fn ) < +∞. Montrer que f ∈ A+
n→+∞ n→+∞
et T (f ) = lim T (fn ).
n→+∞

[Indication : Considérer gp = sup (fp,n ), avec, pour tout n ∈ N, (fp,n )p∈N ⊂ E t.q. fp+1,n ≥ fp,n ,
0≤n≤p
pour tout p ∈ N, lim fp,n (x) = fn (x), pour tout x ∈ [0, 1].]
p→+∞

7. (“Convergence décroissante.”) Soient (fn )n∈N ⊂ A+ et f ∈ E telles que fn+1 ≤ fn , pour tout n ∈ N,
et lim fn (x) = f (x), pour tout x ∈ [0, 1]. Montrer que T (f ) = lim T (fn ).
n→+∞ n→+∞
+
[Indication : On pourra montrer que, pour tout ε > 0 et pour tout n ∈ N, il existe P hn ∈ A
ε
t.q. hn ≥ fn − fn+1 et T (hn ) ≤ T (fn ) − T (fn+1 ) + 2n . Puis, en remarquant que n∈N hn (x) ≥
f0 (x)−f (x), pour tout x ∈ [0, 1], et en utilisant la question III 4, montrer que T (f ) ≥ lim T (fn ).]
n→+∞

8. (“Convergence dominée.”) Soient (gn )n∈N ⊂ E et g ∈ E telles que :


1. gn (x) → g(x), quand n → +∞, pour tout x ∈ [0, 1].
2. |gn (x)| ≤ 1, pour tout x ∈ [0, 1] et pour tout n ∈ N.
Montrer que T (g) = lim T (gn ).
n→+∞

[Indication : On pourra utiliser la question III 5 avec fn = sup gp − inf gp et remarquer que
p≥n p≥n
g − gn ≤ fn et gn − g ≤ fn .]
9. (Exemple.) En choisissant convenablement T , montrer le résultat suivant :
Soient (fn )n∈N ⊂ E et f ∈ E telles que :
1. fn (x) → f (x), quand n → +∞, pour tout x ∈ [0, 1].
2. |fn (x)| ≤ 1, pour tout x ∈ [0, 1] et pour tout n ∈ N.
Z 1 Z 1
alors fn (x)dx → f (x)dx, quand n → +∞.
0 0
Donner un contre exemple à ce résultat si la deuxième hypothèse n’est pas vérifiée.

Exercice 1.12 (Théorème de Bernstein)


On veut démontrer ici le théorème suivant :

Théorème 1.1 (Bernstein) Soient E et F des ensembles quelconques, alors il existe une bijection de
E dans F si et seulement si il existe une injection de E dans F et une injection de F dans E.

14
Le sens (i) ⇒ (ii) est évident, on va donc supposer qu’il existe une injection f de E dans F et une
injection g de F dans E, et on veut construire une bijection de E dans F . Soit x ∈ E donné. On pose
x0 = x, et on construit par récurrence une suite Cx = (xk )k=k(x),+∞ ⊂ E ∪ F , avec k(x) ∈ R ∪ {−∞} de
la manière suivante :
pour k ≥ 0, on pose x2k+1 = f (x2k ), et x2k+2 = f (x2k+1 ) ; si x−k n’a pas d’antécédant par g ou
par f (selon que xk ∈ E ou ∈ F , on pose k(x) = k, sinon, on pose x−k−1 = g −1 (x−k ) si xk ∈ E et
x−k−1 = f −1 (x−k ) si xk ∈ F .
On définit ainsi Cx = {xk , k = k(x), +∞}. On définit l’application ϕ de E dans F par : ϕ(x) = f (x) si
k(x) est pair et ϕ(x) = g −1 (x) si k(x) est impair. Montrer que ϕ ainsi définie est une bijection de E dans
F.

Exercice 1.13 (Limites sup et inf d’ensembles) Corrigé 8 page 279


Soit (An )n∈N une suite de parties d’un ensemble E. On note
[ \ \ [
lim inf An = Ap et lim sup An = Ap .
n→∞ n→∞
n∈N p≥n n∈N p≥n

1. On suppose la suite (An )n∈N monotone, c’est-à-dire que An ⊂ An+1 , pour tout n ∈ N, ou que
An+1 ⊂ An , pour tout n ∈ N. Que sont lim inf n→∞ An et lim supn→∞ An ?
2. Même question que précédemment si la suite est définie par : A2p = A et A2p+1 = B, p ∈ N, A et
B étant deux parties données de E.
3. Montrer que:
1lim supn→∞ An = lim sup 1An ,
n→∞

lim inf An ⊂ lim sup An ,


n→∞ n→∞

+∞
X
lim inf An = {x ∈ E; 1Acn (x) < ∞} ,
n→∞
n=0

+∞
X
lim sup An = {x ∈ E; 1An (x) = ∞} .
n→∞
n=0

Exercice 1.14 (Caractérisation des ouverts de R) (?)


On va montrer ici que tout ouvert de R est une union au plus dénombrable (c’est-à-dire finie ou dénom-
brable) d’intervalles ouverts disjoints deux à deux (la démonstration de ce résultat est donnée dans la
démonstration du lemme 2.4 page 35). Soit O un ouvert de R . On définit, pour x et y ∈ R, la relation:
x  y si {tx + (1 − t)y, t ∈ [0, 1]} ⊂ O. Vérifier que  est une relation d’équivalence. Pour x ∈ O, on
pose: A(x) = {y ∈ O; x  y}.
1. Montrer que si A(x) ∩ A(y) 6= ∅, alors A(x) = A(y).
2. Montrer que, pour tout x ∈ O, A(x) est un intervalle ouvert.
S
3. Montrer qu’il existe I ⊂ O dénombrable tel que O = x∈I A(x), avec A(x) ∩ A(y) = ∅ si x, y ∈ I
et x 6= y.

15
Chapter 2

Tribus et mesures

2.1 Introduction... par les probabilités


2.1.1 Cas d’un problème “discret”
Pour introduire la série de définitions qui suivent, commençons par quelques exemples, tirés du calcul
des probabilités. Le calcul des probabilités s’intéresse à mesurer la “chance” qu’un certain “événement”,
résultat d’une expérience, a de se produire. Considérons par exemple “l’expérience” qui consiste à lancer
un dé. On appelle “éventualité” associée à cette expérience un des résultats possibles de cette expérience,
et “univers des possibles” l’ensemble E de ces éventualités. Dans notre exemple, les éventualités peuvent
être 1, 2, 3, 4, 5 ou 6; on pourrait choisir aussi comme éventualités les résultats correspondant au “dé
cassé”. On peut donc tout de suite remarquer que l’ensemble E des univers du possible dépend de la
modélisation, c’est à dire de la formalisation mathématique que l’on fait du problème. Notons qu’il est
parfois difficile de définir l’ensemble E.
A partir des éventualités, qui sont, par définition, les éléments de l’univers des possibles E, on définit les
“événements”, qui forment un ensemble de parties de E. Dans notre exemple du lancer de dé, l’ensemble
des événements est l’ensemble des parties de E, noté P(E). Dans l’exemple du dé, la partie {2, 4, 6}
de E est l’événement : “le résultat du lancer est pair”. On appelle événement élémentaire un singleton,
par exemple {6} dans notre exemple du lancer de dé, événement certain l’ensemble E tout entier, et
l’événement “vide” l’ensemble vide ∅ (qui a donc une “chance” nulle de se réaliser). Pour mesurer “la
chance” qu’a un événement de se réaliser, on va définir une application p de l’ensemble des événements
(donc de P(E) dans notre exemple du lancer de dé) dans [0, 1] avec certaines propriétés (qui semblent
naturelles. . . ). La “chance” (ou probabilité) pour un événement A ⊂ E de se réaliser sera donc le nombre
p(A), appartenant à [0, 1].
L’exemple du lancer de dé, que nous venons de considérer, est un problème discret fini, au sens ou
l’ensemble E est fini. On peut aussi envisager des problèmes discrets infinis, l’ensemble E est alors infini
dénombrable (on rappelle qu’un ensemble I est “dénombrable” s’il existe une bijection de I dans N, il est
“au plus dénombrable” s’il existe une injection de I dans N), ou des problèmes (parfois appelés “continus”)
où E est infini non dénombrable.

16
2.1.2 Exemple continu
Considérons maintenant “l’expérience” qui consiste à lancer une balle de ping-pong sur une table de ping-
pong. Soit E l’ensemble des points de la table de ping-pong, on peut voir E comme un sous-ensemble de
R2 , un événement élémentaire est alors un point (x, y) ∈ E (le point d’impact de la balle), et un événement
semble être une partie quelconque A de P(E). On suppose qu’on a effectué le lancer “sans viser”, c’est à
dire en supposant que “n’importe quel point de la table a une chance égale d’être atteint” (les événements
élémentaires sont “équiprobables”), et que la balle tombe forcément sur la table (on est très optimiste. . . ).
On se rend compte facilement que la probabilité pour chacun des points de E d’être atteint doit être
nulle, puisque le nombre des points est infini. On peut aussi facilement “intuiter” que la probabilité pour
une partie A d’être atteinte (dans le modèle “équiprobable”) est le rapport entre la “surface de A” et la
surface de E. La notion intuitive de “surface” correspond en fait à la notion mathématique de “mesure”
que nous allons définir dans le prochain paragraphe. Malheureusement, comme on l’a dit dans le chapitre
introductif, il ne nous sera pas mathématiquement possible de définir une application convenable, i.e. qui
vérifie les propriétés (1.9)-(1.10) et qui “mesure” toutes les parties de R, ou R2 , ou même du sous-ensemble
E de R2 (voir à ce sujet l’exercice 2.23). On va donc définir un sous-ensemble de P(E) (qu’on appelle
“tribu”) sur lequel on pourra définir une telle application. Dans le cas d’un ensemble fini, la tribu sera,
en général, P(E) tout entier. Mais, dans le cas de la balle de ping-pong que vous venons de décrire,
l’ensemble des événements sera une tribu strictement incluse dans P(E).

2.2 Tribu ou σ−algèbre


Définition 2.1 (Tribu ou σ−algèbre) Soient E un ensemble, T une famille de parties de E (i.e. T ⊂
P(E)). La famille T est une tribu (on dit aussi une σ−algèbre) sur E si T vérifie :
1. ∅ ∈ T, E ∈ T ,

2. T est stable par union dénombrable, c’est-à-dire que pour toute famille dénombrable (An )n∈N ⊂ T ,
on a ∪n∈N An ∈ T .
3. T est stable par intersection dénombrable, c’est-à-dire que pour toute famille dénombrable (An )n∈N ⊂
T , on a ∩n∈N An ∈ T .

4. T est stable par passage au complémentaire, c’est-à-dire que pour tout A ∈ T , on a Ac ∈ T (On
rappelle que Ac = E \ A).

Il est clair que, pour montrer qu’une partie T de P(E) est une tribu, il est inutile de vérifier les propriétés
1-4 de la proposition précédente. Il suffit de vérifier par exemple ∅ ∈ T (ou E ∈ T ), 2 (ou 3) et 4.
Exemples de tribus sur E :
• T = {∅, E},
• P(E).

Définition 2.2 (Langage probabiliste) Soient E un ensemble quelconque (“l’univers des possibles”)
et T une tribu ; on appelle “éventualité” les éléments de E et “événements” les éléments de T . On appelle
“événement élémentaire” un singleton de T .
On dit que deux événements A, B ∈ T sont incompatibles si A ∩ B = ∅.

17
Proposition 2.1 (Stabilité par intersection des tribus) Soient E et I deux ensembles. Pour tout
i ∈ I, on se donne une tribu, Ti , sur E. Alors, la famille (de parties de E) ∩i∈I Ti = {A ⊂ E;
A ∈ Ti , ∀i ∈ I} est encore une tribu sur E.

Démonstration : La démonstration de cette proposition fait l’objet de la première question de l’exer-


cice 2.2.

Cette proposition nous permet de définir ci-après la notion de tribu engendrée.

Définition 2.3 (Tribu engendrée) Soient E un ensemble et C ⊂ P(E). On appelle tribu engendrée
par C la plus petite tribu contenant C, c’est-à-dire la tribu T (C) intersection de toutes les tribus sur E
contenant C (cette intersection est non vide car P(E) est une tribu contenant C).

Il est parfois utile d’utiliser la notion d’algèbre, qui est indentique à celle de tribu en remplaçant “dénom-
brable” par “finie”.

Définition 2.4 (Algèbre) Soient E un ensemble, A une famille de parties de E (i.e. A ⊂ P(E)). La
famille A est une algèbre sur E si A vérifie :

1. ∅ ∈ A, E ∈ A,
2. A est stable par union finie, c’est-à-dire que pour tout A, B ∈ A on a A ∪ B ∈ A.
3. A est stable par intersection finie, c’est-à-dire que pour tout A, B ∈ A on a A ∩ B ∈ A.

4. A est stable par passage au complémentaire, c’est-à-dire que pour tout A ∈ A, on a Ac ∈ A.

Remarque 2.1 Soit E un ensemble et C ⊂ P(E). Comme pour les tribus, on peut définir l’algèbre
engendrée par C. C’est la plus petite algèbre contenant C, c’est-à-dire l’intersection de toutes les algèbres
contenant C (voir l’exercice 2.8).

Soit E un ensemble, C ⊂ P(E) et T (C) la tribu engendrée par C (voir la définition 2.3 et l’exercice 2.2). Il
est important de remarquer que, contrairement à ce que l’on pourrait être tenté de croire, les éléments de
la tribu engendrée par C ne sont pas tous obtenus, à partir des éléments de C, en utilisant les opérations :
“intersection dénombrable”, “union dénombrable” et “passage au complémentaire”. Plus précisément, on
pose :

[
R1 (C) = {A ⊂ E t.q. A = An , An ∈ C ou Acn ∈ C},
n∈N
\
2
R (C) = {A ⊂ E t.q. A = An , An ∈ C ou Acn ∈ C},
n∈N
1 2
R(C) = R (C) ∪ R (C).

Prenons E = R et C l’ensemble des ouverts de R (donc T (C) est la tribu borélienne de R, voir définition
ci-après). Il est facile de voir que R(C) ⊂ T (C), mais que, par contre (et cela est moins facile à voir),
R(C)[ n’est pas une tribu. En posant : S0 = C, et Sn = R(Sn−1 ), pour n ≥ 1, on peut aussi montrer que
S= Sn n’est pas une tribu (et que S ⊂ T (C)).
n∈N

18
Remarque 2.2 Soit E un ensemble et C1 ⊂ C2 ⊂ P(E). Il est alors facile de voir que T (C1 ) ⊂ T (C2 )
(cf. Exercice 2.2).

Soit E un ensemble. On rappelle qu’une “topologie” sur E est donnée par une famille de parties de E,
appelées “ouverts de E”, contenant ∅ et E, stable par union (quelconque) et stable par intersection finie.
L’ensemble E, muni de cette famile de parties, est alors un “espace topologique”.

Définition 2.5 (Tribu borélienne) Soit E un ensemble muni d’une topologie (un espace métrique, par
exemple). On appelle tribu borélienne (ou tribu de Borel) la tribu engendrée par l’ensemble des ouverts
de E, cette tribu sera notée B(E). Dans le cas E = R, cette tribu est donc notée B(R).

Remarque 2.3
1. L’objectif de la section 2.5 est de construire une application λ : B(R) → R+ t.q. :

(a) λ(]α, β[) = β − α, pour tout α, β ∈ R α < β,


P
(b) λ(∪n∈N An ) = n∈N λ(An ), pour toute suite (An )n∈N ⊂ B(R) t.q. An ∩ Bn = ∅ si n 6= m.
(Noter que ∪n∈N An ∈ B(R) grâce à la stabilité d’une tribu par union dénombrable.)

2. On peut se demander si B(R) = P(R). La réponse est non (voir les exercices 2.23 et 2.24). On
peut même démontrer que card(B(R)) = card(R) (alors que card(P(R)) > card(R)). On donne
ci-après un rappel rapide sur les cardinaux (sans entrer dans les aspects difficiles de la théorie des
ensembles, et donc de manière peut-être un peu imprécise).

3. Rappel sur les cardinaux. Soit A et B deux ensembles.

(a) On dit que card(A) = card(B) si il existe une application ϕ : A → B, bijective.

Pour montrer que deux ensembles ont même cardinaux, il est souvent très utile d’utiliser le
théorème de Bernstein (voir l’exercice 1.12) qui montre que s’il existe une injection de A dans B
et une injection de B dans A, alors il existe ϕ : A → B, bijective (et donc card(A) = card(B)).
Le théorème de Bernstein motive également la définition suivante.
(b) On dit que card(A) ≤ card(B) s’il existe ϕ : A → B, injective.
(c) Un autre théorème intéressant, dû à Cantor, donne que, pour tout ensemble X, on a card(X) <
card(P(X)) (c’est-à-dire card(X) ≤ card(P(X)) et card(X) 6= card(P(X))). On a donc, en
particulier, card(P(R)) > card(R). La démonstration du théorème de Cantor est très simple.
Soit ϕ : X → P(X). On va montrer que ϕ ne peut pas être surjective. On pose A = {x ∈ X;
x 6∈ ϕ(x)} (A peut être l’ensemble vide). Supposons que A ∈ Im(ϕ). Soit alors a ∈ X t.q.
A = ϕ(a).
Si a ∈ A = ϕ(a), alors a 6∈ A par définition de A.
Si a 6∈ A = ϕ(a), alors a ∈ A par définition de A.
On a donc montré que A ne peut pas avoir d’antécédent (par ϕ) et donc ϕ n’est pas surjective.

Proposition 2.2 On note C1 l’ensemble des ouverts de R, C2 = {]a, b[, a, b ∈ R, a < b} et C3 = {]a, ∞[,
a ∈ R}. Alors T (C1 ) = T (C2 ) = T (C3 ) = B(R). (Noter que d’autres caractérisations de B(R), semblables,
sont possibles.)

19
Démonstration : On a, par définition de B(R), T (C1 ) = B(R). On va démontrer ci-après que T (C1 ) =
T (C2 ) (le fait que T (C2 ) = T (C3 ) est laissé au lecteur).
Comme C2 ⊂ C1 , on a T (C2 ) ⊂ T (C1 ). Il suffit donc de démontrer l’inclusion inverse. On va montrer que
C1 ⊂ T (C2 ), on aura alors que T (C1 ) ⊂ T (C2 ).
Soit O un ouvert de R. On suppose O 6= ∅ (on sait déjà que ∅ ∈ T (C2 )). Le lemme 2.1 (plus simple que le
lemme 2.4 page 35) ci-après nous donne l’existence d’une famille (In )n∈A d’intervalles ouverts t.q. A ⊂ N
et O = ∪n∈A In . Noter qu’on a aussi O = ∪n∈N In en posant In = ∅ si n ∈ N \ A. Comme In ∈ C2 ⊂ T (C2 )
pour tout n ∈ A et ∅ ∈ T (C2 ), on en déduit, par stabilité dénombrable d’une tribu, que O ∈ T (C2 ). Donc,
C1 ⊂ T (C2 ) et donc T (C1 ) ⊂ T (C2 ). On a bien montré que T (C1 ) = T (C2 ).

Lemme 2.1 Tout ouvert non vide de R est réunion au plus dénombrable d’intervalles ouverts bornés.

Démonstration : Soit O un ouvert de R, O 6= ∅. On pose A = {(β, γ) ∈ Q2 ; β < γ, ]β, γ[⊂ O}. On a


donc ∪(β,γ)∈A ]β, γ[⊂ O. On va montrer que O ⊂ ∪(β,γ)∈A ]β, γ[ (et donc que O = ∪(β,γ)∈A ]β, γ[).
Soit x ∈ O, il existe αx > 0 t.q. ]x − αx , x + αx [⊂ O. En prenant βx ∈ Q∩]x − αx , x[ et γx ∈ Q∩]x, x + αx [
(de tels βx et γx existent) on a donc x ∈]βx , γx [⊂ O et donc (βx , γx ) ∈ A. D’où x ∈]βx , γx [⊂ ∪(β,γ)∈A ]β, γ[.
On a bien montré que O ⊂ ∪(β,γ)∈A ]β, γ[ et donc que O = ∪(β,γ)∈A ]β, γ[. Comme Q2 est dénombrable,
A est au plus dénombrable et le lemme est démontré.

Définition 2.6 (Espace mesurable ou probabilisable, partie mesurable ou probabilisable)


Soient E un ensemble, et T une tribu sur E. Le couple (E, T ) est appelé “espace mesurable” ou (en
langage probabiliste !) “espace probabilisable”. Les parties de E qui sont (resp. ne sont pas) des éléments
de T sont dites mesurables ou probabilisables (resp. non mesurables, non probabilisables).

2.3 Mesure, probabilité


Définition 2.7 (Mesure) Soit (E, T ) un espace mesurable. On appelle mesure une application m : T →
R+ (avec R+ = R+ ∪ (+∞)) vérifiant :
1. m(∅) = 0

2. m est σ-additive, c’est-à-dire que pour toute famille (An )n∈N ⊂ T de parties disjointes deux à deux,
(i.e. t.q. An ∩ Am = ∅, si n 6= m), on a :
[ X
m( An ) = m(An ). (2.1)
n∈N n∈N

Remarque 2.4

1. Dans la définition précédente on a étendu à R+ l’addition dans R+ . On a simplement posé x + ∞ =


∞, pour tout x ∈ R+ . Noter également que P la somme de la série dans la définition
Pn précédente est
à prendre dans R+ et que, bien sûr, a = n∈N an signifie simplement que p=0 ap → a (dans R+ )
quand n → ∞.
2. Soient x, y, z ∈ R+ . Remarquer que x + y = x + z implique y = z si x 6= ∞.

20
3. Dans la définition précédente, la condition 1. peut être remplacée par la condition : ∃ A ∈ T, m(A) <
∞. La vérification de cette affirmation est laissée au lecteur attentif.
4. Il est intéressant de remarquer que, pour une série à termes positifs, l’ordre de sommation est
sans importance.
P P Plus précisément, si (an )n∈N ⊂ R+ et si ϕ est une bijection de N dans N, on a
n∈N a n = n∈N aϕ(n ). C’est l’objet du lemme 2.2.

5. Une conséquence immédiate de la σ−additivité est l’additivité, c’est-à-dire que


n
X
m(∪np=0 Ap ) = m(Ap )
p=0

pour toute famille finie (Ap )p=0,...,n d’éléments de T , disjoints 2 à 2. L’additivité se démontre avec
la σ−additivité en prenant Ap = ∅ pour p > n dans (2.1).
6. Dans le cas E = R et T = P(R), il est facile de construire des mesures sur T , mais il n’existe pas
de mesure sur T , notée m, telle que m(]a, b[) = b − a pour tout a, b ∈ R, a < b (voir les exercices
2.24 et 2.23). Une telle mesure existe si on prend pour T la tribu borélenne de R, c’est l’objet de
la section 2.5.

P P
Lemme 2.2 Soit (an )n∈N ⊂ R+ et soit ϕ : N → N bijective. Alors n∈N an = n∈N aϕ(n) .

DémonstrationP : Pn P Pn
On pose A = n∈N an (= limn→∞ p=0 ap ) ∈ R+ et B = n∈N aϕ(n) (= limn→∞ p=0 aϕ(p) ) ∈ R+ . On
veut montrer que A = B.
On montre d’abord que B ≤ A. Soit n ∈ N. On pose N = max{ϕ(0), . . . , ϕ(n)}. Comme aq ≥ 0 pour
Pn PN
tout q ∈ N, on a p=0 aϕ(p) ≤ p=0 ap ≤ A. On en déduit, faisant tendre n vers ∞ que B ≤ A.
En raisonnant avec l’inverse de ϕ on a aussi A ≤ B et finalement A = B.

Définition 2.8 (Mesure finie) Soient E un ensemble et T une tribu sur E. On appelle mesure finie
une mesure m sur T telle que m(E) < ∞.

Définition 2.9 (Probabilité) Soient E un ensemble et T une tribu sur E. On appelle probabilité une
mesure p sur T t.q. p(E) = 1.

Définition 2.10 (Espace mesuré, espace probabilisé) Soient E un ensemble, T une tribu sur E et
m une mesure (resp. une probabilité) sur T . Le triplet (E, T, m) est appelé “espace mesuré” (resp. “espace
probabilisé”).

Définition 2.11 (Mesure σ-finie) Soit (E, T, m) un espace mesuré, on dit que m est σ-finie (ou que
(E, T, m) est σ-fini) si :
[
∃ (An )n∈N ⊂ T, m(An ) < ∞, ∀ n ∈ N, et E = An . (2.2)
n∈N

Remarque 2.5 (Langage probabiliste) En langage probabiliste, la propriété de σ-additivité (2.1) que
l’on requiert dans la définition d’une mesure (et donc d’une probabilité) est souvent appelé “axiome
complet des probabilités totales”.

21
Exemple 2.1 (Mesure de Dirac) Soient E un ensemble, T une tribu sur E et a ∈ E. On définit sur
T la mesure δa par (pour A ∈ T ) :
δa (A) = 0, si a ∈
/ A, (2.3)
δa (A) = 1, si a ∈ A. (2.4)
On peut remarquer que la mesure de Dirac est une probabilité.

Remarque 2.6 (Comment choisir la probabilité) Soit (E, T ) un espace probabilisable, on peut évi-
demment définir plusieurs probabilités sur T . C’est tout l’art de la modélisation que de choisir une
probabilité qui rende compte du phénomène aléatoire que l’on veut observer. On se base pour cela souvent
sur la notion de fréquence, qui est une notion expérimentale à l’origine. Soit A ∈ T un événement, dont
on cherche à évaluer la probabilité p(A). On effectue pour cela N fois l’expérience dont l’univers des
possibles est E, et on note NA le nombre de fois où l’événement A est réalisé. A N fixé, on définit alors
la fréquence fA (N ) de l’événement A par :

NA
fA (N ) = .
N
Expérimentalement, il s’avère que fN (A) admet une limite lorsque N → +∞. C’est ce qu’on appelle la
“loi empirique des grands nombres”. On peut donc définir “expérimentalement” p(A) = limN →+∞ fN (A).
Cependant, on n’a pas ainsi démontré que p est une probabilité: il ne s’agit pour l’instant que d’une
approche intuitive. On démontrera plus loin la loi forte des grands nombres, qui permettra de justifier
mathématiquement la loi empirique. On peut remarquer que fN (E) = N N = 1. . .

Exemple 2.2 (Le cas “équiprobable”) Soit (E, T, p) un espace probabilisé .On suppose que tous les
singletons de E appartiennent à la tribu et que les événements élémentaires sont équiprobables. . On a
1
alors: p({x}) = cardE pour tout x ∈ E.

Définition 2.12 (mesure atomique) Soit (E, T, m) un espace mesuré tel que : {x} ∈ T pour tout x
de E. On dit que m est portée par S ∈ T si m(S c ) = 0. Soit x ∈ E, on dit que x est un atome ponctuel
de m si m({x}) 6= 0. On dit que m est purement atomique si elle est portée par la partie de E formée
par l’ensemble de ses atomes ponctuels.

Définition 2.13 (Mesure diffuse) Soient (E, T ) un espace mesurable et m une mesure sur T . On dit
que m est diffuse si {x} ∈ T et m({x}) = 0 pour tout x ∈ E. (Cette définition est aussi valable pour une
mesure signée sur T , définie dans la section 2.4.)

Définition 2.14 (Partie négligeable) Soient (E, T, m) un espace mesuré et A ⊂ E. On dit que A est
négligeable s’il existe un ensemble B ∈ T tel que A ⊂ B et m(B) = 0.

Définition 2.15 (Mesure complète) Soit (E, T, m) un espace mesuré, on dit que m est complète (ou
que (E, T, m) est complet) si toutes les parties négligeables sont mesurables, c’est-à-dire appartiennent à
T.

La proposition suivante donne les principales propriétés d’une mesure.

Proposition 2.3 (Propriétés des mesures) Soit (E, T, m) un espace mesuré. La mesure m vérifie
les quatre propriétés suivantes :

22
1. Monotonie : Soit A, B ∈ T , A ⊂ B, alors

m(A) ≤ m(B) (2.5)

2. σ-sous-additivité : Soit (An )n∈N ⊂ T , alors


[ X
m( An ) ≤ m(An ). (2.6)
n∈N n∈N

3. Continuité croissante : Soit (An )n∈N ⊂ T , t.q. An ⊂ An+1 , pour tout n ∈ N, alors
[
m( An ) = lim (m(An )) = sup(m(An )) (2.7)
n→∞ n∈N
n∈N

4. Continuité décroissante : Soit (An )n∈N ⊂ T , t.q. An+1 ⊂ An , pour tout n ∈ N, et t.q. il existe
n0 ∈ N, m(An0 ) < ∞, alors
\
m( An ) = lim (m(An )) = inf (m(An )) (2.8)
n→∞ n∈N
n∈N

Démonstration :
La démonstration de ces propriétés est facile: elles découlent toutes du caractère positif et du caractère
σ-additif de la mesure. Attention: ces propriétés ne sont pas vérifiées par les mesures signées que nous
verrons à la section 2.4.

1. Monotonie. Soit A, B ∈ T , A ⊂ B. On a B = A ∪ (B \ A) et A ∩ (B \ A) = ∅. Comme A ∈ T et


B\A = B∩Ac ∈ T , l’additivité de m (voir la remarque 2.4) donne m(B) = m(A)+m(B\A) ≥ m(A),
car m prend ses valeurs dans R+ .
Noter aussi que m(B \ A) = m(B) − m(A) si 0 ≤ m(A) ≤ m(B) < ∞ (mais cette relation n’a pas
de sens si m(A) = m(B) = ∞).
P
2. σ−sous additivité. Soit (An )n∈N ⊂ T . On veut montrer que m(∪n∈N An ) ≤ n∈N m(An ). On pose
B0 = A0 et, par récurrence sur n, Bn = An \ (∪n−1i=0 Bi ) pour n ≥ 1. Par récurrence sur n on montre
n−1 c
que Bn ∈ T pour tout n en remarquant que, pour n > 1, Bn = An ∩ (∩i=0 Bi ). La construction
des Bn assure que Bn ∩ Bm = ∅ si n 6= m et ∪n∈N An = ∪n∈N Bn . Pour vérifier cette dernière
propriété, on remarque que Bn ⊂ An donc ∪n∈N Bn ⊂ ∪n∈N An . Puis, si x ∈ An et x 6∈ ∪n−1 i=0 Bi ,
on a alors x ∈ An ∩ (∩n−1 B
i=0 i
c
) = B n . Ceci prouve que ∪ A
n∈N n ⊂ ∪ n∈N nB et donc, finalement,
∪n∈N An = ∪n∈N Bn .
On utilise maintenant la σ−additivité
P et la monotonie de m (car Bn ⊂ An ) pour écrire
de m P
m(∪n∈N An ) = m(∪n∈N Bn ) = n∈N m(Bn ) ≤ n∈N m(An ).
3. Continuité croissante. Soit (An )n∈N ⊂ T , t.q. An ⊂ An+1 , pour tout n ∈ N. Par monotonie de
m, on a m(An+1 ) ≥ m(An ), pour tout n ∈ N, et donc limn→∞ m(An ) = supn∈N m(An ) ∈ R+ . On
pose A = ∪n∈N An et on définit la suite (Bn )n∈N par B0 = A0 et Bn = An \ An−1 pour tout n ≥ 1
(noter que An−1 ⊂ An ). On a A = ∪n∈N An = ∪n∈N Bn , Bn ∈ T pour tout n ∈ N et Bn ∩ Bm = ∅
si n 6= m.

23
La σ−additivité de m nous donne
X n
X
m(A) = m(∪n∈N Bn ) = m(Bn ) = lim m(Bp ).
n→∞
n∈N p=0

n
Pn comme An = ∪p=0 Bp , l’additivité de m (qui se déduit de la σ−additivité) nous donne
Puis,
p=0 m(Bp ) = m(An ) et donc m(A) = limn→∞ m(An ).

4. Continuité décroissante. Soit (An )n∈N ⊂ T , t.q. An+1 ⊂ An , pour tout n ∈ N, et telle qu’il existe
n0 ∈ N, m(An0 ) < ∞.
Par monotonie, on a m(An+1 ) ≤ m(An ) pour tout n ∈ N et donc limn→∞ m(An ) = inf n∈N m(An )
∈ R+ . On a aussi, par monotonie, m(A) ≤ m(An ), pour tout n ∈ N, avec A = ∩n∈N An . Comme
m(An0 ) < ∞, on a aussi m(An ) < ∞ pour tout n ≥ n0 et m(A) < ∞. On pose Bn = An0 \ An =
An0 ∩ Acn ∈ T , pour tout n ≥ n0 . La suite (Bn )n≥n0 est croissante (Bn ⊂ Bn+1 pour tout n ≥ n0 )
et B = ∪n≥0 Bn = ∪n≥n0 (An0 \ An ) = An0 \ ∩n≥n0 An = An0 \ A.
La continuité croissante donne

m(An0 \ A) = m(B) = lim m(Bn ) = lim m(An0 \ An ). (2.9)


n→∞ n→∞

Comme A ⊂ An0 , on a m(An0 \ A) = m(An0 ) − m(A) (car m(A) ≤ m(An0 ) < ∞, on utilise ici la
remarque à la fin de la preuve de la monotonie). De même, comme An ⊂ An0 (pour n ≥ n0 ), on a
m(An0 \ An ) = m(An0 ) − m(An ) (car m(An ) ≤ m(An0 ) < ∞). En utilisant une nouvelle fois que
m(An0 ) < ∞, on déduit de (2.9) que m(A) = limn→∞ m(An ).

Théorème 2.1 (Mesure complétée) Soit (E, T, m) un espace mesuré, on note Nm l’ensemble des
parties négligeables. On pose T = {A ∪ N , A ∈ T , N ∈ Nm }. Alors T est une tribu, et il existe une
et une seule mesure, notée m, sur T , égale à m sur T . De plus, une partie de E est négligeable pour
(E, T , m) si et seulement si elle est négligeable pour (E, T, m). la mesure m est complète et l’espace
mesuré (E, T , m) s’appelle le complété de (E, T, m). La mesure m s’appelle la mesure complétée de la
mesure m.

Démonstration : Cette démonstration est l’objet de l’exercice 2.28.

Définition 2.16 (Mesure absolument continue, mesure étrangère)


Soient (E, T ) un espace mesurable, et m et µ des mesures (positives) sur T .
1. On dit que la mesure µ est absolument continue par rapport à la mesure m (et on note µ << m) si
pour tout A ∈ T tel que m(A) = 0, alors µ(A) = 0.
2. On dit que la mesure µ est étrangère à la mesure m (et note µ⊥m) s’il existe A ∈ T tel que
m(A) = 0 et µ(Ac ) = 0.

Proposition 2.4 Soient (E, T ) un espace mesurable, et m et µ des mesures (positives) sur T ; on suppose
de plus que la mesure µ est σ-finie. Alors il existe une mesure µa absolument continue par rapport à m
et une mesure µe étrangère à m (et à µa ) t.q. µ = µa + µe .

24
Démonstration :
On suppose tout d’abord que µ est une mesure finie. On pose α = sup{µ(A); A ∈ T, m(A) = 0}. Il existe
donc une suite (An )n∈N ⊂ T t.q. m(An ) = 0, pour tout n ∈ N, et µ(An ) → α, quand n → ∞. On pose
alors C = ∪n∈N An .
P
On a C ∈ T , 0 ≤ m(C) ≤ n∈N m(An ) = 0 (par σ-sous additivité de m), µ(C) ≥ µ(An ) pour tout n ∈ N
(par monotonie de µ) et donc, en passant à la limite quand n → ∞, µ(C) ≥ α. Enfin, la définition de α
donne alors µ(C) = α. On a donc trouvé C ∈ T t.q. m(C) = 0 et µ(C) = α.

Pour A ∈ T , on pose µe (A) = µ(A ∩ C) et µa (A) = µ(A ∩ C c ).


Il est clair que µe et µa sont des mesures sur T et que µ = µe + µa . Comme µe (C c ) = 0 et µa (C) = 0,
les mesures µa et µe sont étrangères. Comme m(C) = 0 et µe (C c ) = 0, les mesures µe et m sont aussi
étrangères. Il reste à montrer que µa est absolument continue par rapport à m.

Soit B ∈ T t.q. m(B) = 0. On veut montrer que µa (B) = 0, c’est-à-dire que µ(B ∩ C c ) = 0. On pose
D = B ∩ C c et F = C ∪ D. Comme D ∩ C = ∅, On a m(F ) = m(C) + m(D) ≤ m(C) + m(B) = 0 et
µ(F ) = µ(C) + µ(D) = α + µ(D). Comme m(F ) = 0, la définition de α donne que µ(F ) ≤ α. On a donc
α + µ(D) ≤ α, d’où l’on déduit, comme α ∈ R (et c’est ici que l’on utilise le fait que µ est une mesure
finie), que µ(D) = 0, c’est-à-dire µa (B) = 0. On a bien ainsi montré que µa est absolument continue par
rapport à m.

On considère maintenant le cas général où µ est σ-finie. Il existe une suite (En )n∈N ⊂ T t.q. E = ∪n∈N En ,
µ(En ) < ∞ pour tout n ∈ N et En ∪ Em = ∅ si n 6= m.
Pour n ∈ N et A ∈ T , on pose µ(n) (A) = µ(A∩En ). µ(n) est donc une mesure finie sur T . Le raisonnement
(n) (n)
précédent donne donc l’existence de µa absolument continue par rapport à m et de µe étrangère à m
(n) (n) (n)
(et à µa ) t.q. µ(n) = µa + µe . On pose alors, pour A ∈ T :
X X
µe (A) = µ(n)
e (A); µa (A) = µa(n) (A).
n∈N n∈N

µe et µa sont bien des mesures sur T (voir l’exercice 4.2) et il est clair que µ = µe + µa , µa absolument
continue par rapport à m et µe étrangère à m (et à µa ).

Il est parfois utile (surtout en théorie des probabilités, mais une telle question apparaı̂t aussi dans le
section 2.5 et dans le chapitre 7) de montrer l’unicité d’une mesure ayant des propriétés données. La
proposition suivante donne une méthode pour montrer une telle unicité (d’autres méthodes sont possibles,
voir, par exemple, la proposition 5.4 dans le chapitre 5).
Proposition 2.5 Soit (E, T ) un espace mesurable et m, µ deux mesures sur T . On suppose qu’il existe
C ⊂ T t.q.
1. C engendre T ,
2. C est stable par intersection finie (c’est-à-dire A, B ∈ C ⇒ A ∩ B ∈ C),
3. Il existe (En )n∈N ⊂ C t.q. En ∩ Em = ∅ si n 6= m, m(En ) < ∞, pour tout n ∈ N, et E = ∪n∈N En ,
4. m(A) = µ(A) pour tout A ∈ C.
On a alors m = µ (c’est-à-dire m(A) = µ(A) pour tout A ∈ T ).
Démonstration : Cette démonstration est l’objet de l’exercice 2.19.

25
2.4 mesure signée
Définition 2.17 (Mesure signée) Soit (E, T ) un espace mesurable. On appelle mesure signée (sur T )
une application m : T → R vérifiant la propriété de σ-additivité, c’est-à-dire t.q. pour toute famille
(An )n∈N ⊂ T , t.q. An ∩ Am = ∅, si n 6= m,
[ X
m( An ) = m(An ). (2.10)
n∈N n∈N

Noter qu’une mesure signée prend ses valeurs dans R. En prenant An = ∅ pour tout n ∈ N dans (2.10),
on en déduit que m(∅) = 0.
On peut aussi considérer des mesures à valeurs complexes (c’est-à-dire dans C). Dans ce cas, les parties
réelles et imaginaires de ces mesures à valeurs complexes sont des mesures signées.
Dans toute la suite du cours, les mesures considérées seront en général positives, c’est-à-dire (cf. défini-
tion 2.7) à valeurs dans R+ . Lorsque l’on s’intéressera à des mesures prenant leurs valeurs dans R, on
précisera qu’il s’agit de “mesures signées”. Noter que les mesures signées ne vérifient pas, en général, les
propriétés (2.5) et (2.6). Pour avoir un contre exemple, il suffit de considérer une mesure signée m (non
nulle) t.q. −m soit une mesure (positive).

Proposition 2.6 (Décomposition d’une mesure signée) Soient (E, T ) un espace mesurable et m
une mesure signée sur T . Alors, il existe deux mesures (positives) finies, notées m+ et m− , t.q. :
1. m(A) = m+ (A) − m− (A), pour tout A ∈ T .
2. Les mesures m+ et m− sont étrangères, c’est-à-dire qu’il existe C ∈ T tel que m+ (C) = 0, et
m− (E \ C) = 0.
Une conséquence des propriétés ci-dessus est que m− (A) = −m(A ∩ C) et m+ (A) = m(A ∩ C c ) pour tout
A ∈ T.
De plus, la décompostion de m en différence de deux mesures (positives) finies étrangères est unique. Elle
s’appelle “décomposition de Hahn” de m.

Démonstration :
La démonstration d’existence de m+ et m− est décomposée en trois étapes. Dans la première étape, on
va montrer que, si A ∈ T , il existe à ∈ T t.q. à ⊂ A, m(Ã) ≥ m(A) et :

B ∈ T, B ⊂ Ã ⇒ m(B) ≥ 0.

Cette première étape nous permettra, dans l’étape 2, de montrer l’existence de C ∈ T t.q. m(C) =
sup{m(A), A ∈ T } (ceci montre, en particulier que sup{m(A), A ∈ T } < ∞).

Enfin, dans l’étape 3, on pose m+ (A) = m(A ∩ C) et m− (A) = −m(A ∩ C c ) (pour tout A ∈ T ) et on
remarque que m+ et m− sont des mesures finies, étrangères et t.q. m = m+ − m− .

Etape 1. Soit A ∈ T , on montre, dans cette étape, qu’il existe à ∈ T t.q. à ⊂ A, m(Ã) ≥ m(A) et :

B ∈ T, B ⊂ Ã ⇒ m(B) ≥ 0. (2.11)

On commence par montrer, par récurrence sur n, l’existence d’une suite (Bn )n∈N déléments de T t.q. :

1. B0 = A,

26
2. Bn+1 ⊂ Bn , pour tout n ∈ N,
3. m(Bn \ Bn+1 ) ≤ βn = max{ α2n , −1} où αn = inf{m(C), C ∈ T, C ⊂ Bn }.

On prend B0 = A. Soit maintenant n ∈ N, on suppose Bp connu pour p ≤ n. On a αn = inf{m(C), C ⊂


Bn } ≤ 0 (car ∅ ⊂ Bn ). Si αn = −∞, il existe Cn ∈ T t.q. Cn ⊂ Bn et m(Cn ) ≤ βn = −1. Si
−∞ < αn < 0, on a βn > αn , il existe donc Cn ∈ T t.q. Cn ⊂ Bn et m(Cn ) ≤ βn . Si αn = 0, on prend
Cn = ∅. Enfin, on prend Bn+1 = Bn \ Cn et on obtient bien les propriétés désirées en remarquant que
Cn = Bn \ Bn+1 .

La suite (Bn )n∈N est décroissante (c’est-à-dire Bn+1 ⊂ Bn pour tout n ∈ N). Pour m > n, on a donc
Cm ⊂ Bm ⊂ BP n+1 et donc Cm ∩ Cn = ∅ (car Bn+1 = Bn \ Cn ). Par σ−additivité de m, on en déduit
m(∪n∈N Cn ) = n∈N m(Cn ). Comme m(∪n∈N Cn ) ∈ R, la série de terme général m(Cn ) est convergente.
On a donc m(Cn ) → 0 quand n → ∞ et donc βn → 0 quand n → ∞ (car m(Cn ) ≤ βn ≤ 0) et, finalement,
αn → 0 quand n → ∞.

On pose maintenant à = A\∪n∈N Cn = ∩n∈N Bn . On a, bien sûr, à ∈ T et à ⊂ A. On montre maintenant


que à vérifie (2.11). Soit C ∈ T , C ⊂ Ã. On a, pour tout n ∈ N, C ⊂ Bn et donc m(C) ≥ αn . Quand
n → ∞, on en déduit que m(C) ≥ 0. ce qui donne bien (2.11).

Il reste à montrer que m(Ã) ≥ m(A). Comme A


P= Ã ∪ (∪n∈N Cn ) (et que cette union est “disjointe”), la
σ−additivité de m donne que m(A) = m(Ã) + n∈N m(Cn ) ≤ m(Ã). Ce qui termine la première étape.

Etape 2. On pose α = sup{m(A), A ∈ T } et on montre, dans cette étape, qu’il existe C ∈ T t.q.
m(C) = α.
Par définition d’une borne supérieure, il existe une suite (An )n∈N d’éléments de T t.q. m(An ) → α
quand n → ∞. Grâce à l’étape 1, on peut supposer (quitte à remplacer An par A˜n construit comme dans
l’étape 1) que An vérifie (2.11), c’est-à-dire que pour tout n ∈ N :

B ∈ T, B ⊂ An ⇒ m(B) ≥ 0. (2.12)

On pose C = ∪n∈N An . On commence par montrer que m(C) ≥ m(Am ), pour tout m ∈ N.
Soit m ∈ N. On peut écrire C comme une union “disjointe” :

C = Am ∪ (∪n6=m Cn,m ),

avec Cn,m ∈ T et Cn,m ⊂ An pour tout m 6= n. En effet, il suffit pour cela de constuire par récurrence
(sur n) la suite des Cn,m en prenant pour Cn,m l’intersection de C avec An à laquelle on retranche Am
et les Cn,m précédemment construits.
P
Par σ−additivité de m, on a m(C) = m(Am ) + n6=m m(Cn,m ). puis, comme Cn,m ⊂ An , on a, par
(2.12), m(Cn,m ) ≥ 0. On en déduit m(C) ≥ m(Am ).
En faisant tendre m vers ∞, on a alors m(C) ≥ α et donc, finalement m(C) = α.

Etape 3. Construction de m+ et m− .
Pour constuire m+ et m− , on utilise un élément C de T t.q. m(C) = α = sup{m(A), A ∈ T } (l’existence
de C a été montré à l’étape 2). Pour A ∈ T , on pose :

m+ (A) = m(A ∩ C), m− (A) = −m(A ∩ C c ).

27
On a m+ (∅) = m− (∅) = 0 (car m(∅) = 0) et les applications m+ et m− sont des applications σ−additives
de T dans R (car m est σ−additive). Pour montrer que m+ et m− sont des mesures finies, il suffit de
montrer qu’elles prennent leurs valeurs dans R+ , ce que l’on montre maintenant.
Soit A ∈ T , on a, par additivité de m et grâce à la définition de α, α = m(C) = m(A ∩ C) + m(Ac ∩ C) ≤
m(A ∩ C) + α. On en déduit m(A ∩ C) ≥ 0. ce qui prouve bien que m+ (A) ∈ R+ . On a aussi, encore
une fois par additivité de m et grâce à la définition de α, α ≥ m(C) + m(A ∩ C c ) = α + m(A ∩ C c ). On
en déduit m(A ∩ C c ) ≤ 0 et donc m− (A) ∈ R+ .
Les applications m+ et m− sont des mesures finies (noter que m+ (E) = m(E∩C) < ∞ et m− (E) = m(E∩
C c ) < ∞). Elles sont étrangères car m+ (C c ) = m(C c ∩ C) = m(∅) = 0 et m− (C) = −m(C ∩ C c ) = 0.
Enfin, pour tout A ∈ T , on a, par σ−additivité de m :

m(A) = m(A ∩ C) + m(A ∩ C c ) = m+ (A) − m− (A).

Ceci termine la démonstration de l’existence de m+ et m− .

Pour montrer l’unicité de cette décomposition de m, on suppose que µ et ν sont deux mesures finies
étrangères t.q. m = µ − ν. Comme elle sont étrangères, il existe D ∈ T t.q. µ(Dc ) = ν(D) = 0. On
montre alors que, pour tout A ∈ T , on a nécessairement :

µ(A) = sup{m(B); B ∈ T, B ⊂ A}. (2.13)

En effet, si A ∈ T et B ∈ T , B ⊂ A, on a m(B) = µ(B) − ν(B) ≤ µ(B) ≤ µ(A) (par positivité de ν


et monotonie de µ). Puis, en prenant B = A ∩ D, on a m(B) = m(A ∩ D) = µ(A ∩ D) − ν(A ∩ D) =
µ(A ∩ D) = µ(A) − µ(A ∩ Dc ) = µ(A). Ceci prouve bien que (2.13) est vraie (et prouve que le sup est
atteint pour B = A ∩ D). L’égalité (2.13) donne donc de manière unique µ en fonction de m. L’unicité
de ν découle alors du fait que ν = µ − m.

P
Remarque 2.7 Une conséquence de la proposition 2.6 est que la série n∈N m(An ) apparaissant dans
(2.10)
Pn est absolument Pnconvergente car P(pour toute famille (An )n∈N ⊂ T t.q. An ∩ Am = ∅, si n 6= m) on
n
a p=0 |m(Ap )| ≤ p=0 m+ (Ap ) + p=0 m− (Ap ) ≤ m+ (E) + m− (E) < ∞.
P
En fait, la définition 2.17 donne directement que la série n∈N m(An ) apparaissant dans (2.10) est
commutativement convergente (c’est-à-dire qu’elle est convergente, dans R, quel que soit l’ordre dans
lequel on prend les termes de la série et la somme de la série ne dépend pas de l’ordre dans lequel les
termes ont été pris). Elle est donc absolument convergente (voir l’exercice 2.29). Nous verrons plus loin
que cette équivalence entre les séries absolument convergentes et les séries commutativement convergentes
est fausse pour des séries à valeurs dans un espace de Banach de dimension infinie.

2.5 La mesure de Lebesgue sur la tribu des boréliens


Il serait bien agréable, pour la suite du cours, de montrer l’existence d’une application λ, définie sur tout
P(R) et à valeurs dans R+ , t.q. l’image par λ d’un intervalle de R soit la longueur de cet intervalle, et qui
vérifie les propriétés (1.9) et (1.10). Malheureusement, on peut montrer qu’une telle application n’existe
pas (voir les exercices 2.24 et 2.23). Le théorème suivant donne l’existence d’une telle application définie
seulement sur la tribu des boréliens de R, notée B(R) (l’exercice 2.24 donne alors que B(R) 6= P(R)).
Cette application s’appelle la mesure de Lebesgue.

28
Théorème 2.2 (Carathéodory) Il existe une et une seule mesure sur B(R), notée λ et appelée mesure
de Lebesgue sur les boréliens, t.q. λ(]α, β[) = β − α, pour tout (α, β) ∈ R2 t.q. −∞ < α < β < +∞.

Il y a plusieurs démonstrations possibles de ce théorème. Pour la partie “existence” de ce théorème, nous


donnons dans cette section une démonstration due à Carathéodory. Soit A ⊂ R. On définit λ? (A) par :
n
X
λ? (A) = inf `(Ai ),
(Ai )i∈N ∈EA
i=1

où EA est l’ensemble des familles dénombrables d’intervalles ouverts dont l’union contient A, et `(Ai )
représente la longueur de l’intervalle Ai . On peut montrer (voir l’exercice 2.23) que l’application λ? ainsi
définie de P(R) dans R+ n’est pas σ- additive (ce n’est donc pas une mesure).
On montre par contre dans cette section que la restriction de λ? à B(R) est une mesure, qu’on note λ,
mesure de Lebesgue. L’existence de la mesure de Lebesgue peut aussi être démontrée en utilisant un
théorème plus général (de F. Riesz) que nous verrons dans un chapitre ultérieur.

Après la définition de λ? et la démonstration de propriétés de λ? , on donne la démonstration de la


partie “existence” du théorème de Carathéodory (voir page 32). La partie “unicité” du théorème de
Carathéodory (voir page 35) peut être démontrée en utilisant le théorème de “régularité” sur les mesures
sur B(R) (Théorème 2.3, très utille dans la suite du cours) et d’un lemme classique sur les ouverts
de R (lemme 2.4). Cette partie “unicité” peut aussi être démontrée, plus directement, en utilisant la
proposition 2.5.

Définition 2.18 (Définition de λ? ) Soit A ∈ P(R). On pose λ? (A) = inf{ n∈N `(In ); (In )n∈N ∈
P
EA }, avec EA = {(In )n∈N ; In =]an , bn [, −∞ < an ≤ bn < ∞, ∀n ∈ N, A ⊂ ∪n∈N In } et `(I) = b − a si
I =]a, b[, −∞ < a ≤ b < ∞.

Proposition 2.7 (Propriétés de λ? ) L’application λ? : P(R) → R+ (définie dans la définition 2.18)


vérifie les propriétés suivantes :
1. λ? (∅) = 0,
2. (Monotonie) λ? (A) ≤ λ? (B), pour tout A, B ∈ P(R), A ⊂ B,
3. (σ−sous additivité) Soit (An )n∈N ⊂ P(R) et A = ∪n∈N An , alors λ? (A) ≤ λ? (An ),
P
n∈N

4. λ? (]a, b[) = b − a pour tout (α, β) ∈ R2 t.q. −∞ < α < β < +∞.

Démonstration :
On remarque tout d’abord que λ? (A) ∈ R+ pour tout A ∈ P(R) (car λ? (A) est la borne inférieure d’une
partie de R+ ).

Propriété 1. Pour montrer quePλ? (∅) = 0, il suffit de remarquer que (In )n∈N ∈ E∅ avec In = ∅ pour
?
tout n ∈ N, et donc 0 ≤ λ (∅) ≤ n∈N `(In ) = 0.

Propriété 2. Soit A, B ∈ P(R) t.q. A ⊂ B. On a EB ⊂ EA et donc λ? (A) ≤ λ? (B).

Propriété 3. Soit (An )n∈N ⊂ P(R) et A = ∪n∈N An . Il suffit de considérer le cas où λ? (An ) < ∞ pour
tout n ∈ N (sinon, l’inégalité est immédiate).
Soit ε > 0. Pour tout n ∈ N, il existe (In,m )m∈N ∈ EAn t.q. m∈N `(In,m ) ≤ λ? (An ) + ε/(2n ).
P

29
On remarque alors que (In,m )(n,m)∈N2 est un recouvrement de A par des intervalles ouverts et donc que :
X
λ? (A) ≤ `(In,m ).
(n,m)∈N2

Noter que (n,m)∈N2 `(In,m ) = n∈N `(Iϕ(n) ), où ϕ est une bijection de N dans N2 (cette somme ne
P P

dépend pas de la bijection choisie, voir le lemme 2.2 page 21).Avec le lemme 2.3 ci dessous, on en déduit :
X X X
λ? (A) ≤ ( `(In,m )) ≤ λ? (An ) + 2ε,
n∈N m∈N n∈N

ce qui donne bien, quand ε → 0, λ? (A) ≤ λ? (An ).


P
n∈N

Propriété 4. Pour montrer la quatrième propriété. On commence par montrer :

λ? ([a, b]) = b − a, ∀a, b ∈ R, a < b. (2.14)


Soit donc a, b ∈ R, a < b.
Comme [a, b] ⊂]a − ε, b + ε[, pour tout ε > 0, on a λ? ([a, b]) ≤ b − a + 2ε. On en déduit λ? ([a, b]) ≤ b − a.
Pour démontrer l’inégalité inverse, soit (In )n∈N ∈ E[a,b] . Par compacité de [a, b], il existe n ∈ N t.q.
[a, b] ⊂ ∪np=0 Ip . On peut alors construire (par récurrence) i0 , i1 , . . . , iqP∈ {0, . . . , n} t.q.P ai0 < a,
q
aip+1 < bip pour tout p ∈ {0, . . . , q − 1}, b < biq . On en déduit que b − a < p=0 bip − aip ≤ n∈N `(In )
?
et donc b − a ≤ λ ([a, b]). Ceci donne bien (2.14).
En remarquant que [a + ε, b − ε] ⊂]a, b[⊂ [a, b] pour tout a, b ∈ R, a < b, et 0 < ε < (b − a)/2, la
monotonie de λ? donne (avec (2.14)) que λ? (]a, b[) = b − a pour tout a, b ∈ R, a < b. La monotonie de
λ? donne alors aussi que λ? ([a, b[) = λ? (]a, b]) = λ? (]a, b[) = b − a pour tout a, b ∈ R, a < b, et enfin que
λ? (] − ∞, a]) = λ? (] − ∞, a[) = λ? (]a, ∞]) = λ? ([a, ∞]) = ∞ pour tout a ∈ R.

Lemme 2.3 (Double série à termes positifs) Soit (an,m )(n,m)∈N2 ⊂ R+ . Alors on a :
X X X
an,m = ( an,m ).
(n,m)∈N2 n∈N m∈N

P P P
Démonstration : On pose A = (n,m)∈N2 an,m et B = n∈N ( m∈N an,m ). Soit ϕ une bijection de N
dans N2 . On rappelle que (n,m)∈N2 an,m = p∈N aϕ(p) .
P P

Pour tout i, j ∈ N, il existe n ∈ N t.q. {0, . . . , i} × {0, . . . j} ⊂ {ϕ(0), . . . , ϕ(n)}. Comme an,m ≥ 0 pour
Pn Pi Pj
tout (n, m), on en déduit que A ≥ p=0 aϕ(p) ≥ n=0 ( m=0 an,m ) et donc, en faisant tendre j puis i
vers ∞, que A ≥ B. Un raisonnement similaire donne que B ≥ A et donc A = B.

On introduit maintenant la tribu de Lebesgue, sur laquelle on montrera que λ? est une mesure.

Définition 2.19 (Tribu de Lebesgue) On pose L = {E ∈ P(R) t.q. λ? (A) = λ? (A ∩ E) + λ? (A ∩ E c )


pour tout A ∈ P(R)}. On rappelle que λ? est définie dans la définition 2.18 (et que E c = R \ E). Cet
ensemble de parties de R noté L s’appelle “tribu de Lebesgue” (on montre dans la proposition 2.8 que L
est bien une tribu).

30
Remarque 2.8 On peut avoir une première idée de l’intérêt de la définition 2.19 en remarquant qu’elle
donne immédiatement l’additivité de λ? sur L. En effet, soit E1 , E2 ⊂ R t.q. E1 ∩ E2 = ∅ et soit A ⊂ R.
On suppose que E1 ∈ L et on utilise la définition de L avec A ∩ (E1 ∪ E2 ), on obtient λ? (A ∩ (E1 ∪ E2 )) =
λ? (A ∩ (E1 ∪ E2 ) ∩ E1 ) + λ? (A ∩ (E1 ∪ E2 ) ∩ E1c ) = λ? (A ∩ E1 ) + λ? (A ∩ E2 ) (car E1 ∩ E2 = ∅).
Pn
Par récurrence sur n, on a donc aussi λ? (A ∩ (∪ni=1 Ei )) = i=1 λ? (A ∩ Ei ), dès que E1 , . . . , En−1 ∈ L,
A, En ⊂ R et Ei ∩ Ej = ∅ si i 6= j, i, j ∈ {1, . . . , n}.
En particulier, en prenant A = R, on obtient l’additivité de λ? sur L, c’est-à-dire
n
X
?
λ (∪ni=1 Ei ) = λ? (Ei ),
i=1

si E1 , . . . , En−1 ∈ L et Ei ∩ Ej = ∅ si i 6= j, i, j ∈ {1, . . . , n}.

Remarque 2.9 Pour tout E, A ∈ P(R), on a, par σ−sous additivité de λ? , λ? (A) ≤ λ? (A ∩ E) +


λ? (A ∩ E c ). Pour montrer que E ∈ L (définie dans la définition 2.19), il suffit donc de montrer que
λ? (A) ≥ λ? (A ∩ E) + λ? (A ∩ E c ), pour tout A ∈ P(R).

Proposition 2.8 (Propriétés de L) L est une tribu sur R et λ?|L est une mesure. L et λ? sont définies
dans les définitions 2.18 et 2.19.

Démonstration :
Il est immédiat que ∅ ∈ L et que L est stable par “passage au complémentaire”. On sait aussi que
λ? (∅) = 0. Il reste donc à démontrer que L est stable par union dénombrable et que la restriction de λ?
à L est une mesure. Ceci se fait en deux étapes décrites ci-après.

Etape 1. On montre, dans cette étape, que L est stable par union finie et que, si n ≥ 2 et (Ei )i=1,...,n ⊂ L
est t.q. Ei ∩ Ej = ∅ si i 6= j, alors on a :
n
X
λ? (A ∩ (∪ni=1 Ei )) = λ? (A ∩ Ei ), ∀A ∈ P(R). (2.15)
i=1

(Cette dernière propriété donne l’additivité de λ? sur L en prenant A = R, cette propriété d’additivité a
déjà été signalée dans la remarque 2.8.)
Par une récurrence facile, il suffit de montrer que E1 ∪ E2 ∈ L si E1 , E2 ∈ L et de montrer la propriété
(2.15) pour n = 2. Soit donc E1 , E2 ∈ L. On pose E = E1 ∪ E2 . Pour montrer que E ∈ L, il suffit de
montrer (voir la remarque 2.9) que λ? (A) ≥ λ? (A ∩ E) + λ? (A ∩ E c ), pour tout A ∈ P(R). Soit A ∈ P(R).
Par σ−sous additivité de λ? on a

λ? (A ∩ (E1 ∪ E2 )) = λ? ((A ∩ E1 ) ∪ (A ∩ E1c ∩ E2 )) ≤ λ? (A ∩ E1 ) + λ? (A ∩ E1c ∩ E2 ),

et donc

λ? (A ∩ (E1 ∪ E2 )) + λ? (A ∩ (E1 ∪ E2 )c ) ≤ λ? (A ∩ E1 ) + λ? (A ∩ E1c ∩ E2 ) + λ? (A ∩ E1c ∩ E2c ).

Comme E2 ∈ L, on a λ? (A ∩ E1c ) = λ? (A ∩ E1c ∩ E2 ) + λ? (A ∩ E1c ∩ E2c ). Puis, comme E1 ∈ L, on a


λ? (A) = λ? (A ∩ E1 ) + λ? (A ∩ E1c ). On en déduit

λ? (A ∩ (E1 ∪ E2 )) + λ? (A ∩ (E1 ∪ E2 )c ) ≤ λ? (A).

Ce qui prouve que E ∈ L.

31
Pour montrer (2.15) avec n = 2 si E1 , E2 ∈ L avec E1 ∩ E2 = ∅, il suffit de remarquer que (pour tout
A ∈ P(R)) λ? (A ∩ (E1 ∪ E2 )) = λ? ((A ∩ E1 ) ∪ (A ∩ E2 )) = λ? ([(A ∩ E1 ) ∪ (A ∩ E2 )] ∩ E1 ) + λ? ([(A ∩ E1 ) ∪
(A ∩ E2 )] ∩ E1c ) = λ? (A ∩ E1 ) + λ? (A ∩ E2 ). (On a utilisé le fait que E1 ∈ L.) Ceci termine l’étape 1.
Une conséquence de cette étape (et du fait que L est stable par passage au complémentaire) est que L
est stable par intersection finie.

Etape 2. On montre, dans cette étape, que L est stable par union dénombrable et la restriction de λ? à
L est une mesure (ce qui termine la démonstration de la proposition 2.8).
Soit (En )n∈N ⊂ L et E = ∪n∈N En . On veut montrer que E ∈ L. On commence par remarquer que
E = ∪n∈N Fn avec F0 = E0 et, par récurrence, pour n ≥ 1, Fn = En \ ∪n−1
p=0 Fp . L’étape 1 nous donne que
(Fn )n∈N ⊂ L et, comme Fn ∩ Fm = ∅ si n 6= m, on peut utiliser (2.15). Pour tout A ∈ P(R), on a donc :
n
X
λ? (A) = λ? (A ∩ (∪np=0 Fp )) + λ? (A ∩ (∪np=0 Fp )c ) = λ? (A ∩ Fp ) + λ? (A ∩ (∪np=0 Fp )c ). (2.16)
p=0

En utilisant le fait que E c ⊂ (∪np=0 Fp )c et la monotonie de λ? , on a λ? (A ∩ (∪np=0 Fp )c ) ≥ λ? (A ∩ E c ).


En faisant tendre n vers ∞ dans (2.16) et en utilisant la σ−sous additivité de λ? , on en déduit alors que
λ? (A) ≥ λ? (A ∩ E) + λ? (A ∩ E c ). Ce qui prouve que E ∈ L (voir remarque 2.9) et donc que L est une
tribu.
Il reste à montrer que λ? est une mesure sur L. Soit (En )n∈N ⊂ L t.q. Ei ∩Ej = ∅ si i 6= j et E = ∪n∈N En .
Par monotonie de λ? on a, pour tout n ∈ N, λ? (∪np=0 Ep )P≤ λ? (E) et donc, en utilisant l’additivité de λ?
n
sur L (démontrée à l’étape 1, voir (2.15) avec A = E), p=0 λ? (Ep ) ≤ λ? (E). Ce qui donne, passant à
P∞ ? P∞
limite quand n → ∞, p=0 λ (Ep ) ≤ λ? (E). D’autre part, λ? (E) ≤ p=0 λ? (Ep ), par σ−sous additivité

de λ? . On a donc λ? (E) = p=0 λ? (Ep ). Ce qui prouve que λ?|L est une mesure.
P

Démonstration de la partie “existence” du théorème 2.2 :


Pour montrer la partie “existence” du théorème 2.2, il suffit, grâce aux propositions 2.7 et 2.8, de montrer
que L (définie dans la définition 2.19) contient B(R). Pour cela, il suffit de montrer que ]a, ∞[⊂ L pour
tout a ∈ R (car {]a, ∞[, a ∈ R} engendre B(R)). Soit donc a ∈ R et E =]a, ∞[. Pour tout A ∈ P(R), on
veut montrer que λ? (A) ≥ λ? (A ∩ E) + λ? (A ∩ E c ). On peut supposer que λ? (A) < ∞ (sinon l’inégalité
est immédiate).
Soit ε > 0. Par la définition de λ? (A), il existe (In )n∈N ∈ EA t.q. λ? (A) ≥ n∈N `(In ) − ε. Comme
P
A ∩ E ⊂ (∪n∈N (In ∩ E)) et A ∩ E c ⊂ (∪n∈N (In ∩ E c )), la σ−sous additivité de λ? donne
X X
λ? (A ∩ E) ≤ λ? (In ∩ E) et λ? (A ∩ E c ) ≤ λ? (In ∩ E c ).
n∈N n∈N

Comme In ∩ E et In ∩ E c sont des intervalles, la fin de la démonstration de la proposition 2.7 donne


λ? (In ∩E) = `(I ? c c ? ? c
P
n ∩E) et λ (In ∩E ) = `(In ∩E ). On en déduit λ (A∩E)+λ (A∩E ) ≤ n∈N (`(In ∩E)+
`(In ∩ E c )) = n∈N `(In ) (car `(In ∩ E) + `(In ∩ E c ) = `(In )) et donc λ? (A ∩ E) + λ? (A ∩ E c ) ≤ λ? (A) + ε.
P
Quand ε → 0 on trouve l’inégalité recherchée. On a bien montré que E ∈ L.

On va maintenant démontrer un théorème important dont on peut déduire, en particulier, la partie


“unicité” du théorème 2.2.

Théorème 2.3 (Régularité d’une mesure sur B(R), finie sur les compacts)

32
Soit m une mesure sur B(R). On suppose que m est finie sur les compacts, c’est à dire que m(K) < ∞ pour
tout compact K de R (noter qu’un compact est nécessairement dans B(R)). Alors, pour tout A ∈ B(R)
et tout ε > 0, il existe un ouvert O et un fermé F t.q. F ⊂ A ⊂ O et m(O \ F ) ≤ ε. En particulier, on a
donc, pour tout A ∈ B(R), m(A) = inf{m(O), O ouvert contenant A} et m(A) = sup{m(K), K compact
inclus dans A}.

Démonstration :
On appelle T l’ensemble des A ∈ B(R) t.q. pour tout ε > 0, il existe O ouvert et F fermé vérifiant
F ⊂ A ⊂ O et m(O\F ) ≤ ε. On va montrer que T est une tribu contenant C = {]a, b[, −∞ < a < b < ∞}.
Comme C engendre B(R), ceci donnera T = B(R).
On montre tout d’abord que C ⊂ T . Soit −∞ < a < b < ∞ et A =]a, b[.
Pour tout n ≥ n0 avec n0 t.q. (2/n0 ) < b − a on a :

[a + (1/n), b − (1/n)] ⊂ A ⊂]a, b[.

Pour n ≥ n0 , on pose Bn =]a, a + (1/n)[∪]b − (1/n), b[). La suite (Bn )n≥n0 est une suite décroissante
et ∩n≥n0 Bn = ∅. Comme m est finie sur les compacts, on a m(Bn ) ≤ m([a, b]) < ∞. En utilisant la
continuité décroissante de m (proposition 2.3), on a donc :

m(]a, b[\[a + (1/n), b − (1/n)]) = m(]a, a + (1/n)[∪]b − (1/n), b[) = m(Bn ) → 0 quand n → ∞.

Soit maintenant ε > 0 en prenant n assez grand on a m(Bn ) ≤ ε. En prenant O = A et F = [a +


(1/n), b − (1/n)], on a bien O ouvert, F fermé, F ⊂ A ⊂ O et m(O \ F ) ≤ ε. Ceci prouve que ]a, b[∈ T .

On montre maintenant que T est une tribu. On remarque tout d’abord que ∅ ∈ T (il suffit de prendre
F = O = ∅) et que T est stable par passage au complémentaire (car, si F ⊂ A ⊂ O, on a Oc ⊂ Ac ⊂ F c
et F c \ Oc = O \ F ). Il reste à montrer que T est stable par union dénombrable.
Soit (An )n∈N ⊂ T et A = ∪n∈N An . On veut montrer que A ∈ T . On va commencer par traiter le cas
(simple) où m(A) < ∞ puis le cas (plus difficile) où m(A) = ∞.
Premier cas. On suppose que m(A) < ∞.
Soit ε > 0. Pour tout n ∈ N, il existe On ouvert et Fn fermé t.q. Fn ⊂ An ⊂ On et m(On \ Fn ) ≤ (ε/2n ).
On pose O = ∪n∈N On et F̃ = ∪n∈N Fn . On a F̃ ⊂ A ⊂ O, m(O \ F̃ ) ≤ 2ε, car (O \ F̃ ) ⊂ ∪n∈N (On \ Fn ),
et O ouvert mais F̃ n’est pas nécessairement fermé. . .
Cependant, puisque m(A) < ∞, on a aussi m(F̃ ) < ∞. Par continuité croissante de m (appliquée à la suite
(∪np=0 Fp )n∈N ) on a m(∪np=0 Fp ) → m(F̃ ), quand n → ∞, d’où (puisque m(F̃ ) < ∞) m(F̃ )−m(∪np=0 Fp ) →
0. On prend alors F = ∪N p=0 Fp avec N assez grand pour que m(F̃ \ F ) = m(F̃ ) − m(F ) ≤ ε. On a
bien F ⊂ A ⊂ O, O ouvert, F fermé et, comme (O \ F ) = (O \ F̃ ) ∪ (F̃ \ F ), on a m(O \ F ) =
m(O \ F̃ ) + m(F̃ \ F ) ≤ 3ε. Ceci prouve que A ∈ T .
Deuxième cas. On suppose maintenant que m(A) = ∞ (et le raisonnement précédent n’est plus correct
si m(F̃ ) = ∞). On raisonne en 3 étapes :

1. Soit p ∈ Z. On remarque d’abord que An ∩ [p, p + 1[∈ T pour tout n ∈ N. En effet, soit n ∈ N et
ε > 0. Il existe O ouvert et F fermé t.q. F ⊂ An ⊂ O et m(O \ F ) ≤ ε. Pour k ∈ N? , on a donc :
1 1
Fk = F ∩ [p, p + 1 − ] ⊂ An ∩ [p, p + 1[⊂ Ok = O∩]p − , p + 1[.
k k

33
On a Fk fermé, Ok ouvert et (Ok \ Fk ) ⊂ (O \ F )∪]p − k1 , p[∪]p + 1 − k1 , p + 1[. On en déduit :

1 1
m(Ok \ Fk ) ≤ ε + m(]p − , p[∪]p + 1 − , p + 1[).
k k
Or, la continuité décroissante de m donne que m((]p − k1 , p[∪]p + 1 − k1 , p + 1[) → 0 quand k → ∞
(on utilise ici le fait que m([p − 1, p + 1]) < ∞ car m est finie sur les compacts). Il existe donc
k ∈ N? t.q. m(Ok \ Fk ) ≤ 2ε, ce qui donne bien que An ∩ [p, p + 1[∈ T .

2. Comme m(A ∩ [p, p + 1[) < ∞, on peut maintenant utiliser le premier cas avec A ∩ [p, p + 1[=
∪n∈N (An ∩ [p, p + 1[). Il donne que A ∩ [p, p + 1[∈ T pour tout p ∈ Z.
3. On montre enfin que A ∈ T . Soit ε > 0. Pour tout p ∈ Z, il existe un ouvert Op et un fermé Gp
t.q. Gp ⊂ A ∩ [p, p + 1[⊂ Op et m(Op \ Gp ) ≤ ε/(2|p| ). On prend O = ∪p∈Z Op et F = ∪p∈Z Gp . On
obtient F ⊂ A ⊂ O, m(O \ F ) ≤ 3ε et O est ouvert. Il reste à montrer que F est fermé.
Soit (xn )n∈N ⊂ F t.q. xn → x (dans R) quand n → ∞. On veut montrer que x ∈ F . Il existe
p ∈ Z t.q. x ∈]p − 1, p + 1[. Il existe donc n0 ∈ N t.q. xn ∈]p − 1, p + 1[ pour tout n ≥ n0 . Comme
xn ∈ ∪q∈Z Gq et que Gq ⊂ [q, q + 1[ pour tout q, on a donc xn ∈ Gp ∪ Gp−1 pour tout n ≥ n0 .
Comme Gp ∪ Gp−1 est fermé, on en déduit que x ∈ Gp ∪ Gp−1 ⊂ F et donc que F est fermé.
Ceci montre bien que A ∈ T et termine la démonstration du fait que T est une tribu. Comme cela
a déjà été dit, on en déduit que T = B(R).

On a donc bien montré que pour tout A ∈ B(R) et pour tout ε > 0, il existe O ouvert et F fermé vérifiant
F ⊂ A ⊂ O et m(O \ F ) ≤ ε.

On montre maintenant que m(A) = inf{m(O), O ouvert contenant A} pour tout A ∈ B(R). Soit
A ∈ B(R). On remarque d’abord que la monotonie d’une mesure donne m(A) ≤ inf{m(O), O ouvert
contenant A}. Puis, l’inégalité inverse est immédiate si m(A) = ∞. Enfin, si m(A) < ∞, pour tout ε > 0
il existe O ouvert et F fermé vérifiant F ⊂ A ⊂ O et m(O \ F ) ≤ ε. On a donc O \ A ⊂ O \ F et donc (par
monotonie de m) m(O \ A) ≤ ε et m(O) = m(A) + m(O \ A) ≤ m(A) + ε. On a donc trouvé un ouvert
O contenant A t.q. m(O) − ε ≤ m(A). On en déduit que inf{m(O), O ouvert contenant A} ≤ m(A) et
finalement que m(A) = inf{m(O), O ouvert contenant A}.

De manière semblable, on montre aussi que m(A) = sup{m(K), K compact inclus dans A} pour tout
A ∈ B(R). En effet, soit A ∈ B(R). Ici aussi, on commence par remarquer que la monotonie d’une mesure
donne m(A) ≥ sup{m(K), K compact inclus dans A}. On montre maintenant l’inégalité inverse. Soit
ε > 0. Il existe F fermé t.q. F ⊂ A et m(A \ F ) ≤ ε. Si m(A) = ∞, on en déduit que m(F ) = ∞ et donc
que m(Kn ) ↑ ∞ quand n → ∞ (par continuité croissante de m) avec Kn = F ∩ [−n, n]. Comme Kn est
compact pour tout n ∈ N, on a donc sup{m(K), K compact inclus dans A} = ∞ = m(A). Si m(A) < ∞,
on a m(A) ≥ m(F ) ≥ m(A) − ε et donc, pour n assez grand, m(Kn ) ≥ m(F ) − ε ≥ m(A) − 2ε (toujours
par continuité croissante de m) avec Kn = F ∩ [−n, n]. Comme Kn est compact pour tout n ∈ N et que
ε est arbitraire, on en déduit que sup{m(K), K compact inclus dans A} ≥ m(A) et donc, finalement,
m(A) = sup{m(K), K compact inclus dans A}.

Pour démontrer la partie “unicité” du théorème 2.2 avec le théorème 2.3 on aura aussi besoin du petit
lemme suivant (plus précis que le lemme 2.1 car dans le lemme 2.1 il n’est pas demandé que les ouverts
soient disjoints).

34
Lemme 2.4 (Ouverts de R) Soit O un ouvert de R, alors O est une union dénombrable d’intervalles
ouverts disjoints 2 à 2, c’est à dire qu’il existe (In )n∈N t.q. In est un intervalle ouvert de R pour tout
n ∈ N, In ∩ Im = ∅ si n 6= m et O = ∪n∈N In .

Démonstration :
Pour x ∈ O on pose Ox = {y ∈ O; I(x, y) ⊂ O}, avec I(x, y) = {tx + (1 − t)y, t ∈ [0, 1]} (on a donc
I(x, y) = [x, y] ou [y, x]). On remarque que O = ∪x∈O Ox et que Ox est, pour tout x ∈ O, un intervalle
ouvert (c’est l’intervalle ] inf Ox , sup Ox [, avec inf Ox , sup Ox ∈ R). Il est aussi facile de voir que, pour
tout x, y ∈ O, Ox ∩ Oy 6= ∅ implique que Ox = Oy . On peut trouver A ⊂ O t.q. O = ∪x∈A Ox et
Ox ∩ Oy = ∅ si x, y ∈ A, x 6= y. Comme Ox 6= ∅ pour tout x ∈ A, on peut donc construire une application
de A dans Q en choisissant pour chaque x ∈ A un rationnel de Ox (ce qui est possible car tout ouvert
non vide de R contient un rationnel). Cette application est injective car Ox ∩ Oy = ∅ si x, y ∈ A, x 6= y.
l’ensemble A est donc au plus dénombrable, ce qui termine la démonstration du lemme.

Remarque 2.10 Dans la démonstration du lemme 2.4, Ox est la “composante connexe” de x. Le lemme
2.4 consiste donc à remarquer qu’un ouvert est réunion de ses composantes connexes, que celles ci sont
disjointes deux à deux et sont des ouverts connexes et donc des intervalles ouverts (car un connexe dans
R est nécessairement un intervalle).

Démonstration de la partie “unicité” du théorème 2.2 :


On a construit une mesure, notée λ, sur B(R) t.q. λ(]a, b[) = b − a pour tout a, b ∈ R, a < b. Supposons
que m soit aussi une mesure sur B(R) t.q. m(]a, b[) = b − a pour tout a, b ∈ R, a < b. On veut montrer
que λ = m (sur tout B(R)). Nous le montrons ici avec deux méthodes différentes, utilisant le théorème 2.3
ou la proposition 2.5.
Première méthode, avec le théorème 2.3. En utilisant le fait que tout ouvert est réunion dénom-
brable d’intervalles ouverts disjoints deux à deux (lemme 2.4) et les propriétés de σ−additivité de λ et
de m, on montre que λ(O) = m(O) pour tout ouvert O de R. Puis, en utilisant la dernière assertion du
théorème de régularité (qui s’applique pour m et pour λ, car m et λ sont des mesures sur B(R), finies sur
les compacts), on obtient λ(A) = m(A) pour tout A ∈ B(R), i.e. m = λ.
Deuxième méthode, avec la proposition 2.5. On utilise la proposition 2.5 avec (E, T ) = (R, B(R))
et C = {]a, b], a, b ∈ R, a ≤ b}. On sait que C engendre B(R), et il est clair que C est stable par
intersection finie. On prend maintenant Fn =]n, n + 1] pour n ∈ Z. La famille (Fn )n∈Z est donc une
famille dénombrable d’éléments de C, disjoints deux à deux et t.q. R = ∪n∈Z Fn . Pour a, b ∈ R, a ≤ b, on
a, par continuité décroissante de m, m(]a, b] = limp→∞ m(]a, b + p1 [= limp→∞ b − a + p1 = b − a = λ(]a, b]).
On a donc m = λ sur C (et m(Fn ) < ∞ pour tout n ∈ Z). On peut donc appliquer la proposition 2.5.
Elle donne λ = m sur B(R).

Remarque 2.11 Nous avons vu que la mesure de Lebesgue, notée λ, était régulière. Ceci ne donne pas,
pour A ∈ B(R), l’égalité de la mesure de A avec la mesure de son intérieur ou de son adhérence. Il suffit,
pour s’en convaincre, de prendre, par exemple, A = Q. On a alors λ(A) = 0 (voir la remarque 2.13) et
λ(A) = ∞.

Remarque 2.12 Nous avons donc, dans cette section, construit une application, notée λ? , de P(R) dans
R+ . Cette application n’est pas une mesure mais nous avons montré que la restriction de λ? à la tribu
de Lebesgue, notée L, était une mesure. Puis, nous avons démontré que B(R) ⊂ L et obtenu ainsi,

35
en prenant la restriction de λ? à B(R) la mesure que nous cherchions. On peut se demander toutefois
quelle est la différence entre L et B(R). Du point de vue des cardinaux, cette différence est considérable
car card(L) = card(P(R)) alors que card(B(R)) = card(R) mais du point de vue de l’intégration, la
différence est dérisoire, comme nous pourrons le voir avec l’exercice 4.18 (plus complet que l’exercice
2.28) car l’espace mesuré (R, L, λ|L ) est simplement le complété de (R, B(R), λ|B(R) ).

On donne maintenant une propriété, spécifique à la mesure de Lebesgue, qui est à la base de toutes les
formules de changement de variables pour l’intégrale de Lebesgue.

Proposition 2.9 (Invariance par translation “généralisée”) Soit α ∈ R? et β ∈ R. Pour A ∈


P(R), on note αA + β = {αx + β, x ∈ A}. On a alors :

1. A ∈ B(R) implique αA + β ∈ B(R),


2. λ(αA + β) = |α|λ(A) pour tout A ∈ B(R).

Pour α = 1, cette propriété s’appelle “invariance par translation de λ”.

Démonstration :
Pour la première partie de la proposition, on pose T = {A ∈ B(R); αA+β ∈ B(R)}. On montre facilement
que T est une tribu contenant les intervalles ouverts, on en déduit que T = B(R).
Pour la deuxième partie, on pose, pour tout A ∈ B(R), m1 (A) = λ(αA + β) et m2 (A) = |α|λ(A). Il est
facile de voir que m1 et m2 sont des mesures sur B(R), finies sur les bornés, et qu’elles sont égales sur
l’ensemble des intervalles ouverts. On raisonne alors comme dans la démonstration de la partie “unicité”
du théorème 2.2, en utilisant le théorème 2.3 ou la proposition 2.5. Par exemple, en utilisant le lemme
2.4 et les propriétés de σ−additivité de m1 et de m2 , on montre que m1 (O) = m2 (O) pour tout ouvert
O de R. Puis, en utilisant la dernière assertion du théorème de régularité (qui s’applique pour m1 et
pour m2 ), on obtient m1 (A) = m2 (A) pour tout A ∈ B(R). On a donc λ(αA + β) = |α|λ(A) pour tout
A ∈ B(R).

Remarque 2.13 La mesure de Lebesgue est diffuse (c’est-à-dire que λ({x}) = 0 pour tout x ∈ R). Donc,
si D est une partie dénombrable de R, on a λ(D) = 0. Ainsi, λ(N) = λ(Z) = λ(Q) = 0. La réciproque est
fausse. On construit par exemple un ensemble (dit “ensemble de Cantor”, K, qui est une partie compacte
non dénombrable de [0,1], vérifiant λ(K) = 0, voir exercice 2.27).

Définition 2.20 (Mesure de Lebesgue sur un borélien de R) Soit I un intervalle de R (ou, plus
généralement, I ∈ B(R)) et T = {B ∈ B(R); B ⊂ I} (on peut montrer que T = B(I), où I est muni de
la topologie induite par celle de R, voir l’exercice 2.3 page 41). Il est facile de voir que T est une tribu
sur I et que la restriction de λ (définie dans le théorème 2.2) à T est une mesure sur T , donc sur les
boréliens de I (voir 2.15 page 44). On note toujours par λ cette mesure.

2.6 Indépendance et probabilité conditionnelle


2.6.1 Probabilité conditionnelle
Commençons par expliquer la notion de probabilité conditionnelle sur l’exemple du lancer de dé. On se
place dans le modèle équiprobable: soient E = {1, 2, 3, 4, 5, 6}, T = P(E) et p la probabilité définie par

36
p({x}) = 16 , ∀x ∈ E. La probabilité de l’événement A “obtenir 6” est 16 . Supposons maintenant que
l’on veuille évaluer la chance d’obtenir un 6, alors que l’on sait déjà que le résultat est pair (événement
1
B = {2, 4, 6}). Intuitivement, on a envie de dire que la “chance” d’obtenir un 6 est alors cardB = 13 .

Définition 2.21 (Probabilité conditionnelle) Soient (E, T, p) un espace probabilisé et A, B ∈ T .


Si p(B) 6= 0, la probabilité conditionnelle de A par rapport à B (on dit aussi probabilité de A par rapport
à B), notée p(A|B), est définie par p(A|B) = p(A∩B)
p(B) .
Si p(B) = 0, la probabilité conditionnelle de A par rapport à B, notée p(A|B), n’est pas définie. C’est un
nombre arbitraire entre 0 et 1.

De cette définition on déduit la formule de Bayes: soient (E, T, p) un espace probabilisé et A, B ∈ T ,


alors:
p(B)p(A|B) = p(A ∩ B) (2.17)
Remarque 2.14 Soient (E, T, p) un espace probabilisé et A un événement tel que p(A) 6= 0. Alors
l’application pA : T → [0, 1] définie par:

p(A ∩ B)
pA (B) = p(B|A) = , ∀B ∈ T (2.18)
p(A)

est une probabilité sur T . On dit que “la masse de pA est concentrée en A” : on a en effet : pA (B) = 0,
pour tout B ∈ T t.q. A ∩ B = ∅. On a aussi pA (A) = 1.

Définition 2.22 Soit (E, T, p) un espace probabilisé, on appelle système de constituants une famille
(Cn )n∈N ⊂ T d’ensembles disjoints deux à deux t.q. ∪n∈N Cn = E.

On a comme corollaire immédiat de la relation 2.17:


Proposition 2.10 Soient (E, T, p) un espace probabilisé, (Cn )n∈N ⊂ T un système de constituants de
probabilités non nulles et A ∈ T , alors:
X
p(A) = p(Cn )p(A|Cn ). (2.19)
n∈N

Dans le cas où p(B) = p(B|A), on a envie de dire que A n’influe en rien sur B ; on a dans ce cas:
p(A)p(B) = p(A ∩ B).

2.6.2 Evènements indépendants, tribus indépendantes


Définition 2.23 (Indépendance de deux évènements) Soient (E, T, p) on dit que deux événements
A et B sont (stochastiquement) indépendants si p(A)p(B) = p(A ∩ B).

Remarque 2.15 Attention: il est clair que, lors de la modélisation d’un phénomène aléatoire, si on a des
évènements indépendants a priori, i.e. tels que la réalisation de l’un n’a aucune influence sur la réalisation
de l’autre, on choisira, pour le modèle probabiliste, une probabilité qui respecte l’indépendance: on dit
que l’indépendance a priori implique l’indépendance stochastique. Cependant, la notion d’indépendance
est liée à la notion de probabilité; ainsi, pour une probabilité p donnée, deux évènements peuvent être
indépendants alors qu’ils ne paraissent pas intuitivement indépendants.

37
Exemple 2.3 Prenons comme exemple le lancer simultané de deux dés: a priori, il parait raisonnable
de supposer que les résultats obtenus pour chacun des deux dés n’influent pas l’un sur l’autre, et on
va donc chercher une probabilité qui respecte cette indépendance. L’univers des possibles est ici E =
{(i, j), 1 ≤ i ≤ 6, 1 ≤ j ≤ 6}. Les résultats de chaque lancer simultané des deux dés étant équiprobables,
on a donc envie de définir, pour A ∈ P(E), p(A) = cardA 36 . Voyons maintenant si deux évènements a
priori indépendants sont indépendants pour cette probabilité. Considérons par exemple l’évènement A:
“obtenir un double 6”; on peut écrire: A = B ∩ C, où B est l’évènement “obtenir un 6 sur le premier
dé” et C l’évènement “obtenir un 6 sur le deuxième dé”. On doit donc vérifier que: p(A) = p(B)p(C).
Or B = {(6, j), 1 ≤ j ≤ 6} et C = {(i, 6), 1 ≤ i ≤ 6}. On a donc p(B) = p(C) = 61 , et on a bien
1
p(A) = p(B)p(C)(= 36 ).

On généralise la notion d’indépendance de deux évènements en introduisant la notion d’indépendance de


tribus.

Définition 2.24 (Indépendance des tribus) Soit (E, T, p) un espace probabilisé et (Tk )k∈N? une suite
de tribus incluses dans T .

1. Soit N > 1. On dit que les N tribus Tk , k = 1, . . . , N , sont indépendantes (on dit aussi que la suite
T1 , . . . , TN est indépendante) si pour toute famille (A1 , . . . , AN ) d’événements tels que Ak ∈ Tk pour
k = 1, . . . , N on a: p(∩N k=1 Ak ) = p(A1 )p(A2 ) . . . p(AN ).

2. On dit que la suite (Tk )k∈N? est indépendante (ou que les tribus T1 , . . . , Tn , . . . sont indépendantes)
si pour tout N ≥ 1, les N tribus Tk , k = 1, . . . , N , sont indépendantes.

On peut facilement remarquer que si A et B sont deux évènements d’un espace probabilisé (E, T, p),
ils sont indépendants (au sens de la définition 2.23) si et seulement si les tribus TA = {∅, E, A, Ac }
et TB = {∅, E, B, B c } sont indépendantes (voir l’exercice 3.16). On en déduit la généralisation de la
définition d’indépendance à plusieurs évènements:

Définition 2.25 (Evénements indépendants) Soient (E, T, p) un espace probabilisé et (Ak )k=1,...,N
des événements, on dit que les N événements (Ak )k=1,...,N sont indépendants si les N tribus engendrées
par les événements Ak , k = 1 . . . , N (c’est-à-dire les N tribus définies par Tk = {Ak , Ack , E, ∅} pour
k = 1 . . . , N ) sont indépendantes.

Sous les hypothèses de la définition précédente, on peut remarquer que les événements A1 , . . . , AN sont
indépendants Q
(c’est-à-dire que les tribus engendrées par A1 , . . . , AN sont indépendantes) si et seulement si
P (∩i∈I Ai ) = i∈I P (Ai ) pour tout I ⊂ {1, . . . , N }), voir l’exercice 3.16. Nous terminons ce paragraphe
par une proposition sur les tribus indépendantes :

Proposition 2.11 Soit (E, T, p) un espace probabilisé.


1. Soit N > 1 et (Tk )k∈{0,...N } une suite indépendante de tribus incluses dans T . La tribu T0 est alors
indépendante de la tribu engendrée par les tribus T1 , . . . , TN .

2. (Généralisation) Soit N > 3, q > 1, n0 , . . . , nq t.q. n0 = 0, ni < ni+1 (pour i = 0, . . . , q − 1),


nq = N et (Tk )k∈{1,...N } une suite indépendante de tribus incluses dans T . Pour i = 1, . . . , q, on
note τi la tribu engendrée par les tribus Tn pour n = ni−1 , . . . , ni . Alors, les tribus τ1 , . . . , τq sont
indépendantes.

38
Démonstration : On montre tout d’abord le premier item de la proposition. On note S la tribu
engendrée par les tribus T1 , . . . , TN . Comme S est la plus petite tribu contenant les tribus Tk (k =
1, . . . , N ), elle est incluse dans T . On veut montrer que T0 et S sont indépendantes, c’est-à-dire que
p(A ∩ B) = p(A)p(B) pour tout A ∈ T0 et tout B ∈ S. Pour le montrer, on va utiliser la proposition 2.5
(donnant l’unicité d’une mesure). Soit A ∈ T0 , on définit les mesures m et µ sur T en posant :

m(B) = p(A ∩ B), µ(B) = p(A)p(B), pour B ∈ T,

et on pose :
C = {∩N
k=1 Ak , Ak ∈ Tk pour k = 1, . . . , N }.

Pour B ∈ C, on a B = ∩N k=1 Ak avec Ak ∈ Tk avec k = 1, . . . , N . On a donc, en utilisant l’indépendance


des tribus T0 , T1 , . . . , TN , m(B) = p(A ∩ B) = p(A)p(A1 )p(A2 ) . . . p(AN ) = p(A)p(B) = µ(B). On a donc
m = µ sur C. Comme C est stable par intersection et que E ∈ C, la proposition 2.5 nous donne m = µ sur
la tribu engendrée par C. Comme cette tribu contient toutes les tribus Tk (k = 1, . . . , N ), elle contient
aussi S (en fait, elle est égale à S). On a donc bien montré que p(A ∩ B) = p(A)p(B) pour tout B ∈ S
et pour tout A ∈ T0 .

Pour montrer le deuxième item (qui est une généralisation du premier), il suffit de faire une récurrence
finie de q étapes et d’utiliser la technique précédente. Par exemple, pour q = 2 la technique précédente
donne :
p((∩nk=1
1
Ak ) ∩ B2 ) = p(∩nk=1
1
Ak )p(B2 ),
pour Ak ∈ Tk , k = 1, . . . , n1 et B2 ∈ τ2 . Puis en reprenant la technique précénete, on montre p(B1 ∩B2 ) =
p(B1 )p(B2 ) pour B1 ∈ τ1 et B2 ∈ τ2 . Ce qui donne bien l’indépendance de τ1 et τ2 .

2.6.3 Probabilités sur (R, B(R))


Une probabilité est définie sur un espace probabilisable quelconque. Très souvent, on ne connait du
problème aléatoire que l’on cherche à modéliser ni l’ensemble E (“univers des possibles”) ni la tribu T
(ensemble des évènements) ni la probabilité p. Par contre, on connait une “image” de la probabilité p par
une application (dite mesurable, voir chapitre suivant) X de E dans R. On travaille alors avec l’espace
beaucoup plus sympathique (car mieux défini...) (R, B(R), pX ), ou pX est une probabilité sur B(R), que
les probabilistes appellent souvent “loi de probabilité” (elle dépend de p et de l’application X).
Nous donnons maintenant quelques notions propres aux lois de probabilités (ou probabilités définies sur
(R, B(R))), ainsi que quelques exemples concrets utilisés dans la représentation de phénomènes aléatoires.

Définition 2.26 (Fonction de répartition) Soit p une probabilité sur (R, B(R)). On appelle fonction
de répartition de la probabilité p la fonction F , définie de R dans [0, 1] par: F (t) = p(] − ∞, t]). Cette
fonction est croissante et continue à droite.

Démonstration : Utiliser les propriétés de monotonie et de continuité croissante de la mesure.

Théorème 2.4 Soit F une fonction croissante et continue à droite t.q.:


limt→−∞ F (t) = 0 et limt→+∞ F (t) = 1.
Alors, il existe une unique probabilité p sur B(R) telle que F soit la fonction de répartition de p.

Plus généralement, on a le théorème suivant pour les mesures:

39
Théorème 2.5 (Lebesgue-Stieltjes)

1. Pour toute mesure m sur B(R), finie sur les compacts (on dit “localement finie”), et pour tout a ∈ R,
la fonction F définie sur R par : F (t) = m(]a, t]) si t ≥ a et F (t) = −m(]t, a]) si t ≤ a est continue
à droite et croissante.
2. Réciproquement, pour toute fonction F de R dans R, croissante et continue à droite, il existe une
unique mesure m sur B(R) t.q. pour tous a, b ∈ R, t.q. a ≤ b, on ait m(]a, b]) = F (b) − F (a). Cette
mesure s’appelle la mesure de Lebesgue-Stieltjes associée à F .

Pour démontrer ce théorème, on introduit p? , application définie de l’ensemble des intervalles de R de la


forme ]a, b] dans R par: p? (]a, b]) = F (b) − F (a). La démonstration du fait qu’il existe un prolongement
unique de cette application en une mesure sur B(R) est très voisine à celle du théorème de Carathéodory
(théorème 2.2).

Donnons, pour clore ce chapitre, quelques exemples de lois de probabilités et leurs fonctions de répartition
associées.

Définition 2.27 (Loi discrète) Soit p une probabilité sur (R, B(R)). On dit que p est discrète si elle
est purement atomique P (l’ensemble de ses atomes A est dénombrable, voir exercice 2.12). La probabilité
p s’écrit alors p = a∈A p({a})δa , où δP a désigne la mesure de Dirac en a. La fonction de répartition de
la probabilité p est définie par: F (t) = a∈A,a≤t p({a})

Exemple 2.4 (Exemples de lois discrètes) Donnons quelques exemples de probabilités discrètes, p,
sur B(R) et de A l’ensemble (dénombrable) de leurs atomes.
1
• La loi uniforme : N ∈ N? , A = {a1 , . . . , aN }, p({ai }) = N

P (1 − P )N −k
k k
• La loi binômiale : N ∈ N? , A = {1, . . . , N }, P ∈]0, 1[, p({k}) = CN
• La loi de Pascal : A = N, P ∈]0, 1[, p({k}) = P (1 − P )k−1
k
• La loi de Poisson à paramètre λ : A = N, λ > 0, p({k}) = e−λ λk!

Définition 2.28 (Loi continue) Soit p une probabilité sur (R, B(R)). On dit que p est continue si sa
fonction de répartition est continue.

Exemple 2.5 (Exemple de loi continue) La plupart des exemples de probabilités continues provient
de ce qu’on appelle “les mesures de densité” par rapport à la mesure de Lebesgue, pour lesquelles on a
besoin de la notion d’intégrale de Lebesgue qu’on n’a pas encore introduite. On peut toutefois déjà citer
l’exemple de la loi uniforme sur un intervalle [a, b] de R: Soient −∞ < a < b < +∞; pour A ∈ B(R), on
pose p(A) = λ(A∩[a,b])
b−a . On vérifie facilement que p est une probabilité appelée probabilité uniforme sur
[a, b].

2.7 Exercices
2.7.1 Tribus
Exercice 2.1 (Caractérisation d’une tribu) Corrigé 9 page 281
Soit E un ensemble.

40
1. Soit T une partie de P(E) stable par union dénombrable, stable par passage au complémentaire et
t.q. ∅ ∈ T . Montrer que T est une tribu, c’est-à-dire qu’elle vérifie aussi E ∈ T et qu’elle est stable
par intersection dénombrable.
2. L’ensemble des parties finies de E est-il une tribu ?

Exercice 2.2 (Tribu engendrée) Corrigé 10 page 281


Soit E un ensemble.
1. Montrer qu’une intersection quelconque de tribus sur E est une tribu sur E.
2. Soit A ⊂ P(E). On note TA l’intersection de toutes les tribus sur E contenant A (une partie
de E appartient donc à TA si et seulement si elle appartient à toutes les tribus contenant A, on
remarquera qu’il y a toujours au moins une tribu contenant A, c’est la tribu P(E)). Montrer que
TA est la plus petite des tribus contenant A (c’est la tribu engendrée par A).
3. Soient A et B ⊂ P(E) et TA , TB les tribus engendrées par A et B. Montrer que si A ⊂ B alors
TA ⊂ TB .

Exercice 2.3 (Exemples de Tribus) Corrigé 11 page 282

1. Tribu trace

(a) Soit T une tribu sur un ensemble E et F ⊂ E. Montrer que TF = {A ∩ F ; A ∈ T } est une
tribu sur F (tribu trace de T sur F ).
(b) Si E est un espace topologique et T = B(E) (B(E) est la tribu borélienne de E), montrer
que la tribu trace sur F , notée TF , est la tribu engendrée par la topologie trace sur F (tribu
borélienne de F , notée B(F )). [Montrer que B(F ) ⊂ TF . Pour montrer que TF ⊂ B(F ),
considérer C = {A ∈ P(E); A ∩ F ∈ B(F )} et montrer que C est une tribu (sur E) contenant
les ouverts de E.] Si F est un borélien de E, montrer que TF est égale à l’ensemble des
boréliens de E contenus dans F .

2. Soit E un ensemble infini et S = {{x}, x ∈ E}. Déterminer la tribu engendrée par S (distinguer les
cas E dénombrable et non dénombrable).
3. Soit E un ensemble et f une application de E dans lui-même. Montrer que l’ensemble des parties
A de E t.q. f −1 (f (A)) = A est une tribu sur E.
4. Soit E un ensemble et A un sous-ensemble de E. Trouver la tribu engendrée par C = {B ⊂ E |
A ⊂ B}. A quelle condition obtient-on P(E) ou la tribu grossière ?
5. Soit E un ensemble et f une bijection de E. Montrer que l’ensemble des parties A de E t.q. (x ∈ A
⇐⇒ f (x) ∈ A et f −1 (x) ∈ A) est une tribu sur E.
6. Dans R2 , soit C l’ensemble des parties de R2 contenues dans une réunion dénombrable de droites.
Décrire la tribu engendrée par C. Est-ce une sous-tribu de B(R2 ) ?

Exercice 2.4 (Tribus images) Corrigé 12 page 283


Soient E et F des ensembles. Pour A ⊂ P(E) (resp. P(F )) on note T (A) la tribu de E (resp. F )
engendrée par A.
Soit f : E → F une application.

41
1. Montrer que si T 0 est une tribu sur F , alors f −1 (T 0 ) = {f −1 (B); B ∈ T 0 } est une tribu sur E
(tribu image réciproque).
2. Montrer que si T est une tribu sur E, alors T 0 = {B ⊂ F ; f −1 (B) ∈ T } est une tribu sur F (tribu
image directe).
3. Montrer que pour tout ensemble C de parties de F on a : T (f −1 (C)) = f −1 (T (C)). [Montrer que
T (f −1 (C)) ⊂ f −1 (T (C)). Puis, pour montrer que f −1 (T (C)) ⊂ T (f −1 (C)), montrer que T = {G ⊂
F ; f −1 (G) ∈ T (f −1 (C))} est une tribu contenant C.]

Exercice 2.5 (Tribu borélienne de R2 ) Corrigé 13 page 284


On note T la tribu (sur R2 ) engendrée par {A × B; A, B ∈ B(R)}. On va montrer ici que T = B(R2 ).

1. Montrer que tout ouvert de R2 est réunion au plus dénombrable de produits d’intervalles ouverts de
R. [S’inspirer d’une démonstration analogue faite pour R au lieu de R2 .] En déduire que B(R2 ) ⊂ T .
2. Soit A un ouvert de R et T1 = {B ∈ B(R); A × B ∈ B(R2 )}. Montrer que T1 est une tribu (sur R)
contenant les ouverts (de R). En déduire que T1 = B(R).
3. Soit B ∈ B(R) et T2 = {A ∈ B(R); A × B ∈ B(R2 )}. Montrer que T2 = B(R).

4. Montrer que T ⊂ B(R2 ) (et donc que T = B(R2 )).

Exercice 2.6 (Tribu borélienne sur RN ) Corrigé 14 page 286

1. Montrer que la tribu borélienne de RN est égale à celle engendrée par l’ensemble de toutes les boules
ouvertes de RN . [On pourra montrer d’abord que tout ouvert de RN est réunion dénombrable de
boules ouvertes de RN .]

2. Montrer que la tribu borélienne de RN est égale à celle engendrée par l’ensemble des produits
d’intervalles ouverts à extrémités rationnelles.
3. Montrer que la tribu borélienne de R est engendrée par les intervalles ]a, b] où a, b ∈ R, a < b.
4. Soit S un sous ensemble dense de R. Montrer que B(RN ) est engendrée par la classe des boules
ouvertes (ou bien fermées) telles que les coordonnées du centre et le rayon appartiennent S.

Exercice 2.7 (Une tribu infinie est non dénombrable) (??)


Montrer que toute tribu infinie T sur un ensemble (infini) E est non dénombrable. [Si T est dénombrable,
on pourra introduire, pour tout élément x ∈ E, l’ensemble A(x) intersection de tous les éléments de T
contenant x. Puis, montrer à l’aide de ces ensembles qu’il existe une injection de P(N) dans T .]

Exercice 2.8 (Algèbre) Corrigé 15 page 287


Soit E un ensemble et A ⊂ P(E).
1. Montrer que A est une algèbre (cf. définition 2.4) si et seulement si A vérifie les deux propriétés
suivantes :

(a) E ∈ A,
(b) A, B ∈ A ⇒ A \ B ∈ A.

42
2. Soit (Ai )i∈I une famille d’algèbres (sur E). Montrer que ∩i∈I Ai = {A ∈ P(E); A ∈ Ai pour tout
i ∈ I} est encore une algèbre.
Si C ⊂ P(E), la deuxième question permet donc de définir l’algèbre engendrée par C comme l’intersection
de toutes les algèbres sur E contenant C.

Exercice 2.9 (Suite croissante de tribus)


Soit E un ensemble. Soit (An )n∈N une suite croissante de tribus de E. Montrer que A = ∪n∈N An est
une algèbre (cf. définition 2.4), mais n’est pas, en général, une tribu. Donner une suite d’algèbres finies
de parties de [0, 1] dont la réunion engendre B([0, 1]).

Exercice 2.10 (Tribu engendrée par une partition)


Soit E un ensemble.

1. Soit (Ai )i∈I une partition dénombrable de E. Décrire la tribu engendrée par cette partition, c’est à
dire par le sous ensemble de P(E) dont les éléments sont les Ai . Cette tribu est-elle dénombrable?
2. Montrer que toute tribu finie de parties de E est la tribu engendrée par une partition finie de E.
Quel est le cardinal d’une telle tribu?
3. (?) Montrer que si E est dénombrable, toute tribu sur E est engendrée par une partition.

Exercice 2.11 Corrigé 16 page 288


Soit E un ensemble et C un ensemble de parties de E. On suppose que ∅, E ∈ C, que C est stable par
intersection finie et que le complémentaire de tout élément de C est une union finie disjointe d’éléments
de C, c’est-à-dire :

C ∈ C ⇒ il existe n ∈ N? et C1 , . . . , Cn ∈ C t.q. C c = ∪np=1 Cp et Cp ∩ Cq = ∅ si p 6= q.

On note B l’ensemble des réunions finies disjointes d’éléments de C. Une partie de E est donc un élément
de B si et seulement si il existe n ∈ N? et (Ap )p=1,...,n ⊂ C t.q. Ap ∩ Aq = ∅ si p 6= q et A = ∪np=1 Ap .

1. Montrer que B est stable par intersection finie et par passage au complémentaire.
2. Montrer que l’algèbre (cf. définition 2.4) engendrée par C est égale à B.

Exercice 2.12 (Classes monotones) Corrigé 17 page 289


Soit E un ensemble. Pour Σ ⊂ P(E), on dit que Σ est une classe monotone (sur E) si Σ vérifie les
deux propriétés suivantes (de stabilité par union croissante dénombrable et par intersection décroissante
dénombrable) :
• (An )n∈N ⊂ Σ, An ⊂ An+1 pour tout n ∈ N ⇒ ∪n∈N An ∈ Σ,
• (An )n∈N ⊂ Σ, An ⊃ An+1 pour tout n ∈ N ⇒ ∩n∈N An ∈ Σ.

1. Soit Σ ⊂ P(E). Montrer que Σ est une tribu si et seulement si Σ est une classe monotone et une
algèbre (cf. exercice 2.8).
2. Donner un exemple, avec E = R, de classe monotone qui ne soit pas une tribu.
3. Soit (Σi )i∈I une famille de classes monotones (sur E). Montrer que ∩i∈I Σi = {A ∈ P(E); A ∈ Σi
pour tout i ∈ I} est encore une classe monotone.
Si C ⊂ P(E), cette question permet donc de définir la classe monotone engendrée par C comme
l’intersection de toutes les classes monotones sur E contenant C.

43
4. (Lemme des classes monotones) Soit A une algèbre sur E. On note Σ la classe monotone engendrée
par A et on note T la tribu engendrée par A.
(a) Montrer que Σ ⊂ T .
(b) Soit A ⊂ E. On pose ΣA = {B ⊂ E; A \ B ∈ Σ et B \ A ∈ Σ}. Montrer que ΣA est une classe
monotone.
(c) (Question plus difficile.) Montrer que Σ est une algèbre. [Utiliser la question (b) et la première
question de l’exercice 2.8.] En déduire que T = Σ.

Exercice 2.13 (Caractérisation de la tribu engendrée) Corrigé 18 page 291


Soit E un ensemble et A ⊂ P(E). On dit que A est stable par intersection finie si A, B ∈ A ⇒ A∩B ∈ A.
On dit que A est stable par différence si :

A, B ∈ A, B ⊂ A ⇒ A \ B = A ∩ B c ∈ A.

On dit que A est stable par union dénombrable disjointe si :

(An )n∈N ⊂ A, An ∩ Am = ∅ pour n 6= m ⇒ ∪n∈N An ∈ A.

Soit C ⊂ P(E).

1. On note Z l’ensemble des parties de P(E) stables par différence et stables par union dénombrable
disjointe. Montrer qu’il existe D ∈ Z t.q. C ⊂ D et :

A ∈ Z, C ⊂ A ⇒ D ⊂ A.

Dans la suite, on note toujours D cette partie de P(E). On suppose maintenant que C est stable
par intersection finie et que E ∈ C.
2. Pour A ∈ P(E), on note DA = {D ∈ D t.q. A ∩ D ∈ D}.
(a) Soit A ∈ P(E). Montrer que DA est stable par union dénombrable disjointe et stable par
différence.
(b) Soit A ∈ C. Montrer que C ⊂ DA . En déduire que DA = D.
(c) Soit A ∈ D. Montrer que DA = D. En déduire que D est stable par intersection finie.
3. Montrer que D est une tribu. En déduire que D est la tribu engendrée par C.

2.7.2 Mesures
Exercice 2.14 (Exemple de mesures) Corrigé 19 page 293
Soit E un ensemble infini non dénombrable. Pour toute partie A de E, on pose m(A) = 0 si A est au
plus dénombrable, et m(A) = +∞ sinon. L’application m est-elle une mesure sur P(E) ?

Exercice 2.15 (Mesure trace et restriction d’une mesure) Corrigé 20 page 293
Soit (E, T, m) un espace mesuré

1. Soit F ∈ T . Montrer que la tribu trace de T sur F , notée TF , est incluse dans T (cette tribu est
une tribu sur F ). Montrer que la restriction de m à TF est une mesure sur TF . On l’appellera la
trace de m sur F . Si m(F ) < ∞, cette mesure est finie.

44
2. Soit A une tribu incluse dans T . La restriction de m à A est une mesure. Est-elle finie (resp.
σ-finie) si m est finie (resp. σ-finie) ?

Exercice 2.16 Corrigé 21 page 294


Soit (E, T, m) un espace mesuré fini (“fini” signifie que m(E) < ∞) et (An )n∈N , (Bn )n∈N des suites
d’ensembles mesurables tels que Bn ⊂ An pour tout n ∈ N.

1. Montrer que (∪n∈N An ) \ ∪n∈N Bn ⊂ ∪n∈N (An \ Bn ).


P
2. Montrer que m(∪n∈N An ) − m(∪n∈N Bn ) ≤ n∈N (m(An ) − m(Bn )).

Exercice 2.17 Corrigé 22 page 294


Soit (E, T, m) un espace mesuré fini et (An )n∈N ⊂ T t.q., pour tout n ∈ N, m(An ) = m(E). Montrer que
m(∩n∈N An ) = m(E).

Exercice 2.18 (Contre exemples. . . ) Corrigé 23 page 295

1. Soit λ la mesure de Lebesgue sur B(R) et A ∈ B(R) t.q. λ(A) = 0. A-t-on nécessairement A fermé ?
2. Soit (E, T ) un espace mesurable et C ⊂ P(E) qui engendre T . On considère m1 et m2 des mesures
sur T . Montrer que m1 (A) = m2 (A) pour tout A ∈ C n’implique pas que m1 = m2 sur T . [On
pourra trouver un exemple (facile) avec (E, T ) = (R, B(R)) et m1 , m2 non finies. Un exemple avec
(E, T ) = (R, B(R)) et m1 , m2 finies est aussi possible mais plus difficile à trouver. . . ]

Exercice 2.19 (Résultat d’unicité) Corrigé 24 page 296


Soit (E, T ) un espace mesurable et m, µ deux mesures sur T . Soit C ⊂ P(E). On suppose que C engendre
T et que C est stable par intersection finie.
On suppose que m(A) = µ(A) pour tout A ∈ C.

1. On suppose que E ∈ C et que m(E) < ∞. Montrer que m(A) = µ(A) pour tout A ∈ T . [On pourra
introduire D = {A ∈ T, m(A) = µ(A)} et utiliser l’exercice 2.13.]
2. (Généralisation de la question précédente). On suppose qu’il existe une suite (En )n∈N ⊂ C t.q.
En ∩ Em = ∅ si n 6= m, m(En ) < ∞ pour tout n ∈ N et E = ∪n∈N En . Montrer que m(A) = µ(A)
pour tout A ∈ T .
3. Avec (E, T ) = (R, B(R), donner un exemple pour lequel E ∈ C et m 6= µ.

Exercice 2.20 (Mesure atomique, mesure diffuse) Corrigé 25 page 297


Soit (E, T ) un espace mesurable t.q. {x} ∈ T pour tout x ∈ E. Une mesure m sur T est diffuse si
m({x}) = 0 pour tout x ∈ E. Une mesure m sur T est purement atomique si il existe S ∈ T t.q.
m(S c ) = 0 et m({x}) > 0 si x ∈ S.

1. Montrer qu’une mesure purement atomique et diffuse est nulle. Donner, pour (E, T ) = (R, B(R))
un exemple de mesure purement atomique et un exemple de mesure diffuse. [Montrer que la mesure
de Lebesgue sur B(R) est diffuse.]

2. Soit m une mesure diffuse sur T . Montrer que tous les ensembles dénombrables sont de mesure
nulle.

45
3. Soit m une mesure sur T . On suppose que m est σ-finie, c’est à dire qu’il existe (En )n∈N ⊂ T t.q.
E = ∪n∈N En et m(En ) < +∞ pour tout n ∈ N.

(a) Montrer que l’ensemble des x ∈ E t.q. m({x}) > 0 (de tels x sont appelés “atomes” de m) est
au plus dénombrable. [On pourra introduire l’ensemble An,k = {x ∈ En ; m({x}) ≥ k1 }.]
(b) Montrer qu’il existe une mesure diffuse md et une mesure purement atomique ma sur T telles
que m = md + ma . Montrer que md et ma sont étrangères, c’est à dire qu’il existe A ∈ T t.q.
md (A) = 0 et ma (Ac ) = 0.
(c) Montrer que si m est finie il existe un singleton dont la mesure est supérieure ou égale à la
mesure de tous les autres singletons. Montrer que ceci peut-être inexact si m n’est que σ-finie.

4. Pour (E, T ) = (R, B(R)), donner un exemple de mesure purement atomique finie dont l’ensemble
des atomes est infini.

Exercice 2.21 (limites sup et inf d’ensembles) Corrigé 26 page 299


Soit (E, T, m) un espace mesuré et (An )n∈N ⊂ T . On rappelle que lim supn→∞ An = ∩n∈N ∪p≥n Ap et
lim inf n→∞ An = ∪n∈N ∩p≥n Ap .

1. On suppose qu’il existe n0 ∈ N t.q. m(∪p≥n0 Ap ) < ∞. Montrer que m(lim inf n→∞ An ) ≤
lim inf n→∞ m(An ) ≤ lim supn→∞ m(An ) ≤ m(lim supn→∞ An ).
2. Donner un exemple (c’est-à-dire choisir (E, T, m) et (An )n∈N ⊂ T ) pour lequel :

lim sup m(An ) > m(lim sup An ).


n→∞ n→∞

3. Donner un exemple avec m finie (c’est-à-dire m(E) < ∞) pour lequel


m(lim inf n→∞ An ) < lim inf n→∞ m(An ) < lim supn→∞ m(An ) < m(lim supn→∞ An ).
P
4. (?) (Lemme de Borel-Cantelli) On suppose que n∈N m(An ) < ∞.
Montrer que m(lim supn→∞ An ) = 0.

Exercice 2.22 (Petit ouvert dense. . . ) Corrigé 27 page 300


On considère ici l’espace mesuré (R, B(R), λ). Soit ε > 0, peut-on construire un ouvert dense dans R de
mesure inférieure à ε ? [On rappelle qu’une partie A de R est dense dans R si A = R ou encore si, pour
tout x ∈ R et pour tout ε > 0, il existe a ∈ A t.q. |x − a| < ε.]

Exercice 2.23 (Non existence d’une mesure sur P(R) exprimant la longueur) Corrigé 28 page
300
On définit la relation d’équivalence sur [0, 1[ : xRy si x−y ∈ Q. En utilisant l’axiome du choix, on construit
un ensemble A ⊂ [0, 1[ tel que A contienne un élément et un seul de chaque classe d’équivalence. Pour
q ∈ Q ∩ [0, 1[, on définit Aq = {y ∈ [0, 1[; y = x + q ou y = x + q − 1, x ∈ A}, c’est-à-dire Aq = {y ∈ [0, 1[;
y − q ∈ A ou y − q + 1 ∈ A}.
S
1. Montrer que q∈Q∩[0,1[ Aq = [0, 1[.

2. Montrer que si m est une application de P(R) dans R+ , invariante par translation et vérifiant
m([0, 1[) = 1, m ne peut pas être σ- additive. En déduire la non-existence d’une mesure m, sur
P(R), invariante par translation et t.q. m([a, b]) = b − a pour tout a, b ∈ R, a < b. En particulier,
montrer que l’application λ? , définie en cours, ne peut pas être une mesure sur P(R).

46
Exercice 2.24 (Non existence d’une mesure sur P(R) donnant la longueur des intervalles)
Cet exercice est plus général que le précédent car on veut montrer qu’il n’existe pas de mesure sur P(R)
t.q. m([a, b]) = b − a pour tout a, b ∈ R, a < b, sans l’hypothèse d’invariance par translation de l’exercice
précédent.
Soit E un ensemble non dénombrable, sur lequel on suppose qu’il existe un ordre total, noté ≤, tel que
pour tout x ∈ E, l’ensemble {y ∈ E; y ≤ x} est dénombrable, c’est-à-dire qu’il existe une application fx
injective de cet ensemble dans N. Si E = R ou E = [0, 1], on peut démontrer l’existence d’un tel ordre
(ceci est une conséquence de l’axiome du continu). Soit m une mesure sur P(E); on suppose que m est
finie, i.e. m(E) < +∞, et diffuse. On se propose de montrer que m est nulle, i.e. m(A) = 0, pour tout
A ∈ P(E). On pose, pour x ∈ E et n ∈ N, Ax,n = {y ∈ E; y ≥ x et fy (x) = n}.
1. Montrer que pour tout x, y ∈ E et n ∈ N, Ax,n ∩ Ay,n = ∅. En déduire que, pour tout n ∈ N,
{x ∈ E; m(Ax,n ) 6= 0} est au plus dénombrable (utiliser le fait que m est finie).
2. Montrer qu’il existe x ∈ E t.q., pour tout n ∈ N, m(Ax,n ) = 0.
3. En déduire que m est nulle (montrer pour cela que m(E) = 0 en utilisant la question précédente et
le fait que m est diffuse).
4. Montrer qu’il n’existe pas de mesure m sur P(R) t.q. m(]a, b[) = b − a pour tout a, b ∈ R, a < b.

Exercice 2.25 Corrigé 29 page 301


Soit m une mesure sur B(R) t.q. pour tout intervalle I et tout x ∈ R on ait m(I) = m(I + x) (avec
I + x = {a + x, a ∈ I}) et m([0, 1]) = 1. Montrer que pour tout x ∈ R, m({x}) = 0 (i.e. m est diffuse).
En déduire que m est la mesure de Lebesgue sur B(R). [On pourra découper [0, 1[ en q intervalles de
longueur 1/q.]

Exercice 2.26 (Support d’une mesure sur les boréliens de Rd ) Corrigé 30 page 302
Soit m une mesure sur B(Rd ). Montrer qu’il existe un plus grand ouvert de mesure nulle pour m.
L’ensemble fermé complémentaire de cet ouvert s’appelle le support de m. [On pourra, par exemple,
considérer les pavés à extrémités rationnelles qui sont de mesure nulle pour m.]

Exercice 2.27 (Ensemble de Cantor) Corrigé 31 page 303


On considère l’espace mesuré ([0, 1], B([0, 1]), λ).
On pose C0 = [0, 1], a01 = 0, b01 = 1, et α0 = 1. Pour n ≥ 0, on construit Cn+1 ⊂ [0, 1] de la
S2n S2n+1
manière suivante : on suppose Cn = p=1 [anp , bnp ] connu, et on définit Cn+1 = p=1 [an+1
p , bn+1
p ] où, pour
p = 1, . . . , 2 , a2p−1 = ap , b2p−1 = ap + αn+1 , a2p = bp − αn+1 et b2p = bp , avec αn+1 = ρn2αn , et
n n+1 n n+1 n n+1 n n+1 n

0 < ρn < 1. On pose C = ∩n≥0 Cn (C s’appelle “ensemble de Cantor”, l’exemple le plus classique est
obtenu avec ρn = 23 pour tout n ∈ N).

1. Montrer que Cn+1 ⊂ Cn .



2. Montrer que C est compact et C = ∅.
3. (Question plus difficile.) Montrer que C est non dénombrable.
4. Montrer que si ρn ne dépend pas de n, alors λ(C) = 0. En déduire que si A ∈ B([0, 1]), λ(A) = 0
n’entraı̂ne pas que A est dénombrable.
5. Soit 0 <  < 1. Montrer qu’il existe une suite (ρn )n≥0 ⊂]0, 1[ t.q. λ(C) = .

47
6. Soit f lipschitzienne de R dans R. Montrer que si A est un compact de [0, 1] t.q. λ(A) = 0, alors
f (A) est un compact de R t.q. λ(f (A)) = 0.
7. Construire une fonction continue de R dans R t.q. si A est un compact de [0, 1] t.q. λ(A) = 0, on
n’a pas forcément λ(f (A)) = 0 (mais f (A) est un compact de R). [Utiliser un ensemble de Cantor
de mesure nulle (cf question 4) et un ensemble de Cantor de mesure  > 0 (cf question 5).]

Exercice 2.28 (Mesure complète) Corrigé 32 page 306


Soit (E, T, m) un espace mesuré. Une partie B de E est dite “négligeable” si elle est incluse dans un
élément de T de mesure nulle. On note Nm l’ensemble des parties négligeables. On pose T = {A ∪ N ;
A ∈ T, N ∈ Nm }.

1. Montrer que T est une tribu et que T ∪ Nm ⊂ T .

2. Soit A1 , A2 ∈ T et N1 , N2 ∈ Nm t.q. A1 ∪ N1 = A2 ∪ N2 . Montrer que m(A1 ) = m(A2 ).


Pour B ∈ T , soit A ∈ T et N ∈ Nm t.q. B = A ∪ N , on pose m(B) = m(A). (La question
précédente montre que cette définition est cohérente.)
3. Montrer que m est une mesure sur T et m|T = m. Montrer que m est la seule mesure sur T égale
à m sur T .

4. Montrer que Nm = Nm ⊂ T .

L’exercice 4.18 page 103 montre la différence “dérisoire”, du point de vue de l’intégration, entre (E, T, m)
et son complété (E, T , m).

Exercice 2.29 (Série commutativement convergente dans R) Corrigé 33 page 308


P
Soit (an )n∈N ⊂ R. Le but de l’exercice est P de montrer que si la série n∈N aϕ(n) est convergente pour
toute bijection ϕ : N → N, alors la série n∈N an est absolument convergente.
ce résultat, on suppose, par exemple, que n∈N a+
P
Pour montrer P n = ∞. Montrer qu’il existe ϕ : N → N,
n
bijective, t.q. p=0 aϕ(p) → ∞ quand n → ∞. Conclure.

Exercice 2.30 (Régularité d’une mesure sur B(R), finie sur les bornés)
Cet exercice redémontre le théorème de régularité (théorème 2.3).

I. Soit m une mesure finie sur B(R), tribu borélienne sur R. On pose: T = {A ∈ B(R) tel que
∀ ε > 0, ∃ O ouvert de R, et F fermé de R, tels que F ⊂ A ⊂ O et m(O \ F ) ≤ ε}.

1. Soient a et b ∈ R, a < b. Montrer que ]a, b[ ∈ T .


2. Montrer que T est une tribu. En déduire que m est régulière.
3. En déduire que, ∀A ∈ B(R), m(A) = inf{m(O), O ⊃ A, O ouvert de R}.

II. Soit m une mesure sur B(R), tribu borélienne sur R. On suppose que pour toute partie B bornée
de R t.q. B ∈ B(R), on a: m(B) < +∞.
Pour B ∈ B(R), on pose: νB (A) = m(A ∩ B), ∀A ∈ B(R).

1. Soit B ∈ B(R) une partie bornée de R; montrer que νB est une mesure finie.

48
2. Soient ε > 0 et A ∈ B(R), montrer que, pour tout n ∈ Z, il existe un ouvert On de R tel que
ε
On ⊃ A∩]n, n + 1] et m(On ) ≤ m(A∩]n, n + 1]) + |n| . [Appliquer I.3 avec νBn , Bn ouvert
2
borné contenant ]n, n + 1], et A∩]n, n + 1].]
3. a) Soient ε > 0 et A ∈ B(R). Montrer que pour tout n ∈ Z, il existe On ouvert de R et Fn
ε
fermé de R t.q. Fn ⊂ A∩]n, n + 1] ⊂ On et m(On \ Fn ) ≤ 2|n| .
b) Montrer que m est régulière. [On
S pourra remarquer, en le démontrant, que si Fn est fermé
et Fn ⊂]n, n + 1]∀n ∈ Z, alors n∈Z Fn est fermé.]
c) Montrer que m(A) = inf{m(O), A ⊂ O, O ouvert de R}, ∀A ∈ B(R).

III. On note λ la mesure de Lebesgue sur (R, R). Soit α ∈ R? et β ∈ R. Soit A ∈ R. On pose
αA + β = {αx + β, x ∈ A}. Montrer que αA + β ∈ R et que λ(αA + β) = |α|λ(A). [On
pourra commencer par étudier le cas où A est un ouvert de R.] (Nous appellerons cette propriété :
“invariance par translation généralisée pour la mesure de Lebesgue”.)

Exercice 2.31 (Mesure sur S 1 ) Corrigé 34 page 309


On considère S 1 = {(x, y)t ∈ R2 , |x|2 +|y|2 = 1} (S 1 est donc le cercle unité de R2 ). Pour z = (x, y)t ∈ S 1 ,
il existe un unique θz ∈ [0, 2π[ t.q. x = cos(θz ) et y = sin(θz ). Pour α ∈ [0, 2π[ et z ∈ S 1 on pose
Rα (z) = (cos(θz + α), sin(θz + α))t . Noter que Rα est une bijection de S 1 sur S 1 (c’est la rotation d’angle
α).
Définir une tribu T sur S 1 , t.q. T contienne les parties de la forme {(cos(θ), sin(θ))t , θ ∈]α, β[} avec
−∞ < α < β < ∞, et une mesure µ sur T de sorte que (S 1 , T, µ) soit un espace mesuré avec µ(S 1 ) = 1 et
t.q. µ soit invariante par rotation (c’est à dire que, pour tout A ∈ T et α ∈ [0, 2π[, on ait Rα (A) = {Rα (z),
z ∈ A} ∈ T et µ(Rα (A)) = µ(A)). [On pourra utiliser la tribu borélienne de R, notée B(R), et la mesure
de Lebesgue sur B(R).]

2.7.3 Probabilités
Exercice 2.32 (Exemple de probabilité)
P E = {xk , k ∈ N} un ensemble infini dénombrable et (pk )k∈N ⊂ [0, 1] t.q. pk ≥ 0 ∀k ∈ N et
N
Soit
k∈N pk = 1.
P
1. Montrer que, pour tout A ∈ P(E), A 6= ∅, on peut définir p(A) = k;xk ∈A pk . On pose p(∅) = 0.
2. Montrer que p définie en 1. est une probabilité

Exercice 2.33 (Lemme de Borel-Cantelli) Corrigé 35 page 310


Soient (E, T, p) un espace probabilisé et (An )n∈N ⊂ T . On pose Bn = ∪k≥n Ak et A = ∩n∈N Bn (on
rappelle que A = lim supn→∞ An ).
P
1. Montrer que si n∈N p(An ) < +∞ alors p(A) = 0.
2. On suppose
P que, pour tout n ∈ N? , les événements A1 , . . . , An sont indépendants. On suppose aussi
que n∈N p(An ) = ∞. Montrer que p(A) = 1.

Exercice 2.34 Soient E une “population”, c’est-à-dire un ensemble fini,et (Cn )n∈N une famille de ”sous-
populations”, c’est-à-dire un système de constituants de l’espace probabilisable (E, P(E)). Soit Pn la
probabilité qu’un individu de la population appartienne à la sous-population Cn , c’est-à-dire p(Cn ), où p
est une probabilité sur (E, P(E)). Sachant que dans chaque sous-population la probabilité d’être gaucher
est Qn , trouver la probabilité qu’un gaucher appartienne à Cn .

49
Exercice 2.35 Soient S1 (resp. S2 ) un seau contenant n1 cailloux noirs et b1 cailloux blancs (resp. n2
cailloux noirs et b2 cailloux blancs). On tire au hasard, de manière équiprobable, un des deux seaux,
et on tire ensuite au hasard, de manière équiprobable, un caillou dans ce seau. Sachant qu’on a tiré un
caillou noir, quelle est la probabilité de l’avoir tiré du seau S1 ?

Exercice 2.36 Soient p une probabilité sur (R, B(R)) et F la fonction de répartition de p. Montrer que
F est continue ssi p({a}) = 0. En déduire que F est continue si F ne charge pas les points.

50
Chapter 3

Fonctions mesurables, variables


aléatoires

3.1 Introduction, topologie sur R+


Nous allons, dans ce chapitre, introduire différents outils nécessaires à la définition de l’intégrale de
Lebesgue. De la même manière que les fonctions en escalier ont été introduites lors de la définition
de l’intégrale des fonctions réglées, nous introduisons maintenant le concept de fonction étagée sur un
espace mesurable (E, T ). Nous introduirons ensuite les concepts de fonction mesurable et de variable
aléatoire, ainsi que les premières notions de convergence de ces fonctions. La notion de variable aléatoire
est fondamentale en calcul des probabilités: c’est en général par la connaissance de la variable aléatoire
(et par sa “loi de probabilité”) que se construit le modèle probabiliste, l’espace probabilisé (E, T, p) restant
souvent mal connu.

Remarque 3.1
1. L’objectif est d’intégrer des fonctions de E (espace de départ) dans F (espace d’arrivée). Pour
construire ainsi une notion d’intégrale, il faut un espace mesuré au départ et un espace topologique
à l’arrivée, car nous aurons besoin dans l’espace d’arrivée d’une notion de convergence (pour les
procédés de passage à la limite dans la définition de l’intégrale). Les espaces d’arrivée usuels sont
(pour la théorie de l’intégration) R, C, RN ou un espace de Banach. Le procédé de construction dû à
Lebesgue donne un rôle fondamental aux fonctions à valeurs dans R+ (et à la notion de convergence
“croissante”) et nous aurons besoin d’utiliser la topologie de R+ (voir la définition 3.1).

2. On rappelle qu’un espace topologique est la donnée d’un ensemble F muni d’une famille de parties
de F , appelées “ouverts de F ”, contenant ∅ et F , stable par union (quelconque) et stable par
intersection finie. On rappelle aussi que, dans un espace topologique, xn → x, quand n → ∞,
signifie que, pour tout O ouvert contenant x, il existe n0 t.q. xn ∈ O pour tout n ≥ n0 .
3. Soit F un espace topologique et G ⊂ F . On appelle topologie trace sur G, ou topologie induite sur
G, la topologie définie par l’ensemble des restrictions à G des ouverts de F . Si O ⊂ G, O est un
ouvert de G si et seulement si il existe U ouvert de F t.q. O = U ∩ G. Noter donc que O peut ne
pas être un ouvert de F si G n’est pas un ouvert de F . Par contre, il est important de remarquer
que si G est un borélien de F (c’est-à-dire G ∈ B(F ), B(F ) étant la tribu engendrée par les ouverts

51
de F ), l’ensemble des boréliens de G est exactement l’ensemble des boréliens de F inclus dans G,
c’est-à-dire B(G) = {B ⊂ G; B ∈ B(F )}, ceci est démontré dans l’exercice 2.3 page 41.
4. Un exemple fondamental de topologie sur l’ensemble F est celui de la topologie donnée par une
distance sur F . Dans le cas de F = R, nous considérerons toujours R muni de la topologie donnée
par la structure métrique de R, c’est-à-dire par l’application “distance” définie par d(a, b) = |b − a|.
Définition 3.1 (Topologie et tribu de Borel sur R+ ) R+ = R+ ∪ {∞}
1. Soit O ⊂ R+ . O est un ouvert si pour tout a ∈ O on a :

(a) Si 0 < a < ∞, alors il existe ε ∈ R?+ t.q. ]a − ε, a + ε[⊂ O,


(b) si a = 0, alors il existe α ∈ R?+ t.q. [0, α[⊂ O,
(c) si a = ∞, alors il existe α ∈ R+ t.q. ]α, ∞] ⊂ O.

2. B(R+ ) est la tribu (sur R+ ) engendrée par les ouverts de R+ . Soit B ⊂ R+ , on peut montrer (voir
la remarque 3.2 ci après) que B ∈ B(R+ ) si et seulement si B ∩ R ∈ B(R) (B(R) est la tribu de
Borel sur R).
Remarque 3.2
1. La topologie sur R+ est la topologie induite par celle de R+ , c’est aussi la topologie induite par celle
de R. L’ensemble des boréliens de R+ est donc égal à l’ensemble des boréliens de R+ inclus dans
R+ et c’est aussi l’ensemble des boréliens de R inclus dans R+ (voir la remarque 3.1). On remarque
aussi que {∞} ∈ B(R+ ) (car {∞} est, par exemple, une intersection dénombrable d’ouverts de
R+ ). On en déduit que, si B ⊂ R+ , on a B ∈ B(R+ ) si et seulement si B ∩ R ∈ B(R) (noter que
B ∩ R = B ∩ R+ ).
2. Soit A ⊂ R+ , A est donc un borélien de R+ si et seulement si A ∈ B(R) ou si A = B ∪ {∞}, avec
B ∈ B(R).
3. La définition de la topologie sur R+ donne bien que, pour (xn )n∈N ⊂ R+ , on a xn → ∞ (dans R+ ,
quand n → ∞) si et seulement si, pour tout α > 0, il existe n0 t.q. xn ∈]α, ∞] pour tout n ≥ n0
(ce qui est la définition usuelle de convergence vers ∞).
4. On peut aussi montrer (exercice. . . ) que B(R+ ) est la tribu engendrée par C1 = {]a, ∞]; a ∈ R+ }.
C’est aussi la tribu engendrée par C2 = {]a, ∞[∩R+ ; a ∈ R}. Par contre, ce n’est pas la tribu
engendrée (sur R+ ) par C3 = {]a, ∞[; a ∈ R+ } (on a donc T (C3 ) ⊂ B(R+ ) et T (C3 ) 6= B(R+ )).

3.2 Fonctions étagées


Définition 3.2 (Fonction caractéristique) Soient (E, T ) un espace mesurable et soit A ∈ T . On
appelle fonction caractéristique mesurable de l’ensemble A, et on note 1A (ou χA ) la fonction définie
par : 1A (x) = 1 si x ∈ A et 1A (x) = 0 si x ∈ Ac .
Définition 3.3 (Fonction étagée) Soient (E, T ) un espace mesurable et f ; E → R.
1. On dit que f est étagée (ou T -étagée) si f est une combinaison linéaire (finie) de fonctions carac-
téristiques mesurables, c’est-à-dire s’il existe une famille finie (Ai )i=1,...,n ⊂ T et n réels a1 , ..., an
Xn
tels que f = ai 1Ai .
i=1

52
2. On dit que f est étagée positive si f est étagée et prend ses valeurs dans R+ .
On note E l’ensemble des fonctions étagées et E+ l’ensemble des fonctions étagées positives.

La notion de fonction étagée positive va nous permettre de définir l’intégrale à partir de la notion de
mesure. On se limite pour l’instant aux fonctions positives afin de donner un sens à l’addition de mesures
infinies. Notons que, dans la définition d’une fonction étagée, les ensembles Ai peuvent être d’intersection
non vide. On aura besoin, pour introduire facilement la notion d’intégrale d’une fonction étagée positive,
de considérer une décomposition de la fonction étagée sur des ensembles d’intersection vide. C’est l’objet
du lemme suivant:

Lemme 3.1 (Décomposition canonique d’une fonction étagée positive)


Soit (E, T ) un espace mesurable, et soit f ∈ E+ une fonction étagée positive, non identiquement nulle.
?
Alors il existe une unique famille finie Pn(ai , Ai )i=1,...,n ⊂ R+ × T t.q. 0 < a1 < . . . < an , Ai 6= ∅, pour
tout i, Ai ∩ Aj = ∅, si i 6= j, et f = i=1 ai 1Ai .
Pp
Démonstration : Soient (Bi )i=1,...,p ⊂ T , (bi )i=1,...,p ⊂ R et f = i=1 bi 1Bi une fonction étagée
positive non nulle. L’ensemble Imf des valeurs prises par f est donc fini. Comme Imf ⊂ R+ , on a
doncP Imf \ {0} = {a1 , . . . , an } avec 0 < a1 , . . . < an . En posant Ai = {x ∈ E; f (x) = ai }, on a donc
n
f = i=1 ai 1Ai avec Ai 6= ∅ et Ai ∩ Aj = ∅. (Noter aussi que {x ∈ E; f (x) = 0}P = (∪ni=1 Ai )c .) Il reste
à montrer que Ai ∈ T . Pour i ∈ {1, . . . , n}, on pose Ii = {K ⊂ {1, . . . , p} ; ai = k∈K bk }. On a alors,
pour tout i ∈ {1, . . . , n}, Ai = ∪K∈Ii CK , avec CK = ∩pj=1 Dj , Dj = Bj si j ∈ K et Dj = Bjc si j 6∈ K.
Les propriétés de stabilité d’une tribu nous donnent alors que Ai ∈ T pour tout i ∈ {1, . . . , n}. On a
donc trouvé la décomposition voulue de f . Le fait que cette décomposition est unique est immédiat car
on a nécessairement {a1 , . . . , an } = Imf \ {0} et Ai = {x ∈ E; f (x) = ai }.

On aurait envie à partir de la notion


R de fonction
Pn étagée positive décomposée sous la forme précédente,
de définir l’intégrale de f comme f dm = i=1 ai m(Ai ).
En fait, on pourra même (cf définition 4.1) définir l’intégrale d’une fonction étagée avec une décomposition
plus générale (non unique) grâce au lemme suivant :

Lemme 3.2 Soit (E, T, m) un espace mesuré et soit f ∈ E+ une fonction étagée positive non nulle, t.q.
n
X p
X
f= ai 1Ai et f = bi 1Bi où a1 , ..., an , b1 , ..., bp sont des réels strictement positifs, (Ai )i=1,...,n ⊂ T
i=1 i=1
et (Bi )i=1,...,p ⊂ T sont des familles de parties disjointes deux à deux, i.e. telles que Ai ∩ Aj = ∅ et
Bi ∩ Bj = ∅ si i 6= j. Alors :
Xn Xp
ai m(Ai ) = bj m(Bj ). (3.1)
i=1 j=1

Démonstration : On pose, pour i = 1, . . . , n et j = 1, . . . , p, Cij = Ai ∩ Bj . En remarquant que


{x; f (x) > 0} = ∪ni=1 Ai = ∪pj=1 Bj , on écrit Ai = ∪pj=1 Cij et Bj = ∪ni=1 Cij . On peut donc écrire
n
X p
n X
X
ai m(Ai ) = ai m(Cij ) (3.2)
i=1 i=1 j=1

et
p
X p X
X n
bj m(Bj ) = bj m(Cij ) (3.3)
j=1 j=1 i=1

53
On remarque alors que ai = bj dès que Cij 6= ∅, d’où l’égalité 3.1.

Lemme 3.3 (Décomposition d’une fonction étagée avec une partition)


Soit (E, T ) un espace mesurable, et soit f ∈ E une fonction étagée. Alors il existe une unique famille
n
i , Ai )i=0,...,n ⊂ R × T t.q. ai 6= aj si i 6= j, Ai 6= ∅, pour tout i, Ai ∩ Aj = ∅, si i 6= j, E = ∪i=0 Ai
finie (aP
n
et f = i=0 ai 1Ai .

Démonstration :
La démonstration est très voisine de celle donnée pour la décomposition d’une fonction étagée positive
(lemme 3.1). L’ensemble {ai , i ∈ {0, . . . , n}} est l’ensemble de toutes les valeurs prises par f (et pas
seulement les valeurs non nulles) et Ai = {x ∈ E; f (x) = ai }.

Enfin, on conclut ce paragraphe en remarquant que E est un espace vectoriel sur R.

Proposition 3.1 (Structure vectorielle de E) Soit (E, T ) un espace mesurable, l’ensemble des fonc-
tions étagées, E, est un espace vectoriel sur R. De plus, si f, g ∈ E, on a aussi f g ∈ E.

Démonstration :
Pgn ∈ E et soit α, β P
Soit f, ∈ R. On utilise la décomposition de f et g donnée dans le lemme 3.3. Elle donne
m
f = i=0 ai 1Ai et g = j=0 bj 1Bi . Comme les familles (Ai ){i∈{0,...,n}} et (Bj ){j∈{0,...,m}} forment des
partitions de E, on a:
Pn Pm Pm Pn
f = i=0 j=0 ai 1Ai ∩Bj et g = j=0 i=0 bj 1Ai ∩Bj ,
Pn Pm
de sorte que αf + βg = i=0 j=0 (αai + βbi )1Ai ∩Bj , ce qui montre que αf + βg ∈ E, et donc que E est
un espace vectoriel.
Pn Pm
D’autre part, on remarque aussi que f g = i=0 j=0 ai bi 1Ai ∩Bj , ce qui montre que f g ∈ E.

On montrera aussi les propriétés de linéarité et de monotonie de l’intégrale des fonctions étagées (voir
proposition 4.1).

3.3 Fonctions mesurables et variables aléatoires


Afin d’étendre le concept d’intégrale à une classe de fonctions plus générale que celle des fonctions étagées
(positives), on introduit les fonctions mesurables (positives). On pourra ensuite utiliser une technique de
“passage à la limite” pour définir l’intégrale de telles fonctions.

On va tout d’abord définir la notion de mesurabilité pour une fonction f de E dans F . L’espace de
départ, E, est muni d’une tribu et l’espace d’arrivée, F , est, en général, muni d’une topologie (et donc
de sa tribu de Borel, les exemples fondamentaux sont F = R ou F = R+ ). On peut aussi considérer le
cas où F est muni d’une tribu (non donnée par une topologie sur F ).

Définition 3.4 (Fonction mesurable) Soient (E, T ) un espace mesurable et F un ensemble muni
d’une topologie (par exemple : F = R ou R+ ). Une fonction f , définie de E dans F , est une fonction
T -mesurable si f −1 (A) ∈ T , pour tout A ∈ B(F ). (Ce qui est équivalent à dire que la tribu f −1 (B(F )) =
{f −1 (B), B ∈ B(F )} est incluse dans T ou encore que la tribu Tf = {B ∈ P(F ); f −1 (B) ∈ T } contient

54
B(F ), voir l’exercice 2.4 sur les tribus image directe et image réciproque.) En l’absence d’ambiguı̈té
possible on dira “mesurable” au lieu de “T -mesurable”.

Plus généralement, si F n’est pas muni d’une topologie (et donc de la tribu B(F )) mais est muni directe-
ment d’une tribu T (on a alors deux espaces mesurables : (E, T ) et (F, T )), une fonction f , définie de
E dans F , est une fonction (T, T )-mesurable si f −1 (A) ∈ T , pour tout A ∈ T . (Ce qui est équivalent à
dire que la tribu f −1 (T ) = {f −1 (B), B ∈ T } est incluse dans T ou encore que la tribu Tf = {B ∈ P(F );
f −1 (B) ∈ T } contient T .) En l’absence d’ambiguı̈té possible on dira “mesurable” au lieu de “(T, T )-
mesurable”.

Remarque 3.3 Une fonction étagée est toujours mesurable. En effet, soit (E, T ) un espace mesurable.
Soit f ∈ E (donc f est une application de EP dans R). D’après la proposition 3.3, il existe (A0 , . . . , An ),
n
partition de E, et a0 , . . . , an ∈ R t.q. f = i=0 ai 1Ai et Ai ∈ T pour tout i ∈ {0, . . . , n}. Pour tout
−1
B ⊂ R, on a donc f (B) = ∪{i; ai ∈B} Ai ∈ T . Ce qui prouve que f est mesurable de E dans R.
Noter que si f ∈ E+ , on a donc aussi f mesurable de E dans R+ (voir l’exercice 3.3).

La terminologie probabiliste utilise les termes “variable aléatoire” ou “ élément aléatoire” (au lieu de
“fonction mesurable” ou “application mesurable”).

Définition 3.5 (Variable aléatoire, élément aléatoire)


1. Soit (E, T ) un espace probabilisable, on appelle variable aléatoire une fonction X définie de E dans
R et T -mesurable, i.e. t.q. X −1 (A) ∈ T , pour tout A ∈ B(R).
2. Soit (E, T ) et (F, T ) deux espaces probabilisables. Une fonction X, définie de E dans F , est un
élément aléatoire si c’est une fonction (T, T )-mesurable (c’est-à-dire si X −1 (A) ∈ T , pour tout A
∈ T ). Lorsque F est un espace vectoriel, on dit que X est une variable aléatoire vectorielle ou un
“vecteur aléatoire”.

Remarque 3.4 Comme cela a été dit dans la proposition 3.4, on dit, en l’absence d’ambiguı̈té, “me-
surable” au lieu de “T -mesurable”. On remarque d’ailleurs que le terme probabiliste “variable aléatoire”
ne mentionne pas la dépendance par rapport à la tribu. Dans la définition 3.5, on a noté X la variable
aléatoire plutôt que f car c’est l’usage dans la littérature probabiliste.

Définition 3.6 (Tribu engendrée par une fonction mesurable)


Soient (E, T ) un espace mesurable (resp. probabilisable) et f (resp. X) une fonction mesurable de E
dans R (resp. une variable aléatoire) alors l’ensemble {f −1 (A), A ∈ B(R)} (resp. {X −1 (A), A ∈ B(R)})
est une tribu sur E qu’on appelle tribu engendrée par la fonction mesurable f (resp. la variable aléatoire
X). Cette tribu est aussi la tribu image réciproque de B(R) par f (resp. X).

Définition 3.7 (espaces M et M+ ) Soit (E, T ) un espace mesurable, on note :


• M(E, T ) = {f : E → R, mesurable },
• M+ (E, T ) = {f : E → R+ , mesurable }.
En l’absence d’ambiguı̈té, on notera M = M(E, T ) et M+ = M+ (E, T ).

Proposition 3.2 (Première caractérisation de la mesurabilité)


Soient (E, T ) un espace mesurable et f : E → F , avec F = R ou R+ . Soit C une partie de P(F )
engendrant la tribu borélienne de F . On a alors : f est mesurable si et seulement f −1 (C) ∈ T pour tout
C ∈ C. En particulier, f est mesurable si et seulement si f vérifie l’une des deux propriétés suivantes :

55
1. f −1 (]α, β[) ∈ T , pour tout α, β ∈ R, α < β,
2. f −1 (]α, ∞[) ∈ T , pour tout α ∈ R.

Dans cette caractérisation, l’ensemble ]α, β[ (ou ]α, ∞[) désigne, bien sûr, l’ensemble des éléments de F
appartenant à ]α, β[ (ou ]α, ∞[).

La démonstration de cette proposition fait l’objet de l’exercice 3.1. Le lecteur pourra trouver lui-même
d’autres caractérisations de la mesurabilité, en utilisant la proposition ci-dessus. Par exemple, soit f de
E (muni de la tribu T ) dans R+ , la fonction f est mesurable si et seulement si f −1 (]α, ∞]) ∈ T pour tout
α > 0 (par contre, f −1 (]α, ∞[) ∈ T pour tout α ≥ 0 n’implique pas que f est mesurable).
La proposition suivante nous permettra de définir l’intégrale des fonctions appartenant à M+ (comme
limite d’intégrales de fonctions étagées, voir le chapitre suivant). Par contre, on ne pourra pas donner un
sens, dans le cas général, à l’intégrale des fonctions appartenant à M.

Proposition 3.3 (Mesurabilité positive) Soient (E, T ) un espace mesurable et f : E → R+ . Alors f


∈ M+ si et seulement si il existe une suite (fn )n∈N ⊂ E+ , t.q. :
1. Pour tout x ∈ E, fn (x) → f (x), quand n → ∞,
2. fn+1 (x) ≥ fn (x), pour tout x ∈ E, et tout n ∈ N.

les 2 conditions précédentes seront dénotées dans la suite sous la forme fn ↑ f quand n → ∞.

Démonstration : Soit (fn )n∈N ∈ E+ t.q. fn ↑ f quand n → ∞. On remarque que, pour tout α ∈ R,
[
f −1 (]α, +∞]) = fn−1 (]α, +∞[). (3.4)
n∈N

Comme fn est mesurable, pour tout n ∈ N (voir la remarque 3.3), on a fn−1 (]α, +∞[) ∈ T pour tout
n ∈ N et donc, par stabilité de T par union dénombrable, f −1 (]α, +∞]) ∈ T . Ceci étant vrai pour tout
α ∈ R, on en déduit, comme {]α, +∞], α ≥ 0} engendre B(R+ ), que f est mesurable de E dans R+ ,
c’est-à-dire f ∈ M+ .

Réciproquement, on suppose que f ∈ M+. On va construire (fn )n∈N? ⊂ E+ t.q. fn ↑ f quand n → ∞.


Pour n ∈ N? , on définit la fonction fn par :
p p p+1
(
si f (x) ∈ [ n , n [, avec p ∈ {0, . . . , n2n − 1},
fn (x) = 2 n 2 2 (3.5)
n si f (x) ≥ n,

de sorte que
n
n2 −1
X p
fn = n1{x∈E; f (x)≥n} + 1 p p+1 .
p=0
2n {x∈E; f (x)∈[ 2n , 2n [}

Comme f ∈ M+ , on a {x ∈ E; f (x) ≥ n} ∈ T et {x ∈ E; f (x) ∈ [ 2pn , p+1


2n [} ∈ T pour tout n et tout p,
on a donc (fn )n∈N? ⊂ E+ .

On montre maintenant que, pour tout x ∈ E, on a fn (x) → f (x), quand n → ∞. Soit x ∈ E. On


distingue deux cas :

56
Premier cas. On suppose f (x) < ∞. On a alors, pour n ≥ f (x), |f (x) − fn (x)| ≤ 21n . On a donc
fn (x) → f (x) quand n → ∞.
Deuxième cas. On suppose f (x) = ∞. On a alors fn (x) = n pour tout n ∈ N? et donc fn (x) → f (x)
quand n → ∞.

On montre enfin que, pour tout x ∈ E et pour tout n ∈ N? , on a fn+1 (x) ≥ fn (x). Soit x ∈ E et n ∈ N? .
On distingue trois cas :
Premier cas. On suppose f (x) ≥ n + 1. On a alors fn+1 (x) = n + 1 > n = fn (x).
Deuxième cas. On suppose n ≤ f (x) < n + 1. Il existe alors i ∈ {n2n+1 , . . . , (n + 1)2n+1 − 1} t.q.
i
f (x) ∈ [ 2n+1 , 2i+1 i
n+1 ]. On a alors fn (x) = n ≤ 2n+1 = fn+1 (x).

Troisième cas. On suppose f (x) < n. Il existe alors p ∈ {0, . . . , n2n − 1} t.q. f (x) ∈ [ 2pn , p+1 2n [=
2p
[ 2n+1 , 2(p+1)
2n+1 [. Si f (x) ∈ [ 2p
, 2p+1
2n+1 2n+1 [, on a fn (x) = p
2n = 2p
2n+1 = f n+1 (x). Si f (x) ∈ [ 2p+1 2(p+1)
2n+1 , 2n+1 [, on a
p 2p+1
fn (x) = 2n < 2n+1 = fn+1 (x). On a toujours fn (x) ≤ fn+1 (x).

On a bien ainsi construit (fn )n∈N? ⊂ E+ t.q. fn ↑ f quand n → ∞.

Proposition 3.4 (Mesurabilité sans signe) Soient (E, T ) un espace mesurable, et f : E → R. On


suppose que f est mesurable. Il existe alors une suite (fn )n∈N ⊂ E t.q., pour tout x ∈ E, fn (x) → f (x),
quand n → ∞.
Démonstration :
On définit la fonction f + : E → R+ par f + (x) = max(f (x), 0) pour tout x ∈ E. On remarque que
f + ∈ M+ (et f + ∈ M, voir l’exercice 3.3). En effet, f + prend ses valeurs dans R+ et (f + )−1 (]α, ∞]) =
f −1 (]α, ∞[) ∈ T si α > 0. On conclut en remarquant que {]α, ∞], α > 0} engendre B(R+ ). On définit
également f − = (−f )+ , de sorte que f = f + − f − . On a donc aussi f − ∈ M+ . La proposition 3.3
donne l’existence de (fn )n∈N ⊂ E+ et (gn )n∈N ⊂ E+ t.q. fn ↑ f + et gn ↑ f − quand n → ∞. On pose
hn = fn − gn , de sorte que hn (x) → f (x), quand n → ∞, pour tout x ∈ E. D’autre part, comme E est
un espace vectoriel (voir la proposition 3.1 page 54), on a (hn )n∈N ∈ E.

La proposition précédente nous donnera, avec les propriétés de stabilité de M et M+ (voir la proposition
3.5) une deuxième caractérisation de la mesurabilité, voir la proposition 3.6.

L’ensemble des fonctions mesurables est un ensemble très “stable”, c’est-à-dire que des opérations “usuel-
les” (comme “addition”, “multiplication”, “limite”. . . ) sur des fonctions mesurables donnent encore des
fonctions mesurables, ceci est précisé dans la proposition suivante. Dans le cas (fondamental) de (E, T )
= (R, B(R)), il est “difficile” de trouver des fonctions non mesurables (comme il est “difficile” de trouver
des parties non boréliennes, bien que le cardinal de B(R) soit égal au cardinal de R et donc strictement
inférieur au cardinal de P(R)). En pratique, on peut en gros supposer que les fonctions de R dans R sont
toutes B(R)-mesurables (bien qu’il y ait “beaucoup” de fonctions non mesurables. . . ).
Proposition 3.5 (Stabilité de M et M+ ) Soit (E, T ) un espace mesurable.
1. Soit I ⊂ N.
Soit (fn )n∈I ⊂ M+ , alors supn∈I fn ∈ M+ et inf n∈I fn ∈ M+ .
Soit (fn )n∈I ⊂ M. Si supn∈I fn prend ses valeurs dans R, alors supn∈I fn ∈ M. De même, si
inf n∈I fn prend ses valeurs dans R, alors inf n∈I fn ∈ M.

57
2. Soit (fn )n∈N ⊂ M+ , alors lim supn→∞ fn ∈ M+ et lim inf n→∞ fn ∈ M+ .
Soit (fn )n∈N ⊂ M. Si lim supn∈N fn prend ses valeurs dans R, alors lim supn∈N fn ∈ M. De même,
si lim inf n∈N fn prend ses valeurs dans R, alors lim inf n∈N fn ∈ M.
3. Soit (fn )n∈N ⊂ M+ . On suppose que fn (x) → f (x) dans R+ , pour tout x ∈ E. Alors f ∈ M+ .
Soit (fn )n∈N ⊂ M. On suppose que fn (x) → f (x) dans R, pour tout x ∈ E. Alors f ∈ M.

4. M est un espace vectoriel sur R et si f, g ∈ M, alors f g ∈ M.

Démonstration :

1. Soit (fn )n∈N ⊂ M+ . Il est clair que f = supn∈I fn est bien définie et prend ses valeurs dans R+ .
Puis, Pour tout α ∈ R, on a f −1 (]α, ∞]) = ∪n∈I fn−1 (]α, ∞]) ∈ T . Comme {]α, ∞] ∩ R+ , α ∈ R}
engendre B(R+ ), on en déduit que f est mesurable de E dans R+ , c’est-à-dire f ∈ M+ .
De même la fonction f = inf n∈I fn est aussi bien définie et prend ses valeurs dans R+ (elle prend
même ses valeurs dans R+ si les fn prennent leurs valeurs dans R+ , ceci n’est pas vrai avec la
fonction supn∈I fn ). On remarque ensuite que f −1 (] − ∞, α[) = ∪n∈I fn−1 (] − ∞, α[), pour tout
α ∈ R. Comme {] − ∞, α[∩R+ , α ∈ R} engendre B(R+ ), on en déduit que f est mesurable de E
dans B(R+ ), c’est-à-dire f ∈ M+ .

Soit maintenant (fn )n∈N ⊂ M. La fonction f = supn∈I fn est bien définie si on la considère comme
étant à valeurs dans R car elle peut prendre la valeur +∞ en certains points. On la suppose
maintenant à valeurs dans R. On peut alors raisonner comme précédemment en remarquant que
f −1 (]α, ∞[) = ∪n∈I fn−1 (]α, ∞[) et que {]α, ∞[, α ∈ R} engendre B(R). De même, La fonction
f = inf n∈I fn est bien définie si on la considère comme étant à valeurs dans R car elle peut prendre
la valeur −∞ en certains points. On la suppose maintenant à valeurs dans R. On peut alors
raisonner comme précédemment en remarquant que f −1 (] − ∞, α[) = ∪n∈I fn−1 (] − ∞, α[) et que
{] − ∞, α[, α ∈ R} engendre B(R).
2. Soit (fn )n∈N ⊂ M+ . On pose f = lim supn→∞ fn , la fonction f est bien définie à valeurs dans R+ .
Pour tout x ∈ E, on a f (x) = lim supn→∞ fn (x) = limn→∞ (supp≥n fp (x)) = inf n∈N (supp≥n fp (x)),
c’est-à-dire f = inf n∈N (supp≥n fp ). En utilisant les résultats précédents (avec sup puis inf), on a
donc f ∈ M+ . Un raisonnement similaire donne lim inf n→∞ fn = supn∈N (inf p≥n fp ) ∈ M+ .

Soit maintenant (fn )n∈N ⊂ M. On suppose que f = lim supn→∞ fn = inf n∈N (supp≥n fp ) (qui est
bien définie dans R ∪ {∞}) prend ses valeurs dans R. Comme les fn prennent leurs valeurs dans R,
on peut alors remarquer que la fonction supp≥n fp prend aussi ses valeurs dans R, pour tout n ∈ N.
On a donc, avec la propriété démontrée en 1, supp≥n fp ∈ M pour tout n ∈ N. Puis, utilisant
encore la propriété démontrée en 1, f = inf n∈N (supp≥n fp ) ∈ M. Un raisonnement analogue donne
lim inf n→∞ fn = supn∈N (inf p≥n fp ) ∈ M dès que l’on suppose que lim inf n→∞ fn prend ses valeurs
dans R.
3. Cette question est immédiate grâce à la précédente. Il suffit de remarquer que dès que la limite de la
suite (fn (x))n∈N existe, elle est nécessairement égale à la limite supérieure (ou la limite inférieure)
de cette même suite (fn (x))n∈N , c’est-à-dire que limn→∞ fn (x) = lim supn→∞ fn (x) (pour tout
x ∈ E). Ici on remarque donc simplement que f = lim supn→∞ fn et on applique la propriété 2.

58
4. Soit f, g ∈ M et soit α, β ∈ R On pose h = αf +βg. D’après la proposition 3.4, il existe (fn )n∈N ⊂ E
et (gn )n∈N ⊂ E t.q. fn (x) → f (x) et gn (x) → g(x), quand n → ∞, pour tout x ∈ E. On pose
hn = αfn + βgn , de sorte que hn (x) → h(x), quand n → ∞, pour tout x ∈ E. La proposition
3.1 donne que E est un espace vectoriel sur R, on a donc (hn )n∈N ⊂ E. Comme E ⊂ M (voir la
remarque 3.3), la propriété 3 ci dessus donne alors que h ∈ M. L’ensemble M est donc un espace
vectoriel (sur R).
Soit f, g ∈ M. On pose h = f g. On raisonne comme ci dessus, il existe (fn )n∈N ⊂ E et (gn )n∈N ⊂ E
t.q. fn (x) → f (x) et gn (x) → g(x), quand n → ∞, pour tout x ∈ E. On pose hn = fn gn ,
de sorte que hn (x) → h(x), quand n → ∞, pour tout x ∈ E. La proposition 3.1 donne aussi
(hn )n∈N ⊂ E ⊂ M. La propriété 3 ci dessus donne alors que h ∈ M.

Proposition 3.6 (Deuxième caractérisation de la mesurabilité) Soit (E, T ) un espace mesurable


et f : E → R. Alors, f est mesurable si et seulement si il existe une suite (fn )n∈N ⊂ E t.q., pour tout
x ∈ E, fn (x) → f (x), quand n → ∞.

Démonstration :
Cette caractérisation est donnée par la proposition 3.4 pour le sens “seulement si” et par la propriété 3
de la proposition 3.5 pour le sens “si”.

On rappelle aussi qu’une fonction f de E (muni de la tribu T ) dans R+ est mesurable (c’est-à-dire
appartient à M+ ) si et seulement si il existe (fn )n∈N ⊂ E+ t.q. fn ↑ f (voir la proposition 3.3).

Remarque 3.5 Il est intéressant de remarquer que la proposition 3.6 peut être fausse si on prend pour
F un espace topologique quelconque (elle reste vraie, par exemple, si F est un espace vectoriel normé de
dimension finie) avec une définition immédiate de E généralisant celle donnée pour les fonctions à valeurs
dans R ou R+ .

Définition 3.8 Soient E un ensemble et f : E → R. Pour tout x ∈ E, on pose :

• f + (x) = max(f (x), 0),


• f − (x) = − min(f (x), 0) = (−f )+ (x),
• |f |(x) = |f (x)|.

Proposition 3.7 Soient (E, T ) un espace mesurable et f ∈ M. On a alors f = f + − f − , |f | = f + + f −


et f + , f − , |f | ∈ M+ ∩ M.

Démonstration :
Le fait que f = f + − f − et |f | = f + + f − est immédiat. On a déjà vu, dans la démonstration de la
proposition 3.4, que f + , f − ∈ M+ et donc que f + , f − ∈ M (voir l’exercice 3.3). La proposition 3.5
donne que M est un espace vectoriel sur R. On a donc |f | ∈ M et donc aussi |f | ∈ M+ car |f | ≥ 0.

59
3.4 Mesure image, loi d’une v.a., v.a. indépendantes
Soit (E, T ) et (F, T ) deux espaces mesurables (l’exemple fondamental est (F, T ) = (R, B(R))) et f une
fonction mesurable de E vers F . Si m est une mesure sur T , alors on peut définir, à partir de f et m,
une mesure sur T de la manière suivante :

Proposition 3.8 (Mesure image) Soient (E, T, m) un espace mesuré, (F, T ) un espace mesurable et
f une fonction mesurable de E vers F (c’est-à-dire (T, T )-mesurable). Alors, l’application mf définie de
T dans R+ par : mf (A) = m(f −1 (A)), pour tout A ∈ T , est une mesure sur T , appelée mesure image
par f .

Démonstration : Il suffit de remarquer que mf est bien définie, que mf (∅) = 0 et que mf est
σ−additive, ce qui découle naturellement des propriétés de m.

Définition 3.9 (Loi de probabilité et fonction de répartition d’une variable aléatoire)


Soient (E, T, p) un espace probabilisé, X une variable aléatoire réelle (c’est-à-dire une fonction mesurable
de E, muni de la tribu T , dans R, muni de la tribu borélienne). On appelle loi de probabilité de la variable
aléatoire X la probabilité pX image de p par X (cette probabilité est donc définie sur B(R)). On appelle
fonction de répartition de la variable aléatoire X la fonction de répartition de la probabilité pX .

Dans de nombreux cas, les modèles probabilistes seront déterminés par une loi de probabilité d’une
variable aléatoire. Une conséquence immédiate du théorème 2.4 est que la loi de probabilité d’une
variable aléatoire réelle est entièrement déterminée par sa fonction de répartition. Ceci est énoncé dans
la proposition suivante.

Proposition 3.9 (Egalité de deux lois) Soient (E, T, p) et (E 0 , T 0 , p0 ) des espaces probabilisés, X une
variable aléatoire réelle sur E (c’est-à-dire une fonction mesurable de E, muni de T , dans R muni de
B(R)) et X 0 une variable aléatoire réelle sur E 0 . On a alors pX = pY si et seulement si p({X ≤ t}) =
p0 ({Y ≤ t}) pour tout t ∈ R. On a aussi pX = pY si et seulement si p({s ≤ X ≤ t}) = p0 ({s ≤ Y ≤ t})
pour tout s, t ∈ R, s < t. (Les inégalités strictes peuvent remplacées par des inégalités larges.)

Démonstration : Cette proposition est une conséquence des théorèmes 2.4 et 2.5. Il suffit de remarquer
que p({X ≤ t}) = pX (] − ∞, t]) et p({s ≤ X ≤ t}) = pX ([s, t]) (et les mêmes égalités avec Y au lieu de
X).

On rappelle que la notation p({X ≤ t}) (si X est une v. a. réelle sur l’espace probabilisé (E, T, p)) signifie
p({ω ∈ E; X(ω) ≤ t}). Cette notation sera abrégée sous la forme p(X ≤ t).

Définition 3.10 (Variables aléatoires équidistribuées)


Soient (E, T, p) et (E 0 , T 0 , p0 ) des espaces probabilisés, X (resp. X 0 ) une variable aléatoire de (E, T, p)
(resp. (E 0 , T 0 , p0 )) dans (R, B(R)), on dit que les variables aléatoires X et X 0 sont équidistribuées si elles
ont même loi de probabilité.

Définition 3.11 (Variable aléatoire discrète, entière, continue) Soient (E, T, p) un espace proba-
bilisé, X une variable aléatoire sur (E, T, p), pX la loi de la variable aléatoire X et FX sa fonction de
répartition;
1. Si X(E) est dénombrable, on dit que la variable aléatoire X est discrète.
2. Si X(E) ⊂ N, on dit que la variable aléatoire X est entière.

60
3. Si la fonction de répartition FX définie de R dans [0, 1] est continue, on dit que la variable aléatoire
est continue.

Définition 3.12 (Variables aléatoires indépendantes) Soit (E, T, p)) un espace probabilisé.
1. Soit N > 1 et X1 , . . . , XN une famille de variables aléatoires réelles. On dit que X1 , . . . , XN
sont indépendantes (ou que la famille ( X1 , . . . , XN ) est indépendante) si les tribus engendrées par
X1 , . . . , XN (on notera souvent τ (X) ou σ(X) la tribu engendrée par la variable aléatoire X) sont
indépendantes.
2. Soit (Xn )n∈N? une suite de variables aléatoires réelles. On dit que la suite (Xn )n∈N? est indépen-
dante (ou que les v.a. X1 , . . . , Xn , . . . sont indépendantes) si, pour tout N > 1, les v.a. X1 , . . . , XN
sont indépendantes.

On appellera “suite de v.a.r.i.i.d. ” une suite de variables aléatoires réelles indépendantes identiquement
distribuées (ce dernier point signifiant que toutes les v.a. de la suite ont même loi).

Soit (E, T, p)) un espace probabilisé et X1 , X2 , X3 trois v.a.r. (c’est-à-dire variables aléatoires réelles).
Le fait que X1 soit indépendante de X2 et X3 n’implique pas que X1 soit indépendante de (par exemple)
X2 + X3 , même si X2 et X3 sont indépendantes. Mais, on a bien X1 indépendante de X2 + X3 si la
famille (X1 , X2 , X3 ) est indépendante. Ceci est une conséquence da la proposition suivante.

Proposition 3.10 (Indépendance et composition)


Soit (E, T, p)) un espace probabilisé, n ≥ 1, m ≥ 1 et X1 , . . . , Xn , Y1 , . . . , Ym des v.a.r indépendantes.
Soit ϕ une fonction borélienne de Rn dans R et ψ une fonction borélienne de Rm dans R. Alors, les
v.a.r. ϕ(X1 , . . . , Xn ) et ψ(Y1 , . . . , Ym ) sont indépendantes. Nous avons ici décomposé la famille initiale
de v.a.r. indépendantes en 2 groupes. la proposition peut se généraliser à une décomposition en un nombre
quelconque de groupes.

Démonstration : La notation ϕ(X1 , . . . , Xn ) est un peu incorrecte (mais toujours utilisée). Elle désigne
(comme on le devine facilement) la composition de ϕ (qui va de Rn dans R) avec l’application de E dans
Rn donnée par les Xi , i = 1, . . . , n.
La démonstration de cette proposition (et de sa généralisation à un nombre quelconque de groupes)
est une conséquence simple de la proposition 2.11 dés que l’on remarque que la tribu engendrée par
ϕ(X1 , . . . , Xn ) est incluse dans la tribu engendrée par X1 , . . . , Xn , ce que nous démontrons maintenant.

On note τ la tribu engendrée par X1 , . . . , Xn et X l’application de E dans Rn qui à ω ∈ E associe


t n −1
Q)n. . . , Xn (ω)) . Il est facile de voir que {A ∈ B(R ) t.q.−1X (A) ∈n τ } est
(X1 (ω, une tribu (sur Rn ). Si
A = i=1 Ai avec Ai ∈ B(R) pour tout i = 1, . . . , n, on a X (A) = ∩i=1 Xi (Ai ) ∈ τ (car Xi−1 (Ai )
−1

appartient à τ (Xi ) et donc à τ ). Comme B(Rn ) est engendrée par l’ensemble des produits de boréliens
de R (et même par l’ensemble des produits d’intervalles ouverts de R, voir l’exercice 2.6), on en déduit
que {A ∈ B(Rn ) t.q. X −1 (A) ∈ τ } contient B(Rn ). Pour tout B ∈ B(R), on a donc (ϕ(X))−1 (B) =
X −1 (ϕ−1 (B)) ∈ τ car ϕ−1 (B) ∈ B(Rn ) (puisque ϕ est borélienne). ce qui prouve bien que la tribu
engendrée par ϕ(X1 , . . . , Xn ) est incluse dans la tribu engendrée par X1 , . . . , Xn .

Nous verrons au chapitre 7 la conséquence principale de l’indépendance. Cette conséquence est que, si
X, Y sont des v.a.r. indépendantes, la loi du couple (X, Y ) est le produit des lois PX et PY (c’est-à-dire ,
avec les notations du Chapitre 7, P(X,Y ) = PX ⊗ PY ). Une propriété analogue est vraie pour une famille
(X1 , . . . , Xn ) de v.a.r. indépendantes.

61
Nous terminons ce paragraphe par un théorème très utile en probabilités sur la représentation d’une v.a.
mesurable par rapport à une autre v.a..

Théorème 3.1 (V.a. mesurable par rapport à une autre v.a.) Soient X et Y deux v.a. réelles
définies sur un espace de probabilités (Ω, A, P ). Alors, la v.a. Y est mesurable par rapport à la tribu
engendrée par X (notée τ (X)) si et seulement si il existe une fonction borélienne f de R dans R telle
que Y = f (X).

Démonstration : La démonstration de ce résultat fait l’objet de l’exercice 3.14 (corrigé 46). Il est in-
téressant de remarquer que le démonstration de ce théorème faite dans le corrigé 46 donne les informations
complémentaires suivantes :
• Y est τ (X)-mesurable bornée si et seulement si il existe f borélienne bornée t.q. Y = f (X),
• Y est τ (X)-mesurable positive si et seulement si il existe f borélienne positive t.q. Y = f (X).
La partie “si” de ces deux résultats est immédiate. Pour la partie “seulement si”, il suffit de remarquer
que la démonstration faite dans le corrigé 46 donne f t.q.

Imf = {f (t), t ∈ R} ⊂ Im(Y ) ∪ {0}, avec ImY = {Y (ω), ω ∈ Ω}.

3.5 Convergence p.p., p.s., en mesure, en probabilité


On introduit ici plusieurs notions de convergence de fonctions définies sur un espace mesuré à valeurs dans
R (ou R+ ) et on donne des liens entre ces différentes convergences. On introduit les notions équivalentes
pour les variables aléatoires en langage probabiliste.

Définition 3.13 (Egalité presque partout) Soient (E, T, m) un espace mesuré, F un ensemble et f
et g des fonctions définies de E dans F (F = R ou F = R+ , par exemple) ; on dit que f = g m-presque
partout (et on note f = g m-p.p.) si l’ensemble {x ∈ E ; f (x) 6= g(x)} est négligeable, c’est à dire qu’il
existe A ∈ T t.q. m(A) = 0 et f (x) = g(x) pour tout x ∈ Ac .

On peut remarquer que si f et g sont des fonctions mesurables de E (muni de la tribu T et de la mesure
m) dans R (ou R+ ), l’ensemble {x ∈ E ; f (x) 6= g(x)} (noté aussi {f 6= g}) appartient à T . Le fait que
f = g m p.p. revient donc à dire que m({f 6= g}) = 0. Dans la cas où f ou g n’est pas mesurable,
l’ensemble {f 6= g} peut être négligeable sans appartenir à T (il appartient nécessairement à T si la
mesure est complète, voir la définition 2.15).
En l’absence de confusion possible, on remplace m-p.p. par p.p.. Cette définition se traduit en langage
probabiliste par:

Définition 3.14 (Egalité presque sûre) Soient (E, T, p) un espace probabilisé, X et Y des variables
aléatoires X et Y de (E, T ) dans (R, B(R)) ; on dit que X = Y p-presque sûrement (et on note X = Y
p.s. ), si l’ensemble {x ∈ E ; X(x) 6= Y (x)} est négligeable.

Définition 3.15 (Convergence presque partout) Soient (E, T, m) un espace mesuré, F un ensem-
ble, (fn )n∈N une suite de fonctions de E dans F et f une fonction de E dans F (F = R ou F = R+ , par
exemple) ; on dit que fn converge presque partout vers f (fn → f p.p. ) si il existe une partie A de E,
négligeable, t.q., pour tout élément x de Ac , la suite (fn (x))n∈N converge vers f (x).

62
Noter que la convergence simple entraı̂ne la convergence presque partout.
La définition 3.15 se traduit en langage probabiliste par:

Définition 3.16 (Convergence presque sure) Soient (E, T, p) un espace probabilisé, (Xn )n∈N une
suite de variables aléatoires et X une variable aléatoire ; on dit que Xn converge presque sûrement vers
X (Xn → X p.s. ) si il existe une partie A de E, négligeable, t.q., pour tout élément x de Ac , la suite
(Xn (x))n∈N converge vers X(x).

Définition 3.17 (Convergence presque uniforme) Soient (E, T, m) un espace mesuré, (fn )n∈N ⊂
M et f ∈ M. On dit que fn converge presque uniformément vers f (fn → f p.unif. ) si, pour tout
ε > 0, il existe A ∈ T t.q. m(A) ≤ ε et fn converge uniformément vers f sur Ac .

La convergence presque uniforme entraı̂ne la convergence presque partout (voir exercice 3.23).
Attention, la convergence “presque uniforme” ne donne pas la convergence “uniforme en dehors d’un
ensemble de mesure nulle”. La convergence “uniforme en dehors d’un ensemble de mesure nulle” est reliée
à la convergence “essentiellement uniforme”, c’est-à-dire la convergence pour le “sup essentiel”, défini
ci-après, ou pour la norme k · k∞ que nous verrons dans la section 6.1.2.

Définition 3.18 (sup essentiel) Soient (E, T, m) un espace mesuré et f ∈ M. On dit que f est
essentiellement bornée si il existe C ∈ R+ tel que |f | ≤ C p.p.. On appelle alors “sup essentiel de |f |”, et
on le note kf k∞ , l’infimum des valeurs C telles que |f | ≤ C p.p.. Si f n’est pas essentiellement bornée,
on pose kf k∞ = ∞.

Remarquons que dans le cas où (E, T, m) = (R, B(R), λ), le sup essentiel d’une fonction continue est la
borne supérieure de sa valeur absolue (ceci fait l’objet de la proposition 6.4).

Définition 3.19 (Convergence essentiellement uniforme) Soient (E, T, m) un espace mesuré, f ∈


M et (fn )n∈N ⊂ M; on dit que fn converge essentiellement uniformément vers f (fn → f ess. unif. )
si kfn − f k∞ → 0 lorsque n → +∞.

Il est facile de voir que la convergence essentiellement uniforme entraı̂ne la convergence presque uniforme,
mais la réciproque est fausse (voir l’exercice 3.24). Le théorème suivant donne, dans le cas où la mesure
est finie, un résultat très important qui fait le lien entre la convergence presque partout et la convergence
presque uniforme.

Théorème 3.2 (Egorov) Soient (E, T, m) un espace mesuré, tel que m(E) < +∞, (fn )n∈N ⊂ M et
f ∈ M. On suppose que fn → f p.p.. Alors, pour tout ε > 0, il existe A ∈ T tel que m(A) ≤ ε et fn
converge uniformément vers f sur Ac . (Autrement dit, la suite (fn )n∈N converge presque uniformément
vers f .)

La démonstration de ce théorème fait l’objet de l’exercice 3.24. Attention, lorsque m(E) = +∞, on peut
trouver des suites de fonctions qui convergent presque partout et non presque uniformément.

Définition 3.20 (Convergence en mesure) Soient (E, T, m) un espace mesuré, (fn )n∈N ⊂ M et f ∈
M. On dit que fn converge en mesure vers f si :

∀ ε > 0, lim m({x ∈ E ; |f (x) − fn (x)| ≥ ε}) = 0. (3.6)


n→+∞

Cette définition se traduit en langage probabiliste par:

63
Définition 3.21 (Convergence stochastique ou en probabilité) Soient (E, T, p) un espace proba-
bilisé, (Xn )n∈N une suite de variables aléatoires et X une variable aléatoire . On dit que Xn converge
stochastiquement, ou en probabilité, vers X si :

∀ ε > 0, lim p({x ∈ Xn ; |X(x) − Xn (x)| ≥ ε}) = 0. (3.7)


n→+∞

On peut montrer (cf exercice 3.22) que si (fn )n∈N ⊂ M converge en mesure vers f ∈ M et (fn )n∈N
converge en mesure vers g ∈ M, alors f = g p.p.. On montre aussi que si (fn )n∈N ⊂ M converge en
mesure vers f ∈ M et (gn )n∈N converge en mesure vers g ∈ M, alors (fn + gn )n∈N ⊂ M converge en
mesure vers f + g ∈ M, et, si m est une mesure finie, (fn gn )n∈N ⊂ M converge en mesure vers f g ∈ M.
On montre à l’aide du théorème d’Egorov que si fn converge vers f presque partout, et si m(E) < +∞,
alors fn converge vers f en mesure. Réciproquement, si fn converge vers f en mesure, alors il existe une
sous-suite de (fn )n∈N qui converge vers f presque uniformément (et donc presque partout). Ce second
résultat est vrai même si m(E) = +∞ (voir exercice 3.25).

On donne maintenant un résumé des différents types de convergence connus jusqu’à présent avec les
relations existantes entre eux; les relations entre convergence presque partout et convergence en mesure
(resp. convergence presque sure et convergence stochastique) sont étudiées dans l’exercice 3.25. (On en
introduira bientôt encore quelques-unes. . . )

Terminologie “analyste” Terminologie “probabiliste”


convergence simple (cs)
convergence uniforme (cu)
convergence presque partout (cpp) convergence presque sure (cps)
convergence presque uniforme (cpu)
convergence en mesure (cm) convergence stochastique (cst)

On a les implications suivantes :

Terminologie “analyste” Terminologie “probabiliste”


(cu) ⇒ (cs) ⇒ (cpp)
(cu) ⇒ (cpu) ⇒ (cpp)
(cpp) ⇒ (cpu) si la mesure est finie
(cm) ⇒ (cpu) (et donc (cpp)) pour une sous-suite (cst) ⇒ (cps) pour une sous-suite
(cpp) ⇒ (cm) si la mesure est finie (cps) ⇒ (cst) si la mesure est finie
(cpu) ⇒ (cm)

3.6 Exercices
Exercice 3.1 (Caractérisation des fonctions mesurables) (?)Corrigé 36 page 311
Soient (E, T ) un espace mesurable et f une application de E dans R ;
1. Montrer que Tf = {B ∈ P(R) ; f −1 (B) ∈ T } est une tribu.

2. Soit C un ensemble qui engendre B(R), montrer que les deux assertions suivantes sont équivalentes :

(i) f est mesurable,


(ii) f −1 (C) ∈ T , pour tout C ∈ C.

64
Exercice 3.2 (Composition de fonctions mesurables) Corrigé 37 page 311
Soit (E, T ) et (F, S) deux espaces mesurables. Soit f : E → F et ϕ : F → R (R est muni, comme
toujours, de la tribu borélienne). On suppose que f et ϕ sont mesurables. Montrer que ϕ◦f est mesurable
(de E dans R).

Exercice 3.3 (R ou R+ . . . ) Corrigé 38 page 311


Soit ϕ : R → R, ϕ ≥ 0. On munit R (au départ et à l’arrivée) de la tribu borélienne. Montrer que ϕ est
mesurable (on dit aussi borélienne) si et seulement si ϕ est mesurable quand on la considère comme une
application de R dans R+ (R+ étant aussi muni de la tribu borélienne).

Exercice 3.4 (Stabilité de M) Corrigé 39 page 312

1. Soient (E, T ), (E 0 , T 0 ), (E 00 , T 00 ) des espaces mesurables, f (resp. g) une application de E dans


E 0 (resp. de E 0 dans E 00 ). On suppose que f et g sont mesurables. Montrer que g ◦ f est une
application mesurable de E dans E 00 .
2. Soit (E, T ) un espace mesurable, on munit R de la tribu des boréliens B(R); soient f et g des
fonctions mesurables de E dans R.
(a) Montrer que f + (= sup(f, 0)), f − (= − inf(f, 0)) sont des fonctions mesurables de E dans R.
(b) Montrer que f + g, f g et |f | sont des fonctions mesurables de E dans R.
3. Soient (E, T ) un espace mesurable, (fn )n∈N une suite de fonctions mesurables de E dans R. On
suppose que la suite (fn (x))n∈N converge (dans R) pour tout x ∈ E. On pose f (x) = limn→+∞ fn (x)
(pour tout x ∈ E). Montrer que f est une fonction mesurable de E dans R.
4. Soit (E, T ) un espace mesurable, on suppose qu’il existe A ∈ T dont les sous-ensembles ne soient
pas tous mesurables. Il existe donc B ⊂ A t.q. B ∈ / T . Montrer que h = 1B − 1A\B n’est pas
mesurable (de E dans R), alors que |h| l’est.

Exercice 3.5 (Mesurabilité des fonctions continues) Corrigé 40 page 313


Soit f une application de R dans R. On munit R (au départ et à l’arrivée) de la tribu borélienne

1. On suppose f continue. Montrer que f est mesurable (on dit aussi que f est borélienne).
2. On suppose f continue à droite (resp. gauche). Montrer que f est mesurable.
3. On suppose f croissante. Montrer que f est mesurable.

Exercice 3.6 (Mesurabilité de 1Q )


On munit R de sa tribu borélienne. La fonction 1Q est-elle mesurable ?

Exercice 3.7
Soit (E, T, p) un espace probabilisé et X une variable aléatoire sur (E, T ) ;
1. On prend pour X la variable aléatoire nulle, c’est-à-dire X : E → R, X(x) = 0, pour tout x ∈ E.
Calculer la loi de probabilité pX de X. En déduire que la connaissance de pX ne permet pas en
général de déterminer la probabilité p sur E.
2. Montrer que pX détermine p de manière unique si la tribu engendrée par X (voir la définition 3.6),
notée TX , est égale à T . Cette condition est-elle nécessaire ?

65
Exercice 3.8
Soit A une tribu sur un ensemble E et A ∈ A tel que : B ∈ A et B ⊂ A implique B = ∅ ou B = A.
Montrer que toute fonction mesurable (de E dans R) est constante sur A. En particulier si A est engendrée
par une partition, une fonction mesurable est constante sur chaque élément de la partition. Donner une
fonction constante sur tout élément d’une partition mais qui ne soit pas mesurable. [Prendre comme
partition de R tous les singletons. . . ]

Exercice 3.9 (Egalité presque partout) Corrigé 41 page 313

1. Soient f et g des fonctions continues de R dans R et λ la mesure de Lebesgue ; montrer que f = g


λ p.p. si et seulement si f = g.
2. Soient f et g des fonctions de R dans R et δ0 la mesure de Dirac en 0 ; montrer que f = g δ0 p.p.
si et seulement si f (0) = g(0).

Exercice 3.10 Corrigé 42 page 314


Soit f : RN × R dans R. On munit Rp de sa tribu borélienne (pour tout p ∈ N? ). On suppose que f est
mesurable par rapport à x ∈ RN , pour tout y ∈ R, et que f est continue a gauche par rapport a y ∈ R,
pour tout x ∈ RN .
Pour n > 1 et p ∈ Z, on pose : anp = np , p ∈ Z ; on définit la fonction fn , n > 1, de RN × R dans R par :

fn (x, y) = f (x, anp ), si y ∈ [anp , anp+1 [

1. Montrer que fn converge simplement vers f lorsque n → +∞.


2. Montrer que fn est mesurable. [On pourra utiliser, sans le démontrer, le fait que A × B ∈ B(RN +1 )
si A ∈ B(RN ) et B ∈ B(R). Ceci est démontré dans l’exercice 2.5 page 42 pour N = 1 et dans
l’exercice 7.1 pour N > 1.]
3. Montrer que f est mesurable.

[On pourra se contenter du cas N = 1. . . ]

Exercice 3.11 (Tribu de Borel sur R+ ) Corrigé 43 page 315

1. Montrer que {[0, β[, β ∈ R?+ } engendre B(R+ ).

2. Montrer que {[0, β[, β ∈ Q ∩ R?+ } engendre B(R+ ).

3. (Question plus difficile.) Montrer que {]0, β[, β ∈ R?+ } n’engendre pas B(R+ ).

Exercice 3.12 Corrigé 44 page 316


Soit f une fonction mesurable de R dans R (R est muni de sa tribu borélienne, notée B(R)). On se
propose de montrer que le graphe de f est un borélien de R2 . On admettra le résultat suivant, vu dans
l’exercice 2.5:
A, B ∈ B(R) ⇒ A × B ∈ B(R2 ).
On munit aussi R2 de sa tribu borélienne. Pour x, y ∈ R, on pose F (x, y) = f (x) et H(x, y) = y.

1. Montrer que F et H sont mesurables de R2 dans R.

66
2. On pose G(f ) = {(x, y)t ∈ R2 ; y = f (x)} (G(f ) est donc le graphe de f ). Montrer que G(f ) ∈
B(R2 ).

Exercice 3.13 (mesurabilité au sens de Lusin) Corrigé 45 page 316


Soit m une mesure sur B(RN ), finie sur les compacts de RN . On rappelle (cf. cours) que m est néces-
sairement régulière (c’est-à-dire que pour tout A ∈ B(RN ) et pour tout ε > 0, il existe F fermé et O
ouvert t.q. F ⊂ A ⊂ O et m(O \ F ) < ε).
Soit f ∈ RN → R. On dit que f est “mesurable au sens de Lusin” si pour tout compact K et pour tout
ε > 0, il existe K1 compact, K1 ⊂ K, t.q. m(K \ K1 ) ≤ ε et f|K1 ∈ C(K1 , R).

1. On suppose, dans cette question, que f = 1A avec A ∈ B(RN ). Montrer que f est mesurable au sens
de Lusin. [Construire K1 avec K, F et O, où F et O sont donnés par la régularité de m appliquée
à l’ensemble A.]
2. On suppose, dans cette question, que f est étagée (c’est-à-dire f ∈ E(RN , B(RN )). Montrer que f
est mesurable au sens de Lusin.
3. On suppose que f est mesurable (c’est-à-dire f ∈ M(RN , B(RN )). Montrer que f est mesurable au
sens de Lusin. [On rappelle qu’une fonction mesurable est limite simple de fonctions étagées. On
pourra utiliser le théorème d’Egorov, Théorème 3.2, et la question précédente.]

Exercice 3.14 (V.a. mesurable par rapport à une autre v.a.) Corrigé 46 page 318
Dans cet exercice, on démontre le théorème 3.1. Soit X et Y deux variables aléatoires réelles définies sur
un espace de probabilités (Ω, A, P ). On veut veut montrer que Y est mesurable par rapport à la tribu
engendrée par X (notée τ (X) si et seulement si il existe une fonction borélienne f de R dans R telle que
Y = f (X) (c’est-à-dire , plus précisément, que Y = f ◦ X).

1. Montrer que si Y est de la forme Y = f (X) où f est une fonction borélienne de R dans R, alors Y
est τ (X)-mesurable.

On suppose maintenant que Y est τ (X)-mesurable.

2. On suppose, dans cette question, qu’il existe une suite de réels (aj ) tels que aj 6= ak pour j 6= k et
une suite d’événements (Aj ) disjoints deux à deux tels que
X
Y = aj 1Aj .
j

On suppose aussi que ∪j Aj = Ω. Montrer que, pour tout j, Aj ∈ τ (X) et qu’il existe une fonction
borélienne f : R → R telle que Y = f (X).
1
3. Soit n un entier. On définit la fonction φn : R → R par: φn (x) = n [nx] où [·] désigne la partie
entière. ([x] est le plus grand entier inférieur ou égal à x.)

(a) Montrer que, pour tout x ∈ R, φn (x) converge vers x, quand n → ∞.


(b) On pose Yn = φn (Y ). Montrer que Yn est τ (X) mesurable.

4. Terminer la preuve du théorème.


Maintenant, on se demande dans quelle mesure la fonction f est unique. On note PX la loi de X.

67
5. Soit f et g deux fonctions boréliennes t.q. Y = f (X) = g(X). Montrer que

PX (f = g) = 1.

Exercice 3.15 (Composition de v.a.) Corrigé 47 page 320


Soit (Ω, A, P ) un espace probabilisé. Soit N une variable aléatoire à valeurs dans N? et (Yn )n∈N une suite
de variables alélatoires réelles. (c’est-à-dire à valeurs dans R, muni de la tribu des boréliens). On définit
Z par
∀ω ∈ Ω , Z(ω) = YN (ω) (ω).
Montrer que Z est une variable aléatoire.

Exercice 3.16 (Evénements, tribus et v.a. indépendantes) Corrigé 48 page 320


Soit (E, A, P ) un espace probabilisé.

1. (Indépendance de 2 évènements) Soit A1 , A2 ∈ A. Montrer que A1 et A2 sont indépendants (c’est-à-


dire P (A1 ∩A2 ) = P (A1 )P (A2 )) si et seulement si les tribus τ ({A1 }) et τ ({A2 }) sont indépendantes
(c’est-à-dire P (B1 ∩ B2 ) = P (B1 )P (B2 ) pour tout B1 ∈ τ ({A1 }) et B2 ∈ τ ({A2 })).
2. (Indépendance de n évènements, n ≥Q2) Soit n ≥ 2, A1 , . . . , An ∈ A. Montrer que les événements
A1 , . . . , An vérifient “P (∩i∈I Ai ) = i∈I P (Ai ) pour tout I ⊂ {1, . . . , n}”Q si et seulement si les
n
tribus τ ({A1 }), . . . , τ ({An }) sont indépendantes (c’est-à-dire P (∩ni=1 Bi ) = i=1 P (Bi ) pour tout
Bi ∈ τ ({Ai }), i ∈ {1, . . . , n}).
3. En donnant un exemple (avec n ≥ 3), montrer que l’on peut avoir n évévements, notés A1 , . . . , An ,
indépendants deux à deux, sans que les événements A1 , . . . , An soient indépendants.

4. Soit A ∈ A.

(a) On suppose que A ∈ A1 et A ∈ A2 et que A1 et A2 sont deux tribus indépendantes (et


contenues dans A). Montrer que P (A) ∈ {0, 1}.
(b) Montrer que P (A) ∈ {0, 1} si et seulement si A est indépendant de tous les éléments de A.

5. Soit n ≥ 1 et A1 , . . . , An ∈ A. Montrer que les événements A1 , . . . , An sont indépendants si et


seulement si les v.a. 1A1 , . . . , 1An sont indépendantes.

Exercice 3.17 (Indépendance 3 par 3 et dépendance globale)


Trouver un espace de probabilités et 4 v.a.r. prenant leurs valeurs dans {−1, 1} t.q. les 4 v.a. soient
3 par 3 indépendantes mais ne soient pas indépendantes. [On pourra considérer des produits de v.a.
indépendantes.]

Exercice 3.18 (Transformation d’une v.a.r. de loi uniforme en une v.a.r. de loi donnée)
Soit (E, A, P ) un espace de probabilités, X une v.a.r. et U une v.a.r. de loi U([0, 1]), Soit F la fonction
de répartition de X (i. e. F (x) = P (X ≤ x) pour x ∈ R). On définit G de R dans R de la manière
suivante :
G(u) = inf{x ∈ R; F (x) ≥ u}, si u ∈]0, 1[,
G(u) = 0, si u 6∈]0, 1[.
Montrer que la v.a.r. Y = G(U ) a la même loi que X. [On pourra montrer que P (G(U ) ≤ x) = P (U ≤
F (x)), pour tout x ∈ R.]

68
Exercice 3.19 (Limite croissante d’une suite de v.a.r.)
Soit (E, A, P ) un espace de probabilités, Y une v.a.r., (Xn )n∈N une suite de v.a.r. et X une application
de E dans R. On suppose que Xn ↑ X, quand n → ∞, et que Xn et Y sont indépendantes, pour tout
n ∈ N. Montrer que X est une v.a.r. et que X et Y sont indépendantes. (N.B. La conclusion est encore
vraie sans la croissance de la suite Xn .)

Exercice 3.20 (Construction de v.a. indépendantes de lois uniformes sur un intervalle)


Soit (E, A, P ) un espace de probabilités.
1. Soit (Un )P
n∈N? , une suite de v.a.r.i.i.d. avec P (Un = 0) = P (Un = 1) = 1/2. Montrer que V , définie
par V = n≥1 Un 2−n est une v.a. de loi U([0, 1]).
2. Soit Un,k , n, k ≥ 1, des P
v.a.r.i.i.d. avec P (Un,k = 0) = P (Un,k = 1) = 1/2. Montrer les v. a. Vn ,
n ≥ 1 définies par Vn = k≥1 Un,k 2−k sont des v.a.r.i.i.d. de loi U([0, 1]).

Exercice 3.21 (Loi du “produit de la loi exponentielle par ±1”)


Soit (Ω, A, P ) un espace probabilisé et X, Y deux v.a.r. indépendantes. On suppose que X suit une loi
exponentielle de paramètre λ (avec λ > 0), c’est-à-dire que PX est une mesure de densité par rapport à
la mesure de Lebesgue et cette densité est la fonction f définie par f (x) = λ exp(−λx)1]0,+∞[ (x) pour
x ∈ R. On suppose que Y est t. q. P (Y = 1) = P (Y = −1) = 1/2. Donner la loi de XY .

Exercice 3.22 (Convergence en mesure) (??)Corrigé 49 page 323


Soient (E, T, m) un espace mesuré, (fn )n∈N une suite de fonctions mesurables de E dans R.

1. Montrer que si il existe f et g fonctions mesurables de E dans R telles que (fn )n∈N converge en
mesure vers f et g, alors f = g p.p..
[On pourra commencer par montrer que, pour tout δ > 0, m({x ∈ E ; |f (x) − g(x)| > δ}) = 0].
2. Montrer que si (fn )n∈N ⊂ M converge en mesure vers f ∈ M et (gn )n∈N ⊂ M converge en mesure
vers g ∈ M, alors (fn + gn )n∈N ⊂ M converge en mesure vers f + g ∈ M.
3. On suppose maintenant que m est une mesure finie. Montrer que si (fn )n∈N ⊂ M converge en
mesure vers f ∈ M et (gn )n∈N ⊂ M converge en mesure vers g, alors (fn gn )n∈N ⊂ M converge en
mesure vers f g ∈ M.
[On pourra commencer par montrer que, si (fn )n∈N ⊂ M converge en mesure vers f ∈ M, alors,
pour tout ε > 0, il existe n0 et k0 ∈ N tels que, si n ≥ n0 et k ≥ k0 , on a m({x ∈ E ; |fn (x)| ≥
k}) ≤ ε]. Donner un contre-exemple au résultat précédent lorsque m(E) = ∞.

Exercice 3.23 (Convergence presque uniforme et convergence p.p.) Corrigé 50 page 325
Soient (E, T, m) un espace mesuré, (fn )n∈N ⊂ M (c’est-à-dire une suite de fonctions mesurables de E
dans R) et f ∈ M. On suppose que fn → f presque uniformément (c’est à dire que pour tout ε > 0 il
existe A ∈ T t.q. m(A) ≤ ε et fn → f uniformément sur Ac ). Montrer que fn → f p.p., quand n → ∞.

Exercice 3.24 (Théorème d’Egorov) (??) Corrigé 51 page 325


Soient (E, T, m) un espace mesuré fini, (fn )n∈N une suite de fonctions mesurables de E dans R, et f une
fonction mesurable de E dans R. On suppose que fn → f p.p., lorsque n → +∞.
Pour j ∈ N? et n ∈ N, on définit :
1 [
An,j = {x ; |f (x) − fn (x)| ≥ }, et Bn,j = Ap,j (3.8)
j
p≥n

69
1. Montrer que à j fixé, lim m(Bn,j ) = 0.
n→+∞

2. Montrer que, pour tout ε > 0, il existe A tel que m(A) ≤ ε et fn → f uniformément sur Ac lorsque
n → +∞. En déduire le théorème d’Egorov (théorème 3.2).
[
[On cherchera A sous la forme : Bnj ,j , avec un choix judicieux de nj .]
j∈N?

3. Montrer, par un contre exemple, qu’on ne peut pas prendre ε = 0 dans la question précédente.
4. Montrer, par un contre exemple, que le résultat du théorème d’Egorov est faux lorsque m(E) = +∞.

Exercice 3.25 (Convergence en mesure et convergence p.p.) Corrigé 52 page 327


Soient (E, T, m) un espace mesuré, (fn )n∈N une suite de fonctions mesurables de E dans R, et f une
fonction mesurable de E dans R. On rappelle que, par définition, la suite (fn )n∈N converge en mesure
vers f si :

∀ ε > 0, lim m({x ∈ E; |fn (x) − f (x)| > ε}) = 0. (3.9)


n→+∞

1. On suppose ici que m(E) < +∞.

(a) Montrer que si (fn )n∈N tend vers f presque partout, alors (fn )n∈N tend vers f en mesure
[Utiliser le théorème d’Egorov.]
(b) (Question plus difficile.) Montrer par un contrexemple que la réciproque de la question précé-
dente est fausse.

2. Soit (fn )n∈N une suite de fonctions mesurables de E dans R. On dit que (fn )n∈N est de Cauchy en
mesure si :

∀ ε > 0, ∀δ > 0, ∃n ∈ N; p, q ≥ n ⇒ m({x ∈ E; |fp (x) − fq (x)| > ε}) ≤ δ. (3.10)

Montrer que si la suite (fn )n∈N converge en mesure vers f , alors (fn )n∈N est de Cauchy en mesure.
3. Soit (fn )n∈N une suite de Cauchy en mesure ; montrer qu’il existe une fonction mesurable g et
une sous-suite (fnk )k∈N , telles que pour tout ε > 0, il existe A ∈ T vérifiant m(A) ≤ ε et tel que
(fnk )k∈N converge uniformément vers g sur Ac . [On pourra construire la sous-suite (fnk )k∈N de
telle sorte que m(Ak ) ≤ 2−k , avec Ak = {x ∈ E; |fnk+1 (x) − fnk (x)| > 2−k }, et chercher A sous la
[
forme Ak , où p est convenablement choisi.]
k≥p

4. Montrer que si (fn )n∈N converge en mesure vers f , il existe une sous-suite qui converge vers f
presque partout. [On pourra commencer par montrer que la suite (fnk )k∈N construite à la question
précédente converge presque partout et en mesure.]

Exercice 3.26
Soient (E, T, m) un espace mesuré fini. On pose, pour f et g fonctions mesurables de E dans R (c’est-à-
dire f, g ∈ M) :
|f − g|
Z
d(f, g) = dm.
1 + |f − g|

70
|f −g| 1
1. Montrer que d est bien définie et prend ses valeurs dans R+ (c’est-à-dire que 1+|f −g| ∈ LR (E, T, m)
pour tout f, g ∈ M) et que d est une semi-distance sur M (c’est-à-dire que d(f, g) = d(g, f ), pour
tout f, g ∈ M, et que d(f, h) ≤ d(f, g) + d(g, h), pour tout f, g, h ∈ M).
2. Soient (fn )n∈N ⊂ M et f ⊂ M. Montrer que fn converge en mesure vers f lorsque n → +∞ si et
seulement si lim d(fn , f ) = 0. [Il est probablement utile de considérer, pour ε > 0, les ensembles
n→+∞
An = {x ∈ E; |fn (x) − f (x)| > ε}.]

Exercice 3.27 (Mesurabilité d’une limite p.p.)


Soient (E, T, m) un espace mesuré, (fn )n∈N ⊂ M(E, T ) et f : E → R. On suppose que fn → f p.p..
Montrer que f ∈ M(E, T ), où (E, T , m) est le compété de (E, T, m) (voir le théorème 2.1). En donnant
un exemple (c’est-à-dire en choisissant convenablement (E, T, m), (fn )n∈N et f ), montrer qu’on peut avoir
f 6∈ M(E, T ).

Exercice 3.28 (Essentiellement uniforme versus presque uniforme) Corrigé 53 page 328
Soit (E, T, m) un espace mesuré. Pour f ∈ M, on pose Af = {C ∈ R, |f | ≤ C p.p.}. Si Af 6= ∅, on pose
kf k∞ = inf Af . Si Af = ∅, on pose kf k∞ = ∞.

1. Soit f ∈ M t.q. Af 6= ∅. Montrer que kf k∞ ∈ Af .

2. Soient (fn )n∈N ⊂ M et f ∈ M.


(a) On suppose, dans cette question, que kfn − f k∞ → 0 quand n → ∞ (on dit que fn → f
essentiellement uniformément). Montrer que fn → f presque uniformément.
(b) En donnant un exemple (c’est-à-dire en choisissant convenablement (E, T, m), (fn )n∈N et f ),
montrer qu’on peut avoir fn → f presque uniformément, quand n → ∞, et kfn − f k∞ 6→ 0.

Exercice 3.29
Soit A la classe des sous-ensembles de Z tels que

pour n > 0, 2n ∈ A ⇐⇒ 2n + 1 ∈ A.

1. Montrer que A est une tribu.


2. Montrer que l’application ϕ : n 7→ n + 2 est une bijection de Z dans Z, mesurable quand Z est
muni (au départ et à l’arrivée) de la tribu A (c’est à dire t.q. que ϕ−1 (A) ∈ A pour tout A ∈ A).
Montrer que l’inverse de ϕ n’est pas mesurable.

Exercice 3.30
On considère des applications f de E dans R. On note σ(f ) = {f −1 (A), A ∈ B(R)} (σ(f ) est la tribu
image réciproque de B(R) par f ).

1. Décrire σ(f ) dans chacun des cas suivants:

(a) E = R et f (x) = x ou f (x) = x2 ou f (x) = |x|.


(b) E = R2 et f (x, y) = x + y.

2. Montrer que les singletons sont tous dans σ(f ) si et seulement si f est injective.

71
3. Dans le cas général, montrer qu’une fonction g de E dans R est σ(f )-mesurable si et seulement si
il existe une fonction borélienne ϕ de R dans R t.q. g = ϕ ◦ f . [On pourra commencer par le cas
où g est étagée, puis utiliser un argument de limite].
4. Montrer que l’on a toujours une fonction bornée g t.q. σ(g) = σ(f ).

Exercice 3.31 (Mesurabilité des troncatures) Corrigé 54 page 329


Soit (X, T ) un espace mesurable et f une fonction mesurable de X dans R (R est muni, comme toujours
quand on ne le précise pas, de la tribu borélienne). Pour a > 0, on définit la fonction “tronquée” :

 a si f (x) > a
fa (x) = f (x) si |f (x)| ≤ a
−a si f (x) < −a

Montrer que fa est mesurable.

Exercice 3.32
Soit (E, T ) un espace mesurable (on munit R de la tribu des boréliens B(R), comme toujours). Soient
(fn )n∈N une suite de fonctions mesurables de E dans R, et A l’ensemble des points x ∈ E tels que
(fn (x))n∈N ne soit pas de Cauchy. Montrer que A est mesurable (i.e. A ∈ T ).

Exercice 3.33
Soit ϕ : R2 → R B(R2 )-mesurable. Pour x ∈ R, on pose : fϕ (x) = ϕ(x, x).

1. Montrer que fϕ est B(R)-mesurable.


2. Soient ϕ et ψ : R2 → R B(R2 )-mesurables. Montrer que ϕ = ψ λ2 -p.p. 6⇒ fϕ = fψ λ-p.p.. (λ2 est
la mesure de Lebesgue sur B(R2 ) dont on suppose l’existence).
3. Soient ϕ et ψ : R2 → R B(R2 )-mesurables t.q. :

(a) ϕ(x, .) et ψ(x, .) sont continues p.p. en x ∈ R


(b) ϕ(, .y) et ψ(., y) sont mesurables pour tout y ∈ R

(Ces fonctions sont dites de “Carathéodory”.)


(a) Montrer que ϕ et ψ sont B(R2 )-mesurables.
(b) Montrer que ϕ = ψ λ2 -p.p. ⇒ ϕ(x, .) = ψ(x, .) partout, p.p. en x ∈ R. En déduire que si
ϕ = ψ λ2 -p.p, alors fϕ = fψ λ-p.p..

Exercice 3.34 (Exemple de tribu engendrée)


Dans cet exercice, on s’intéresse à la tribu τ (X) engendrée par la variable aléatoire X définie sur Ω, muni
de la tribu A, à valeurs dans R, muni de la tribu borélienne.

1. (Cas d’un lancer de dé) Dans cette question, Ω = {1, 2, 3, 4, 5, 6}, A = P(Ω)) et X est la variable
aléatoire définie par X(ω) = 1 lorsque ω est pair, X(ω) = 0 sinon. Montrer que τ (X) est formé de
4 éléments.
2. (Cas de n tirages à pile ou face) Soit n ∈ N? , Ω = {0, 1}n , A = P(Ω)) et k ∈ {1, · · · , n}. La variable
aléatoire X représente le k-ième tirage, X est donc l’application ω = (ω1 , · · · , ωn ) 7→ ωk . Montrer
que τ (X) est ici aussi formé de 4 éléments.

72
3. Dans cette question, on prend Ω = R, A = B(R) et, pour tout ω ∈ Ω, X(ω) = ω − [ω], où [ω]
désigne la partie entière de ω (c’est-à-dire [ω] = max{n ∈ Z, t.q. n ≤ ω}. Si C est un borélien inclus
dans [0, 1[ (ce qui est équivalent à dire C ∈ B([0, 1[)), on pose ϕ(C) = ∪k∈Z Ck , avec Ck = {x + k,
x ∈ C}. Montrer que τ (X) = {ϕ(C), C ∈ B([0, 1[)}.

Exercice 3.35 (Tribu et partition)


Soit Ω un ensemble. On appelle partition de Ω une famille finie ou dénombrable de parties non vides
de Ω et disjointes deux à deux et dont l’union est égale à Ω. Les éléments d’une partition sont appelés
atomes.

1. Soit a = {Ai ; i ∈ I} une partition de Ω et soit τ (a) la tribu engendrée par a. Montrer que
[
τ (a) = { Aj où J ⊂ I} .
j∈J

En déduire qu’une v.a. réelle est τ (a)-mesurable si et seulement si elle est constante sur tous les
atomes de a.
Une partition a est dite plus fine qu’une partition b si tous les atomes de b s’écrivent comme union
d’atomes de a.

2. Montrer que si a est plus fine que b et si b est plus fine que a alors a et b sont égales.
3. Montrer que si a et b sont deux partitions telles que τ (a) = τ (b) alors a et b sont égales.

Exercice 3.36 (Fonctions constantes)


Soit (Ω, A, P ) un espace de probabilité et X une variable aléatoire (réelle). Pour a ∈ R, on pose ϕ(a) =
P (X −1 (] − ∞, a])) (on note souvent X −1 (] − ∞, a]) = {X ≤ a}). La fonction ϕ est donc la fonction de
répartition de la probabilité PX .

1. Montrer que ϕ est une fonction croissante de R dans R et que lima→+∞ ϕ(a) = 1, lima→−∞ ϕ(a) = 0.
On suppose maintenant que, pour tout B ∈ B(R), on a P (X −1 (B)) = 0 ou 1.
2. Montrer qu’il existe α ∈ R t.q. X = α p.s..

73
Chapter 4

Fonctions intégrables

Maintenant qu’on a construit un espace mesuré (E, T, m) (dont un exemple fondamental est (E, T, m) =
(R, B(R), λ), on voudrait généraliser la notion d’intégrale à cet espace, c’est-à-dire introduire une applica-
R
tion qui à f , fonction de E dans R, associe un réel, dépendant de la mesure m, que nous noterons f dm,
tel que:
R
• Si f = 1A , A ∈ T , alors f dm = m(A),
• L’application ainsi définie soit
R linéaire, Rc’est-à-dire que pour toutes fonctions f et g définies de E
dans R, (αf + βg)dm = α f dm + β gdm, ∀ (α, β) ∈ R2 .
R

En fait, on ne peut pas définir une telle application sur toutes les fonctions de E dans R, nous allons la
définir seulement sur les fonctions que nous appellerons “intégrables”.

4.1 Intégrale d’une fonction étagée positive


Soit (E, T, m) un espace mesuré. On rappelle que E+ est l’ensemble des fonctions étagées de E dans
R, ne prenant que des valeurs positives ou nulles. Si f ∈ E+ , f non nulle, le lemme 3.1 nous donne,
en particulier,
Pn l’existence de (ai , Ai )i=1,...,n ⊂ R?+ × T t.q. Ai ∩ Aj = ∅, si i 6= j, i, j ∈ {1, . . . , n},
et f = i=1 ai 1Ai . D’autre part, le lemme Pn 3.2 nous permet d’affirmer que, pour une fonction étagée
positive qu’on écrit sous la forme
Pn : f = i=1 ai 1Ai , où les Ai sont deux à deux disjoints et les ai sont
strictement positifs, la valeur i=1 ai m(Ai ) est indépendante de la décomposition choisie. On peut donc
définir l’intégrale sur E+ de la manière suivante :

Définition 4.1 (Intégrale d’une fonction de E+ ) Soit (E, T, m) un espace mesuré et soit f de E
dans R une fonction étagée positive non nulle (c’est-à-dire f ∈ E+ ). Soient (Ai )i=1,...,n ⊂ T une famille
de parties disjointes
Pn deux à deux (i.e. t.q. Ai ∩ Aj = ∅ si i 6= j) et
R n réels a1 , ...,
R an strictement
Pn positifs
tels que f =R i=1 ai 1Ai . On définit l’intégrale de f , qu’on
R note f dm, par : f dm = i=1 a i m(Ai )
(on a donc f dm ∈ R+ ). D’autre part, si f = 0, on pose f dm = 0.
n
X
Remarque 4.1 En adoptant la convention 0 × +∞ = 0, on peut aussi remarquer que si f = ai 1Ai ∈
i=1
E+ , où la famille (Ai )i=1,...,n ⊂ T est t.q. Ai ∩ Aj = ∅ si i 6= j, et où les réels a1 , ..., an sont supposés

74
positifs seulement, on a encore :
Z n
X
f dm = ai m(Ai ). (4.1)
i=1

Proposition 4.1 (Propriétés de l’intégrale sur E+ ) Soient f et g ∈ E+ , α et β ∈ R?+ , alors :


Z Z Z
• linéarité positive : αf + βg ∈ E+ , et (αf + βg)dm = α f dm +β gdm,
R R
• monotonie : f ≥ g ⇒ f dm ≥ gdm.

Démonstration :
Il est facile de montrer que si f ∈ E+ et α ∈ R?+ on a αf ∈ E+ et αf dm = α f dm. Pour montrer
R R

la linéarité positive, il suffit donc de considérer le cas α = β = 1 et f et g non nulles. Soit donc f,
g ∈ E+ , non nulles. D’après le lemme sur laPdécomposition canonique des fonctions étagées positives
n Pm
non nulles (lemme 3.1), on peut écrire f = i=1 a i 1 Ai
et g = j=1 bj 1Bj avec 0 < a1 < . . . < an ,
Ai 6= ∅ pour tout i, Ai ∩ Aj = ∅ si i 6= j, 0 < b1 < . . . < bm , Bj 6= ∅ pour tout j, BP j ∩ Bi = ∅
n
si j 6= i. En posant a0 = b0 = 0, A0 = (∪ni=1 Ai )c et B0 = (∪nj=1 Bj )c , on a aussi f = i=0 ai 1Ai ,
Pm Pn Pm P
g = j=0 bj 1Bj et on peut écrire f + g = i=0 j=0 (ai + bj )1Ai ∩Bj = (i,j)∈K (ai + bj )1Ai ∩Bj , avec
K = {(i, j) ∈ {0, . . . , n} × {0, . . . , m} \ (0, 0)}.
R P R
On a donc f + g ∈ E+ et (f + g)dm = (i,j)∈K (ai + bj )m(Ai ∩ Bj ). On en déduit (f + g)dm =
Pn Pm Pm Pn Pn Pm
i=1 j=0 ai m(Ai ∩ Bj ) + j=1 i=0 bj m(Ai ∩ Bj ) = i=1 ai m(ARi ) + j=1 bj m(B
R j
) (car (A0 , . . . , An )
R
et (B0 , . . . , Bm ) sont des partitions de E). On a donc bien montré (f + g)dm = f dm + gdm.

Il reste à montrer la monotonie. Soit f, g ∈ E+ t.q. f ≥ g. On a donc f − g ∈ E+ (on rappelle que


E
R est un Respace vectoriel
R sur R, Rvoir la proposition
R 3.1) et donc la linéarité positive nous donne que
f dm = (f − g)dm + gdm ≥ gdm car (f − g)dm ≥ 0.

Remarque 4.2

1. Une conséquence directe de la linéarité positive de l’intégrale sur E+ est que, si f ∈ E+ , pour
Xn
n’importe quelle décomposition de f : f = ai 1Ai ∈ E+ , a1 , ..., an ≥ 0 et (Ai )i=1,...,n ⊂ T (on ne
i=1
suppose plus Ai ∩ Aj = ∅ si i 6= j), on a encore, par linéarité positive :
Z n
X Z n
X
f dm = ai 1Ai = ai m(Ai ), (4.2)
i=1 i=1

en posant ai m(Ai ) = 0 si ai = 0.
2. Une conséquence de la monotonie de l’intégrale sur E+ est que, pour tout f ∈ E+ , on a :
Z Z
f dm = sup{ gdm, g ∈ E+ , g ≤ f }.

75
4.2 Intégrale d’une fonction mesurable positive
On donne maintenant un petit lemme fondamental qui va permettre de définir l’intégrale des fonctions
de M+ .
Lemme 4.1 Soient (E, T, m) un espace mesuré, (fn )n∈N ⊂ E+ , et g ∈ E+ , tels que :
• fn+1 (x) ≥ fn (x), pour tout n ∈ N, et tout x ∈ E,
• lim fn (x) ≥ g(x), pour tout x ∈ E,
n→∞

alors Z Z
lim fn dm ≥ g dm. (4.3)
n→∞
R
Noter que la suite ( fn dm)n∈N est une suite croissante de R+ , donc sa limite existe dans R+ .
Démonstration : Pour x ∈ E, on pose f (x) = limn→+∞ fn (x) (cette limite existe et appartient à R+ ).
Il se peut que f 6∈ E+ , mais on a toujours f ∈ M+ et les hypothèses du lemme donne fn ↑ f quand
n → ∞.
Soit α ∈]0, 1[, on définit, pour n ∈ N :

An = {x ∈ E ; αg(x) ≤ fn (x)}. (4.4)

On a donc An = (fn − αg)−1 ([0, ∞[) ∈ T , An ⊂ An+1 (car fn ≤ fn+1 ) et E = ∪n∈N An . En effet, si
x ∈ E, on distingue 2 cas :

1. Si g(x) = 0, alors x ∈ An pour tout n ∈ N donc x ∈ ∪n∈N An ,


2. Si g(x) > 0, on a alors αg(x) < g(x) ≤ limn→∞ fn (x). Il existe donc nx (dépendant de x) t.q.
x ∈ An pour n ≥ nx . Donc, x ∈ ∪n∈N An .

On a donc bien montré que E = ∪n∈N An . (Comme An ⊂ An+1 , pour tout n ∈ N, on peut aussi remarquer
que la suite de fonctions (αg1An )n∈N converge simplement et en croissant vers la fonction αg.)

On remarque maintenant que αg1An ∈ E+ , fn ∈ E+ et que, grâce à la définition de An , on a αg1An ≤ fn .


La monotonie de l’intégrale sur E+ donne donc :
Z Z
αg1An dm ≤ fn dm. (4.5)

En utilisant la décomposition canonique de g (lemme


Pp 3.1) il existe (bi , Bi )i=1,...,p t.q.P
0 < b1 < . . . < bp ,
p
Bi 6= ∅ pour tout i, Bi ∩ Bj = ∅ si i 6= j et g = i=1 bi 1Bi . On a donc αg1An = i=1 αbi 1Bi ∩An et
donc : Z p
X
αg1An dm = αbi m(Bi ∩ An ).
i=1

Comme ∪n∈N (Bi ∩An ) = Bi ∩(∪n∈N An ) = Bi ∩E = Bi , la continuité croissante de m donne m(Bi ∩An ) →
m(Bi ), quand n → ∞. On en déduit :
Z p
X p
X Z
lim αg1An dm = lim αbi m(Bi ∩ An ) = αbi m(Bi ) = αgdm.
n→∞ n→∞
i=1 i=1

76
On peut donc passer à la limite, quand n → ∞, dans (4.5) et obtenir :
Z Z
αgdm ≤ lim fn dm.
n→∞
R R
Enfin, la linéarité positive de l’intégrale sur E+ donne αgdm = α gdm. On conclut la démonstration
du lemme en faisant tendre α vers 1.

Remarque 4.3 Dans la démonstration précédente, on a besoin de α < 1 pour pouvoir écrire αg(x) ≤
fn (x) pour n ≥ nx , avec nx ∈ N pouvant dépendre de x. Un tel nx pourrait ne pas exister en prenant
α = 1.

Le lemme suivant est une conséquence simple du lemme 4.1.

Lemme 4.2 Soient (E, T, m) un espace mesuré et f ∈ M+ . Soient deux suites (fn )n∈N et (gn )n∈N
d’éléments de E+ convergeant simplement et en croissant vers f . On a alors :
Z Z
lim fn dm = lim gn dm. (4.6)
n→∞ n→∞

Démonstration : R R
Il suffit d’appliquer le lemme 4.1 avecR g = gp , p fixé. OnRobtient gp dm ≤ limn→∞ fn dm. Puis, passant
à la limite quand p → ∞, limp→∞ gp dm ≤ limn→∞ fn dm. On obtient enfin (4.6) en changeant les
rôles de fn et gp .

Le lemme 4.2 permet donc de définir l’intégrale sur M+ de la manière suivante :

Définition 4.2 (Intégrale sur M+ ) Soient (E, T, m) un espace mesuré, et f ∈ M+ . D’après la propo-
sition sur la mesurabilité positive, il existe une suite (fn )n∈N ⊂ E+ telle que fn ↑ f quand n → ∞,
c’est-à-dire :

• Pour tout x ∈ E, fn (x) → f (x), quand n → ∞,


• fn+1 (x) ≥ fn (x), pour tout x ∈ E, et tout n ∈ N.
On définit l’intégrale de f en posant :
Z Z
f dm = lim fn dm (∈ R+ ). (4.7)
n→∞

On a aussi la caractérisation suivante, parfois bien utile, de l’intégrale d’une fonction mesurable positive
à partir d’intégrales de fonctions étagées positives:
R R
Lemme 4.3 Soient (E, T, m) un espace mesuré et f ∈ M+ ; alors f dm = sup{ gdm, g ∈ E+ , g ≤ f }.

77
Démonstration : Soit (fn )n∈N ⊂ E+ telle que fn ↑ f quand n → ∞.
R R
La monotonie de l’intégrale sur E+ donne que fn dm = sup{ gdm, g ∈ E+ , g ≤ fn } (voir la remar-
que 4.2). Comme fn ≤ f , on a donc, pour tout n ∈ N :
Z Z Z
fn dm = sup{ gdm, g ∈ E+ , g ≤ fn } ≤ sup{ gdm, g ∈ E+ , g ≤ f }.
R R R
La définition de f dm donne alors : f dm ≤ sup{ gdm, g ∈ E+ , g ≤ f }.
R
Pour montrer
R l’inégalité
R inverse, soit g ∈ ER+ t.q. g ≤ f . Comme fRn ↑ f , le lemme 4.1 donne gdm ≤
limn→∞ fn dm = f dm. On a donc sup{ gdm, g ∈ E+ , g ≤ f } ≤ f dm.

Proposition 4.2 (Propriétés de l’intégrale sur M+ ) Soient f et g ∈ M+ , α et β ∈ R?+ , alors :


Z Z Z
• linéarité positive : αf + βg ∈ M+ , et (αf + βg)dm = α f dm +β gdm,
R R
• monotonie : f ≥ g ⇒ f dm ≥ gdm.

Démonstration :
La linéarité positive se démontre de manière très simple à partir de la linéarité positive sur E+ (proposition
4.1). et de la définition 4.2.
La monotonie est une conséquence immédiate du lemme 4.3.

Remarque 4.4 (A propos de 0 × ∞ . . .) Soient (E, T, m) un espace mesuré et A ∈ T t.q. m(A) = 0.


On note IA la fonction indicatrice de l’ensemble A. Cette fonction est définie de E dans R+ par :
IA (x) = +∞ si x ∈ A et IA (x) = 0 si x 6∈ A. Cette fonction est souvent notée aussi ∞1A . Il est clair que
IA ∈ M+ et que IA est la limite croissante de la suite R (fn )n∈N ⊂ E+ définie par fn = n1A . On en déduit,
en utilisant la définition de l’intégrale sur M+ , que IA dm = 0.

Une conséquence de cette remarque est le lemme suivant :

Lemme 4.4 Soit (E, T, m) un espace mesuré.


1. Soit f ∈ M+ et A ∈ T . On note f 1A R ∈ M+ la Rfonction définie par f 1A (x) = f (x) si x ∈ A
c
et
R f 1 A (x) = 0 si x ∈ A . On définit A
f dm par f 1A dm. On suppose que m(A) = 0. Alors,
A
f dm = 0.
R R
2. Soit f, g ∈ M+ t.q. f = g p.p.. Alors, f dm = gdm.
R
3. Soit f ∈ M+ t.q. f = 0 p.p.. Alors f dm = 0.

Démonstration :

1. Soit f ∈ M+ et A ∈ T t.q. m(A) = 0. Soit IA la fonction indicatrice deRl’ensemble A (définie dans


la remarque 4.4). On a évidemment f 1A ≤ IA et donc, par monotonie, f 1A dm = 0.

78
2. Soit f, g ∈ M+R t.q. f = gRp.p.. Soit A ∈ T t.q. m(A) = R0 et f 1Ac =R g1Ac . On a donc f 1Ac ,
g1Ac ∈ M+ et f 1Ac dm R = g1RAc dm. D’autreR part, comme
R f 1A dm = g1A dm = 0, on a aussi,
par
R linéarité
R positive f dm = f 1 Ac dm + f 1A dm = f 1Ac dm (et de même pour g). Donc,
f dm = gdm.
R R
3. Soit f ∈ M+ t.q. f = 0 p.p.. Alors f dm = 0dm = 0.

Ce lemme nous permet d’étendre la définition de l’intégrale à certaines fonctions non mesurables :

Définition 4.3 Soit (E, T, m) un espace mesuré et f définie sur Ac , à valeurs dans R (resp. R+ ), avec
A ∈ T , m(A) = 0 (on dit que f est définie p.p., car f n’est pas définie sur A).
1. f est m-mesurable (resp. m-mesurable positive) si il existe g ∈ M (resp. g ∈ M+ ) t.q. f = g p.p..
(c’est-à-dire qu’il existe B ∈ T t.q. m(B) = 0, B ⊃ A et f = g sur B c ).
R R
2. Soit f m-mesurable positive. On pose f dm = gdm, avec g ∈ M+ t.q. f = g p.p. (noter que
cette intégrale ne dépend pas du choix de g, grâce au lemme 4.4).

Remarque 4.5 Soit (E, T, m) un espace mesuré. Il est facile de montrer les résultats suivants :

1. Soit f de E dans R ou R+ . Alors, f ∈ E+ si et seulement si f ∈ M+ , Imf ⊂ R+ et card(Imf ) < ∞.

2. Soit A ∈ T t.q. m(A) = 0 et f de Ac dans R. Alors, f est m-mesurable si et seulement si il existe


(fn )n∈N ⊂ E t.q. fn → f p.p. (voir l’exercice 4.17).
3. Soit A ∈ T t.q. m(A) = 0 et f de Ac dans R+ . Alors, f est m-mesurable positive si et seulement
si il existe (fn )n∈N ⊂ E+ t.q. fn → f p.p..

Le résultat suivant sera souvent utile par la suite. En particulier, les inégalités de Markov et Bienaymé-
Tchebichev (voir la section 4.9) en découlent immédiatement.

Lemme 4.5 Soient (E, T, m) un espace mesuré, f ∈ M+ et t ∈ R?+ ; alors :


Z
1
m({f ≥ t}) ≤ f dm. (4.8)
t

Démonstration : On définit At = {f ≥ t} = {x ∈ E ; f (x) ≥ t}. On a At ∈ T et f ≥ t1At . Par


monotonie de l’intégrale sur M+ , on en déduit l’inégalité 4.8.

4.3 Théorème de convergence monotone et lemme de Fatou


Théorème 4.1 (Convergence Monotone (1)) Soit (E, T, m) un espace mesuré et soit (fn )n∈N ⊂
M+ t.q. fn+1 (x) ≥ fn (x), pour toutZ n ∈ N et Ztout x ∈ E. On pose, pour tout x ∈ E, f (x) =
lim fn (x) ∈ R+ . Alors f ∈ M+ et : fn dm → f dm lorsque n → +∞.
n→+∞

79
Démonstration : R R
Noter que si (fn )n∈N ∈ E+ , le fait que fn dm → f dm, lorsque n → +∞, est donné par la définition de
l’intégrale sur M+ . La difficulté est donc ici de travailler avec (fn )n∈N ∈ M+ au lieu de (fn )n∈N ∈ E+ .

Comme (fn )n∈N ⊂ M+ converge simplement et en croissant vers f , la proposition 3.5 donne f ∈ M+ .
Puis, par monotonie de l’intégrale sur M+ , on a
Z Z
lim fn dm ≤ f dm. (4.9)
n→+∞

Il reste donc à montrer que :


Z Z
lim fn dm ≥ f dm. (4.10)
n→+∞

Pour montrer (4.10), on va construire une suite de fonctions (gp )p∈N ⊂ E+ t.q gp ↑ f , quand p → ∞, et
gp ≤ fp , pour tout p ∈ N.

Pour tout n ∈ N, fn ∈ M+ ; il existe une suite de fonctions (fn,p )p∈N ⊂ E+ t.q. fn,p ↑ fn lorsque p tend
vers +∞. On définit alors :
gp = sup fn,p (4.11)
n≤p

On note que :

1. gp ∈ E+ car gp est le sup d’un nombre fini d’éléments de E+ (donc gp est mesurable, Im(gp ) ⊂ R+
et card(Im(gp )) < ∞, ce qui donne gp ∈ E+ ).

2. gp+1 ≥ gp , pour tout p ∈ N. En effet, comme fn,p+1 ≥ fn,p (pour tout n et p), on a

gp+1 = sup{fp+1,p+1 , sup fn,p+1 } ≥ sup fn,p+1 ≥ sup fn,p = gp .


n≤p n≤p n≤p

On peut donc définir, pour x ∈ E, g(x) = limp→∞ gp (x) ∈ R+ (car la suite (gp (x))p∈N est croissante
dans R+ ).

3. g = f . En effet, on remarque que gp ≥ fn,p si n ≤ p. On fixe n et on fait tendre p vers l’infini,


on obtient g ≥ fn pour tout n ∈ N. En faisant n → ∞ on en déduit g ≥ f . D’autre part, on a
fn,p ≤ fn ≤ f pour tout n et tout p. On a donc gp ≤ f pour tout p. En faisant p → ∞ on en
déduit g ≤ f . On a bien montré que f = g.

4. gp ≤ fp pour tout p ∈ N. En effet, fn,p ≤ fn ≤ fp si n ≤ p. On a donc gp = supn≤p fn,p ≤ fp .

Les points 1 à 3Rci dessus donnentR(gp )p∈N ∈ E+ et gp ↑ f quand p → ∞. Donc, la définition de l’intégrale
sur M+ donne f dm = limp→∞ gp dm.
R R R
Le pointR 4 donne (par monotonie
R de l’intégrale sur M+ ) gp dm ≤ fp dm, on en déduit f dm =
limp→∞ gp dm ≤ limp→∞ fp dm.
R R
Finalement, on obtient bien f dm = limp→∞ fp dm.

On utilisera souvent une légère extension (facile) du théorème de convergence monotone :

80
Théorème 4.2 (Convergence Monotone (2)) Soit (E, T, m) un espace mesuré et soit (fn )n∈N ⊂
M+ . On suppose que fn ↑ f p.p. (c’est-à-dire que il existe A ∈ T t.q. m(A) = 0 et fn (x) ↑ f (x)
pour tout x ∈ Ac ). La fonction
Z f (définieZ p.p.) est alors m−mesurable positive (c’est-à-dire que il existe
g ∈ M+ t.q. f = g p.p.) et fn dm → f dm. On rappelle que, par définition (voir la définition 4.3),
R R
f dm = gdm avec g ∈ M+ t.q. f = g p.p..

Démonstration :
Soit A ∈ T t.q. m(A) = 0 et fn ↑ f sur Ac , quand n → ∞. On pose gn = fn 1Ac (c’est-à-dire gn (x) = fn (x)
si x ∈ Ac et gn (x) = 0 si x ∈ A). On a gn ∈ M+ et gn ↑ g avec g = f 1Ac (c’est-à-dire g(x) = f (x) si
x ∈ Ac et g(x) = 0 siRx ∈ A). Comme
R g ∈ M+ et f = g p.p., on a donc f Rm−mesurable
R positive. Puis, le
théorèmeR 4.1 donne
R gn dm → gdm quand R n → ∞. D’autre part, on a gn dm = fn dm (car fn = gn
p.p.) et gdm = f dm (par définition de f dm), donc
Z Z
fn dm → f dm.

Corollaire 4.1 (Séries à termes positifs ou nuls) Soient (E, T, m) un espace mesuré, (fn )n∈N ⊂
+∞
X Z +∞ Z
X
M+ ; on pose, pour tout x ∈ E, f (x) = fn (x)(∈ R+ ). Alors f ∈ M+ et f dm = fn dm.
n=0 n=0

Démonstration : On applique le théorème de convergence monotone (théorème 4.1) à la suite (gn )n∈N
définie par
Xn
gn = fp .
p=0

On a gn ∈ M+ et gn ↑ f . Donc f ∈ M+ et
n Z
X Z Z
fp dm = gn dm → f dm.
p=0

Lemme 4.6 (Fatou) Soient (E, T, m) un espace mesuré, (fn )n∈N ⊂ M+ . On pose pour tout x ∈ E :
f (x) = lim inf fn (x) = lim ( inf fp (x)) ∈ R+ . Alors f ∈ M+ et :
n→+∞ n→+∞ p≥n
Z Z Z
f dm ≤ lim inf fn dm = lim ( inf fp dm). (4.12)
n→+∞ n→+∞ p≥n

Démonstration : Pour n ∈ N, on pose gn (x) = inf p≥n fp (x) (pour tout x ∈ E), de sorte que gn ∈ M+
R 3.5) et gn ↑ f . Le théorème de convergence monotone (théorème 4.1) donne que f ∈ M+
(cf.R proposition
et gn dm → f dm.
R R R R
Or, gn ≤ fp si p ≥ n. On a donc gn dm ≤ fp dm si p ≥ n et donc (en fixant n) gn dm ≤ inf p≥n fp dm.
On en déduit Z Z Z Z
f dm = lim gn dm ≤ lim ( inf fp dm) = lim inf fn dm.
n→∞ n→∞ p≥n n→∞

81
R
Le lemme de Fatou est souvent utilisé avec des suites (fn )n∈N ⊂ M+ telles que la suite ( fn dm)n∈N est
bornée et la suite (fn (x))n∈N est convergente pour presque tout x ∈ E. Il permet alors de montrer que la
limite (au sens de la convergence p.p.) de la suite (fn )n∈N est “intégrable” (voir les paragraphes suivants).
On utilise pour cela le corollaire (immédiat) suivant :
Corollaire 4.2 Soient (E, T, m) un espace mesuré et (fn )n∈N ⊂ZM+ t.q. fn (x) → f (x), pour presque
tout x ∈ E, lorsque n → +∞. On suppose qu’il existe C ≥ 0 t.q. fn dm ≤ C, pour tout n ∈ N. Alors,
Z
f est m−mesurable positive et f dm ≤ C.

Démonstration : Comme (fn )n∈N ∈ M+ et fn → f p.p., on a bien f m−mesurable positive. On pose


g = lim infRn→∞ fn (c’est-à-dire
R g(x) = lim inf n→∞ fn (x) pour tout x ∈ E). On a donc g ∈ M+ et f = g
p.p. donc f dm = gdm par définition de l’intégrale des fonctions m-mesurables (définition 4.3).
R R R R R
Le lemme de Fatou donne f dm = gdm ≤ lim inf n→∞ gn dm et donc f dm ≤ C car gn dm ≤ C
pour tout n ∈ N.

4.4 Mesures et probabilités de densité


4.4.1 Définitions
A partir d’une mesure et d’une fonction mesurable positive, on peut définir une autre mesure de la manière
suivante :
Définition 4.4 (Mesure de densité)
Soient (E, T, m) un espace mesuré et f ∈ M+ . Pour A ∈ T , on rappelle que f 1A est la fonction (de E
dans R+ ) définie
R par f 1AR(x) = f (x) si x ∈ A et f 1A (x) = 0 si x ∈ Ac (cette fonction appartient à M+ )
et on définit A f dm par f 1A dm.
On définit alors µ : T → R+ par :
Z Z
µ(A) = f 1A dm = f dm, ∀A ∈ T. (4.13)
A

L’application µ ainsi définie est une mesure sur T (ceci est démontré dans l’exercice 4.22), appelée mesure
de densité f par rapport à m, et notée µ = f m.
Proposition 4.3 Soient (E, T, m) un espace mesuré, f ∈ M+ et µ la mesure de densité f par rapport
à m. Alors, la mesure µ est absolument continue par rapport à la mesure m, c’est-à-dire que si A ∈ T
est tel que m(A) = 0, alors µ(A) = 0.
R
Démonstration : Soit A ∈ T t.q. m(A) = 0. On a alors f 1A = 0 m-p.p. et donc µ(A) = f 1A dm = 0
d’après le lemme 4.4.

On déduit de cette proposition que la mesure de Dirac définie sur B(R) par :
δ(A) = 1 si 0 ∈ A
(4.14)
δ(A) = 0 si 0 ∈ Ac .

82
n’est pas une mesure de densité par rapport à la mesure de Lebesgue (on peut montrer que ces deux
mesures sont étrangères (voir définition 2.16 et proposition 2.4).
Notons que l’on peut aussi définir des mesures signées de densité, voir la définition 6.15.

4.4.2 Exemples de probabilités de densité


Définition 4.5 (Probabilité de densité) Soit p une probabilité R sur B(R), on dit que
R p est uneRproba-
bilité de densité (par rapport à Lebesgue) s’il existe f ∈ M+ t.q. f dλ = 1 et p(A) = f 1A dλ = A f dλ
pour tout A ∈ B(R).
Les lois de probabilité sur B(R), de densité par rapport à la mesure de Lebesgue, données dans la
proposition suivante seront souvent utilisées dans le calcul des probabilités (On rappelle qu’une loi de
probabilité est, par définition, une probabilité sur B(R)).

Définition 4.6 (Quelques lois de densité sur B(R))


1
1. Loi uniforme, U(a, b) Soit a, b ∈ R, a < b, la loi uniforme sur [a, b] est la loi de densité b−a 1[a,b] :
1
R
p(A) = b−a 1[a,b] 1A dλ, ∀A ∈ T .
2. Loi exponentielle, E(τ ) Soit τ > 0; la loi exponentielle est définie par la densité f définie par :

0 si x < 0
f (x) = (4.15)
τ e−τ x si x ≥ 0

3. Loi de Gauss, N (µ, σ 2 ) Soit (µ, σ) ∈ R × R?+ ; la loi de Gauss de paramètre (µ, σ) est définie par la
densité f définie par :
1 (x − µ)2 
f (x) = √ exp − (4.16)
σ 2π 2σ 2

4.5 L’espace L1 des fonctions intégrables


+ −
R +f ∈ M,R La proposition
Soit R que |f |, f , f ∈ M+ et la monotonie de l’intégrale
R − 3.7 donne sur M+ donne
f dm ≤ |f |dm et f dm ≤ |f |dm. Ceci va nous permette de définir l’espace L1 et l’intégrale sur
L1 à partir de l’intégrale sur M+ (définition 4.2 page 77).

Définition 4.7 (Espace L1 et Intégrale de Lebesgue) Soient (E,ZT, m) un espace mesuré et f ∈


M. On dit que f est intégrable (ou intégrable au sens de Lebesgue) si |f |dm < +∞. Dans ce cas, on
Z Z
a aussi f + dm < +∞ et f − dm < +∞. On pose alors :
Z Z Z
f dm = +
f dm − f − dm (∈ R). (4.17)

On note L1R (E, T, m) (ou plus simplement L1 ) l’ensemble des fonctions intégrables.

l’intégrale sur RM+ donne |f |dm = f + dm + f − dm. On voit


R R R
Soit f ∈ M, la linéarité positive de
donc que f ∈ L1 si et seulement si f + dm < ∞ et f − dm < ∞.
R

Proposition 4.4 (Propriétés de L1 et de l’intégrale sur L1 ) Soit (E, T, m) un espace mesuré. On


a alors :

83
1. L1 est un espace vectoriel sur R.
Z
2. L’application f 7→ f dm est une application linéaire de L1 dans R.
Z Z
3. Monotonie : soient f et g ∈ L1 telles que f ≤ g ; alors f dm ≤ gdm

4. Pour tout f ∈ L1 , | f dm| ≤ |f |dm.


R R

Démonstration :

1. On sait déjà que M est un espace vectoriel sur R (proposition 3.5). Pour montrer que L1 est un
espace vectoriel sur R, il Rsuffit de remarquer,
R en utilisant
R la linéarité
R positive et
R la monotonie de
l’intégrale sur M+ , que |αf |dm = |α| |f |dm et |f + g|dm ≤ |f |dm + |g|dm, pour tout
f, g ∈ M et tout α ∈ R.

2. (a) Soit α ∈ R et f ∈ L1 . On veut montrer que


Z Z
αf dm = α f dm. (4.18)

Cas 1. Si α = 0, (4.18) est bien vraie.


Cas 2. Si α > 0, on remarque que (αf )+ = αfR + et (αf )−R = αf − . En utilisant la linéarité
R positive
+ −
f + dm −
R
de
R − l’intégrale sur
R M + , on en déduit αf dm = (αf ) dm − (αf ) dm = α(
f dm) = α f dm.
Cas 3. Si α < 0, on remarque que (αf )+ = (−α)f − et R(αf )− = R(−α)f + . EnR utilisant la
+ −
linéarité
R positive

Rde l’intégrale
+
R M+ , on en déduit αf dm = (αf ) dm− (αf ) dm =
sur
(−α)( f dm − f dm) = α f dm.
(b) Soit f, g ∈ L1 . On veut montrer que
Z Z Z
(f + g)dm = f dm + gdm.

On utilise les deux décompositions de f + g : f + g = (f + g)+ − (f + g)− = f + − f − + g + − g − .


On en déduit (f + g)+ + f − + g − = (f + g)− + f + + g + . En utilisant la linéarité positive de
l’intégrale sur M+ , on en déduit
Z Z Z Z Z Z
(f + g)+ dm + f − dm + g − dm = (f + g)− dm + f + dm + g + dm.

On en déduit (noter que tous les termes de l’égalité précédente sont dans R+ )
Z Z Z Z Z Z
(f + g)+ dm − (f + g)− dm = f + dm − f − dm + g + dm − g − dm,
R R R
et donc (f + g)dm = f dm + gdm.
Z
On a bien montré que l’application f 7→ f dm est une application linéaire de L1 dans R.

84
3. Soit f, g ∈ L1 t.q. f ≤ g. On remarque que f + − f − ≤ g + − g − , donc f + +Rg − ≤ g + R+ f − . En
utilisant la Rlinéarité positive Ret la monotonie
R + de l’intégrale surR M+ , on en
R déduit fR + dm+ g − dm ≤

R + R − + −
g dm + f dm et donc f dm = f dm − f dm ≤ g dm − g dm = gdm.
4. Soit f ∈ L1 . On a | f dm| = | f + dm − f − dm| ≤ f + dm + f − dm = |f |dm.
R R R R R R

On peut définir sur L1 une semi-norme de la manière suivante :

Définition 4.8 (Semi-norme sur L1 ) Soient (E, T, m) un espace mesuré et f ∈ L1 . On pose :


Z
kf k1 = |f |dm (4.19)

L’application de L1 dans R+ définie par f 7→ kf k1 est une semi-norme sur L1 .

On a bien kf k1 ∈ R+ pour tout f ∈ L1 . Le fait que f 7→ kf k1 est une semi-norme 1


R sur L découleR alors
de Rla partie 1 de la
R démonstration
R de la proposition 4.4, c’est-à-dire du fait que |αf |dm = |α| |f |dm
et |f + g|dm ≤ |f |dm + |g|dm, pour tout f, g ∈ M et tout α ∈ R. Par contre, k · k1 n’est pas une
norme sur L1 car kf k1 = 0 n’entraı̂ne pas f = 0 mais seulement f = 0 p.p., comme cela est démontré à
la proposition 4.5.

Proposition 4.5 Soit (E, T, m) un espace mesuré.


R
1. Soit f ∈ M+ . Alors f dm = 0 si et seulement si f = 0 p.p..
2. Soit f ∈ L1 . Alors kf k1 = 0 si et seulement si f = 0 p.p..
3. Soit f, g ∈ L1 t.q. f = g p.p.. Alors f dm = gdm.
R R

Démonstration :

1. Soit f ∈ M+ .
R R
(a) On suppose que f = 0 p.p. . On a alors f dm = 0dm = 0 (ceci est donné par le troisième
point du lemme 4.4.)
(b) on suppose que f dm = 0. Soit n ∈ N? , le lemmeP4.5 page 79 donne f dm ≥ n1 m({f ≥ n1 }).
R R

On a donc m({f ≥ n1 }) = 0 et m({f > 0}) ≤ n∈N? m({f ≥ n1 }) = 0 (on a utilisé ici la
σ-sous additivité de m). Comme {f = 0}c = {f > 0}, on en déduit f = 0 p.p..

2. Soit f ∈ L1 . La propriété démontrée ci dessus donne kf k1 = 0 si et seulement si |f | = 0 p.p., et


donc kf k1 = 0 si et seulement si f = 0 p.p.
3. Soit f, g ∈ L1 t.q. f = g p.p.. On a | f dm − gdm| = | (f − g)dm| ≤R |f − g|dm
R R R R
R = 0 (On a
utilisé le quatrième point de la proposition 4.4 et |f − g| = 0 p.p.). Donc, f dm = gdm.

La dernière assertion de la proposition précédente nous permettra, dans la prochaine section, de définir
l’intégrale sur un espace appelé L1 .

On conclut cette section par une proposition préliminaire au théorème de convergence dominée.

85
Proposition 4.6 Soit (E, T, m) un espace mesuré. Soit (fn )n∈N ⊂ L1 , f ∈ M et g ∈ L1 t.q. fn → f
1
R quand n R→ ∞, et, pour tout n ∈ N, |fn | ≤ g p.p.. On a alors f ∈ L , kfn − f k1 → 0, quand n → ∞
p.p.,
et fn dm → f dm, quand n → ∞.

Démonstration :
Comme fn → f p.p. quand n → ∞, Il existe A ∈ T t.q. m(A) = 0 et fn (x) → f (x) pour tout x ∈ Ac .
Puis, comme |fn | ≤ g p.p., il existe, pour tout n ∈ N, Bn ∈ T t.q. m(Bn ) = 0 et |fn | ≤ g sur Bnc . On
pose C = A ∪ (∪n∈N Bn ). Par σ-sous additivité de m, on a aussi m(C) = 0. On pose alors hn = fn 1C c ,
h = f 1C c G = g1C c , de sorte que hn = fn p.p., h = f p.p. et G = g p.p.. De plus les fonctions hn , h et
G sont toujours mesurables et donc hn ∈ L1 , h ∈ M et G ∈ L1 .
Comme |hn (x)| ≤ G(x) pour tout x ∈ E (et pour tout n ∈ N) et hn (x) → h(x) pour tout x ∈ E. On a
aussi |h| ≤ G. Ceci montre que h ∈ L1 et donc que f ∈ L1 .
On pose maintenant Fn = 2G − |hn − h|. Comme |hn − h| ≤ 2G, on a Fn ∈ M+ et on peut donc appliquer
le lemme de Fatou (lemme 4.6) à la suite (Fn )n∈N . Comme lim inf n→∞ Fn = 2G, on obtient :
Z Z Z
2Gdm ≤ lim inf (2G − |hn − h|)dm = lim ( inf (2G − |hn − h|)dm). (4.20)
n→∞ n→∞ p≥n

La linéarité de l’intégrale sur L1 donne (2G − |hn − h|)dm = 2Gdm − |hn − h|dm. Donc :
R R R

Z Z Z
inf (2G − |hn − h|)dm = 2Gdm − sup |hn − h|dm
p≥n p≥n

et Z Z Z
lim inf (2G − |hn − h|)dm = 2Gdm − lim sup |hn − h|dm.
n→∞ n→∞
R
L’inégalité 4.20 devient alors (en remarquant que 2Gdm ∈ R) :
Z
lim sup |hn − h|dm ≤ 0.
n→∞

On a donc khn − hk1 → R0 quand n →


R ∞ et, comme hn − h = fn − f p.p., on en déduit kfn − f k1 → 0,
quand n → ∞, et donc fn dm → f dm, quand n → ∞ (grâce au quatrième point de la proposition
4.4).

4.6 L’espace L1
Dans toute cette section, on travaille avec un espace mesuré (E, T, m).
On définit maintenant une relation d’équivalence, notée (= p.p.), sur L1 par :

f (= p.p.) g si f = g p.p.. (4.21)

Définition 4.9 (L1 ) L’ensemble L1 = L1R (E, T, m) est l’ensemble des classes d’équivalence de la relation
(= p.p.) définie sur L1 , i.e. L1 = L1 /(= p.p.).

Dans la suite, L1 désigne L1R (E, T, m) et L1 désigne L1R (E, T, m).

86
Remarque 4.6

1. Un élément de L1 est donc une partie de L1 .


2. Si f ∈ L1 , on note f˜ = {g ∈ L1 ; g = f p.p.}. f˜ est donc un élément de L1 , c’est l’élément de L1
auquel f appartient (on l’appelle la classe de f ).

Définition 4.10 (Structure vectorielle sur L1 ) On munit L1 d’une structure vectorielle (faisant de
L1 un espace vectoriel sur R)
1. Soient F ∈ L1 et α ∈ R. On choisit f ∈ F et on pose αF = {g ∈ L1 ; g = αf p.p.}.
2. Soient F, G ∈ L1 . On choisit f ∈ F , g ∈ G et on pose F + G = {h ∈ L1 ; h = f + g p.p.}.

La définition précédente est bien cohérente. En effet αF (qui est la classe de αf ) ne dépend pas du choix
de f dans F car f = f1 p.p. implique αf = αf1 p.p.. De même F + G (qui est la classe de f + g) ne
dépend pas du choix de f dans F et du choix de g dans G car f = f1 p.p. et g = g1 p.p. implique
f + g = f1 + g1 p.p..

Définition 4.11 (Intégrale sur L1 ) Soit F ∈ L1 et f ∈ F (on dit que f est un représentant de la
classe F , noter que f ∈ L1 ). On pose :
Z Z
F dm = f dm. (4.22)
R
Ici aussi cette définition est bien cohérente car F dm ne dépend pas du choix de f dans F , grâce
au troisième point de la proposition 4.5. Le troisième point de la proposition 4.5 nous donne aussi
kf k1 = kgk1 si f, g ∈ L1 et f = g p.p.. Ceci nous permet de définir une norme sur L1 :

Définition 4.12 (Norme sur L1 ) Soit F ∈ L1 . On choisit f ∈ F et on pose kF k1 = kf k1 .

Proposition 4.7 L’application F 7→ kF k1 est une norme sur L1 . L’espace L1 muni de la norme k · k1
est donc un espace vectoriel normé.

Démonstration : Il est facile de vérifier que k · k1 est bien une norme sur R (sachant que c’est déjà
une semi-norme sur L1 ). Le seul point délicat est de remarquer que kF k1 = 0 implique que F = 0 (0
est ici l’élément neutre de L1 , c’est-à-dire {h ∈ L1 ; h = 0 p.p.}). Ceci découle du premier point de la
proposition 4.5.

On montrera plus loin que L1 est complet, c’est donc un espace vectoriel normé complet, c’est-à-dire un
espace de Banach, voir le théorème 4.6 page 92.

On rappelle que si f ∈ L1 , F ∈ L1 et que f ∈ F , on dit que f est un représentant de F . On introduit


maintenant plusieurs notions de convergence dans L1 . Il est facile de vérifier que ces définitions sont
cohérentes, c’est-à-dire qu’elles ne dépendent pas des représentants choisis pour les éléments de L1 .
La notion de convergence simple n’a pas de sens dans L1 , mais la notion de convergence p.p., vue
précédemment, se généralise aux éléments de L1 ainsi que la notion de convergence en mesure.

Définition 4.13 Soit (E, T, m) un espace mesuré.


1. Soient (Fn )n∈N ⊂ L1 et F ∈ L1 . On dit que Fn → F p.p. quand n → ∞ si fn → f p.p., quand
n → ∞, avec fn ∈ Fn et f ∈ F .

87
2. Soient (Fn )n∈N ⊂ L1 et F ∈ L1 . On dit que Fn → F en mesure quand n → ∞ si fn → f en
mesure, quand n → ∞, avec fn ∈ Fn et f ∈ F .
3. Soient (Fn )n∈N ⊂ L1 et F ∈ L1 . On dit que Fn → F dans L1 quand n → ∞ si kFn − F k1 → 0
quand n → ∞. (Ici aussi, noter que kFn − F k1 = kfn − f k1 si fn ∈ Fn et f ∈ F .)

4. Soient F, G ∈ L1 . On dit que F ≥ G p.p. si f ≥ g p.p. avec f ∈ F et g ∈ G.

On peut démontrer (s’inspirer de la démonstration du théorème 4.7 et voir les exercices du chapitre 3)
que si une suite de fonctions de L1 converge en mesure, alors on peut en extraire une sous-suite qui
converge presque partout. Dans le cas où la mesure m est finie, la convergence presque partout entraı̂ne
la convergence en mesure.

Remarque 4.7 Soit (E, T, m) un espace mesuré. Soient F, G ∈ L1 . F = G est donc équivalent à f = g
p.p. si f ∈ F et g ∈ G. En général, on écrira plutôt F = G p.p. au lieu de F = G (voir la remarque 4.9).

Remarque 4.8 Soit (E, T, m) un espace mesuré. Soient (Fn )n∈N ⊂ L1 et f : E → R (ou f : E → R).
On utilisera souvent la notation (légérement incorrecte), “Fn → f p.p. quand n → ∞”. Cette notation
signifie “fn → f p.p. quand n → ∞” en choissisant fn ∈ Fn . Ceci est cohérent car le fait que “fn → f
p.p. quand n → ∞” ne dépend pas du choix de fn dans Fn (voir aussi la remarque 4.9).
En fait, on écrira même souvent “Fn → f p.p. quand n → ∞” (pour une suite (Fn )n∈N ⊂ L1 ) sans
préciser les espaces de départ et d’arrivée pour f . A vrai dire, en choissisant fn ∈ Fn , f est au moins
définie p.p. sur E et le changement du choix de fn dans Fn ne change f que sur un ensemble de mesure
nulle. D’autre part, en l’absence de précision, f sera supposée être à valeurs dans R.

Proposition 4.8 (propriétés de l’intégrale sur L1 ) Soit (E, T, m) un espace mesuré. On a alors :
1. Soit F ∈ L1 . Alors | F dm| ≤ kF k1 .
R

2. F 7→ F dm est une application linéaire continue de L1 dans R.


R

3. Soient F, G ∈ L1 t.q. F ≥ G p.p., alors F dm ≥ Gdm.


R R

Démonstration :

1. Soit F ∈ L1 et f ∈ F , on a | F dm| = | f dm| ≤ kf k1 = kF k1 .


R R

2. La linéarité de l’intégrale sur L1 découle immédiatement de la linéarité de l’intégrale sur L1 (propo-


sition 4.4). La continuité est donné par le premier point ci dessus.
3. La monotonie de l’intégrale sur L1 découle immédiatement de la monotonie de l’intégrale sur L1
(proposition 4.4).

Remarque 4.9 soit (E, T, m) un espace mesuré.


1. On confondra dans la suite un élément F de L1 avec un représentant f de F , c’est-à-dire avec un
élément f ∈ L1 t.q. f ∈ F .

88
2. De manière plus générale, soit A ⊂ E t.q. Ac soit négligeable (c’est-à-dire Ac ⊂ B avec B ∈ T et
m(B) = 0) et soit f : A → R (la fonction f est donc définie p.p.). On dira que f est un élément
de L1 si il existe une fonction g ∈ L1 t.q. f = g p.p.. On confond donc, en fait, la fonction f avec
la classe d’équivalence de g, c’est-à-dire avec g̃ = {h ∈ L1 ; h = g p.p.}. D’ailleurs, cetR ensemble est
aussi égal à {h ∈ L1 ; h = f p.p.}. En confondant ainsi f et g̃ on a donc f dm = gdm. Noter
R

également que f est m-mesurable (voir la définition 4.3 page 79).


3. Avec la confusion décrite ci-dessus, si f et g sont des éléments de L1 , f = g signifie en fait f = g
p.p..

Remarque 4.10 Soient (E, T, m) un espace mesuré, et (E, T , m) son complété (cf définition 2.15 et
exercice 2.15). L’espace L1R (E, T, m) est “identique” à l’espace L1R (E, T , m), il existe une bijection évidente
entre ces deux espaces en remarquant que si f ∈ L1R (E, T , m), alors il existe g ∈ L1R (E, T, m) t.q. f = g
p.p. (voir à ce propos l’exercice 4.9).

Pour montrer qu’une fonction est dans L1 on utilise souvent le lemme de Fatou de la manière suivante
(voir l’exercice 4.27 pour la démonstration, qui est en fait une conséquence facile du lemme de Fatou pour
les fonctions mesurables positives, cf lemme 4.6) :

Lemme 4.7 (Utilisation de Fatou) Soient (E, T, m) un espace mesuré, et (fn )n∈N ⊂ L1R (E, T, m).
On suppose que :
1. fn ≥ 0 p.p., ∀n ∈ N,
R
2. ∃C, fn dm ≤ C, ∀n ∈ N,
3. fn → f p.p., quand n → ∞,

alors f ∈ L1R (E, T, m) (au sens “il existe g ∈ L1R (E, T, m) t.q. f = g p.p.”) et
R
|f |dm ≤ C.

On peut également montrer qu’une fonction est dans L1 en utilisant le théorème de convergence monotone.
Ceci est précisé dans le théorème 4.3 (dit théorème de Beppo-Lévi) (qui donne aussi un résultat de
convergence dans L1 ).

4.7 Théorèmes de convergence dans L1


Nous connaissons à présent trois notions de convergence pour les fonctions de L1 , les notions de con-
vergence presque partout, convergence en mesure et la notion de convergence habituelle dans un espace
normé, c’est-à-dire , ici, la convergence pour la norme L1 . On peut montrer par des contre-exemples que
la convergence presque partout n’entraı̂ne pas la convergence L1 , et que la convergence L1 n’entraı̂ne
pas la convergence presque partout. Pour montrer que la convergence presque partout n’entraı̂ne pas la
convergence L1 , on peut considérer l’espace mesuré (E, T, m) = (R, B(R), λ) et la suite (fn )n∈N ⊂ L1 (R)
définie par : fn (x) = n 1]0, n1 ] . On a évidemment fn → 0 pp, alors que kfn k1 = 1. Pour montrer que la
convergence L1 n’entraı̂ne pas la convergence presque partout, on considère à nouveau l’espace mesuré
(E, T, m) = (R, B(R), λ), et on construit la suite (fn )n∈N ⊂ L1 (R) (dite “bosse glissante”) définie par :
fn+k (x) = 1] k−1 , k ] , pour n = p(p−1)2 , p ∈ N et 1 ≤ k ≤ n. On peut voir facilement que kfn k1 = p1
n n

pour n ∈ [ p(p−1)
2 , p(p+1)
2 [, alors que fn 6→ 0 pp (par contre, on peut noter qu’il est possible d’extraire
de (fn )n∈N une sous-suite qui converge presque partout vers 0). Le théorème de convergence dominée,

89
énoncé ci-après, donne une hypothèse suffisante pour qu’une suite (de fonctions) convergeant presque
partout converge aussi dans L1 .

On rappelle (voir la remarque 4.8) que l’hypothèse “(Fn )n∈N ⊂ L1 et f : E → R t.q. Fn → f p.p.”
signifie simplement que fn → f p.p. en choisissant fn ∈ Fn . Cette définition est bien cohérente car elle
ne dépend pas du choix des fn dans Fn . On rappelle aussi que fn → f p.p. signifie qu’il existe A ∈ T
t.q. m(A) = 0 et fn (x) → f (x) dans R pour tout x ∈ Ac .

4.7.1 Convergence presque partout et convergence dans L1


Le théorème suivant est une conséquence du théorème de convergence monotone et permet de montrer la
convergence dans L1 d’une suite monotone de fonctions convergeant presque partout.
Théorème 4.3 (Beppo-Lévi) Soient (E, T, m) un espace mesuré et (fn )n∈N ⊂ L1R (E, T, m). On sup-
pose que :
1. fn+1 ≥ fn p.p., ∀n ∈ N, [ou fn+1 ≤ fn p.p., ∀n ∈ N],
2. fn → f p.p., quand n → ∞.
On a alors :
1. f ∈ L1R (E, T, m) (au sens “il existe g ∈ L1R (E, T, m) t.q. f = g p.p.”) si et seulement si :
Z
lim fn dm ∈ R.
n→+∞

2. Si f ∈ L1R (E, T, m), alors fn → f dans L1 .


La démonstration de ce théorème fait l’objet de l’exercice 4.28.
Nous allons maintenant voir un résultat fondamental, conséquence du lemme de Fatou, qui permet de
prouver la convergence de suites dans L1 sans hypothèse de convergence monotone.
Théorème 4.4 (Convergence dominée) Soit (E, T, m) un espace mesuré. L’espace L1R (E, T, m) est
noté L1 . Soit (fn )n∈N ⊂ L1 et f une fonction de E dans R telles que :
1. fn → f p.p.
2. ∃F ∈ L1 t.q., pour tout n ∈ N, |fn | ≤ F p.p..
Alors f ∈ L1 (au sens “il existe g ∈ L1R (E, T, m) t.q. Zf = g p.p.”)
Z
1
Z et fn → f dans L (c’est-à-dire
|fn − f |dm → 0 lorsque n → +∞). Ceci donne aussi fn dm → f dm, lorsque n → +∞.

Démonstration :
Ce théorème est essentiellement donné par la proposition 4.6. La différence avec la proposition 4.6 tient
dans le fait que fn et F sont dans L1 au lieu de L1 et que f n’est pas nécessairement mesurable. Il s’agit
toutefois de différences “mineures” comme nous le voyons ci après.
Pour tout n ∈ N, on choisit un représentant de fn , encore noté fn . La première hypothèse du théorème
signifie que fn → f p.p. (voir la remarque 4.8). Il existe donc A ∈ T t.q. m(A) = 0 et fn (x) → f (x),
quand n → ∞, pour tout x ∈ Ac . On remplace alors fn par fn 1Ac , encore noté fn (c’est toujours un
représentant de la même classe d’équivalence car m(A) = 0). On définit aussi g par g = f sur Ac et g = 0
sur A. Enfin, on choisit un représentant de F , encore noté F . On obtient ainsi :

90
1. (fn )n∈N ⊂ L1 ,
2. fn (x) → g(x) pour tout x ∈ E, quand n → ∞,
3. F ∈ L1 et fn ≤ F p.p., pour tout n ∈ N.

Les 2 premiers items donnent aussi g ∈ M (par la proposition 3.5, on utilise ici le fait que fn (x) → f (x)
pour tout x ∈ E et pas seulement pour presque tout x). On
R peut donc R appliquer la proposition 4.6 page
86. Elle donne : g ∈ L1 , kfn − gk1 → 0, quand n → ∞ et fn dm → gdm, quand n → ∞.
Comme g = f p.p., on a donc f ∈ L1 (au sens 1
R g ∈ LRR (E, T, m) t.q. f = g p.p.”). Puis
R “il existe
kfn − f k1 = kfn − gk1 → 0, quand n → ∞, et fn dm → gdm = f dm, quand n → ∞.

4.7.2 Convergence d’une série absolument convergente et conséquences


On va maintenant montrer que l’espace (L1 , k.k1 ) est un espace de Banach, en montrant que toute série
absolument convergente dans L1 (i.e. t.q. la série des normes converge) est convergente dans L1 . On en
déduira aussi un résultat très important (le théorème 4.7) qui permet d’extraire d’une suite convergeant
dans L1 une sous-suite convergeant presque partout. On aura besoin au cours de la démonstration du
petit résultat (démontré dans l’exercice 4.9) suivant :
R
Lemme 4.8 Soient (E, T, m) un espace mesuré et F ∈ M+ . On suppose que F dm < ∞. Alors
F < +∞ p.p. (c’est-à-dire que il existe A ∈ T t.q. m(A) = 0 et F (x) < ∞ pour tout x ∈ Ac ).
1
Théorème 4.5 (Séries
X absolument convergentes dans L ) Soit (E, T, m) un espace mesuré. Soit
1
(fn )n∈N ⊂ L t.q. kfn k1 < +∞ ; alors :
n∈N
Pn
1. ∃F ∈ L1 ; | p=0 fp | ≤ F p.p., pour tout n ∈ N.
2. La série de terme général fn (x) est, pour presque tout x ∈ E, convergente (dans R).
P
On définit f par f (x) = n∈N fn (x) (de sorte que f est définie p.p.).
Pn
3. f ∈ L1 (au sens “il existe g ∈ L1R (E, T, m) t.q. f = g p.p.” ) et p=0 fp → f dans L1 et p.p., quand
n → ∞.

Démonstration :
P
1. On choisit un représentant de fn , encore noté fn , et on pose F (x) = p∈N |fp (x)| ∈ R+ . On a donc
F ∈ M+ et le corollaire 4.1 du théorème de convergence monotone donne
Z XZ X
F dm = |fn |dm = kfn k1 < ∞.
n∈N n∈N

Le lemme 4.8 donne alors F < ∞ p.p., c’est-à-dire il existe A ∈ T t.q. m(A) = 0 et F (x) < ∞
pour tout x ∈ Ac . En remplaçant F par 0 sur A, on a donc F ∈ L1 . (Donc, F ∈ L1 au sens de la
remarque 4.9).
Pn
La définition de F donne immédiatement | p=0 fp | ≤ F p.p., pour tout n ∈ N.

91
2. Pour tout x ∈ Ac , la série de terme général fn (x) est absolument convergente dans R, donc
c
Pn m(A) = 0, f est donc définie p.p. car elle est définie pour x ∈ A par
convergente. Comme
f (x) = limn→∞ p=0 fp (x).
Pn
3. On pose sn = p=0 fp . le premier point donne |sn | ≤ F p.p., pour tout n ∈ N et F ∈ L1 . Le
deuxième point donne sn → f p.p.. On peut donc appliquer le théorème de convergence dominée
(théorème 4.4). Il donne f ∈ L1 et la convergence de la suite (sn )n∈N (vers f ) dans L1 . La
convergence p.p. (vers f ) de la suite (sn )n∈N est donné par le deuxième point.

Théorème 4.6 (Riesz-Fisher) Soit (E, T, m) un espace mesuré. L1 est un espace de Banach, c’est-à-
dire un espace vectoriel normé complet.
Démonstration : On sait déjà que L1 est espace vectoriel normé. Une conséquence du théorème 4.5 est
que, dans L1 , toute série absolument convergente est convergente. Cette propriété est une caractérisation
du fait qu’un espace vectoriel normé est complet. On en déduit donc que (L1 , k.k1 ) est complet et donc
que (L1 , k.k1 ) est un espace de Banach.

Dans la suite L1 sera toujours muni de la norme k · k1 .


Théorème 4.7 (Réciproque partielle du théorème de CD) Soient (fn )n∈N ⊂ L1 et f ∈ L1 telles
que fn → f dans L1 , alors il existe une sous-suite (fnk )k∈N , et F ∈ L1 telles que :
1. fnk → f p.p.,
2. |fnk | ≤ F p.p., pour tout k ∈ N.
Démonstration :En utilisant le fait que (fn )n∈N est une suite de Cauchy dans L1 , on construit par
récurrence une suite (fnk )k∈N telle que nk+1 > nk et si p, q ≥ nk , kfp − fq k1 ≤ 21k . On peut alors
appliquer le théorème 4.5 à la série de terme général gk = fnk+1 − fnk pour conclure.

On donne maintenant le théorème de Vitali, qui donne des conditions nécessaires et suffisantes de con-
vergence dans L1 pour une suite convergeant p.p.. La démonstration de ce théorème ainsi que des petits
résultats préliminaires qu’elle nécessite font l’objet des exercices 4.29 et 4.30.
Proposition 4.9 Soient (E, T, m) un espace mesuré, f ∈ L1R (E, T, m) ; alors :
R
1. ∀ ε > 0, ∃ δ > 0 t.q. ∀A ∈ T, m(A) ≤ δ ⇒ A |f |dm ≤ ε.
R
2. ∀ ε > 0, ∃ C ∈ T t.q. m(C) < +∞ et C c |f |dm ≤ ε.
Théorème 4.8 (Vitali) Soient (E, T, m) un espace mesuré et (fn )n∈N ⊂ L1 = L1R (E, T, m) t.q. fn → f
p.p., f prenant ses valeurs dans R (voir remarque 4.8). Alors, f ∈ L1 et fn → f dans L1 si et seulement
si les deux conditions suivantes sont vérifiées :
Z
1. (Equi-intégrabilité) ∀ε > 0, ∃δ > 0 ; ∀ A ∈ T, ∀ n ∈ N, m(A) ≤ δ ⇒ |fn |dm ≤ ε .
A
Z
2. (“Equi-petitesse à l’infini”) ∀ε > 0, ∃C ∈ T, m(C) < +∞ ; ∀n ∈ N, |fn |dm ≤ ε.
Cc
La démonstration de ce théorème fait l’objet de l’exercice 4.30 ; elle ne nécessite pas le théorème de
convergence dominée : on utilise le théorème d’Egorov (cf théorème 3.2 et exercice 3.24). Le théorème
de convergence dominée peut être vu comme une conséquence du théorème de Vitali (cf exercice 4.30).

92
R
4.8 Continuité et dérivabilité sous le signe
Soient (E, T, m) un espace mesuré, f une fonction de E × R dans R ; à t ∈ R fixé, on définit l’application
f (., t) : E → R, qui à x associe f (x, t). On suppose que l’application f (., t) ainsi définie vérifie l’hypothèse
suivante :
f (., t) ∈ L1 = L1R (E, T, m), ∀t ∈ R, (4.23)
et on note F l’application définie de R dans R par :
Z Z
F (t) = f (., t)dm = f (x, t)dm(x). (4.24)
R
Théorème 4.9 (Continuité sous ) Soient (E, T, m) un espace mesuré, f une fonction de E ×R dans
R vérifiant l’hypothèse (4.23) et t0 ∈ R ; on suppose de plus que :
1. l’application f (x, .), définie pour presque tout x ∈ E par : t 7→ f (x, t), est continue en t0 , pour
presque tout x ∈ E ;

2. ∃ ε > 0 et ∃ G ∈ L1R (E, T, m) tels que |f (., t)| ≤ G p.p., pour tout t ∈]t0 − ε, t0 + ε[.
Z Z
Alors F , définie de R dans R par : F (t) = f (., t)dm = f (x, t)dm(x), est continue en t0 .

Démonstration : Soit (tn )n∈N ⊂]t0 − ε, t0 + ε[, t.q. tn → t0 lorsque n → +∞. Soit fn définie par
fn (x) = f (x, tn ). Comme fn → f (·, t0 ) p.p. et |fn | ≤ G p.p.. On peut appliquer le théorème de
convergence dominée (théorème 4.4) à la suite (fn )n∈N . Il donne F (tn ) → F (t0 ) quand n → ∞.

R
Théorème 4.10 (Dérivabilité sous ) Soient (E, T, m) un espace mesuré, f une fonction de E × R
dans R vérifiant l’hypothèse (4.23) et t0 ∈ R . On suppose de plus qu’il existe ε > 0, A ∈ T et G ∈
L1R (E, T, m) t.q. m(A) = 0 et :

1. L’application t 7→ f (x, t) est dérivable pour tout t ∈]t0 − ε, t0 + ε[ et pour tout x ∈ Ac ;


∂f
2. | (x, t)| ≤ G(x) pour tout t ∈]t0 − ε, t0 + ε[ et pour tout x ∈ Ac .
∂t
Z Z
Alors F , définie de R dans R par : F (t) = f (., t)dm = f (x, t)dm(x), est dérivable en t0 et :
Z
0 ∂f
F (t0 ) = (x, t0 )dm(x). (4.25)
∂t

Démonstration : Soit (tn )n∈N? ⊂]t0 − ε, t0 + ε[, t.q. tn → t0 lorsque n → +∞ et tn 6= t0 pour tout
n ∈ N? . Soit fn définie par
f (x, tn ) − f (x, t0 )
fn (x) = .
tn − t0
La suite (fn )n∈N est dans L1 et on peut lui appliquer le théorème de convergence dominée (théorème
4.4) car fn → ∂f c
∂t (·, t0 ) p.p., quand n → ∞, et, si x ∈ A et n ∈ N, il existe θx,n ∈]0, 1[ t.q. fn (x) =
∂f
∂t (x, θx,n t0 + (1 − θx,n )tn ) (grâce au théorème des accroissements finis) et donc |fn | ≤ G p.p., pour tout

93
n ∈ N. Le théorème 4.4 donne alors ∂f 1
fn dm → ∂f
R R
∂t (·, t0 ) ∈ L et ∂t (·, t0 )dm. Ceci étant vrai pour toute
suite (tn )n∈N ⊂]t0 − ε, t0 + ε[, t.q. tn → t0 lorsque n → +∞ et tn 6= t0 pour tout n ∈ N? , on en déduit
bien que F est dérivable en t0 et :
Z
∂f
F 0 (t0 ) = (x, t0 )dm(x). (4.26)
∂t
.

4.9 Espérance et moments des variables aléatoires


Définition 4.14 (Espérance, moment, variance) Soient (Ω, A, p) un espace probabilisé et X une
variable aléatoire réelle.
1. Si X ≥ 0 (c’est-à-dire X(ω)
R ≥ 0 pour tout ω ∈ Ω), on définit l’espérance E(X) de la variable
aléatoire X par E(X) = X(ω)dp(ω).
2. Si X ∈ L1R (Ω, A, p) (c’est-à-dire E(|X|) < ∞), on définit l’espérance E(X) de la variable aléatoire
X par : Z
E(X) = X(ω)dp(ω).

On définit la variance de X par Var(X) = σ 2 (X) = E((X − E(X))2 ) (avec σ(X) ≥ 0).
3. Pour r ∈ [1, +∞[, le moment d’ordre r de la variable aléatoire X est l’espérance de la variable
aléatoire |X|r .
Définition 4.15 (Covariance) Soient (Ω, A, p) un espace probabilisé et X, Y deux v.a.r. t.q. E(X 2 ) <
∞ et E(Y 2 ) < ∞. On définit la covariance de X et Y par : cov(X, Y ) = E((X − E(X)(Y − E(Y )).
(Remarquer que (X − E(X)(Y − E(Y )) est une v.a.r. intégrable car sa valeur absolue est majorée, par
exemple, par X 2 + Y 2 + E(X)2 + E(Y )2 qui est intégrable.)
On calcule rarement l’espérance d’une v.a. comme intégrale par rapport à la probabilité p ; en effet,
l’espace (Ω, A, p) est souvent mal connu. Le théorème 4.11 montre qu’il suffit en fait de connaı̂tre la loi
de la v.a. X pour calculer son espérance (ou, plus généralement, l’espérance d’une fonction de X). On
se ramène ainsi au calcul d’une intégrale sur R.
Les deux inégalités suivantes découlent immédiatement du lemme 4.5 :
Lemme 4.9 (Inégalité de Markov) Soient (Ω, A, p) un espace probabilisé, X une variable aléatoire
réelle positive sur Ω et λ ∈ R?+ . On suppose que 0 < E(X) < ∞. Alors :
1
p({X ≥ λE(X)}) ≤ .
λ
Démonstration : Il suffit, par exemple, d’appliquer le lemme 4.5 avec f = X et t = λE(X).

Lemme 4.10 (Inégalité de Bienaymé Tchebichev) Soient (Ω, A, p) un espace probabilisé, X une
variable aléatoire réelle sur Ω, intégrable et t.q. sa variance vérifie 0 < σ 2 (X) < +∞, et λ ∈ R?+ . Alors :
1
p({|X − E(X)| ≥ λσ(X)}) ≤ .
λ2

94
Démonstration : Appliquer le lemme 4.5 avec f = |X − E(X)|2 et t = λ2 σ 2 (X).

Soit (Ω, A, p) un espace probabilisé, X une variable aléatoire réelle sur Ω. La loi de X, notée pX est définie
par pX (A) = p(X −1 (A)), pour tout A ∈ B(R)). Ceci est équivalent à dire que pour tout A ∈ B(R), on a,
avec ϕ = 1A :
Z Z
ϕ ◦ X(ω)dp(ω) = ϕ(x)dpX (x). (4.27)
Ω R

On rappelle que ϕ ◦ X est souvent improprement noté ϕ(X), ce qui s’explique par le fait ϕ ◦ X(ω) =
ϕ(X(ω)) pour tout ω ∈ Ω. Le théorème 4.11 montre que cette égalité est vraie pour une large classe
de fonctions boréliennes ϕ de R dans R ou R+ (on rappelle que borélienne signifie mesurable quand les
espaces sont munis de la tribu de Borel).

Théorème 4.11 (Loi image) Soit (Ω, A, p) un espace probabilisé, X une variable aléatoire réelle sur
Ω et pX la loi de la variable aléatoire X. On a alors :
1. L’égalité (4.27) est vraie pour toute fonction ϕ borélienne de R dans R+ et toute fonction borélienne
bornée de R dans R.
2. Soit ϕ une fonction borélienne de R dans R, la fonction ϕ◦X appartient à L1 (Ω, A, p) si et seulement
si ϕ ∈ L1 (R, B(R), pX ). De plus, si ϕ ∈ L1 (R, B(R), pX ), L’égalité (4.27) est vraie.

Démonstration : On remarque que (4.27) est vraie pour tout ϕ = 1A , avec A ∈ B(R) (par définition
de pX ). Par linéarité positive, (4.27) est encore vraie pour tout ϕ borélienne étagée positive de R dans
R. Par convergence monotone, (4.27) est alors vraie pour tout ϕ borélienne de R dans R+ . Ceci donne la
première partie du premier item. En utilisant la décomposition ϕ = ϕ+ −ϕ− , on montre alors le deuxième
item. Enfin, la deuxième partie du premier item vient du fait que ϕ est intégrable pour la probabilité pX
si ϕ est borélienne bornée.

Un produit de v.a.r. intégrables et indépendantes est une v.a.r. intégrable (ce qui est, bien sûr, faux sans
l’hypothèse d’indépendance) et L’espérance de ce produit est égal au produit des espérances. Ce résultat
plus général est donnée dans la proposition suivante.

Proposition 4.10 Soit (Ω, A, p) un espace probabilisé, d > 1 et X1 , . . . , Xd des v.a.r. indépendantes.
1. Soit ϕ1 , . . . , ϕd des fonctions boréliennes de R dans R+ . On a alors :
d
Y n
Y
E( ϕi (Xi )) = E(ϕi (Xi )). (4.28)
i=1 i=1

(En convenant qu’un produit de termes est nul si l’un des termes est nul.)
2. Soit ϕ1 , . . . , ϕd des fonctions boréliennes de R dans R. On suppose que ϕ(Xi ) est intégrable pour
Qd
tout i = 1, . . . , d. La v.a.r. i=1 ϕi (Xi ) est intégrable et l’égalité (4.28) est vraie.
3. Soit ϕ1 , . . . , ϕd des fonctions boréliennes bornées de R dans R. L’égalité (4.28) est vraie.

N.B. Si X1 , . . . , Xd sont des v.a.r., le fait que (4.28) soit vraie pour toute famille ϕ1 , . . . , ϕd de fonctions
boréliennes bornées de R dans R est donc une condition nécessaire et suffisante pour les v.a.r. X1 , . . . , Xd
soient indépendantes.

95
Démonstration : Si ϕ1 , . . . , ϕd sont des fonctions caractéristiques de boréliens de R, l’égalité (4.28)
est une conséquence immédiate de la définition de l’indépendance des Xi (Si ϕi = 1Ai avec Ai ∈ B(R),
on a E(ϕi (Xi )) = P ({Xi ∈ Ai }) = P (Xi−1 (Ai ))). Par linéarité positive, on en déduit que (4.28) est
vraie si les fonctions ϕi sont (boréliennes) étagées positives (c’est-à-dire ϕ ∈ E+ ). Puis, par convergence
monotone, on en déduit le premier item de la proposition (car toute fonction orélienne de R dans R+ est
limite croissante d’éléments de E+ ).

Pour le deuxième item, on utilise (4.28) avec la fonction x 7→ |ϕi (x)| au lieu de la fonction ϕi (pour
Qd
tout i). On montre ainsi que la v.a.r. i=1 ϕi (Xi ) est intégrable. Puis, on montre (4.28) par linéarité

(utilisant ϕi = ϕ+
i − ϕi ).

Le troisième item est conséquence immédiate du deuxième (car si X est une v.a.r. et ϕ est une fonction
borélienne bornée, la v.a.r. ϕ(X) est intégrable).

Une conséquence de la proposition 4.10 est que XY est intégrable et cov(X, Y ) = 0 si X, Y sont deux
v.a.r. intégrables sur un espace probabilisé (Ω, A, p).

Pour montrer que des v.a.r. sont indépendantes, il est parfois utile de savoir qu’il suffit de montrer (4.28)
lorsque les fonctions ϕi sont continues à support compact de R de R. C’est l’objet de la proposition 4.12 qui
se démontre à partir d’un résultat d’unicité (proposition 4.11) sur lequel nous reviendrons au chapitre 5.
On note Cc (R, R) l’ensemble des fonctions continues à support compact de R de R (une fonction ϕ de R
dans R est à support compact si il existe un compact K de R t.q. ϕ = 0 sur K c ).
Proposition 4.11 Soit m et µ deux mesures sur B(R), finies sur les compacts de R. On suppose que :
Z Z
ϕdm = ϕdµ pour tout ϕ ∈ Cc (R, R).

Alors, m = µ.
Démonstration : Puisque m et µ sont des mesures sur B(R), finies sur les compacts, on a bien
Cc (R, R) ⊂ L1R (R, B(R), m) et Cc (R, R) ⊂ L1R (R, B(R), µ). On pose maintenant C = {]a, b[, a, b ∈ R,
a < b} et on commence par montrer que m = µ sur C.
Soit a, b ∈ R, a < b. Il existe une suite (ϕn )n∈N ⊂ Cc (R, R) t.q. ϕn ↑ 1]a,b[ . En effet, il suffit de construire
ϕn , pour n ≥ 2/(b − a), de la manière suivante :
ϕn (x) = 0 si x ≤ a,
ϕn (x) = n(x − a) si a < x < a + n1 ,
ϕn (x) = 1 si a + n1 < x < b − n1 ,
ϕn (x) = −n(x − b) si b − n1 ≤ x ≤ b
ϕn (x) = 0 si b ≤ x.
R R
Puis, en passant à la limite quand n → ∞ dans l’égalité ϕn dm = ϕn dµ, on obtient (par convergence
monotone ou par convergence dominée) m(]a, b[) = µ(]a, b[).
On conclut enfin que m = µ en utilisant, par exemple, la proposition 2.5.

Proposition 4.12 Soit (Ω, A, p) un espace probabilisé, d > 1 et X1 , . . . , Xd des v.a.r. Ces v.a.r. sont
indépendantes si et seulement si on a, pour tout famille {ϕ1 , . . . , ϕd } ⊂ Cc (R, R),
d
Y d
Y
E( ϕi (Xi )) = E(ϕi (Xi )), (4.29)
i=1 i=1

96
(En convenant qu’un produit de termes est nul si l’un des termes est nul.)

Démonstration : Le fait que la condition est nécessaire est une conséquence immédiate de la proposi-
tion 4.10 car une fonction continue à support compact est borélienne et bornée. On montre maintenant
que la condtion est nécessaire. On suppose donc que (4.29) est vraie pour toute famille {ϕ1 , . . . , ϕd } ⊂
Cc (R, R) et on veut montrer que les v.a.r. X1 , . . . , Xd sont indépendantes, c’est-à-dire que pour tout
A1 , . . . , An ∈ B(R), on a : !
Yd Yd
E 1Ai (Xi ) = E(1Ai (Xi )). (4.30)
i=1 i=1
Qd
(On rappelle en effet que E(1Ai (Xi )) = p(Xi−1 (Ai )) et E( i=1 1Ai Xi )) = p(∩ni=1 Xi−1 (Ai ).)

Pour montrer (4.30), on introduit, pour tout 1 ≤ n ≤ d + 1, la propriété suivante, notée Pn :


Pn : (4.29) est vraie si ϕi = 1Ai , avec Ai ∈ B(R), pour i < n, et ϕi ∈ Cc (R, R) pour i ≥ n.
L’hypothèse de la proposition donne que P1 est vraie. On suppose maintenant que Pn est vraie pour un
n ∈ {1, . . . , d}. Soit Ai ∈ B(R) pour i < n (et ϕi = 1Ai ) et ϕi ∈ Cc (R, R) pour i > n. Pour An ∈ B(R),
on pose, avec ϕn = 1An :
Qd
m(An ) = E( i=1 ϕi (Xi )),
Qd
µ(An ) = i=1 E(ϕi (Xi )).
R R
Les applications m et µ sont des mesures sur B(R). La propriété Pn montre que ϕdm = ϕdµ pour
tout ϕ ∈ Cc (R, R). La proposition 4.11 montre alors que m = µ ce qui donne la propriété Pn+1 . Par
récurrence sur n, on montre ainsi que Pd+1 est vraie, ce qui donne (4.30) et l’indépendance de X1 , . . . , Xd .

4.10 Espace L1C (E, T, m) et espace L1RN (E, T, m)


Définition 4.16 Soient (E, T, m) un espace mesuré et N > 1 (N ∈ N).
1. Soit f : E → RN . Pour x ∈ E, on pose f (x) = (f1 (x), . . . , fN (x))t ∈ RN . La fonction f
appartient à L1RN (E, T, m) si fn ∈ L1R (E, T, m) pour tout n ∈ {1, . . . , N }.
2. Si f ∈ L1RN (E, T, m), on note
Z Z Z
f dm = ( f1 dm, . . . , fN dm)t ∈ RN .

La caractérisation suivante de mesurabilité et intégrabilité est intéressante.

Proposition 4.13 Soient (E, T, m) un espace mesuré, N > 1 et f : E → RN .

1. fn est mesurable (de E dans R) pour tout n ∈ {1, . . . , N } si et seulement si f est mesurable de E
dans RN , c’est-à-dire si et seulement si f −1 (A) ∈ E pour tout A ∈ B(RN ).
2. Si f est mesurable R(de E dans RN ). On munit RN d’une norme, notée k·k. Alors, f ∈ L1RN (E, T, m)
si et seulement si kf kdm < ∞ (noter que kf k ∈ M+ ).

Démonstration : On donne la démonstration pour N = 2.

97
1. On suppose d’abord f1 , f2 ∈ M. On veut montrer que f est mesurable de E dans R2 . Comme
B(R2 ) est engendré par {A × B, A, B ∈ B(R)}, il suffit de montrer que f −1 (A × B) ∈ T pour tout
A, B ∈ B(R).
Soit donc A, B ∈ B(R). On a f −1 (A × B) = f1−1 (A) ∩ f2−1 (B) ∈ T car f1 et f2 sont mesurables.
Donc f −1 (A × B) ∈ T . On a bien montré que f est mesurable de E dans R2

Réciproquement, on suppose maintenant que f est mesurable de E dans R2 . Soit A ∈ B(R). On


remarque que f1−1 (A) = f −1 (A × R). Or A × R ∈ B(R2 ), donc f1−1 (A) = f −1 (A × R) ∈ T , ce qui
prouve que f1 est mesurable. On prouve de manière semblable que f2 est mesurable.
2. Soit f mesurable de E dans RN . On suppose que RN est muni d’une norme, notée k · k. Comme
y 7→ kyk est continue de RN dans R, l’application kf k : x 7→ kf (x)k est mesurable de E dans R
(comme composée d’applications mesurables). Comme cette application ne prend que des valeurs
positives ou nulles, on a donc kf k ∈ M+ .

Comme toutes les normes sur RN sont équivalentes, on a donc kf kdm < ∞ si et seulement si
R
R PN R
kf k1 dm < ∞, avec kf k1 = n=1 |fn |. Il est alors immédiat de remarquer que kf k1 dm < ∞ si
et seulement fn ∈ L1R (E, T, m) pour tout n ∈ {1, . . . , N }. On a donc :
Z
kf kdm < ∞ ⇔ f ∈ L1RN (E, T, m).

La définition de L1RN (E, T, m) donne immédiatement que cet espace est un espace vectoriel sur R. De
plus, si RN est muni d’une norme, notée k · k, il est aussi immédiat que l’application f 7→ kf kdm est une
R

semi-norme sur L1RN (E, T, m). Pour obtenir un espace vectoriel normé, on va considérer, comme dans le
cas N = 1, l’espace L1RN (E, T, m) quotienté par la relation “f = g p.p.”. On rappelle que f = g p.p. si il
existe A ∈ T t.q. m(A) = 0 et f = g sur Ac .

Définition 4.17 Soit (E, T, m) un espace mesuré.

1. L’espace L1RN (E, T, m) est l’espace L1RN (E, T, m) quotienté par la relation “f = g p.p.”.
2. On munit RN d’une norme notée k · k. Soit F ∈ L1RN (E, T, m). On pose kF k1 = kf kdm, où
R

f ∈ F (cette définition est correcte car indépendante du choix de f dans F ).

Proposition 4.14 Soient (E, T, m) un espace mesuré et N > 1. L’espace L1RN (E, T, m) est un espace
de Banach (réel) c’est-à-dire un espace vectoriel (sur R) normé complet (avec la norme définie dans la
définition 4.17).

Démonstration : La démonstration de cette proposition découle facilement du cas N = 1.

Définition 4.18 Soit (E, T, m) un espace mesuré.


1. Soit f : E → C. On note <(f ) et =(f ) les parties réelle et imaginaire de f . On a donc,
pour x ∈ E, f (x) = <(f )(x) + i=(f )(x), avec <(f )(x), =(f )(x) ∈ R. La fonction f appartient à
L1C (E, T, m) si <(f ), =(f ) ∈ L1R (E, T, m).

98
2. Si f ∈ L1C (E, T, m), on note
Z Z Z
f dm = <(f )dm + i =(f )dm ∈ C.

Ici aussi, on a une caractérisation de mesurabilité et intégrabilité.

Proposition 4.15 Soit (E, T, m) un espace mesuré et f une application de E → C.

1. <(f ) et =(f ) sont mesurables (de E dans R) si et seulement si f est mesurable de E dans C,
c’est-à-dire si et seulement f −1 (A) ∈ E pour tout A ∈ B(C).
2. Si f est mesurable (de E dans C), f ∈ L1C (E, T, m) si et seulement si |f |dm < ∞ (noter que
R

|f | ∈ M+ ).

Démonstration :
La démonstration de cette proposition se ramène facilement à la précédente démonstration (c’est-à-dire à
la démonstration de la proposition 4.13) en utilisant l’application ϕ : C → R2 définie par ϕ(z) = (x, y)t
si z = x + iy ∈ C, qui est une bijection continue, d’inverse continue.

Ici aussi, la définition de L1C (E, T, m) donne immédiatement que cet espace est un espace vectoriel sur C.
Il est aussi immédiat que l’application f 7→ |f |dm est une semi-norme sur L1C (E, T, m). Pour obtenir
R

un espace vectoriel normé, on va considérer l’espace L1C (E, T, m) quotienté par la relation “f = g p.p.”.

Définition 4.19 Soit (E, T, m) un espace mesuré.

1. L’espace L1C (E, T, m) est l’espace L1C (E, T, m) quotienté par la relation “f = g p.p.”.
2. Soit F ∈ L1C (E, T, m). On pose kF k1 = |f |dm, où f ∈ F (cette défintion est correcte car
R

indépendante du choix de f dans F ).

Proposition 4.16 Soit (E, T, m) un espace mesuré. L’espace L1C (E, T, m) est un espace de Banach
(complexe) c’est-à-dire un espace vectoriel (sur C) normé complet (avec la norme définie dans la définition
4.19).

Démonstration :
La démonstration de cette proposition découle facilement du fait que L1R (E, T, m) est un espace de Banach
(réel).

4.11 Exercices
4.11.1 Intégrale des fonctions mesurables positives et espace L1
Exercice 4.1 (Sup de mesures) Corrigé 55 page 330
Soit (E, T ) un espace mesurable et (mn )n∈N une suite de mesures sur T . On suppose que mn+1 (A) ≥
mn (A) pour tout A ∈ T et tout n ∈ N. On pose m(A) = sup{mn (A), n ∈ N} pour A ∈ T .

99
1. (Lemme préliminaire) Soit (an,p )n,p∈N ⊂ R+ et (ap )p∈N ⊂ R ≥ an,p , pour tout n, p ∈ N,
P+∞t.q. an+1,p P∞
et an,p → ap quand n → ∞, pour tout p ∈ N. Montrer p=0 an,p → p=0 ap (dans R+ ) quand
PN P∞ P∞
n → ∞. [On pourra utiliser p=0 an,p ≤ p=0 an,p ≤ p=0 ap .]
2. Montrer que m est une mesure.
3. Soit f ∈ E+ (E, R que E+ (E, T ) est l’ensemble des fonctions étagées de E dans R+ .)
R T ). (On rappelle
Montrer que f dm = supn∈N ( f dmn ).
4. Soit f ∈ M+ (E, T ). (On rappelle que M+ (E, T ) est l’ensemble des fonctions mesurables de E dans
R+ .)
R R
(a) Montrer que ( f dmn )n∈N est une suite croissante majorée par f dm.
R R
(b) Montrer que f dmn → f dm quand n → ∞.

5. Soit f ∈ L1R (E, T, m). Montrer que f ∈ L1R (E, T, mn ) pour tout n ∈ N et que f dmn → f dm
R R

quand n → ∞.

Exercice 4.2 (Somme de mesures) Corrigé 56 page 331


Soient m1 et m2 deux mesures sur l’espace mesurable (E, T ).
1. Montrer que m = m1 + m2 est une mesure.
2. Montrer qu’une application f mesurable de E dans R est intégrable pour la mesure m si et seulement
si
R elle est Rintégrable Rpour les mesures m1 et m2 . Si f est intégrable pour la mesure m, montrer que
f dm = f dm1 + f dm2 .
)n∈N une famille de mesures (positives) sur (E, T ) et (αn )n∈N ⊂ R?+ . On pose, pour A ∈ T ,
3. Soit (mn P
m(A) = n∈N αn mn (A). Montrer que m est une mesure sur T ; soit f une application mesurable
de E dans R et intégrable
R pourP R m ; montrer que f est, pour tout n ∈ N, intégrable pour
la mesure
la mesure mn et que f dm = n∈N αn f dmn .

Exercice 4.3 (Mesure de Dirac) Corrigé 57 page 333


R
Soit δ0 la mesure de Dirac en 0, définie sur B(R). (cf exemple 2.1.) Soit f ∈ M+ , calculer f dδ0 .

Exercice 4.4 (Restrictions de la mesure de Lebesgue) Corrigé 58 page 333


Soit A et B deux boréliens de R t.q. A ⊂ B. On note λA [resp. λB ] la restriction à B(A) [resp. B(B)] de
1 1
R mesure deR Lebesgue sur B(R). Soit f ∈ LR (B, B(B), λB ). Montrer que f|A ∈ LR (A,1 B(A), λA ) et que
la
f|A dλA = f 1A dλB . [Considérer d’abord le cas f ∈ E+ puis f ∈ M+ et enfin f ∈ L .]

Exercice 4.5 (Intégrale de Lebesgue et intégrale des fonctions continues) Corrigé 59 page 334
R1
Soit f ∈ C([0, 1], R). Montrer que f ∈ L1R ([0, 1], B([0, 1]), λ) et que f dλ = 0 f (x)dx (cette dernière
R

intégrale est à prendre au sens de “l’intégrale des fonctions continues” vue au Chapitre 1). On rappelle
que l’on note (un peu abusivement. . . ) par λ la restriction à B([0, 1]) de la mesure le Lebesgue (aussi
notée λ. . . ) sur B(R).

Exercice 4.6 (Fonctions continues et fonctions intégrables) Corrigé 60 page 335


Soit m une mesure finie sur B([0, 1]). Montrer que C([0, 1], R) ⊂ L1R ([0, 1], B([0, 1]), m).

Exercice 4.7 (f, g ∈ L1 6⇒ f g ∈ L1 )

100
Soient f , g ∈ L1R ([0, 1], B([0, 1]), λ). Donner un exemple pour lequel f g 6∈ L1R ([0, 1], B([0, 1]), λ).

Exercice 4.8 (Rappel du cours. . . )


Soit (E, T,Rm) un espace mesuré et f ∈ M+ . Montrer que si A ∈ T est tel que m(A) = 0, alors
f 1A dm) = 0. (On rappelle que f 1A = f sur A et f 1A = 0 sur Ac .)
R
A
f dm(=

Exercice 4.9 (f positive intégrable implique f finie p.p.)Z Corrigé 61 page 335
Soit (E, T, m) un espace mesuré et f ∈ M+ . Montrer que si f dm < +∞, alors f < +∞ p.p..

Exercice 4.10 (Une caractérisation de l’intégrabilité) Corrigé 62 page 336


Soient (E, T, m) un espace mesuré fini, u une fonction mesurable de E dans R. Pour n ∈ N, on pose
An = {x ∈ E, |u(x)| ≥ n} et Bn = {x ∈ E, n < |u(x)| ≤ n + 1}.

1. Montrer que :

Z +∞
X +∞
X
|u|dm < +∞ ⇔ n m(Bn ) < +∞ ⇔ m(An ) < +∞. (4.31)
n=0 n=0

2. Soit p ∈]1, +∞[, montrer que |u|p est une fonction mesurable et que :

Z +∞
X +∞
X
|u|p dm < +∞ ⇔ np m(Bn ) < +∞ ⇔ np−1 m(An ) < +∞. (4.32)
n=0 n=0

Exercice 4.11 (Sur la convergence en mesure)


Soit (E, T, m) un espace mesuré. Soit (fn )n∈N ⊂ M, (gn )n∈N ⊂ M et f, g ∈ M t.q. fn → f en mesure
et gn → g en mesure, quand n → ∞.

1. On suppose, dans cette question, que f ∈ L1R (E, T, m) et que g ∈ L1R (E, T, m). Montrer que f g ∈ M
et fn gn → f g en mesure, quand n → ∞.
[On pourra s’inspirer de la question 3. de l’exercice 3.22 et donc commencer par montrer que, pour
tout ε > 0, il existe n0 et k0 ∈ N tels que :

n ≥ n0 , k ≥ k0 ⇒ m({x ∈ E ; |fn (x)| ≥ k}) ≤ ε.]

Donner un exemple pour lequel f g 6∈ L1R (E, T, m).


2. En prenant (E, T, m) = (R, B(R), λ), Donner un exemple pour lequel fn gn 6→ f g en mesure, quand
n → ∞ (pour cet exemple, on a donc f 6∈ L1R (E, T, m) ou g 6∈ L1R (E, T, m)).

Exercice 4.12 (Sur l’inégalité de Markov) Corrigé 63 page 338


Soit (E, T, m) un espace mesuré et f ∈ L1R (E, T, m).
Z
1. Montrer que pour tout a > 0, on a a m({|f | > a}) ≤ |f | dm.
{|f |>a}
Z
2. Montrer que pour tout a > 0, on a m({|f | > a}) ≤ ( |f | dm)/a. (Ceci est l’inégalité de Markov.)

101
3. Montrer que
lim a m({|f | > a}) = 0. (4.33)
a→∞

4. Donner des exemples de fonctions non intégrables qui vérifient la propriété (4.33) dans les 2 cas
suivants : (E, T, m) = (R, B(R), λ) et (E, T, m) = (]0, 1[, B(]0, 1[), λ).

Exercice 4.13 (Sur f ≥ 0 p.p.) Corrigé 64 page 339


Soit (E, T, m) un espace mesuré et f ∈ L1R (E, T, m). Montrer que les 2 conditions suivantes sont équiva-
lentes :
1. f ≥ 0 p.p.,
R
2. A f dm ≥ 0 pour tout A ∈ T .

Exercice 4.14 Corrigé 65 page 340


Soient (E, T, m) un espace mesuré et f ∈ L1 (= L1R (E, T, m)).
Z
1. Montrer que : ∀ε > 0, ∃ δ > 0 t.q. ∀A ∈ T , m(A) ≤ δ ⇒ |f |dm ≤ ε. [Introduire fn = inf(|f |, n)].
A

2. Montrer que : ∀ε > 0, ∃ C ∈ T t.q. :


(i) m(C) < +∞,
Z
(ii) |f |dm ≤ ε,
Cc
(iii) sup |f | < +∞,
C

1
[Considérer Cn = {x ∈ E ; ≤ |f (x)| ≤ n}, et montrer que pour n ≥ n0 où n0 est bien choisi, Cn
n
vérifie (i), (ii) et (iii).]

Exercice 4.15
1
R
RSoit2 (E, T, m) un espace mesuré et f ∈ LR (E, T, m). On suppose que 0 ≤ f ≤ 1 p.p. et que f dm =
f dm. Montrer qu’il existe un ensemble mesurable fini A tel que f = 1A p.p..

Exercice 4.16 (Intégration par rapport à une mesure image)


Soit (E, T, m) un espace mesuré, (F, S) un espace mesurable et f de E dans F . On suppose que f est
mesurable, c’est à dire que f −1 (B) ∈ T pour tout B ∈ S. pour tout B ∈ S, on pose µ(B) = m(f −1 (B))
(On note souvent µ = f? m).

1. Montrer que µ est une mesure sur S (on l’appelle mesure image de m par f ).
2. µ est-elle finie (resp. σ-finie, diffuse) lorsque m est finie (resp. σ-finie, diffuse) ?
3. Montrer qu’une fonction Φ mesurable de F dans R est µ−intégrable si et seulement si Φ ◦ f est
m-intégrable et que dans ce cas Z Z
Φ ◦ f dm = Φ dµ.
E F

Exercice 4.17 (m−mesurabilité) Corrigé 66 page 341

102
Soit (E, T, m) un espace mesuré. Soit A ∈ T t.q. m(A) = 0 et f une application de Ac dans R. Montrer
que :
il existe g mesurable de E dans R t.q. f = g p.p. si et seulement si il existe (fn )n∈N , suite de fonctions
étagées, t.q. fn → f p.p., quand n → ∞.

Exercice 4.18 (Mesure complète, suite de l’exercice 2.28) Corrigé 67 page 341
On reprend les notations de l’exercice 2.28 page 48. On note donc (E, T , m) le complété de l’espace
mesuré (E, T, m).

Montrer que L1R (E,Z T, m) ⊂ L1 1 1


ZR (E, T , m). Soit f ∈ LR (E, T , m), montrer qu’il existe g ∈ LR (E, T, m) t.q.
f = g p.p. et que f dm = gdm.

Exercice 4.19 (Petit lemme d’intégration) Corrigé 68 page 342


Soit (E, T, m) un espace mesuré et f ∈ M(E, T ). (On rappelle que M(E, T ) est l’ensemble des fonctions
mesurables de E dans R.)

1. On suppose (dans cette question) que f ∈ L1R (E, T, m). Montrer que
Z
(An )n∈N ⊂ T, m(An ) → 0 ⇒ f 1An dm → 0. (4.34)

2. On prend (dans cette question) (E, T, m) = (R, B(R), λ). Donner un exemple de f ∈ M(E, T ) t.q.
f ≥ 0 (de sorte que f ∈ M+ (E, T )), pour lequel (4.34) est faux.
3. On suppose (dans cette question) que m(E) < ∞ et que f > 0 (c’est à dire f (x) > 0 pour tout
x ∈ E). Montrer que
Z
(An )n∈N ⊂ T, f 1An dm → 0 ⇒ m(An ) → 0. (4.35)

On pourra utiliser le fait que, pour p ∈ N? , An ⊂ {f < p1 } ∪ {x ∈ An ; f (x) ≥ p1 }.

4. On prend (dans cette question) (E, T, m) = (R, B(R), λ) (de sorte que m(E) = ∞). Montrer que si
f ∈ L1R (E, T, m) et f > 0, alors (4.35) est faux. Donner un exemple de f ∈ L1R (E, T, m) t.q. f > 0.

Exercice 4.20 (Fatou sans positivité) Corrigé 69 page 344


Soit (E, T, m) un espace mesuré. Soit (fn )n∈N ⊂ L1R (E, T, m), f ∈ L1R (E, T, m) et h ∈ M(E, T ). (On
rappelle que M(E, T ) est l’ensemble des fonctions mesurables de E dans R.)

1. On suppose que fRn → h p.p. quand n → ∞, fn ≥ f p.p. pour tout n ∈ N, et on suppose qu’il
existe C ∈ R t.q. fn dm ≤ C pour tout n ∈ N.

(a) Montrer qu’il existe (gn )n∈N ⊂ L1R (E, T, m) et g ∈ L1R (E, T, m) t.q.
• fn = gn p.p., pour tout n ∈ N, f = g p.p.,
• gn (x) → h(x), quand n → ∞, pour tout x ∈ E,
• gn ≥ g pour tout n ∈ N.
(b) Montrer que h ∈ L1R (E, T, m).

103
R n ≥ f p.p., pour
2. (question plus difficile) On reprend les hypothèses de la question précédente sauf “f
tout n ∈ N” que l’on remplace par l’hypothèse (plus faible) “il existe D ∈ R t.q. fn dm ≥ D pour
tout n ∈ N”. Donner un exemple pour lequel h ∈ / L1R (E, T, m). [Prendre (E, T, m) = (R, B(R), λ).]

Exercice 4.21 Corrigé 70 page 344


Soient T > 0 et f ∈ L1 = L1 ([0, T ], B([0, T ]), λ) (λ désigne donc ici la mesure de Lebesgue sur B([0, T ]).

1. Soit n ∈ N. Montrer que la fonction x 7→ enx f (x) appartient à L1 .

R nxsuppose, dans la suite de l’exercice, que f ≥ 0 p.p.


On et qu’il existe M ∈ R+ t.q. que
e f (x) dλ(x) ≤ M pour tout n ∈ N.
2. Montrer que f = 0 p.p.. [Appliquer le théorème de convergence monotone.]
3. On suppose de plus que f est continue. Montrer que f (x) = 0 pour tout x ∈ [0, T ].

4.11.2 L’espace L1
Exercice 4.22 (Mesure de densité) Corrigé 71 page 345
R
Soit (E, T, m) un espace mesuré et f ∈ M+ . Pour A ∈ T , on pose µ(A) = A f dm.

1. Montrer que µ est une mesure sur T .


2. Soit g ∈ M. Montrer que g ∈ L1R (E, T, µ) si et seulement si f gR ∈ L1R (E,
R T, m) (on pose f g(x) = 0
si f (x) = ∞ et g(x) = 0). Montrer que, pour g ∈ L1R (E, T, µ), gdµ = f gdm.
(On dit que µ est la mesure de densité f par rapport à m et on pose µ = f m.)

Exercice 4.23 (Comparaison de convergence dans L1 )


On considère ici l’espace mesurable (R, B(R), où B(R) est la tribu des boréliens sur R. On note λ la
mesure de Lebesgue et, pour a ∈ R, on note δa la mesure de Dirac en a. On pose µ = δ1 + δ2 + 3λ
(noter que µ est une mesure sur B(R)). Soit f l’application de R dans R définie par f (x) = x3 . On pose
fn = f 1[−n,n] pour tout n ∈ N. On pose L1 (µ) = L1R (R, B(R), µ).

1. Montrer que, pour tout n ∈ N, fn ∈ L1 (µ), et calculer an = fn dµ.


R

2. A-t-on convergence simple, convergence uniforme, convergence en mesure, convergence dans L1 (µ)
de la suite (fn )n∈N ?.

Exercice 4.24 (Convergence uniforme et convergence des intégrales)


Soient (E, T, m) un espace mesuré et (fn )n∈N ⊂ L1 (= L1R (E, T, m)) ; on suppose que fn converge
uniformément vers f quand n → ∞ (plus précisément : il existe des représentants des fn , encore notés
fn , t.q. fn converge uniformément vers f ).
1. A-t-on f ∈ L1 (plus précisément : existe-t-il F ∈ L1 t.q. f = g p.p. si g ∈ F ) ? [distinguer les cas
m(E) < +∞ et m(E) = +∞.]
Z Z
2. Si f ∈ L1 et ( fn dm)n∈N converge dans R, a-t-on : lim
R
fn dm = f dm ?
n→+∞

Exercice 4.25 Corrigé 72 page 346

104
1 1 1
R (fn )n∈NR⊂ L (= LR (E, T, m)) et f ∈ L ; on suppose que fn ≥1 0 pp
Soient (E, T, m) un espace mesuré,
∀n ∈ N, que fn → f pp et que fn dm → f dm lorsque n → +∞. Montrer que fn → f dans L . [on
pourra examiner la suite (f − fn )+ .]

Exercice 4.26 (Exemple de convergence)

1. Soit (E, T, m) un espace mesuré, (fn )n∈N ⊂ L1R (E, T, m), f, g ∈ L1R (E, T, m). On suppose que
fn → f p.p. et que fn → g dans L1R (E, T, m). Montrer que f = g p.p.
2. On suppose maintenant (E, T, m) = ([−1, 1], B(R), λ). Pour n ∈ N, on définit la fonction : fn =
n1[ −1 , 1 ] .
2n 2n

(a) Montrer que la suite (fn )n∈N est bornée dans L1 , et que la suite ( fn dλ)n∈N converge.
R

(b) Peut-on appliquer le théorème de Lebesgue de la convergence dominée ?


(c) A-t-on convergence de la suite (fn )n∈N dans L1R (E, T, m) ?
R R
(d) Montrer que pour toute fonction ϕ continue de [−1, 1] à valeurs dans R, fn ϕdλ → ϕdδ0
lorsque n → +∞ (on dit que fn λ tend vers δ0 dans l’ensemble des mesures sur les boréliens
de [−1, 1] pour la topologie “faible ?”).

Exercice 4.27 (A propos du lemme de Fatou)


Soient (E, T, m) un espace mesuré et (fn )n∈N ⊂ L1 (= L1R (E, T, m)) t.q. fn ≥ 0 p.p. pour tout n ∈ N.
On pose, pour tout x ∈ E, f (x) = lim inf fn (x).
n→+∞

1. Construire, pour tout n ∈ N, gn ∈ M+ t.q. fn = gn p.p..


On pose g = lim inf gn (où gn est construite à la question 1).
n→+∞

2. Montrer que f = g pp, que f ≥ 0 p.p. et que :


Z Z
gdm ≤ lim inf fn dm (4.36)
n→+∞

Z
3. On suppose de plus qu’il existe C > 0 t.q. fn dm ≤ C pour tout n ∈ N. Montrer que f ∈
L1R (E, T, m) et que f < +∞ p.p..

Exercice 4.28 (Théorème de Beppo-Lévi) Corrigé 73 page 347


Soient (E, T, m) un espace mesuré, (fn )n∈N ⊂ L1 (= L1R (E, T, m)) et f : E → R, t.q. :
(i) fn → f p.p. lorsque n → +∞.
(ii) La suite (fn )n∈N est monotone, c’est-à-dire :
fn+1 ≥ fn p.p., pour tout n ∈ N,
ou
fn+1 ≤ fn p.p., pour tout n ∈ N.

1. Construire (gn )n∈N ⊂ L1 (= L1R (E, T, m)) et g ∈ M t.q. fn = gn p.p., f = g p.p., gn (x) → g(x)
pour tout x ∈ E, et gn+1 ≥ gn pour tout n ∈ N (ou gn+1 ≤ gn pour tout n ∈ N).

105
Z
2. Montrer que f ∈ L1 ⇔ lim fn dm ∈ R.
n→+∞

3. On suppose ici que f ∈ L1 , montrer que fn → f dans L1 , lorsque n → +∞.

Exercice 4.29 (Préliminaire pour le théorème de Vitali) Corrigé 74 page 349


Soient (E, T, m) un espace mesuré et f ∈ L1 (= L1R (E, T, m)).
1. Montrer que pour tout ε > 0, il existe δ > 0 t.q. :
Z
A ∈ T, m(A) ≤ δ ⇒ |f |dm ≤ ε.
A

[Choisir un représentant de f et introduire fn = inf(|f |, n)].


Z
2. Soit ε > 0, montrer qu’il existe C ∈ T t.q. m(C) < +∞ et |f |dm ≤ ε. [Choisir un représentant
Cc
1
de f et considérer Cn = {x ∈ E ; ≤ |f (x)|}.]
n
Exercice 4.30 (Théorème de Vitali) Corrigé 75 page 350
Soient (E, T, m) un espace mesuré, (fn )n∈N ⊂ L1 (= L1R (E, T, m)) et f : E → R, t.q. fn → f p.p..

1. On suppose m(E) < +∞. Montrer que : f ∈ L1 et fn → f dans L1 lorsque n → +∞ si et seulement


Rsi (fn )n∈N est équi-intégrable (i.e. : Pour tout ε > 0, il existe δ t.q. (A ∈ T , n ∈ N, m(A) ≤ δ ⇒
A n
|f |dm ≤ ε).R [Pour montrer Rle sens ⇒, utiliserR la question 1 de l’exercice 4.29. Pour le sens ⇐,
remarquer que |fn − f |dm = A |fn − f |dm + Ac |fn − f |dm, utiliser le théorème d’Egorov et le
lemme de Fatou...]
2. On suppose maintenant m(E) = +∞. Montrer que : f ∈ L1 et fn → f dans L1 lorsque n →
+∞
R si et seulement si (fn )n∈N est équi-intégrable et vérifie : ∀ ε > 0, ∃ C ∈ T , m(C) < +∞ et
C c |f n |dm ≤ ε pour tout n. [Pour montrer le sens ⇒, utiliser l’exercice 4.29. Pour le sens ⇐,
utiliser l’exercice 4.29, le lemme de Fatou et le résultat de la question 1.]
3. Montrer que le théorème de convergence dominée de Lebesgue peut être vu comme une conséquence
du théorème de Vitali.

Exercice 4.31 (Théorème de “Vitali-moyenne”) Corrigé 76 page 353


Soit (E, T, m) un espace mesuré. On note L1 = L1R (E, T, m). Soit (fn )n∈N ⊂ L1 et f ∈ M(E, T ).

1. On suppose que m(E) < ∞. On se propose ici de montrer que :

f ∈ L1 et
 
1. fn → f en mesure, quand n → ∞,
⇔ (4.37)
kfn − f k1 → 0 quand n → ∞ 2. (fn )n∈N équi-intégrable.

(a) Montrer le sens (⇒) de (4.37).


(b) Pour montrer le sens (⇐), on suppose maintenant que fn → f en mesure, quand n → ∞, et
que (fn )n∈N est équi-intégrable.
i. Montrer que pour tout δ > 0 et η > 0, il existe n ∈ N t.q. : p, q ≥ n ⇒ m({|fp − fq | ≥
η} ≤ δ.
ii. Montrer que la suite (fn )n∈N est de Cauchy dans L1 .

106
iii. Montrer que f ∈ L1 et que kfn − f k1 → 0 quand n → ∞.

2. On ne suppose plus que m(E) < ∞. Montrer que :




 1. fn → f en mesure, quand n → ∞,
f ∈ L1 et

2. (fn )n∈N équi-intégrable,

⇔ (4.38)
kfn − f k1 → 0 quand n → ∞ 
 3. ∀εR> 0, ∃A ∈ T t.q. m(A) < ∞ et ,
|f |dm ≤ ε, pour tout n ∈ N.

Ac n

Exercice 4.32 (Continuité de p 7→ k · kp ) Corrigé 77 page 356


Soient (E, T, m) un espace mesuré et f ∈ M(E, T ).
Z  p1
1. Pour p ∈ [1, +∞[, on pose kf kp = |f |p dm (noter que |f |p ∈ M+ ) et on dit que f ∈ Lp si
kf kp < +∞. On pose I = {p ∈ [1, +∞[, f ∈ Lp }.
(a) Soient p1 et p2 ∈ [1, +∞[, et p ∈ [p1 , p2 ]. Montrer que si f ∈ Lp1 ∩ Lp2 , alors f ∈ Lp . En
déduire que I est un intervalle. [On pourra introduire A = {x; |f (x)| ≤ 1}.]
(b) On montre sur des exemples que les bornes de I peuvent être ou ne pas être dans I. On prend
pour cela: (E, T, m) = ([2, +∞[, B([2, ∞[), λ) (λ est ici la restriction à [2, ∞[ de la mesure de
Lebesgue sur B(R)). Calculer I dans les deux cas suivants:
i. f (x) = x1 , x ∈ [2, +∞[.
ii. f (x) = x(ln1x)2 , x ∈ [2, +∞[.
(c) Soit (pn )n∈N Z⊂ I et p ∈ I,Z (I désigne l’adhérence de I dans R), t.q. pn ↑ p (ou pn ↓ p).
Montrer que |f |pn dm → |f |p dm quand n → +∞. [On pourra encore utiliser l’ensemble
A].

2. On dit que f ∈ L∞ s’il existe C ∈ R t.q. |f | < C p.p.. On note kf k∞ = inf{C ∈ R t.q. |f | < C
p.p.}. Si f 6∈ L∞ , on pose kf k∞ = +∞.
(a) Montrer que f ≤ kf k∞ p.p.. A-t-on f < kf k∞ p.p. ?
On pose J = {p ∈ [1, +∞]; f ∈ Lp } ⊂ R+ .
(b) Remarquer que J = I ou J = I ∪ {+∞}. Montrer que si p ∈ I et +∞ ∈ J, alors [p, +∞] ⊂ J.
En déduire que J est un intervalle de R+ .
(c) Soit (pn )n∈N ⊂ I t.q. pn ↑ +∞. On suppose que kf k∞ > 0 (noter que f = 0 p.p. ⇔ kf k∞ =
0).
Z
i. Soit 0 < c < kf k∞ . Montrer que : lim inf kf kpn ≥ c. [On pourra remarquer que |f |p dm
n→+∞
≥ cp m({x; |f (x)| ≥ c}.]
ii. On suppose que kf k∞ < +∞. Montrer que : lim sup kf kpn ≤ kf k∞ . [On pourra considérer
n→+∞
 |f | pn
la suite gn = et noter que gn ≤ g0 p.p.. ]
kf k∞
iii. Déduire de (a) et (b) que kf kpn → kf k∞ lorsque n → +∞.

107
3. Déduire des deux parties précédentes que p → kf kp est continue de J dans R+ , où J désigne
l’adhérence de J dans R (c’est-à-dire J = [a, b] si J = |a, b|, avec 1 ≤ a ≤ b ≤ +∞, et | désigne ] ou
[).
R
Exercice 4.33 (Exemple de continuité et dérivabilité sous le signe )
Soit f : R × R+ → R+ donnée par: f (t, x) =ch(t/(1 + x)) − 1.
1. Montrer que pour tout t ∈ R, la fonction f (t, .) appartient à L1 (R+ , B(R), λ).
R
2. On pose: F (t) = R+ f (t, x)dx. Montrer que F est continue, dérivable. Donner une expression de
F 0.
R
Exercice 4.34 (Contre exemple à la continuité sous le signe )
Soit f : R+ ×]0, 1[→ R+ donnée par: f (t, x) = 1 si x ∈ [0, 4t ] ∪ [t, 1], f ( 2t , t) = 2t et f est affine par
morceaux.
1. Montrer que la fonction f (., x) est continue pour tout x ∈]0, 1[.
2. Montrer que f (t, x) → 1 lorsque t → 0, pour tout x ∈]0, 1[.
R
3. Montrer que f (t, x)dxR 6→ 1 lorsque t → 0. Pourquoi ne peut on pas appliquer le théorème de
continuité sous le signe ?
Exercice 4.35 (Continuité d’une application de L1 dans L1 ) Corrigé 78 page 362
Soient (E, T, m) un espace mesuré fini et soit g une fonction continue de R dans R t.q. :
∃ C ∈ R?+ ; |g(s)| ≤ C|s| + C, ∀s ∈ R. (4.39)
1. Soit u ∈ L1R (E, T, m). Montrer que g ◦ u ∈ L1R (E, T, m).
On pose L1 = L1R (E, T, m). Pour u ∈ L1 , on pose G(u) = {h ∈ L1R (E, T, m); h = g ◦ v p.p.} ∈ L1 ,
avec v ∈ u.
2. Montrer que la définition précédente a bien un sens, c’est à dire que G(u) ne dépend pas du choix
de v dans u.
3. Soit (un )n∈N ⊂ L1 . On suppose que un → u p.p. et qu’il existe F ∈ L1 t.q. |un | ≤ F p.p., pour
tout n ∈ N. Montrer que G(un ) → G(u) dans L1 .
4. Montrer que G est continue de L1 dans L1 . [On pourra utiliser la question 3. et le théorème appelé
“réciproque partielle de la convergence dominée”.]
5. (Question non corrigée, voir le corrigé 102 page 389) On considère ici (E, T, m) = ([0, 1], B(R), λ).
On suppose que g ne vérifie pas (4.39). On va construire u ∈ L1 t.q. G(u) 6∈ L1 .
(a) Soit n ∈ N? , montrer qu’il existe αn ∈ R tel que : |g(αn )| ≥ n|αn | et |αn | ≥ n.
(b) On choisit une suite (αn )n∈N? vérifiant les conditions données à la question précédente. Montrer
qu’il existe α > 0 t.q.
+∞
X α
2
= 1.
n=1
|αn |n

α
(c) Soit (an )n∈N? une suite définie par : a1 = 1 et an+1 = an − (où αn et α sont définies
|αn |n2
P+∞
dans les 2 questions précédentes). On pose u = n=1 αn 1[an+1 ,an [ . Montrer que u ∈ L1 et
G(u) 6∈ L1 .

108
4.11.3 Espérance et moments des variables aléatoires
Exercice 4.36 Soient (E, T ) un espace probabilisé et X une variable aléatoire de (E, T ) dans (R, B(R)),
de loi de probabilité pX . Calculer l’espérance et la variance de la variable aléatoire X dans les cas
suivants :
1. pX est la loi uniforme sur [a, b] (a, b ∈ R, a < b ;

2. pX est la loi exponentielle ;


3. pX est la loi de Gauss.

Exercice 4.37 Dans une ruche, la longévité d’une abeille ouvrière née au printemps est une variable
aléatoire X définie par la densité de probabilité f (t) = λt2 e−αt , où λ et α sont des réels positifs.
Sachant que la longévité moyenne d’une abeille est de 45 jours, calculer λ et α.

Exercice 4.38 (Problème de Buffon) Sur un parquet “infini” dont les lattes ont une largeur 2d, on
laisse tomber au hasard une aiguille de longueur 2` avec ` < d, et on veut estimer la probabilité de
l’événement A: “l’aiguille rencontre un interstice”. On appelle (Ω, T, p) l’espace probabilisé associé à ce
problème.
On considère:

• que la position x du centre de l’aiguille par rapport à l’interstice le plus proche et dans la direction
x0 x perpendiculaire aux lattes est une variable aléatoire uniformément distribuée sur [−d, d],
• que l’angle orienté θ que fait l’aiguille avec l’interstice est une variable aléatoire uniformément
distribuée sur [− π2 , π2 ].

1. Montrer que l’événement A “correspond” (on précisera en quel sens) à la partie PA du plan (x, θ):
PA = {(x, θ) ∈ [−d, d] × [− π2 , π2 ]; |x| < ` sin θ}. Représenter graphiquement PA .
2`
2. Montrer que p(A) = πd .

Exercice 4.39 (Inégalité de Jensen) Corrigé 79 page 363


Rappel : Une fonction f de R dans R est convexe si et seulement si pour tout a ∈ R il existe ca t.q.
f (x) − f (a) ≥ ca (x − a) pour tout x ∈ R.
Soit f une fonction convexe de R dans R et X une v.a. sur un espace de probabilité (Ω, A, P ). On
suppose que X et f (X) sont intégrables. Montrer l’inégalité de Jensen, c’est-à-dire :
Z Z
f (X)dP ≥ f ( XdP ).

[Utiliser le rappel avec a bien choisi.]

Exercice 4.40 (Sur l’équi-intégrabilité ) Corrigé 80 page 364


Soit (E, A, P ) un espace de probabilité
R et (Xn )n∈N une suite de v.a. (réelles). On rappelle que la suite
(Xn )n∈N est équi-intégrable si A |Xn |dP → 0, quand P (A) → 0 (avec A ∈ A), uniformément par rapport
à n ∈ N. Montrer l’équivalence entre les deux propriétés suivantes :
Z
1. lim sup |Xn |dP = 0,
a→∞ n∈N {|Xn |>a}

109
Z
2. sup |Xn |dP < +∞ et (Xn )n∈N équi-intégrable.
n∈N

Exercice 4.41 (Caractérisation de l’indépendance) Corrigé 81 page 364


Soit (Ω, A, P ) un espace de probabilités, n ≥ 2 et X1 , X2 , . . . , Xn , n variables aléatoires réelles. Montrer
que l’indépendance de (X1 , X2 , . . . Xn ) est équivalente à la propriété suivante :
n
Y
∀(a1 , . . . , an ) ∈] − ∞, +∞[n , P [X1 ≤ a1 , . . . , Xn ≤ an ] = P [Xi ≤ ai ].
i=1

(La notation P [X ≤ a] est identique à P ({X ≤ a}), elle désigne la probabilité de l’ensemble {ω ∈
Ω, X(ω) ≤ a}.)

Exercice 4.42 (Sign(X) et |X| pour une gaussienne) Corrigé 82 page 364
Pour s ∈ R, on pose sign(s)=1 si s > 0, sign(s)=-1 si s < 0 et sign(0)= 0. Soit (Ω, A, P ) un espace
x2
1
probabilisé et X une v.a.r. gaussienne centrée (c’est-à-dire PX = f λ avec, pour x ∈ R, f (x) = √2πσ e− 2σ2 ,
où σ > 0 est la racine carré de la variance de X). Montrer que sign(X) et |X| sont indépendantes et
préciser leurs lois. Même question avec sign(X) et X 2 .

Exercice 4.43 (V.a. gaussiennes dépendantes) Corrigé 83 page 364


Soit (Ω, A, P ) un espace de probabilités, σ1 > 0, σ2 > 0 et X1 , X2 deux variables aléatoires indépendantes
et telles que :
X1 ∼ N (0, σ12 ) et X2 ∼ N (0, σ22 ).
(le signe “∼” signifie “a pour loi”.) Construire deux v.a. Y1 et Y2 t.q. X1 ∼ Y1 , X2 ∼ Y2 et Y1 et Y2 soient
dépendantes.

Exercice 4.44 (V.a. gaussiennes dépendantes, à covariance nulle) Corrigé 84 page 365
soit (Ω, A, P ) est un espace de probabilités et X, S deux v.a. réelles, indépendantes, t.q. X ∼ N (0, 1)
et S a pour loi PS = 21 δ1 + 12 δ−1 . (Il est possible de construire un espace de probabilités et des v.a.
indépendantes ayant des lois prescrites, voir le Chapitre 7.)

1. Montrer que SX ∼ N (0, 1).


2. Montrer que SX et X sont dépendantes.
3. Montrer que Cov(SX, X) = 0.

4. (Question subsidiaire.) On ne suppose plus l’existence de S, mais on suppose qu’il existe Y v.a.
gaussienne indépendante de X. Montrer que si Y ∼ N (0, σ 2 ), avec σ > 0, il est possible d’utiliser
Y pour construire S, v.a. indépendante de X et telle que PS = 21 δ1 + 12 δ−1 .

Exercice 4.45 (Identités de Wald) Corrigé 85 page 366


Soit (Ω, A, P ) un espace probabilisé, (Xn )n∈N? une suite v.a.r.i.i.d. et N une v.a. à valeurs dans N? . On
PN (ω)
pose SN = X1 + . . . + XN (c’est-à-dire que, pour ω ∈ Ω, SN (ω) = n=1 Xn (ω)).
?
Pn n ∈ N ,
1. On suppose, dans cette question, que les v.a.r. N, X1 , . . . , Xn , . . . sont indépendantes. Pour
on pose An = {ω ∈ Ω, N (w) = n} (on note, en général, An = {N = n}), Yn = p=1 Xp et
Pn
Zn = p=1 |Xp |.

110
(a) Soit n ∈ N? . Montrer que 1An et Yn sont des v.a.r. indépendantes et que 1An et Zn sont des
v.a.r. indépendantes.
(b) On suppose que N et X1 sont intégrables . Montrer que SN est intégrable
P∞ et calculer E(SN )
en
P∞ fonction de E(N ) et E(X1 ). [On pourra remarquer que S N = n=1 1An Yn et |SN | ≤
1
n=1 An nZ .]
(c) On suppose que N et X1 sont de carré intégrable, montrer que SN est de carré intégrable et
calculer sa variance en utilisant les variances de N et X1 .
2. On suppose maintenant que {N = n} ∈ σ(X1 , . . . , Xn ) pour tout n ∈ N? (où σ(X1 , . . . , Xn ) est la
tribu engendrée par X1 , . . . , Xn ) et que E(X1 ) = 0.

(a) Montrer que 1{n≤N } et Xn sont des v.a.r. indépendantes.


P
(b) Reprendre les questions 1(b) et 1(c). [On pourra écrire SN = n∈N? 1{n≤N } Xn .]
N.B. : Le cas E(X1 ) 6= 0 peut aussi être traité. Il se ramène au cas E(X1 ) = 0 en considérant
Yn = Xn − E(Xn ).

Exercice 4.46 (Limite p.s. et indépendance) Corrigé 86 page 366


Soit (Ω, A, P ) un espace probabilisé, (Xn )n∈N? une suite v.a.r. et X, Y deux v.a.r.. On suppose que, pour
tout n ∈ N? , Xn et Y sont indépendantes et on suppose que Xn → X p.s., quand n → ∞. Montrer que
X et Y sont indépendantes.

Exercice 4.47 (Exponentielle d’une v.a. gaussienne)


Soit (Ω, A, P ) un espace de probabilité et X une v.a. t.q. X ∼ N (0, 1). Soit Y = exp(X). Calculer la
moyenne, la variance et la densité de Y .

Exercice 4.48 (Loi du χ2 )


Soit (Ω, A, P ) un espace de probabilité et X une v.a. t.q. X ∼ N (0, 1). Calculer l’espérance, la variance
ainsi que la densité de la v.a. X 2 . (Remarque : cette loi s’appelle “Loi du χ2 à 1 degré de liberté”.)

111
Chapter 5

Mesures sur la tribu des boréliens

5.1 L’intégrale de Lebesgue et l’intégrale des fonctions continues


Nous commençons par comparer l’intégrale de Lebesgue (définie sur (R, B(R), λ)) à l’intégrale “classique”
des fonctions continues (et plus généralement des fonctions réglées).

Soit I un intervalle de R (borné ou non). On rappelle que B(I) = {A ∈ B(R), A ⊂ I}. On peut donc
considérer la restriction à B(I) de la mesure de Lebesgue définie sur B(R). On notera en général (un peu
incorrectement) aussi λ cette mesure sur B(I).
Proposition 5.1 Soit −∞ < a < b < +∞. Soit f ∈ C([a, b], R). Alors, f ∈ L1R ([a, b], B([a, b]), λ)) et
R Rb
f dλ = a f (x)dx (cette dernière intégrale est à prendre au sens de “l’intégrale des fonctions continues”
vue au Chapitre 1).
Démonstration :
La démonstration de cette proposition fait l’objet de l’exercice (corrigé) 4.5 page 100. En fait l’exercice
4.5 s’intéresse au cas [0, 1] mais s’adapte facilement pour le cas général [a, b].

Remarque 5.1
1. Si I est un intervalle de R dont les bornes sont a, b ∈ R (I peut être fermé ou ouvert en a et b) et
si f ∈ L1 (I, B(I), λ) ou L1 (I, B(I), λ), on notera souvent :
Z Z Z b
f dλ = f (x)dλ(x) = f (x)dx.
a

Cette notation est justifée par la proposition précédente (proposition 5.1) car, si I est compact,
l’intégrale de Lebesgue contient l’intégrale des fonctions continues (et aussi l’intégrale des fonctions
réglées et aussi l’intégrale de Riemann, voir l’exercice 5.3).
2. Soient −∞ < a < b < +∞ et f ∈ C([a, b], R).
La proposition 5.1 donne que f ∈ L1R ([a, b], B([a, b]), λ)). En fait, on écrira souvent que f ∈
L1R ([a, b], B([a, b]), λ)), c’est-à-dire qu’on confondra f avec sa classe dans L1R ([a, b], B([a, b]), λ), qui

112
est {g ∈ L1R ([a, b], B([a, b]), λ); g = f p.p.}. On peut d’ailleurs noter que f est alors le seul élé-
ment continu de {g ∈ L1R ([a, b], B([a, b]), λ); g = f p.p.} comme le montre la proposition suivante
(proposition 5.2).

Proposition 5.2 Soient −∞ ≤ a < b ≤ +∞ et f, g ∈ C(]a, b[, R). On suppose que f = g λ-p.p.. On a
alors f (x) = g(x) pour tout x ∈ [a, b].

Démonstration :
Cette proposition est démontrée à l’exercice (corrigé) 3.9 page 66 pour a = −∞ et b = ∞. La démon-
stration pour a et b quelconques est similaire.

Proposition 5.3 Soit f ∈ Cc (R, R) (fonction continue à support compact). Alors f ∈ L1R (R, B(R), λ).
(Ici aussi, on écrira souvent f ∈ L1R (R, B(R), λ).)
Rb
De plus, si a, b ∈ R sont t.q. a < b et f = 0 sur [a, b]c (de tels a et b existent). Alors, f dλ = a f (x)dx
R

(cette dernière intégrale étant à prendre au sens de “l’intégrale des fonctions continues” vue au Chapitre 1).

Démonstration:
On remarque d’abord que f est borélienne car continue. Puis, pour montrer que f est intégrable, on
va utiliser la proposition 5.1. Comme f est à support compact, il existe a, b ∈ R t.q. a < b et f = 0
sur [a, b]c . On a alors, par la proposition 5.1, f|[a,b] ∈ C([a, b], R) ⊂ L1R ([a, b], B([a, b]), λ). On a donc
|f |dλ = |f|[a,b] |dλ < ∞ et donc f ∈ L1R (R, B(R), λ). Enfin, la proposition 5.1 donne aussi :
R R

Z Z b
f|[a,b] dλ = f (x)dx.
a
R Rb
D’où l’on conclut bien que f dλ = a
f (x)dx.

Le résultat précédent se généralise à l’intégrale de Riemann des fonctions Riemann-intégrables (construite


à partir des sommes de Darboux). Ceci fait l’objet de l’exercice 5.3.

5.2 Mesures abstraites et mesures de Radon


F
Remarque 5.2 Les propositions 5.1 et 5.3 donnent les résultats suivants :
R
1. Pour f ∈ Cc (R, R), on pose L(f ) = f dλ. L’application L est une application linéaire (de Cc (R, R)
dans R) positive, c’est-à-dire que f ≥ 0 ⇒ L(f ) ≥ 0. (On rappelle que f ≥ 0 signifie que f (x) ≥ 0
pour tout x ∈ R.)
Plus généralement, soit m une mesure sur (R, B(R)), finie sur les compacts. Il est facile de voir
que Cc (R, R) ⊂ L1R (R, B(R), m) R(en toute rigueur, on a plutôt Cc (R, R) ⊂ L1R (R, B(R), m)). Pour
f ∈ Cc (R, R), on pose L(f ) = f dm. L’application L est une application linéaire (de Cc (R, R)
dans R) positive (ou encore une “forme linéaire positive”).
On peut montrer une réciproque de ce résultat (théorème 5.1).

113
R
2. Soit −∞ < a < b < ∞. Pour f ∈ C([a, b], R), on pose L(f ) = f dλ. L’application L est une
application linéaire (de C([a, b], R) dans R) positive.
Ici aussi, plus généralement, soit m une mesure finie sur ([a, b], B([a, b])). Il est facile de voir
que C([a, b], R) ⊂ L1R ([a, b], B([a, 1
R b]), m) (ou plutôt C([a, b], R) ⊂ LR ([a, b], B([a, b]), m)). Pour f ∈
C([a, b], R), on pose L(f ) = f dm. L’application L est une application linéaire (de C([a, b], R)
dans R) positive (ou encore une “forme linéaire positive”).
Ici aussi, on peut montrer une réciproque de ce résultat (voir la remarque 5.5).

On énonce maintenant des résultats, dûs à F. Riesz, qui font le lien entre les applications linéaires
(continues ou positives) sur des espaces de fonctions continues (c’est cela que nous appellerons “mesures
de Radon”) et les mesures “abstraites” sur B(R) (c’est-à-dire les applications σ−additives sur les boréliens
de R, à valeurs dans R ou R+ , non identiquement égales à +∞). Le théorème 5.1 donné ci après est parfois
appelé “Théorème de représentation de Riesz en théorie de la mesure”. Dans ce cours, nous utilisation
l’appelation “Théorème de représentation de Riesz” pour le théorème 6.8, il s’agit du “Théorème de
représentation de Riesz dans les espaces de Hilbert”.

Théorème 5.1 (Riesz) Soit L une forme linéaire positive sur Cc dans R, alors il existe une unique
mesure m sur (R, B(R)) t.q. : Z
∀ f ∈ Cc , L(f ) = f dm. (5.1)

De plus, m est finie sur les compacts (c’est-à-dire m(K) < ∞ pour tout compact K de R.)

Démonstration : La partie “unicité” de cette démonstration est assez facile et est donnée dans la
proposition 5.4. La partie “existence” est plus difficile, on en donne seulement le schéma général.
Soit L une forme linéaire positive sur Cc (R, R).
1. Montrer que L est continue, c’est-à-dire : pour tout compact K de R, il existe CK ∈ R t.q.
pour toute fonction continue à support dans K, |L(f )| ≤ CK kf k∞ . (Considérer une fonction
ψK ∈ Cc (R, R) t. q. ψK (x) = 1 si x ∈ K, et ψK (x) ≥ 0).
2. Montrer le lemme suivant:

Lemme 5.1 (Dini) Soient (fn )n∈N ⊂ Cc (R, R) et f ∈ Cc (R, R) t.q. fn ↑ f ou fn ↓ f lorsque
n → +∞. Alors fn converge uniformément vers f .
3. Déduire des deux étapes précédentes que si (fn )n∈N ⊂ Cc (R, R) et f ∈ Cc (R, R) t.q. fn ↑ f ou
fn ↓ f lorsque n → +∞, alors L(fn ) → L(f ).

4. Soient (fn )n∈N et (gn )n∈N ⊂ Cc (R, R) des suites telles que fn ↑ f et gn ↑ g (ou fn ↓ f et gn ↓ g), où
f et g sont des fonctions de R dans R. Montrer que si f ≤ g alors limn→+∞ L(fn ) ≤ limn→+∞ L(gn )
(et dans le cas particulier où f = g, limn→+∞ L(fn ) = limn→+∞ L(gn )). [On pourra, par exemple,
considérer, pour n fixé, hp = inf(gp , fn ) et remarquer que hp ↑ fn .]
5. On définit:

A+ = {f : R → R; ∃(fn )n∈N ⊂ Cc (R, R); fn ↑ f et lim L(fn ) < +∞}, (5.2)


n→+∞
A− = {f : R → R; ∃(fn )n∈N ⊂ Cc (R, R); fn ↓ f et lim L(fn ) > −∞}, (5.3)
n→+∞

114
Si f ∈ A+ , on pose L(f ) = limn→+∞ L(fn ), où (fn )n∈N ⊂ Cc (R, R); fn ↑ f . Si f ∈ A− , on pose
L(f ) = limn→+∞ L(fn ), où (fn )n∈N ⊂ Cc (R, R); fn ↓ f . Vérifier que ces définitions sont cohérentes
(c’est-à-dire qu’elles ne dépendent pas des suites choisies et que si f ∈ A+ ∩ A− , les deux définitions
coincident). Montrer les propriétés suivantes:
(a) Si f ∈ A+ (resp. A− ) alors −f ∈ A− (resp. A+ )et L(−f ) = −L(f ).
(b) Si f, g ∈ A+ (resp. A− ) alors f + g ∈ A+ (resp. A− ) et L(f + g) = L(f ) + L(g).
(c) Si f ∈ A+ (resp. A− ) et α ∈ R+ alors αf ∈ A+ (resp. A− ) et L(αf ) = αL(f ).
(d) Si f ∈ A+ (resp. A− ) et g ∈ A+ alors sup(f, g) ∈ A+ et inf(f, g) ∈ A+ .
(e) Si f, g ∈ A+ (resp. A− ) et f ≥ g, alors L(f ) ≥ L(g).
(f) Si (fn )n∈N ⊂ A+ (resp. A− ) et fn ↑ f ∈ A+ (resp. fn ↓ f ∈ A− ), alors L(fn ) ≥ L(f ).
(g) Soit (fn )n∈N ⊂ A+ (resp. A− ) t.q. fn ↑ f (resp. fn ↓ f ), où f est une fonction de R dans R.
Si limn→+∞ L(fn ) < +∞, alors f ∈ A+ .
Remarquer aussi que A+ contient toutes les fonctions caractéristiques des ouverts bornés et que A−
contient toutes les fonctions caractéristiques des compacts.
6. On pose:

E = {f : R → R; ∀ε > 0, ∃g ∈ A+ et h ∈ A− ; h ≤ f ≤ g et L(g) − L(h) ≤ ε} (5.4)

et pour f ∈ E, on définit:
L(f ) = sup L(h) = inf L(g). (5.5)
h∈A− g∈A−
h≤f g≥f

Montrer que cette définition a bien un sens, c’est-à-dire que d’une part :

sup L(h) = inf L(g),


h∈A− g∈A−
h≤f g≥f

et d’autre part la définition de L sur E est compatible avec la définition sur A+ et A− (après avoir
remarqué que A+ ⊂ E et A− ⊂ E). Montrer les propriétés suivantes sur E:
(a) E est un espace vectoriel et L une forme linéaire positive sur E.
(b) E est stable par passage à la limite croissante ou décroissante.
(c) E est stable par inf et sup, i.e. si f ∈ E et g ∈ E, alors sup(f, g) ∈ E et inf(f, g) ∈ E.
7. Soit (ϕn )n∈N ⊂ Cc t.q. 0 ≤ ϕn ≤ 1 et ϕn ↑ 1. On pose T = {A ∈ P(R); 1A ϕn ∈ E∀n ∈ N}. Montrer
que T ⊃ B(R).
8. Pour A ∈ T , on pose: m(A) = limn→+∞ L(1A ϕn ) ∈ R ∪ {+∞}. Montrer que m est une mesure
σ-finie.
9. Montrer que L1 (R, T, m) = E et que f dm = L(f ), ∀f ∈ E.
R

Proposition 5.4 Soit d ≥ 1, m et µ deux mesures sur B(Rd ), finies sur les compacts. On suppose que
f dm = f dµ, pour tout f ∈ Cc (Rd , R). Alors m = µ.
R R

115
Démonstration : La démonstration de cette proposition peut se faire en utilisant la proposition 2.5.
Elle est faite pour d = 1 au chapitre 4 (proposition 4.11. Sa généralisation au cas d > 1 est laissée en
exercice.

Remarque 5.3 Le théorème 5.1 donne un autre moyen de construire la mesure de Lebesgue que celui
vu au chapitre 2 :
Rb
Pour f ∈ Cc (R, R), on pose L(f ) = a f (x)dx, où a, b ∈ R sont choisis pour que f = 0 sur [a, b]c (on
utilise ici l’intégrale des fonctions continues sur un compact de R). L’application L est clairement linéaire
positive
R de Cc (R, R) dans R. Le théorème 5.1 donne donc l’existence d’une mesure m sur B(R) t.q.
f dm = L(f ) pour tout f ∈ Cc (R, R). Cette mesure est justement la mesure de Lebesgue (elle vérifie
bien m(]a, b[) = b − a pour tout a, b ∈ R, a < b).

Définition 5.1 On définit les espaces de fonctions continues (de R dans R) suivants :

Cb (R, R) = {f ∈ C(R, R); sup |f (x)| < ∞},


x∈R

C0 (R, R) = {f ∈ C(R, R); f (x) → 0 quand |x| → ∞},


Cc (R, R) = {f ∈ C(R, R); ∃K ⊂ R, K compact, f = 0 sur K c }.
Pour f ∈ Cb (R, R), on pose kf ku = supx∈R |f (x)|. La norme k · ku s’appelle “norme de la convergence
uniforme” (elle est aussi parfois appelée “norme infinie”.)

Il est clair que Cc (R, R) ⊂ C0 (R, R) ⊂ Cb (R, R) et on rappelle que Cb (R, R) et C0 (R, R) sont des espaces
de Banach (e.v.n. complet) avec la norme k · ku

Remarque 5.4 Soit m une mesure finie sur B(R), alors Cb (R, R) ⊂ L1R (R,RB(R), m) (en toute rigueur,
on a plutôt Cb ⊂ L1R (R, B(R), m)). Pour f ∈ Cb (R, R), on pose L(f ) = f dm. L’application L est
alors une application linéaire sur Cb (R, R). On munit Cb (R, R) de la norme de la convergence uniforme,
L’application L est alors continue (car L(f ) ≤ m(E)kf ku pour tout f ∈ Cb (R, R)). L’application L est
aussi positive, c’est-à-dire que f ≥ 0 ⇒ L(f ) ≥ 0. On donne ci-après des réciproques partielles de ces
résultats.

Théorème 5.2 (Riesz) Soit L une application linéaire positive de C0 dans R, alors il existe une unique
mesure m finie sur (R, B(R)) t.q. :
Z
∀ f ∈ C0 , L(f ) = f dm. (5.6)

Démonstration : Ici aussi, on ne donne qu’un schéma de la démonstration.


Soit L une application linéaire positive de C0 dans R.
1. Pour montrer que si m existe, alors m est finie, considérer les fonctions fn = 1[−n,n] + (x + n +
1)1[−(n+1),n] + (n + 1 − x)1[n,n+1] , et la continuité de L.
2. Montrer que L est continue.[Raisonner par l’absurde en supposant que L est positive et non continue :
en utilisant le fait que si L est non continue alors L est non bornée sur la boule unité, construire
une suite gn de fonctions positives telles que la série de terme général gn converge absolument. Soit
g la limite de la série de terme général gn , montrer que T (g) > n, ∀ n ∈ N.]

116
3. Montrer que la restriction T de L à Cc (R,RR) est linéaire continue, et donc par le théorème 5.1 qu’il
existe une unique mesure m t.q. T (f ) = f dm, ∀f ∈ Cc (R, R).
R
4. Montrer que L(f ) = f dm ∀f ∈ C0 (R, R) [approcher f de manière uniforme par fn ∈ Cc (R, R),
c
prendre par exemple: fn = f ϕn où ϕn ∈ Cc (R, R), ϕn = R 1 sur [−n,
R n] et ϕn (x) = 0 sur [−(n+1), n] .
Montrer que limn→+∞ L(fn ) = L(f ) et que limn→+∞ fn dm = f dm .

Le résultat du théorème 5.2 est faux si on remplace C0 par Cb . On peut, par exemple, construire une
application linéaire continue positive sur Cb , non identiquement nulle sur Cb et nulle sur C0 . Si on note
L une telle application (nulle R sur C0 mais non identiquement nulle sur Cb ) et si mR est une mesure finie
sur (R, B(R)) t.q. L(f ) = f dm pour f ∈ Cb , on montre facilement (en utilisant f dm = 0 pour tout
f ∈ C0 ) que m = 0 et donc L(f ) = 0 pour tout f ∈ Cb , en contradiction avec le fait que L n’est pas
identiquement nulle sur Cb .
Pour construire une application linéaire continue positive sur Cb , non identiquement nulle et nulle sur
C0 , on peut procéder de la manière décrite ci après. On note F le sous espace vectoriel de Cb formé des
éléments de Cb ayant une limite en +∞. On a donc f ∈ F si f ∈ Cb et si il existe l ∈ R t.q. f (x) → l
quand x → ∞. Pour f ∈ F on pose L̃(f ) = limx→∞ f (x). On a ainsi défini une forme linéaire positive
sur F (car, pour f ∈ F , f (x) ≥ 0 pour tout x ∈ R implique bien L̃(f ) ≥ 0). En utilisant le théorème
5.3 donné ci après, il existe donc L, forme linéaire positive sur Cb , t.q. L = L̃ sur F . L’application L est
donc linéaire continue positive sur Cb (pour la continuité, on remarque que |L(f )| ≤ kf ku ), elle est bien
nulle sur C0 (car limx→∞ f (x) = 0 si f ∈ C0 ⊂ F ) et non identiquement nulle sur Cb car L(f ) = 1 si f
est la fonction constante, égale à 1 en tout point.

Théorème 5.3 (Hahn-Banach positif )


Soit F un sous espace vectoriel de Cb = {f ∈ C(R, R); supx∈R |f (x)| < ∞} et T une application linéaire
de F dans R. On suppose que F contient les fonctions constantes et que T est positive (c’est-à-dire que,
pour f ∈ F , f (x) ≥ 0 pour tout x ∈ R implique T (f ) ≥ 0). Il existe alors T , application linéaire positive
sur Cb , t.q. T = T sur F .

Démonstration : La démonstration n’est pas détaillée ici. Elle peut se faire en utilisant une technique
très similaire à celle donnant la démonstration du théorème de Hahn-Banach (qui permet aussi de montrer
le théorème de prolongement d’une application linéaire continue définie sur un sous espace vectoriel d’un
espace de Banach). Elle peut aussi se faire en se ramenant au théorème de Hahn-Banach lui-même tel
qu’il est donné, par exemple, dans le livre d’analyse fonctionnelle de H. Brezis.

Il est intéressant de noter que le résultat du théorème peut être faux si on retire l’hypothèse “F contient
les fonctions constantes”.

On peut maintenant faire la remarque suivante:


Remarque 5.5 Soit K une partie compacte de R. On note C(K, R) = {f|K , f ∈ Cb }. Si m est une
mesure finie sur (K, B(K)) Rl’espace fonctionnel C(K, R) est inclus dans L1R (K, B(K), m), et l’application
qui à f ∈ C(K, R) associe f dm est linéaire positive (et continue, si C(K, R) est muni de la norme de
la convergence uniforme). Réciproquement, soit L une application linéaire positive de C(K, R) dans R.
Le théorème précédent permet de montrer qu’il existe une unique mesure finie, notée m, sur (K, B(K))
t.q. : Z
L(f ) = f dm, ∀f ∈ C(K, R). (5.7)

117
Considérons maintenant le cas des mesures signées: si m est une mesure signée sur (R, B(R)) (ou R sur
(K, B(K))), l’application qui à f ∈ C0 (ou ∈ C(K), K étant une partie compacte de R) associe f dm
est linéaire continue (pour la norme de la convergence uniforme). Réciproquement, on a aussi existence
et unicité d’une mesure (signée) définie à partir d’une application linéaire continue de C0 (ou de C(K))
dans R:

Théorème 5.4 (Riesz, mesures signées) Soit L une application linéaire continue (pour la norme in-
finie) de C0 (R, R) dans R (ou de C(K, R) dans R, où K est un compact de R). Alors il existe une unique
mesure signée, notée m, sur B(R) (ou sur B(K)) t.q. :
Z
L(f ) = f dm, ∀f ∈ C0 (R, R)( ou C(K, R)). (5.8)

Les éléments de (C0 (R, R))0 (ou (C(K, R))0 ) sont appelés ”mesures de Radon” sur R (ou K). On rappelle
que, pour un espace de Banach (réel) E, on note E 0 son dual topologique, c’est-à-dire l’ensemble des
applications linéaires continues de E dans R.
Démonstration : Elle consiste à se ramener au théorème de Riesz pour des formes linéaires positives.
Elle n’est pas détaillée ici. On rappelle seulement que si m est une mesure signée sur T (tribu sur
un ensemble E). il existe deux mesures finies m+ et m− sur T , étrangères (c’est-à-dire qu’il existe
A ∈ T t.q. m+ (A) = m− (Ac ) = 0) et t.q. m = m+ R− m− . On R a alors (par
R définition) L1R (E, T, m) =
1 + 1 − 1 + −
LR (E, T, m ) ∩ LR (E, T, m ) et, si f ∈ LR (E, T, m), f dm = f dm − f dm .

Définition 5.2 (Mesure de Radon) Soit Ω un ouvert borné de R, alors on appelle mesure de Radon
sur Ω un élément de (C(Ω, R))0 , c’est-à-dire une application linéaire continue (pour la norme infinie) de
C(Ω, R) dans R.

Remarque 5.6 Soit T une forme linéaire sur Cc (Ω, R).

1. Si T est continue pour la norme k.k∞ , on peut montrer


R qu’il existe une et une seule mesure signée,
notée µ, sur les boréliens de Ω telle que T (f ) = f dµ, pour tout f ∈ Cc (Ω, R). Pour montrer
l’existence de µ, on peut commencer par se ramener au théorème 5.4 en prolongeant T (de manière
non unique) en une application linéaire continue sur C(Ω, R) (ceci est possible par le théorème
de Hahn-Banach). Le théorème 5.4 donne alors une (unique) mesure sur B(Ω) correspondant à
ce prolongement de T . La restriction de cette mesure à B(Ω) est la mesure µ recherchée. Il est
intéressant de remarquer que cette mesure µ est unique, sans que celle donnée par le théorème 5.4
soit unique (car cette dernière dépend du prolongement choisi de T à C(Ω, R)).
2. Si T est continue pour la topologie “naturelle” de Cc (Ω, R), (c’est-à-dire que, pour tout compact
K ⊂ Ω, il existe CK ∈ R tel que T (f ) ≤ CK kf k∞ , pour tout f ∈ Cc (Ω, R) avec f = 0 sur
le complémentaire de K) alors ce résultat est faux ; par contre onR peut montrer
R qu’il existe deux
mesures (positives) µ1 et µ2 sur les boréliens de Ω telles que T (f ) = f dµ1 − f dµ2 , ∀ f ∈ Cc (Ω, R) ;
noter quePµ1 et µ2 peuvent prendre toutes les deux la valeur +∞ (exemple : N = 1, Ω =] − 1, 1[,
T (f ) = n∈N? nf (1 − n1 ) − n∈N? nf (−1 + n1 )), et donc que (µ1 − µ2 )(Ω) n’a pas toujours un
P
sens. . . .
Soit maintenant T une forme linéaire sur Cc∞ (Ω, R), continue pour la norme R k · ku , alors il existe une et
une seule mesure signée, notée µ, sur les boréliens de Ω telle que T (f ) = f dµ, ∀ f ∈ Cc∞ (Ω, R).

118
5.3 Changement de variables, densité et continuité
On montre dans cette section quelques propriétés importantes de l’espace L1R (R, B(R), λ) (et éventuelle-
ment de L1R (R, B(R), µ) si µ est finie sur les compacts)
Proposition 5.5 (Changement de variable affine) Soient α ∈ R? , β ∈ R et f ∈ 1
R L (R, B(R),
R λ). On
1 1
définit g : R → R par g(x) = f (αx + β) pour x ∈ R. Alors, g ∈ L (R, B(R), λ) et gdλ = |α| f dλ.
Le même résultat reste vrai en remplaçant L1 par L1 .
Démonstration :
1. On pose ϕ(x) = αx + β, pour tout x ∈ R, de sorte que g = f ◦ ϕ. Comme f et ϕ sont boréliennes
(noter que ϕ est même continue), g est aussi borélienne, c’est-à-dire g ∈ M.
2. Pour montrer que g ∈ L1 (R, B(R), λ) et
Z Z
1
gdλ = f dλ, (5.9)
|α|
on raisonne en plusieurs étapes :
(a) On suppose que f = 1A avec A ∈ B(R) t.q. λ(A) < ∞. On a alors g = 1 1 A− β (avec
α α
1 β β
αA −α = { α1 x − α , x ∈ A}). On a donc g ∈ L1 (R, B(R), λ) et (5.9) est vraie (car on a déjà
β
vu que λ( α1 A − α 1
) = |α| λ(A), dans la proposition 2.9).
(b) On suppose
Pn que f ∈ E+ ∩ L1 (R, B(R), λ). Il existe donc a1 , . . . , an > 0 et A1 , . . . , An ∈ T t.q.
1
f = i=1 ai 1A i . Comme f ∈ L (R, B(R), λ), on a aussi λ(Ai ) < ∞ pour tout i. On conclut
n
alors que g = i=1 ai 1 1 Ai − β , ce qui donne que g ∈ E+ ∩ L1 (R, B(R), λ) et que (5.9) est vraie.
P
α α

(c) On suppose que f ∈ M+ ∩ RL1 (R, B(R), 1


R λ). Il existe (fn )n∈N ⊂ E+ ∩ L (R, B(R), λ) t.q. fn ↑ f
quand n → ∞. On a donc fn dλ ↑ f dλ quand n → ∞. On définit gn Rpar gn (x) = αx + β,
pour tout x ∈ R. On a alors gn ∈ E+ ∩ L1 (R, B(R), λ), gn ↑ g et gn dλ ↑ gdλ quand n → ∞.
R

Comme (5.9) est vraie pour f = fn et g = gn , on en déduit que g ∈ M+ ∩ L1 (R, B(R), λ) et


(5.9) est vraie.
(d) On suppose enfin seulement que f ∈ L1 (R, B(R), λ). Comme f = f + − f − , avec f ± ∈ M+ ∩
L1 (R, B(R), λ), on peut utiliser l’étape précédente avec f ± et on obtient que g ∈ L1 (R, B(R), λ)
et que (5.9) est vraie.
3. Le résultat obtenu est encore vrai pour L1 au lieu de L1 . Il suffit de remarquer que
f1 = f2 p.p. ⇒ g1 = g2 p.p. ,
avec gi (·) = fi (α · +β), i = 1, 2.
En fait, lorsque f décrit un élément de L1 (qui est un ensemble d’éléments de L1 ), la fonction
g(α · +β) décrit alors un élément de L1 .

Le résultat de densité que nous énonçons à présent permet d’approcher une fonction de L1R (R, B(R), λ)
“aussi près que l’on veut” par une fonction continue à support compact. Ce résultat est souvent utilisé
pour démontrer certaines propriétés des fonctions de L1 : On montre la propriété pour les fonctions
continues, ce qui s’avère en général plus facile, et on “passe à la limite”.

119
Théorème 5.5 (Densité de Cc (R, R) dans L1R (R, B(R), λ))
L’ensemble Cc (R, R) des fonctions continues de R dans R et à supports compacts, est dense dans L1 =
L1R (R, B(R), λ), c’est-à-dire :

∀f ∈ L1R (R, B(R), λ), ∀ε > 0, ∃ϕ ∈ Cc (R, R); kf − ϕk1 < ε.

Démonstration :
On a déjà vu que Cc (R, R) ⊂ L1 . En toute rigueur, on a plutôt Cc (R, R) ⊂ L1 = L1R (R, B(R), λ).
L’objectif est donc de montrer que pour tout f ∈ L1 et tout ε > 0, il existe ϕ ∈ Cc (R, R) t.q. kf −ϕk1 ≤ ε.
On va raisonner une nouvelle fois en plusieurs étapes (fonctions caractéristiques, E+ , M+ et enfin L1 ).

Etape 1. On suppose ici que f = 1A avec A ∈ B(R) et λ(A) < ∞.


Soit ε > 0. Comme λ est une mesure régulière (proposition 2.3), il existe un ouvert O et un fermé F
t.q. F ⊂ A ⊂ O et λ(O \ F ) ≤ ε. Pour n ∈ N? , on pose Fn = F ∩ [−n, n], de sorte que Fn est compact
(pour tout n) et F = ∪n∈N? Fn . La continuité croissante de λ donne alors λ(Fn ) ↑ λ(F ), quand n → ∞.
Comme λ(F ) ≤ λ(A) < ∞, on a aussi λ(F \ Fn ) = λ(F ) − λ(Fn ) → 0 quand n → ∞. Il existe donc n0
t.q. λ(F \ Fn0 ) ≤ ε.
On pose K = Fn0 et on obtient donc K ⊂ F ⊂ A ⊂ O. Ce qui donne λ(O\K) ≤ λ(O\F )+λ(F \K) ≤ 2ε.
On a donc trouvé un compact K et un ouvert O t.q. K ⊂ A ⊂ O et λ(O \ K) ≤ 2ε. ceci va nous
permettre de construire ϕ ∈ Cc (R, R) t.q. kf − ϕk1 ≤ 2ε.
On pose d = d(K, Oc ) = inf{d(x, y), x ∈ K, y ∈ Oc }. On remarque que d > 0. En effet, il existe
(xn )n∈N ⊂ K et (yn )n∈N ⊂ Oc t.q. d(xn , yn ) = |xn − yn | → d quand n → ∞. Par compacité de K, on
peut supposer (après extraction éventuelle d’une sous suite) que xn → x, quand n → ∞. Si d = 0, on a
alors aussi yn → x quand n → ∞ et donc x ∈ Oc ∩ K (car K et Oc sont fermés). Ce qui est impossible
car Oc ∩ K = ∅. On a donc bien montré d > 0.
On pose maintenant , pour tout x ∈ R, ϕ(x) = d1 (d − d(x, K))+ avec d(x, K) = inf{d(x, y), y ∈ K}. La
fonction ϕ est continue car x 7→ d(x, K) est continue (cette fonction est même lipschitzienne, on peut
montrer que |d(x, k) − d(y, K)| ≤ |x − y|). Elle est à support compact car il existe A > 0 t.q. K ⊂ [−A, A]
et on remarque alors que ϕ = 0 sur [−A − d, A + d]c . On a donc ϕ ∈ Cc (R, R). Enfin, on remarque
que ϕ = 1 sur K, ϕ = 0 sur Oc et 0 ≤ ϕ ≤ 1 (partout). On en déduit que f − ϕ = 0 sur K ∪ Oc et
0 ≤ |f − ϕ| ≤ 1, ce qui donne
kf − ϕk1 ≤ λ(O \ K) ≤ 2ε,
et termine donc la première (et principale) étape.

1
EtapePn2. On suppose ici que1 f ∈ E+ ∩ L . Il existe donc a1 , . . . , an > 0 et A1 , . . . , An ∈ T t.q.
f = i=1 ai 1Ai . Comme f ∈ L , on a aussi λ(Ai ) < ∞ pour tout i.
Soit P de ϕi ∈ Cc (R, R) t.q. k1Ai − ϕi k1 ≤ ε. On pose
ε > 0, l’étape 1 donne, pour tout i, l’existence P
n n
ϕ = i=1 ai ϕi ∈ Cc (R, R) et on obtient kf − ϕk1 ≤ ( i=1 ai )ε (ce qui est bien arbitrairement petit).

Etape 3. On suppose ici que f ∈ M+ ∩ L1 .


Soit
R ε > 0. D’après
R R M+ (lemme 4.3), Il existe g ∈ E+ t.q. g ≤ f et
la Rcaractérisation de l’intégrale dans
f dλ − ε ≤ gdm ≤ f dm, de sorte que kg − f k1 = (f − g)dλ ≤ ε. L’étape 2 donne alors l’existence
de ϕ ∈ Cc (R, R) t.q. kg − ϕk1 ≤ ε. D’où l’on déduit kf − ϕk1 ≤ 2ε. Ce qui termine l’étape 3.

Etape 4. On suppose enfin que f ∈ L1 .

120
Soit ε > 0. Comme f ± ∈ M+ ∩ L1 , l’étape 3 donne qu’il existe ϕ1 , ϕ2 ∈ Cc (R, R) t.q. kf + − ϕ1 k1 ≤ ε et
kf − − ϕ2 k1 ≤ ε. On pose alors ϕ = ϕ1 − ϕ2 . On a ϕ ∈ Cc (R, R) et kf − ϕk1 ≤ 2ε. Ce qui prouve bien
la densité de Cc (R, R) dans L1 .

Le résultat de densité que nous venons de démontrer n’est pas limité à la mesure de Lebesgue. Il est vrai
pour toute mesure sur B(R), finie sur les compacts. Il est aussi vrai en remplaçant Cc par Cc∞ . Enfin, il
n’est pas limité à R, il est également vrai dans Rd , d ≥ 1. Tout ceci est montré dans l’exercice 7.13. Par
contre, le résultat que nous montrons maintenant n’est pas vrai pour toute mesure sur B(R), finie sur les
compacts (voir l’exercice 7.13).

Théorème 5.6 (Continuité en moyenne) Soient f ∈ L1R (R, B(R), λ) et h ∈ R. On définit fh (“trans-
latée” de f ) par : fh (x) = f (x + h), pour presque tout x ∈ R. Alors :
Z
kfh − f k1 = |f (x + h) − f (x)|dx → 0 lorsque h → 0. (5.10)

Démonstration :
Soient f ∈ L1R (R, B(R), λ) et h ∈ R. On remarque que fh = f (· + h) ∈ L1R (R, B(R), λ) (d’après la
proposition 5.5). D’autre part f = g p.p. implique fh = gh p.p.. On peut donc définir fh comme élément
de L1R (R, B(R), λ) si f ∈ L1R (R, B(R), λ).
La démonstration de (5.10) fait l’objet de l’exercice 5.14.

5.4 Intégrales impropres des fonctions de R dans R


On considère ici des fonctions de R dans R, et l’espace mesuré (R, B(R), λ).
Définition 5.3 (Intégrabilité à gauche) Soient f : R → R, α ∈ R et a ∈ R ∪ {+∞}, a > α ; on
suppose que ∀ β ∈]α, a[, f 1]α,β[ ∈ L1 (= L1R (R, B(R), λ)). On dit que f est intégrable à gauche en a
Z a Z
(ou encore que existe) si f 1]α,β[ dλ a une limite dans R lorsque β → a. Cette limite est notée
Z a
f (t)dt.
α

Remarque 5.7 Ceci ne veut pas dire que f 1]α,a[ ∈ L1 . Il suffit pour s’en convaincre de prendre a = +∞,
sin x
α = 0, considérer la fonction f définie par f (0) = 1 et, pour x > 0, f (x) = .
x
Par contre, dès que la fonction f considérée est de signe constant, on a équivalence entre les deux notions :

Proposition 5.6 Soient f : R → R+ , α ∈ R et a ∈ R ∪ {+∞}, a > α ; on suppose que ∀ β ∈]α, a[,


f 1]α,β[ ∈ L1 (= L1R (R, B(R), λ)). Alors f est intégrable à gauche en a si et seulement si f 1]α,a[ ∈ L1 .
Démonstration : Ce résultat se déduit du théorème de convergence monotone (construire une suite qui
tend en croissant vers f 1]α,a[ ).

121
5.5 Exercices
Exercice 5.1 (La mesure de Dirac n’est pas une fonction. . . )
On note E = C([0, 1], R) et on munit E de la norme de la convergence uniforme. Soit T l’application de
E dans R définie par T (ϕ) = ϕ(0). On note aussi δ0 la mesure de Dirac en 0 sur B([0, 1]).

1. Montrer que T ∈ E 0 (on rappelle que E 0 est le dual topologique de E, c’est à dire l’ensemble des
applications linéaires continues de E dans R).
2. Soit ϕ ∈ E. Monter que ϕ ∈ L1 ([0, 1], B([0, 1]), δ0 ) et que T (ϕ) = ϕdδ0 , où δ0 est la mesure de
R

Dirac en 0.

3. Soient g ∈ L1R ([0, 1], B([0, 1]), λ) et (ϕnR)n∈N ⊂ E définie par: ϕn (x) = (1/n)(n − n2 x)+ , pour tout
x ∈ [0, 1] et tout n ∈ N. Montrer que gϕn dλ → 0 lorsque n → +∞.
1
R qu’il n’existe pas g ∈ LR ([0, 1], B([0, 1]), λ) t.q. on ait, pour toute fonction ϕ ∈ E:
En déduire
T (ϕ) = gϕdλ.
4. Montrer que δ0 n’est pas une mesure de densité par rapport à λ.

Exercice 5.2
Soit (fn )n∈N la suite de fonctions de ]0, 1[ dans R définie par fn (x) = (n − n2 x)+ . On note λ la mesure
de Lebesgue sur la tribu B(R) des boréliens de ]0, 1[, et L1 = L1R (]0, 1[, B(R), λ).
Soit T l’application de C([0, 1], R) dans R définie par T (ϕ) = ϕ(0).
 0  0
1. Montrer que T ∈ C([0, 1], R) (on rappelle que C([0, 1], R) est le dual de C([0, 1], R), c’est à
dire l’ensemble des formes linéaires continues sur C([0, 1], R) muni de la norme uniforme).
R
2. Montrer que T (ϕ) = ϕdδ0 , où δ0 est la mesure de Dirac en 0.
 
fn
3. Soient g ∈ L1 (]0, 1[, R) et (ϕn )n∈N ⊂ C([0, 1], R) définie par: ϕn = 2n
R
. Montrer que gϕn dλ → 0
lorsque n → +∞.
1
R qu’il n’existe pas g ∈ L (]0, 1[, R) t.q. on ait, pour toute fonction ϕ ∈ C([0, 1], R):
En déduire
T (ϕ) = gϕdλ; montrer que δ0 n’est pas une mesure de densité.

Exercice 5.3 (Intégrale de Riemann) Soient a, b des réels, a < b et f : [a, b] → R une fonction
bornée, i.e. telle qu’il existe M ∈ R t.q. |f (t)| ≤ M, ∀t ∈ [a, b]. Soit ∆ une subdivision de [a, b], ∆ =
PN
{x0 , x1 , . . . , xN +1 } avec x0 = a < x1 < . . . < xN +1 = b. On pose S ∆ = i=0 (supx∈[xi ,xi+1 ] f (x))(xi+1 −
PN
xi ), et S∆ = i=0 (inf x∈[xi ,xi+1 ] f (x))(xi+1 − xi ). On note A l’ensemble des subdivisions de [a, b] et
S ? = inf ∆∈A S ∆ , et S? = sup∆∈A S∆ . On dit que f est Riemann intégrable si S ? = S? . On pose alors
Rb
R a f (x)dx = S ? .
1. Soient ∆1 et ∆2 ∈ A tels que ∆1 ⊂ ∆2 . Montrer que S∆1 ≤ S∆2 ≤ S ∆2 ≤ S ∆1 . En déduire que
0
S∆ ≤ S ∆ pour tous ∆, ∆0 ∈ A, et donc que S? ≤ S ? .
2. Montrer qu’il existe une suite de subdivisions (∆n )n∈N telle que S∆n → S? et S ∆n → S ? quand
n → +∞.

3. Montrer que si f est continue, f est Riemann-intégrable.

122
4. On suppose maintenant que f est Riemann-intégrable. Soit (∆n )n∈N une suite t.q. S∆n → S? et
(n) (n)
S ∆n → S ? quand n → +∞. Pour ∈ N, on note ∆n = {xO , . . . , xNn +1 }, et on pose:
(n) (n) (n) (n)
gn (x) = inf{f (y), y ∈ [xi , xi+1 ]}, xi ≤ x < xi+1 , i = 0, . . . , Nn + 1 (5.11)
(n) (n) (n) (n)
hn (x) = sup{f (y), y ∈ [xi , xi+1 ]}, xi ≤x< xi+1 , i = 0, . . . , Nn + 1 (5.12)
gn (b) = hn (b) = 0. (5.13)

(a) Montrer
R que gn et hn ∈ M ∩ L1 , où M = M({[a, b], B(R), λ}) et L1 = L1 ({[a, b], B(R), λ}), et
que (hn − gn )dλ → 0 quand n → +∞.
(b) Montrer que gn ≤ gn+1 ≤ f ≤ gn+1 ≤ hn , ∀n ∈ N.
(c) On pose g = limn→+∞ gn et h = limn→+∞ hn ; montrer que g = h p.p. . En déduire que
Rb
f ∈ L1 et que f dλ = R a f (x)dx.
R

(d) Soit f définie par:

f (x) = 1 si x ∈ Q, (5.14)
f (x) = 0 si x 6∈ Q. (5.15)

Montrer que f n’est pas Riemann intégrable, mais que f ∈ L1R ([a, b], B(R), λ).

Exercice 5.4 Corrigé 87 page 368


Soit (fn )n∈N ⊂ C 1 (]0, 1[, R) convergeant simplement vers la fonction f :]0, 1[→ R; on suppose que la suite
(fn0 )n∈N (⊂ C(]0, 1[, R) ) converge simplement vers la fonction constante et égale à 1.

1. A-t-on f ∈ C 1 (]0, 1[, R) et f 0 = 1 ?


2. On suppose maintenant que la suite (fn0 )n∈N converge vers la fonction constante et égale à 1 dans
L1R (]0, 1[, B(]0, 1[), λ). A-t-on f ∈ C 1 (]0, 1[, R) et f 0 = 1 ?

Exercice 5.5 (Intégrale impropre) Corrigé 88 page 369


On définit l’application f de R dans R par :

f (x) = 0, si x ≤ 0,
f (x) = x2 sin x12 , si x > 0.

1. Montrer que f est continue et dérivable en tout point de R.


Rb
2. Soit 0 < a < b < ∞. Montrer que f 0 1]a,b[ ∈ L1R (R, B(R), λ). On pose f 0 (t)dt = f 0 1]a,b[ dλ.
R
a
Montrer que :
Z b
f (b) − f (a) = f 0 (t)dt.
a

3. Soit a > 0.

(a) Montrer f 0 1]0,a[ 6∈ L1R (R, B(R), λ).


Ra
(b) Pour 0 < x < a, on pose g(x) = x f 0 (t)dt. Montrer que g(x) a une limite (dans R) quand
R a→0 0, avec x > 0, et que cette 0limite est 1égale à f (a) − f (0). (Cette limite
x
0
est aussi notée
0
f (t)dt, improprement. . . car f 1]0,a[ ∈
6 LR (R, B(R), λ), la restriction de f à ]0, a[ n’est donc
pas intégrable pour la mseure de Lebesgue sur ]0, a[.)

123
Exercice 5.6
Soit (E, T, m) un espace mesuré, (fn )n∈N ⊂ L1R (E, T, m) et f ∈ L1R (E, T, m). On supposeR que fn → f dans
L1R (E, T, m) et qu’il existe C ≥ 0 tel que |fn | ≤ C p.p. et pour tout n ∈ N. Montrer que |fn −f |2 dm → 0
lorsque n → +∞.

Exercice 5.7 Corrigé 89 page 371


Rx
Soit f ∈ L1R (R, B(R), λ). On définit F : R → R par: F (x) = f 1[0,x] dλ(= 0 f (t)dt), pour x ≥ 0, et
R
R R0
F (x) = − f 1[x,0] dλ(= − x f (t)dt) pour x < 0. Montrer que F est uniformément continue.

Exercice 5.8 (Intégrabilité et limite à l’infini) Corrigé 90 page 371


Soit f ∈ L1R (R, B(R), λ) = L1 .

1. On suppose que f (x) admet une limite quand x → ∞. Montrer que cette limite est nulle.

2. On suppose que f ∈ C(R, R) ; a-t-on : lim f (x) = 0 ?


x→+∞

3. On suppose que f est uniformément continue ; a-t-on : lim f (x) = 0 ? [On pourra commencer
x→+∞
par montrer que, pour η > 0 quelconque et (xn )n∈N ⊂ R t.q. lim xn = +∞, on a :
n→+∞

Z xn +η
lim |f (x)|dλ(x) = 0.] (5.16)
n→+∞ xn −η

4. On suppose que f ∈ C 1 (R, R) et f 0 ∈ L1 ; a-t-on : lim f (x) = 0 ?


x→+∞

Exercice 5.9

1. On considère l’espace mesuré (E, T, m) = (]0, 1[, B(]0, 1[, λ). Soit 0 < α < +∞ . On pose, pour
1
x ∈]0, 1[, f (x) = ( )α . Pour quelles valeurs de α a-t-on f ∈ L1R (E, T, m) ?
x
2. On considère l’espace mesuré (E, T, m) = (R?+ , B(R?+ ), λ). Soit f définie, pour x ∈]0, +∞[, par :
sin x
f (x) = / L1R (E, T, m). On pose fn = f 1]0,n[ . Montrer que fn ∈ L1R (E, T, m),
. Montrer que f ∈
x Z
que fn → f p.p. (et même uniformément) et que fn dm a une limite dans R lorsque n → +∞.

Exercice 5.10 On munit RN de la tribu borélienne B(RN ) et de la mesure de Lebesgue λN . Soient f et


g ∈ C(RN , R) telles que f = g pp. Montrer que f = g partout. [On dira donc que f ∈ L1 (RN , B(RN ), λn )
est continue si il existe g ∈ C(RN , R) t.q. f = g pp. Dans ce cas on identifie f avec g.]

Exercice 5.11 1. On considère l’espace mesuré (E, T, m) = (]0, 1[, B(R), λ) ; soit 0 < α < +∞ ; on
1
pose, pour x ∈]0, 1[, f (x) = ( )α . Pour quelles valeurs de α a-t-on f ∈ L1R (E, T, m) ?
x
2. On considère l’espace mesuré (E, T, m) = (R?+ , B(R), λ) ; soit f définie, pour x ∈]0, +∞[, par :
sin x
f (x) = / L1R (E, T, m). On pose fn = f 1]0,n[ . Montrer que fn ∈ L1R (E, T, m),
. Montrer que f ∈
x Z
que fn → f p.p. (et même uniformément) et que fn dm a une limite dans R lorsque n → +∞.

124
Exercice 5.12 Soit µ et ν deux mesures finies sur B(R), tribu borélienne sur R.
1. Montrer que si, pour toute fonction continue à support compact on a :
Z Z
f dµ = f dν, (E)

alors µ = ν. [On rappelle (cf. exercice 2.30) que si m est une mesure finie sur B(R), alors :
∀ A ∈ R, m(A) = inf{m(O), O ⊃ A, O ouvert de R}.]
2. On suppose maintenant que l’égalité (E) est vérifiée pour toute fonction f de Cc∞ (R, R). Le résultat
précédent vous parait-il encore vrai ?

Exercice 5.13 (Notation: Soit f une fonction de R dans R, on note f 2 la fonction de R dans R définie
par: f 2 (x) = (f (x))2 .) Soit E = {f ∈ C 1 (R, R); f ∈ L1 = L1R (R, B(R), λ) et f 02 ∈ L1 }. Pour f ∈ E, on
1
définit kf k = |f |dλ + ( |f 0 |2 dλ) 2
R R

1. Montrer que (E, k.k) est un espace vectoriel normé. E est-il un espace de Banach ?
2. Soient a ∈ R et δ ∈ R?+ . Montrer que a ≤ δa2 + 1δ .En déduire que pour f ∈ E, (x, y) ∈ R2 et
δ ∈ R?+ , on a: |f (x) − f (y)| ≤ δ |f 0 |2 dλ + 1δ |x − y|.
R

3. Montrer que si f ∈ E, alors:


• f est uniformément continue.
• f est bornée.
• f 2 ∈ L1 .

Exercice 5.14 (Continuité en moyenne) Corrigé 91 page 373


Pour f ∈ L1 = L1R (R, B(R), λ) et h ∈ R, on définit fh (“translatée” de f ) par : fh (x) = f (x + h), pour
x ∈ R. (noter que fh ∈ L1 ).
1. Soit f ∈ Cc = Cc (R, R), montrer que kfh − f k1 → 0 lorsque h → 0.
2. Soit f ∈ L1 , montrer que kfh − f k1 → 0 lorsque h → 0.

Exercice 5.15 On note L1 = L1R (RN , B(RN ), λN ), et Cb = Cb (RN , R) l’ensemble des fonctions contin-
ues bornées de RN dans R.
1. Pour f ∈ L1 , h ∈ R?+ et x ∈ RN , on définit
Z
1
fh (x) = f (y)dy,
λN (B(0, h)) B(x,h)

où B(0, h) désigne la boule ouverte de centre 0 et de rayon h. Montrer que fh est définie partout,
que fh ∈ L1 , et que fh → f dans L1 lorsque h → 0. En déduire qu’il existe (hn )n∈N t.q. hn → 0
lorsque n → +∞ et fhn → f p.p. lorsque n → +∞.
2. On considère maintenant une suite de mesures (µn )n∈N finies sur (RN , B(RN )), t.q. µn → δ0 dans
Cb0 i.e. ϕdµn → ϕdµ, ∀ϕ ∈ Cb . Soit f une fonction mesurable bornée de RN dans R et intégrable
R R

pour la mesure de Lebesgue, et ν = f λ. Montrer que µn ? ν est une mesure de densité fn ∈ L1 et


montrer que fn → f dans L1 .

125
3. Soit A ∈ R t.q. A ⊂ [0, 1] ; on dit que A est ”bien équilibré” si pour tout intervalle I de [0, 1], on
a : λ(I ∩ A) = λ(I ∩ Ac ) = λ(I)
2 . Montrer qu’il n’existe pas de borélien A de [0, 1] bien équilibré.

Exercice 5.16 (Non existence de borélien “bien équilibré”)


Soit N ≥ 1. On note L1 = L1R (RN , B(RN ), λN ).
1. Pour f ∈ L1 , h ∈ R?+ et x ∈ RN , on définit
Z
1
fh (x) = f (y)dy,
λN (B(0, h)) B(x,h)

où B(x, h) désigne la boule ouverte de centre x et de rayon h. Montrer que fh est définie pour tout
x ∈ RN . Montrer que fh ∈ L1 et que fh → f dans L1 lorsque h → 0. [On pourra, par exemple,
utiliser le théorème de continuité en moyenne dans L1 .]
En déduire qu’il existe (hn )n∈N t.q. hn → 0, lorsque n → +∞, et fhn → f p.p. lorsque n → +∞.

2. Montrer qu’il n’existe pas de borélien A inclus dans [0,1] et t.q. λ(I ∩ A) = λ(I ∩ Ac ) = λ(I) 2 pour
tout intervalle I de [0, 1]. [On pourra raisonner par l’absurde et utiliser la question précédente avec
N = 1 et f convenablement choisi. Cette question est aussi une conséquence de l’exercice 5.17.]
Exercice 5.17 (Sur la concentration d’un borélien) Corrigé 92 page 374
Soit −∞ ≤ a < b ≤ +∞, A ∈ B(]a, b[) et ρ ∈]0, 1[. On suppose que λ(A∩]α, β[) ≤ ρ(β − α) pour tout
α, β t.q. a ≤ α < β ≤ b. Montrer que λ(A) = 0. [On pourra, par exemple, commencer par montrer que
λ(A ∩ O) ≤ ρλ(O) pour tout ouvert O de ]a, b[.]
Conséquence de cet exercice : Soit A ∈ B(]a, b[) t.q. λ(A) > 0. Alors, pour tout ρ < 1, il existe α, β t.q.
a ≤ α < β ≤ b et λ(A∩]α, β[) ≥ ρ(β − α).
Exercice 5.18 (Points de Lebesgue) Corrigé 93 page 375
On désigne par λ la mesure de Lebesgue sur les boréliens de R, par L1 l’espace L1R (R, B(R), λ) et par L1
l’espace L1R (R, B(R), λ). On note dt = dλ(t).
1. Soit (I1 , . . . , In ) des intervalles ouverts non vides de R t.q. chaque intervalle n’est pas contenu dans
la réunion des autres. On pose Ik =]ak , bk [ et on suppose que la suite (ak )k=1,...,n est croissante.
Montrer que la suite (bk )k=1,...,n est croissante et que les intervalles d’indices impairs [resp. pairs]
sont disjoints 2 à 2.
2. Soit J une famille finie d’intervalles ouverts non vide de R dont la réunion est notée A. Montrer
qu’il existe
Pune sous-famille finie de J, notée (I1 , . . . , Im ), formée d’intervalles disjoints 2 à 2 et t.q.
m
λ(A) ≤ 2 k=1 λ(Ik ). [Utiliser la question 1.]

On se donne maintenant f ∈ L1 et on suppose qu’il existe a > 0 t.q. f = 0 p.p. sur [−a, a]c . Le
but de l’exercice est de montrer que :
Z 1
n n
f (x + t)dt → f (x), pour presque tout x ∈ R, quand n → ∞. (5.17)
2 1
−n

Pour ε > 0, on définit fε? de R dans R par :


Z h
1
fε? (x) = sup |f (x + t)|dt. (5.18)
h≥ε 2h −h

126
3. (a) Montrer que fε? est bornée.
(b) Montrer que fε? est borélienne. [On pourra montrer que fε? est le sup de fonctions continues.]
(c) Montrer que fε? (x) → 0 quand |x| → ∞.

4. Pour y > 0, on pose By,ε = {x ∈ R, fε? (x) > y}.

(a) Montrer que tout x ∈ By,ε est le centre d’un intervalle ouvert I(x) t.q.
i. λ(I(x)) ≥ 2ε,
1
R
ii. λ(I(x)) I(x)
|f |dλ > y.
Montrer que parmi les intervalles I(x), x ∈ By,ε , ainsi obtenus, il en existe un nombre fini
I(x1 ), . . . I(xn ) dont la réunion recouvre By,ε . [On pourra d’abord remarquer que By,ε est
borné.]
(b) Montrer que λ(By,ε ) ≤ y2 kf k1 . [Utiliser la question 2.]

On définit maintenant f ? de R dans R+ par :


Z h
1
f ? (x) = sup |f (x + t)|dt. (5.19)
h>0 2h −h

5. Montrer que f ? est borélienne et que λ({f ? > y}) ≤ y2 kf k1 , pour tout y > 0.

6. Montrer (5.17) si f admet un représentant continu. [cette question n’utilise pas les questions
précédentes.]
7. Montrer (5.17). [Approcher f , dans L1 et p.p., par une suite d’éléments de Cc (R, R), notée (fp )p∈N .
On pourra utiliser (f − fp )? .]

Exercice 5.19 (Convergence vague et convergence etroite) Corrigé 94 page 378


Soit (mn )n ∈ N une suite de mesures (positives) finies sur B(Rd ) (d ≥ 1) et m une mesure (positive) finie
sur B(Rd ). On suppose que :
• ϕdmn → ϕdm, quand n → ∞, pour tout ϕ ∈ Cc∞ (Rd , R).
R R

• mn (Rd ) → m(Rd ) quand n → ∞.

1. Soit ϕ ∈ Cc (Rd , R). Montrer que ϕdmn → ϕdm, quand n → ∞. [On pourra utiliser le fait que
R R

ϕ est limite uniforme d’une suite d’élement de Cc∞ (Rd , R).]


2. Pour p ∈ N? , on note Bp la boule fermée de centre 0 et de rayon p (pour la norme euclidienne
de Rd ). Montrer qu’il existe une suite (ϕp )p∈N? ⊂ Cc (Rd , R) t.q., pour tout p ∈ N? , 0 ≤ ϕp ≤ 1,
ϕp = 1 sur Bp et ϕp ≤ ϕp+1 . On utilise cette suite (ϕp )p∈N? dans les questions suivantes.

3. Soit ε > 0.
Z
?
(a) Montrer qu’il existe p0 ∈ N t.q. : p ≥ p0 ⇒ (1 − ϕp )dm ≤ ε.
Z Z
?
(b) Montrer que, pour tout p ∈ N , (1 − ϕp )dmn → (1 − ϕp )dm quand n → ∞.

127
Z
(c) Montrer qu’il existe p1 ∈ N? t.q. : n ∈ N, p ≥ p1 ⇒ (1 − ϕp )dmn ≤ ε.

4. Montrer que ϕdmn → ϕdm, quand n → ∞, pour tout ϕ ∈ Cb (Rd , R) (on dit alors que la suite
R R

(mn )n∈N converge étroitement vers m).


5. Indiquer brièvement comment obtenir le même résultat (c’est-à-dire le résultat de la question 4) si
on remplace “Rd ” (dans les hypothèses et dans la question 4) par “Ω ouvert de Rd ”.

Exercice 5.20 (Unicité avec Cc∞ )


Soit m et µ deux mesures finies sur les boréliens de Rd (d ≥ 1). on suppose que ϕdm = ϕdµ pour
R R

tout ϕ ∈ Cc∞ (Rd , R). Montrer que m = µ.

Exercice 5.21 (Densité de Cc et Cc∞ dans L1 )


Soit d ≥ 1 et µ une mesure sur les boréliens de Rd . On suppose que µ vérifie les deux propriétés suivantes :

(p1) µ est est finie sur les compacts de Rd , c’est-à-dire que µ(K) < +∞ si K est un compact de Rd ,
(p2) µ est régulière, c’est-à-dire que pour tout A ∈ B(Rd ) et tout ε > 0, il existe O ouvert et F fermé
t.q. F ⊂ A ⊂ O et µ(O \ F ) ≤ ε.
En fait, la propriété (p1) entraı̂ne la propriété (p2) (cela est démontré au chapitre 7, proposition 7.5)
mais cette démonstration n’est pas demandée ici.
On note L1µ l’espace L1R (Rd , B(Rd ), µ). Pour f ∈ L1µ , on note kf k1 = |f |dµ. Enfin, pour x ∈ Rd , on
R

note |x| la norme euclidienne de x.

1. Soit ϕ ∈ Cc (Rd , R) (c’est-à-dire ϕ continue de Rd dans R et à support compact). Montrer que


ϕ ∈ L1µ .
+
2. Soit K un compact de Rd et η > 0. Pour x ∈ Rd , on pose ϕ(x) = (η−d(x,K)) η avec d(x, K) =
inf{|x − y|, y ∈ K}. Montrer que ϕ ∈ Cc (Rd , R) et que ϕ(x) = 1 si x ∈ K.

3. Soit A ∈ B(Rd ) t.q. µ(A) < +∞.


(a) Soit ε > 0, montrer qu’il existe O ouvert et K compact t.q. K ⊂ A ⊂ O et µ(O \ K) ≤ ε.
(b) Soit ε > 0. Montrer qu’il existe ϕ ∈ Cc (Rd , R) t.q. kϕ − 1A k1 ≤ ε.
4. Soit f une fonction borélienne positive de Rd dans R. On suppose que f ∈ L1µ . Soit ε > 0. Montrer
qu’il existe ϕ ∈ Cc (Rd , R) t.q. kf − ϕk1 ≤ ε. [On pourra approcher f par une fonction étagée.]
5. (Densité.) Soit f ∈ L1µ et ε > 0.

(a) Montrer qu’il existe ϕ ∈ Cc (Rd , R) t.q. kf − ϕk1 ≤ ε.


(b) Montrer qu’il existe ψ ∈ Cc∞ (Rd , R) t.q. kf − ψk1 ≤ ε. [On pourra montrer que, si ϕ ∈
Cc (Rd , R), on a kϕ − ϕn k1 → 0, quand n → ∞, avec ϕn = ϕ ? ρn et (ρn )n∈N? une famille
régularisante, voir la définition 8.4. du polycopié de cours).]

6. (Continuité en moyenne ?)
(a) Soit ϕ ∈ Cc (Rd , R). Montrer que kϕ(· + h) − ϕk1 → 0 quand h → 0.

128
(b) Montrer, en donnant un exemple (c’est-à-dire en choisissant convenablement f et µ) qu’on
peut avoir f ∈ L1µ et kf (· + h) − f k1 6→ 0 quand h → 0.

7. On suppose maintenant que Ω est un ouvert de Rd et que µ est une mesure sur les boréliens de
Ω, finie sur les sous ensembles compacts de Ω. Indiquer brièvement comment on peut montrer la
densité de Cc (Ω, R) et Cc∞ (Ω, R) dans L1R (Ω, B(Ω), µ).

Exercice 5.22 (Loi d’une fonction linéaire de X)


Soit (Ω, A, P ) un espace de probabilité et X une v.a.. On suppose que la loi de X a une densité par
rapport à Lebesgue et on note g cette densité.
Soit a, b ∈ R, montrer que la v.a. aX + b a une densité par rapport à la mesure de Lebesgue et donner
cette densité en fonction de g, a et b.

129
Chapter 6

Les espaces Lp

6.1 Définitions et premières propriétés


6.1.1 Les espaces Lp , avec 1 ≤ p < +∞
Soient (E, T, m) un espace mesuré, 1 ≤ p < ∞ et f ∈ M = M(E, T ) (c’est-à-dire f : E → R,
mesurable). On remarque que |f |p ∈ M+ , car |f |p = ϕR◦ f où ϕ est la fonction continue (donc borélienne)
définie par ϕ(s) = |s|p pour tout s ∈ R. La quantité |f |p dm est donc bien définie et appartient à R+ .
Ceci va nous permette de définir les espaces de fonctions de puissance p-ième intégrable. On retrouve,
pour p = 1, la définition de l’espace des fonctions intégrables.

Définition 6.1 (Les espaces Lp ) Soient (E, T, m) un espace mesuré, 1 ≤ p < ∞ et f une fonction
définie de E dans R, mesurable. (On a donc |f |p ∈ M+ .)
1. On dit que f ∈ Lp = LpR (E, T, m) si |f |p dm < ∞. On pose alors :
R

Z  p1
kf kp = |f |p dm . (6.1)

2. On dit que f 6∈ Lp = LpR (E, T, m) si |f |p dm = ∞ et on pose alors kf kp = +∞.


R

De manière analogue au cas p = 1 on quotiente les espaces Lp par la relation d’équivalence “= p.p.”
afin que l’application f 7→ kf kp définisse une norme sur l’espace vectoriel des classes d”equivalence (voir
section 4.5).

Définition 6.2 (Les espaces Lp ) Soient (E, T, m) un espace mesuré et 1 ≤ p < +∞.

1. On définit l’espace LpR (E, T, m) comme l’ensemble des classes d’équivalence des fonctions de Lp
pour la relation d’équivalence (= pp). En l’absence d’ambiguı̈té on notera Lp l’espace LpR (E, T, m).
2. Soit F ∈ LpR (E, T, m). On pose kF kp = kf kp si f ∈ F . (Cette définition est cohérente car ne
dépend pas du choix de f dans F . On rappelle aussi que F = f˜ = {g ∈ Lp ; g = f p.p.}.)

Proposition 6.1 Soient (E, T, m) un espace mesuré et 1 ≤ p < +∞. Alors :


1. LpR (E, T, m) est un espace vectoriel sur R.

130
2. LpR (E, T, m) est un espace vectoriel sur R.

Démonstration :

• Soit Rα ∈ R, f ∈ Lp . On a αf ∈ M (car M est un espace vectoriel) et |αf |p dm =


R
1.
|α|p |f |p dm < ∞. Donc, αf ∈ Lp .
• Soit f, g ∈ Lp . On veut montrer que f + g ∈ Lp . On sait que f + g ∈ M (car M est un espace
vectoriel) et on remarque que, pour tout x ∈ E,

|f (x) + g(x)|p ≤ 2p |f (x)|p + 2p |g(x)|p ,

et donc Z Z Z
p p p p
|f + g| dm ≤ 2 |f | dm + 2 |g|p dm < ∞,

ce qui montre que f + g ∈ Lp .


2. La structure vectorielle de Lp s’obtient comme pour p = 1. Soit F, G ∈ Lp et α, β ∈ R. On choisit
f ∈ F et g ∈ G et on définit αF + βG comme étant la classe d’équivalence de αf + βg. Comme
d’habitude, cette définition est cohérente car la classe d’équivalence de αf + βg ne dépend pas des
choix de f et g dans F et G.

On va montrer maintenant que f 7→ kf kp est une semi-norme sur λp et une norme sur Lp .

1 1
Lemme 6.1 (Inégalité de Young) Soient a, b ∈ R+ et p, q ∈ ]1, +∞[ t.q. + = 1. Alors :
p q
ap bq
ab ≤ + . (6.2)
p q

Démonstration :
La fonction exponentielle θ 7→ exp(θ) est convexe (de R dans R). On a donc, pour tout θ1 , θ2 ∈ R et tout
t ∈ [0, 1],
exp(tθ1 + (1 − t)θ2 ) ≤ t exp(θ1 ) + (1 − t) exp(θ2 ).
1
Soit a, b > 0 (les autres cas sont triviaux). On prend t = p (de sorte que (1 − t) = 1q ), θ1 = p ln(a) et
p q
θ2 = q ln(b). On obtient bien ab ≤ ap + bq .

Lemme 6.2 (Inégalité de Hölder)


1 1
Soient (E, T, m) un espace mesuré et p, q ∈]1, +∞[ t.q. + = 1. Soient f ∈ LpR (E, T, m) et g ∈
p q
LqR (E, T, m). Alors, f g ∈ L1R (E, T, m) et

kf gk1 ≤ kf kp kgkq . (6.3)

Le même résultat est vrai avec Lp , Lq et L1 au lieu de Lp , Lq et L1 .

131
Démonstration :
On remarque d’abord que f g ∈ M car f, g ∈ M (voir la proposition 3.5).
|f (x)|p |g(x)|q
L’inégalité de Young donne |f (x)g(x)| ≤ p + q pour tout x ∈ E. On en déduit, en intégrant :
Z Z Z
1 p 1
|f g|dm ≤ |f | dm + |g|q dm < ∞. (6.4)
p q

Donc, f g ∈ L1 .
Pour montrer (6.3), on distingue maintenant 3 cas :

Cas 1. On suppose kf kp = 0 ou kgkq = 0. On a alors f = 0 p.p. ou g = 0 p.p.. On en déduit f g = 0 p.p.,


donc kf gk1 = 0 et (6.3) est vraie.

Cas 2. On suppose kf kp = 1 et kgkq = 1. On a alors, avec (6.4),


Z
1 1
kf gk1 = |f g|dm ≤ + = 1 = kf kp kgkq .
p q

L’inégalité (6.3) est donc vraie.


Cas 3. On suppose kf kp > 0 et kgkq > 0. On pose alors f1 = kffkp et g1 = g
kgkq , de sorte que kf1 kp =
kg1 kq = 1. Le cas 2 donne alors
kf gk1
= kf1 g1 k≤ 1.
kf kp kgkq
Ce qui donne (6.3).

Dans le cas où f ∈ Lp et g ∈ Lq , on confond les classes f et g avec des répresentants, encore notés f et
g. Le résultat précédent donne f g ∈ L1 et (6.3). On a alors f g ∈ L1 au sens de la confusion habituelle,
c’est-à-dire “il existe h ∈ L1 t.q. f g = h p.p.” (et f g ne dépend pas des représentants choisis), et (6.3)
est vérifiée.

Lemme 6.3 (Inégalité de Minkowski) Soient (E, T, m) un espace mesuré et 1 ≤ p < ∞. Soient
f, g ∈ LpR (E, T, m). Alors, f + g ∈ Lp et :

kf + gkp ≤ kf kp + kgkp . (6.5)

Le même résultat est vrai avec Lp au lieu de Lp .

Démonstration :
Le cas p = 1 à déjà été fait. On suppose donc p > 1. On a aussi déjà vu que f + g ∈ Lp (proposition
6.1). Il reste donc à montrer (6.5). On peut supposer que kf + gkp 6= 0 (sinon (6.5) est trivial).
On remarque que
|f + g|p ≤ F H + GH, (6.6)
avec F = |f |, G = |g| et H = |f + g|p−1 .

132
p
On pose q = p−1 , de sorte que p1 + 1q = 1, F ∈ Lp , G ∈ Lp et H ∈ Lq (car f + g ∈ Lp ). On peut donc
appliquer l’inégalité de Hölder (6.3), elle donne

kF Hk1 ≤ kF kp kHkq , kGHk1 ≤ kGkp kHkq .

On en déduit, avec (6.6),


Z Z
1
|f + g|p dm ≤ (kf kp + kgkp )( |f + g|p dm)1− p ,

D’où l’on déduit (6.5).

Il est clair que le lemme est vrai avec Lp au lieu de Lp .

On en déduit la propriété suivante:


Proposition 6.2 Soient (E, T, m) un espace mesuré et 1 ≤ p < ∞.
1. L’application f 7→ kf kp est une semi-norme sur Lp .
2. L’application f 7→ kf kp est une norme sur Lp . Lp , muni de cette norme, est donc une espace
vectoriel (sur R) normé.
Démonstration :

• On a bien kf kp ∈ R+ pour tout f ∈ Lp .


• On a déjà vu que kαf kp = |α|kf kp , pour tout α ∈ R et tout f ∈ Lp .
• L’inégalité (6.5) donne kf + gkp ≤ kf kp + kgkp pour tout f, g ∈ Lp .

L’application f 7→ kf kp est donc une semi-norme sur Lp . On remarque que, si f ∈ Lp , on a

kf kp = 0 ⇔ f = 0 p.p..

Cette équivalence donne que l’application f 7→ kf kp est une norme sur Lp .

Remarque 6.1 On reprend ici la remarque 4.9. Soient (E, T, m) un espace mesuré et 1 ≤ p < ∞. On
confondra dans la suite un élement F de Lp avec un représentant f de F , c’est-à-dire avec un élément
f ∈ Lp t.q. f ∈ F . De manière plus générale, soit A ⊂ E t.q. Ac soit négligeable (c’est-à-dire Ac ⊂ B
avec B ∈ T et m(B) = 0). On dira qu’une fonction f , définie de A dans R, est un élément de Lp si
il existe une fonction g ∈ Lp t.q. f = g p.p.. On confond donc, en fait, la fonction f avec la classe
d’équivalence de g, c’est-à-dire avec g̃ = {h ∈ Lp ; h = g p.p. }. D’ailleurs, cet ensemble est aussi égal à
{h ∈ Lp ; h = f p.p. }.
Avec cette confusion, si f et g sont des élements de Lp , f = g signifie en fait f = g p.p..

Théorème 6.1 (Convergence dominée) Soient (E, T, m) un espace mesuré, 1 ≤ p < ∞, et (fn )n∈N
⊂ Lp une suite t.q. :
• fn → f pp,

133
• ∃ F ∈ Lp t.q. |fn | ≤ F pp, ∀ n ∈ N ;
Z
alors fn → f dans Lp (c.à.d |fn − f |p dm → 0 quand n → ∞).

Démonstration :
On se ramène au cas p = 1.

On peut choisir des représentants des fn (encore notés fn ) de manière à ce que la suite (fn (x))n∈N soit
convergente dans R pour tout x ∈ E. On pose g(x) = limn→∞ fn (x). On a donc g ∈ M et g ≤ F p.p.,
ce qui montre que g ∈ Lp . On a donc f ∈ Lp (au sens f = g p.p. avec g ∈ Lp ).
Puis, on remarque que
0 ≤ hn = |fn − f |p ≤ (|fn | + |f |)p ≤ 2p F p p.p.,
pour tout n ∈ N, et que hn → 0 p.p. quand n → ∞. Comme F p ∈ L1 , on peut appliquer le théorème de
convergence dominée, il donne hn → 0 dans L1 , c’est-à-dire fn → f dans Lp .

Théorème 6.2 (Réciproque partielle) Soient (E, T, m) un espace mesuré, 1 ≤ p < ∞, (fn )n∈N ⊂ Lp
et f ∈ Lp . On suppose que fn → f dans Lp quand n → ∞. Alors il existe une sous-suite (fnk )k∈N t.q. :
• fnk → f p.p. lorsque k → +∞,

• ∃ F ∈ Lp t.q. |fnk | ≤ F p.p., pour tout k ∈ N .

Démonstration :
Comme dans le cas p = 1, Ce théorème est une conséquence de la proposition suivante sur les séries
absolument convergentes.

Proposition 6.3 (Séries absolument convergentes dans Lp ) X


Soient (E, T, m) un espace mesuré, 1 ≤ p < ∞ et (fn )n∈N ⊂ Lp . On suppose que kfn kp < +∞.
n∈N
Alors :
P+∞ P+∞
1. n=0 |fn (x)| < +∞ pour presque tout x ∈ E. On pose f (x) = n=0 fn (x) (la fonction f est donc
définie p.p.).
2. f ∈ Lp (au sens “il existe g ∈ Lp t.q. f = g p.p.”).
Pn p p
Pn
3. k=0 fk (x) → f p.p. et dans L , lorsque n → +∞. De plus, il existe F ∈ L t.q. | k=1 fk (x)| ≤ F
p.p., pour tout n ∈ N.

Démonstration : Pour chaque n ∈ N, on choisit un représentant de fn , encore noté fn .


Pn
On pose, pour tout x ∈ E, gn (x) = k=0 |fk (x)|. On a (gn )n∈N ⊂ M+ . Comme la suite est croissante,
il existe F ∈ M+ t.q. gn ↑ F , quand n → ∞. On a donc aussi gnp ↑ F p quand n → ∞ et le théorème de
convergence monotone donne
Z Z
gn dm → F p dm, quand n → ∞.
p
(6.7)

134
Pn P∞
On remarque maintenant que kgn kp ≤ k=0 kfk kp ≤ k=0 kfk kp = A < ∞. Donc kgn kpp ≤ Ap pour
tout n ∈ N et (6.7) donne alors Z
F p dm ≤ Ap < ∞. (6.8)

L’inégalité (6.8) donne que F < ∞ p.p.. Il existe donc B ∈ T t.q. m(B) = 0 et F (x) < ∞ pour tout
x ∈ B c . Pour tout x ∈ B c , la série de terme général fn (x) est donc absolument convergente dans R. Elle
est donc convergente dans R et on peut définir, pour tout x ∈ B c , f (x) ∈ R par

X n
X
f (x) = fk (x) = lim fk (x).
n→∞
k=0 k=0

La fonction f n’est pas forcément dans M, mais elle est m-mesurable (voir Pn la définition 4.3 page 79),
il
Pn existe donc g ∈ M t.q. f = g p.p.. Puis, comme g ≤ F p.p. (car | k=0 fk (x)| ≤ gn ≤ F p.p. et
p
f
k=0 k (x) → g p.p.) on a, grâce à (6.7), g ∈ L , ce qui donne bien f ∈ Lp (au sens “il existe g ∈ Lp
t.q. f = g p.p.”)

Enfin, pour montrer lePdernier item de la proposition, il suffit d’appliquer le théorème de convergence
p n Pn
dominée
R p dans L car f
k=0 k (x) →Pnf p.p. et, pour tout n ∈ N, | k=0 k (x)| ≤ gn ≤ F p.p. avec
f
F dm < ∞. On obtient bien que k=0 fk (x) → f dans Lp .

Toute série absolument convergente de Lp est donc convergente dans Lp . On en déduit le résultat suivant:
Théorème 6.3 Soient (E, T, m) un espace mesuré, et 1 ≤ p < ∞. L’espace vectoriel normé (Lp , k.kp )
est complet.
On peut maintenant se demander si les espaces Lp sont des espaces de Hilbert. Ceci est vrai pour p = 2,
et, en général, faux pour p 6= 2 (voir à ce propos l’exercice 6.30). Le cas de L2 sera étudié en détail dans
la section 6.2
En général, les espaces Lp , avec 1 < p < +∞, autres que L2 ne sont pas des espaces de Hilbert, mais nous
verrons ultérieurement (section 6.3 que ce sont des espaces de Banach réflexifs (c’est-à-dire que l’injection
canonique entre l’espace et son bi-dual est une bijection). Les espaces L1 et L∞ (que nous verrons au
paragraphe suivant) sont des espaces de Banach non réflexifs (sauf cas particuliers).

Remarque 6.2 Soient (E, T, m) un espace mesuré et 1 < p < ∞. On peut aussi définir LpC (E, T, m)
et LpRN (E, T, m) (avec N > 1) comme on a fait pour p = 1 (voir la section 4.10). On obtient aussi des
espaces de Banach (complexes ou réels). Le cas L2C (E, T, m) est particulièrement intéressant. Il sera muni
d’une structure hilbertienne (voir le théorème 6.4).

6.1.2 L’espace L∞
Définition 6.3 (L’espace L∞ ) Soient (E, T, m) un espace mesuré et f une fonction mesurable (de E
dans R) ;
1. on dit que f est essentiellement bornée, ou encore que f ∈ L∞ = L∞
R (E, T, m) si il existe C ∈ R+
tel que |f | ≤ C p.p. ;
2. si f ∈ L∞ , on pose kf k∞ = inf{C ∈ R+ ; |f | ≤ C p.p.},
/ L∞ , on pose kf k∞ = +∞.
3. si f ∈

135
Remarque 6.3 (Rappels sur la définition de l’inf. . . ) Soit A ⊂ R, A 6= ∅. On rappelle que A est
borné inférieurement si il existe un minorant de A, c’est-à-dire si il existe α ∈ R tel que x ≥ α pour
tout x ∈ A. Si A est borné inférieurement, on définit la borne inférieure de A comme le plus grand des
minorants : x = inf{A} = max{α; α ≤ x pour tout x ∈ A}. Si A n’est pas borné inférieurement, on pose
inf A = −∞. Dans les manipulations sur les inf (et sur les sup. . . ) il est utile de connaı̂tre le résultat
suivant :
x = inf A ⇒ ∃(xn )n∈N ⊂ A; xn ↓ x quand n → +∞. (6.9)
Ceci se démontre très facilement en écrivant :
1. Si A est non borné inférieurement, alors, pour tout n ∈ N, il existe yn ∈ A t.q. yn ≤ −n. En
choisissant x0 = y0 et, par récurrence, xn = min(xn−1 , yn ), on a donc xn ↓ −∞ = inf A.
2. Si A est borné inférieurement, soit x = inf A. Alors, x + n1 n’est pas un minorant de A et donc,
pour n ∈ N? , il existe yn ∈ A tel que x ≤ yn ≤ x + n1 . En choisissant x0 = y0 et, par récurrence,
xn = min(xn−1 , yn ), on a clairement: xn → x lorsque n → +∞.
Le petit lemme suivant (dont la démonstration est immédiate en écrivant la définition de kf k∞ , voir
l’exercice corrigé 4.32) est parfois bien utile.

Lemme 6.4 Si f ∈ L∞ , alors |f | ≤ kf k∞ p.p..

Démonstration :
Voir l’exercice corrigé 4.32.

On a égalité entre le sup essentiel et le sup pour les fonctions continues:


Proposition 6.4 Si (E, T, m) = (R, B(R), λ) et f ∈ C(R, R), alors kf ku = supx∈R |f (x)| = kf k∞ .
Démonstration :
On distingue 2 cas:
Cas 1. On suppose ici que |f | est non bornée, c’est-à-dire kf ku = ∞. Soit α ∈ R+ . Comme |f | est non
bornée, il existe x ∈ R t.q. |f (x)| > α. Par continuité de f , il existe alors ε > 0 t.q. |f (y)| > α pour tout
y ∈ [x − ε, x + ε]. On a donc {|f | > α} ⊃ [x − ε, x + ε] et donc λ({|f | > α}) ≥ 2ε. Donc, |f | n’est pas
inférieure ou égale à α p.p.. On a donc {C ∈ R+ ; |f | ≤ C p.p.} = ∅, donc kf k∞ = ∞ = kf ku .

Cas 2. On suppose maintenant que kf ku < ∞. On a |f (x)| ≤ kf ku pour tout x ∈ R, donc kf k∞ ≤ kf ku .


D’autre part, on sait que |f | ≤ kf k∞ p.p.. On a donc λ{|f | > kf k∞ }) = 0. Or {|f | > kf k∞ } est ouvert
(car f est continue), c’est donc un ouvert de mesure nulle, on a donc {|f | > kf k∞ } = ∅ (la mesure de
Lebesgue d’un ouvert non vide est toujours strictement positive). Ce qui prouve |f (x)| ≤ kf k∞ pour
tout x ∈ R et donc kf ku ≤ kf k∞ .
On obtient bien finalement kf ku = kf k∞ .

Définition 6.4 Soient (E, T, m) un espace mesuré et L∞ = L∞


R (E, T, m).

1. On définit L∞ = L∞ R (E, T, m) comme l’ensemble des classes d’équivalence sur L



pour la relation
d’équivalence “= p.p.”.
2. Soit F ∈ L∞ . On pose kF k∞ = kf k∞ avec f ∈ F , de sorte que F = {g ∈ L∞ ; g = f p.p.}. (Cette
définition est cohérente car kf k∞ ne dépend pas du choix de f dans F .)

136
Proposition 6.5 Soient (E, T, m) un espace mesuré, L∞ = L∞
R (E, T, m) et L

= L∞
R (E, T, m). Alors :

1. L∞ est un espace vectoriel sur R et l’application définie de L∞ dans R par f 7→ kf k∞ est une
semi-norme sur L∞ .
2. L∞ est un espace vectoriel sur R et l’application définie de L∞ dans R par f 7→ kf k∞ est une
norme sur L∞ . L∞ est donc un espace e.v.n. (réel).

Démonstration :
1. • Si α ∈ R et f ∈ L∞ , il est clair que αf ∈ L∞ et que kαf k= |α|kf k∞ .
• Soit f, g ∈ L∞ . Comme |f | ≤ kf k∞ p.p. et |g| ≤ kgk∞ p.p., on montre facilement que |f +g| ≤
|f | + |g| ≤ kf k∞ + kgk∞ p.p.. Ce qui prouve que (f + g) ∈ L∞ et kf + gk∞ ≤ kf k∞ + kgk∞ .
On a bien montré que L∞ est un espace vectoriel sur R et comme kf k∞ ∈ R+ pour tout f ∈ L∞ ,
l’application f 7→ kf k∞ est bien une semi-norme sur L∞ .
2. la structure vectorielle de L∞ s’obtient comme celle de Lp (p < ∞) et le fait que f 7→ kf k∞ soit
une norme découle du fait que
f = 0 p.p. ⇔ kf k∞ = 0.

Proposition 6.6 Soit (E, T, m) un espace mesuré. L’espace L∞


R (E, T, m) est un espace de Banach (réel),
c’est-à-dire un e.v.n. complet.

Démonstration :
On sait déjà que L∞ est un e.v.n.. Le fait qu’il soit complet est la conséquence du fait que toute série
absolument convergente dans L∞ est convergente dans L∞ . Ce qui est une conséquence de la proposition
suivante sur les séries absolument convergentes.

Proposition 6.7 (Séries absolument convergentes dans L∞ ) P+∞


Soient (E, T, m) un espace mesuré et (fn )n∈N ⊂ L∞
R (E, T, m). On suppose que n=0 kfn k∞ < +∞.
Alors :
Pn
1. Il existe C ∈ R+ t.q., pour tout n ∈ N, k=0 |fk | < C p.p..
pour presque tout x ∈ E, absolument convergente dans R. On
2. La série de terme général fn (x) est, P
+∞
définit, pour presque tout x, f (x) = n=0 fn (x).
Pn
3. On a f ∈ L∞ (au sens “il existe g ∈ L∞ t.q. f = g p.p.) et k k=0 fk − f k∞ → 0 lorsque n → +∞.

Démonstration : Pour chaque n ∈ N, on choisit un représentant de fn , encore noté fn . Comme


|fn | ≤ kfn k∞ p.p., il existe An ∈ T t.q. m(An ) = 0 et |fn | ≤ kfn k∞ sur Acn . On pose A = ∪n∈N An ∈ T .
On a m(A) = 0 (par σ-sous additivité de m) et, pour tout n ∈ N et x ∈ Ac , |fn (x)| ≤ kfn k∞ .
Pour tout x ∈ Ac , on a donc
n
X n
X ∞
X
|fk (x)| ≤ kfk k∞ ≤ kfk k∞ = C < ∞. (6.10)
k=0 k=0 k=0

137
Comme m(A) = 0, ceci montre le premier item.

Pour tout x ∈ Ac , la série de terme général fn (x) est absolument convergente dans R, donc convergente.
On pose donc
+∞
X Xn
f (x) = fk (x) = lim fk (x) ∈ R.
n→∞
k=0 k=0

f est donc définie p.p., elle est m-mesurable (voir la définition 4.3) car limite p.p. de fonctions mesurables.
Il existe donc g ∈ M t.q. f = g p.p. et (6.10) donne |g| ≤ C p.p.. On a donc g ∈ L∞ et donc f ∈ L∞
(au sens “il existe g ∈ L∞ t.q. f = g p.p.”).
Pn
Il reste à montrer que k=0 fk → f dans L∞ .
On remarque que, pour tout x ∈ Ac ,
n
X ∞
X ∞
X ∞
X
| fk (x) − f (x)| = | fk (x)| ≤ |fk (x)| ≤ kfk k∞ → 0, quand n → ∞.
k=0 k=n+1 k=n+1 k=n+1

Comme m(A) = 0, on en déduit


n
X n
X ∞
X
k fk − f k∞ ≤ sup | fk (x) − f (x)| ≤ kfk k∞ → 0, quand n → ∞.
x∈Ac
k=0 k=0 k=n+1
Pn
et donc k=0 fk → f dans L∞ , quand n → ∞.

La proposition 6.7 permet de montrer que L∞ est complet (théorème 6.6). Elle permet aussi de montrer
ce que nous avons appelé précédemment (dans le cas p < ∞) “réciproque partielle du théorème de
convergence dominée”. Il est important par contre de savoir que le théorème de convergence dominée
peut être faux dans L∞ , comme le montre la remarque suivante.

Remarque 6.4 (Sur la convergence dominée. . . ) Attention : le résultat de convergence dominée


qu’on a démontré pour les suites de fonctions de Lp , 1 ≤ p < +∞, est faux pour les suites de fonctions
de L∞ . Il suffit pour s’en convaincre de considérer l’exemple suivant : (E, T, m) = ([0, 1], B([0, 1]), λ),
fn = 1[0, n1 ] , pour n ∈ N. On a bien (fn )n∈N ⊂ L∞
R ([0, 1], B([0, 1]), λ) et

fn → 0 p.p. , quand n → ∞,
fn ≤ 1[0,1] p.p., pour tout n ∈ N, 1[0,1] ∈ L∞
R ([0, 1], B([0, 1]), λ).

Pourtant, kfn k∞ = 1 6→ 0, quand n → ∞.

Par contre, le résultat de réciproque partielle de la convergence dominée est vrai, comme conséquence du
résultat que toute suite absolument convergente dans L∞ est convergente (dans L∞ , proposition 6.7). La
démonstration est similaire à la démonstration du théorème 4.7.

Remarque 6.5 Soit (E, T, m) un espace mesuré. On peut aussi définir L∞ ∞


C (E, T, m) et LRN (E, T, m)
(avec N > 1) comme on a fait pour p = 1 (voir la section 4.10). On obtient aussi des espaces de Banach
(complexe ou réels).

138
6.1.3 Quelques propriétés des espaces Lp , 1 ≤ p ≤ +∞
Proposition 6.8 (Comparaison entre les espaces Lp )
Soit (E, T, m) un espace mesuré fini, i.e. m(E) < +∞. Soient p, q ∈ R+ tels que 1 ≤ p < q ≤ +∞. Alors,
LqR (E, T, m) ⊂ LpR (E, T, m). De plus, il existe C, ne dépendant que de p, q et m(E), t.q. kf kp ≤ Ckf kq
pour tout f ∈ LqR (E, T, m) (ceci montre que l’injection de Lq dans Lp est continue).
Démonstration :
On distingue les cas q < ∞ et q = ∞.
Cas q < ∞. On suppose ici que 1 ≤ p < q < +∞.
Soit f ∈ Lq . On choisit un représentant de f , encore noté f . Pour tout x ∈ E, on a |f (x)|p ≤ |f (x)|q si
|f (x)| ≥ 1. On a donc |f (x)|p ≤ |f (x)|q + 1, pour tout x ∈ E. Ce qui donne, par monotonie de l’intégrale,
Z Z
|f |p dm ≤ m(E) + |f |q dm < ∞, (6.11)

et donc que f ∈ Lp . On a ainsi montré Lq ⊂ Lp .

On veut montrer maintenant qu’il existe C, ne dépendant que de p, q et m(E), t.q., pour tout f ∈
LqR (E, T, m),
kf kp ≤ Ckf kq . (6.12)
1
En utilisant (6.11), on remarque que (6.12) est vraie avec C = (m(E)+1) p , si kf kq = 1. Ceci est suffisant
1
pour dire que (6.12) est vraie avec C = (m(E) + 1) p pour tout f ∈ Lq . En effet, (6.12) est trivialement
vraie pour kf kq = 0 (car on a alors f = 0 p.p. et kf kp = 0). Puis, si kf kq > 0, on pose f1 = kffkq de
sorte que kf1 kq = 1. On peut donc utiliser (6.12) avec f1 . On obtient kf1kq kf kp = kf1 kp ≤ C, ce qui
donne bien kf kp ≤ Ckf kq .

On a donc montré (6.12) avec un C ne dépendant que p et m(E) (et non de q). Toutefois, le meilleur
C possible dans (6.12) dépend de p, q et m(E). Ce meilleur C peut être obtenu en utilisant l’inégalité
1 1
de Hölder généralisée (proposition 6.9). Elle donne kf kp ≤ Ckf kq avec C = (m(E)) p − q (voir la remar-
que 6.6).

Cas q = ∞. On suppose ici que 1 ≤ p < q = +∞.


Soit f ∈ L∞ . On choisit un représentant de f , encore noté f . On a |f | ≤ kf k∞ p.p.. On en déduit
|f |p ≤ kf kp∞ p.p. et donc Z
|f |p dm ≤ m(E)kf kp∞ < ∞.
1
Ce qui donne f ∈ Lp et kf kp ≤ Ckf k∞ avec C = (m(E)) p .
1 1
On voit ici qu’on a obtenu le meilleur C possible (si m(E) > 0) car kf kp = (m(E)) p = (m(E)) p kf k∞ si
f = 1E .

Proposition 6.9 (Inégalité de Hölder généralisée)


1 1 1
Soient (E, T, m) un espace mesuré et p, q, r ∈ [1, +∞] tels que + = . Soient f ∈ LpR (E, T, m) et
p q r
g ∈ LqR (E, T, m). Alors, f g ∈ LrR (E, T, m) et
kf gkr ≤ kf kp kgkq . (6.13)

139
Démonstration : Comme d’habitude, on confond un élément de Ls (s = p, q ou r) avec un de ses
représentants. On travaille donc avec Ls au lieu de Ls . On suppose donc que f ∈ Lp et g ∈ Lq et on
veut montrer que f g ∈ Lr et que (6.13) est vraie. On remarque d’abord que f g ∈ M.
Ici encore, on distingue plusieurs cas.

Cas 1. On suppose ici 1 ≤ p, q, r < ∞.


p q
On pose f1 = |f |r et g1 = |g|r de sorte que f1 ∈ L r et g1 ∈ L r . Comme pr + rq = 1, on peut appliquer le
lemme 6.2 (donnant l’inégalité de Hölder) avec f1 , g1 (au lieu de f , g) et pr , rq (au lieu de p, q). Il donne
que f1 g1 ∈ L1 et kf1 g1 k1 ≤ kf1 k pr kg1 k rq . On en déduit que f g ∈ Lr et
Z Z Z
r r
|f g|r dm ≤ ( |f |p dm) p ( |g|q dm) q ,

ce qui donne (6.13)

Cas 2. On suppose ici q = ∞ et r = p < ∞.


Comme |g| ≤ kgk∞ p.p., On a |f g|p ≤ |f |p kgkp∞ p.p. et donc
Z Z
|f g|p dm ≤ kgkp∞ |f |p dm,

ce qui donne f g ∈ Lp et (6.13).

Cas 3. On suppose ici p = q = r = ∞.


Comme |f | ≤ kf k∞ p.p. et |g| ≤ kgk∞ p.p., on a |f g| ≤ kf k∞ kgk∞ p.p., ce qui donne f g ∈ L∞ et
(6.13).

Remarque 6.6

1. Par une récurrence facile sur n ∈ N? , on peut encore généraliser


Pn la proposition 6.9. Soient (E, T, m)
un espace mesuré, p1 , . . . , pn ∈ [1, ∞] et r ∈ [1, ∞] t.q. 1r = i=1 p1i . Pour tout i ∈ {1, . . . , n}, soit
Qn Qn Qn
fi ∈ LpRi (E, T, m). Alors, i=1 fi ∈ LrR (E, T, m) et k i=1 fi kr ≤ i=1 kfi kpi .
2. L’inégalité (6.13) permet aussi de trouver le meilleur C possible dans la proposition 6.8 (Inégalité
(6.12)) :
Soit (E, T, m) un espace mesuré fini. Soient p, q ∈ R+ tels que 1 ≤ p < q < +∞. Soit f ∈
LqR (E, T, m). Comme 1 ≤ p < q < ∞, il existe r ∈ [1, ∞[ t.q. p1 = 1q + 1r . On peut alors
utiliser la proposition 6.9 avec f ∈ Lq et 1E ∈ Lr . Elle donne que f ∈ Lp et kf kp ≤ Ckf kq avec
1 1
C = (m(E)) p − q . Cette valeur de C est la meilleure possible (si m(E) > 0) dans (6.12) car si
1 1
f = 1E on obtient kf kp ≤ (m(E)) p − q kf kq .

Remarque 6.7 Les espaces Lp , p ∈]0, 1[ (que l’on peut définir comme dans le cas 1 ≤ p < ∞) sont des
Z  p1
espaces vectoriels, mais l’application f 7→ |f |p dm n’est pas une norme sur Lp si p ∈]0, 1[ (sauf cas
particulier).

140
Remarque 6.8 Soient (E, T, m) un espace mesuré, et f ∈ M(E, T ). L’ensemble J = {p ∈ [1, +∞], f ∈
Lp } est un intervalle de [1, +∞]. L’application définie de J dans R+ par p 7→ kf kp est continue, voir à
ce propos l’exercice 4.32, et dans le cas particulier des fonctions continues à support compact, l’exercice
6.10. En particulier, lorsque p ∈ J, p → +∞ on a kf kp → kf k∞ . On en déduit le résultat suivant : si il
existe p0 < +∞ tel que f ∈ Lp pour tout p tel que p0 ≤ p < +∞, et si il existe C t.q. kf kp ≤ C, pour
tout p ∈ [p0 , +∞[, alors f ∈ L∞ et kf k∞ ≤ C.

6.2 Analyse hilbertienne et espace L2


6.2.1 Définitions et propriétés élémentaires
Définition 6.5 (Produit scalaire)

1. Soit H un espace vectoriel sur R. On appelle “produit scalaire sur H” une application de H ×H → R,
notée (·/·) (ou (·/·)H ) t.q.
ps1 : (u/u) > 0 pour tout u ∈ H \ {0},
ps2 : (u/v) = (v/u) pour tout u, v ∈ H,
ps3 : u 7→ (u/v) est une application linéaire de H dans R, pour tout v ∈ H.
2. Soit H un espace vectoriel sur C. On appelle “produit scalaire sur H” une application de H ×H → C,
notée (·/·) (ou (·/·)H ) t.q.
ps1 : (u/u) ∈ R?+ pour tout u ∈ H \ {0},
ps2 : (u/v) = (v/u) pour tout u, v ∈ H,
ps3 : u 7→ (u/v) est une application linéaire de H dans R, pour tout v ∈ H.

Remarque 6.9 (Exemple fondamental) Soit (E, T, m) un espace mesuré.


1. On prend H = L2R (E, T, m). H est un e.v. sur R. On rappelle 1
R que f g ∈ LR (E, T, m) si f, g ∈
2
LR (E, T, m) (lemme 6.2 pour p = q = 2). L’application (f, g) 7→ f gdm est un produit scalaire sur
H.
2. On prend H = L2C (E, T, m) (voir le théorème 6.4 ci après). H est un e.v. sur C. En utilisant
le lemme 6.2, on montre facilementR que f g ∈ L1C (E, T, m) si f, g ∈ L2C (E, T, m) (lemme 6.2 pour
p = q = 2). L’application (f, g) 7→ f gdm est un produit scalaire sur H.

Proposition 6.10 (Inégalité de Cauchy-Schwarz)

1. Soit H un e.v. sur R muni d’un produit scalaire, noté (·/·). Alors :

(u/v)2 ≤ (u/u)(v/v), pour tout u, v ∈ H. (6.14)

De plus, (u/v)2 = (u/u)(v/v) si et seulement si u et v sont colinéaires.


2. Soit H un e.v. sur C muni d’un produit scalaire, noté (·/·). Alors :

|(u/v)|2 ≤ (u/u)(v/v), pour tout u, v ∈ H. (6.15)

De plus, |(u/v)|2 = (u/u)(v/v) si et seulement si u et v sont colinéaires.

141
Démonstration :

1. On suppose ici K = R. Soit u, v ∈ H. Pour α ∈ R on pose p(α) = (u + αv/u + αv) = (v/v)α2 +


2α(u/v) + (u/u). Comme p(α) ≥ 0 pour tout α ∈ R, on doit avoir ∆ = (u/v)2 − (v/v)(u/u) ≤ 0,
ce qui donne (6.14).

On s’intéresse maintenant au cas d’égalité dans (6.14).


Si u = 0 ou v = 0, on a égalité dans (6.14) (et u et v sont colinéaires).
Si u 6= 0 et v 6= 0, on a égalité dans (6.14) (c’est-à-dire ∆ = 0) si et seulement si il existe α ∈ R
t.q. p(α) = 0. Donc, on a égalité dans (6.14) si et seulement si il existe α ∈ R t.q. u = −αv. On
en déduit bien que (u/v)2 = (u/u)(v/v) si et seulement si u et v sont colinéaires.
2. On suppose maintenant K = C. Soit u, v ∈ H. Pour α ∈ C on pose p(α) = (u + αv/u + αv) =
αα(v/v) + α(v/u) + α(u/v) + (u/u). On choisit de prendre α = β(u/v) avec β ∈ R. On pose donc,
pour tout β ∈ R, ϕ(β) = p(β(u/v)) = β 2 |(u/v)|2 (v/v) + 2β|(u/v)|2 + (u/u). Ici encore, comme
ϕ(β) ∈ R+ pour tout β ∈ R, on doit avoir ∆ = |(u/v)|4 − |(u/v)|2 (v/v)(u/u) ≤ 0, ce qui donne
(6.15).

On s’intéresse maintenant au cas d’égalité dans (6.15)


Si u = 0 ou v = 0, on a égalité dans (6.15) (et u et v sont colinéaires).
On suppose maintenant u 6= 0 et v 6= 0. On remarque d’abord que, si (u/v) = 0, on n’a pas égalité
dans (6.15) et u et v ne sont pas colinéaires. On suppose donc maintenant que (u/v) 6= 0. On a
alors égalité dans (6.15) si et seulement si ∆ = 0 et donc si et seulement si il existe β ∈ R t.q.
ϕ(β) = 0. Donc, on a égalité dans (6.15) si et seulement si il existe β ∈ R t.q. u = −β(u/v)v, et
donc si et seulement si il existe α ∈ R t.q. u = −αv.
Finalement, on en déduit bien que |(u/v)|2 = (u/u)(v/v) si et seulement si u et v sont colinéaires.

Proposition 6.11 (Norme induite par un produit scalaire)


p K, avec K = R ou K = C, muni d’un produit scalaire, noté (·/·). Pour tout u ∈ H,
Soit H un e.v. sur
on pose kukH = (u/u). Alors, k · kH est une norme sur H. On l’appelle norme induite par le produit
scalaire (·/·).

Démonstration :

• Il est clair que kukH ∈ R+ pour tout u ∈ H et que

kukH = 0 ⇔ (u/u) = 0 ⇔ u = 0.

• On a bien kαukH = |α|kukH pour tout α ∈ K et tout u ∈ H.


2
• Enfin, pour montrer l’inégalité triangulaire, soit u, v ∈ H. On a ku
p+ vkHp= (u + v/u + v) =
(u/u)+(v/v)+(u/v)+(v/u). Comme, par (6.14) ou (6.15), |(u/v)| ≤ (u/u) (v/v) = kukH kvkH ,
on en déduit ku + vk2H ≤ (kukH + kvkH )2 . Donc,

ku + vkH ≤ kukH + kvkH .

142
Définition 6.6 (espace de Hilbert)

1. Un espace préhilbertien (réel ou complexe) est un espace vectoriel (sur R ou sur C) normé dont la
norme est induite par un produit scalaire.
2. Un espace de Hilbert (réel ou complexe) est un espace vectoriel (sur R ou sur C) normé complet
dont la norme est induite par un produit scalaire. C’est donc un espace de Banach dont la norme
est induite par un produit scalaire.

Théorème 6.4 (L’espace L2 ) Soit (E, T, m) un espace mesuré.

1. L’espace L2R (E, T, m), muni de la norme k · k2 , est un espace de Hilbert (réel) et le produit scalaire
associé à la norme est défini par : Z
(f /g)2 = f g dm. (6.16)

2. (a) Soit f une application mesurable de E dans C (donc |f | ∈ M+ ). p On dit que f ∈ L2C (E, T, m)
si |f |2 ∈ L1R (E, T, m). Pour f ∈ L2C (E, T, m), on pose kf k2 = k|f |2 k1 . Alors, L2C (E, T, m)
est un espace vectoriel sur C et f 7→ kf k2 est une semi-norme sur L2C (E, T, m).
(b) On appelle L2C (E, T, m) l’espace L2C (E, T, m) quotienté par la relation d’équivalence “= p.p.”.
Pour F ∈ L2C (E, T, m), on pose kF k2 = kf k2 avec f ∈ F (noter que kf k2 ne dépend pas du
choix de f dans F ). Alors L2C (E, T, m), muni de k · k2 , est un espace de Banach (complexe).
(c) L’espace L2C (E, T, m), muni de la norme k · k2 , est un espace de Hilbert (complexe) et le produit
scalaire associé à la norme est défini par :
Z
(f /g)2 = f g dm. (6.17)

Démonstration :

1. On sait déjà que L2R (E, T, m), muni de la norme k · k2 est un espace de Banach (réel). Le lemme
6.2 pour Rp = q = 2 donne que f g ∈ L1R (E, T, m) si f, g ∈ L2R (E, T, m). On peut donc poser
(f /g)2 = f gdm. Il est facile de voir que (·/·)2 est un produit scalaire et que la norme induite par
ce produit scalaire est bien la norme k · k2 .

2. Soit f : E → C mesurable. On rappelle (section 4.10) que les fonctions <(f ) et =(f ) sont
mesurables de E dans R (i.e. appartiennent â M). On a donc bien |f | ∈ M+ et |f |2 = (<(f ))2 +
(=(f ))2 ∈ M+ .
Comme |f |2 = (<(f ))2 + (=(f ))2 ∈ M+ , on remarque aussi que f ∈ L2C (E, T, m) si et seulement si
<(f ), =(f ) ∈ L2R (E, T, m). Comme L2R (E, T, m) est un e.v. (sur R), il est aors immédiat de voir
que L2C (E, T, m) est un e.v. sur C.
On quotiente maintenant L2C (E, T, m) par la relation “= p.p.”. On obtient ainsi l’espace L2C (E, T, m)
que l’on munit facilement d’une structure vectorielle sur C. L’espace L2C (E, T, m) est donc un e.v.
sur C.

143
En utilisant le lemme 6.2, on montre facilement que f g ∈ L1C (E, T, m) si f, g ∈ L2C (E, T, m) (on
utilise le fait que les Rparties réelles et imaginaires de f et g sont dans L2R (E, T, m)). On peut
donc poser (f /g)2 = f gdm. Il est aussi facile de voir que (·/·)2 est alors un produit scalaire sur
L2C (E,RT, m) et que la norme induite par ce produit scalaire est justement k · k2 (car |f |2 = f f et
donc f f dm = kf k22 ). On a, en particulier, ainsi montré que f 7→ kf k2 est bien une norme sur
L2R (E, T, m). On en déduit aussi que f 7→ kf k2 est une semi-norme sur L2R (E, T, m).
On a montré que l’espace L2C (E, T, m), muni de la norme k·k2 , est un espace préhilbertien. il reste à
montrer qu’il est complet (pour la norme k · k2 ). Ceci est facile. En effet, kf k22 = k<(f )k22 + k=(f )k22
pour tout f ∈ L2C (E, T, m). Donc, une suite (fn )n∈N ⊂ L2C (E, T, m) est de Cauchy si et seulement si
les suites (<(fn ))n∈N et (=(fn ))n∈N sont de Cauchy dans L2R (E, T, m) et cette même suite converge
dans L2C (E, T, m) si et seulement si les suites (<(fn ))n∈N et (=(fn ))n∈N convergent dans L2R (E, T, m).
Le fait que L2C (E, T, m) soit complet découle alors du fait que L2R (E, T, m) est complet.

Remarquons que dans le cas p = 2, l’inégalité de Hölder est en fait l’inégalité de Cauchy-Schwarz.
Proposition 6.12 (Continuité du produit scalaire)
Soit H est un Banach réel ou complexe. Soient (un )n∈N ⊂ H, (vn )n∈N ⊂ H et u, v ∈ H t.q. un → u et
vn → v dans H, quand n → ∞. Alors, (un /vn ) → (u/v) quand n → ∞.
Démonstration : Il suffit de remarquer que, grâce à l’inégalité de Cauchy-Schwarz (inégalités (6.14) et
(6.15)), on a :
|(un /vn ) − (u/v)| ≤ |(un /vn ) − (un /v)| + |(un /v) − (u/v)|
≤ kun kkvn − vk + kun − ukkvk.
On conclut en utilisant le fait que un → u, vn → v et en remarquant que la suite (un )n∈N est bornée car
convergente.

Définition 6.7 Soit H est un Banach réel ou complexe. On note H 0 (ou L(H, K)) l’ensemble des
applications linéaires continues de H dans K (avec K = R pour un Banach réel et K = C pour un
Banach complexe). Si T ∈ H 0 , on pose
|T (u)|
kT kH 0 = sup .
u∈H\{0} kukH

On rappelle que k · kH 0 est bien une norme sur H 0 et que H 0 , muni de cette norme, est aussi un espace
de Banach (sur K).
Enfin, si T ∈ H 0 et u ∈ H, on a |T (u)| ≤ kT kH 0 kukH .
Remarque 6.10 Soit H un espace de Hilbert (réel ou complexe). Pour v ∈ H, on pose ϕv (u) = (u/v)
pour tout u ∈ H. Grâce à l’inégalité de Cauchy-Schwarz ((6.14) ou (6.15)), on voit que ϕv ∈ H 0 et
kϕv kH 0 ≤ kvkH . Il est facile alors de voir que kϕv kH 0 = kvkH . Ceci montre que v 7→ ϕv est une
application injective de H dans H 0 . le théorème de représentation de Riesz (théorème 6.8), fondamental,
montrera que cette application est surjective.
Proposition 6.13
Soit H un espace de Hilbert (réel ou complexe). Alors, pour tout u, v ∈ H On a
ku + vk2H + ku − vk2H = 2kuk2H + 2kvk2H . (6.18)
Cette identité s’appelle “ identité du parallélogramme”.

144
Démonstration : Il suffit d’écrire ku + vk2H + ku − vk2H = (u + v/u + v) + (u − v/u − v) et de développer
les produits scalaires.

Remarque 6.11

1. On peut se demander si deux produits scalaires (sur un même espace vectoriel) peuvent induire la
même norme. La réponse est “ non”. En effet, le produit scalaire est entièrement déterminé par
la norme qu’il induit. Par exemple, dans le cas d’un e.v. réel, si le produit scalaire (·/·) induit la
norme k · k, on a, pour tout u, v, (u/v) = 14 (ku + vk2 − ku − vk2 ).
2. On se donne maintenant un e.v.n. noté H. Comment savoir si la norme est induite ou non par un
produit scalaire ? On peut montrer que la norme est induite par un produit scalaire si et seulement
si l’identité du parallélogramme (6.18) est vraie pour tout u, v ∈ H. Ceci est surtout utile pour
montrer qu’une norme n’est pas induite par un produit scalaire (on cherche u, v ∈ H ne vérifiant
pas (6.18)).

Définition 6.8 (Orthogonal) Soit H un espace de Hilbert (réel ou complexe).


1. Soit u, v ∈ H. On dit que u et v sont orthogonaux (et on note u⊥v) si (u/v) = 0.
2. Soit A ⊂ H. On appelle “orthogonal de A” l’ensemble A⊥ = {u ∈ H; (u/v) = 0 pour tout v ∈ A}.

Proposition 6.14 Soient H un espace de Hilbert (réel ou complexe) et A ⊂ H. Alors :


1. A⊥ est un s.e.v. fermé de H,

2. A⊥ = A ,
3. A ⊂ (A⊥ )⊥ (que l’on note aussi A⊥⊥ ).

Démonstration :
1. Soit u1 , u2 ∈ A⊥ et α1 , α2 ∈ K (K = R ou K = C selon que H est un hilbert réel ou complexe).
Pour tout v ∈ A, on a (α1 u1 + α2 u2 /v) = α1 (u1 /v) + α2 (u2 /v) = 0. Donc, α1 u1 + α2 u2 ∈ A⊥ . Ce
qui montre que A⊥ est un s.e.v. de H.

Soit (un )n∈N ⊂ A⊥ t.q. un → u dans H, quand n → ∞. L’application w 7→ (w/v) est continue de
H dans K (voir la remarque (6.10)) pour tout v ∈ H. Soit v ∈ A, de (un /v) = 0 on déduit donc
que (u/v) = 0. Ce qui montre que u ∈ A⊥ et donc que A⊥ est fermé.

2. • Comme A ⊂ A, on a A ⊂ A⊥ .

• Soit maintenant u ∈ A⊥ . On veut montrer que u ∈ A .
Soit v ∈ A, il existe (vn )n∈N ⊂ A t.q. vn → v dans H quand n → ∞. Comme (u/vn ) = 0 pour

tout n ∈ N, on en déduit, par continuité de w 7→ (u/w), que (u/v) = 0. Donc u ∈ A . ce qui

donne A⊥ ⊂ A .

Finalement, on a bien montré A⊥ = A .
3. Soit v ∈ A. On a (u/v) = 0 pour tout u ∈ A⊥ , donc (v/u) = 0 pour tout u ∈ A⊥ , ce qui donne
v ∈ (A⊥ )⊥

145
Remarque 6.12 dans le dernier item de la proposition précédente, on peut se demander si A = A⊥⊥ .
On montrera, dans la section suivante que ceci est vrai si A est s.e.v. fermé (ce qui est aussi une condition
nécessaire).

On termine cette section avec le théorème de Pythagore.


Théorème 6.5 (Pythagore)
Soient H un espace de Hilbert (réel ou complexe) et u1 , . . . , un ∈ H t.q. (ui /uj ) = 0 si i 6= j. Alors :
n
X n
X
k ui k2H = kui k2H . (6.19)
i=1 i=1

Démonstration :
La démonstration de ce résultat est immédiate, par récurrence sur n :
L’égalité (6.19) est vraie pour n = 1 (et tout u1 ∈ H).
Soit n ∈ P N . On suppose que (6.19) est vraie (pour tout u1 , . . . , un ∈ H). Soit u1 , . . . , un+1 ∈ H. On
n
pose y = i=1 ui , de sorte que
n+1
X
k ui k2H = ky + un+1 k2H = (y + un+1 /y + un+1 ) = (y/y) + (y/un+1 ) + (un+1 /y) + (un+1 /un+1 ).
i=1
Pn+1
Comme (y/un+1 ) = 0 = (un+1 /y), on en déduit, avec l’hypothèse de récurrence, que k i=1 ui k2H =
Pn+1 2
i=1 kui kH .

6.2.2 Projection sur un convexe fermé non vide


Remarque 6.13 Soit E un ensemble muni d’une distance, notée d (E est alors un espace métrique).
Soit A ⊂ E. On pose d(x, A) = inf y∈A d(x, y). Il n’existe pas toujours de x0 ∈ A t.q. d(x, x0 ) = d(x, A)
et, si un tel x0 existe, il peut être non unique. Par exemple, dans le cas où A est compact (pour la
topologie induite par d), x0 existe mais peut être non unique.
Dans le cas où il existe un et un seul x0 ∈ A t.q. d(x, x0 ) = d(x, A), x0 est appelé “projection de x sur
A”.
L’objectif de cette section est de montrer l’existence et l’unicité de x0 dans le cas où A est une partie
convexe fermée non vide d’un espace de Hilbert (et d la distance induite par la norme de l’espace de
Hilbert).

Définition 6.9 (Partie convexe) Soit E un e.v. sur K, avec K = R ou K = C. Soit C ⊂ E. On dit
que C est convexe si :
u, v ∈ C, t ∈ [0, 1] ⇒ tu + (1 − t)v ∈ C.

Théorème 6.6 (Projection sur un convexe fermé non vide)


Soient H un espace de Hilbert (réel ou complexe) et C ⊂ H une partie convexe fermée non vide. Soit
x ∈ H. Alors, il existe un et un seul x0 ∈ C t.q. d(x, x0 ) = d(x, C) = inf y∈C d(x, y) (avec d(x, y) =
kx − ykH ). On note x0 = PC (x). PC est donc une application de H dans H (dont l’image est égale à
C). On écrit souvent PC x au lieu de PC (x).

146
Démonstration :
Existence de x0 .
On pose d = d(x, C) = inf y∈C d(x, y). Comme C 6= ∅, il existe une suite (yn )n∈N ⊂ C t.q. d(x, yn ) → d
quand n → ∞. On va montrer que (yn )n∈N est une suite de Cauchy en utilisant l’identité du parallélo-
gramme (6.18) (ce qui utilise la structure hilbertienne de H) et la convexité de C.
L’identité du parallélogramme donne

kyn − ym k2H = k(yn − x) − (ym − x)k2H = −k(yn − x) + (ym − x)k2H + 2kyn − xk2H + 2kym − xk2H ,

et donc
yn + ym
kyn − ym k2H = −4k − xk2H + 2kyn − xk2H + 2kym − xk2H . (6.20)
2
yn +ym
Comme C est convexe, on a 2 ∈ C et donc d ≤ k yn +y
2
m
− xkH . On déduit alors de (6.20) :

kyn − ym k2H ≤ −4d2 + 2kyn − xk2H + 2kym − xk2H . (6.21)


Comme d(yn , x) = kyn − xkH → d quand n → ∞, on déduit de (6.21) que la suite (yn )n∈N est de Cauchy.
Comme H est complet, il existe donc x0 ∈ H t.q. yn → x0 quand n → ∞. Comme C est fermée, on
a x0 ∈ C. Enfin, comme kx − yn kH → d quand n → ∞, on a, par continuité (dans H) de z 7→ kzkH ,
d(x, x0 ) = kx − x0 kH = d = d(x, C). Ce qui termine la partie “existence”.

Unicité de x0 . Soit y1 , y2 ∈ C t.q. d(x, y1 ) = d(x, y2 ) = d(x, C) = d. On utilise encore l’identité du


parallélogramme. Elle donne (voir (6.20)) :
y1 + y2 y1 + y2
ky1 − y2 k2H = −4k − xk2H + 2ky1 − xk2H + 2ky2 − xk2H = −4k − xk2H + 4d2 .
2 2
Comme y1 +y
2
2
∈ C On a donc d ≤ k y1 +y
2
2
− xkH et donc ky1 − y2 k2H ≤ −4d2 + 4d2 = 0. Donc y1 = y2 .
Ce qui termine la partie “unicité”.

Remarque 6.14 Le théorème précédent est, en général, faux si on remplace “Hilbert” par “Banach”.
Un exemple de non existence est donné à l’exercice 6.24 (et il est facile de trouver des exemples de non
unicité).

On donne maintenant deux caractérisations importantes de la projection. La première est valable pour
tout convexe fermé non vide alors que la deuxième ne concerne que les s.e.v. fermés.

Proposition 6.15 (Première caractérisation de la projection)


Soient H un espace de Hilbert (réel ou complexe) et C ⊂ H une partie convexe fermée non vide. Soient
x ∈ H et x0 ∈ C.

1. On suppose que H est un Hilbert réel. Alors :

x0 = PC x ⇔ (x − x0 /x0 − y) ≥ 0, pour tout y ∈ C. (6.22)

2. On suppose que H est un Hilbert complexe. Alors :

x0 = PC x ⇔ <(x − x0 /x0 − y) ≥ 0, pour tout y ∈ C. (6.23)

147
Démonstration :
Cas d’un Hilbert réel

• Sens (⇒)
On veut montrer que (x − x0 /x0 − y) ≥ 0, pour tout y ∈ C. Comme x0 = PC x, on a kx − x0 k2H ≤
kx − zk2H pour tout z ∈ C. Soit y ∈ C. On prend z = ty + (1 − t)x0 avec t ∈]0, 1]. Comme C est
convexe, on a z ∈ C et donc

kx − x0 k2H ≤ kx − zk2H = (x − x0 − t(y − x0 )/x − x0 − t(y − x0 ))


= kx − x0 k2H + t2 ky − x0 k2H − 2t(x − x0 /y − x0 ).

On en déduit
2t(x − x0 /y − x0 ) − t2 ky − x0 k2H ≤ 0.

On divise cette inégalité par t (on rappelle que t > 0) pour obtenir

2(x − x0 /y − x0 ) − tky − x0 k2H ≤ 0,

ce qui donne, en faisant tendre t vers 0 :

(x − x0 /x0 − y) ≥ 0.

• Sens (⇐)
On veut montrer que x0 = PC x, c’est-à-dire kx − x0 k2H ≤ kx − yk2H pour tout y ∈ C.
Soit y ∈ C, on a kx−yk2H = kx−x0 +x0 −yk2H = kx−x0 k2H +kx0 −yk2H +2(x−x0 /x0 −y) ≥ kx−x0 k2H
car kx0 − yk2H ≥ 0 et 2(x − x0 /x0 − y) ≥ 0.

Cas d’un Hilbert complexe


La démonstration est très voisine.

• Sens (⇒)
On veut montrer que <(x − x0 /x0 − y) ≥ 0, pour tout y ∈ C.
En reprenant les mêmes notations que dans le cas “Hilbert réel” et en suivant la même démarche,
on obtient :
kx − x0 k2H ≤ kx − zk2H = (x − x0 − t(y − x0 )/x − x0 − t(y − x0 ))
= kx − x0 k2H + t2 ky − x0 k2H − 2t<(x − x0 /y − x0 ).

On en déduit
2t<(x − x0 /y − x0 ) − t2 ky − x0 k2H ≤ 0.

On divise cette inégalité par t (on rappelle que t > 0) pour obtenir

2<(x − x0 /y − x0 ) − tky − x0 k2H ≤ 0,

ce qui donne, en faisant tendre t vers 0 :

<(x − x0 /x0 − y) ≥ 0.

148
• Sens (⇐)
On veut montrer que x0 = PC x, c’est-à-dire kx − x0 k2H ≤ kx − yk2H pour tout y ∈ C.
Soit y ∈ C, on a kx−yk2H = kx−x0 +x0 −yk2H = kx−x0 k2H +kx0 −yk2H +2<(x−x0 /x0 −y) ≥ kx−x0 k2H
car kx0 − yk2H ≥ 0 et 2<(x − x0 /x0 − y) ≥ 0.

Remarque 6.15 On prend comme espace de Hilbert réel H = L2R (E, T, m) (avec E 6= ∅) et on prend
C = {f ∈ H: f ≥ 0 p.p.}. On peut montrer que C est une partie convexe fermée non vide et que
PC f = f + pour tout f ∈ H. Ceci est fait dans l’exercice 6.23.

Un s.e.v. fermé est, en particulier, un convexe fermé non vide. On peut donc définir la projection sur un
s.e.v. fermé. On donne maintenant une caractérisation de la projection dans ce cas particulier.

Proposition 6.16 (Deuxième caractérisation de la projection)


Soient H un espace de Hilbert (réel ou complexe) et F un s.e.v. fermé de H. Soient x ∈ H et x0 ∈ F .
Alors :
x0 = PF x ⇔ (x − x0 ) ∈ F ⊥ . (6.24)

Démonstration :
Cas d’un Hilbert réel

• Sens (⇐)
On veut montrer que x0 = PF x. On utilise la première caractérisation. Soit y ∈ F . Comme
(x − x0 ) ∈ F ⊥ , on a (x − x0 /x0 − y) = 0 ≥ 0 (car x0 − y ∈ F ). Donc, la proposition 6.15 donne
x0 = PF x.
• Sens (⇒)
On veut montrer que (x − x0 ) ∈ F ⊥ . La première caractérisation (proposition 6.15) donne (x −
x0 /x0 − y) ≥ 0 pour tout y ∈ F . Soit z ∈ F . On choisit y = x0 + z ∈ F (car F est un s.e.v.) pour
obtenir (x − x0 /z) ≤ 0 et y = x0 − z ∈ F pour obtenir (x − x0 /z) ≥ 0. On en déduit (x − x0 /z) = 0.
Ce qui donne que (x − x0 ) ∈ F ⊥ .

Cas d’un Hilbert complexe


La démonstration est très voisine.

• Sens (⇐)
On veut montrer que x0 = PF x. Soit y ∈ F . Comme (x − x0 ) ∈ F ⊥ , on a (x − x0 /x0 − y) = 0 (car
x0 − y ∈ F ). On a donc <(x − x0 /x0 − y) = 0. Donc, la proposition 6.15 donne x0 = PF x.
• Sens (⇒)
On veut montrer que (x − x0 ) ∈ F ⊥ . La première caractérisation (proposition 6.15) donne <(x −
x0 /x0 − y) ≥ 0 pour tout y ∈ F . Soit z ∈ F . On choisit y = x0 − αz ∈ F (car F est un s.e.v.) avec
α = (x − x0 /z) pour obtenir <(x − x0 /αz) ≤ 0. Mais (x − x0 /αz) = α(x − x0 /z) = |(x − x0 /z)|2 .
Donc, 0 ≥ <(x − x0 /αz) = |(x − x0 /z)|2 . On en déduit (x − x0 /z) = 0. Ce qui donne que
(x − x0 ) ∈ F ⊥ .

149
Définition 6.10 (Projection orthogonale et projecteurs algébriques)

1. Soient H un espace de Hilbert (réel ou complexe) et F ⊂ H un s.e.v. fermé de H. L’opérateur PF


s’appelle “projecteur orthogonal sur F ”. Si u ∈ H, PF u s’appelle la projection orthogonale de u sur
F.
2. (Rappel algébrique) Soit E un e.v. sur K (K = R ou K = C). Soient F, G deux s.e.v. de E t.q.
E = F ⊕ G. Pour x ∈ E, il existe donc un et un seul couple (y, z) ∈ F × G t.q. x = y + z. On
pose y = P x et donc z = (I − P )x (où I est l’application identité). P et I − P sont les projecteurs
associés à la décomposition E = F ⊕ G. Ce sont des applications linéaires de E dans E. L’image
de P est égale à F et L’image de I − P est égale à G. Dans le prochain théorème, on va comparer
la projection orthogonale et des projecteurs algébriques particuliers.

Théorème 6.7
Soient H un espace de Hilbert (réel ou complexe) et F un s.e.v. fermé de H. Alors :
1. H = F ⊕ F ⊥ ,
2. PF (projecteur orthogonal sur F ) est égal au projecteur algébrique sur F associé à la décomposition
H = F ⊕ F ⊥.
3. F = F ⊥⊥ .

Démonstration : On rappelle que l’on a déjà vu que F ⊥ est un s.e.v. fermé.

1. Soit u ∈ H. On a u = (u − PF u) + PF u. La 2eme caractérisation (proposition 6.16) donne


(u − PF u) ∈ F ⊥ . Comme PF u ∈ F , on en déduit que H = F + F ⊥ .
Soit maintenant u ∈ F ∩F ⊥ . On doit donc avoir (u/u) = 0, ce qui donne u = 0 et donc F ∩F ⊥ = {0}.
On a donc H = F ⊕ F ⊥ .
2. Soit u ∈ H. Comme u = PF u + (u − PF u), avec PF u ∈ F et (u − PF u) ∈ F ⊥ , on voit que PF
est égal au projecteur algébrique sur F associé à la décomposition H = F ⊕ F ⊥ . (Noter aussi que
(I − PF ) est égal au projecteur algébrique sur F ⊥ associé à la décomposition H = F ⊕ F ⊥ .)

3. Il reste à montrer que F = F ⊥⊥ .


• On a déjà vu que F ⊂ F ⊥⊥ .
• Soit u ∈ F ⊥⊥ . On a u = (u − PF u) + PF u. La 2eme caractérisation (proposition 6.16) donne
(u − PF u) ∈ F ⊥ et on a aussi (u − PF u) ∈ F ⊥⊥ car u ∈ F ⊥⊥ et PF u ∈ F ⊂ F ⊥⊥ . On a donc
(u − PF u) ∈ F ⊥ ∩ F ⊥⊥ = {0}. Donc u = PF u ∈ F . On a donc montré que F ⊥⊥ ⊂ F .
Finalement, on a bien montré que F = F ⊥⊥ .

Le théorème 6.7 a un corollaire très utile :

150
Corollaire 6.1
Soient H un espace de Hilbert (réel ou complexe) et F un s.e.v. de H. Alors :

F = H ⇔ F ⊥ = {0}.

Démonstration : F est un s.e.v. fermé de H. Le théorème 6.7 donne donc H = F ⊕ (F )⊥ . On a déjà


vu que (F )⊥ = F ⊥ , on a donc
H = F ⊕ F ⊥,
d’où l’on déduit
F = H ⇔ F ⊥ = {0}.

6.2.3 Théorème de Représentation de Riesz


Remarque 6.16 On rappelle ici la définition 6.7 et la remarque 6.10. Soit H est un Banach réel ou
complexe. On note H 0 (ou L(H, K)) l’ensemble des applications linéaires continues de H dans K (avec
K = R pour un Banach réel et K = C pour un Banach complexe). On rappelle que H ? est l’ensemble
des applications linéaires de H dans K. On a donc H 0 ⊂ H ? . Si H est de dimension finie, on a H 0 = H ? ,
mais si H est de dimension infinie, on peut montrer que H 0 6= H ? .

1. Si T ∈ H ? , on rappelle que T est continue si seulement si il existe k ∈ R t.q. |T (u)| ≤ kkukH , pour
tout u ∈ H.
2. Si T ∈ H 0 , on pose kT kH 0 = supu∈H\{0} |T (u)| 0
kukH . On rappelle que k · kH est bien une norme sur H et
0

0
que H , muni de cette norme, est aussi un espace de Banach (sur K). Noter que ceci est aussi vrai
si H est un e.v.n. non complet. Noter aussi que, si T ∈ H 0 et u ∈ H, on a |T (u)| ≤ kT kH 0 kukH .
3. On suppose maintenant que H un espace de Hilbert (réel ou complexe). Pour v ∈ H, on pose
ϕv (u) = (u/v) pour tout u ∈ H. Grâce à l’inégalité de Cauchy-Schwarz ((6.14) ou (6.15)), on a
|ϕv (u)| ≤ kukH kvkH . On a donc ϕv ∈ H 0 et kϕv kH 0 ≤ kvkH . En remarquant que ϕv (v) = kvk2H ,
on montre alors que kϕv kH 0 = kvkH .

On considère maintenant l’application ϕ : H → H 0 définie par ϕ(v) = ϕv pour tout v ∈ H.

• Si K = R, ϕ est une application linéaire de H dans H 0 car, pour tout v, w ∈ H et tout α, β ∈ R,

ϕαv+βw (u) = (u/αv + βw) = α(u/v) + β(u/w) = αϕv (u) + βϕw (u), pour tout u ∈ H,

ce qui donne ϕαv+βw = αϕv + βϕw . L’application ϕ est donc une isométrie (linéaire) de H
sur Im(ϕ) ⊂ H 0 . (En particulier ϕ est donc injective.)
• Si K = C, ϕ est une application “anti-linéaire” de H dans H 0 car, pour tout v, w ∈ H et tout
α, β ∈ R,

ϕαv+βw (u) = (u/αv + βw) = α(u/v) + β(u/w) = αϕv (u) + βϕw (u), pour tout u ∈ H,

ce qui donne ϕαv+βw = αϕv + βϕw . L’application ϕ est donc une isométrie (anti-linéaire) de
H sur Im(ϕ) ⊂ H 0 . (En particulier ϕ est donc, ici aussi, injective.)

151
L’objectif du théorème de représentation de Riesz (théorème 6.8) est de montrer que l’application
ϕ est surjective, c’est-à-dire que Im(ϕ) = H 0 .

Théorème 6.8
Soit H un espace de Hilbert (réel ou complexe). Soit T ∈ H 0 . Alors, il existe un et un seul v ∈ H t.q.

T (u) = (u/v), pour tout u ∈ H. (6.25)

L’application ϕ définie dans la remarque 6.16 est donc surjective (le résultat ci dessus donne T = ϕv ).

Démonstration :
Existence de v
On pose F = Ker(T ). Comme T est linéaire et continue, F est un s.e.v. fermé de H. Le théorème 6.7
donne donc H = F ⊕ F ⊥ . On distingue deux cas :

• Cas 1. On suppose ici que T = 0. On a alors F = E et il suffit de prendre v = 0 pour avoir (6.25).
• Cas 2. On suppose maintenant que T 6= 0. On a donc F 6= H et donc F ⊥ 6= {0} (car H = F ⊕F ⊥ ).
Il existe donc v0 ∈ F ⊥ , v0 6= 0. Comme v0 6∈ F , on a T (v0 ) 6= 0.
Pour u ∈ H, on a alors
T (u) T (u)
u=u− v0 + v0 . (6.26)
T (v0 ) T (v0 )
T (u)
On remarque que u − T (v0 ) v0 ∈ F car

T (u) T (u)
T (u − v0 ) = T (u) − T (v0 ) = 0.
T (v0 ) T (v0 )
T (u)
Donc, comme v0 ∈ F ⊥ , (u − T (v0 ) v0 /v0 ) = 0 et (6.26) donne

T (u) T (u)
(u/v0 ) = ( v0 /v0 ) = (v0 /v0 ),
T (v0 ) T (v0 )
d’où l’on déduit
T (v0 )
T (u) = (u/v0 ).
(v0 /v0 )
T (v0 ) T (v0 )
On pose v = (v0 /v0 ) v0 si K = R et v = (v0 /v0 ) v0 si K = C. On a bien

T (u) = (u/v), pour tout u ∈ H,

c’est-à-dire T = ϕv (avec les notations de la remarque 6.16).

Dans les 2 cas on a bien trouvé v ∈ H vérifiant (6.25).

Unicité de v
Soit v1 , v2 ∈ H t.q. T = ϕv1 = ϕv2 (avec les notations de la remarque 6.16). Comme ϕ est linéaire (si
K = R) ou anti-linéaire (si K = C), on en déduit ϕv1 −v2 = ϕv1 − ϕv2 = 0. Comme ϕ est une isométrie,
on a donc v1 = v2 , ce qui donne la partie unicité du théorème.

152
Remarque 6.17 Soit H un espace de Hilbert (réel ou complexe). Soit T ∈ H ? \ H 0 . T est donc une
application linéaire de H dans K(= R ou C), non continue. On pose F = Ker(T ). La démonstration du
théorème 6.8 permet alors de montrer que F ⊥ = {0} et donc F = H (dans un Hilbert H, le noyau d’une
forme linéaire non continue est donc toujours dense dans H). En effet, on raisonne par l’absurde :
si F ⊥ 6= {0}, il existe v0 ∈ F ⊥ , v0 6= 0. le raisonnement fait pour démontrer le théorème 6.8 donne alors
T (u) = (u/v) pour tout u ∈ H, avec v = (vT0(v/v00)) v0 si K = R et v = T (v0 )
(v0 /v0 ) v0 si K = C. On en déduit que
T est continu, contrairement à l’hypothèse de départ.
⊥ ⊥
On a donc F ⊥ = {0} et donc F = F ⊥ = {0}. On en déduit, comme H = F ⊕ F (par le théorème 6.7,
car F est toujours un s.e.v. fermé), que H = F .

Remarque 6.18 (Structure hilbertienne de H 0 ) Soit H un espace de Hilbert (réel ou complexe).


On sait déjà que H 0 (avec la norme habituelle, voir la remarque 6.16) est un espace de Banach. Le
théorème 6.8 permet aussi de montrer que H 0 est un espace de Hilbert. En effet, en prenant les notations
de la remarque 6.16, l’application ϕ est un isométrie bijective, linéaire ou anti-linéaire de H dans H 0 .
Cela suffit pour montrer que l’identité du parallélogramme (identité (6.18)) est vraie sur H 0 et donc que
H 0 est une espace de Hilbert (voir la remarque (6.11)). Mais on peut même construire le produit scalaire
sur H 0 (induisant la norme usuelle de H 0 ) :
Soient T1 , T2 ∈ H 0 . Par le théorème 6.8, il existe v1 , v2 ∈ H t.q. T1 = ϕv1 et T2 = ϕv2 . On pose
(T1 /T2 )H 0 = (v2 /v1 )H (où (·/·)H désigne ici le produit scalaire dans H). Il est facile de voir que (·/·)H 0
est un produit scalaire sur H 0 . Il induit bien la norme usuelle de H 0 car (T1 /T1 )H 0 = (v1 /v1 )H = kv1 k2H =
kϕv1 k2H 0 = kT1 k2H 0 car ϕ est une isométrie.

6.2.4 Bases hilbertiennes


Soient E un e.v. sur K, K = R ou C, et B = {ei , i ∈ I} ⊂ E une famille d’éléments de E (l’ensemble I
est quelconque, il peut être fini, dénombrable ou non dénombrable). On rappelle que B = {ei , i ∈ I} ⊂ E
est une base (algébrique) de E si B vérifie les deux propriétés suivantes :

1. B est libre, c’est-à-dire :


P 
αi ei = 0, avec
i∈J 
J ⊂ I, card(J) < ∞, ⇒ αi = 0 pour tout i ∈ J,
αi ∈ K pour tout i ∈ J,

2. B est génératrice, c’est-à-dire


P que pour tout u ∈ E, il existe J ⊂ I, card(J) < ∞, et il existe
(αi )i∈J ⊂ K t.q. u = i∈J αi ei .

En notant vect{ei , i ∈ I} l’espace vectoriel engendré par la famille {ei , i ∈ I}, le fait que B soit génératrice
s’écrit donc : E = vect{ei , i ∈ I}.
On rappelle aussi que tout espace vectoriel admet des bases (algébriques). Cette propriété se démontre à
partir de l’axiome du choix.
Dans le cas d’un espace de Hilbert, on va définir maintenant une nouvelle notion de base : la notion de
base hilbertienne.

Définition 6.11 Soient H un espace de Hilbert sur K, K = R ou C, et B = {ei , i ∈ I} ⊂ H une famille


d’éléments de H (l’ensemble I est quelconque). La famille B est une base hilbertienne de H si elle vérifie
les deux propriétés suivantes :

153

1 si i = j,
1. (ei /ej ) = δi,j = pour tout i, j ∈ I.
0 si i 6= j,
P
2. vect{ei , i ∈ I} = H. On rappelle que vect{ei , i ∈ I} = { i∈J αi ei , J ⊂ I, card(J) < ∞, (αi )i∈J ⊂
K}.

Remarque 6.19 Soit H un espace de Hilbert sur K, K = R ou C.

1. Si H est de dimension finie, il existe des bases hilbertiennes (qui sont alors aussi des bases al-
gébriques). Le cardinal d’une base hilbertienne est alors égal à la dimension de H puisque, par
définition, la dimension de H est égal au cardinal d’une base algébrique (ce cardinal ne dépendant
pas de la base choisie). La démonstration de l’existence de bases hilbertiennes suit celle de la propo-
sition 6.17 (la récurrence dans la construction de la famille des en s’arrête pour n = dim(H) − 1,
voir la preuve de la proposition 6.17).
2. Si H est de dimension infinie et que H est séparable (voir la définition 6.12), il existe des bases
hilbertiennes dénombrables (voir la proposition 6.17).
3. Si H est de dimension infinie et que H est non séparable, il existe toujours des bases hilbertiennes
(ceci se démontre avec l’axiome du choix), mais elles ne sont plus dénombrables.

Définition 6.12 Soit E un e.v.n. sur K, K = R ou C. On dit que E est séparable si il existe A ⊂ E
t.q. A = E et A au plus dénombrable.

Proposition 6.17 Soit H un espace de Hilbert sur K, K = R ou C, de dimension infinie. On suppose


que H est séparable . Alors, il existe B = {ei , i ∈ N} ⊂ H , base hilbertienne de H.

Démonstration : Comme H est séparable, il existe une famille {fn , n ∈ N} ⊂ H dense dans H, c’est-
à-dire t.q. {fn , n ∈ N} = H.
On va construire, par une récurrence sur n, une famille {en , n ∈ N} t.q. :
1. (en /em ) = δn,m pour tout n, m ∈ N,
2. {f0 , . . . , fn } ⊂ vect{e0 , . . . , en } pour tout n ∈ N.
On aura alors trouvé une base hilbertienne car on aura fi ∈ vect{en , n ∈ N}, pour tout i ∈ N, et donc
H = {fn , n ∈ N} ⊂ {en , n ∈ N} ⊂ H, d’où H = {en , n ∈ N}. Avec la propriété (en /em ) = δn,m pour
tout n, m ∈ N, ceci donne bien que {en , n ∈ N} est une base hilbertienne de H.

On construit maintenant la famille {en , n ∈ N}.

Construction de e0
fϕ(0)
Soit ϕ(0) = min{i ∈ N; fi 6= 0} (les fi ne sont pas tous nuls car H 6= {0}). On prend e0 = kfϕ(0) k , de
sorte que (e0 /e0 ) = 1 et f0 ∈ vect{e0 } (car f0 = kf0 ke0 , même si ϕ(0) 6= 0).

Construction de en+1
Soit n ∈ N. On suppose construits e0 , . . . , en t.q.

• (ep /em ) = δp,m pour tout p, m ∈ {0, . . . , n},


• {f0 , . . . , fp } ⊂ vect{e0 , . . . , ep } pour tout p ∈ {0, . . . , n}.

154
(Ce qui est vérifié pour n = 0 grâce à la construction de e0 .)
On construit maintenant en+1 t.q. les deux assertions précédentes soient encore vraies avec n + 1 au lieu
de n.
Un sous espace vectoriel de dimension finie est toujours fermé, donc vect{e0 , . . . , en } = vect{e0 , . . . , en }.
Si fi ∈ vect{e0 , . . . , en } pour tout i ∈ N, on a alors {fi , i ∈ N} ⊂ vect{e0 , . . . , en } et donc H =
vect{fi , i ∈ N} ⊂ vect{e0 , . . . , en } = vect{e0 , . . . , en }. Ce qui prouve que H est de dimension finie (et
dim(H) = n + 1). Comme H est de dimension infinie, il existe donc i ∈ N t.q. fi 6∈ vect{e0 , . . . , en }
(dans le cas où H est dimension finie, la construction de la famille des en s’arrête pour n = dim(H) − 1
et on obtient une base hilbertienne avec {e0 , . . . , en }). On pose alors ϕ(n + 1) = min{i Pn ∈ N; fi 6∈
vect{e0 , . . . , en }}. On a donc, en particulier, ϕ(n+1) ≥ n+1. En prenant ẽn+1 = fϕ(n+1) − i=0 αi ei avec
αi = (fϕ(n+1) /ei ) pour tout i ∈ {0, . . . , n}, on remarque que ẽn+1 6= 0 (car fϕ(n+1) 6∈ vect{e0 , . . . , en })
et que (ẽn+1 /ei ) = 0 pour tout i ∈ {0, . . . , n}. Il suffit alors de prendre en+1 = kẽẽn+1 n+1
k pour avoir
(ep /em ) = δp,m pour tout Pnp, m ∈ {0, . . . , n + 1}. Enfin, il est clair que f n+1 ∈ vect{e0 , . . . , en+1 } car on
a fn+1 = kẽn+1 ken+1 + i=0 αi ei ∈ vect{e0 , . . . , en+1 } si ϕ(n + 1) = n + 1 et fn+1 ∈ vect{e0 , . . . , en } si
ϕ(n + 1) > n + 1.
On a donc bien trouvé en+1 t.q.
• (ep /em ) = δp,m pour tout p, m ∈ {0, . . . , n + 1},

• {f0 , . . . , fp } ⊂ vect{e0 , . . . , ep } pour tout p ∈ {0, . . . , n + 1}.


Ce qui conclut la construction de la famille {en , n ∈ N} vérifiant les deux assertions demandées. Comme
cela a déjà été dit, la famille {en , n ∈ N} est alors une base hilbertienne de H.

La proposition 6.17 montre donc que tout espace de Hilbert séparable, et de dimension infinie, admet une
base hilbertienne dénombrable. On peut aussi démontrer la réciproque de ce résultat, c’est-à-dire que
tout espace de Hilbert admettant une base hilbertienne dénombrable est séparable et de dimension infinie
(cf. exercice 6.22). La proposition suivante s’adresse donc uniquement aux espaces de Hilbert séparables.

Proposition 6.18 Soient H un espace de Hilbert sur K, K = R ou C. et {en , n ∈ N} une base


hilbertienne de H (l’espace H est donc séparable et de dimension infinie (cf. exercice 6.22) et, dans ce
cas, une telle base existe d’après la proposition 6.17). Alors :
1. (Identité de Bessel) kuk2 = n∈N |(u/en )|2 , pour tout u ∈ H,
P
P Pn
2. u = n∈N (u/en )en , pour tout u ∈ H, c’est-à-dire i=0 (u/ei )ei → u dans H, quand n → ∞,
P Pn
3. soient u ∈ H et (αn )n∈N ⊂ K t.q. u = n∈N αn en (c’est-à-dire i=0 αi ei → u dans H quand
n → ∞), alors αi = (u/ei ) pour tout i ∈ N,
P
4. (identité de Parseval) (u/v) = n∈N (u/en )(v/en ), pour tout u, v ∈ H.

Démonstration : Pour n ∈ N, on pose Fn = vect{e0 , . . . , en }. Fn est donc un s.e.v. fermé de H (on a


dim(Fn ) = n + 1 et on rappelle qu’un espace de dimension finie est toujours complet, Fn est donc fermé
dans H).
On remarque que Fn ⊂ Fn+1 pour tout n ∈ N, que ∪n∈N Fn = vect{ei , i ∈ N} et donc que ∪n∈N Fn = H
(car {ei , i ∈ N} est une base hilbertienne de H).
Soit u ∈ H. La suite (d(u, Fn ))n∈N est décroissante (car Fn ⊂ Fn+1 ), on a donc d(u, Fn ) ↓ l quand
n → ∞, avec l ≥ 0. On va montrer que l = 0. En effet, pour tout ε > 0, il existe v ∈ ∪n∈N Fn t.q.

155
d(v, u) ≤ ε (car ∪n∈N Fn = H). Il existe donc n ∈ N t.q. v ∈ Fn . On a alors d(u, Fn ) ≤ ε, ce qui prouve
que l ≤ ε. Comme ε > 0 est arbitraire, on a bien montré que l = 0.

On utilise maintenant le théorème d’existence et d’unicité de la projection sur un convexe fermé non vide
(théorème 6.6). Il donne l’existence (et l’unicité) de un = PFn u ∈ Fn t.q. d(un , u) = d(u, Fn ), pour tout
n ∈ N. On a alors u = (u−un )+un et la deuxième caractérisation de la projection (proposition 6.16) donne
que (u − un ) ∈ Fn⊥ . Le théorème de Pythagore (théorème 6.5) donne enfin que kuk2 = kun k2 + ku − un k2 .
Comme ku − un k = d(u, un ) = d(u, Fn ) ↓ 0 quand n → ∞, on en déduit que

kun k2 → 0, quand n → ∞. (6.27)


Pn
Soit n ∈ N. Comme un ∈ Fn = vect{e0 , . . . , en }, on a un = i=0 αi ei avec αi = (un /ei ) pour tout
i ∈ {0, . . . , n} (car (ei /ej ) = δi,j pour tout i, j). Puis, comme (u − un ) ∈ Fn⊥ , on a (u − un /ei ) = 0 pour
tout iP ∈ {0, . . . , n}, d’où l’on déduit que αi = (u/ei ) pour tout i ∈ {0, . . . , n}.
Pn On a donc montré que
n
un = i=0 (u/ei )ei . Ce qui, avec le théorème de Pythagore, donne kun k2 = i=0 |(u/ei )|2 . On obtient
donc, avec (6.27) le premier item de la proposition, c’est-à-dire l’identité de Bessel.

On montre maintenant le deuxième item de la proposition. En reprenant les notations précédentes, on


a, pour u ∈ H, u = (u − un ) + un et (u − un ) → 0 dans H quand n → ∞ (car ku − un k = d(u, Fn )). On
a donc unP → u dans H quand n → ∞. Ceci donne bien le deuxième item de la proposition car on a vu
n
que un = i=0 (u/ei )ei .
Pn
Pour montrer le troisième item de la proposition, on suppose Pnque (αi )i∈N ⊂ PK est t.q.
n
i=0 αi ei → u
dans H quand n → ∞. Soit j ∈ N. On remarque que ( i=0 αi ei /ej ) = i=0 i i j = αj pour
α (e /e )
n ≥ j. En utilisant la continuité du produit scalaire par rapport à son premier argument (ce qui est une
conséquence simple de l’inégalité de Cauchy-Schwarz), on en déduit (faisant n → ∞) que (u/ej ) = αj .
Ce qui prouve bien le troisième item de la proposition.

Enfin, pour montrer l’identité de Parseval, on utilise la continuité du produit scalaire par rapport à ses
deux arguments (ce qui est aussi une conséquence de l’inégalité de Cauchy-Schwarz), c’est-à-dire le fait
que 
un → u dans H, quand n → ∞,
⇒ (un /vn ) → (u/v) quand n → ∞. (6.28)
vn → v dans H, quand n → ∞,
Pn Pn
Pour u, v ∈ H, on utilise (6.28) avec un = i=0 (u/ei )ei et vn = i=0 (v/ei )ei . On a bien un → u et vn →
Pn Pn
v (d’après le deuxième item) et on conclut en remarquant que (un /vn ) = i=0 j=0 (u/ei )(v/ej )(ei /ej ) =
Pn
i=0 (u/ei )(v/ei ).

Remarque 6.20 Soit H un espace de Hilbert sur K, K = R ou C, séparable et de dimension infinie.

1. Soit {en , n ∈ N} une base hilbertienne de H et soit ϕ : N → N bijective. On pose ẽn = eϕ(n) .
Comme {en , n ∈ N} = {ẽn , n ∈ N}, la famille {ẽn , n ∈ N} est donc aussi une base hilbertienne de
H. On peut donc appliquer la proposition 6.18 avec la famille {en , n ∈ N} ou avec la famille {ẽn ,
n ∈ N}. Le deuxième item de la proposition 6.18 donne alors, pour tout u ∈ H,
X X
u= (u/en )en = (u/eϕ(n) )eϕ(n) .
n∈N n∈N

156
P
Ceci montre que la série n∈N (u/en )en est “commutativement convergente” (c’est-à-dire qu’elle
est convergente, dans H, quel que soit l’ordre dans lequel on prend les termes de la série et la
somme de la série ne dépend pas de l’ordre dans lequel les termes ont été pris). Noter pourtant
que cette série peut ne Ppas être absolument convergente. On peut remarquer, pour donner un
n 1
exemple, que la suite ( i=0 i+1 ei )n∈N ⊂ H est de Cauchy, donc converge, dans H, quand n → ∞,
1
vers un certain u. Pour cet élément u de H, on a (u/ei ) = i+1
P pour tout i ∈ N. La série
n∈N (u/en )e n est donc commutativement convergente mais n’est pas absolument convergente car
1
P P
n∈N k(u/en )en k = n∈N n+1 = ∞ (voir à ce propos le corrigé 107). L’exercice 6.32 complète cet
exemple en construisant une isométrie bijective naturelle entre H et l2 .
Par contre, on rappelle que, dans R ou C, une série est commutativement convergente si et seulement
si elle est absolument convergente (voir l’exercice 2.29). On peut d’ailleurs remarquer que la série
donnée à l’item 4 de la proposition 6.18 est commutativement convergente (pour la même raison
que pour la série de l’item 2, donnée ci dessus) et est aussi absolument convergente. En effet, pour
2 2
u, v ∈ H, on a |(u/ei )(v/ei )| ≤ |(u/e
P i )| + |(v/ei )| pour tout i ∈ N, ce qui montre bien (grâce à
l’identité de Bessel) que la série n∈N (u/en )(v/en ) est absolument convergente (dans K).

2. Soit I un ensemble dénombrable (un exemple intéressant pour la suite est I = Z) et {ei , i ∈ I} ⊂ H.
Soit ϕ : N → I bijective. On pose, pour n ∈ N, ẽn = eϕ(n) . On a alors {ei , i ∈ I} = {ẽn , n ∈ N}.
La famille {ei , i ∈ I} est donc une base hilbertienne si et seulement si la famille {ẽn , n ∈ N} est
une base hilbertienne.
Si la famille {ei , i ∈ I} est une base hilbertienne, on peut donc appliquer la proposition 6.18 avec
la famille {ẽn , n ∈ N}. On obtient, par exemple, que pour tout u ∈ H :
X
u= (u/eϕ(n) )eϕ(n) .
n∈N

P
La somme de la série n∈N (u/eϕ(n) )eϕ(n) ne dépend P donc pas du choix de la bijection ϕ entre N
et I et il est alors légitime de la noter simplement i∈I (u/ei )ei . Ceci est détaillé dans la définition
6.13 et permet d’énoncer la proposition 6.19.

Définition 6.13 Soient H un espace


P de Hilbert (réel ou complexe) et I un ensemble dénombrable. Soit
(ui )i∈I ⊂ H. On dit que la série i∈I ui est commutativement convergente si il existe u ∈ H t.q., pour
tout ϕ : N → I bijective, on ait :
n
X
uϕ(p) → u, quand n → ∞.
p=0
P
On note alors u = i∈I ui .

Proposition 6.19 Soit H un espace de Hilbert sur K, K = R ou C. Soient I dénombrable et {ei , i ∈ I}


une base hilbertienne de H (l’espace H est donc séparable et de dimension infinie). Alors :
1. (IdentitéPde Bessel) Pour tout u ∈ H, la série i∈I |(u/ei )|2 est commutativement convergente et
P
kuk2 = i∈I |(u/ei )|2 ,
P P
2. Pour tout u ∈ H, la série i∈I (u/ei )ei est commutativement convergente et u = i∈I (u/ei )ei ,

157
P
3. soient
P u ∈ H et (αn )n∈N ⊂ K t.q. la série i∈I αi ei est commutativement convergente et u =
i∈I i ei , alors αi = (u/ei ) pour tout i ∈ I,
α
P
4. (identité de Parseval) Pour tout u, v ∈ H, la série i∈I (u/ei )(v/ei ) est commutativement conver-
P
gente et (u/v) = i∈I (u/ei )(v/ei )

Démonstration : La démonstration est immédiate à partir de la proposition 6.18 et de la définition des


séries commutativement convergentes (définition 6.13). Il suffit de remarquer que {eϕ(n) , n ∈ N} est une
base hilbertienne de H pour toute application ϕ : N → I bijective (et d’appliquer la proposition 6.18),
comme cela est indiqué dans la remarque 6.20 (deuxième item).

La proposition suivante donne une caractérisation très utile des bases hilbertiennes.

Proposition 6.20 (Caractérisation des bases hilbertiennes)


Soit H un espace de Hilbert réel ou complexe. Soit {ei , i ∈ I} ⊂ H t.q. (ei /ej ) = δi,j pour tout i, j ∈ I.
Alors, {ei , i ∈ I} est une base hilbertienne si et seulement si :

u ∈ H, (u/ei ) = 0 ∀i ∈ I ⇒ u = 0.

Démonstration : On pose F = vect{ei , i ∈ I}. F est s.e.v. de H.


On sait que {ei , i ∈ I} est une base hilbertienne si et seulement si F = H. Or, on a déjà vu (proposition
6.1) que F = H ⇔ F ⊥ = {0}. Donc, {ei , i ∈ I} est une base hilbertienne si et seulement si

u ∈ H, u ∈ F ⊥ ⇒ u = 0.

Comme u ∈ F ⊥ si et seulement si (u/ei ) = 0 pour tout i ∈ I, on en déduit que {ei , i ∈ I} est une base
hilbertienne si et seulement si
u ∈ H, (u/ei ) = 0 ∀i ∈ I ⇒ u = 0.

On donne maintenant un exemple de base hilbertienne, cet exemple donne un résultat de convergence de
la série de Fourier d’une fonction périodique de R dans C.
Pour cet exemple, on prend H = L2C (]0, 2π[, B(]0, 2π[), λ), où λ désigne la mesure de Lebesgue sur
B(]0, 2π[). On rappelle que H est un espace de Hilbert complexe et que le produit scalaire sur H est
R R 2π
donné par (f /g)2 = f gdλ = 0 f (x)g(x)dx pour f, g ∈ H.
Pour n ∈ Z, on définit en ∈ H par (en confondant en avec son représentant continu) :
1
en (x) = √ exp(inx), x ∈]0, 2π[. (6.29)

La convergence dans H de la série de Fourier de f ∈ H est alors donnée par la proposition suivante
(noter que cette proposition ne donne pas de convergence ponctuelle de la série de Fourier, même si f est
continue).

Proposition 6.21 (Séries de Fourier) Soit H = L2C (]0, 2π[, B(]0, 2π[), λ). Alors :

1. La famille {en , n ∈ Z}, où en est donnée par (6.29), est une base hilbertienne de H.

158
P
2. Pour tout f ∈ H, la série n∈Z (f /en )2 enest commutativement convergente et
X
f= (f /en )2 en .
n∈Z

En particulier, on a
Z 2π n
X
|f (x) − (f /ep )2 ep (x)|2 dx → 0, quand n → ∞.
0 p=−n

Démonstration : Pour démontrer que {en , n ∈ Z} est une base hilbertienne, on utilise la proposition
6.20. Il suffit donc de montrer :
1. (en /em )2 = δn,m pour tout n, m ∈ Z,
2. f ∈ H, (f /en )2 = 0 ∀n ∈ Z ⇒ f = 0.
R 2π 1
L’assertion 1 est immédiate car (en /em )2 = 0 2π exp(i(n − m)x)dx. Ce qui donne bien 0 si n 6= m et 1
si n = m.
Pour montrer l’assertion 2, soit f ∈ H t.q. (f /en )2 = 0 pour tout n ∈ Z. On va montrer que f = 0
(c’est-à-dire f = 0 p.p.) en raisonnant en plusieurs étapes.
Etape 1. On note P = vect{en , n ∈ Z} (P est donc l’ensemble des polynômes trigonométriques). Par
antilinéarité du produit scalaire de H par rapport à son deuxième argument, on a (f /g) = 0 pour tout
g ∈ P.
Etape 2. On note Cp = {g ∈ C([0, 2π], C); g(0) = g(2π)}. On peut montrer que P est dense dans
Cp pour la norme de la convergence uniforme (définie par kgku = max{g(x), x ∈ [0, 2π]}). On admet
ce résultat ici (c’est une conséquence du théorème de Stone-Weierstrass). Soit g ∈ Cp , il existe donc
(gn )n∈N ∈ P t.q. gn → g uniformément sur [0, 2π]. On a donc kgn − gku = kgn − gk∞ → 0 quand n → ∞.
Comme √ λ([0, 2π]) < ∞, on en déduit que kgn − gk2 → 0 quand n → ∞. (Plus précisément, on a ici
k · k2 ≤ 2πk · k∞ ). Comme (f /gn )2 = 0 pour tout n ∈ N (par l’étape 1), on en déduit (avec l’inégalité
de Cauchy-Schwarz) que (f /g)2 = 0. On a donc (f /g)2 = 0 pour tout g ∈ Cp .
Etape 3. Soit g ∈ C([0, 2π], C). Pour n ∈ N? on définit gn par :
gn (x) = g(x), si x ∈ [ n1 , 2π],
gn (x) = g(2π) + (g( n1 ) − g(2π))(nx), si x ∈ [0, n1 [,

de sorte que gn ∈ Cp (noter que gn est affine entre 0 et n1 et vérifie gn (0) = g(2π) et gn ( n1 ) = g( n1 )).
Par l’étape 2, on a (f /gn )2 = 0 pour tout n ∈ N? . D’autre part, le théorème de convergence dominée
dans Lp donne que gn → g dans H quand n → ∞ (noter en effet que gn → g p.p. et que gn ≤ kgk∞ ∈ H,
pour tout n ∈ N? ). On en déduit donc que (f /g)2 = 0. On a donc (f /g)2 = 0 pour tout g ∈ C([0, 2π], C).
Etape 4. On prend maintenant g ∈ H = L2C (]0, 2π[, B(]0, 2π[), λ). On définit g̃ de R dans C par g̃ = g sur
[0, 2π] et g̃ = 0 sur R \ [0, 2π]. On obtient ainsi g ∈ L2C (R, B(R), λ) (On a, comme d’habitude, confondu
un élément de L2 avec l’un de ses représentants; et λ désigne maintenant la mesure de Lebesgue sur
B(R)). On montre dans l’exercice (corrigé) 6.4 que Cc (R, R) est dense dans L2R (R, B(R), λ). On en déduit
facilement que Cc (R, C) est dense dans L2C (R, B(R), λ). Il existe donc (hn )n∈N ⊂ Cc (R, C) t.q. hn → g̃
dans L2C (R, B(R), λ), quand n → ∞. On en déduit que
Z 2π Z
|hn (x) − g(x)|2 dx ≤ |hn (x) − g̃(x)|2 dx → 0, quand n → ∞.
0 R

159
En posant gn = (hn )|[0,2π] , on a donc gn ∈ C([0, 2π], C) et gn → g dans H, quand n → ∞. Comme l’étape
3 donne (f /gn )2 = 0 pour tout n ∈ N, on en déduit que (f /g)2 = 0.
Pour conclure, il suffit maintenant de prendre g = f . On obtient (f /f )2 = 0 et donc f = 0 p.p..
On a bien ainsi montré (grâce à la proposition 6.20) que {en , n ∈ Z} est une base hilbertienne de H.

On montre maintenant le deuxième item de la proposition.


P
Soit f ∈ H. La proposition 6.19 donne que la série n∈Z (f /en )2 en est commutativement convergente et
que X
f= (f /en )2 en .
n∈Z

N dans Z donnée par ϕ(0) = 0, et, pour n ≥ 1, ϕ(2n−1) =


En utilisant la définition 6.13 et la bijection deP
m
n, ϕ(2n) = −n, on a donc, en particulier, i=0 (f /eϕ(m) )2 eϕ(m) → f, dans H, quand m → ∞. en
prenant m = 2n, ceci donne exactement
Z 2π n
X
|f (x) − (f /ep )ep (x)|2 dx → 0, quand n → ∞.
0 p=−n

6.3 Dualité dans les espaces Lp , 1 ≤ p ≤ ∞


6.3.1 Dualité pour p = 2
Soit (E, T, m) un espace mesuré. On note H = L2K (E, T, m), avec K = R ou C.
Soit f ∈ L2K (E, T, m). On note ϕf : H → K, l’application définie par ϕf (g) = (g/f )2 . On a déjà vu
(remarque 6.10) que ϕf ∈ H 0 (dual topologique de H). On remarque aussi que kϕf kH 0 = kf kH = kf k2 .
En effet |ϕf (g)| ≤ kf kH kgkH (par l’inégalité de Cauchy-Schwarz) et |ϕf (f )| ≤ kf k2H . Donc :

|ϕf (g)|
kϕf kH 0 = sup{ , g ∈ H \ {0}} = kf kH .
kgkH

Le théorème de représentation de Riesz (théorème 6.8 page 152) appliqué à l’espace de Hilbert H =
L2K (E, T, m) donne que pour tout T ∈ H 0 , il existe un et un seul f ∈ H t.q. T (g) = (g/f )2 pour tout
g ∈ H, c’est-à-dire un et un seul f ∈ H t.q. T = ϕf .
L’application ϕ : f 7→ ϕf est donc une isométrie bijective de L2K (E, T, m) sur L2K (E, T, m). (Noter que
ϕ est linéaire si K = R et antilinéaire si K = C.)
Cette situation est spécifique au cas p = 2. Nous examinons ci-après le cas général 1 ≤ p ≤ ∞.

6.3.2 Dualité pour 1 ≤ p ≤ ∞


p
Soit (E, T, m) un espace mesuré. Soit p ∈ [1, +∞], on pose q = p−1 ∈ [1, +∞] (de sorte que p1 + 1q = 1, q
s’appelle le conjugué de p). Dans toute cette section, on note LrK = LrK (E, T, m), avec K = R ou C (et
r ∈ [1, ∞]).
On cherche à caractériser le dual de LpK , de manière semblable à ce qui a été fait à la section précédente
dans le cas p = 2.

160
Soit f ∈ LqK , on considère l’application :
 Z

 gf dm si K = R,
ϕf : g 7→ Z (6.30)

 gf dm si K = C.

L’inégalité de Hölder (proposition 6.9) montre que ϕf (g) est bien définie si g ∈ LpK et que ϕf ∈ (LpK )0
(dual topologique de LpK ). On peut aussi obtenir un majorant de la norme de ϕf car l’inégalité de Hölder
donne
|ϕf (g)| ≤ kf kq kgkp , pour tout g ∈ LpK ,
d’où l’on déduit que
|ϕf (g)|
kϕf k(LpK )0 = sup{ , g ∈ LpK \ {0}} ≤ kf kq . (6.31)
kgkp
On définit donc une application ϕ : f 7→ ϕf de LqK dans (LpK )0 . La définition de ϕf (formule (6.30))
montre que cette application est linéaire dans le cas K = R et antilinéaire dans le cas K = C. Elle est
toujours continue, grâce à (6.31). On montre maintenant que c’est, en général, une isométrie.

Proposition 6.22
p
Soit (E, T, m) un espace mesuré. Soient p ∈ [1, +∞] et q = p−1 . Si p = 1, la mesure m est supposée
de plus σ-finie. L’application ϕ : f 7→ ϕf , où ϕf est définie par (6.30) est une application de LqK dans
(LpK )0 , linéaire dans le cas K = R et antilinéaire dans le cas K = C. De plus , c’est une isométrie,
c’est-à-dire que kϕf k(LpK )0 = kf kq pour tout f ∈ LqK . (L’application ϕ est donc nécessairement injective,
mais pas forcément surjective.)

Démonstration : on sait déjà que ϕ est une application de LqK dans (LpK )0 , linéaire dans le cas K = R
et antilinéaire dans le cas K = C. On sait aussi que kϕf k(LpK )0 ≤ kf kq pour tout f ∈ LqK (voir (6.31)).
Pour terminer la démonstration de cette proposition, Il suffit donc de montrer que, pour tout f ∈ LqK ,

kϕf k(LpK )0 ≥ kf kq . (6.32)

On se limite au cas K = R (les adaptations pour traiter le cas K = C sont faciles à deviner).
Soit f ∈ LqR . On suppose f 6= 0 (sinon (6.32) est immédiat). On confond f avec l’un de ses représentants,
|ϕf (g)|
de sorte que f ∈ Lq = LqR (E, T, m). Pour montrer 6.32, on va chercher g ∈ LpK \ {0} t.q. kgk p
= kf kq .
On distingue maintenant trois cas.

Cas 1 : 1 < p < ∞. On définit g : E → R par g(x) = |f (x)|q−1 sign(f (x)) pour tout x ∈ E, avec
la fonction sign : R → R définie par sign(s) = −1 si s < 0, sign(s) = 1 si s > 0 et (par exemple)
sign(0) = 0. La fonction g est mesurable (comme composée d’applications mesurables) et on a (en notant
q
que p = q−1 ):
Z Z Z
q
p q−1 q−1
|g| dm = (|f | ) dm = |f |q dm < ∞.
q

Donc, g ∈ LpR (plus précisément, g ∈ LpR ) et kgkp = kf kqp 6= 0. Pour ce choix de g, on a donc

|ϕf (g)|
Z
1 1 q
= q f gdm = q kf kq = kf kq ,
kgkp kf kqp p
kf kq

161
car q − pq = 1.
On en déduit que
|ϕf (h)| |ϕf (g)|
kϕf k(LpK )0 = sup{ , h ∈ LpK \ {0}} ≥ = kf kq ,
khkp kgkp
ce qui donne (6.32).

Cas 2 : p = ∞. On a, dans ce cas, q = 1. On prend, comme pour le premier cas, g = sign(f ). On a ici
g ∈ L∞ 1 1
R et kgk∞ = 1 (car m(E) 6= 0, sinon LR = {0} et il n’y a pas de f ∈ LR , f 6= 0). Pour ce choix de
|ϕf (g)|
g, on a ϕf (g) = kf k1 , donc kgk∞ = kf k1 et, comme dans le premier cas, ceci donne (6.32).

Cas 3 : p = 1. On a, dans ce cas, q = ∞. Ce cas est un peu plus délicat que les précédents. On ne peut
|ϕf (g)|
pas toujours trouver g ∈ L1K \ {0} t.q. kgk 1
= kf k∞ . En utilisant le caractère σ-fini de m, on va, pour
|ϕf (gn )|
tout n ∈ N? , trouver gn ∈ L1K \ {0} t.q. kgk1 ≥ kf k∞ − n1 . Ce qui permet aussi de montrer (6.32).

Soit n ∈ N? . On pose αn = kf k∞ − n1 et An = {|f | ≥ αn }. On a m(An ) > 0 (car m(An ) = 0 donnerait


kf k∞ ≤ αn ).
Si m(An ) < ∞, on peut prendre gn = sign(f )1An qui est mesurable (car sign(f ) et 1RAn sont mesurables) et
intégrable car m(An ) < ∞. On a alors gn ∈ L1R \{0}, kgn k1 = m(An ) et ϕf (gn ) = An |f |dm ≥ αn m(An ).
Donc :
|ϕf (gn )| 1
kϕf k(L1K )0 ≥ ≥ αn = kf k∞ − .
kgn k1 n
En faisant tendre n vers l’infini, on en déduit (6.32).
Si m(An ) = ∞, le choix de gn = sign(f )1An ne convient pas car sign(f )1An 6∈ L1R . On utilise alors le fait
que m est σ-finie. Comme m est σ-finie, il existe une suite (Ep )p∈N ⊂ T t.q. m(Ep ) < ∞, Ep ⊂ Ep+1 ,
pour tout p ∈ N, et E = ∪p∈N Ep . Par continuité croissante de m, on a donc m(An ∩ Ep ) ↑ m(An )
quand p → ∞. Comme m(An ) > 0 il existe donc p ∈ N (dépendant de n, on ne note pas cette
1
dépendance) t.q. m(An ∩ Ep ) > 0. On prend alors R gn = sign(f )1An ∩Ep . On a bien alors gn ∈ LR \ {0},
kgn k1 = m(An ∩ Ep ) ≤ m(Ep ) < ∞ et ϕf (gn ) = An ∩Ep |f |dm ≥ αn m(An ∩ Ep ). Donc :

|ϕf (gn )| 1
kϕf k(L1K )0 ≥ ≥ αn = kf k∞ − .
kgn k1 n
En faisant tendre n vers l’infini, on en déduit (6.32). ce qui conclut la preuve de la proposition.

La proposition 6.22 montre que l’application ϕ : f 7→ ϕf , où ϕf est définie par (6.30) est une application
de LqK dans (LpK )0 , linéaire dans le cas K = R et antilinéaire dans le cas K = C. De plus, c’est une
isométrie, c’est-à-dire que kϕf k(LpK )0 = kf kq pour tout f ∈ LqK . Comme cela a déjà été dit, l’application
ϕ est donc nécessairement injective car ϕf = ϕh implique ϕf −h = 0 et donc kf − hkq = kϕf −h k(LpK )0 = 0,
ce qui donne f = h p.p.. Mais l’application ϕ n’est pas forcément surjective. On sait qu’elle est surjective
si p = 2 (c’était l’objet de la section précédente). Le théorème suivant montre qu’elle est surjective si m
est σ-finie et p ∈ [1, +∞[ (de sorte qu’on identifie souvent, dans ce cas, (LpK )0 à LqK ).
p
Théorème 6.9 (Dualité Lp − Lq ) Soient (E, T, m) un espace mesuré σ-fini, 1 ≤ p < +∞, q = p−1 et
T ∈ (LpK )0 . Alors, il existe un unique f ∈ LqK t.q.
 Z

 gf dm si K = R,
T (g) = Z

 gf dm si K = C,

162
c’est-à-dire t.q. T = ϕf donné par (6.30) (on a donc montré la surjectivité de l’application ϕ : LqK →
(LpK )0 définie par ϕ(f ) = ϕf pour f ∈ LqK ).

Remarque 6.21 (Dual de L∞ ) Noter que le théorème précédent est, en général, faux pour p = ∞.
L’application ϕ : f 7→ ϕf , où ϕf est donnée par (6.30) est donc une isométrie (linéaire ou antilinéaire,
selon que K = R ou C) de L1K dans (L∞ 0
K ) mais l’image de ϕ est, sauf cas très particuliers, différente de
(LK ) . L’application ϕ ne permet donc pas d’identifier le dual de L∞
∞ 0 1
K à LK .

Démonstration du théorème 6.9:


La démonstration de ce théorème est faite dans l’exercice 6.38. Elle consiste essentiellement à se ramener
directement à appliquer le théorème de représentation de Riesz (théorème 6.8) dans un espace L2 appro-
prié.

Une autre démonstration, probablement plus classique, consiste à appliquer le théorème de Radon-
Nikodym, qui lui-même se démontre en se ramenant au théorème de représentation de Riesz. Cette
démonstration est donnée, dans un cas particulier, dans l’exercice 6.35. Nous verrons le théorème de
Radon-Nikodym dans la section suivante, voir les théorèmes 6.10 et 6.11.

Enfin, on propose dans l’exercice 6.37 une autre démonstration de ce théorème dans le cas p < 2 (utilisant
toujours le théorème de représentation de Riesz).

Une conséquence intéressante du théorème de dualité (théorème 6.9) est le caractère réflexif des espaces
Lp pour 1 < p < ∞, ce que l’on détaille maintenant.

Soit F un espace de Banach réel (mais il est possible de traiter aussi les Banach complexes). On note F 0
le dual (topologique) de F et F 00 le dual (topologique) de F 0 . On dit aussi que F 00 est le bidual de F .
Pour u ∈ F , on définit Ju : F 0 → R par

Ju (T ) = T (u) pour tout T ∈ F 0 . (6.33)

Il est facile de voir que Ju ∈ F 00 et kJu kF 00 ≤ kukF . On peut en fait montrer que kJu kF 00 = kukF (c’est
une conséquence du théorème de Hahn-Banach, non démontré ici). Comme l’application J : u 7→ Ju est
linéaire, c’est donc une isométrie linéaire de F dans F 00 . Il est alors immédiat que J est injective. On
l’appelle “’injection canonique” de F dans F 00 . Par contre, J n’est pas toujours surjective.

Définition 6.14 Soit F un espace de Banach, F 0 son dual (topologique) et F 00 son bidual (c’est-à-dire
le dual topologique de F 0 ). Pour u ∈ F , on définit Ju ∈ F 00 par (6.33). On dit que l’espace F est réflexif
si l’application J : u 7→ Ju (de F dans F 00 ) est surjective (l’application J est toujours injective).

Un espace de Hilbert H est toujours réflexif car l’application J est alors simplement la composée des deux
bijections de H dans H 0 et de H 0 dans H 00 données par le théorème de représentation de Riesz (Théorème
6.8). Ce qui montre que J est surjective. L’espace L2R (E, T, m) est donc réflexif. Plus généralement, une
conséquence directe du théorème 6.9 est que les espaces Lp , sont réflexifs pour p ∈]1, +∞[.
Proposition 6.23 Soient (E, T, m) un espace mesuré et 1 < p < +∞. Alors, l’espace LpR (E, T, m) est
réflexif.
Démonstration : On pose q = p
p−1 , Lp = LpR (E, T, m) et Lq = LqR (E, T, m).
On note Φ l’application de Lp dans (Lq )0 définie par Φ(f ) = ϕf , où ϕf est donnée par (6.30), et on note
Ψ l’application de Lq dans (Lp )0 définie par Ψ(f ) = ϕf .

163
Comme p 6= ∞ et q 6= ∞, le théorème 6.9 donne que Φ est une bijection de Lp dans (Lq )0 et Ψ est une
bijection de Lq dans (Lp )0 . On rappelle aussi que Φ et Ψ sont des isométries linéaires.
Soit s ∈ (Lp )00 . Pour montrer que Lp est réflexif, il suffit de montrer qu’il existe u ∈ Lp t.q. Ju = s (où
Ju est défini par 6.33), c’est-à-dire t.q. s(T ) = T (u) pour tout T ∈ (Lp )0 .
On va montrer que u = Φ−1 (s ◦ Ψ) convient. En effet, soit T ∈ (Lp )0 . On a :
Z
T (u) = uΨ−1 (T )dm,

et : Z
−1 −1
s(T ) = (s ◦ Ψ)(Ψ (T )) = Φ(u)(Ψ (T )) = uΨ−1 (T )dm = T (u).

On a donc bien montré que l’application J : u 7→ Ju (de Lp dans (Lp )00 ) est surjective, c’est-à-dire que
Lp est réflexif.
On peut aussi noter que la démonstration de cette proposition donne en fait que Ju = Φ(u) ◦ Ψ−1 pour
tout u ∈ Lp .

6.3.3 Théorème de Radon-Nikodym


La définition 4.4 donnait la définition d’une mesure de densité. On reprend ici cette définition et on
donne aussi la définition de mesure “signée” de densité.
Définition 6.15 (Mesure de densité) Soit (E, T, m) un espace mesuré.
1. Soit µ une mesure surR T . On dit que µ est une mesure de densité par rapport à m si il existe
f ∈ M+ t.q. µ(A) = A f dm, pour tout A ∈ T . On pose alors µ = f m (on dit aussi que f est la
densité de µ par rapport à m).
2. Soit µ une mesure signée sur T . On ditRque µ est une mesure signée de densité par rapport à m
si il existe f ∈ L1R (E, T, m) t.q. µ(A) = A f dm, pour tout A ∈ T . On pose alors µ = f m (on dit
aussi que f est la densité de µ par rapport à m).
Remarque 6.22 (Sur les mesures de densité) Soient (E, T, m) un espace mesuré et µ une mesure
sur T .
1. (Unicité de la densité) Soit f, gR∈ M+ . On
R suppose que µ = f m et µ = gm. On a alors f = g
m-p.p.. En effet, on doit avoir A f dm R= A gdm pour toutR A ∈ T . En choisissant A = {f > g}
puis A = {f < g}, on en déduit que {f >g} (f − g)dm + {f <g} (g − f )dm = 0. Ce qui donne
R
|f − g|dm = 0 et donc f = g m-p.p..
2. (Espace L1 pour une mesure de densité) Soit f ∈ M+ t.q. µ = f m. Soit g ∈ M, l’exercice (corrigé)
4.22 donne alors les assertions suivantes :
(a) g ∈ L1R (E, T, µ) ⇔ f g ∈ L1R (E, T, m),
(b) g ∈ L1R (E, T, µ) ⇒ gdµ = f gdm.
R R

R f ∈ M+ t.q. µ = f m. Soit A ∈ T t.q. m(A) = 0.


3. (Absolue continuité d’une mesure de densité) Soit
On a alors f 1A = 0 m-p.p. et donc µ(A) = f 1A dm = 0. Selon la définition 6.16 ci-après, ceci
montre que la mesure µ est absolument continue par rapport à la mesure m. L’objectif du théorème
de Radon-Nikodym (théorème 6.10) sera de démontrer la réciproque de ce résultat (si µ est finie et
m est σ-finie).

164
Rappelons la définition d’une mesure absolument continue :

Définition 6.16 (Mesure absolument continue) Soient (E, T, m) un espace mesuré et µ une mesure
(positive ou signée) sur T . On dit que µ est absolument continue par rapport à m, et on note µ << m,
si :
A ∈ T, m(A) = 0 ⇒ µ(A) = 0.

Remarque 6.23 On donne ici un exemple de mesure non absolument continue : on prend (E, T, m) =
(R, B(R), λ) et µ = δ0 (mesure de Dirac en 0 sur B(R)). Comme λ({0} = 0 et δ0 ({0} = 1, la mesure δ0
n’est pas absolument continue par rapport à λ.

On donne maintenant le théorème de Radon-Nikodym pour les mesures (positives).

Théorème 6.10 (Radon-Nikodym) Soient (E, T, m) un espace mesuré σ-fini et µ une mesure finie
sur T . Alors, µ est absolument continue par rapport à m si et seulement si µ est une mesure de densité
par rapport à m.

Démonstration :
Sens (⇐). Ce sens a été montré dans le troisième item de la remarque 6.22 (et les hypoth eses “µ finie”
et “m σ-finie” sont inutiles. (Noter aussi que le premier item de cette même remarque donne l’unicité
m-p.p. de la densité de µ par rapport à m.)

Sens (⇒). Pour toute mesure ν sur T et pour tout 1 ≤ p ≤ ∞, on note Lp (ν) = LpR (E, T, ν) et
Lp (ν) = LpR (E, T, ν).

Pour démontrer que µ est absolument continue par rapport à m, on va appliquer le théorème de représen-
tation de Riesz (théorème 6.8) dans l’espace de Hilbert H = L2R (µ + m).
On rappelle d’abord que l’exercice (corrigé) 4.2 donne que µ + m est une mesure sur T (définie par
(µ + m)(A) = µ(A) + m(A) pour tout A ∈ T ) et que les deux propriétés suivantes sont vérifiées (questions
1 et 2 de l’exercice 4.2) :

g ∈ L1 (µ + m) ⇔ g ∈ L1 (µ) ∩ L1 (µ),
Z Z Z
g ∈ L1 (µ + m) ⇒ gd(µ + m) = gdµ + gdm. (6.34)
R R R
Il est aussi clair que f d(µ +R m) = f dµ +R f dm pourR tout f ∈ M+ (voir le corrigé 56 de l’exercice
4.2). Pour g ∈ M, on a donc g 2 d(µ + m) = g 2 dµ + g 2 dm, ce qui donne L2 (µ + m) = L2 (µ) ∩ L2 (m).
Enfin, pour A ∈ T , on a (µ + m)(A) = 0 si et seulement si µ(A) = m(A) = 0. On a donc, pour
f, g : E → R : 
f = g µ-p.p.,
f = g (µ + m)-p.p. ⇔
f = g m-p.p..
On décompose maintenant la démonstration en 3 étapes.

Etape 1. Utilisation du théorème de Riesz.


On pose H = L2 (µ + m) (H est donc un espace de Hilbert). On veut définir T : H → R par :
Z
T (g) = gdµ pour tout g ∈ H. (6.35)

165
On montre tout d’abord que cette définition est correcte. Soit g ∈ H = L2 (µ + m). On choisit un
représentant de g, encore noté g, Rde sorte que g ∈ L2 (µ + m) = L2 (µ) ∩ L2 (m). CommRµ est finie, on a
L2 (µ) ⊂ L1 (µ). Donc g ∈ L1 (µ), gdµ existe et appartient à R. Puis, on remarque que gdµ ne dépend
pas du représentant choisi car g1 = g2 (µ + m)-p.p. implique g1 = g2 µ-p.p.. L’application T est donc
bien définie de H dans R par (6.35).
On montre maintenant que T ∈ H 0 . Il est immédiat que T est linéaire. On remarqueR ensuite que, pour
p tout
g ∈ H, on a, en utilisant l’inégalité de Cauchy-Schwarz avec g et 1E , |T (g)| = | gdµ| ≤ kgkL2 (µ) µ(E)
p p p
≤ kgkL2 (µ+m) µ(E)) = kgkH µ(E). On a donc T ∈ H 0 (et kT kH 0 ≤ µ(E)).

On peut maintenant appliquer le théorème de représentation de Riesz (théorème 6.8). Il donne qu’il existe
ϕ ∈ H = L2 (µ + m) t.q. T (g) = gϕd(µ + m) pour tout g ∈ L2 (µ + m). On choisit un représentant de
R

ϕ, encore noté ϕ. On a alors ϕ ∈ L2 (µ + m) et


Z Z
gdµ = gϕd(µ + m) pour tout g ∈ L2 (µ + m). (6.36)

Pour g ∈ L2 (µ + m), on a gϕ ∈ L1 (µ + m) et donc gϕd(µ + m) = gϕdµ + gϕdm (d’après (6.34)).


R R R

On déduit donc de (6.36) :


Z Z
g(1 − ϕ)dµ = gϕdm, pour tout g ∈ L2 (µ + m). (6.37)

Etape 2. On cherche dans cette étape des bornes sur ϕ.

On montre tout d’abord que ϕ ≥ 0 m-p.p. et µ-p.p. (ce qui est équivalent a dire que ϕ ≥ 0 (µ + m)-p.p.).
Comme m est σ-finie, il existe une suite (An )n∈N ⊂ T t.q. m(An ) < ∞ pour tout n ∈ N et E = ∪n∈N An .
Pour n ∈ N, on pose Bn = {ϕ < 0} ∩ An ∈ T . Dans (6.37), on prend g = 1Bn (on a bien g ∈ L2 (µ + m)
car (µ + m)(Bn ) ≤ µ(E) + m(An ) < ∞). On obtient
Z Z
(1 − ϕ)1Bn dµ = ϕ1Bn dm.

Comme (1 − ϕ) > 0 et ϕ < 0 sur Bn , on en déduit que (1 − ϕ)1Bn = 0 µ-p.p. et ϕ1Bn = 0 m-p.p. et
donc µ(Bn ) = m(Bn ) = 0. P
Par σ-additivité d’une mesure, comme {ϕ < 0} = ∪n∈N Bn , on en déduit (µ + m)({ϕ < 0}) ≤ n∈N (µ +
m)(Bn ) = 0 et donc ϕ ≥ 0 (µ + m)-p.p..

On montre maintenant que ϕ < 1 (µ + m)-p.p..


On prend dans (6.37) g = 1Cn , avec Cn = {ϕ ≥ 1} ∩ An (on a bien g ∈ L2 (µ + m) car (µ + m)(Cn ) ≤
µ(E) + m(An ) < ∞). On obtient
Z Z
(1 − ϕ)1Cn dµ = ϕ1Cn dm.

Comme (1 − ϕ) ≤ 0 et ϕ > 0 sur Cn , on en déduit que (1 − ϕ)1Cn = 0 µ-p.p. et ϕ1Cn = 0 m-p.p. et


donc m(Cn ) = 0. Mais on ne peut en déduire µ(Cn ) = 0 (car on a seulement (1 − ϕ) ≤ 0 sur Cn et non
(1 − ϕ) < 0). C’est ici (et seulement ici) qu’on utilise l’hypothèse d’absolue continuité de µ par rapport
à m. Comme m(Cn ) = 0, l’hypothèse
P µ << m donne µ(Cn ) = 0. Comme {ϕ ≥ 1} = ∪n∈N Cn , on en
déduit (µ + m)({ϕ ≥ 1}) ≤ n∈N (µ + m)(Cn ) = 0 et donc ϕ < 1 (µ + m)-p.p..

166
On a donc montré que 0 ≤ ϕ < 1 (µ + m)-p.p.. En changeant ϕ sur un ensemble de mesure (µ + m) nulle,
on peut donc supposer 0 ≤ ϕ(x) < 1 pour tout x ∈ E. On a toujours ϕ ∈ L2 (µ + m) et (6.37) reste vraie.
ϕ
Etape 3. On montre maintenant que µ = f m avec f = 1−ϕ .
On montre tout d’abord que (6.37) est vraie pour tout g ∈ M+ :

• On remarque d’abord que (6.37) est vraie si g = 1A avec A ∈ T t.q. m(A) < ∞ car, dans ce cas,
g ∈ L2 (µ + m).
• On suppose maintenant que A ∈ T . Comme m est σ-finie, il existe une suite (En )n∈N ⊂ T t.q.
m(En ) < ∞, En ⊂ En+1 , pour tout n ∈ N, et E = ∪n∈N En . On prend gn = 1Bn avec Bn = A ∩ En ,
de sorte que gn ↑ 1A et donc (1−ϕ)gn ↑ (1−ϕ)1A et ϕgn ↑ ϕ1A . Comme (6.37) est vraie pour g = gn
(car m(Bn ) < ∞), le théorème de convergence monotone (théorème 4.1) appliqué aux mesures µ et
m donne (6.37) pour g = 1A .
• Si g ∈ E+ , il est alors facile de montrer que (6.37) est vraie. C’est une conséquence immédiate de
la linéarité positive de l’intégrale sur M+ .
• On prend enfin g ∈ M+ . Il existe (gn )n∈N ∈ E+ t.q. gn ↑ g. On a donc (1 − ϕ)gn ↑ (1 − ϕ)g et
ϕgn ↑ ϕg. On écrit (6.37) pour gn au lieu de g. En passant à la limite quand n → ∞, le théorème
de convergence monotone (théorème 4.1) appliqué aux mesures µ et m donne (6.37) pour g.

On a donc maintenant ϕ mesurable, 0 ≤ ϕ(x) < 1 pour tout x ∈ E et (6.37) pour tout g ∈ M+ .
h
Soit h ∈ M+ . On pose g = 1−ϕ . On a g ∈ M+ (car 0 ≤ ϕ(x) < 1 pour tout x ∈ E). (6.37) donne alors
Z Z
ϕ
hdµ = h dm. (6.38)
1−ϕ
ϕ
R
En posant f = 1−ϕ , on a f ∈ M+ et (6.38) avec h = 1A donne µ(A) = f 1A dm pour tout A ∈ T ,
c’est-à-dire µ = f m.

Théorème 6.11 (Radon-Nikodym, mesures signées) Soit (E, T, m) un espace mesuré et soit µ une
mesure signée sur T , alors :

µ << m ⇐⇒ ∃f ∈ L1R (E, T, m) µ = f m. (6.39)

Démonstration : La démonstration n’est pas détaillée ici, elle consiste essentiellement à se ramener au
théorème 6.10 en décomposant µ sous la forme µ = µ+ − µ− comme cela est fait dans la proposition 2.6.

6.4 Convergence faible, faible-?, étroite, en loi. . .


6.4.1 Convergence faible et faible-?
On limite ce paragraphe au cas des espaces de Banach réels. L’extension au cas des Banach complexes
est simple (!).

167
Définition 6.17 (Convergence faible dans un espace de Banach)
Soit F un espace de Banach (réel) et F 0 son dual topologique (i.e. l’espace des applications linéaires
continues sur F dans R). Soit (un )n∈N ⊂ F et u ∈ F . On dit que la suite (un )n∈N converge faiblement
vers u si pour tout élement T de F 0 , on a : T (un ) → T (u) (dans R) quand n → ∞.

Par le théorème 6.9, on a donc la proposition suivante sur la convergence faible dans LpR (E, T, m), pour
1 ≤ p < +∞ :

Proposition 6.24 (Convergence faible dans Lp )


Soit (E, T, m) un espace mesuré, p ∈ [1, +∞[ et q le conjugué de p, Lp = LpR (E, T, m), (fn )n∈N ⊂ Lp
et u ∈ Lp . Alors, R (fn )n∈N converge faiblement vers f si et seulement si on a, pour tout g ∈
la suite
LqR (E, T, m), fn gdm → f gdm quand n → ∞.
R

Démonstration :
On note Φ l’application de Lq dans (Lp )0 définie par Φ(f ) = ϕf , où ϕf est donnée par (6.30), La
démonstration de cette proposition est alors immédiate quand on remarque que le théorème 6.9 donne
que Φ est une bijection de Lq dans (Lp )0 .

Définition 6.18 (Convergence faible ? dans le dual d’un espace de Banach)


Soit F un espace de Banach (réel) et F 0 son dual topologique ; soit (Tn )n∈N ⊂ F 0 et T ∈ F 0 . On dit que
la suite (Tn )n∈N converge vers T dans F 0 pour la topologie faible ? si pour tout élement u de F , on a :
Tn (u) → T (u) (dans R) quand n → ∞.

Remarque 6.24 (Convergence forte, faible et faible ?) Soit F un espace de Banach (réel).
1. Soient (Tn )n∈N ⊂ F 0 et T ∈ F 0 . Les implications suivantes sont alors immédiates :

Tn → T dans F 0 ⇒ Tn → T faiblement dans F 0 ⇒ Tn → T ?-faiblement dans F 0 .

La deuxième implication est une conséquence de l’injection canonique de F dans F 00 (construite


avec (6.33)).
2. Pour u ∈ F , on définit Ju ∈ F 00 avec (6.33). Soient (un )n∈N ⊂ F et u ∈ F . On a alors :

un → u faiblement dans F ⇔ Jun → Ju ?-faiblement dans F 00 .

Mais, si F n’est pas réflexif, l’application J : u 7→ Ju , de F dans F 00 , n’est pas surjective et on


peut avoir une suite (un )n∈N non faiblement convergente dans F alors que la suite (Jun )n∈N est
?-faiblement convergente dans F 00 . Dans ce cas, la limite de (Jun )n∈N pour la topologie faible-? de
F 00 n’est pas dans l’image de J.
Dans le cas où F est un espace de Banach réflexif, l’application J : u 7→ Ju est surjective de F dans F 00
et on a alors :
1. Soient (Tn )n∈N ⊂ F 0 et T ∈ F 0 . Alors :

Tn → T faiblement dans F 0 ⇔ Tn → T ?-faiblement dans F 0 .

2. Soit (un )n∈N ⊂ F . La suite (un )n∈N est faiblement convergente dans F si et seulement si la suite
(Jun )n∈N est ?-faiblement convergente dans F 00 .

168
Soit 1 < p ≤ ∞, donc 1 ≤ q = p−1 p
< ∞. On note Lp = LpR (E, T, m), Lq = LqR (E, T, m) et Φ l’application
de Lp dans (Lq )0 définie par Φ(f ) = ϕf , où ϕf est donnée par (6.30). Le théorème 6.9 donne que Φ est
une bijection de Lp dans (Lq )0 . On confond (ou on identifie) fréquemment u ∈ Lp avec Φ(u) ∈ (Lq )0 .
On a alors une notion de convergence faible-? dans Lp . Si 1 < p < ∞ (on a alors aussi 1 < q < ∞),
les notions de convergente faible et faible-? dans Lp sont équivalentes. Dans le cas de L∞ , que l’on
identifie fréquemment avec le dual (topologique) de L1 , les notions de convergente faible et faible-? sont
différentes. La convergence faible est plus forte que la convergence faible-?. On donne ci dessous la
définition de convergence faible-? quand on considère L∞ comme le dual de L1 .

Définition 6.19 (Convergence faible ? dans L∞ )


Soient (E, T, m) un espace mesuré et L∞ = L∞R (E, T, m). Soient (fn )n∈N ⊂ L

et f ∈ L∞ . On dit que

la suiteR(fn )n∈N converge
R vers f dans L pour la topologie faible ? si pour tout élement g de L1R (E, T, m),
on a : fn gdm → f gdm.

6.4.2 Convergence étroite et convergence en loi


Si m est une mesure
R finie sur les boréliens de Rd , on note Lm l’application de Cb (Rd , R) dans R définie
par Lm (ϕ) = ϕdm (cette application caractérise m, d’après la proposition 5.4). On a vu au chapitre 5
que Lm ∈ Cb (Rd , R)0 . Soit (mn )n∈N une suite de mesures finies sur les boréliens de Rd (d ≥ 1) et m
une mesure finie sur les boréliens de Rd .R La convergence faible-? dans (Cb (Rd , R)0 de Lmn vers Lm ,
quand n → ∞, signifie donc que limn→∞ ϕdmn = ϕdm, pour tout ϕ ∈ Cb (Rd , R). Ceci s’appelle la
R

convergence étroite de mn vers m.

Définition 6.20 (Convergence étroite et vague) Soit (mn )n∈N une suite de mesures finies sur les
boréliens de Rd (d ≥ 1) et m une mesure finie sur les boréliens de Rd .
1. On dit que mn → m étroitement, quand n → ∞, si :
Z Z
ϕdmn → ϕdm pour tout ϕ ∈ Cb (Rd , R)).

2. On dit que mn → m vaguement, quand n → ∞, si :


Z Z
ϕdmn → ϕdm pour tout ϕ ∈ Cc (Rd , R)).

La proposition suivante montre que la convergence vague et la convergence des masses totales donnent la
convergence étroite. Si m et les mesures mn sont des probabilités, la convergence étroite de mn vers m
(quand n → ∞) est donc équivalente à la convergence vague.

Proposition 6.25 Soit (mn )n∈N une suite de mesures finies sur les boréliens de Rd (d ≥ 1) et m une
mesure finie sur les boréliens de Rd . On suppose que mn → m vaguement et que mn (R) → m(R) (quand
n → ∞). On a alors mn → m étroitement. (La réciproque de cette proposition est immédiate.)

Démonstration : La démonstration de cette proposition est contenue dans l’exercice 5.19.

La convergence en loi d’une suite de v.a.r. est définie par la convergence étroite (ou vague, puisque c’est
équivalent) des lois des v.a.r.

169
Définition 6.21 Soit (Ω, A, p)un espace probabilisé, (Xn )n∈N une suite de v.a.r. sur (Ω, A, p) et X une
v.a.r. sur (Ω, A, p). On dit que Xn → X en loi, quand n → ∞, si :
Z Z
ϕ(Xn )dp → ϕ(X)dp pour tout ϕ ∈ Cb (R, R).

(Ce que est équivalent à dire que PXn → PX étroitement.)

6.4.3 Lois des grands nombres, théorème central limite


Dans ce paragraphe, on donne des résultats de convergence (en probabilité, p.s., en loi) pour des sommes
de v.a.r. indépendantes. Nous commençons ce paragraphe par un résutat (simple) sur la variance de la
somme de v.a.r. indépendantes, dont on déduit la loi faible des grands nombre qui donne non seulement
un résultat de convergence (en probabilité) mais aussi des estimations précises sur cette convergence.
Puis, on éenonce la loi forte des grands nombres et le théorème central limite.

Proposition 6.26 Soit (Ω, A, p) un espace probabilisé et (Xn )n∈N? une suite de v.a.r. indépendantes 2
à 2 et de carré intégrable. On a alors, pour tout n ∈ N? ,

Var(X1 + . . . + Xn ) = Var(X1 ) + . . . + Var(Xn ).


Pn
Démonstration
Pn : On pose Sn = i=1 Xi et Ei = E(Xi ). On a alors, par linéarité de l’intégrale,
E(Sn ) = i=1 Ei et :
n
X n
X n
X
Var(Sn ) = E((Sn − E(Sn ))2 ) = E( (Xi − Ei ) (Xj − Ej )) = E((Xi − Ei )(Xj − Ej )).
i=1 i=j i,j=1

Pour i 6= j, on a, comme Xi et Xj sont indépendantes, E((Xi −Ei )(Xj −Ej )) = E(Xi −Ei )E(Xj −Ej ) = 0.
On en déduit :
X n n
X
Var(Sn ) = E((Xi − Ei )2 ) = Var(Xi ).
i=1 i=1

Proposition 6.27 (Loi faible des grands nombres) Soit (Ω, A, p) un espace probabilisé et (Xn )n∈N?
une suite de v.a.r. indépendantes 2 à 2 et de carré intégrable.
Pn On suppose que ces v.a.r. sont de même
moyenne m et de même variance σ 2 . On pose Yn = n1 i=1 Xi (ce sont les “moyenne de Césaro” de la
suite (Xn )n∈N? ), alors Yn converge stochastiquement (ou en probabilité) vers la v.a.r constante et égale à
m, c’est-à-dire que l’on a :

∀ε > 0, p(|Xn − m| > ε) → 0 lorsque n → +∞.

Plus précisément, on a pour tout ε > 0 et n ∈ N? ,

σ2
p(|Yn − m| ≥ ε) ≤ .
nε2
Démonstration : Soit ε > 0 et n ∈ N? . En utilisant l’inégalité de Bienaymé Tchebychev (lemme 4.10),
on a :
1
p(|Yn − m| ≥ ε) = p((Yn − m)2 ≥ ε2 ) ≤ 2 E((Yn − m)2 ).
ε

170
Puis, en posant Sn = i=1 Xi , on a E((Yn − m)2 ) = n12 E((Sn − nm)2 ) = Varn(S
Pn n)
2 . La proposition 6.26
donne Var(Sn ) = nVar(X1 ) = nσ 2 . On en déduit finalement

1 nσ 2 σ2
p(|Yn − m| ≥ ε) ≤ = .
ε2 n2 nε2

On donne maintenant, sans démonstration, la loi forte des grands nombres.

Proposition 6.28 (Loi forte des grands nombres) Soit (Ω, A, p) un espace probabilisé et (Xn )n∈N?
une suite de v.a.r. indépendantes.
1. On
P suppose 2ici que les Xn sont de carré intégrable, que E(Xn ) = 0 pour tout n ∈ N? et que
2
n∈N? E(Xn )/(n ) < ∞. Alors :

n
1X
Xi → 0 p.s., quand n → ∞.
n i=1

2. On suppose ici que la suite (Xn )n∈N est une suite de v.a.r.i.i.d. et que E(|X1 |) < ∞. Alors :
n
1X
Xi → E(X1 ) p.s., quand n → ∞.
n i=1

On donne enfin, sans démonstration, le théorème central limite.

Théorème 6.12 Soit (Ω, A, p) un espace probabilisé et (Xn )n∈N? une suite de v.a.r.i.i.d. de carrés
intégrables. On note m = E(X1 ) et σ 2 = Var(X1 ). On pose
n
1 X
Yn = √ (Xi − m).
n i=1

La suite (PYn )n∈N? converge alors étroitement vers la loi normale N (0, σ 2 ) (où N (0, 0) = δ0 et la loi
normale, ou loi de Gauss, N (0, σ 2 ), est définie au chapitre 4, section 4.4, dans le cas σ 2 6= 0).

6.5 Exercices
6.5.1 Espaces Lp , 1 ≤ p ≤ ∞
Exercice 6.1 Corrigé 95 page 382
Soit (E, T, m) un espace mesuré, p ∈ [1, ∞[ et A ∈ T . On pose F = {f ∈ LpR (E, T, m); f = 0 p.p. sur
A}. Montrer que F est fermé (dans LpR (E, T, m)).

Exercice 6.2 Corrigé 96 page 382


Soit p ∈ [1, ∞] et C = {f ∈ Lp (R, B(R), λ); f ≥ 0 p.p.}. Montrer que C est d’intérieur vide pour p < ∞
et d’intérieur non vide pour p = ∞.

Exercice 6.3 (Convergence essentiellement uniforme) Corrigé 97 page 383

171
Soit (E, T, m) un espace mesuré, (fn )n∈N une suite de fonctions mesurables de E dans R et f une fonction
mesurable de E dans R.
Montrer que kfn − f k∞ → 0, quand n → ∞, si et seulement si il existe A ∈ T t.q. m(A) = 0 et fn → f
uniformément sur Ac , quand n → ∞.

Exercice 6.4 (Densité et continuité en moyenne) Corrigé 98 page 383

1. Soit p ∈ [1, ∞[. Montrer que Cc (R, R) est dense dans LpR (R, B(R), λ). Soit f ∈ LpR (R, B(R), λ),
montrer que kf − f (· + h)kp → 0 quand h → 0.
2. Les assertions précédentes sont-elles vraies pour p = ∞ ?

Exercice 6.5 (Sur la séparabilité. . . )

1. Montrer que LpR (R, B(R), λ) est séparable pour p ∈ [1, ∞[ et n’est pas séparable pour p = ∞.
2. On munit C0 (R, R) et Cb (R, R) de la norme de la convergence uniforme. Montrer que C0 (R, R) est
séparable et que Cb (R, R) n’est pas séparable.

Exercice 6.6 Soient (E, T, m) un espace mesuré, et f , g, h des fonctions mesurables de E dans R. Soient
1 1 1
p, q, r ∈ ]1, +∞[, tels que + + = 1, montrer que :
p q r
Z Z Z Z
1 1 1
|f gh|dm ≤ ( |f |p dm) p ( |g|q dm) q ( |h|r dm) r .

Exercice 6.7 (Produit Lp − Lq ) Corrigé 99 page 385


p
Soient (E, T, m) un espace mesuré, p ∈ [1, +∞] et q le conjugué de p (i.e. q = p−1 ). Soient (fn )n∈N ⊂
p q p q
LR (E, T, m), (gn )n∈N ⊂ LR (E, T, m), f ∈ LRR (E, T, m) etR g ∈ LR (E, T, m) t.q. fn → f dans LpR (E, T, m)
et gn → g dans LqR (E, T, m). Montrer que fn gn dm → f gdm lorsque n → +∞.

Exercice 6.8 (Caractérisation de Lp )


p
Soit (E, T, m) un espace mesuré, p ∈ [1, ∞] et q = p−1 . On note Lr l’espace LrR (E, T, m) (pour r ∈ [1, ∞]).
Soit f : E → R une application mesurable. On suppose que f g ∈ L1 pour tout g ∈ Lq . Le but de
l’exercice est de montrer (si possible. . . ) que f ∈ Lp .

1. On suppose, dans cette question, que p = 1. Montrer que f ∈ L1 .


2. On suppose, dans cette question, que p = ∞. Pour montrer que f ∈ L∞ , on raisonne par l’absurde
en supposant que f 6∈ L∞ .

(a) Soit α ≥ 0. Montrer qu’il existe β > α t.q. m({α ≤ |f | < β} > 0. En déduire qu’il existe une
suite croissante (αn )n∈N t.q. α0 = 0, αn ≥ n et m(An ) > 0 avec An = {αn ≤ |f | < αn+1 }
(pour tout n ∈ N).
P
(b) Soit (bn )n∈N ⊂ R. On pose g = n∈N bn 1An (les An étant définis à la question précédente).
Montrer qu’un choix convenable de (bn )n∈N donne g ∈ L1 et f g 6∈ L1 .
(c) Conclure.

3. On suppose, dans cette question, que p ∈]1, ∞[ et que m(E) < ∞. Pour montrer que f ∈ Lp , on
raisonne une nouvelle fois par l’absurde en supposant que f 6∈ Lp .

172
(a) Soit α ≥ 0. Montrer qu’il existe β > α t.q. 1 ≤ A |f |p dm < ∞ avec RA = {α ≤ |f | < β}.
R

En déduire qu’il existe une suite croissante (αn )n∈N t.q. α0 = 0 et 1 ≤ An |f |p dm < ∞ avec
An = {αn ≤ |f | < αn+1 } (pour tout n ∈ N).
(b) Soit (bn )n∈N ⊂ R. On pose g = n∈N bn |f |p−1 1An (les An étant définis à la question précé-
P
dente). Montrer qu’un choix convenable de (bn )n∈N donne g ∈ Lq et f g 6∈ L1 .
(c) Conclure.
4. On suppose, dans cette question, que p ∈]1, ∞[ et que m est σ-finie. Montrer que f ∈ Lp .
Exercice 6.9 (un peu de calcul diff...)
Soient (E, T, m) un espace mesuré fini, et g ∈ C 1 (R, R) et 1 ≤ p < +∞; pour u ∈ Lp = Lp (E, T, m), on
note g(u) la (classe de) fonction(s): x 7→ g(u(x)), et G la fonction qui à u associe g(u).
p
1. Soit 1 ≤ q < +∞; montrer que G ∈ C(Lp , Lq ) ssi il existe C ∈ R tel que |g(s)| ≤ C|s| q + C pour
tout s ∈ R.
2. Montrer que G ∈ C 1 (Lp , Lp ) ssi il existe a, b ∈ R tel que g(s) = as + b pour tout s ∈ R.
Exercice 6.10 Soit f une fonction de R dans R, continue à support compact, montrer que :
kf kLp (R,B(R),λ) → kf k∞ lorsque p → +∞.
[Pour montrer que lim inf kf kLp (R,B(R),λ) ≥ kf k∞ , on pourra introduire, pour 0 < ε < kf k∞ , un ensemble
p→+∞
Aε tel que ∀ x ∈ Aε , |f (x)| > kf k∞ − ε. ]
Exercice 6.11 Corrigé 100 page 385
Soient (E, T, m) un espace mesuré, (fn )n∈N ⊂ L1R (E, T, m), (gn )n∈N ⊂ L∞ 1
R (E, T, m), f ∈ LR (E, T, m) et
∞ 1
g ∈ LR (E, T, m). On suppose que fn → f dans LR (E, T, m).
1. On suppose que gn → g dans L∞ 1
R (E, T, m). Montrer que fn gn → f g dans LR (E, T, m).

2. On suppose maintenant que gn → g p.p.. Montrer par un contre exemple qu’on peut ne pas avoir
fn gn → f g dans L1R (E, T, m).
3. On suppose maintenant que gn → g p.p. et qu’il existe M ∈ R t.q. kgn k∞ ≤ M . Montrer qu’on a
alors fn gn → f g dans L1R (E, T, m).
Exercice 6.12 Soit (E, T, m) un espace mesuré et µ une mesure de densité f ∈ M+ par rapport à m,
montrer que : Z Z
(i) gdµ = f g dm, ∀ g ∈ M+
1 1
(ii) Soit g ∈ M, alors g ∈ L Z (µ) ⇔ fZg ∈ L (m), (6.40)
et si g ∈ L1 (µ), alors gdµ = f g dm

Exercice 6.13
Soit K : R2 R→ R+ une fonction mesurable (on a donc R K ∈ M+ (R2 , B(R2 ))). On suppose qu’il existe
M ∈ R+ t.q. K(x, t)dt ≤ M , pour tout x ∈ R, et K(t, y)dt ≤ M , pour tout y ∈ R.
Pour tout 1 ≤ p ≤ ∞, on note Lp l’espace LpR (R, B(R), λ) et Lp l’espace LpR (R, B(R), λ).
1
R f : R → R est une fonction mesurable, on pose, pour tout x ∈ R t.q. K(x, ·)f (·) ∈ L , T (f )(x) =
Si
K(x, t)f (t)dt.
Soit 1 ≤ p ≤ ∞. [On conseille de considérer séparément les cas p = 1, p = ∞ et 1 < p < ∞.]

173
1. Soit f ∈ Lp (on identifie f , comme d’habitude, avec l’un de ses représentants, on a donc f ∈ Lp ).
Montrer que T (f )(x) est définie pour presque tout x ∈ R. Montrer que T (f ) ∈ Lp (au sens “il existe
g ∈ Lp t.q. T (f ) = g p.p.”).
2. Montrer que T est une application linéaire continue de Lp dans Lp .

Exercice 6.14 (Inégalité de Hardy) Corrigé 101 page 386


Soit p ∈]1, ∞[. On note Lp l’espace LpR (]0, ∞[, B(]0, ∞[), λ) (λ est donc ici la mesure de Lebesgue sur les
boréliens de ]0, ∞[).
Soit f ∈ Lp . Pour x ∈]0, ∞[, on pose F (x) = x1 f 1]0,x[ dλ. Le but de l’exercice est de montrer que
R
p
F ∈ Lp et kF kp ≤ p−1 kf kp .

1. On suppose, dans cette question, que f ∈ Cc (]0, ∞[) (c’est-à-dire que f est continue et à support
compact dans ]0, ∞[).

(a) Montrer F ∈ C 1 (]0, ∞[) ∩ Lp . Montrer que xF 0 (x) = −F (x) + f (x) pour tout x > 0.
(b) On suppose, dans cette question, que f (x) ≥ 0 pour tout x ∈]0, ∞[.
R∞ p
R ∞ p−1
Montrer que 0 F p (x)dx = p−1 0
F (x)f (x)dx. [On pourra utiliser une intégration par
parties.]
p
Montrer que kF kp ≤ p−1 kf kp .
p
(c) Monter que kF kp ≤ p−1 kf kp (on ne suppose plus que f (x) ≥ 0 pour tout x ∈]0, ∞[).

2. On ne suppose plus que f ∈ Cc (]0, ∞[).

(a) Montrer qu’il existe (fn )n∈N ⊂ Cc (]0, ∞[) t.q kfn −f kp → 0 quand n → ∞. [On pourra utiliser
la densité de Cc (R, R) dans LpR (R, B(R), λ), exercice 6.4.]
p
(b) Montrer que F ∈ C(]0, ∞[) ∩ Lp et que kF kp ≤ p−1 kf kp .

kF k p
3. Montrer que sup{ kf kpp , f ∈ Lp , kf kp 6= 0} = p−1 (dans cette formule, F est donné comme
1
précédemment à partir de f ). [On pourra considérer la suite (fn )n∈N? définie par fn (t) = t− p 1]1,n[ (t)
pour t ∈]0, ∞[).]

Exercice 6.15 (Continuité d’une application de Lp dans Lq ) Corrigé 102 page 389
Soit (E, T, m) un espace mesuré fini, p, q ∈ [1, ∞[ et g une application continue de R dans R t.q. :
p
∃ C ∈ R?+ ; |g(s)| ≤ C|s| q + C, ∀s ∈ R. (6.41)

1. Soit u ∈ LpR (E, T, m). Montrer que g ◦ u ∈ LqR (E, T, m).


On pose Lr = LrR (E, T, m), pour r = p et r = q. Pour u ∈ Lp , on pose G(u) = {h ∈ LqR (E, T, m);
h = g ◦ v p.p.}, avec v ∈ u. On a donc G(u) ∈ Lq et cette définition a bien un sens, c’est à dire que
G(u) ne dépend pas du choix de v dans u.
2. Soit (un )n∈N ⊂ Lp . On suppose que un → u p.p., quand n → ∞, et qu’il existe F ∈ Lp t.q. |un | ≤ F
p.p., pour tout n ∈ N. Montrer que G(un ) → G(u) dans Lq .
3. Montrer que G est continue de Lp dans Lq .

174
4. On considère ici (E, T, m) = ([0, 1], B(R), λ) et on prend p = q = 1. On suppose que g ne vérifie
pas (6.41). On va construire u ∈ L1 t.q. G(u) 6∈ L1 .

(a) Soit n ∈ N? , montrer qu’il existe αn ∈ R tel que : |g(αn )| ≥ n|αn | et |αn | ≥ n.
(b) On choisit une suite (αn )n∈N vérifiant les conditions données à la question précédente. Montrer
qu’il existe α > 0 t.q.
+∞
X α
2
= 1.
n=1
|αn |n

α
(c) Soit (an )n∈N une suite définie par : a0 = 1 et an+1 = an − (où αn et α sont définies
|αn |n2
P+∞
dans les 2 questions précédentes). On pose u = n=1 αn 1[an+1 ,an [ . Montrer que u ∈ L1 et
G(u) 6∈ L1 .

Exercice 6.16 (Conv. p.p. et conv. des normes, par Egorov) Corrigé 103 page 391
Soit (E, T, m) un espace mesuré et 1 ≤ p ≤ ∞. On note Lp l’espace LpR (E, T, m). Soit (fn )n une suite
d’éléments de Lp et f ∈ Lp . On suppose que fn → f p.p., quand n → ∞.

1. Montrer que kf kp ≤ lim inf n→∞ kfn kp . [Traiter séparément le cas 1 ≤ p < ∞ et p = ∞.]
2. En prenant (E, T, m) = (]0, 1[, B(]0, 1[), λ) (où λ est la mesure de Lebesgue sur les boréliens de
]0, 1[), donner un exemple pour lequel la suite (kfn kp )n∈N converge dans R et kf kp < limn∈N kfn kp .
[On pourra aussi traiter séparément les cas 1 ≤ p < ∞ et p = ∞.]

Pour la suite de l’exercice, on suppose que kfn kp → kf kp , quand n → ∞.


3. Dans cette question, on suppose que p = 1.

(a) On suppose que m(E) < ∞. Pour tout n ∈ N, on choisit un représentant de fn , encore noté
fn . On choisit aussi un représentant de f , encore noté f . Soit A ∈ T et ε > 0. On suppose
que fn → f uniformément sur Ac . Montrer qu’il existe n0 t.q. :
Z Z
n ≥ n0 ⇒ |fn |dm ≤ ε + |f |dm.
A A

(b) On suppose que m(E) < ∞. Montrer que fn → f dans L1 , quand n → ∞. [On pourra utiliser
le théorème d’Egorov.]
(c) On suppose que m(E) = ∞. Soit ε > 0. Montrer qu’il existe C ∈ T t.q. :
Z
m(C) < ∞ et |f |dm ≤ ε.
Cc

(d) On suppose que m(E) = ∞. Montrer que fn → f dans L1 , quand n → ∞.

4. Dans cette question, on suppose que 1 < p < ∞. Montrer que fn → f dans Lp , quand n → ∞.
[S’inspirer de la méthode suggérée pour le cas p = 1.]
5. Dans cette question, on suppose que p = ∞ et que (E, T, m) = (]0, 1[, B(]0, 1[), λ). Donner un
exemple pour lequel fn 6→ f dans L∞ , quand n → ∞.

175
Exercice 6.17 (Conv. p.p. et conv. des normes, par Fatou) Corrigé 104 page 395
Soit (E, T, m) un espace mesuré. Pour p ∈ [1, ∞], on note Lp l’espace LpR (E, T, m).
Soit p ∈ [1, ∞[, (fn )n∈N une suite d’éléments de Lp et f ∈ Lp . On suppose que fn → f p.p. et que
kfn kp → kf kp , quand n → ∞.
1. On suppose que p = 1. Pour n ∈ N, on pose gn = |fn | + |f | − |fn − f | (en ayant choisi des
représentants de fn et f ). Montrer que gn ≥ 0 pour tout n ∈ N. En utilisant le lemme de Fatou,
montrer que fn → f dans L1 .
2. On suppose maintenant que p ∈]1, ∞[. En utilisant le lemme de Fatou pour une suite convenable,
montrer que fn → f dans Lp .
Exercice 6.18 (Compacité Lp − Lq ) Corrigé 105 page 396
Dans cet exercice, (E, T, m) est un espace mesuré. Pour tout 1 ≤ r ≤ ∞, on note Lr l’espace LrR (E, T, m)
(et Lr l’espace LrR (E, T, m)).
1. Soit r > 1 et (gn )n∈N une suite bornée de Lr . Montrer que la suite (gn )n∈N est équi-intégrable,
c’est-à-dire que :
Z
∀ε > 0, ∃δ > 0 t.q. n ∈ N, A ∈ T, m(A) ≤ δ ⇒ |gn |dm ≤ ε.
A

[Utiliser l’inégalité de Hölder.]

Soit 1 ≤ p < q ≤ ∞ et (fn )n∈N une suite bornée de Lq . On suppose dans toute la suite que fn → f
p.p. quand n → ∞.
2. (Compacité Lp − Lq .) On suppose que m(E) < ∞.

(a) Montrer que f ∈ Lq (au sens “il existe g ∈ Lq t.q. f = g p.p.”).


(b) Montrer que fn → f dans Lp quand n → ∞. [Utiliser la question 1 avec gn = |fn − f |p et un
théorème du cours.]

3. On suppose que m(E) = ∞.

(a) Soit B ∈ T t.q. m(B) < ∞. Montrer quefn 1B → f 1B dans Lp quand n → ∞.


(b) On prend ici (E, T, m) = (R, B(R), λ), q = 2, p = 1, f = 0. Donner un exemple pour lequel
(fn )n∈N ⊂ L1 , fn 6→ 0 dans L1 quand n → ∞ (et (fn )n∈N bornée dans L2 , fn → 0 p.p. quand
n → ∞).

Exercice 6.19 (Exemples de v.a. appartenant à Lq ) Corrigé 106 page 397


Soit (Ω, A, P ) un espace de probabilités et X une v.a. (réelle). Dans les trois cas suivants, donner les
valeurs de q ∈ [1, ∞] pour lesquels la variable aléatoire X appartient à l’espace Lq (Ω, A, P ) :
1. X suit une loi exponentielle E(λ) (λ > 0) (c’est-à-dire que la loi de X a une densité f par rapport
à la mesure de Lebesgue, avec f (x) = λ exp(−λx)1]0,+∞[ pour x ∈ R).
2. X suit une loi de Cauchy de paramètre c > 0 (la loi de X a une densité f par rapport à la mesure
c
de Lebesgue, avec f (x) = π1 x2 +c2 pour x ∈ R).

3. X suit une loi géométrique G(p) (p ∈]0, 1[) (c’est-à-dire que P ({X = k}) = p(1 − p)k−1 , pour tout
k ∈ N? ).

176
6.5.2 Espaces de Hilbert, Espace L2
Exercice 6.20 Corrigé 107 page 399
2
Soit (E, T, m) un espace
P mesuré et (fn )n∈N une suite d’élements de LR (E,
P T, m) deux à deux orthogonaux.
Montrer que la série n∈N fn converge (dans L2 ) si et seulement si n∈N kfn k22 est convergente (dans
R).
Exercice 6.21 (Lp n’est pas un espace de Hilbert si p 6= 2) Corrigé 108 page 399
Montrer que LpR (R, B(R), λ) (muni de sa norme usuelle) n’est pas un espace de Hilbert si 1 ≤ p ≤ ∞,
p 6= 2. [Pour p 6= 2, chercher des fonctions f et g mettant en défaut l’identité du parallèlogramme,
c’est-à-dire l’identité (6.18) page 144.]
Exercice 6.22 (Caractérisation des espaces de Hilbert séparables)
Soit E un espace de Hilbert (réel) de dimension infinie. Montrer que E est séparable si et seulement si il
existe une base hilbertienne dénombrable de E [l’une des implications a d’ejà été vue. . . ].
Exercice 6.23 (projection sur le cône positif de L2 ) Corrigé 109 page 399
Soit (X, T, m) un espace mesuré et E = L2R (X, T, m). On pose C = {f ∈ E, f ≥ 0 p.p.}.
1. Montrer que C est une partie convexe fermée non vide de E.
2. Soit f ∈ E. Montrer que PC f = f + .
Exercice 6.24 (Exemple de non existence de la projection) Corrigé 110 page 400
Dans cet exercice, on donne un exemple t.q. :
E est un espace de Banach réel, F est un sous espace vectoriel fermé de E, g ∈ E \ F (et donc d(g, F ) =
inf{kg − f kE , f ∈ F } > 0. . . ) et il n’existe pas d’élément f ∈ E t.q. d(g, F ) = kg − f kE .

On prend E = C([0, 1], R), on munit E de la norme habituelle, kf kE = max{|f (x)|, x ∈ [0, 1]}. On pose
R1
F = {f ∈ E; f (0) = 0, 0 f (x)dx = 0}. Enfin, on prend g ∈ E défini par g(x) = x, pour tout x ∈ [0, 1].
1. Montrer que E est un espace de Banach (réel).
2. Montrer que F est un sous espace vectoriel fermé de E.
R1 R1
3. Soit f ∈ F . Montrer que kg − f kE ≥ 1/2. [On pourra remarquer que 0
|(g − f )(x)|dx ≥ 0
(g −
f )(x)dx = 1/2.]
4. Montrer qu’il n’existe pas d’élément f ∈ F t.q. kg − f kE = 1/2.
5. Montrer que d(g, F ) = 1/2. [On pourra, par exemple, montrer que kg − fn kE → 1/2, avec fn défini
par fn (x) = −βn x, pour x ∈ [0, 1/n], fn (x) = (x − 1/n) − βn /n, pour x ∈ [1/n, 1], et βn choisi pour
que fn ∈ F .]
Exercice 6.25 (Lemme de Lax-Milgram) Corrigé 111 page 402
Soit E est un espace de Hilbert réel et a une application bilinéaire de E × E dans R. On note (·/·) le
produit scalaire dans E et k · k la norme dans E. On suppose qu’il existe C ∈ R et α > 0 t.q. :

|a(u, v)| ≤ Ckukkvk, ∀u, v ∈ E (continuité de a),

a(u, u) ≥ αkuk2 , ∀u ∈ E (coercivité de a).


Soit T ∈ E 0 . On va montrer, dans cet exercice, qu’il existe un et un seul u ∈ E t.q. T (v) = a(u, v) pour
tout v ∈ E (ceci est le lemme de Lax-Milgram).

177
1. On suppose, dans cette question, que a est symétrique. On définit une application bilinéaire, notée
(·/·)a de E × E dans R par (u/v)a = a(u, v). Montrer que (·/·)a est un produit scalaire sur E et
que la norme induite par ce produit scalaire est équivalente à la norme k · k. En déduire qu’il existe
un et un seul u ∈ E t.q. T (v) = a(u, v) pour tout v ∈ E. [Utiliser le théorème de représentation de
Riesz.]
2. On ne suppose plus que a est symétrique.
(a) Soit u ∈ E, Montrer que l’application v 7→ a(u, v) est un élément de E 0 . En déduire qu’il
existe un et un seul élément de E, notée Au, t.q. (Au/v) = a(u, v) pour tout v ∈ E.
On note, dans la suite A l’application qui à u ∈ E associe Au ∈ E.
(b) Montrer que A est linéaire continue de E dans E.
(c) Montrer que Im(A) est fermé
(d) Montrer que (Im(A))⊥ = {0}.
(e) Montrer que A est bijective et en déduire qu’il existe un et un seul u ∈ E t.q. T (v) = a(u, v)
pour tout v ∈ E.

Exercice 6.26 (Exemple de projection dans L2 ) Corrigé 112 page 404


On désigne par λ la mesure de Lebesgue sur les boréliens de ]0, 1[, par Lp l’espace LpR (]0, 1[, B(]0, 1[), λ)
et par Lp l’espace LpR (]0, 1[, B(]0, 1[), λ).

Soit g ∈ L2 .

1. Soit v ∈ L2 et φ ∈ Cc∞ (]0, 1[, R) (on rappelle que φ ∈ Cc∞ (]0, 1[, R) signifie que φ est une application
de ]0, 1[ dans R, de classe C ∞ , et qu’il existe K ⊂]0, 1[, K compact, t.q. φ(x) = 0 pour tout
x ∈]0, 1[\K) . Montrer que vgφ0 ∈ L1 .

On pose C = {v ∈ L2 ; v ≤ 1 p.p., vgφ0 dλ ≤ φdλ, pour tout φ ∈ Cc∞ (]0, 1[, R), φ ≥ 0}. (On
R R

rappelle que φ ≥ 0 signifie φ(x) ≥ 0 pour tout x ∈]0, 1[.)

2. Montrer que C est un convexe fermé non vide de L2 .


3. On désigne par 1 la fonction constante et égale à 1 sur ]0, 1[. Soit u ∈ C. Montrer que :
R
(ku − 1k2 ≤ kv − 1k2 pour tout v ∈ C) ⇔ ( (1 − u)(u − v)dλ ≥ 0 pour tout v ∈ C).
4. Soit u ∈ C t.q. ku − 1k2 ≤ kv − 1k2 pour tout v ∈ C. On suppose que u, g ∈ C 1 (]0, 1[, R).

(a) Montrer que (ug)0 (x) ≥ −1 pour tout x ∈]0, 1[.


(b) Soit x ∈]0, 1[ t.q. u(x) < 1. Montrer que (ug)0 (x) = −1.
(c) Montrer que u est solution du problème suivant:
(ug)0 (x) ≥ −1, pour tout x ∈]0, 1[,
u(x) ≤ 1, pour tout x ∈]0, 1[,
(1 + (ug)0 (x))(u(x) − 1) = 0, pour tout x ∈]0, 1[.

Exercice 6.27 (Approximation dans L2 ) Corrigé 113 page 408

178
On désigne par λ la mesure de Lebesgue sur les boréliens de R, par Lp l’espace LpR (R, B(R), λ) et par Lp
l’espace LpR (R, B(R), λ). On note dt = dλ(t).
Pour f ∈ L2 et k ∈ N? , on définit Tk f de R dans R par :
Z n(x)+1
k
Tk f (x) = k f (t)dt, (6.42)
n(x)
k

n(x) n(x) + 1
où n(x) est l’entier de Z tel que ≤x< (l’entier n dépend donc de x).
k k
1. Soit k ∈ N? et f ∈ L2 . Montrer que Tk f ∈ L2 (plus précisément, Tk f ∈ L2 et on confond alors,
comme d’habitude, Tk f avec {g ∈ L2 , g = Tk f p.p.}) et que kTk f k2 ≤ kf k2 , pour tout k ∈ N? .
2. Soit f ∈ Cc (R, R) (i.e. f continue de R dans R et à support compact). Montrer que Tk f → f dans
L2 quand k → ∞.
3. Soit f ∈ L2 . Montrer que Tk f → f dans L2 quand k → ∞.

Exercice 6.28 (Projections orthogonales) Corrigé 114 page 409


On pose H = L2R (] − 1, +1[, B(] − 1, +1[), λ). (On rappelle que B(] − 1, +1[) est
R la tribu borélienne de
] − 1, 1[ et λ la mesure de Lebesgue sur B(] − 1, +1[).) Soit F = {f ∈ H t.q. ]−1,+1[ f dλ = 0}. Soit
R R
G = {f ∈ H t.q. ]−1,0[ f dλ = ]0,1[ f dλ}.

1. Montrer que F et G sont des sous-espaces vectoriels fermés de H. Déterminer les sous-espaces F ⊥ ,
G⊥ et F ∩ G.
2. Calculer, pour g ∈ H, les projections orthogonales PF (g) et PG (g) de g sur F et G.

Exercice 6.29 (Projection orthogonale dans L2 ) Corrigé 115 page 410


On pose L2 = L2R (R, B(R), λ) (muni de sa structure hilbertienne habituelle) et, pour α, β ∈ R donnés,
α < β, C = {f ∈ L2 ; α ≤ f ≤ β p.p.}.

1. Montrer que C est vide si et seulement si αβ > 0.


2. On suppose maintenant que αβ ≤ 0. Montrer que C est une partie convexe fermée non vide de L2 .
Soit f ∈ L2 , montrer que PC f (x) = max{min{f (x), β}, α} pour presque tout x ∈ R. (PC f désigne
la projection de f sur C.)

Exercice 6.30 Corrigé 116 page 411


Soit (E, T, m) un espace mesuré, et Lp = LpR (E, T, m).
1. On suppose ici qu’ il existe A et B ∈ T t.q. A ∩ B = ∅, et 0 < m(B) < +∞, 0 < m(A) <
+∞. Montrer que Lp est un Hilbert si et seulement si p = 2. [On pourra utiliser l’identité du
parallèlogramme avec des fonctions de Lp bien choisies.]
2. Montrer que pour m = δ0 (mesure de Dirac en 0), LpR (R, B(R), m) est un Hilbert pour tout p ∈
[1, +∞].

Exercice 6.31 (Espace l2 ) Corrigé 117 page 412

179
On note m la mesure du dénombrement sur P(N), c’est-à-dire m(A) = card(A) si A est fini et m(A) = ∞
si A n’est pas fini.
On note l2 = L2R (N, P(N), m).
1. Montrer que chaque élément de l2 ne contient qu’un seul élément de l’espace L2R (N, P(N), m).

2. Montrer que l’inégalité de Cauchy-Schwarz sur l2 donne :


X X X
( an bn )2 ≤ a2n b2n
n∈N n∈N n∈N

a2n < ∞ et 2
P P
pour toutes suites (an )n∈N , (bn )n∈N ⊂ R+ t.q. n∈N n∈N bn < ∞.

ϕ : N? → NP
?
, bijective. Montrer que n∈N? ϕ(n)
P
3. Soit P n2 = ∞. [On pourra commencer par montrer
n 1 n 1
que p=1 ϕ(p) ≤ p=1 p pour tout n ∈ N? puis utiliser l’inégalité de Cauchy-Schwarz.]

Exercice 6.32 (Isométrie d’un espace de Hilbert avec l2 ) Corrigé 118 page 413
Soit H un espace de Hilbert réel, de dimension infinie et séparable. Soit {en , n ∈ N} une base hilbertienne
de H (une telle base existe, cf. proposition 6.17).
Pour u ∈ H, on définit au ∈ l2 (l2 est défini à l’exercice 6.31) par au (n) = (u/en )H , pour tout n ∈ N.
(On montrera tout d’abord que au est bien un élément de l2 .)
Montrer que l’application A : u 7→ au (est linéaire et) est une isométrie de H dans l2 , c’est-à-dire que
kau kl2 = kukH pour tout u ∈ H.
Montrer que A est bijective (il faut donc montrer que, pour tout a ∈ l2 , il existe u ∈ H t.q. a = au ).

Exercice 6.33 (Tribu et partition, suite et fin)


Cet exercice est la suite de l’exercice 3.35. Soit (Ω, A, P ) un espace de probabilité et a une partition de Ω
On note τ (a) la tribu engendrée par a (voir l’exercice 3.35). On suppose que la partition a est mesurable,
c’est-à-dire que ses atomes sont des éléments de A (on a donc τ (a) ⊂ A).
Donner une base hilbertienne de L2 (Ω, τ (a), P ) construite à partir des atomes de a.
En déduire l’expression de la projection orthogonale d’une variable aléatoire X appartenant à L2 (Ω, A, P )
sur le sous espace L2 (Ω, τ (a), P ).

6.5.3 Théorème de Radon-Nikodym et Dualité dans les espaces Lp


Exercice 6.34 (Fonctions absolument continues) Corrigé (partiel) 119 page 414
Soit −∞ < a < b < +∞. On admet les 2 résultats suivant :

• Toute fonction monotone définie sur [a, b], à valeurs dans R, est dérivable en presque tout point de
]a, b[.
• Soit f ∈ L1R (]a, b[, B(]a, b[), λ). Pour x ∈ [a, b], on pose F (x) = f 1]a,x[ dλ. La fonction F est alors
R

dérivable en presque tout point de ]a, b[ et on a F 0 = f p.p..

1. (Fonctions monotones.) Soit f une fonction monotone croissante définie sur [a, b] et à valeurs dans
R.

180
(a) Montrer que f 0 ∈ L1R (]a, b[, B(]a, b[), λ) et que
Z
f 0 1]a,b[ dλ ≤ f (b) − f (a).

[On pourra poser f (x) = f (b) pour x > b, considérer fn (x) = n(f (x + n1 ) − f (x)) et remarquer
que fn → f 0 p.p. sur ]a, b[.]
(b) Donner un exemple pour lequel l’inégalité de la question précédente est stricte. (Les courageux
pourront chercher un exemple pour lequel f est continue. . . )

2. (Fonctions absolument continues.)


Une fonction définie sur [a, b] et à valeurs dans R est dite absolument continue si pour tout ε > 0 il
existe δ > 0 tel que pour toute famille finie d’intervalles
Pn deux à deux disjoints (]ak , bk [)1≤k≤n dont
la somme des longueurs est inférieure à δ, on a k=1 |f (bk ) − f (ak )| < ε.

(a) Montrer que “absolue continuité” implique “uniforme continuité”.


(b) Montrer que l’ensemble des fonctions absolument continues sur [a, b] forme un espace vectoriel.

3. (Fonctions absolument continues et fonctions monotones.) Une fonction f définie sur [a, b] (et à
valeurs dans R) est dite à variation bornée Ps’il existe C t.q. pour toute subdivision du segment
n
[a, b], a = x0 < x1 < ... < xn = b, on ait k=1 |f (xk ) − f (xk−1 )| ≤ C. Pour une fonction f à
variation bornée, on peut définir, pour a < x ≤ b, Vax [f ] par :
n
X
Vax [f ] = sup{ |f (xk ) − f (xk−1 )| , a = x0 < x1 < ... < xn = x, n ∈ N? }.
k=1

On pose aussi Vaa [f ] = 0.

(a) Montrer que toute fonction absolument continue est à variation bornée.
(b) Montrer pour toute fonction f (définie sur [a, b] et) absolument continue, la fonction x 7→ Vax [f ]
est absolument continue sur [a, b]. En déduire que toute fonction absolument continue (définie
sur [a, b]) est la différence de deux fonctions absolument continues monotones croissantes (et
est donc dérivable en presque tout point de ]a, b[).

4. Soit f ∈ L1R (]a, b[, B(]a, b[), λ). Pour x ∈ [a, b], on pose F (x) = f 1]a,x] dλ. Montrer que F
R

absolument continue.
5. Soit F une fonction absolument continue et monotone croissante de [a, b] dans R. On prolonge cette
fonction sur R en posant F (x) = F (a) si x < a et F (x) = F (b) si x > b. Une version étendue du
théorème de Carathéodory (cette version étendue est donnée par le théorème 2.5, pour ce résultat
il suffit de F continue croissante) donne l’existence d’une (et une seule) mesure mF sur B(R) t.q.
mF (]α, β[) = F (β) − F (α) pour tout α, β ∈ R, α < β.

(a) Montrer que mF est absolument continue par rapport à λ. [Utiliser la régularité de λ et
l’absolue continuité de F .]
(b) Montrer qu’il existe g ∈ L1R (R, B(R), λ) t.q. F (β) − F (α) = g1]α,β[ dλ, pour tout α, β ∈ R,
R

α < β. Montrer que g = F 0 p.p. sur ]a, b[.

181
6. Soit F une fonction absolument continue de [a, b] dans R. Montrer que F est dérivable en presque
tout point de ]a, b[, que F 0 ∈ L1R (]a, b[, B(]a, b[), λ) et que pour tout x ∈ [a, b] on a
Z
F (x) − F (a) = F 0 1]a,x[ dλ.

Exercice 6.35 (Dualité L1 -L∞ par le théorème de Radon-Nikodym) Corrigé 120 page 418
Soit (E, T, m) un espace mesuré fini et T ∈ (L1R (E, T, m))0 . On suppose que T est positive, c’est à dire
que, pour f ∈ L1R (E, T, m), f ≥ 0 p.p. implique T (f ) ≥ 0.

1. Pour A ∈ T , on pose µ(A) = T (1A ). Montrer que µ est bien définie et que µ est une mesure finie
sur T .
R
2. En utilisant le théorème de Radon-Nikodym, montrer qu’il existe g ∈ M+ t.q. T (1A ) = g1A dm
pour tout A ∈ T .
3. Montrer que g ∈ L∞ ∞
R (E, T, m) (plus précisément, il existe h ∈ LR (E, T, m) t.q. h = g p.p.). [On
pourra montrer que kgk∞ ≤ kT k(L1 )0 en choissisant bien A dans la formule trouvée à la question
précédente.]
4. Montrer que T (f ) = gf dm pour tout f ∈ L1R (E, T, m).
R

Exercice 6.36 (Une démonstration de la dualité Lp − Lq pour p < 2) Corrigé 121 page 420
Soit (E, T, m) un espace mesuré σ−fini et 1 ≤ p < 2. On pose q = p/(p − 1) et on note Lr l’espace
LrR (E, T, m) (pour r = p, r = q et r = 2). Soit T ∈ (Lp )0 .

1. On considére d’abord le cas où m(E) < +∞.


(a) Montrer que L2 ⊂ Lp et que l’injection canonique de L2 dans Lp est continue.
(b) Montrer qu’il existe g ∈ L2 t.q. T (f ) = f gdm pour tout f ∈ L2 .
R

(c) Montrer que la fonction g, trouvée à la question précédente, appartient à Lq [distinguer les cas
p > 1 et p = 1. Dans le cas p > 1, on pourra considérer les fonctions fn = |g|(q−2) g1{|g|≤n} .
Dans le cas p = 1, prendre f = sgn(g)1A où A = {|g| > kT k(Lp )0 }.]
(d) RSi f ∈ Lp , montrer que fn = f 1{|f |≤n} ∈ L2 . En déduire que il existe g ∈ Lq t.q. T (f ) =
f gdm, pour tout f ∈ Lp .
2. On considére maintenant le cas où m(E) = +∞. Comme m est σ-finie, on peut écrire E = ∪n∈N An ,
avec An ⊂ An+1 et m(An ) < +∞. On note Tn = {A ∈ T , A ⊂ An }, mn = m|Tn et Lr (mn ) =
LrR (An , Tn , mn ) (r = p ou q).

(a) Soit n ∈ N. Pour f ∈ Lp (mn ), on pose Tn (f ) = T (f˜) avec f˜ = f p.p. sur An et f˜ = 0 p.p.
sur (An )c . Montrer que Tn ∈ (Lp (mn ))0 et qu’il existe gn ∈ Lq (mn ) t.q. :
Z
Tn (f ) = f gn dmn , ∀f ∈ Lp (mn ).

On utilise (gn )n∈N dans les questions suivantes.


(b) Montrer que si m ≥ n, gn = gm p.p. sur An .
(c) On définit g : E → R par g = gn sur An .

182
i. Montrer que g ∈ Lq (E). (Distinguer les cas q < +∞ et q = +∞.)
ii. Montrer que T (f ) = f gdm, pour tout f ∈ Lp .
R

Exercice 6.37 (Dualité Lp − Lq )


Lorsque p < 2, on propose d’étudier la démonstration suivante de la dualité Lp − Lq : soit T ∈ (Lp )0 ;
1. On considére d’abord le cas où m(E) < +∞ :
(a) Montrer que L2 ⊂ Lp et que l’injection canonique de L2 dans Lp est continue.
Z
(b) En déduire que il existe g ∈ L2 t.q. T (f ) = f gdm, ∀ f ∈ L2 .

(c) Montrer que g ∈ Lq (distinguer les cas p > 1 et p = 1. Dans le cas p > 1, on pourra
considérer les fonctions fn = |g|(q−2) g1{|g|≤n} . Dans le cas p = 1, prendre f = sgn(g)1A où
A = {|g| > kT k(Lp )0 }.
Si f ∈ Lp , montrer que fn = f 1{|f |≤n} ∈ L2 . En déduire que il existe g ∈ Lq t.q. T (f ) =
(d) Z
f gdm, ∀ f ∈ Lp .

2. On considére maintenant le cas où m(E) = +∞. Comme m est σ-finie, on peut écrire E = ∪n∈N An ,
avec An ⊂ An+1 et m(An ) < +∞.
 0
(a) A n fixé, définir à partir de T une application linéaire continue Tn ∈ Lp (An ) t.q. : ∃gn ∈
Z
Lq (An ) ; Tn (f ) = f gdm, ∀f ∈ Lp (An ).
An
(b) Montrer que si m ≥ n, gn = gm pp sur An .
(c) On définit g : E → R par g = gn sur An .
(i) Montrer que g ∈ Lq (E). (Distinguer les cas q < +∞ et q = +∞.)
Z
(ii) Montrer que T (f ) = f gdm, ∀ f ∈ Lp .

Exercice 6.38 (Démonstration du théorème de dualité Lp − Lq )


Soient (E, T, m) un espace mesuré σ-fini : il existe une famille dénombrable
[ (An )n∈N d’ensembles An
qu’on peut prendre disjoints deux à deux tels que m(An ) < +∞ et E = An . Soient p ∈ [1, +∞[ et
n∈N
T une forme linéaire continue sur LpR (E, T, m) = Lp .

Partie 1. (Rappel
Z du cours.) On considère d’abord le cas p = 2, montrer qu’il existe un unique g ∈ L2
t.q. T (f ) = f gdm, ∀ f ∈ L2 .

Partie 2. On s’intéresse maintenant au cas p ∈ [1, 2]


2p
1. Soit ψ, une fonction mesurable de E dans R. Montrer que si ψ ∈ Lr , où r = , alors, pour
2−p
toute fonction f de L2 , la fonction f ψ est dans Lp .
X
Montrer qu’il existe une fonction ψ ∈ Lr de la forme : ψ = αn 1An , αn > 0.
n∈N
Dans toute la suite, ψ désignera une fonction particulière de la forme précédente.

183
2. Déduire des questions précédentes l’existence
Z d’une unique fonction G ∈ L2 t.q., pour toute fonction
f G
f de Lp t.q. ∈ L2 , on a T (f ) = f dm.
ψ ψ
1 1
3. Soient p ∈]1, 2[, et q tel que + = 1 ; on définit les fonctions fn , de E dans R, par :
p q
n
(q−2) G [
fn = |g| g1{|g|≤n} 1Bn où g = et Bn = Ap . (6.43)
ψ p=1

fn
(a) Montrer que : ∀ n ∈ N, ∈ L2 .
ψ
G
(b) En déduire que g = ∈ Lq . [Il est fortement conseillé d’utiliser la continuité de T de Lp
ψ
dans R.]
4. Soient p = 1 et f ∈ L1 . On définit : fn = sgn(g)1A 1Bn où A = {|g| > kT k(Lp )0 }.
fn
(a) Montrer que : ∀ n ∈ N, ∈ L2 .
ψ
G
(b) En déduire que m(A ∩ Bn ) = 0, ∀n ∈ N, et que g (= ) ∈ L∞ .
ψ
fn
5. Soient p ∈ [1, 2[ et f ∈ Lp , on définit fn = f 1{|f |≤n} 1Bn . Montrer que ∈ L2 et que fn tend vers
Z ψ
f dans Lp . En déduire que il existe g ∈ Lq t.q. T (f ) = f gdm, ∀ f ∈ Lp .

Partie 3. On s’intéresse maintenant au cas p > 2, et on suppose ici que T ≥ 0, i.e. T (f ) ≥ 0 pour toute
1 1
fonction f ≥ 0 p.p. Soit q tel que + = 1.
p q
1. On suppose dans cette question que la forme linéaire T est, de plus, continue pour la norme k.kL1 .
Z
(a) Montrer qu’il existe g ∈ L∞ t.q. T (f ) = f gdm pour toute fonction f ∈ L1 ∩ Lp .
(b) Montrer que g ∈ Lq . [On pourra utiliser un raisonnement similaire à celui de la question 3 de
la partie 2].
Z
(c) En déduire qu’il existe g ∈ Lq t.q. T (f ) = f gdm pour toute fonction f ∈ Lp et que
kgkLq = kT k(Lp )0 . [On pourra utiliser un raisonnement similaire à celui de la question 5 de la
partie 2].
2. On suppose ici qu’il existe une suite (Tn )n∈N de formes linéaires sur Lp vérifiant les quatre propriétés
suivantes :
∀ f ∈ Lp ; f ≥ 0, 0 ≤ Tn (f ) ≤ T (f ) (6.44)
p
∀ f ∈ L ; f ≥ 0, Tn (f ) ≤ Tn+1 (f ) (6.45)
Z
∀ f ∈ Lp ; f ≥ 0, Tn (f ) ≤ n f dm (6.46)

∀ f ∈ Lp ; f ≥ 0, Tn (f ) converge vers T (f ) lorsque n tend vers + ∞. (6.47)

184
Z
(a) Montrer que, pour tout n ∈ N, il existe gn ∈ Lq tel que Tn (f ) = gn f dm, pour tout f ∈ Lp .
Montrer que kgn kLq ≤ kT k(Lp )0
(b) Montrer que, pour tout n ∈ N, 0 ≤ gn ≤ n p.p. et gn ≤ gn+1 p.p..
Z
(c) Montrer qu’il existe g ∈ Lq t.q. T (f ) = gf dm, pour toute fonction f ∈ Lp .

3. Soit Tn l’application de Lp dans R définie par :


 Z 
Si f ∈ Lp et f ≥ 0, Tn (f ) = p
inf T (ϕ) + n (f − ϕ)dm ,
ϕ∈L ,0≤ϕ≤f

si f ∈ Lp est quelconque, Tn (f ) = Tn (f + ) − Tn (f − )

Montrer que Tn vérifie les propriétés (1) à (4).


4. Montrer que Tn est linéaire .
p q
5. En déduire que,
Z pour toute forme linéaire continue positive T sur L , il existe une fonction g de L
t.q. T (f ) = f gdm.

6. MontrerZ que, pour toute forme linéaire continue T sur Lp , il existe une fonction g de Lq t.q.
T (f ) = f gdm. [Décomposer T en une partie positive et une partie négative].

6.5.4 Convergence faible, faible-?, étroite, en loi. . .


Exercice 6.39 Corrigé 122 page 423
2 2 2
R ⊂ L = RL (E, T, m) et f ∈ L t.q. la suite
Soient (E, T, m) un espace mesuré, (fn )n∈N (fn )n∈N tende
faiblement vers f dans L , c’est-à-dire : fn ϕdm → f ϕdm pour toute fonction ϕ ∈ L2 .
2

1. Montrer que kf k2 ≤ lim inf n→+∞ kfn k2 .


2. On suppose de plus que kfn k2 → kf k2 lorsque n → +∞. Montrer que la suite (fn )n∈N tend vers f
dans L2 .

Exercice 6.40 (Convergence faible) Corrigé 123 page 424


Soit (E, T, m) un espace mesuré σ−fini. Pour 1 ≤ r ≤ ∞, on note Lr l’espace LrR (E, T, m). Soit
1 ≤ p < ∞ et q = p/(p − 1). Soit (fn )n∈N ⊂ Lp et f ∈ Lp .

1. Montrer que fn → f faiblement dans Lp quand n → ∞ (voir la dénition 6.17) si et seulement si


Z Z
fn gdm → f gdm, ∀g ∈ Lq . (6.48)

2. Montrer que kf kp ≤ lim inf n→∞ kfn kp si fn → f faiblement dans Lp , quand n → ∞. [Utiliser
(6.48) avec un choix convenable de g.]
On suppose dans les questions suivantes (questions 3 à 7) que:

m(E) < ∞, fn → f p.p., ∃C t.q. kfn kp ≤ C, ∀n ∈ N. (6.49)

185
3. On suppose, dans cette question, que p > 1.

(a) Soit N ∈ N etR g ∈ Lq t.q.R g = 0 p.p. sur EN


c
avec EN = ∩n≥N {x ∈ E; |fn (x) − f (x)| ≤ 1}.
Montrer que fn gdm → f gdm, quand n → ∞.
(b) Montrer que fn → f faiblement dans Lp . [Pour g ∈ Lq , introduire gN = g1EN .]
(c) Donner un exemple avec (E, T, m) = (]0, 1[, B(]0, 1[), λ) pour lequel fn 6→ f dans Lp .

4. On suppose, dans cette question, que p = 1. Montrer que kf k1 ≤ lim inf n→∞ kfn k1 . Donner un
exemple avec (E, T, m) = (]0, 1[, B(]0, 1[), λ) pour lequel fn 6→ f faiblement dans L1 , quand n → ∞.
5. On suppose, dans cette question, que p > 1 et on prend 1 ≤ r < p. Montrer que fn → f dans Lr ,
quand n → ∞. [On pourra, par exemple, utiliser le théorème de Vitali pour la suite (gn )n∈N avec
gn = |fn − f |r .]
6. Pour cette question, on retire dans (6.49) l’hypothèse m(E) < ∞ et on suppose que p > 1. Montrer
que fn → f faiblement dans Lp .

7. Dans cette question, on conserve l’hypothèse (6.49) mais on ne suppose plus que f ∈ Lp . Montrer
que f appartient nécessairement à Lp .
8. On prend maintenant (E, T, m) = (]0, 1[, B(]0, 1[), λ) et on définit fn , pour n ∈ N par fn = 1 p.p.
sur ]2k/n, (2k + 1)/n[ pour k ∈ N, (2k + 1)/n ≤ 1 et fn = −1 p.p. sur ]2k − 1/n, 2k/n[ pour
k ∈ N? , 2k/n ≤ 1. Montrer que fn → 0 faiblement dans Lp , pour tout 1 ≤ p < ∞. [On pourra, par
exemple, utiliser la densité de C([0, 1], R) dans L1 .]

Exercice 6.41 Soit (fn )n∈N la suite de fonctions de ]0, 1[ dans R définie par fn (x) = (n − n2 x)+ . On
note λ la mesure de Lebesgue sur la tribu B(R) des boréliens de ]0, 1[, et Lp = LpR (]0, 1[, B(R), λ) pour
p ∈ [1, +∞].
1. Montrer que la suite (fn )n∈N est bornée dans L1 .
2. Montrer que la suite (fn )n∈N n’est pas bornée dans Lp pour p > 1.

3. Y-a-t’il convergence simple, convergence presque partout, convergence uniforme, convergence en


mesure, convergence dans Lp (p ∈ [1, +∞]) de la suite (fn )n∈N (justifier vos réponses...) ?
R
4. Montrer que pour toute fonction ϕ ∈ C([0, 1], R), on a fn ϕdλ → ϕ(0). En déduire que la suite
(fn )n∈N ne converge pas faiblement dans L1 (utiliser le fait que la mesure de Dirac n’est pas une
mesure de densité, cf exercice 5.2).

Exercice 6.42 Soient (E, T, m) un espace mesuré t.q. m(E) < +∞, et (fn )n∈N une suite de L2 =
L2 (E, T, m) t.q. :

(i) la suite (kfn k2 )n∈N est bornée,


Z Z
(ii) fn → f fn gdm → f gdm quand n → +∞.

1. Montrer que f ∈ L2 et kf k2 ≤ sup kfn k2 .


n≥1

186
2. Soit ε > 0, on note Bn = {x [
∈ E; |f (x) − fn (x)| > ε}. Montrer que m(Bn ) → 0 lorsque n → +∞.
[On pourra introduire Ap = Bn et montrer que m(Ap ) → 0 quand p → +∞.]
n≥p

3. Montrer que fn →Zf dans L1 quandZ n → +∞. Z


[On pourra écrire |fn − f |dm = |fn − f |dm + |fn − f |dm.]
|fn −f |>ε |fn −f |≤ε

4. Montrer, en donnant un exemple, que fn peut ne pas converger dans L2 , quand n → +∞.
5. Montrer que, pour tout g ∈ L2 , on a :
Z Z
fn g dm → f g dm quand n → +∞ (6.50)
Z
(on dit que fn → f “faiblement” dans L2 ). [Décomposer (f − fn )gdm de manière semblable à la
question 3.]

Exercice 6.43 Soient (E, T, m) un espace mesuré t.q. m(E) < +∞ et p ∈ [1, +∞]. Pour r ∈ [1, +∞],
on note Lr = LrR (E, T, m) et k.kr la norme usuelle sur Lr . Soit (fn )n∈N ⊂ Lp , t.q. :

(i) la suite (kfn kp )n∈N est bornée,


(ii) fn → f pp quand n → +∞.

1. Montrer que f ∈ Lp et kf kp ≤ sup kfn kp .


n≥1

2. On suppose (dans cette question seulement) que p > 1. Soit r ∈ [1, p[, montrer que fn → f dans
Lr quand n → +∞.
1 1
3. Soit q le conjugué de p (i.e. tel que p + q = 1), montrer que, pour tout g ∈ Lq , on a :
Z Z
fn g dm → f g dm quand n → +∞.

Peut-on dire que fn → f “faiblement” dans Lp ?

Exercice 6.44 (Convergence forte contre convergence faible)


Soit (E, T, m) un espace mesuré. Pour r ∈ [1, +∞], on note Lr l’espace LrR (E, T, m).
Soit p ∈ [1, ∞[ et q l’exposant conjugué de p. Soit (un )n∈N ⊂ Lp , u ∈ Lp , (vn )n∈N ⊂ Lq et v ∈ Lq .
1. On suppose que un → u faiblement dans Lp et vn → v dans Lq , quand n → ∞. Montrer que
un vn → uv faiblement dans L1 , quand n → ∞.

2. On suppose que p = 1, un → u faiblement dans L1 , vn → v p.p., quand n → ∞, et qu’il existe


C ∈ R t.q., pour tout n ∈ N, vn ≤ C p.p.. Montrer que un vn → uv faiblement dans L1 , quand
n → ∞.

Exercice 6.45 (Convergence faible et non linéarité) Corrigé 124 page 427

187
On désigne par λ la mesure de Lebesgue sur les boréliens de ]0, 1[, par Lp l’espace LpR (]0, 1[, B(]0, 1[), λ)
et par Lp l’espace LpR (]0, 1[, B(]0, 1[), λ).

1. (Unicité de la limite faible). Soit (un )n∈N ⊂ L1 et u, v ∈ L1 . On suppose que un → u faiblement


dans L1 , quand n → ∞, (c’est-à-dire que T (un ) → T (u) pour toute application T linéaire continue
de L1 dans R) et que un → v faiblement dans L1 .

(a) Montrer que (u − v)φdλ = 0, pour tout φ ∈ L∞ .


R

(b) Montrer que u = v p.p.. [Choisir convenablement φ dans l’égalité précécente.]

2. (Convergence forte contre convergence faible) Soit (vn )n∈N ⊂ L∞ et v ∈ L∞ . On suppose qu’il
existe C > 0 t.q. kvn k∞ ≤ C pour tout n ∈ N et que vn → v p.p., quand n → ∞.

(a) Montrer que vn → v dans Lp , quand n → ∞, pour tout 1 ≤ p < ∞.


(b) Donner un exemple pour lequel vn 6→ v dans L∞ .
(c) Soit (un )n∈N ⊂ L1 et u ∈ L1 . On suppose que ku
R n k∞ ≤ C pour
R tout n ∈ N et que un → u
faiblement dans L1 , quand n → ∞. Montrer que un vn dλ → uvdλ, quand n → ∞. [Ecrire
vn = v + (vn − v).]

On se donne maintenant une fonction ϕ ∈ C(R, R).


3. Soit u ∈ L∞ . Montrer que ϕ ◦ u ∈ L∞ .
4. Soit u ∈ L∞ et v, w ∈ u. Montrer que {h ∈ L∞ ; h = ϕ ◦ v p.p.} = {h ∈ L∞ ; h = ϕ ◦ w p.p.}.

Grâce aux 2 questions précédentes, pour u ∈ L∞ , on pose, si v ∈ u :


ϕ(u) = {h ∈ L∞ ; h = ϕ ◦ v p.p.}, de sorte que ϕ(u) ∈ L∞ .

On se donne maintenant (un )n∈N ⊂ L∞ . On suppose qu’il existe C > 0 t.q. kun k∞ ≤ C pour tout
n ∈ N et qu’il existe u ∈ L1 et f : ]0, 1[→ R t.q. :

• un → u faiblement dans L1 , quand n → ∞,


• ϕ(un ) → f p.p., quand n → ∞.

Le but de l’exercice est de comparer f et ϕ(u).


5. Montrer que | u1A dλ| ≤ Cλ(A) pour tout A ∈ B(]0, 1[). Montrer que u ∈ L∞ que kuk∞ ≤ C.
R

6. On suppose, dans cette question, que ϕ est affine (c’est-à-dire qu’il existe α, β ∈ R t.q. ϕ(s) = αs+β
pour tout s ∈ R). Montrer que f = ϕ(u) p.p.. [Utiliser, en particulier, la question 1.]
7. On suppose, dans cette question, que ϕ est injective. Montrer qu’il existe v ∈ L∞ t.q. un → v p.p.
quand n → ∞. En déduire que v = u et f = ϕ(u) p.p..
8. (Astuce de Minty) On suppose, dans cette question, que ϕ est croissante.

(a) Soit v ∈ L∞ . Montrer que (f − ϕ(v))(u − v)dλ ≥ 0. [Utiliser la croissance de ϕ et la question


R

2 (c).]

188
(b) Soit w ∈ L∞ . Montrer que
R
(f − ϕ(u))wdλ ≤ 0. [Utiliser la question précédente avec
v = u + (1/n)w.]
(c) Montrer que f = ϕ(u) p.p..

9. On définit un , pour n ∈ N, par un = 1 p.p. sur ]2k/2n, (2k + 1)/2n[ pour k ∈ {0, . . . , n − 1}, et
un = −1 p.p. sur ]2k − 1/2n, 2k/2n[ pour k ∈ {1, . . . , n}.
R
(a) Montrer que un φdλ → 0, quand n → ∞, pour tout φ ∈ C([0, 1], R).
(b) Montrer que un → 0 faiblement dans L1 , quand n → ∞. [On pourra, par exemple, utiliser la
densité de C([0, 1], R) dans L1 .] Montrer que un 6→ 0 dans L1 , quand n → ∞.
(c) Donner un exemple de fonction ϕ ∈ C(R, R) pour lequel ϕ(un ) → f p.p. et f 6= ϕ(0) p.p.. (et
donc ϕ n’est pas croissante et n’est pas injective).
(d) Donner un exemple de fonction ϕ ∈ C(R, R) croissante pour lequel ϕ(un ) → f p.p. (et donc
f = ϕ(0) p.p., par la question 8, et ϕ est non injective, par les questions 7 et 9 (b)).

Exercice 6.46 (Convergence étroite de mesures) Corrigé 125 page 433


Soit (mn )n∈N une suite de mesures finies sur B(R) (on rappelle que “mn finie” signifie que “mn (R) < ∞”)
et m une mesure finie sur B(R). On rappelle que Cb (R, R) ⊂ L1R (R, B(R), mn ), pour tout n ∈ N, et que
Cb (R, R) ⊂ L1R (R, B(R), m).
On suppose que : Z Z
gdmn → gdm, pour tout g ∈ Cb (R, R).

Soit f ∈ C(R, R). On ne suppose pas que f est bornée, mais on suppose que f ∈ L1R (R, B(R), mn ) pour
tout n ∈ N.

1. On pose α = supn∈N mn (R). Montrer que α < ∞.


2. On suppose, dans cette question, que :
Z
β = sup |f |2 dmn < ∞.
n∈N

(a) Soit ϕ une fonction continue de R dans R, à support compact et t.q. 0 ≤ ϕ(x) ≤ 1 pour tout
x ∈ R. Montrer qu’il existe C ∈ R, ne dépendant que de α et β (définis ci dessus), t.q. :
Z
|f |ϕdm ≤ C.

(b) Montrer que f ∈ L1R (R, B(R), m)


Z Z
(c) Montrer que f dmn → f dm, quand n → ∞.
Z
3. On ne suppose plus que sup |f |2 dmn < ∞.
n∈N

Montrer (en choississant convenablement (mn )n∈N , m et f ) que l’on peut avoir f 6∈ L1R (R, B(R), m).

Exercice 6.47 (Convergence faible et convexité) Corrigé 126 page 435

189
Dans cet exercice (E, T, m) est un espace mesuré et on suppose que la mesure m est σ−finie.. Pour tout
1 ≤ r ≤ ∞, on note Lr l’espace Lr (E, T, m) (et Lr l’espace Lr (E, T, m)). Soit 1 ≤ p < ∞, (un )n∈N une
suite bornée de Lp et u ∈ Lp t.q. un → u faiblement dans Lp quand n → ∞ (on rappelle que ceci signifie
T (un ) → T (u), quand n → ∞, pour tout T dans (Lp )0 , c’est-à-dire dans le dual topologique de Lp ).

1. On pose r = p/(p − 1) si p > 1 et r = ∞, si p = 1. Montrer que, pour tout v ∈ Lr :


Z Z
un vdm → uvdm.

Soit ϕ ∈ C 1 (R, R). On suppose que ϕ est strictement convexe (ce qui est équivalent à dire que ϕ0
est strictement croissante).
2. Soit a ∈ R. Pour x ∈ R, on pose ha (x) = ϕ(x) − ϕ(a) − ϕ0 (a)(x − a).
(a) Montrer que ha (x) > 0 si x 6= a.
(b) Montrer que ha est décroissante sur ] − ∞, a[ et croissante sur ]a, ∞(.
Soit 1 ≤ q < ∞. On suppose maintenant que la suite (ϕ(un ))n∈N est bornée dans Lq et qu’elle
converge faiblement dans Lq , quand n → ∞, vers une (classe de) fonction(s) ϕ ∈ Lq .
Précision de notation : On choisit un représentant pour un . On désigne alors par ϕ(un ) la fonction
(de E dans R) x 7→ ϕ(un (x)). Cette fonction est supposée être dans Lq et on l’identifie, comme
d’habitude, avec l’élément de Lq qu’elle représente.
Pour n ∈ N, on pose fn = [ϕ(un ) − ϕ(u) − ϕ0 (u)(un − u)].
Précision de notation : Ici aussi, pour définir fn , on choisit un représentant pour u. On désigne
alors par ϕ(u) et ϕ0 (u) les fonctions x 7→ ϕ(u(x)) et x 7→ ϕ0 (u(x)).
3. Soit k ∈ R?+ et B ∈ T t.q. m(B) < ∞. On pose Ak = {|u| ≤ k} (c’est-à-dire Ak = {x ∈ E t.q.
|u(x)| ≤ k}.
Z Z
Montrer que fn 1Ak 1B dm → (ϕ − ϕ(u))1Ak 1B dm, quand n → ∞.

4. Montrer ϕ ≥ ϕ(u) p.p.. [Utiliser les questions 2(a) et 3.]

On suppose maintenant que ϕ = ϕ(u) p.p..


5. Soit B ∈ T t.q. m(B) < ∞, k ∈ R?+ et Ak = {|u| ≤ k}. Montrer que (fn )n∈N admet une sous suite
convergeant p.p. vers 0 sur Ak ∩ B.
6. (Question plus difficile.) Montrer que (fn )n∈N admet une sous suite convergeant p.p. vers 0 sur E.
[Utiliser le fait que la mesure m est σ−finie et un “procédé diagonal”.]
7. Soit x ∈ E t.q. fn (x) → 0, montrer que un (x) → u(x). [Soit b ∈ R, limite d’une sous suite de la
suite (un (x))n∈N . Utiliser la question 2 pour montrer que b = u(x).]
8. Montrer que (un )n∈N admet une sous suite convergeant p.p. vers u.
9. On suppose ici que p > 1. Montrer que un 1B → u1B dans Lr pour tout r ∈ [1, p[ et tout B ∈ T
t.q. m(B) < ∞. [Utiliser l’exercice 6.18.]

190
10. En prenant (E, T, m) = (R, B(R), λ) et ϕ(s) = s2 , donner un exemple pour lequel un 6→ u p.p. sur
E (toutefois, d’après la question 8, (un )n∈N admet une sous suite convergeant p.p. vers u).

Exercice 6.48 (Produit de convergences faibles) Corrigé 127 page 439


Soit (E, T, m) un espace mesuré fini. Pour p ∈ [1, ∞], on note Lp l’espace LpR (E, T, m).
Soit α, β > 0. Pour a ∈ R+ , on définit ψa de R+ dans R par ψa (t) = (tα − aα )(tβ − aβ ).

1. Soit a ∈ R+ . Montrer que ψa (t) > 0 pour tout t ∈ R+ , t 6= a.

Soit (fn )n∈N une suite de fonctions positives appartenant à L∞ et lα , lβ , lα+β ∈ L∞ . On suppose
que la suite (fn )n∈N est bornée dans L∞ et que fnγ → lγ ?−faiblement dans L∞ , quand n → ∞,
pour γ = α, γ = β et γ = α + β.
On rappelle que fnγ → lγ ?−faiblement dans L∞ signifie que fnγ ϕdm → lγ ϕdm, quand n → ∞,
R R

pour tout ϕ ∈ L1 .
2. Soit ϕ ∈ L1 t.q. ϕ ≥ 0 p.p.. Montrer que la ϕdm ≥ 0.
R

3. Montrer que lα ≥ 0 p.p..


1
4. Montrer que lα+β ≥ lα lβ p.p.. [On pourra utiliser ψa (t) ≥ 0 avec t = fn (x) et a = (lα (x)) α .]
1
5. On suppose maintenant que lα+β = lα lβ p.p.. On pose f = lαα et gn = (fnα − f α )(fnβ − f β ).
(a) Montrer que gn → 0 dans L1 , quand n → ∞.
(b) Montrer qu’il existe ϕ : N → N strictement croissante t.q. gϕ(n) → 0 p.p., quand n → ∞.
Montrer que fϕ(n) → f p.p., quand n → ∞. [Utiliser la question 1.]
(c) Montrer que fn → f dans Lq , quand n → ∞, pour tout q ∈ [1, ∞[.

Exercice 6.49 (Convergence faible contre convergence forte)


Soit (E, T, m) un espace mesuré. On suppose que m est σ-finie. Pour r ∈ [1, ∞], on note Lr l’espace
LrR (E, T, m) (et Lr est muni de sa norme usuelle). Soit p, q ∈ [1, ∞] t.q. p1 + 1q = 1. Soit (fn )n∈N une
suite bornée de Lp et (ϕn )n∈N une suite bornée de Lq .

1. On suppose ici que p ∈ [1, ∞[ (et donc q ∈]1, ∞]), ϕn → ϕ dans Lq , quand n → ∞, et fn → f
faiblement dans Lp , quand n → ∞ (c’est-à-dire que T (fn ) → T (f ) pour toute application linéaire
continue T de Lp dans R).
(a) Montrer que fn ψdm → f ψdm, pour tout ψ ∈ Lq .
R R
R R
(b) Montrer que fn ϕn dm → f ϕdm.
1
2. On suppose ici que p = ∞ (et donc q = 1), ϕRn → ϕ dans L
R , quand n → ∞, et fn →1 f ?−faiblement

dans
R R n → ∞ (c’est-à-dire que fn ψdm → f ψdm pour tout ψ ∈ L ). Montrer que
L , quand
fn ϕn dm → f ϕdm.

On suppose pour la suite de l’exercice que p = 1 (et donc q = ∞) et m(E) < ∞.


3. Montrer que ϕn → ϕ dans L∞ , quand n → ∞, implique :
(p1) ϕn → ϕ p.p. quand n → ∞.

191
4. Montrer, en prenant (par exemple) (E, T, m) = (]0, 1[, B(]0, 1[), λ) que (p1) n’implique pas ϕn → ϕ
dans L∞ quand n → ∞. [Il faut donc trouver une suite (ϕn )n∈N bornée de L∞ et ϕ ∈ L∞ t.q.
ϕn → ϕ p.p., quand n → ∞, et kϕn − ϕk∞ 6→ 0, quand n → ∞.]

On suppose maintenant que la suite (ϕn )n∈N vérifie (p1) et que :


(p2) fn → f faiblement dans L1 , quand n → ∞,
5. Montrer que ϕ ∈ L∞ (au sens “il existe ϕ̄ ∈ L∞ (E, T, m) t.q. ϕ = ϕ̄ p.p.”). [On rappelle que la
suite (ϕn )n∈N est, par hypothèse, bornée dans L∞ .]
6. On admet que (p2) implique l’équi-intégrabilité de la suite (fn )n∈N , c’est-à-dire :
Z
∀ε > 0, ∃δ > 0 t.q. A ∈ T, m(A) ≤ δ, n ∈ N ⇒ |fn |dm ≤ ε.
A
R R
Montrer que fn ϕn dm → f ϕdm. [On pourra utiliser le théorème d’Egorov.]

Exercice 6.50 (Dunford-Pettis)


En attente

Exercice 6.51 (Conv. étroite et conv. des mesures des intervalles) Corrigé 128 page 439
Soit (mn )n∈N une suite de mesures sur B(R) et m une mesure sur B(R). On suppose que mn → m
étroitement, quand n → ∞, et que m est diffuse (c’est-à-dire que m({x}) = 0 pour tout x ∈ R). Soit I
un intervalle de R, montrer que mn (I) → m(I) quand n → ∞. Montrer (en donnant un contre-exemple)
que cette propriété peut être fausse si m n’est pas diffuse.

Exercice 6.52 (Convergence en loi) Corrigé 129 page 440


Soit (Ω, A, P ) un espace de probabilités et X une v.a. réelle de loi uniforme sur [−1, 1].

1. Montrer que −X est une v.a. de même loi que X.


2. Donner un exemple de suite (Xn )n∈N de v.a. t.q. :

(a) (Xn )n∈N converge en loi vers X,


(b) (Xn − X)n∈N ne converge pas en loi vers 0.

3. Donner un exemple de trois v.a. X, Y, Z t.q. X et Y aient la même loi, mais sans que XZ et Y Z
aient la même loi.

Exercice 6.53 (Convergence en loi + convergence en probabilité) Corrigé 130 page 441
Soit (Ω, A, P ) est un espace de probabilité, X une v.a. réelle et (Xn )n∈N , (Yn )n∈N deux suites de v.a.
réelles t.q. :
Xn → X en loi, Yn → 0 en probabilité, quand n → ∞.
Montrer que
Xn + Yn → X en loi, quand n → ∞.
[On pourra utiliser la convergence vague.]

Exercice 6.54 (Convergence en loi versus convergence en probabilité) Corrigé 131 page 442

192
Soit (Ω, A, P ) un espace de probabilité, X une v.a. réelle et (Xn )n∈N une suite de v.a. réelles.

1. On suppose, dans cette question, que Xn → X en probabilité, quand n → ∞. Montrer que :

Xn → X en loi, quand n → ∞.

[Remarquer qu’il suffit de démontrer une convergence vague de PXn vers PX .]

2. On suppose qu’il existe a ∈ R t.q. X = a p.s.. On suppose aussi que Xn → X en loi, quand n → ∞.
Montrer que :
Xn → X en probabilité, quand n → ∞.

193
Chapter 7

Produits d’espaces mesurés

7.1 Motivation
Au chapitre 1, on a introduit la mesure de Lebesgue sur la tribu des boréliens de R (notée B(R)), ce
qui nous a permis d’exprimer la notion de longueur d’une partie (borélienne) de R. On peut se poser
la question de savoir s’il existe une mesure sur une tribu convenable de R2 qui exprimerait la notion de
surface (et une mesure sur une tribu convenable de R3 qui exprimerait la notion de volume. . . ).
La question est donc : existe-t-il une mesure λ2 sur une tribu de R2 contenant B(R) × B(R), vérifiant :

λ2 (A × B) = λ(A)λ(B), ∀A, B ∈ B(R) ? (7.1)

La tribu T2 , sur laquelle on veut définir λ2 , doit donc contenir B(R) × B(R). On remarque tout d’abord
que B(R) × B(R) = {A × B, A ∈ B(R), B ∈ B(R)} n’est pas une tribu. En effet, B(R) × B(R) n’est pas
stable par passage au complémentaire ni par union (par contre, B(R) × B(R) est stable par intersection
dénombrable). On définit alors T2 comme la tribu engendrée par B(R) × B(R), qu’on note B(R) ⊗ B(R).

On cherche alors une mesure λ2 : T2 → R+ t.q. λ2 (A × B) = λ(A)λ(B) pour tout A, B ∈ B(R). On


peut montrer l’existence et l’unicité de la mesure λ2 (voir le théorème 7.1). On peut aussi montrer que
la tribu T2 est la tribu borélienne sur R2 , c’est-à-dire la tribu engendrée par les ouverts de R2 (voir la
proposition 7.1).

Une autre question qu’on abordera dans ce chapitre concerne l’intégration des fonctions à plusieurs
variables. Considérons par exemple une fonction f définie de R2 dans R. Sous quelles hypothèses (faciles
à vérifier. . . ) peut-on écrire :
Z Z  Z Z 
f (x, y)dy dx = f (x, y)dx dy ? (7.2)

Une réponse à cette question est apportée par le théorème de Fubini, que nous verrons dans ce chapitre.

On introduira aussi le produit de convolution de deux fonctions, qui sera utile, par exemple, pour démon-
trer des théorèmes de densité. Mais la convolution est un notion utile pour beaucoup d’autres raisons
(elle est utile, par exemple, en théorie du signal).

194
7.2 Mesure produit
On rappelle ici qu’un espace mesuré (E, T, m) est σ-fini (on dit aussi que m est σ-finie) si il existe une
famille (An )n∈N ⊂ T t.q. E = ∪n∈N An et m(An ) < +∞, pour tout n ∈ N. L’espace mesuré (R, B(R), λ)
est σ-fini (prendre, par exemple, An = [−n, n]). Il existe, par contre, des mesures non finies. L’exemple
le plus simple sur (R, B(R)) consiste à prendre m(A) = ∞ pour tout A ∈ B(R), A 6= ∅. Un exemple plus
intéressant (intervenant pour certains problèmes) consiste à se donner un borélien non vide B de R (B
peut être, par exemple, réduit à un point) et à définir mB par mB (A) = ∞ si A ∈ B(R) et A ∩ B 6= ∅ et
mB (A) = 0 si A ∈ B(R) et A ∩ B = ∅.

Définition 7.1 (Tribu produit) Soient (E1 , T1 ) et (E2 , T2 ) des espaces mesurables. On pose E =
E1 × E2 . On appelle tribu produit la tribu sur E engendrée par T1 × T2 = {A1 × A2 , A1 ∈ T1 , A2 ∈ T2 }.
Cette tribu produit est notée T1 ⊗ T2 .

Un exemple fondamental est (E1 , T1 ) = (E2 , T2 ) = (R, B(R)). On va montrer que, dans ce cas, B(R) ⊗
B(R) = B(R2 ).

Proposition 7.1 (Tribu B(RN ))


Pour tout N ≥ 2, on a B(RN −1 ) ⊗ B(R) = B(RN ).

Démonstration : La démonstration est faite pour N = 2 dans l’exercice 2.5 (corrigé 13). Elle s’adapte
facilement pour traiter aussi le cas N > 2 (exercice 7.1).

Théorème 7.1 (Mesure produit)


Soient (E1 , T1 , m1 ) et (E2 , T2 , m2 ) deux espaces mesurés σ-finis, E = E1 × E2 et T = T1 ⊗ T2 . Alors, il
existe une et une seule mesure m sur T vérifiant :

m(A1 × A2 ) = m1 (A1 )m2 (A2 ) pour tout A1 ∈ T1 , et A2 ∈ T2 t.q. m1 (A1 ) < ∞ et m(A2 ) < ∞. (7.3)

Cette mesure est notée m = m1 ⊗ m2 . De plus, m est σ-finie.

Démonstration :
Existence de m. On va construire une mesure m sur T vérifiant (7.3).
Soit A ∈ T . On va montrer,
R à l’étape 1, que, pour tout x1 ∈ E1 , on a 1A (x1 , ·) ∈ M+ (E2 , T2 ). On pourra
donc poser fA (x1 ) = 1A (x1 , ·)dm2 , pour tout x1 ∈ E1 . L’application fA sera donc une application R de
E1 dans R+ . On va montrer, à l’étape 2, que fA ∈ M+ (E1 , T1 ). On posera alors m(A) = fA dm1 .
Enfin, il restera à l’étape 3 à montrer que m est bien une mesure vérifiant (7.3) et que m est σ-finie.

Etape 1. Pour A ∈ P(E) et x1 ∈ E1 , on note S(x1 , A) = {x2 ∈ E2 ; (x1 , x2 ) ∈ A} ⊂ E2 , de sorte que


1A (x1 , ·) = 1S(x1 ,A) .
Soit x1 ∈ E1 . On pose Θ = {A ∈ P(E); S(x1 , A) ∈ T2 }.
On remarque tout d’abord que Θ ⊃ T1 × T2 . En effet, si A = A1 × A2 avec A1 ∈ T1 et A2 ∈ T2 , on a
S(x1 , A) = A2 ∈ T2 si x1 ∈ A1 et S(x1 , A) = ∅ ∈ T2 si x1 6∈ A1 .
On remarque ensuite que Θ est une tribu. En effet :

• ∅ ∈ Θ car S(x1 , ∅) = ∅ ∈ T2 ,

195
• Θ est stable par passage au complémentaire. En effet :
S(x1 , Ac ) = (S(x1 , A))c (c’est-à-dire S(x1 , E \ A) = E2 \ S(x1 , A)). On a donc S(x1 , Ac ) ∈ T2 si
A ∈ Θ, ce qui prouve que Ac ∈ Θ.
• Θ est stable par union dénombrable. Il suffit de remarquer que :
S(x1 , ∪n∈N A(n) ) = ∪n∈N S(x1 , A(n) ) ∈ T2 si (A(n) )n∈N ⊂ Θ.

Θ est donc une tribu contenant T1 × T2 , ceci prouve que Θ contient T1 ⊗ T2 = T . On a donc S(x1 , A) ∈ T2
pour tout A ∈ T .

Pour tout A ∈ T , on peut donc définir une application fA : E1 → R+ en posant :


Z Z
fA (x1 ) = m2 (S(x1 , A)) = 1S(x1 ,A) dm2 = 1A (x1 , ·)dm2 ∈ R+ , pour tout x1 ∈ E1 . (7.4)

Etape 2. Dans cette étape, on démontre que fA ∈ M+ (E1 , T1 ) pour tout A ∈ T . Cette étape est plus
difficile que la précédente.
On note Σ = {A ∈ T ; fA ∈ M+ (E1 , T1 )} et on va montrer que Σ ⊃ T et donc que Σ = T .
On suppose d’abord que m2 est finie.
Il est facile de voir que Σ contient T1 × T2 . En effet, si A = A1 × A2 avec A1 ∈ T1 et A2 ∈ T2 , on a alors
fA = m2 (A2 )1A1 ∈ E+ (E1 , T1 ) ⊂ M+ (E1 , T1 ).
On note maintenant A l’ensemble des réunions finies disjointes d’éléments de T1 ×T2 (A s’appelle l’algèbre
engendrée par T1 × T2 , voir l’exercice 7.2). Si A ∈ A, il existe donc (A(p) )P p=1,...,n ⊂ T1 × T2 t.q.
n
A(p) ∩ A(q) = ∅ si p 6= q et A = ∪np=1 A(p) . On a alors fA (x1 ) = m2 (S(x1 , A)) = p=1 m2 (S(x1 , A(p) )) =
Pn (p)
p=1 fA(p) ∈ M+ (E1 , T1 ) car A ∈ T1 × T2 ⊂ Σ. On a donc A ⊂ Σ.
On montre maintenant que Σ est une classe monotone, c’est-à-dire que :

(A(n) )n∈N ⊂ Σ, A(n) ⊂ A(n+1) ∀n ∈ N ⇒ ∪n∈N A(n) ∈ Σ (7.5)

et
(A(n) )n∈N ⊂ Σ, A(n) ⊃ A(n+1) ∀n ∈ N ⇒ ∩n∈N A(n) ∈ Σ. (7.6)
(n) (n) (n+1)
Pour montrer (7.5), soit (A )n∈N ⊂ Σ t.q. A ⊂A pour tout n ∈ N. On pose A = ∪n∈N A(n) .
Soit x1 ∈ E1 . On a alors (S(x1 , A ))n∈N ⊂ T2 (par l’étape 1, car Σ ⊂ T ), S(x1 , A(n) ) ⊂ S(x1 , A(n+1) )
(n)

pour tout n ∈ N et S(x1 , ∪n∈N A(n) ) = ∪n∈N S(x1 , A(n) ). On en déduit, par continuité croissante de
m2 , que m2 (S(x1 , A)) = supn∈N m2 (S(x1 , A(n) )) et donc que fA = supn∈N fA(n) . Ce qui prouve que
fA ∈ M+ (E1 , T1 ) car fA(n) ∈ M+ (E1 , T1 ) pour tout n ∈ N. On a donc A = ∪n∈N A(n) ∈ Σ.
La démonstration de (7.6) est similaire, il faut utiliser la continuité décroissante de m2 au lieu de la
continuité croissante. C’est pour utiliser la continuité décroissante de m2 qu’on a besoin de m2 finie.

On a ainsi montré que Σ est une classe monotone contenant l’algèbre A. On peut en déduire, cela fait
l’objet de l’exercice 2.12 (corrigé 17), que Σ contient la tribu engendrée par A et donc aussi la tribu
engendrée par T1 × T2 (car T1 × T2 ⊂ A), c’est-à-dire que Σ contient T = T1 ⊗ T2 . On a bien montré,
finalement, que Σ = T .

Il reste maintenant à montrer que Σ = T sans l’hypothèse m2 finie. Comme m2 est σ-finie, on peut
construire une suite (Fn )n∈N ⊂ T2 t.q. Fn ⊂ Fn+1 et m2 (Fn ) < ∞ pour tout n ∈ N. Pour n ∈ N, on
(n) (n) (n)
définit alors la mesure m2 par m2 (A2 ) = m2 (A2 ∩ Fn ) pour tout A2 ∈ T2 . La mesure m2 est finie,

196
(n) (n)
l’étape 1 et la première partie de l’étape 2 donne donc que, pour tout A ∈ T , fA ∈ M+ (E1 , T1 ) où fA
(n) (n) (n)
est définie par 7.4 avec m2 au lieu de m2 (c’est-à-dire fA (x1 ) = m2 (S(x1 , A)) pour tout x1 ∈ E1 ).
(n)
On conclut alors en remarquant que fA ↑ fA quand n → ∞, ce qui donne que fA ∈ M+ (E1 , T1 ).

On a donc montré que fA ∈ M+ (E1 , T1 ) pour tout A ∈ T . Ceci nous permet de définir m : T → R+
par : Z
m(A) = fA dm1 , pour tout A ∈ T. (7.7)

Etape 3. Dans cette étape, on montre que m, définie par (7.7), est une mesure sur T et que m vérifie
(7.3) et est σ-finie.
On montre d’abord que m est bien une mesure sur T :

1. m(∅) = 0 car f∅ (x1 ) = m2 (S(x1 , ∅)) = m2 (∅) = 0.


2. (σ-additivité de m) Soit (A(n) )n∈N ⊂ T t.q. A(n) ∩ A(m) = ∅ si n 6= m. On pose A = ∪n∈N A(n) .
Pour x1 ∈ E1 , on a :

S(x1 , A) = ∪n∈N S(x1 , A(n) ) et S(x1 , A(n) ) ∩ S(x1 , A(m) ) = ∅ si n 6= m.


(n)
P
La
P σ-additivité de m2 donne alors m2 (S(x1 , A)) = n∈N m2 (S(x1 , A )), c’est-à-dire fA (x1 ) =
n∈N fA(n) (x1 ). Le premier corollaire du théorème de convergence monotone (corollaire 4.1) donne
alors: Z XZ X
m(A) = fA dm1 = fA(n) dm1 = m(A(n) ),
n∈N n∈N

ce qui donne la σ-additivité de m.

On montre maintenant que m vérifie (7.3). Soient A1 ∈ T1 et A2 ∈ TR2 t.q. m1 (A1 ) < ∞ et m(A2 ) < ∞.
On pose A = A1 × A2 . On a alors fA = m2 (A2 )1A1 et donc m(A) = fA dm1 = m2 (A2 )m1 (A1 ).
(n) (n)
Il reste à vérifier que m est σ-finie. Comme m1 et m2 sont σ-finies, il existe (B1 )n∈N ⊂ T1 et (B2 )n∈N ⊂
(n) (n) (n) (n)
T2 t.q. E1 = ∪n∈N B1 , E2 = ∪n∈N B2 et, pour tout n ∈ N, m1 (B1 ) < ∞ et m2 (B2 ) < ∞.
(n) (m)
Pour (n, m) ∈ N2 , on pose Cn,m = B1 × B2 , de sorte que E = ∪(n,m)∈N2 Cn,m et m(Cn,m ) =
(n) (m)
m1 (B1 ) × m2 (B2 ) < ∞. Comme N2 est dénombrable, on en déduit que m est σ-finie.

Unicité de m.
La partie “existence” de la démonstration donne une mesure m sur T vérifiant (7.3). La partie “unicité”
du théorème peut se montrer avec la proposition 2.5, nous développons cette méthode ci-après, ou avec
le lemme des classes monotones (exercice 2.12) comme cela est expliqué dans la remarque 7.1.
Soit m et µ deux mesures sur T vérifiant (7.3). Pour montrer que m = µ, on va apliquer la proposition 2.5.
On pose :
C = {A1 × A2 , A1 ∈ T1 , A2 ∈ T2 , m1 (A1 ) < ∞, m2 (A2 ) < ∞}.
Comme m1 et m2 sont σ−finies, il est facile de montrer que tout élément de T1 × T2 est une réunion
dénombrable d’éléments de C. On en déduit que C engendre T . Il est clair que C est stable par intersection
finie et, par (7.3), on a m = µ sur C. Puis, comme m1 et m2 sont σ−finies, il existe deux suites

197
(E1,n )n∈N ⊂ T1 et (E2,n )n∈N ⊂ T2 d’éléments de T1 et T2 , disjoints deux à deux et t.q. E1 = ∪n∈N E1,n ,
E2 = ∪n∈N E2,n et mi (Ei,n ) < ∞ pour tout i ∈ {1, 2} et tout n ∈ N. Pour n, m ∈ N, on pose Fn,m =
E1,n ×E2,m . La famille (Fn,m )n,m∈N est une famille dénombrable déléments de C, disjoints deux à deux et
t.q. E = ∪n,m∈N Fn,m et m(Fn,m ) = m1 (E1,n )m2 (E1,m ) < ∞. On peut alors utiliser la Proposition 2.5.
Elle donne m = µ sur T et termine la démonstration du théorème.

Remarque 7.1 Comme cela a été dit, un autre moyen de montrer la partie “unicité” du théorème
précédent est d’utiliser le lemme des classes monotones (exercice 2.12). Supposons tout d’abord que m1
et m2 sont finies. On a alors (par (7.3)) :
m(E) = µ(E) = m1 (E1 )m2 (E2 ) < ∞.
La condition (7.3) donne également que m = µ sur T1 ×T2 . On a alors aussi m = µ sur l’algèbre engendrée
par T1 × T2 , notée A (cette algèbre a été définie dans la partie “existence” de la démonstration). En effet,
si A ∈ A, il existe (A(p) )p=1,...,n ⊂ T1 × T2 t.q. A(p) ∩ A(q) = ∅ si p 6= q et A = ∪np=1 A(p) . On a alors, par
additivité de m et µ, m(A) = n∈N m(A(n) ) = n∈N µ(A(n) ) = µ(A).
P P

On pose maintenant Σ = {A ∈ T ; m(A) = µ(A)}. On vient de montrer que Σ ⊃ A. Il est d’autre


part facile de voir que Σ est une classe monotone. En effet, les propriétés de continuité croissante et de
continuité décroissante appliquées à m et µ permettent facilement de vérifier (7.5) et (7.6) (on utilise
ici, pour montrer (7.6), que m et µ sont des mesures finies). Comme dans la partie “existence” de
la démonstration, l’exercice 2.12 donne alors que Σ contient la tribu engendrée par A et donc que Σ
contient T = T1 ⊗ T2 . Ce qui donne Σ = T et donc m = µ.
(n) (n)
Dans le cas où m1 et m2 ne sont pas finies, mais σ-finies, il existe (B1 )n∈N ⊂ T1 et (B2 )n∈N ⊂ T2
(n) (n) (n) (n)
t.q. E1 = ∪n∈N B1 , E2 = ∪n∈N B2 et, pour tout n ∈ N, m1 (B1 ) < ∞ et m2 (B2 ) < ∞. On peut
(n) (n+1) (n) (n+1)
également supposer que B1 ⊂ B1 et B2 ⊂ B2 pour tout n ∈ N (il suffit, par exemple, de
(n) n (p)
remplaçer Bi par ∪p=0 Bi ). Par un raisonnement analogue à celui fait dans le cas où m1 et m2 sont
(n) (n)
finies, on peut montrer que m = µ sur {A ∈ T ; A ⊂ B1 × B2 }. On conclut alors, en utilisant la
propriété de continuité croissante, que m = µ sur T .

Remarque 7.2 Dans le théorème précédente (théorème 7.1), on peut aussi remarquer que :
1. m(A1 × A2 ) = m1 (A1 )m2 (A2 ) = ∞ si A1 ∈ T1 et A2 ∈ T2 avec m1 (A1 ) 6= 0 et m(A2 ) = ∞ (ou
avec m1 (A1 ) = ∞ et m2 (A2 ) 6= 0),
2. m(A1 × A2 ) = 0 si A1 ∈ T1 et A2 ∈ T2 avec m1 (A1 ) = 0 et m(A2 ) = ∞ (ou avec m1 (A1 ) = ∞ et
m2 (A2 ) = 0).
En effet, on suppose par exemple que m1 (A1 ) = 0 et m(A2 ) = ∞. Comme m2 est σ-finie, on peut
construire une suite (Fn )n∈N ⊂ T2 t.q. Fn ⊂ Fn+1 et m2 (Fn ) < ∞ pour tout n ∈ N. On a alors, par
continuité croissante de m, m(A1 × A2 ) = limn→∞ m(A1 × (A2 ∩ Fn )) = limn→∞ m1 (A1 )m2 (A2 ∩ Fn ) = 0
(on a d’ailleurs aussi m2 (A2 ∩ Fn ) ↑ ∞, ce qui permet de conclure si 0 < m1 (A1 ) < ∞ que m(A1 × A2 ) =
∞). Les autres cas se traitent de manière analogue.
Définition 7.2 (Espace produit)
L’espace (E, T, m), construit dans le théorème 7.1, s’appelle l’espace (mesuré) produit des espaces (E1 , T1 ,
m1 ) et (E2 , T2 , m2 ).
Un exemple fondamental d’espace produit est l’espace (RN , B(RN ), λN ) pour N ≥ 2 que nous verrons
dans la section 7.4.

198
7.3 Théorèmes de Fubini-Tonelli et Fubini
Théorème 7.2 (Fubini-Tonelli) Soient (E1 , T1 , m1 ) et (E2 , T2 , m2 ) des espaces mesurés σ-finis. On
note (E, T, m) l’espace produit (donc, T = T1 ⊗ T2 et m = m1 ⊗ m2 ). Soit f : E → R+ une fonction
mesurable positive (i.e. T -mesurable positive). Alors :

1. f (x1 , ·) ∈ M+ (E2 , T2 ) pour tout x1 ∈ E1 ,


on pose Z Z
ϕf (x1 ) = f (x1 , ·)dm2 = f (x1 , x2 )dm2 (x2 ) pour tout x1 ∈ E1 ,

de sorte que ϕf : E1 → R+ ,
2. ϕf ∈ M+ (E1 , T1 ),
Z Z Z Z 
3. f dm = ϕf dm1 = f (x1 , x2 )dm2 (x2 ) dm1 (x1 ),

4. les mêmes résultats sont vrais en inversant les rôles de m1 et m2 , de sorte que :
Z Z  Z Z 
f (x1 , x2 )dm2 (x2 ) dm1 (x1 ) = f (x1 , x2 )dm1 (x1 ) dm2 (x2 ).

Démonstration : la démonstration se fait en plusieurs étapes.

Etape 1.R Soit f = 1A , A ∈R T . La partie “existence de m” de la démonstration du théorème 7.1 donne


alors que f dm = m(A) = ϕf dm1 .
Plus précisément, on a, pour tout x1 ∈ E1 , f (x1 , ·) = 1A (x1 , ·) = 1S(x1 ,A) , avec S(x1 , A) = {x2 ∈ E2 ;
(x1 , x2 ) ∈ A} ⊂ E2 (comme dans la démonstration du théorème 7.1). L’étape 1 de la démonstration
(de la partie existence) du théorème 7.1 donne que S(x1 , A) ∈ T2 pour tout x1 ∈ E1 , et donc f (x1 , ·) ∈
M+ (E2 , T2 ). Ceci donne le premier item (pour f = 1A ) de la conclusion du théorème 7.2.
R
On pose ϕf (x1 ) = f (x1 , ·)dm2 = m2 (S(x1 , A)) pour tout x1 ∈ E1 . (Cette fonction ϕf était notée
fA dans la démonstration du théorème 7.1). L’étape 2 de la démonstration du théorème 7.1 donne que
ϕf ∈ M+ (E1 , T1 ). Ceci donne le deuxième item (pour f = 1A ) de la conclusion du théorème 7.2.
R
On a alors posé, dans la démonstration du théorème 7.1, m(A) = ϕf dm1 et l’étape 3 a montré que m
était une mesure sur T vérifiant (7.3) (et la seule mesure sur T vérifiant (7.3), d’après la partie “unicité”
de la démonstration du théorème 7.1). Ceci donne le troisième item (pour f = 1A ) de la conclusion du
théorème 7.2.

Pour avoir le quatrième item (pour f = 1A ) de la conclusion du théorème 7.2, il suffit de remarquer
que l’on peut inverser les rôles de m1 et m2 dans la démonstration du théorème
R 7.2. On obtient ainsi
que f (·, x2 ) ∈ M+ (E1 , T1 ) pour tout x2 ∈ RE2 . On pose alors ψf (x2 ) = f (·, x2 )dm1 . On obtient que
ψf ∈ M+ (E2 , T2 ). Enfin, on pose m̃(A) = ψf dm2 et on obtient que m̃ est une mesure sur T vérifiant
(7.3). La partie “unicité” de la démonstration du théorème 7.1 donne alors que m = m̃, ce qui est
exactement le quatrième item (pour f = 1A ) de la conclusion du théorème 7.2.

?
Pn2. On prend maintenant f ∈ E+ (E, T ). Il existe donc a1 , . . . , an ∈ R+ et A1 , . . . , An ∈ T t.q.
Etape
f = i=1 ai 1Ai .

199
Pn
On a alors, pour tout x1 ∈ E1 , f (x1 , ·) = i=1 ai 1Ai (x1 , ·) ∈ M+ (E2 , T2 ) car l’étape 1 donne 1Ai (x1 , ·) ∈
M+ (E2 , T2 ) pour tout i. Ce qui donne le premier item de la conclusion du théorème 7.2.
R Pn
On pose ϕf (x1 ) = f (x1 , ·)dm2 pour tout x1 ∈ E1 . On a ϕf ∈ M+ (E1 , T1 ) car ϕf = i=1 ai ϕ1Ai et
que ϕ1Ai ∈ M+ (E1 , T1 ) pour tout i (d’après l’étape 1). Ce qui donne le deuxième item de la conclusion
du théorème 7.2.

Enfin, on utilise la linéarité de l’intégrale et l’étape 1 pour f = 1Ai , on obtient :


Z X n Xn Z Z X n
f dm = ai m(Ai ) = ai ϕ1Ai dm1 = ( ai ϕ1Ai )dm1
i=1 i=1 i=1
Z n
X Z Z Z Z
 
= ai 1Ai (x1 , ·)dm2 dm1 (x1 ) = f (x1 , ·)dm2 dm1 (x1 ) = ϕf dm1 .
i=1

Ce qui donne le troisième item de la conclusion du théorème 7.2.

Pour avoir le quatrième item de la conclusion du théorème 7.2, il suffit de changer les rôles de m1 et m2 .

Etape 3. On peut enfin prendre f ∈ M+ (E, T ). Il existe une suite (fn )n∈N ∈ E+ (E, T ) t.q. fn ↑ f
quand n → ∞.
On a donc, pour tout x1 ∈ E1 , fn (x1 , ·) ↑ f (x1 , ·) quand n → ∞. On en déduit que f (x1 , ·) ∈ M+ (E2 , T2 )
car (d’après l’étape 2) fn (x1 , ·) ∈ M+ (E2 , T2 ) pour tout n ∈ N (ce qui donne le premier item).
R R
Le théorème de convergence monotone (pour m2 ) donne que ϕfn (x1 ) = fn (x1 , ·)dm2 ↑ f (x1 , ·)dm2 =
ϕf (x1 ) pour tout x1 ∈ E1 . Donc, ϕfn ↑ ϕf . Comme ϕfn ∈ M+ (E1 , T1 ) (d’après l’étape 2), on en déduit
que ϕf ∈ M+ (E1 , T1 ) (ce qui donne le deuxième item).
On applique maintenant le théorème de convergence monotone pour m1 et pour m, ils donnent :
Z Z Z Z
ϕfn dm1 ↑ ϕf dm1 et fn dm ↑ f dm quand n → ∞.
R R R R
L’étape 2 donne fn dm = ϕfn dm1 , on en déduit donc que f dm = ϕf dm1 . Ce qui donne le
troisième item de la conclusion du théorème 7.2.

Enfin, ici encore, pour avoir le quatrième item de la conclusion du théorème 7.2, il suffit de changer les
rôles de m1 et m2 .

Corollaire 7.1 Soient (E1 , T1 , m1 ) et (E2 , T2 , m2 ) des espaces mesurés σ-finis. On note (E,T ,m) l’es-
pace produit. Soit f : E → R une fonction T -mesurable. Alors :
Z Z  Z Z 
f ∈ L1R (E, T, m) ⇐⇒ |f |dm2 dm1 < +∞ ⇐⇒ |f |dm1 dm2 < +∞. (7.8)

Démonstration : Le corollaire découle


R immédiatement du théorème 7.2 appliqué à la fonction |f | ∈
M+ (E, T ). Dans (7.8), la notation ( |f |dm2 )dm1 signifie :
Z 
|f (x1 , x2 )|dm2 (x2 ) dm1 (x1 ).

La notation est similaire en inversant les rôles de m1 et m2 .

Voici une conséquence immédiate du théorème 7.2 pour la mesurabilité :

200
Proposition 7.2 Soient (E1 , T1 ) et (E2 , T2 ) deux espaces mesurables. On pose E = E1 × E2 et T =
T1 ⊗ T2 . Soit f ∈ M(E, T ) (c’est-à-dire f : E → R, T -mesurable). Alors :
1. f (x1 , ·) ∈ M(E2 , T2 ), pour tout x1 ∈ E1 ,

2. f (·, x2 ) ∈ M(E1 , T1 ), pour tout x2 ∈ E2 .

Démonstration : La démonstration est facile, il suffit de remarquer que f = f + − f − et que f + , f − ∈


M+ (E, T ). Le premier item de la conclusion du théorème 7.2 donne alors, pour tout x1 ∈ E1 , f + (x1 , ·) ∈
M+ (E2 , T2 ) et f − (x1 , ·) ∈ M+ (E2 , T2 ). Comme f (x1 , ·) = f + (x1 , ·) − f − (x1 , ·), on en déduit que
f (x1 , ·) ∈ M(E2 , T2 ). En changeant les rôles de (E1 , T1 ) et (E2 , T2 ), on montre aussi que f (·, x2 ) ∈
M(E1 , T1 ), pour tout x2 ∈ E2 .

Remarque 7.3 La réciproque de la proposition précédente est fausse. Soient (E1 , T1 ) et (E2 , T2 ) deux
espaces mesurables, E = E1 × E2 et T = T1 ⊗ T2 . Soit f : E → R t.q.
1. f (x1 , ·) ∈ M(E2 , T2 ), pour tout x1 ∈ E1 ,

2. f (·, x2 ) ∈ M(E1 , T1 ), pour tout x2 ∈ E2 .


Alors, f n’est pas forcément T -mesurable. Un exemple est donné dans l’exercice 7.4. Un cas particulier
intéressant pour laquelle cette réciproque est vraie est donné par la proposition 7.3.

Proposition 7.3 Soient (E1 , T1 ) et (E2 , T2 ) deux espaces mesurables. On pose E = E1 × E2 et T =


T1 ⊗T2 . Soient F1 ∈ M(E1 , T1 ) et F2 ∈ M(E2 , T2 ). On définit f : E → R par f (x1 , x2 ) = F1 (x1 )F2 (x2 )
pour tout (x1 , x2 ) ∈ E. Alors f est T -mesurable (c’est-à-dire f ∈ M(E, T )).

Démonstration : On procède en 3 étapes.


Etape 1. On prend d’abord F1 = 1A1 et F2 = 1A2 avec A1 ∈ T1 et A2 ∈ T2 . On a alors f = 1A1 ×A2 ∈
M(E, T ) car A1 × A2 ∈ T1 × T2 ⊂ T1 ⊗ T2 = T .
(1) (1)
Etape 2. On prend maintenant F1 ∈ E(E1 , T1 ) et F2 ∈ E(E2 , T2 ). Il existe alors a1 , . . . , an ∈ R,
(1) (1) (2) (2) (2) (2)
A1 , . . . , An ∈ T1 , a1 , . . . , am ∈ R et A1 , . . . , Am ∈ T2 t.q. :
n
(1) (1) (1) (1)
X
F1 = ai Ai et Ai ∩ Ak = ∅ si i 6= k,
i=1

m
(2) (2) (2) (1)
X
F2 = aj Aj et Aj ∩ Ak = ∅ si j 6= k.
j=1
Pn Pm (1) (2)
On a alors f = i=1 j=1 ai aj 1A(1) ×A(2) ∈ E(E, T ) ⊂ M(E, T ).
i j

(1)
Etape 3. On prend enfin F1 ∈ M(E1 , T1 ) et F2 ∈ M(E2 , T2 ). Il existe (Fn )n∈N ⊂ E(E1 , T1 ) et
(2) (1) (2)
(Fn )n∈N ⊂ E(E2 , T2 ) t.q. Fn (x1 ) → F1 (x1 ) pour tout x1 ∈ E1 et Fn (x2 ) → F2 (x2 ) pour tout
(1) (2)
x2 ∈ E2 . On en déduit que fn (x1 , x2 ) = Fn (x1 )Fn (x2 ) → f (x1 , x2 ) pour tout (x1 , x2 ) ∈ E et donc
que f ∈ M(E, T ) car fn ∈ M(E, T ) pour tout n ∈ N (étape 2).

201
Théorème 7.3 (Fubini)
Soient (E1 , T1 , m1 ) et (E2 , T2 , m2 ) des espaces mesurés σ-finis. On note (E, T, m) l’espace produit. Soit
f : E → R une fonction T -mesurable (c’est-à-dire f ∈ M(E, T )) et intégrable pour la mesure m,
c’est-à-dire f ∈ L1R (E, T, m). Alors :

1. f (x1 , ·) ∈ L1R (E2 , T2 , m2 ) pour presque tout x1 ∈ E1 ,


on pose ϕf (x1 ) = f (x1 , ·)dm2 pour x1 ∈ E1 t.q. f (x1 , ·) ∈ L1R (E2 , T2 , m2 ). La fonction ϕf est
R

donc définie p.p. sur E1 (et à valeurs dans R).

2. ϕf ∈ L1R (E1 , T1 , m1 ) (au sens : il existe g ∈ L1R (E1 , T1 , m1 ) t.q. f = g p.p.).


Z Z Z Z 
3. f dm = ϕf dm1 = f (x1 , x2 )dm2 (x2 ) dm1 (x1 ),

4. les mêmes résultats sont vrais en inversant les rôles de m1 et m2 , de sorte que :
Z Z  Z Z 
f (x1 , x2 )dm2 (x2 ) dm1 (x1 ) = f (x1 , x2 )dm1 (x1 ) dm2 (x2 ).

Démonstration : Comme f ∈ M(E, T ), on a f + , f − ∈ M+ (E, T ). On peut donc appliquer le théorème


de Fubini-Tonelli (théorème 7.2) à f + et f − . Il donne :
1. f + (x1 , ·), f − (x1 , ·) ∈ M+ (E2 , T2 ), pour tout x1 ∈ E1 ,

2. ϕf + , ϕf − ∈ M+ (E1 , T1 ) avec ϕf ± (x1 ) = f ± (x1 , ·)dm2 pour tout x1 ∈ E1 .


R

3. f ± dm = ϕf ± dm1 .
R R

Le premier item donne que f (x1 , ·) = f + (x1 , ·) − f − (x1 , ·) ∈ M(E2 , T2 ) (noter que f, f + et f − sont à
valeurs dans R).
Comme f + dm < ∞ et f − dm < ∞ (car f ∈ L1R (E, T, m)), le troisième item donne que ϕf + < ∞
R R

p.p. (sur E1 ) et que ϕf − < ∞ p.p. (sur E1 ). On a donc f + (x1 , ·) ∈ L1R (E2 , T2 , m2 ) et f − (x1 , ·) ∈
L1R (E2 , T2 , m2 ) pour presque tout x1 ∈ E1 . On en déduit donc que f (x1 , ·) = f + (x1 , ·) − f − (x1 , ·) ∈
L1R (E2 , T2 , m2 ) pour presque tout x1 ∈ E1 . Ce qui donne le premier item de la conclusion.
La fonction ϕf est donc définie p.p. sur E1 et on a ϕf = ϕf + −ϕf − p.p. (on a ϕf (x1 ) = ϕf + (x1 )−ϕf − (x1 )
en tout point x1 t.q. ϕf + (x1 ) < ∞ et ϕf − (x1 ) < ∞). Comme ϕf + < ∞ et ϕf − < ∞ p.p, on peut trouver
A ∈ T1 t.q. m1 (A) = 0 et ϕf + < ∞ et ϕf − < ∞ sur Ac = E1 \ A. En posant g = ϕf +R− ϕf − sur
c 1
R et g = 0Rsur A, on a donc g ∈ M(E1 , T1 ), g = ϕf p.p. et g ∈ LR (E1 , T1 , m1 ) car |g|dm1 ≤
A
ϕf + dm1 + ϕf − dm1 < ∞. Ceci donne le deuxième item de la conclusion (le fait que ϕf appartienne
à L1R (E1 , T1 , m1 )) et donne aussi le troisième item car :
Z Z Z Z Z Z Z
ϕf dm1 = gdm1 = ϕf + dm1 − ϕf − dm1 = f + dm − f − dm = f dm.

Enfin, comme pour le théorème de Fubini-Tonelli, le quatrième item de la conclusion s’obtient en


changeant les rôles de m1 et m2 .

Le théorème de Fubini est souvent utilisé sous la forme du corollaire suivant :

202
Corollaire 7.2 Soient (E1 , T1 , m1 ) et (E2 , T2 , m2 ) des espaces mesurés σ-finis, (E,T ,m) l’espace produit
et f : E → R une fonction T -mesurable t.q. :
Z Z 
|f (x1 , x2 )|dm2 (x2 ) dm1 (x1 ) < +∞
ou Z Z 
|f (x1 , x2 )|dm1 (x1 ) dm2 (x2 ) < +∞.

Alors : Z Z  Z Z 
f (x1 , x2 )dm2 (x2 ) dm1 (x1 ) = f (x1 , x2 )dm1 (x1 ) dm2 (x2 ). (7.9)

(Toutes les intégrales ayant bien un sens.)


Démonstration : Le corollaire est une conséquence immédiate du théorème 7.3 et de l’équivalence
(7.8).

Remarque 7.4 (contre-exemple lié au théorème de Fubini) On cherche ici à construire une fonc-
tion pour laquelle la conclusion du théorème de Fubini n’est pas vérifiée : soient a une fonction (continue)
de R dans R et f : R2 → R définie par f (x, y) = a(x) si x ≥ 0 et x ≤ y < 2x, f (x, y) = −a(x) si x ≥ 0 et
2x ≤ y < 3x, f (x, y) = 0 si x < 0 ou x ≥ 0 et y ∈ / [x, 3x]. On pose b(x) = x a(x). On peut montrer que
les hypothèses du théorème de Fubini ne
Z Z sont vérifiées b ∈ L1R (R, B(R), λ). En prenant par exemple
queZ si Z
1   
a(x) = , on montre que : f (x, y)dy dx 6
= f (x, y)dx dy (voir l’exercice 7.5).
(1 + x)2

7.4 Mesure de Lebesgue sur la tribu des boréliens de RN


On a déjà vu que B(RN ) = B(RN −1 ) ⊗ B(R) pour tout N ≥ 1 (exercice 2.5 pour N = 2 et exercice
7.1). Le paragraphe précédent permet alors de définir la mesure de Lebesgue sur les boréliens de RN
(c’est-à-dire sur la tribu B(RN ), engendrée par les ouverts de RN ) pour tout N ≥ 1.

Définition 7.3 (Mesure de Lebesgue sur B(RN ))

1. La mesure de Lebesgue sur B(R2 ) est la mesure λ ⊗ λ, on la note λ2 .


2. Par récurrence sur N , la mesure de Lebesgue sur B(RN ), N ≥ 3, est la mesure λN −1 ⊗ λ, on la
note λN .
Z Z
1 N 1 N N 1 N
On note L (R ) = LR (R , B(R ), λN ), et pour f ∈ L (R ), on note f (x)dλN (x) = f (x)dx.
On donne maintenant quelques propriétés de la mesure de Lebesgue sur B(RN ). Il s’agit de propriétés
élémentaires ou de généralisations simples de propriétés vues pour la mesure de Lebesgue sur B(R). Les
démonstrations seront proposées en exercices.

Proposition 7.4 (Propriétés élémentaires de λN )


Soit N ≥ 2. On rappelle que λN est la mesure de Lebesgue sur B(RN ).
1. La mesure λN est σ-finie.
QN QN QN
2. Soit A1 , . . . , AN ∈ B(R). Alors, i=1 Ai ∈ B(RN ) et λN ( i=1 Ai ) = i=1 λ(Ai ).

203
3. Soient α1 , . . . , αN ∈ R et β1 , . . . , βN ∈ R t.q. αi < βi pour tout i ∈ {1, . . . , N }. Alors :
N
Y N
Y N
Y
λN ( ]αi , βi [) = λ(]αi , βi [) = (βi − αi ).
i=1 i=1 i=1

4. Soit K un compact de RN (noter que K ∈ B(RN )). Alors, λN (K) < +∞.
5. Soit O un ouvert non vide de RN . Alors, λN (O) > 0.
6. Soit f, g ∈ C(RN , R). Alors f = g p.p. (c’est-à-dire λN -p.p.) implique f (x) = g(x) pour tout
x ∈ RN .
7. Cc (RN , R) ⊂ L1R (RN , B(RN ), λN ). (En confondant f avec sa classe, on écrira donc souvent
Cc (RN , R) ⊂ L1R (RN ).)
Démonstration : Comme λN est une mesure produit, le fait que λN est σ-finie est (par récurrence sur
N ) une conséquence du théorème donnant l’existence (et l’unicité) de la mesure produit (théorème 7.1)
car ce théorème donne que le produit de mesures σ-finies est σ-finie.

La démonstration des autres propriétés fait l’objet de l’exercice 7.10.

Une propriété très importante de λN est sa “régularité”, c’est-à-dire que pour tout élément A de B(RN )
et pour tout ε > 0, il existe O ouvert de RN et F fermé de RN tels que
F ⊂ A ⊂ O et λN (O \ F ) ≤ ε.
Cette propriété est une conséquence du fait que toute mesure sur B(RN ), finie sur les compacts, est
régulière (proposition 7.5).
Proposition 7.5 (Régularité d’une mesure sur B(RN ), finie sur les compacts)
Soit m une mesure sur B(RN ) t.q. m(K) < ∞ pour tout compact K de RN . (Noter que ceci est vrai
pour m = λN .) Alors :
1. Pour tout A ∈ B(RN ) et pour tout ε > 0, il existe O ouvert de RN et F fermé de RN tels que :
F ⊂ A ⊂ O et m(O \ F ) ≤ ε. (7.10)

2. Pour tout A ∈ B(RN ), on a m(A) = inf{m(O), O ouvert t.q. A ⊂ O}.


Démonstration : Cette proposition fait l’objet de l’exercice 7.11.

On donne maintenant des généralisations au cas de λN de propriétés déjà vues pour λ.


Proposition 7.6 (Densité de Cc dans L1 (RN )) Pour tout N ≥ 1, l’espace Cc (RN , R) est dense dans
L1 (RN ) (c’est-à-dire que, pour tout f ∈ L1 (RN ) et tout ε > 0, il existe ϕ ∈ Cc (RN , R) t.q. kf − ϕk1 ≤ ε).
Démonstration : La démonstration de cette proposition fait l’objet de l’exercice 7.12, elle découle
essentiellement de la régularité de λN . Cette démonstration est très voisine de celle faite pour le cas
N = 1, théorème 5.5.

Comme cela a déjà été dit après le théorème 5.5, le résultat de densité que nous venons d’énoncer n’est
pas limité à la mesure de Lebesgue. Il est vrai pour toute mesure sur B(RN ), finie sur les compacts. Il
est aussi vrai en remplaçant Cc par Cc∞ . On obtient donc le théorème suivant :

204
Théorème 7.4 (Densité de Cc∞ dans L1 (RN )) Soit N ≥ 1 et µ sur une mesure sur B(RN ), finie sur
les compacts. Alors, l’espace Cc∞ (RN , R) est dense dans L1 (RN , B(RN ), µ) (c’est-à-dire que, pour tout
f ∈ L1 (RN , B(RN ), µ) et tout ε > 0, il existe ϕ ∈ Cc (RN , R) t.q. kf − ϕk1 ≤ ε).

Démonstration : La démonstration de ce théorème fait l’objet de l’exercice 7.13.

Proposition 7.7 (Invariance par translation)


Soient N ≥ 1, α1 , . . . , αN ∈ R? et β1 , . . . , βN ∈ R. Pour x = (x1 , . . . , xN )t ∈ RN . On pose ϕ(x) =
(α1 x1 + β1 , . . . , αN xN + βN )t (de sorte que ϕ est une bijection de RN dans RN ). Pour tout A ∈ B(RN ),
QN
on a alors ϕ(A) = {ϕ(x), x ∈ A} ∈ B(RN ) et λN (ϕ(A)) = i=1 |αi |λN (A).
Pour αi = 1 pour tout i, cette propriété s’appelle “invariance par translation de λN ”.

Démonstration : Cette proposition a déjà été vue pour N = 1, proposition 2.9. La démonstration de la
proposition 2.9 utilisait , par exemple, le fait que tout ouvert est réunion dénombrable d’intervalles ouverts
disjoints 2 à 2 (et la régularité de λ). La démonstration proposée ici pour N ≥ 1 utilise une récurrence
sur N et la partie “unicité” du théorème 7.1 sur la mesure produit. Elle fait l’objet de l’exercice 7.14.
On peut aussi noter que la partie “unicité” du théorème 7.1 peut être faite (voir la remarque 7.1) avec
le lemme des classes monotones (exercice 2.12). Ce lemme pourrait aussi être utilisé pour démontrer la
proposition 2.9 (au lieu du théorème de régularité et du fait que tout ouvert est réunion dénombrable
d’intervalles ouverts disjoints 2 à 2).

Proposition 7.8 (Changement de variables simple)


Soient N ≥ 1, α1 , . . . , αN ∈ R? et β1 , . . . , βN ∈ R. Pour x = (x1 , . . . , xN )t ∈ RN . On pose ϕ(x) =
(α1 x1 + β1 , . . . , αN xN + βN )t (de sorte que ϕ est une bijection de RN dans RN ). Alors :

1. Pour tout f ∈ M+ = M+ (RN , B(RN )), on a f ◦ ϕ ∈ M+ et :


Z N
Y Z
f dλN = |αi | (f ◦ ϕ)dλN .
i=1

2. Pour tout f ∈ L1 = L1R (RN , B(RN ), λN ), on a f ◦ ϕ ∈ L1 et :


Z N
Y Z
f dλN = |αi | (f ◦ ϕ)dλN .
i=1

Démonstration : La démonstration est une conséquence simple de la proposition 7.7. Elle fait l’objet
de l’exercice 7.15.
QN
Noter aussi que i=1 |αi | est la valeur absolue du déterminant de la matrice jacobienne de ϕ au point
x. Cette matrice est notée Dϕ(x), elle ne dépend pas de x pour les applications considérées dans cette
proposition. Cette proposition sera généralisée au théorème 7.5.

205
7.5 Convolution
1 N 1 N N 1 N
R R
R rappelle que L (R ) = LR (R , B(R ), λN ) et que, pour f ∈ L (R ), f dλN = f (x)dλN (x) =
On
f (x)dx (c’est-à-dire que dx signifie toujours dλN (x)).
On note aussi L1 (RN ) = L1R (RN , B(RN ), λN ).
Soient f, g ∈ L1 (RN ). On souhaite définir la fonction “convoluée” de f et g, c’est-à-dire définir f ? g par :
Z
f ? g(x) = f (t)g(x − t)dt. (7.11)

La définition de cette fonction nécessite les deux conditions suivantes :


1. Il faut que la définition ne dépende pas des représentants choisis pour f et g.
2. Il faut que, ayant choisi des représentants pour f et g, encore notés f et g, la fonction g(x − ·)f (·)
appartienne à L1 (RN ) (au sens “il existe h ∈ L1 (RN ) t.q. g(x − ·)f (·) = h p.p.”). Ceci n’est pas
immédiat car, en général, le produit deux fonctions intégrables n’est pas une fonction intégrable.
La condition 1 est satisfaite, car, pour x ∈ RN , si f , f1 , g et g1 sont des fonctions de RN dans R, on a :

f = f1 p.p., g = g1 p.p. ⇒ f (·)g(x − ·) = f1 (·)g1 (x − ·) p.p.. (7.12)

(p.p. signifiant ici λN -p.p..) En effet, il suffit de remarquer que si f = f1 p.p. et g = g1 p.p., il existe
A, B ∈ B(RN ) t.q. λN (A) = λN (B) = 0, f = f1 sur Ac et g = g1 sur B c . Pour x ∈ RN , on a alors
f (·)g(x − ·) = f1 (·)g1 (x − ·) sur Ac ∩ Bxc = (A ∪ Bx )c avec Bx = {x − z, z ∈ B}. On en déduit bien
f (·)g(x − ·) = f1 (·)g1 (x − ·) p.p. car λN (A ∪ Bx ) ≤ λN (A) + λN (Bx ) = λN (A) + λN (B) = 0 (on utilise
ici la propriété d’invariance par translation donnée dans la proposition 7.7).
On en déduit que, si Si f et f1 [resp. g et g1 ] sont des représentants d’un même élément de L1 (RN ), on
1 N 1 N 1 N
Ra f (.)g(x − .) ∈ L R(R ) si et seulement si f1 (.)g1 (x − .) ∈ L (R ) et, si f (.)g(x − .) ∈ L (R ), on a
f (t)g(x − t)dt = f1 (t)g1 (x − t)dt.

On montre dans la proposition suivante que la condition 2 est satisfaite pour presque tout x ∈ RN .

Proposition 7.9 (Convolution) Soient f, g ∈ L1 (RN ) (que l’on confond avec l’un de leurs représen-
tants). Alors :
• Pour presque tout x ∈ RN , la fonction 1 N
Z g(x − ·)f (·) appartient à L (R ) (en la confondant avec sa
classe). On pose donc : f ? g(x) = f (t)g(x − t)dt. La fonction f ? g est donc définie p.p. sur
RN .

• f ? g ∈ L1 (RN ) (au sens “il existe h ∈ L1 (RN ) t.q. f ? g = h p.p.”).


• kf ? gk1 ≤ kf k1 kgk1 .

Démonstration : On donne la démonstration pour N = 1 (le cas N > 1 est similaire, en ayant d’abord
montré que λ2N = λN ⊗ λN ).
On choisit des représentants de f et g, de sorte que f, g ∈ L1 (R) = L1R (R, B(R), λ). On souhaite appliquer
le théorème de Fubini (théorème 7.3) à H : R2 → R, définie par H(x, y) = f (y)g(x − y), avec les espaces
mesurés (Ei , Ti , mi ) = (R, B(R), λ) pour i = 1, 2.

206
CommeR λRest σ-finie, pour appliquer le théorème de Fubini, il suffit de vérifier que H est B(R2 )-mesurable
et que ( |H(x, y)|dx)dy < ∞.
On montre d’abord que H est B(R2 )-mesurable. On a H = H1 ◦ ψ avec :

H1 : (x, y) 7→ f (x)g(y), ψ : (x, y) 7→ (y, x − y).


La fonction H1 est mesurable de R2 dans R (car f et g sont mesurables de R dans R, on applique ici la
proposition 7.3) et ψ est mesurable de R2 dans R2 car continue (R et R2 sont toujours munis de leur tribu
borélienne). La fonction H est donc mesurable de R2 dans R comme composée de fonctions mesurables.
On peut maintenant calculer l’intégrale de |H| :
Z Z Z Z Z Z
( |H(x, y)|dx)dy = ( |f (y)g(x − y)|dx)dy = |f (y)|( |g(x − y)|dx)dy.
R R
La proposition 7.8 donne |g(x − y)|dx = |g(x)|dx = kgk1 , Donc :
Z Z Z
( |H(x, y)|dx)dy = kgk1 |f (y)|dy = kgk1 kf k1 < ∞.

Le théorème de Fubini peut donc s’appliquer. Il donne que H(x, ·) ∈ L1 (R) pour presque tout x ∈ R.
Donc, g(x − ·)f (·) ∈ L1 (R) pour presque tout x ∈ R. Ceci montre bien que f ? g est définie p.p.. Le
théorème de Fubini donne alors aussi que f ? g ∈ L1 (R) (au sens “il existe h ∈ L1 (R) t.q. f ? g = h p.p.”).
Enfin pour montrer que kf ? gk1 ≤ kf k1 kgk1 , il suffit de remarquer que :
Z Z Z Z
kf ? gk1 = | f (y)g(x − y)dy|dx ≤ ( |H(x, y)|dx)dy = kgk1 kf k1 .

Remarque 7.5 On a vu précédemment que L1 (RN ) muni de l’addition (loi de composition interne),
de la multiplication par un scalaire (loi de composition externe) et de la norme k · k1 est un espace de
Banach. L’ajout de la convolution (loi de composition interne) confère à L1 (RN ) la structure d’algèbre
de Banach.
On sait aussi que Cb (R, R) muni de l’addition, de la multiplication interne, de la multiplication par un
scalaire et de la norme de la convergence uniforme k · ku est aussi une algèbre de Banach. En fait, nous
montrerons par la suite qu’il existe un isomorphisme d’algèbre, appelé transformation de Fourier, entre
L1 (RN ) et son image (par cette transformation) dans Cb (RN , R).

Remarque 7.6 On donne ici quelques propriétés supplémentaires de la convolution.


Soit N ≥ 1. Pour p ∈ [1, ∞], on pose Lp (RN ) = LpR (RN , B(RN ), λ).
1. Soit f, g ∈ L1 (RN ). On a alors f ? g = g ? f p.p.. Ceci découle de l’invariance par translation de la
mesure de Lebesgue (propositions 7.7 et 7.8) et est démontré dans l’exercice 7.19.

2. Soit1 < p < ∞. Soient f ∈ Lp (RN ) et g ∈ L1 (RN ). Alors, f ? g est définie p.p. sur RN ,
f ? g ∈ Lp (RN ) et kf ? gkp ≤ kf kp kgk1 . Cette propriété fait l’objet de l’exercice 7.21.
3. Soit p, q ∈ [1, ∞] t.q. (1/p) + (1/q) = 1. Soient f ∈ Lp (RN ) et g ∈ Lq (RN ). Alors, f ? g est définie
partout sur RN et f ? g ∈ Cb (RN , R), voir l’exercice 8.6.

207
4. Soit p ∈ [1, ∞]. Soient f ∈ Lp (RN ) et g ∈ Cc∞ (RN , R). Alors, f ? g est définie partout sur RN et
f ? g ∈ C∞ (RN , R), voir l’exercice 7.20.
5. (Régularisation par convolution) Soit f : RN → R. On dit que f ∈ L1loc (RN ) si f 1K ∈ L1 (RN ) pour
tout compact K de RN . On suppose que f ∈ L1loc (RN ). Soit k ∈ N et g ∈ Cck (RN , R). Alors, f ? g
est définie partout sur RN et f ?g ∈ C k (RN , R) (voir l’exercice 7.20, noter que Lp (RN ) ⊂ L1loc (RN )).
6. Soit f, g ∈ L1 (RN ). On suppose que f et g sont à support compact (f à support compact signifie
qu’il existe K, compact de RN t.q. f = 0 p.p. sur K c ). Alors, la fonction f ? g est aussi à support
compact. Ceci fait partie de l’exercice 7.19.

La convolution est un outil très utile pour “régulariser” des fonctions. Elle est à la base de résultats de
densité fondamentaux que nous verrons dans le chapitre suivant (densité de Cc∞ (RN , R) dans Lp (RN )
pour p < ∞, par exemple).
Il est aussi intéressant de généraliser la convolution de fonctions en convolution de mesures. On com-
mence par remarquer qu’un fonction f dans L1loc (RN , B(RN ), λN ) (voir la remarque 7.6) est entièrement
déterminée par la mesure qu’elle induit sur B(RN ), c’est-à-dire par Rla mesure m définie par m = f λN .
Ceci est précisé dans le lemme suivant (en remarquant que ϕdm = ϕf dλN pour tout ϕ ∈ Cc (RN , R)).
R

Lemme 7.1 Soit N ≥ 1 et f, g ∈ L1loc (RN , B(RN ), λN ) t.q.


R R
f ϕdλN = gϕdλN , pour tout ϕ ∈
Cc (RN , R). Alors, f = g p.p..

Démonstration : Soit M ∈ N? . On note BM la boule (fermée) de centre 0 et rayon M dans RN et


hM la fonction défnie par :

hM (x) = f (x) − g(x) si x ∈ BM et |f (x) − g(x)| ≤ M,


hM (x) = 0 si x ∈ BM ou |f (x) − g(x)| > M,
hM (x) = 0 si x 6∈ BM .

On a hM ∈ L1 (RN , B(RN ), λN ) (car BM est un compact de RN ). Comme Cc (RN , R) est dense dans
L1 (RN , B(RN ), λN ) (théorème 5.5 pour d = 1 et théorème 7.6 pour N ≥ 1), il existe une suite (ϕn )n∈N
t.q. ϕn → hM dans L1 (RN , B(RN ), λN ) quand n → ∞. On peut aussi supposer (quitte à extraire une
sous suite) que ϕn → hM p.p. (théorème 6.2). Enfin, en remplaçant ϕn par max(min(ϕn , M ), −M ) on
obtient :
ϕn ∈ Cc (RN , R) pour tout n ∈ N,
ϕn → hM p.p.,
|ϕn | ≤ M pour tout n ∈ N.
Comme ϕn ∈ Cc (RN , R), on a (f R− g)ϕn dλN = 0. Le théorème de convergence dominée (la domination
R

est par M 1BM |f − g|) donne alors hM (f − R g)dλN = 0. En faisant maintenant tendre M vers l’infini, le
théorème de convergence monotone donne |f − g|dλN = 0, et donc f = g p.p.

Pour que la convolution de mesures soit une généralisation de la convolution de fonctions, on souhaite
que m ? µ = (f ? g)λN , lorsque m = f λN et g = gλN avec f, g ∈ L1 (RN , B(RN ), λN ) (et donc f ? g ∈
L1 (RN , B(RN ), λN )). Noter que m, µ et m ? µ sont des mesures signées.
Soit f, g ∈ L1 (RN , B(RN ), λN ). On pose m = f λN et g = gλN . On a, pour tout ϕ borélienne bornée de
RN dans R (par exemple, ϕ ∈ Cb (RN , R)),
Z Z Z 
(f ? g)ϕdλN = f (x − y)g(y)dy ϕ(x)dx.
Rd Rd

208
(On
R R rapelle que dx désigne dλN (x)). En utilisant le théorème de Fubini (qui s’applique bien ici car
|f (x − y)g(y)ϕ(x)|dxdy ≤ kϕk∞ kf k1 kgk1 ), puis avec le changement de variable z = x − y (pour y
fixé) on obtient :
Z Z Z  Z Z 
(f ? g)ϕdλN = f (x − y)ϕ(x)dx g(y)dy = f (z)ϕ(z + y)dz g(y)dy.
Rd Rd Rd Rd

On a donc :
Z Z Z  Z
(f ? g)ϕdλN = ϕ(z + y)dm(z) dµ(y) = ϕ(y + z)d(m ⊗ µ)(z, y), (7.13)
RN RN R2N

où la dernière égalité découle de la définition de m ⊗ µ. Plus précisément, si m et µ sont des mesures
finies (c’est-à-dire des applications σ-additives de B(RN ) dans R+ ), la dernière égalité de 7.13 est donnée
par le troisième item du théorème de Fubini (théorème 7.3). Si m et µ sont des mesures signées, on se
ramène au cas précédent avec la décomposition de Hahn (proposition 2.6) qui donne m = m+ − m− et
µ = µ∗ − µ− . La mesure m ⊗ µ est alors définie à partir de m± ⊗ µ± .
R
On est ainsi amené à définir m ? µ en utilisant le deuxième membre de (7.13) pour définir ϕd(m ? µ).

Définition 7.4 Soit N ≥ 1 et m, µ des mesures signées sur B(RN ). On définit la mesure signée µ ? ν
sur B(RN ) par :
Z
m ? µ(A) = 1A (x + y)d(m ⊗ µ)(x, y) pour tout A ∈ B(RN ).
B(R2N )

où m ⊗ ν = m+ ⊗ µ+ + m− ⊗ µ− − m− ⊗ µ+ − m+ ⊗ µ− et m± µ± sont données par la décomposition


de Hahn de m et µ (proposition 2.6).

Le fait que m?µ est une mesure signée sur B(RN ) est facile (la σ-additivité de m?µ découle, par exemple,
du théorème de convergence dominée). On déduit de cette définition la proposition suivante.

Proposition 7.10 Soit N ≥ 1 et m, µ des mesures signées sur B(RN ).


1. On a alors, pour tout ϕ borélienne bornée de RN dans R (par exemple, ϕ ∈ Cb (RN , R)) :
Z Z
ϕd(m ? µ) = ϕ(x + y)d(m ⊗ µ)(x, y).
RN B(R2N )

2. Si m et µ sont des probabilités, la mesure m ? µ est aussi une probabilité.


3. Si f, g ∈ L1 (RN , B(RN ), λN ), m = f λN et µ = gλN , on a m ? µ = (f ? g)λN .

Démonstration : Le premier item se démontre, comme souvent, en considérant des fonctions étagées,
puis en écrivant ϕ comme limite de fonctions étagées (bornées par la borne supérieure de |ϕ|, exercice 7.23).
Le deuxième item est immédiat en remarquant que m ? µ(A) ≥ 0 si m et µ sont des mesures (positives)
et m ? µ(RN ) = m(RN )µ(RN ). Enfin, le troisième item a été vu avant la proposition 7.10.

Remarque 7.7 Il aurait aussi été possible de définir m ? µ grâce au théorème de Riesz dans C0 (RN , R)
(théorème 5.4 pour N ≥ 1). Si m, µ sont des mesures signées sur B(RN ) (ou, directement, des formes
linéaires continues sur C0 (RN , R)). On définit, l’application L de C0 (RN , R) dans R par :

209
Z Z
L(ϕ) = ϕ(x + y)dm(x)dµ(y), ∀ϕ ∈ C0 (RN , R). (7.14)
RN RN
L’application L est une forme linéaire continue sur C0 (RN , R). Par le théorème de Riesz, il existe donc
une unique mesure de Radon, notée τ (c’est la mesure convoluée de m et µ) t.q. :
Z
L(ϕ) = ϕ(s)dτ (s). (7.15)

7.6 Formules de changement de variables


La proposition 7.8 donne un résultat sur les changements de variables “simples”. On donne maintenant
une généralisation dans le cas où les intégrales portent sur des ouverts bornés de RN .
Théorème 7.5 (Formules de changement de variables)
Soient N ≥ 1, U et V des ouverts bornés de RN et ϕ un C 1 -difféomorphisme de U dans V (i.e. ϕ est
une bijection de U dans V , ϕ ∈ C 1 (U, V ) et ϕ−1 ∈ C 1 (V, U )). On note Dϕ(y) la matrice jacobienne de
ϕ en y et Det(Dϕ) la fonction y 7→ Det(Dϕ(y)).
1. Soit f ∈ M+ = M+ (RN , B(RN )). Alors, (f ◦ ϕ)|Det(Dϕ)|1U ∈ M+ et :
Z Z
f (x)dx = f (ϕ(y))|Det(Dϕ(y))|dy.
V U

2. Soit f ∈ M(RN , B(RN )) t.q. f 1V ∈ L1 = L1R (RN , B(RN )). Alors, (f ◦ ϕ)|Det(Dϕ)|1U ∈ L1 et :
Z Z
f (x)dx = f (ϕ(y))|Det(Dϕ(y))|dy.
V U

Démonstration : Comme ϕ est de classe C 1 , il est facile de voir que (f ◦ϕ)|Det(Dϕ)|1U est mesurable si
f est mesurable. La démonstration de l’item 1 du théorème n’est pas faite ici. Elle consiste à se ramener
par un procédé de localisation au cas de changements de variables affines.

Le deuxième item du théorème est une conséquence facile du premier. En effet, soit f ∈ M(RN , B(RN ))
t.q. f 1V ∈ L1 . En appliquant le premier item à la fonction |f | ∈ M+ , on obtient que (f ◦ϕ)|Det(Dϕ)|1U ∈
1 + −
RL . Puis en Rappliquant le premier item à f et f et en faisant la différence, on obtient bien que
V
f (x)dx = U f (ϕ(y))|Det(Dϕ(y))|dy.

Un exemple de changement de variables


On conclut cette section en donnant l’exemple des coordonnées polaires pour N = 2.
2 2 1 2 2
R fonction f appartient à M+ (R , B(R )) (ou à L2R (R , B(R ), λ2 )) et on veut calculer (par exemple)
La
B1
f (x)dx, où B1 est la boule unité (ouverte) de R , en passant en coordonnée polaires.
On a donc B1 = {x ∈ R2 ; |x| < 1}, où | · | est la norme euclidienne dans R2 , c’est-à-dire |x|2 = x21 + x22 si
x = (x1 , x2 )t ∈ R2 .
On pose L = {(x1 , 0)t , x1 ∈ [0, 1[} et on remarque que λ2 (L) = λ([0, 1[) × λ({0}) = 0. Donc, en posant
V = B1 \ L, on a : Z Z Z Z
f (x)dx = f (x)dx = f (x)dx(= f dλ2 ).
B1 B1 \L V V

210
On pose aussi U =]0, 1[×]0, 2π[, de sorte que U et V sont de ouverts bornés de R2 . L’application
ϕ : (r, θ)t 7→ (r cos θ, r sin θ)t est alors une bijection de U dans V . Elle est de classe C 1 et son inverse
est de classe C 1 (ϕ et ϕ−1 sont même de classe C ∞ ). On peut calculer la matrice jacobienne de ϕ et son
déterminant :  
cos θ −r sin θ
Dϕ(r, θ) = , |Det(Dϕ(r, θ))| = r.
sin θ r cos θ
On peut donc appliquer le théorème 7.5, il donne :
Z Z Z Z
f (x)dx = f (x)dx = f (r cos θ, r sin θ)rdλ2 (r, θ) = f (r cos θ, r sin θ)rdλ2 (r, θ)
B1 V U ]0,1[×]0,2π[

En appliquant maintenant le théorème de Fubini-Tonelli pour évaluer la dernière intégrale (si f ∈ L1 au


lieu de f ∈ M+ , on raisonne d’abord sur |f | puis on utilise le théorème de Fubini), on obtient :
Z Z 2π Z 1
f (x)dx = ( f (r cos θ, r sin θ)rdr)dθ.
B1 0 0

Si f (x) ne dépend que de |x|, c’est-à-dire si il existe ψ t.q. f (x) = ψ(|x|), on obtient alors :
Z Z 1
f (x)dx = 2π ψ(r)rdr.
B1 0

En particulier, on voit que f 1B1 ∈ L1 (R2 ) si et seulement si g ∈ L1R (]0, 1[, B(R), λ), avec g définie par
g(r) = rψ(r) pour r ∈]0, 1[.

Prenons toujours f ∈ M+ (R2 , B(R2 )) (ou bien f ∈ L1R (R2 , B(R2 ), λ2 )). Le raisonnement que nous venons
de faire pour B1 peut être fait pour Ba = {x ∈ R2 ; |x| < a} avec a > 0. On obtient alors, pour tout
a>0: Z Z Z 2π a
f (x)dx = ( f (r cos θ, r sin θ)rdr)dθ. (7.16)
Ba 0 0

En prenant a = n, n ∈ N? , dans (7.16), on obtient aussi, quand n → ∞ (avec le théorème de convergence


monotone si f ∈ M+ et en raisonnement avec f ± si f ∈ L1 ) :
Z Z 2π Z ∞
f (x)dx = ( f (r cos θ, r sin θ)rdr)dθ. (7.17)
0 0

7.7 Exercices
7.7.1 Mesure produit
Exercice 7.1 Corrigé 132 page 443
Montrer que, pour tout n ≥ 2, on a B(Rn ) = B(Rn−1 ) ⊗ B(R). [S’inspirer de la démonstration faite pour
n = 2 dans l’exercice 2.5.]

Exercice 7.2 Corrigé 133 page 445

211
Soient E1 , E2 deux ensembles, T1 une tribu sur E1 et T2 une tribu sur E2 . On note E = E1 × E2 et on
rappelle que T1 × T2 = {A1 × A2 , A1 ∈ T1 , A2 ∈ T2 }.
Montrer que l’algèbre engendrée par T1 ×T2 est égale à l’ensemble des réunions finies disjointes d’éléments
de T1 × T2 c’est-à-dire que, pour tout A ∈ P(E), A appartient à l’algèbre engendrée par T1 × T2 si et
seulement si il existe (A(p) )p=1,...,n ⊂ T1 × T2 t.q. A(p) ∩ A(q) = ∅ si p 6= q et A = ∪np=1 A(p) .

Exercice 7.3 (Exemple de mesure produit) Corrigé 134 page 446


Soit m1 et m2 des mesures σ−finies, non nulles, sur (R, B(R)) et t.q. m1 ⊗ m2 (R2 \ D) = 0, où D =
{(x, x), x ∈ R}. Montrer qu’il existe a, α, β ∈ R t.q. m1 = αδa et m2 = βδa , où δa est la mesure de Dirac
en a.

Exercice 7.4 (Fonction non borélienne dont les traces sont boréliennes) Corrigé 135 page 446
Pour B ⊂ R2 , on note t(B) l’ensemble des x1 ∈ R t.q. (x1 , 0) ∈ B. On pose T = {B ⊂ R2 ; t(B) ∈ B(R)}.
Soit θ ∈]0, π2 [. Pour x = (x1 , x2 )t ∈ R2 , on pose g(x) = (x1 cos θ − x2 sin θ, x1 sin θ + x2 cos θ)t .

1. Montrer que T est une tribu contenant B(R2 ).


2. Soit A ⊂ R t.q. A 6∈ B(R). On pose B = A × {0}.
(a) Montrer que B 6∈ B(R2 ).
(b) On pose f = 1B ◦ g. Montrer que la fonction f n’est pas une fonction borélienne de R2 dans R
mais que les fonctions f (x1 , ·) et f (·; x2 ) sont boréliennes de R dans R, pour tout x1 , x2 ∈ R.

7.7.2 Fubini-Tonelli et Fubini


Exercice 7.5 (Contre-exemple au théorème de Fubini) Corrigé 136 page 447
Soit L1 = L1R (R, B(R), λ). Pour (x, y) ∈ R2 , on pose :
1
x > 0 et x < y ≤ 2x

 (x+1)2 si
 1
− (x+1) si x > 0 et 2x < y ≤ 3x

2
f (x, y) = (7.18)

 0 si x > 0 et y 6∈]x, 3x[
x ≤ 0.

0 si

1. Montrer que f : R2 → R est B(R2 )- mesurable.


2. Montrer que pour tout y ∈ R, f (., y) ∈ L1 ; on pose φ(y) = f (x, y)dλ(x). Montrer que φ ∈ L1 .
R

3. Montrer que pour tout x ∈ R, f (x, .) ∈ L1 ; on pose ψ(x) = f (x, y)dλ(y). Montrer que ψ ∈ L1 .
R
R R
4. Montrer que φdλ 6= ψdλ (φ et ψ sont définies dans les questions précédentes).
5. Pourquoi le théorème de Fubini ne s’applique-t-il pas ici ?

Exercice 7.6 (Intégrale d’une fonction positive) Corrigé 137 page 448
Soit (E, T, m) un espace mesuré σ-fini, et f : E → R+ une application mesurable. On pose F = 1A
avec A = {(t, x) ∈ R × E; 0 < t < f (x)}.

1. Montrer que F est B(R) ⊗ T - mesurable

212
R R +∞ R R +∞
2. Montrer que f dm = 0 m({x ∈ E; f (x) > t})dt et que f dm = 0 m({x ∈ E; f (x) ≥ t})dt.
[Utiliser le théorème de Fubini-Tonelli.]

Exercice 7.7 (Une caractérisation de Lp ) Corrigé 138 page 449


On munit R [resp. R2 ] de sa tribu borélienne, notée B(R) [resp. B(R2 )].
Soit f une application mesurable de R dans R. Pour tout y ∈ R+ , on pose Ay = {x ∈ R; |f (x)| > y}.
Pour tout y ∈ R?− , on pose Ay = ∅.

1. Montrer que l’application (x, y)t 7→ 1Ay (x) est mesurable de R2 dans R. [On pourra commencer
par montrer que {(x, y)t ∈ R2 ; |f (x)| > y} est un borélien de R2 .]
Soit p ∈ [1, ∞[. Pour y ∈ R, on pose gp (y) = |y|p−1 λ(Ay ) (en convenant que gp (0) = 0 si λ(A0 ) =
∞).
2. (a) Montrer que l’application (x, y)t 7→ |y|p−1 1Ay (x) est mesurable positive de R2 dans R.
(b) Montrer que gp est intégrable sur R si et seulement si f ∈ LpR (R, B(R), λ). [On pourra, par
exemple, utiliser le théorème de Fubini-Tonelli.]

Exercice 7.8 (Mesure de boules de R2 )


On considère ici l’espace mesuré (R2 , B(R2 ), λ2 ). Montrer que λ2 ({x ∈ R2 ; |x| < R}) = πR2 pour tout
R > 0.

Exercice 7.9 (A propos de Fubini)


P
Soit, pour n ≥ 1, In = [1 − 1/n, 1 − 1/(n + 1)[; on pose ϕn = n(n + 1)χIn et f (x, y) = n≥1 (ϕn (x) −
ϕn+1 (x))ϕn (y).

1. Montrer que f : [0, 1]2 → R est bien définie et mesurable,


2. Montrer que, pour tout x ∈ [0, 1], y 7→ f (x, y) est intégrable sur [0, 1]et que, pour tout y ∈ [0, 1],
x 7→ f (x, y) est intégrable sur [0, 1],
R R
3. Montrer que F : x 7→ [0,1] f (x, y) dy et G : y 7→ [0,1] f (x, y) dx sont intégrables sur [0, 1]. Calculer
R R
alors [0,1] F (x) dx et [0,1] G(y) dy. Peut on appliquer à f le théorème de Fubini ?

7.7.3 Mesure de Lebesgue sur B(RN )


Exercice 7.10 (Propriétés élémentaires de λN ) Corrigé 139 page 451
Soit N ≥ 2. On rappelle que λN est la mesure de Lebesgue sur B(RN ).
QN QN QN
1. Soit A1 , . . . , AN ∈ B(R). Montrer que i=1 Ai ∈ B(RN ) et λN ( i=1 Ai ) = i=1 λ(Ai ).

2. Soient α1 , . . . , αN ∈ R et β1 , . . . , βN ∈ R t.q. αi < βi pour tout i ∈ {1, . . . , N }. Montrer que


QN QN
λN ( i=1 ]αi , βi [) = i=1 λ(]αi , βi [).
3. Soit K est un compact de RN (noter que K ∈ B(RN ). Montrer que λN (K) < +∞.

4. Soit O un ouvert non vide de RN . Montrer que λN (O) > 0.


5. Soit f, g ∈ C(RN , R). Montrer que f = g p.p. (c’est-à-dire λN -p.p.) implique f (x) = g(x) pour
tout x ∈ RN .

213
6. Montrer que Cc (RN , R) ⊂ L1R (RN , B(RN ), λN ).

Exercice 7.11 (Régularité de λN ) Corrigé 140 page 452


Soit m une mesure sur B(RN ) t.q. m(K) < ∞ pour tout compact K de RN . (noter que ceci est vrai
pour m = λN .)

1. SoientA ∈ B(RN ) et ε > 0. Montrer qu’il existe O ouvert de RN et F fermé de RN tels que :

F ⊂ A ⊂ O et m(O \ F ) ≤ ε.

2. Soit A ∈ B(RN ). Déduire de la question précédente que m(A) = inf{m(O), O ouvert t.q. A ⊂ O}.

[On pourra s’inspirer de la démonstration de la régularité d’une mesure sur B(R), finie sur les compacts
(théorème 2.3).]

Exercice 7.12 (Densité de Cc dans L1 (RN ))


Soit N ≥ 1. Montrer que l’espace Cc (RN , R) est dense dans L1 (RN ) (c’est-à-dire que, pour tout f ∈
L1 (RN ) et tout ε > 0, il existe ϕ ∈ Cc (RN ) t.q. kf − ϕk1 ≤ ε). [S’inspirer de la démonstration faite pour
le cas N = 1, théorème 5.5.]

Exercice 7.13 (Densité de Cc et Cc∞ dans L1 ) Corrigé 141 page 454


Soit d ≥ 1 et µ une mesure sur les boréliens de Rd . On suppose que µ vérifie les deux propriétés suivantes :
(p1) µ est est finie sur les compacts de Rd , c’est-à-dire que µ(K) < +∞ si K est un compact de Rd ,
(p2) µ est régulière, c’est-à-dire que pour tout A ∈ B(Rd ) et tout ε > 0, il existe O ouvert et F fermé
t.q. F ⊂ A ⊂ O et µ(O \ F ) ≤ ε.
En fait, la propriété (p1) entraı̂ne la propriété (p2) (voir la proposition 7.5) mais cette démonstration
n’est pas demandée ici.
On note L1µ l’espace L1R (Rd , B(Rd ), µ). Pour f ∈ L1µ , on note kf k1 = |f |dµ. Enfin, pour x ∈ Rd , on
R

note |x| la norme euclidienne de x.

1. Soit ϕ ∈ Cc (Rd , R) (c’est-à-dire ϕ continue de Rd dans R et à support compact). Montrer que


ϕ ∈ L1µ .
+
2. Soit K un compact de Rd et η > 0. Pour x ∈ Rd , on pose ϕ(x) = (η−d(x,K)) η avec d(x, K) =
inf{|x − y|, y ∈ K}. Montrer que ϕ ∈ Cc (Rd , R) et que ϕ(x) = 1 si x ∈ K.
3. Soit A ∈ B(Rd ) t.q. µ(A) < +∞.
(a) Soit ε > 0, montrer qu’il existe O ouvert et K compact t.q. K ⊂ A ⊂ O et µ(O \ K) ≤ ε.
(b) Soit ε > 0. Montrer qu’il existe ϕ ∈ Cc (Rd , R) t.q. kϕ − 1A k1 ≤ ε.
4. Soit f une fonction borélienne positive de Rd dans R. On suppose que f ∈ L1µ . Soit ε > 0. Montrer
qu’il existe ϕ ∈ Cc (Rd , R) t.q. kf − ϕk1 ≤ ε. [On pourra approcher f par une fonction étagée.]
5. (Densité.) Soit f ∈ L1µ et ε > 0.

(a) Montrer qu’il existe ϕ ∈ Cc (Rd , R) t.q. kf − ϕk1 ≤ ε.

214
(b) Montrer qu’il existe ψ ∈ Cc∞ (Rd , R) t.q. kf − ψk1 ≤ ε. [On pourra montrer que, si ϕ ∈
Cc (Rd , R), on a kϕ − ϕn k1 → 0, quand n → ∞, avec ϕn = ϕ ? ρn et (ρn )n∈N? une famille
régularisante, voir la définition 8.4.]
6. (Continuité en moyenne ?)
(a) Soit ϕ ∈ Cc (Rd , R). Montrer que kϕ(· + h) − ϕk1 → 0 quand h → 0.
(b) Montrer, en donnant un exemple (c’est-à-dire en choisissant convenablement f et µ) qu’on
peut avoir f ∈ L1µ et kf (· + h) − f k1 6→ 0 quand h → 0.

7. On suppose maintenant que Ω est un ouvert de Rd et que µ est une mesure sur les boréliens de
Ω, finie sur les sous ensembles compacts de Ω. Indiquer brièvement comment on peut montrer la
densité de Cc (Ω, R) et Cc∞ (Ω, R) dans L1R (Ω, B(Ω), µ).

Exercice 7.14 (Invariance par translation de λN ) Corrigé 142 page 455


Soient N ≥ 1, α1 , . . . , αN ∈ R? et β1 , . . . , βN ∈ R. Pour x = (x1 , . . . , xN )t ∈ RN , on pose ϕ(x) =
(α1 x1 + β1 , . . . , αN xN + βN )t , de sorte que ϕ est une bijection de RN dans RN .

1. Soit A ∈ B(RN ), montrer que ϕ(A) = {ϕ(x), x ∈ A} ∈ B(RN ).


QN
2. Montrer que λN (ϕ(A)) = i=1 |αi |λN (A) pour tout A ∈ B(RN ). [On pourra faire une récurrence
sur N : La proposition 2.9 donne le résultat pour la mesure de Lebesgue sur B(R), notée λ. On
suppose que le résultat est vrai pour λN −1 (et pour toute famille α1 , . . . , αN −1 ∈ R? , β1 , . . . , βN −1 ∈
QN
R). On le démontre alors pour λN en posant m(A) = ( i=1 |αi |)−1 λN (ϕ(A)) et en montrant que
m est une mesure sur B(RN ) égale à λN sur B(RN −1 ) ⊗ B(R). On utilise pour conclure la partie
“unicité” du théorème 7.1 sur la mesure produit.]

Exercice 7.15 (Changement de variables simple) Corrigé 143 page 457


Soient N ≥ 1, α1 , . . . , αN ∈ R? et β1 , . . . , βN ∈ R. Pour x = (x1 , . . . , xN )t ∈ RN . On pose ϕ(x) =
(α1 x1 + β1 , . . . , αN xN + βN )t (de sorte que ϕ est une bijection de RN dans RN ).
QN
1. Soit f ∈ E+ = E+ (RN , B(RN )), montrer que f ◦ ϕ ∈ E+ et que f dλN = i=1 |αi | (f ◦ ϕ)dλN .
R R

[Utiliser l’exercice 7.14.]


QN
2. Soit f ∈ M+ = M+ (RN , B(RN )), montrer que f ◦ϕ ∈ M+ et que f dλN = i=1 |αi | (f ◦ϕ)dλN .
R R

QN
3. Soit f ∈ L1 = L1R (RN , B(RN ), λN ), montrer que f ◦ ϕ ∈ L1 et que f dλN = i=1 |αi | (f ◦ ϕ)dλN .
R R

Exercice 7.16 (Primitives de fonctions Lp ) Corrigé 144 page 458


Soit p ∈ [1, ∞[. On note Lp = LpR (]0, 1[, B(]0, 1[), λ). Soit f, g ∈ Lp . On définit F et G de [0, 1] dans R
par :
Z x Z Z x Z
F (x) = f (t)dt (= f dλ), G(x) = g(t)dt (= gdλ), pour tout x ∈ [0, 1].
0 ]0,x[ 0 ]0,x[

1. Montrer que F et G sont des fonctions continues et qu’il existe C ∈ R t.q. |F (y) − F (x)| ≤
1 1
C|y − x|1− p et |G(y) − G(x)| ≤ C|y − x|1− p , pour tous x, y ∈ [0, 1], x < y.
2. On suppose p > 1. Soit n ∈ N? et k ∈ {0, . . . , n − 1}. Montrer que, pour tout x ∈ [ nk , k+1
n ], on a
(F (x), G(x)) ∈ An,k × Bn,k , où An,k et Bn,k sont des intervalles de R (indépendants de x) dont les
longueurs tendent vers 0 quand n → ∞. [Utiliser la question 1.]

215
3. On suppose p > 2. Montrer que E = {(F (x), G(x)); x ∈ [0, 1]} est une partie négligeable de R2
(muni de la mesure de Lebesgue sur les boréliens de R2 ). [En utilisant une majoration convenable
des longueurs de An,k et Bn,k , inclure E (pour tout n ∈ N) dans une partie de R2 dont la mesure
de Lebesgue tend vers 0 quand n → ∞.]

Exercice 7.17 (Lemme de Comparaison)


Soit ϕ une fonction décroissante de R?+ dans R+ , on définit l’application de B(R) × B(R) dans R+ par:
Z Z
Φ(A, B) = ϕ(|x − y|)dxdy.
A×B

Soient A, B ∈ B(R), a = λ(A), b = λ(B) (λ est la mesure de Lebesgue) et α, β ∈ R, α < b tels que
A ⊂ [α, β] et B ⊂ [α, β]. Montrer que

Φ(A, B) ≥ Φ([α, α + a], [β − b, b]).

Exercice 7.18
Soit ϕ : R2 → R B(R2 )-mesurable. Pour x ∈ R, on pose : fϕ (x) = ϕ(x, x).

1. Montrer que fϕ est B(R)-mesurable.


2. Soient ϕ et ψ : R2 → R B(R2 )-mesurables. Montrer que ϕ = ψ λ2 -p.p. 6⇒ fϕ = fψ λ-p.p.. (λ2 est
la mesure de Lebesgue sur B(R2 ) dont on suppose l’existence).
3. Soient ϕ et ψ : R2 → R B(R2 )-mesurables t.q. :

(a) ϕ(x, .) et ψ(x, .) sont continues p.p. en x ∈ R


(b) ϕ(, .y) et ψ(., y) sont mesurables pour tout y ∈ R

(Ces fonctions sont dites de “Carathéodory”.)


(a) Montrer que ϕ et ψ sont B(R2 )-mesurables.
(b) Montrer que ϕ = ψ λ2 -p.p. ⇒ ϕ(x, .) = ψ(x, .) partout, p.p. en x ∈ R. En déduire que si
ϕ = ψ λ2 -p.p, alors fϕ = fψ λ-p.p..

7.7.4 Convolution
Exercice 7.19 (Propriétés élémentaires de la convolution) Corrigé 145 page 460
Soit f, g ∈ L1 (RN ) = L1R (RN , B(RN ), λN ).

1. Montrer que f ? g = g ? f p.p.. [Utiliser l’invariance par translation de la mesure de Lebesgue et sa


conséquence pour les changements de variables simples (propositions 7.7 et 7.8).]
2. On suppose que f et g sont à support compact (f à support compact signifie qu’il existe K, compact
de RN , t.q. f = 0 p.p. sur K c ). Montrer que la fonction f ? g est alors aussi à support compact.
[On désigne par B(0, α) la boule ouverte de centre 0 et de rayon α. Comme f et g sont à support
compact, il existe a et b ∈ R+ tels que f = 0 p.p. sur B(0, a)c et g = 0 p.p. sur B(0, b)c . Montrer
que f ? g = 0 p.p. sur B(0, a + b)c .]

Exercice 7.20 (Convolution Lp − Cc∞ ) Corrigé 146 page 461

216
Soit 1 ≤ p ≤ ∞. Soit f ∈ Lp (RN ) = LpR (RN , B(RN ), λN ) (ou f ∈ L1loc (RN )) et ρ ∈ Cc∞ (RN , R). On
pourra se limiter au cas N = 1.

1. Montrer que pour tout x ∈ RN , la fonction f (·)ρ(x − ·) appartient à L1 (RN ). On pose alors
Z
f ? ρ(x) = f (·)ρ(x − ·)dλN .

2. Montrer que f ? ρ ∈ C ∞ (RN , R).


3. On suppose maintenant que f est à support compact, c’est à dire qu’il existe un compact de R,
noté K, t.q. f = 0 p.p. sur K c , montrer que f ? ρ est aussi à support compact.

Exercice 7.21 (Inégalité de Young) Corrigé 147 page 463


Soient 1 < p < +∞, f ∈ L1R (RN , B(RN ), λN ) et g ∈ LpR (RN , B(RN ), λN R ).R Montrer que f ? g est
définie p.p., f ? g ∈ LpR (RN , B(RN ), λN ) et kf ? gkp ≤ kf k1 kgkp . [Ecrire ( |f (x − y)g(y)|dy)p dx =
1 1
p
( |f (x − y)| q |f (x − y)| p |g(y)|dy)p dx, avec q = p−1
R R
. Appliquer l’inégalité de Hölder puis le théorème
de Fubini-Tonelli].

Exercice 7.22 (Itérations de convolution)


Soient L1 = L1R (R, B(R), λ) et f ∈ L1 t.q. f = 0 p.p. sur R− . On définit, pour n ∈ N? , f ?n par : f ?1 = f
Z +∞
?n
et f = f ?(n−1)
? f pour n ≥ 1. Pour λ ≥ 0, on pose : g(α) = e−αt |f (t)|dt.
0
?n
1. (a) Montrer que f est bien définie pour tout n ∈ N , et que f ?n = 0 sur R− .
?
R +∞
(b) Montrer, par récurrence sur n, que 0 e−αt |f ?n (t)|dt ≤ (g(α))n , pour tout α ≥ 0 et tout
n ≥ 1.
Rx
(c) En déduire que 0 |f ?n (t)|dt ≤ eαx (g(α))n , pour tout α ≥ 0 tout n ≥ 1 et tout x ≥ 0.

2. Soit h ∈ Cb (R, R). Montrer que h ? f (x) est définie pour tout x ∈ R et que h ? f ∈ Cb (R, R).
Remarquer de même que h ? f ?n ∈ Cb (R, R). On suppose maintenant que, h = 0 sur R− ; montrer
que, pour tout x ∈ R, h ? f ?n (x) → 0 quand n → +∞.

Exercice 7.23
R Soient µ et ν des mesures sur l’espace mesurable (R, B(R)). On définit µ ? ν par :
µ ? ν(A) = R2 1A (x + y)dµ(x)dν(y).
1. Montrer que µ ? ν est une mesure.

2. Montrer que si µ et ν sont des probabilités, alors µ ? ν est une probabilité.


3. Montrer que si µ et ν sont des mesures de densités respectives f et g (par rapport à Lebesgue),
alors µ ? ν est une mesure de densité f ? g.

7.7.5 Changement de variables


Exercice 7.24 (Fonction Gamma)
Z ∞
Pour tout x > 0, on pose Γ(x) = tx−1 e−t dt.
0

217
1. Montrer que Γ(x + 1) = xΓ(x) pour tout x > 0. En déduire que Γ(n) = (n − 1)! pour tout entier
n ≥ 1.
Z ∞ √
2 π
2. Calculer Γ( 21 ). On pourra utiliser e−x dx = .
0 2
Z ∞
3. Montrer que Γ est de classe C ∞ sur ]0, ∞[ et que Γ(n) (x) = (ln t)n tx−1 e−t dt, pour tout n ≥ 1.
0

Exercice 7.25 (Calcul d’un volume)


Calculer le volume de E où E = {(x, y, z) ∈ [0, 1]3 ; z ≥ 4xy}.

Exercice 7.26 Corrigé 148 page 464


Z n Z n Z ∞
sin x
1. Vérifier que si n ≥ 1 dx = ( e−xt dt) sin xdx.
0 x 0 0
Z n
2. Calculer Fn (t) = e−xt sin xdx (t ≥ 0).
0
Z ∞
3. Calculer lim Fn (t)dt. (Fn est définie à la question précédente.)
n→+∞ 0
Z n
sin x π
4. En déduire que lim dx = .
n→+∞ 0 x 2

Exercice 7.27 (Coordonnées polaires) Corrigé 149 page 465


2 2
1. Calculer (R+ )2 e−(x +y ) dx dy (on rappelle que dx dy désigne dλ2 (x, y)). [On pourra utiliser le
R

passage en coordonnées polaires.]


Z
2
2. Calculer e−x dx.
R+

Exercice 7.28
Soient Ω = {(x, y) | 1 < x2 + 4y 2 < 4 , x > 0 , y > 0}, G = {(x, y) ∈ Ω | y < x}, Ω0 = {(x0 , y 0 ) | 1 < x0 <
4 , 0 < y 0 } et G0 = Ω0 ∩ {y 0 < 1}.
1. Montrer qu’il existe un difféomorphisme T : Ω → Ω0 tel que T (G) = G0 .
2 2
−4y
2. Soit f (x, y) = x 4x 2 si x 6= 0 et f (0, y) = 0. Montrer que f est borélienne sur R2 , intégrable sur
G et calculer son intégrale. f est-elle intégrable sur Ω?

Exercice 7.29 (Sur volume de la boule unité dans RN )


On note CN le volume de la boule unité dans RN . Montrer que, si ρ > 0 et B N (ρ) désigne la boule de
centre 0 et de rayon ρ dans RN , on a λN (B N (ρ)) = ρN CN . En déduire la relation de récurrence suivante:
R1
CN +1 = CN 0 (1 − u)N/2 u−1/2 du.

Exercice 7.30 (Sur volume de la boule unité dans RN , suite)


On appelle fonction eulérienne de première espèce la fonction B :]0, ∞[2 → R définie par B(p, q) =
R 1 p−1
0
t (1 − t)q−1 dt.

218
1. Montrer que B est bien définie et C 1 sur ]0, ∞[2 .
R π/2 R∞ 2u2p−1
2. Montrer que B(p, q) = 2 0 sin(ϕ)2p−1 cos(ϕ)2q−1 dϕ = 0 (1+u2 )p+q du. En déduire B(1/2, 1/2).

3. Montrer que B(p, q) = Γ(p)Γ(q)


Γ(p+q) [on pourra calculer Γ(p)Γ(q) en introduisant le difféomorphisme
ϕ(t, v) = (tv, t(1 − v))]. En déduire Γ(1/2).
4. Calculer, en fonction de Γ, les constantes CN de l’exercice précédent.

Exercice 7.31 (Cordonnées polaires dans RN ) Corrigé 150 page 466


On note S N −1 la sphère de centre 0 et rayon 1 dans RN (i.e. S N −1 = {x ∈ RN | |x| = 1}, où |.| désigne
la norme euclidienne usuelle). Pour A ⊂ S N −1 , on pose A e = {tx , t ∈ [0, 1] , x ∈ A}.
N −1
Montrer que si A est un borélien de S , alors A est un borélien de RN .
e
On définit alors, quand A est un borélien de S N −1 , σ(A) = N λN (A).e Montrer que σ définit une mesure
N −1
sur les borélien de S .
Montrer que, pour tout f : RN → R mesurable positive ou intégrable on a
Z Z ∞ Z 
f (x) dx = f (ρξ) dσ(ξ) ρN −1 dρ.
RN 0 S N −1

Trouver alors les α ∈ R tels que x → |x|α soit intégrable sur RN \B1 ou sur B1 , avec B1 = {x ∈ RN ;
|x| ≤ 1}.

Exercice 7.32 (Changement de variables W 1,1 croissant) Corrigé 151 page 469
Rx
Soit f ∈ L1R (R, B(R), λ) t.q. f > 0 p.p.. Pour x ∈ R, on pose ϕ(x) = −∞ f (t)dt. (On rappelle que, pour
Rb R
a < b, a f (t)dt désigne 1]a,b[ f dλ.)

1. Montrer que ϕ ∈ C(R, R) et que ϕ est strictement croissante.


R
On note Im l’image de ϕ (Im est donc un intervalle dont les bornes sont 0 et f dλ) et on note
ψ : Im → R la fonction inverse de ϕ (ψ est donc continue de Im dans R).
On rappelle que si I est un intervalle de R et B(I) est sa tribu borélienne, on a B(I) = P(I) ∩ B(R).
Pour A ⊂ R, on note ϕ(A) = {ϕ(x), x ∈ A}. Pour A ⊂ Im , on note ψ(A) = {ψ(x), x ∈ A}.
2. Montrer que {ϕ(A), A ∈ B(R)} = B(Im ) et que {ψ(A), A ∈ B(Im )} = B(R).
R
3. Soit I un intervalle de R. Montrer que λ(ϕ(I)) = I f dλ.
R
4. Soit O un ouvert de R. Montrer que λ(ϕ(O)) = O f dλ. En déduire que, pour tout ε > 0 il existe
δ > 0 t.q. :
O ouvert, λ(O) ≤ δ ⇒ λ(ϕ(O)) ≤ ε.
R
5. Soit A ∈ B(R). Montrer que λ(ϕ(A)) = A f dλ. [On pourra, par exemple, utiliser la régularité de
λ et la question précédente.]
6. Soit a, b ∈ R t.q. a < b.

219
(a) Soit B ∈ B(R). On pose g = 1B . Montrer que :
Z ϕ(b) Z b
g(t)dt = g(ϕ(s))f (s)ds. (7.19)
ϕ(a) a

[Prendre A = ψ(B ∩ Im )∩]a, b[ et utiliser la question précédente.]


(b) Montrer que (7.19) est encore vraie pour g ∈ E+ (R, B(R)), puis pour g ∈ M+ (R, B(R)).
(c) Soit g : R → R mesurable. On suppose que g1]ϕ(a),ϕ(b)[ ∈ L1R (R, B(R), λ). Montrer g ◦
ϕf 1]a,b[ ∈ L1R (R, B(R), λ) et que (7.19) est vraie.

NB: On peut montrer que ϕ est dérivable p.p. et que ϕ0 = f p.p.. La formule (7.19) est alors la
formule habituelle de changement de variable. Noter aussi que la fonction ϕ, restreinte à l’intervalle ]a, b[,
appartient à un espace appelé W 1,1 (]a, b[) (ce qui explique le titre de l’exercice).

220
Chapter 8

Densité, séparabilité, et compacité


dans les espaces Lp(Ω)

Tout ce chapitre est consacré aux espaces LpR (Ω, B(Ω), λN ) où Ω un ouvert de RN , N ≥ 1, B(Ω) est la
tribu borélienne de Ω, λN désigne la restriction à B(Ω) de la mesure de Lebesgue sur B(RN ) (aussi notée
λN ) et 1 ≤ p ≤ ∞.
On notera toujours Lp (Ω) = LpR (Ω, B(Ω), λN ).

8.1 Théorèmes de densité pour les espaces Lp (Ω)


8.1.1 Densité des fonctions Cc (Ω, R) dans Lp (Ω)
Définition 8.1 Soient N ≥ 1, Ω un ouvert de RN et f une fonction définie de Ω dans R. On dit que f
est à support compact (dans Ω) si il existe un compact K ⊂ Ω tel que f = 0 sur Ω \ K.

On note souvent supp(f ) l’adhérence dans Ω de l’ensemble des x ∈ Ω t.q. f (x) 6= 0. On peut montrer
que f est à support compact si et seulement si supp(f ) est compact.

Définition 8.2 Soient N ≥ 1, Ω un ouvert de RN et f une fonction définie de Ω dans R. On dit que
f ∈ Cc∞ (Ω, R) si
1. f est de classe C ∞ (de Ω dans R).
2. f est à support compact (dans Ω).

On note aussi D(Ω) = Cc∞ (Ω, R).

Remarque 8.1 Si N = 1 et Ω =]0, 1[, la fonction f définie par f (x) = x(x − 1) est de classe C ∞ sur Ω,
mais elle n’est pas à support compact. En effet, il n’existe pas de compact inclus dans ]0, 1[ t.q. f soit
nulle en dehors de ce compact.
Par contre, si f est de classe C ∞ sur ]0, 1[ et si il existe ε > 0 tel que f (x) = 0 pour x ∈]0, ε[ et pour
x ∈]1 − ε, 1[, alors f ∈ Cc∞ (Ω, R).

221
Théorème 8.1 (Densité de Cc (Ω, R) dans Lp (Ω)) Soient N ≥ 1, p ∈ [1, +∞[ et Ω un ouvert de RN
(par exemple, Ω = RN ). Alors :
Cc (Ω, R) est dense dans Lp (Ω) c’est-à-dire :

∀f ∈ Lp (Ω), ∀ε > 0, ∃ϕ ∈ Cc (Ω, R) t.q. kf − ϕkp ≤ ε. (8.1)


Démonstration : La démonstration de ce résultat est faite dans l’exercice 6.4 pour le cas Ω = R. La
généralisation donnée ici se démontre de manière très voisine (grâce au résultat de régularité, proposition
7.5), voir l’exercice 8.1.

Une conséquence importante du théorème 8.1 est la “continuité en moyenne” que l’on donne maintenant.
Théorème 8.2 (Continuité en moyenne) Soient N ≥ 1, p ∈ [1, +∞[,et f ∈ Lp (RN ). Alors, kf (· +
h) − f kp → 0 quand h → 0, c’est-à-dire :
Z
|f (x + h) − f (x)|p dx → 0, quand h → 0.

Démonstration : La démonstration est ici encore très similaire à la démonstration vue pour N = 1
dans l’exercice 6.4, elle est proposée dans l’exercice 8.2.

Remarque 8.2 (Attention à L∞ !) Les deux résultats précédents sont faux dans L∞ . Considérer par
exemple le cas N = 1 et la fonction f = 1R+ (qui appartient à L∞ (R), en confondant f avec sa classe).
On peut montrer que (voir l’exercice 8.3) :
1
1. ∀ϕ ∈ C(R, R), kf − ϕk∞ ≥ .
2
2. ∀h > 0, kf (· + h) − f k∞ = 1.

8.1.2 Régularisation par convolution


Si a ∈ R+ , on note Ba la boule fermée de centre 0 et de rayon a de RN .
Définition 8.3 (L1loc )
Soient N ≥ 1 et Ω un ouvert de RN . Soit f : Ω → R. On définit que f est “localement intégrable sur
Ω” si f 1K ∈ L1 (Ω) (au sens “il existe g ∈ L1 (Ω) t.q. f = g p.p. sur K”) pour tout compact K ∈ Ω.
On note L1loc (Ω)(= L1loc (Ω, B(Ω), λN )) l’ensemble des fonctions localement intégrables sur Ω.
Remarque 8.3 Soient N ≥ 1 et Ω un ouvert de RN . Pour tout p tel que 1 ≤ p ≤ +∞, on a Lp (Ω) ⊂
L1loc (Ω) (ceci est une conséquence immédiate du résultat d’inclusion entre les espaces Lp , proposition 6.8).
Définition 8.4 (Famille
R régularisante) Soit N ≥ 1 et soit ρ ∈ Cc∞ (RN , R) t.q. ρ ≥ 0, {x ∈ RN ;
ρ(x) 6= 0} ⊂ B1 et ρ(x)dx = 1. On appelle famille régularisante (ou famille de noyaux régularisants)
la famille de fonctions (ρn )n∈N? ⊂ Cc∞ (RN , R) définie par : ρn (x) = nN ρ(nx), x ∈ RN , n ∈ N? .
Remarque 8.4 Dans la définition précédente, il est facile de vérifier que {x ∈ RN ; ρn (x) 6= 0} ⊂ B n1 et
R
ρn (x)dx = 1
Il existe bien des fonctions vérifiant les propriétés demandées pour ρ dans la définition 8.4. Pour N = 1,
par exemple, il suffit de prendre ρ(x) = α exp( x21−1 ) pour x ∈] − 1, 1[ et ρ(x) = 0 pour x 6∈] − 1, 1[, avec
R
α > 0 choisi pour avoir ρ(x)dx = 1.

222
Lemme 8.1 Soient N ≥ 1, (ρn )n∈N? une famille régularisante et f ∈ L1loc (RN ). Alors, f ? ρn est définie
partout sur RN et f ? ρn ∈ C ∞ (RN , R). De plus, si il existe a > 0 t.q. f = 0 p.p. sur Bac , on a alors
c
f ? ρn = 0 sur Ba+ 1 (f ? ρn est donc à support compact).
n

Démonstration : La démonstration du fait que f ? ρn ∈ C ∞ (RN , R) est donnée dans l’exercice 7.20. La
seconde partie est donnée dans les exercices 7.20 et 7.19. L’indication de la seconde question de l’exercice
7.19 donne le support indiqué ici pour f ? ρn .

Proposition 8.1 Soient N ≥ 1, (ρn )n∈N? une famille régularisante. Soient p ∈ [1, +∞[ et f ∈ Lp (RN ).
Alors, f ? ρn → f dans Lp (RN ) lorsque n → +∞.

Démonstration : La démonstration est une conséquence du théorème de continuité en moyenne (théo


rème 8.2).
On choisit un représentant de f , encore noté f . Pour n ∈ N? , on pose fn = f ? ρn . Pour x ∈ RN , on a :
Z Z Z
fn (x) − f (x) = f (x − y)ρn (y)dy − f (x) ρn (y))dy = (f (x − y) − f (x))ρn (y)dy,

et donc : Z
|fn (x) − f (x)| ≤ ( |f (x − y) − f (x)|ρn (y)dy)p .
p

1 1
Pour p > 1, on utilise l’inégalité de Hölder en écrivant ρn = ρnp ρnq (avec q = p/(p − 1)) et on obtient (ce
qui est aussi immédiatement vrai pour p = 1) :
Z Z Z
p
|fn (x) − f (x)|p ≤ |f (x − y) − f (x)|p ρn (y)dy( ρn (y)dy) q = |f (x − y) − f (x)|p ρn (y)dy. (8.2)

On remarque maintenant que l’application (x, y)t 7→ (f (y) − f (x)) est mesurable de R2 dans R (munis de
leur tribu borélienne), ceci est une conséquence (par exemple) de la proposition 7.3 et de la mesurabilité
de la somme d’applications mesurables. L’application (x, y)t 7→ (x, x − y) est mesurable de R2 dans R2
(car continue). Par composition, l’application (x, y)t 7→ (f (x − y) − f (x)) est donc mesurable de R2 dans
R. On en déduit, en utilisant une nouvelle fois la mesurabilité de la composée d’applications mesurables
(et du produit d’applications mesurables), que (x, y)t 7→ |f (x − y) − f (x)|p ρn (y) est mesurable (positive)
de R2 dans R.
On peut donc appliquer le théorème de Fubini-Tonelli pour déduire de (8.2) que :

Z Z Z Z Z
|fn (x) − f (x)|p dx ≤ ( |f (x − y) − f (x)|p ρn (y)dy)dx = ( |f (x − y) − f (x)|p ρn (y)dx)dy =
Z
kf (· − y) − f kpp ρn (y)dy.
B1
n
(8.3)
On utilise maintenant le théorème 8.2. Soit ε > 0. Il existe η > 0 t.q. :

h ∈ RN , |h| ≤ η ⇒ kf (· − h) − f kp ≤ ε.

On déduit donc de (8.3) que :


1
≤ η ⇒ kfn − f kp ≤ ε.
n

223
Ce qui termine la démonstration.

Le deux résultats précédents permettent de démontrer le théorème de densité suivant :

Théorème 8.3 Soient N ≥ 1 et p ∈ [1, +∞[, Cc∞ (RN , R) est dense dans Lp (RN ).

Démonstration : La démonstration proposée ici utilise une méthode dite de “troncature et régularisa-
tion”.
Pour f ∈ Lp (RN ), on dit que f est “à support compact” si il existe K compact de RN t.q. f = 0 p.p. sur
K c . On note A l’ensemble des f ∈ Lp (RN ) à support compact.

Etape 1. On montre dans cette étape que A est dense dans Lp (RN ). Soit f ∈ Lp (RN ). Pour n ∈ N,
on pose fn = f 1Bn . Comme fn → f p.p. quand n → ∞ et |fn | ≤ |f | p.p. (pour tout n ∈ N), on peut
appliquer le théorème de convergence dominée dans Lp (on utilise ici le fait que p < ∞). Il donne que
fn → f dans Lp (RN ) quand n → ∞. Comme (fn )n∈N ⊂ A, on a bien montré la densité de A dans
Lp (RN ).
Etape 2. Soit maintenant f ∈ A. Pour conclure la démonstration, il suffit de montrer qu’il existe une
suite (fn )n∈N? ⊂ Cc∞ (RN , R) t.q. fn → f dans Lp (RN ) quand n → ∞. Or cette suite est donné avec
fn = f ? ρn où (ρn )n∈N? est une famille régularisante. En effet, le lemme 8.1 donne que (fn )n∈N? ⊂
Cc∞ (RN , R) et la proposition 8.1 donne que fn → f dans Lp (RN ) quand n → ∞.

On rappelle (remarque 8.2) que Cc (RN , R) (et donc aussi Cc∞ (RN , R)) n’est pas dense dans L∞ (RN ). Il
est intéressant aussi de remarquer que le théorème précédent (théorème 8.3) est encore vrai si on remplace
la mesure de Lebesgue par une mesure sur les boréliens de RN (N ≥ 1), finie sur les compacts. Toutefois
la démonstration donnée ici doit alors être modifiée. Ceci est fait dans l’exercice 7.13 pour p = 1 (et la
généralisation pour traiter tous les cas p ∈ [1, ∞[ est assez simple).

8.1.3 Densité de Cc∞ (Ω, R) dans Lp (Ω)


On a aussi un résultat de densité pour les fonctions définies sur un ouvert de RN .

Théorème 8.4 (Densité de D(Ω) dans Lp (Ω)) Soient N ≥ 1, p ∈ [1, +∞[ et Ω un ouvert de RN .
Alors, D(Ω) = Cc∞ (Ω, R) est dense dans Lp (Ω).
1
Démonstration : Pour Ω 6= RN , on pose Kn = {x ∈ RN ; d(x, Ωc ) ≥ n} ∩ Bn si n ∈ N? .

Soient f ∈ Lp (Ω) et ε > 0. On remarque d’abord (en utilisant, comme pour le théorème précédent, le
théorème de convergence dominée dans Lp ) que f 1Kn → f dans Lp (Ω) quand n → ∞. On peut donc
choisir n0 ∈ N? t.q. kf − fn0 kp ≤ ε.
On pose maintenant g = fn0 . On peut considérer que g ∈ Lp (RN ) et on a g = 0 p.p. sur K c avec
K = Kn0 . En prenant une famille régularisante, (ρn )n∈N? , le lemme 8.1 et la proposition 8.1 donnent que
g ? ρn → g dans Lp (RN ) quand n → ∞ et (g ? ρn )n∈N? ⊂ Cc∞ (RN , R). Il suffit alors de remarquer que la
restriction de g ? ρn à Ω est à support compact dans Ω dès que n > n0 pour conclure la démonstration.

Ici aussi, le théorème 8.4 est encore vrai si on remplace la mesure de Lebesgue par une mesure sur
les boréliens de Ω, finie sur les compacts. La démonstration donnée ici doit alors être modifiée (voir
l’exercice 7.13).

224
8.2 Séparabilité de Lp (Ω)
Proposition 8.2 Soient N ≥ 1, Ω un ouvert de RN et p tel que 1 ≤ p < +∞. Alors, l’espace Lp (Ω) est
séparable.

Démonstration : La démonstration est l’objet de l’exercice 8.4 (et de 6.5 pour le car Ω = R).

Les espaces du type L∞ ne sont, en général, pas séparables. L’exercice 8.5 montre que, par exemple,
L∞
R (R, B(R), λ) n’est pas séparable.

8.3 Compacité dans les espaces Lp (Ω)


Soit E un espace vectoriel normé et A une partie de E ; on rappelle que A est (séquentiellement) compact
si de toute suite d’éléments de A on peut extraire une sous-suite qui converge. Notons que cette notion
de compacité “séquentielle” est équivalente à la notion ce compacité “de Borel -Lebesgue” (i.e. de tout
recouvrement de A par des ouverts on peut extraire un sous-recouvrement fini) dès que E est un espace
métrique (ce qui est notre cas, car E est un espace vectoriel normé).
Une partie A de E est dite relativement compacte si son adhérence est compacte (ou encore si il existe
un compact K de E tel que A ⊂ K).
Dans le cas où E est un espace de dimension finie, A est compacte si et seulement si A est fermée bornée,
et A est relativement compacte si et seulement si A est bornée.
Ces deux caractérisations sont fausses si dim(E) = +∞. On sait par le théorème de Riesz que la boule
unité fermée d’un evn E est compacte si et seulement si la dimension de E est finie.
On s’intéresse ici au cas E = Lp (Ω) (Ω ouvert non vide de RN ), espace vectoriel normé de dimension
infinie, et on voudrait caractériser les parties relativement compactes ; en particulier, étant donnée une
suite de fonctions de Lp (Ω), sous quelles hypothèses peut-on en extraire une sous-suite qui converge ? Une
condition nécessaire évidente est que la partie considérée soit bornée (une partie relativement compacte
est toujours bornée). La deuxième condition est, pour 1 ≤ p < +∞ et Ω bornée, que la partie soit
équicontinue en moyenne, au sens précisé dans le théorème suivant :

Théorème 8.5 (Kolmogorov) Soit Ω ∈ B(RN ) et 1 ≤ p < +∞ ; on considère ici l’espace mesuré
(E, T, m) = (Ω, B(RN ), λN ). Soit A ⊂ Lp (Ω) ; A est relativement compacte si et seulement si :
1. Il existe C ∈ R t.q. kf kp ≤ C pour tout f ∈ A,

2. la partie A est équicontinue en moyenne, c’est-à-dire que pour tout ε > 0, il existe δ > 0 t.q. :

pour tout f ∈ A, |h| ≤ δ ⇒ kf˜(· + h) − f˜kp ≤ ε,

Z partie A est “équi-petite” à l’infini”, c’est-à-dire que pour tout ε > 0, il existe a ∈ R+ , t.q.
3. la
|f˜|p dm ≤ ε pour tout f ∈ A,
c
Ba

où f˜ est la prolongée de f par 0 en dehors de Ω.

La démonstration de ce théorème se fait en utilisant la densité de l’espace de fonctions Cc (Ω, R) dans


Lp (Ω), et le théorème d’Ascoli, que nous rappelons ici :

225
Théorème 8.6 (Ascoli) Soient K une partie compacte de R et A une partie de l’espace vectoriel
C(K, R) muni de la norme uniforme ; A est relativement compacte si et seulement si A est bornée
et uniformément équicontinue, i.e. ∀ ε > 0, ∃δ > 0 ; ∀ x, y ∈ K, |x − y| ≤ δ ⇒ |f (x) − f (y)| ≤ ε,
∀ f ∈ A.

Corollaire 8.1 Soient Ω ∈ B(RN ), 1 ≤ p < +∞ et (fn )n∈N ⊂ Lp (Ω). On suppose que la famille
A = {fn , n ∈ N} vérifie les conditions 1, 2 et 3 du théorème de Kolmogorov. On peut alors extraire
de (fn )n∈N une sous-suite, notée (fϕ(n) )n∈N , et il existe f ∈ Lp (Ω) t.q. fϕ(n) → f dans Lp (Ω) quand
n → ∞.

8.4 Propriété de compacité faible


On a introduit au chapitre 6 la convergence faible ? dans le dual d’un espace de Banach. On a une
propriété de compacité très utile lorsque l’espace de Banach considéré est séparable :

Proposition 8.3 (Compacité faible-? séquentielle des bornés du dual d’un séparable)
Soit F un espace de Banach séparable et F 0 son dual topologique ; soit (Tn )n∈N une suite bornée de F 0 ;
alors il existe une sous-suite (Tnk )k∈N et T ∈ F 0 t.q. la sous-suite (Tnk )k∈N converge vers T dans F 0 pour
la topologie faible ? (i.e. Tnk (u) → T (u) (dans R) pour tout élement u de F .)

Démonstration : procédé diagonal. . .


Cette propriété s’applique donc aux suites bornées de L∞ (Ω) ; en effet, grâce au théorème 6.9 et à la
proposition 8.2), l’espace L∞ (Ω) peut être identifié au dual de l’espace L1 (Ω), qui est un espace séparable
(Ω est ici un borélien de RN ). On a donc, par exemple, le résultat suivant :

Proposition 8.4 (Compacité faible ? séquentielle des bornés de L∞ )


Soit (un )n∈N une suite bornée de L∞
R (R, B(R), λ), i.e. telle qu’il existe M ∈ R+ t.q. kun k∞ ≤ M pour
tout n ∈ N. Alors, il existe une sous suite, encore notée (un )n∈N , et il existe u ∈ L∞
R (R, B(R), λ) t.q.
un → u dans L∞ R (R, B(R), λ) pour la topologie faible ?.

Dans le cas p ∈]1, +∞[, on peut écrire une propriété de compacité faible :

Proposition 8.5 (Compacité faible séquentielle des bornés de Lp )


Soit (un )n∈N une suite bornée de LpR (R, B(R), λ), p ∈]1, +∞[, i.e. telle qu’il existe M ∈ R+ t.q. kun kp ≤
p
M pour tout n ∈ N. Alors, il existe une sous suite, encore notéeR (un )n∈N , et il existe u ∈ LR (R, B(R), λ)
t.q. un → u dans L pour la topologie faible, c’est-à-dire t.q. (un v − uv)dm → 0 pour tout v ∈ Lq , où
p
p
q = p−1 .

8.5 Exercices
Exercice 8.1 (Densité de Cc (Ω, R) dans Lp (Ω))
Soient, N ≥ 1, p ∈ [1, +∞[ et Ω un ouvert de RN . Montrer que Cc (Ω, R) est dense dans Lp (Ω), c’est-à-
dire que pour tout f ∈ Lp (Ω) et pour tout ε > 0, il existe ϕ ∈ Cc (Ω, R) t.q. kf − ϕkp ≤ ε. [Reprendre la
démonstration de l’exercice 6.4 qui traite le cas Ω = R. Utiliser le résultat de régularité, proposition 7.5.]

Exercice 8.2 (Continuité en moyenne)


Soient N ≥ 1, p ∈ [1, +∞[ et f ∈ Lp (RN ). Montrer que kf (· + h) − f kp → 0 quand h → 0. [Reprendre
la démonstration vue pour N = 1 dans l’exercice 6.4]

226
Exercice 8.3 (Non densité de Cc dans L∞ ) Corrigé 152 page 471
On considère f = 1R+ (qui appartient à L∞
R (R, B(R), λ), en confondant f avec sa classe).
1
1. Montrer que kf − ϕk∞ ≥ 2 pour tout ϕ ∈ C(R, R).
2. Montrer que kf (· + h) − f k∞ = 1 pour tout h ∈ R?.

Exercice 8.4 (Séparabilité de Lp (Ω), 1 ≤ p < ∞) Corrigé 153 page 471


Soient N ≥ 1, Ω un ouvert de RN et p tel que 1 ≤ p < +∞. Montrer que l’espace Lp (Ω) est séparable.
On pourra se limiter au cas Ω = R et raisonner ainsi : Soit n ∈ N? , pour q = 0, 1, . . . , 2n2 − 1, on note:
+ nq , −n + q+1
Iqn = [−n S c
n [. On pose : An = {f : R → R; f |Iq = r, où r ∈ Q, et f = 0 sur [−n, n[ }. On
n

pose A = n∈N? An .
1. Montrer que A est dénombrable.

2. Montrer que, pour tout f ∈ Cc (R, R) et pour tout ε > 0, il existe g ∈ A t.q. kf − gkp ≤ ε.
3. Conclure par la densité de Cc (R, R) dans Lp (R, ) (théorème 8.1).

Exercice 8.5 (Non séparabilité de L∞ R (R, B(R), λ)) Corrigé 154 page 472
On note B l’ensemble des f appartenant à L∞ (R, B(R), λ) t.q., pour tout n ∈ N, f = 0 p.p. sur ]n, n + 1[
ou f = 1 p.p. sur ]n, n + 1[.
1. Montrer que B est non dénombrable. [Construire une injection de l’ensemble des parties de N dans
B.]

2. Soit A une partie dense de L∞ R (R, B(R), λ). Montrer que pour tout f ∈ B, il existe g ∈ A t.q.
kf − gk∞ ≤ 41 . En déduire qu’on peut construire une application injective de B dans A.
3. Montrer que L∞
R (R, B(R), λ) n’est pas séparable.

Exercice 8.6 (Convolution Lp − Lq ) Corrigé 155 page 473


Pour 1 ≤ p ≤ ∞, on note Lp = LpR (R, B(R), λ) et Lp = LpR (R, B(R), λ).
p
1. Soit 1 < p < +∞, q = p−1 , f ∈ Lp et g ∈ Lq .

(a) Montrer que pour tout x ∈ R, l’application f (·)g(x − ·) est intégrable.


On peut donc définir (f ? g)(x) pour tout x ∈ R.
(b) Montrer que |(f ? g)(x)| ≤ kf kp kgkq , pour tout x ∈ R.
(c) Montrer que f ? g est continue sur R.
p
2. Soit 1 < p < +∞, q = p−1 .

(a) Soit F ∈ Lp et G ∈ Lq . Montrer qu’on peut définir F ? G sur R en posant F ? G = f ? g, avec


f ∈ F et g ∈ G. [Il suffit donc de démontrer que f ? g ne dépend pas du choix de f dans F et
g dans G.]
(b) Montrer que l’application (F, G) 7→ F ? G est bilinéaire continue de Lp × Lq dans Cb (R, R) (on
rappelle que Cb (R, R) est l’ensemble des fonctions continues bornées de R dans R, muni de la
norme de la convergence uniforme).

227
(c) Soit F ∈ Lp et G ∈ Lq . Montrer que F ? G ∈ C0 (R, R) (c’est-à-dire que la fonction F ? G est
continue de R dans R et que (F ? G)(x) → 0 quand x → ±∞).

3. On prend maintenant p = 1 et q = +∞.

(a) Soit f ∈ L1 et g ∈ L∞ . Montrer que (f ? g)(x) est bien définie pour tout x ∈ R. Montrer que
f ? g ∈ Cb (R, R).
(b) Soit F ∈ L1 et G ∈ L∞ . Montrer que (F ? G)(x) est bien définie pour tout x ∈ R en posant
F ? G = f ? g, avec f ∈ F et g ∈ G.
(c) L’application (F, G) 7→ F ? G est-elle continue de L1 × L∞ dans Cb ?
(d) A-t-on F ? G ∈ C0 (R, R), pour tout F ∈ L1 et G ∈ L∞ ?

Exercice 8.7 (Caractérisation d’une fonction par son action sur Cc∞ ) Corrigé 156 page 476
Soit d ∈ N? . On rappelle que λd est la mesure de Lebesgue sur les boréliens de Rd et que l’élément
d’intégration par rapport à λd est noté dx (au lieu de dλd (x)). On rappelle aussi que | · | dénote la norme
euclidienne dans Rd . On se donne une fonction ρ ∈ Cc∞ (Rd , R) t.q. :
• ρ(x) = 0 si x ∈ Rd , |x| ≥ 1,
• ρ(x) ≥ 0 si x ∈ Rd ,
R
• ρ(x)dx = 1.

Pour n ∈ N? , on note ρn la fonction définie par ρn (x) = nd ρ(nx), de sorte que (ρn )n∈N? est une famille
de noyaux régularisants (voir le chapitre 8 du cours).
1. Soit f ∈ L1 (Rd , B(Rd ), λd ).

(a) Soit ϕ ∈ Cc∞ (Rd , R). Montrer que f ϕ ∈ L1 (Rd , B(Rd ), λd ).


On suppose maintenant que f (x)ϕ(x)dx = 0 pour tout ϕ ∈ Cc∞ (Rd , R).
R

(b) Soit n ∈ N? . Montrer f ? ρn (x) est bien défini pour tout x ∈ Rd et que f ? ρn (x) = 0 pour tout
x ∈ Rd .
(c) Montrer que f = 0 p.p..

2. Soit Ω un ouvert de Rd et g ∈ L1loc (Ω) (c’est-à-dire que g est une fonction de Rd dans R t.q.
g1K ∈ L1 (Rd , B(Rd ), λd ) pour tout compact K de Ω).

(a) Soit ϕ ∈ Cc∞ (Ω, R). Montrer que gϕ ∈ L1 (Rd , B(Rd ), λd ). (La fonction ϕ est prolongée par 0
hors de Ω.)
On suppose maintenant que g(x)ϕ(x)dx = 0 pour tout ϕ ∈ Cc∞ (Ω, R).
R

(b) Soit n ∈ N? . On note Ωn l’ensemble des x ∈ Ω t.q. |x − y| > n1 pour tout y ∈ Ωc . Montrer
g ? ρn (x) est bien définie pour tout x ∈ Ωn et que g ? ρn (x) = 0 pour tout x ∈ Ωn .
(c) Soit K un compact de Ω, montrer que g1K = 0 p.p.. En déduire que g = 0 p.p. sur Ω.

Exercice 8.8 (Théorème de compacité dans L1 ) Corrigé 157 page 478

228
On pose L1 (]0, 1[) = L1R (]0, 1[, B(]0, 1[), λ) et L1 (R) = L1R (R, B(R), λ) (où λ désigne la mesure de Lebesgue
sur B(R) ou sa trace sur B(]0, 1[)). Pour f ∈ L1 (]0, 1[[), on identifie f avec l’un de ses représentants et
on note f˜ la fonction définie par f˜ = f sur ]0, 1[ et f˜ = 0 sur R\]0, 1[.
Soit A une partie de L1 (]0, 1[).
On rappelle que A est relativement compacte dans L1 (]0, 1[) si et seulement si A est précompacte (c’est-
à-dire que pour ε > 0 il existe p ∈ N? et f1 , . . . , fp ∈ A t.q. A ⊂ ∪pi=1 B(fi , ε), où B(f, ε) désigne la boule
ouverte dans L1 (]0, 1[) de centre f et de rayon ε).

Partie I (condition suffisante). On suppose, dans cette partie, que A est relativement compacte dans
L1 (]0, 1[).

1. Montrer que A est une partie bornée de L1 (]0, 1[).


2. Soit ε > 0. Montrer qu’il existe α > 0 t.q. :

h ∈ R, |h| ≤ α, f ∈ A ⇒ kf˜(· + h) − f˜k1 ≤ ε. (8.4)

Partie II (condition nécessaire). On suppose, dans cette partie, que A une partie bornée de L1 (]0, 1[)
et que pour tout ε > 0 il existe α > 0 vérifiant (8.4).

Soit ρ ∈ Cc∞ (R, R) t.q. ρ ≥ 0, ρ(x) = 0 si |x| ≥ 1 et ρ(x)dx = 1. Pour n ∈ N? , on définit ρn par
R

ρn (x) = nρ(nx) si x ∈ R.

1. Soit ε > 0. Montrer qu’il existe n0 ∈ N? t.q. :

n ∈ N? , n ≥ n0 , f ∈ A ⇒ kf˜ ? ρn − f˜k1 ≤ ε. (8.5)

[On pourra remarquer que f˜ ? ρn (x) − f˜(x) = (f˜(x − ny ) − f˜(x))ρ(y)dy.]


R

2. Soit n ∈ N? . Pour f ∈ A, on note fn la restriction à [0, 1] de la fonction f˜ ? ρn .

(a) Montrer qu’il existe C1 , C2 > 0 ne dépendant que de n, ρ et de la borne de A dans L1 (]0, 1[)
t.q. :
x ∈ [0, 1], f ∈ A ⇒ |fn (x)| ≤ C1 ,
x, y ∈ [0, 1], f ∈ A ⇒ |fn (x) − fn (y)| ≤ C2 |x − y|.
En déduire que l’ensemble {fn , f ∈ A} est relativement compact dans C([0, 1], R) [Utiliser le
théorème d’Ascoli.]
(b) Montrer que l’ensemble {fn , f ∈ A} est relativement compact dans L1 (]0, 1[).

3. Montrer que la partie A est relativement compacte dans L1 (]0, 1[).

229
Chapter 9

Vecteurs aléatoires

9.1 Définition, propriétés élémentaires


Définition 9.1 (Vecteur aléatoire) Soit d ≥ 1 et (Ω, A) un espace probabilisable. On appelle vecteur
aléatoire (souvent noté v.a.) de dimension d une application mesurable de Ω dans Rd (où Rd est muni
de la tribu borélienne).

Noter que la notation “v.a.” signifie indifféremment “variable(s) aléatoire(s)” ou “vecteur(s) aléatoire(s)”.

Proposition 9.1 Soit d > 1 et (Ω, A) un espace probabilisable. Soit X une application de Ω dans Rd .
On note X1 , . . . , Xd les composantes de X (de sorte de X = (X1 , . . . , Xd )t ). On note σ(X) la tribu
engendrée par X (et σ(Xi ), pour i = 1, . . . , d la tribu engendrée par Xi ). On a alors :
1. σ(X) est la plus petite tribu contenant les tribus σ(X1 ), . . . , σ(Xd ).
2. X est un v.a. si et seulement si Xi est, pour tout i ∈ {1, . . . , d}, une v.a.r..

Démonstration : On rappelle que σ(X) = {X −1 (B), B ∈ B(Rd )} et que, pour tout i, σ(Xi ) =
Qd
{Xi−1 (A), A ∈ B(R)}. On note C = { i=1 Ai , Ai ∈ B(R) pour tout i}. On rappelle que C ⊂ B(Rd ) (voir
l’exercice 7.10) et que C engendre B(Rd ) (c’est même encore vrai si on se limite à prendre pour Ai des
intervalles, ouverts, voir l’exercice 2.6).
On note T la plus petite tribu contenant les tribus σ(X1 ), . . . , σ(Xd ). Soit i ∈ {1, . . . , d} et A ∈ B(R).
Qd
En prenant B = j=1 Aj avec Aj = R si j 6= i et Ai = A, on a X −1 (B) ∈ σ(X) (car B ∈ C ⊂ B(Rd ))
et X −1 (B) = Xi−1 (A). On en déduit Xi−1 (A) ∈ σ(X) et donc σ(Xi ) ⊂ σ(X) pour tout i ∈ {1, . . . , d}.
Comme σ(X) est une tribu, on a donc T ⊂ σ(X).
Qd
Pour montrer l’inclusion inverse (c’est-à-dire T ⊃ σ(X)). On remarque que, si B ∈ C on a B = i=1 Ai
avec des Ai appartenant à B(R). On a donc X −1 (B) = ∩di=1 Xi−1 (Ai ) ∈ T (car Xi−1 (Ai ) ∈ σ(Xi ) ⊂ T ).
Or, il est facile de voir que {B ∈ B(Rd ), t.q. X −1 (B) ∈ T } est une tribu. Cette tribu contient C, elle
contient donc la tribu engendrée par C, c’est-à-dire B(Rd ). On vient donc de montrer que {B ∈ B(Rd ),
t.q. X −1 (B) ∈ T } = B(Rd ), c’est-à-dire que X −1 (B) ∈ T pour tout B ∈ B(Rd ), ou encore que σ(X) ⊂ T .
On a bien, finalement, σ(X) = T , ce qui donne le premier item de la proposition.
Le deuxième item est un conséquence facile du premier. En effet, si X est un v.a., on a pour tout i,
σ(Xi ) ⊂ σ(X) ⊂ A et donc Xi est une v.a.r.. Réciproquement; si Xi est, pour tout i, une v.a.r., on a

230
σ(Xi ) ⊂ A pour tout i. Comme A est une tribu, on a donc A ⊃ T et comme T = σ(X) on en déduit que
X est un v.a..

La démonstration de la proposition 9.1 n’utilise pas vraiment le fait que les Xi soient des applications à
valeurs dans R. Elle se généralise donc facilement au cas où les Xi sont des applications à valeurs dans
Rd i .

Proposition 9.2 Soit p ∈ N, p ≥ 2, d1 , . . . , dp ∈ N? . soit (Ω, A) un espace probabilisable et, pour tout
i ∈ {1, . . . , p}, Xi une application de Ω dans Rdi . On note X = (X1 , . . . , Xd )t , de sorte que X est une
application de Ω dans Rd avec d = d1 + . . . + dp . Soit d ≥ 1 et (Ω, A) un espace probabilisable. Soit X
une application de Ω dans Rd . On note σ(X) la tribu engendrée par X (et σ(Xi ), pour i = 1, . . . , p la
tribu engendrée par Xi ). On a alors :
1. σ(X) est la plus petite tribu contenant les tribus σ(X1 ), . . . , σ(Xp ).
2. X est un v.a. (de dimension d) si et seulement si Xi est, pour tout i ∈ {1, . . . , p}, un v.a. (de
dimension di ).

Définition 9.2 (Loi d’un v.a.) Soit (Ω, A, p) un espace probabilisé, d ≥ 1 et X un v.a. de dimension
d. On appelle loi de probabilité de X, et on note cette loi PX ou pX , la probabilité sur B(Rd ) image par
X de p (c’est-à-dire PX (A) = p(X −1 (A)) pour tout A ∈ B(Rd )). Si (X1 , . . . , Xd ) sont les composantes
de X, La probabilité pX est aussi appelée loi conjointe de (X1 , . . . , Xd ).

Un exemple important est la loi normale multidimensionnelle.

Définition 9.3 (Loi normale multidimensionnelle) Soit (Ω, A, p) un espace probabilisé, d ≥ 1 et X


un v.a. de dimension d. Soit m ∈ Rd et D une matrice (à coefficients réels, de taille d × d) s.d.p.
(c’est-à-dire symétrique définie positive). Le v.a. X a pour loi N (m, D) (loi normale de paramètre m et
D) si PX = f λd avec :
1 1
f (x) = p exp(− (x − m)t D−1 (x − m)) λd -p.p. en x ∈ Rd .
(2π)d/2 det(D) 2

Si D est seulement semi-définie positive (c’est-à-dire Du · u ≥ 0 pour tout u ∈ Rd ), au lieu d’être définie
positive (c’est-à-dire Du · u > 0 pour tout u ∈ Rd , u 6= 0), la loi normale N (0, D) est aussi définie,
voir la proposition 9.9, mais ce n’est pas une loi de densité (par rapport à la mesure de Lebesgue), voir
l’exercice 10.9 (et l’exercice 9.14 qui donne un exemple de loi normale bidimensionnelle qui n’est pas de
densité).

Nous verrons dans la section 9.3 que si X est un v.a. suivant une loi normale multidimensionnelle, X
est un v.a. gaussien. L’extension de la définition de la loi normale multidimensionnelle au cas D non
inversible permettra alors de dire que les v.a. gaussiens sont exactement ceux qui suivent une loi normale
multidimensionnelle (proposition 9.9).
Le fait que les composantes du v.a. X suivent une loi normale ne donne pas que X suit une loi normale
multidimensionnelle (voir, par exemple, l’exercice 10.10). Mais, si les composantes du v.a. X suivent
une loi normale et sont indépendantes, le v.a. X suit alors une loi normale multidimensionnelle (cf.
l’exercice 9.11 ou l’exercice 10.10).

Définition 9.4 (i-ème projecteur) Soit d ≥ 1. On appelle i-ème projecteur de Rd l’application πi , de


Rd dans R, qui a un vecteur de Rd fait correspondre sa i-ème composante dans la base canonique de Rd .

231
Définition 9.5 (Probabilité marginale) Soit (Ω, A, p) espace probabilisé , d ≥ 1 et X un vecteur
aléatoire de dimension d. On appelle i-ème probabilité marginale du vecteur aléatoire X la mesure image
de pX par le i-ème projecteur πi . La remarque suivante montre que cette probabilité marginale est en fait
la loi de Xi notée pXi .

Remarque 9.1 Soit (Ω, A, p) espace probabilisé , d ≥ 1 et X = (X1 , . . . , Xd )t un vecteur aléatoire de


dimension d. On note qi la i-ème probabilité marginale du vecteur aléatoire X. Soit B ∈ B(R), par
définition de la loi marginale, on a :

qi (B) = pX (πi−1 (B)) = p(X −1 (πi−1 (B))).

Comme Xi = πi ◦ X, on a donc :
qi (B) = p(Xi−1 (B)).
La probabilité qi est donc aussi la loi de la variable aléatoire Xi .

Remarque 9.2 Soit (Ω, A, p) espace probabilisé , d > 1 et X = (X1 , . . . , Xd )t un vecteur aléatoire de
dimension d. La connaissance de pX entraı̂ne la connaissance des pXi . La réciproque est en général
fausse.

On définit la densité d’une loi de manière analogue au cas scalaire.


Définition 9.6 (Loi de densité) Soit p une probabilité sur B(RN ) (N ?ge1), on dit que p est une prob-
abilité de densité (par rapport à la mesure de Lebesgue) s’il existe f ∈ L1R (RN , B(RN ), λN ) t.q. p = f λN .
De même que dans le cas scalaire, on a un théorème qui permet de calculer des intégrales par rapport à
la loi image :

Théorème 9.1 (Loi image) Soit d ≥ 1, (Ω, A, p) un espace probabilisé, X un v.a. de dimension d et
pX la loi de X. Soit ϕ une application borélienne de Rd dans R. On a alors :
1. ϕ ◦ X ∈ L1R (Ω, A, p) si et seulement si ϕ ∈ L1R (Rd , B(Rd ), pX ) ,
2. L’égalité Z Z
ϕ ◦ (x)dp(x) = ϕ(s)dpX (s),
Ω Rd

est vrai si ϕ prend ses valeurs dans R+ , ou si ϕ est bornée ou encore si ϕ ◦ X ∈ L1 (Ω, A, p). (On
rappelle que ϕ ◦ X est en général notée ϕ(X)).

Définition 9.7 (Fonction de répartition)


Soit d ≥ 1, (Ω, A, p) un espace probabilisé, X = (X1 , . . . , Xd )t un v.a. de dimension d et pX la loi de
X. On appelle fonction de répartition du vecteur aléatoire X la fonction définie de Rd dans [0, 1] par :
FX (t1 , . . . , td ) = p([X1 ≤ t1 , . . . , Xd ≤ td ]).

Proposition 9.3 Soit d ≥ 1, (Ω, A, p) un espace probabilisé et X un v.a. de dimension d de fonction de


répartition FX . Alors :
1. 0 ≤ FX (t) ≤ 1 pour tout t ∈ Rd ;
2. Si t, t0 ∈ Rd , t ≤ t0 (i.e. ti ≤ t0i , pour tout i = 1, . . . , d), FX (t) ≤ FX (t0 ) ;
3. FX est continue à droite en tout point ;

232
4. FX (t1 , . . . , td ) → 1 lorsque (t1 , . . . , td ) → (+∞, . . . , +∞) ;
5. FX (t1 , . . . , td ) → 0 lorsque ti → −∞ (à i fixé).

Démonstration : La démonstration découle facilement des propriétés d’une mesure (monotonie, conti-
nuité croissante et continuité décroissante.

Proposition 9.4 Soit d ≥ 1, (Ω, A, p) un espace probabilisé et X un v.a. de dimension d de fonction de


répartition FX . Si FX ∈ C d (Rd , [0, 1]), alors pX est une probabilité de densité (par rapport à Lebesgue)
et cette densité, notée fX , vérifie
∂ d FX
fX = λd -p.p.. (9.1)
∂x1 . . . ∂xd

Démonstration : On suppose que d = 1. Pour tout a, b ∈ R, a < b, la définition de FX donne


Rb 0
pX (]a, b]) = FX (b) − FX (a). Mais, comme FX est de classe C1 , on a FX (b) − FX (a) = a FX (t)dt. En
0
notant m la mesure de densité FX par rapport à λ, on a donc PX (]a, b]) = m(]a, b]) pour tout a, b ∈ R,
a < b, ce qui est suffisant pour dire que PX = m (en utilisant, par exemple, la proposition 2.5).

Pour d > 1, on note m la mesure de densité ∂ d FX /∂x1 . . . ∂xd par rapport à λd . Un raisoonnement voisin
Qd Qd
du précédent donne m( i=1 ]ai , bi ]) = PX ( i=1 ]ai , bi ]) pour tout ai , bi ∈ R, ai < bI , i = 1, . . . , d. On en
déduit m = PX avec la proposition 2.5.

Définition 9.8 (Espérance) Soit (Ω, A, p) espace probabilisé , d > 1 et X = (X1 , . . . , Xd )t un vecteur
aléatoire de dimension d. On suppose que E(|Xi |) < ∞ pour tout i ∈ {1, . . . , d}. L’espérance de X,
notée E(X), est alors le vecteur de Rd dont les composantes sont les espérances des Xi , c’est-à-dire
E(X) = (E(X1 ), . . . , E(Xd ))t .

Remarque 9.3 Soit (Ω, A, p) espace probabilisé , d > 1 et X = (X1 , . . . , Xd )t un vecteur aléatoire de
dimension d t.q. E(|Xi |) < ∞ pour tout i ∈ {1, . . . , d}. Soit u ∈ Rd . L’application u · X (qui à ω ∈ Ω
associe u · X(ω), on rappelle que ξ · η est le produit scalaire canonique de ξ et η dans Rd ) est une v.a.r.
intégrable et il est clair que E(u · X) = u · E(X). L’application u 7→ E(u · X) est donc l’application
linéaire sur Rd représentée par E(X).

Définition 9.9 (Variance, covariance) Soit (Ω, A, p) espace probabilisé , d > 1 et X = (X1 , . . . , Xd )t
un vecteur aléatoire de dimension d. On suppose que E(Xi2 ) < ∞ pour tout i ∈ {1, . . . , d}. On définit
alors la matrice de covariance de X, notée Cov(X), comme la matrice dont le coefficient i, j est donné
par :
Cov(X)i,j = E((Xi − E(Xi ))(Xj − E(Xj ))) pour tout i, j ∈ {1, . . . , d}.
On a donc Ci,i = Var(Xi ) et Ci,j = Cov(Xi , Xj ) (noter d’ailleurs que Cov(Xi , Xi ) = Var(Xi )). Enfin,
on peut aussi noter que Cov(X) est l’espérance de la matrice (X − E(X))(X − E(X)t .

Remarque 9.4 Soit (Ω, A, p) espace probabilisé , d > 1 et X = (X1 , . . . , Xd )t un vecteur aléatoire de
dimension d t.q. E(Xi2 ) < ∞ pour tout i ∈ {1, . . . , d}. Pour tout u ∈ Rd , on a donc E((u · X)2 ) < ∞
et il est facile de voir (voir l’exercice 9.8) que Var(u · X) = ut Cov(X)u. La matrice Cov(X) est donc la
matrice de la forme quadratique u 7→ Var(u · X), définie sur Rd . Cette matrice est donc symétrique et
semi-définie positive. On peut aussi noter que, pour tout u, v ∈ Rd , on a ut Cov(X)v = E((u · X)(v · X)).

233
9.2 Indépendance
Définition 9.10 Soit p ∈ N, p ≥ 2, d1 , . . . , dp ∈ N? . soit (Ω, A) un espace probabilisable et, pour tout
i ∈ {1, . . . , p}, Xi un v.a. de dimension di . Les v.a. X1 , . . . , Xp sont dits indépendants si les tribus
σ(X1 ), . . . , σ(Xp ) (engendrées par X1 , . . . , Xp ) sont indépendantes (cf définition 2.24, p. 38)

La proposition suivante donne des “opérations” possibles sur l’indépendance.

Proposition 9.5 Soit p ∈ N, p ≥ 2, d1 , . . . , dp ∈ N? . soit (Ω, A) un espace probabilisable et, pour tout
i ∈ {1, . . . , p}, Xi un v.a. de dimension di . On suppose que les v.a. X1 , . . . , Xp sont indépendants. On
se donne maintenant une suite strictement croissante p0 , . . . , pq (q ≥ 2) t.q. 1 = p0 < . . . < pq = p + 1
et, pour i ∈ {1, . . . , q}, on note Yi le v.a. (Xpi−1 , . . . , Xpi −1 )t , qui est donc un v.a. de dimension
ri = dpi−1 + . . . + dpi −1 . On a alors
1. Les v.a. Y1 , . . . , Yq sont indépendantes,
2. Si ϕi est, pour tout i ∈ {1, . . . , q}, une application borélienne de Rri dans Rsi (avec si ∈ N? ), les
v.a. ϕ1 (Y1 ), . . . , ϕq (Yq ) sont indépendants.

Démonstration : le premier item est une conséquence immédiate de la proposition 2.11 (sur l’indépen-
dance de tribus) et de la proposition 9.2. Le second item est une conséquence immédiate du premier car
σ(ϕi (Yi )) ⊂ σ(Yi ) pour tout i.

Remarque 9.5 Soit (Ω, A) un espace probabilisable et X, Y deux v.a. (pas nécessairement de même
dimension). La proposition 9.5 montre que si X et Y sont indépendants, toute composante de X est
indépendante de toute composante de Y . Réciproquement, si toute composante de X est indépendante de
toute composante de Y , on en déduit que X et Y sont indépendants. Ceci est encore une conséquence
simple de la proposition 2.11.

On donne maintenant une généralisation de la proposition 4.10.

Proposition 9.6 Soit (Ω, A, p) un espace probabilisé, n ≥ 2 et X1 , . . . , Xn des v.a. indépendants, de


dimension d1 , . . . , dn ∈ N? .
1. Soit, pour tout i ∈ {1, . . . , n}, une fonction borélienne, notée ϕi , de Rdi dans R+ . On a alors :
d
Y n
Y
E( ϕi (Xi )) = E(ϕi (Xi )). (9.2)
i=1 i=1

(En convenant qu’un produit de termes est nul si l’un des termes est nul.)
2. Soit, pour tout i ∈ {1, . . . , n}, ϕi une fonction borélienne de Rdi dans R. On suppose que ϕ(Xi )
Qd
est intégrable pour tout i = 1, . . . , n. La v.a.r. i=1 ϕi (Xi ) est alors intégrable et l’égalité (9.2) est
vraie.
3. Soit, pour tout i ∈ {1, . . . , n}, ϕi une fonction borélienne bornée de Rdi dans R. Alors, l’égalité (9.2)
est vraie.
N.B. Comme dans la proposition 4.10, l’item 3 est donc une CNS pour que les v.a. X1 , . . . , Xn soient
indépendants.

234
Démonstration : La démonstration suit pas à pas celle de la proposition 4.10, sans difficulté supplé-
mentaire.

Remarque 9.6 Soit (Ω, A, p) un espace probabilisable. La proposition 9.6 donne aussi des résultats
quand les fonctions ϕi sont à la valeurs dans Rri avec ri 6= 1. Par exemple, soit X, Y sont deux v.a.
indépendants de dimensions d. On suppose X et Y intégrables (c’est-à-dire E(|X|) < ∞ et E(|Y |) < ∞).
La v.a.r. X · Y est alors intégrable et E(X · Y ) = E(X) · E(Y ).
¯ X, Y indépendants.
Plus généralement, soit X est un v.a. de dimension d, Y est un v.a. de dimension d,
¯
On suppose que ϕ est une fonction borélienne de R dans R et ψ une fonction borélienne de Rd dans Rr
d r

t.q. ϕ◦X et ψ◦Y soient intégrables. On a alors ϕ◦X·ψ◦Y intégrable et E(ϕ◦X·ψ◦Y ) = E(ϕ◦X)·E(ψ◦Y ).
Enfin, si X1 , . . . , Xn sont des v.a. indépendants de dimension d (d ≥ 1), la formule donnée dans la
proposition 6.26 se généralise et donne :
n
X
Cov(X1 + . . . + Xn ) = Cov(Xi ).
i=1

Pour le montrer, il suffit de traiter le cas n = 2 (qui est traité dans l’exercice 9.9) et de faire une récurrence
sur n.

On donne maintenant la généralisation de la proposition 4.12.

Proposition 9.7 Soit (Ω, A, p) un espace probabilisé, n ≥ 2 et X1 , . . . , Xn des v.a. indépendants, de


dimension d1 , . . . , dn ∈ N? . Ces v.a. sont indépendants si et seulement si on a, pour tout famille {ϕi ),
i = 1, . . . n} t.q. ϕi ∈ Cc (Rdi , R) pour tout i,
d
Y d
Y
E( ϕi (Xi )) = E(ϕi (Xi )), (9.3)
i=1 i=1

(En convenant qu’un produit de termes est nul si l’un des termes est nul.)

Démonstration : Ici encore, la démonstration suit pas à pas celle de la proposition 4.12, sans difficulté
supplémentaire.

Théorème 9.2 (Loi d’un couple de v.a. indépendantes) Soit (Ω, A, P ) un espace probabilisé.
1. Soit X, Y deux v.a.r.. Les v.a. X et Y sont indépendantes si et seulement si la loi du v.a. (X, Y )t
(ou du couple (X, Y )) est P(X,Y )t = PX ⊗ PY .
2. Soit X1 , . . . , Xn (n ≥ 2) n v.a. de dimension d1 , . . . , dn ∈ N? . On pose Z = (X1 , . . . , Xn )t (Z est
donc un v.a. de dimension d1 + . . . + dn ). Les v.a. X1 , . . . , Xn sont indépendantes si et seulement
si la loi du v.a. Z est PZ = PX1 ⊗ . . . ⊗ PXn .

Démonstration : La démonstration du premier item fait partie de l’exercice 9.10. le second item est
une généralisation assez simple (en faisant, par exemple, une récurrence sur n pour se ramener au cas
n = 2).

On utilise souvent en théorie des probabilités une suite (finie ou infinie) de v.a.r. indépendantes ayant
des lois prescrites. Le théorème suivant montre qu’il existe effectivement un espace de probabilité et une
suite de v.a.r.i. sur cet espace ayant des lois prescrites.

235
Théorème 9.3 (Existence de v.a.r.i. de lois prescrites) Soit (pn )n∈N? une suite de probabilités sur
B(R). On a alors :
1. Pour tout n ∈ N? , il existe un un espace probabilisé, noté (Ω, A, P ), et une suite finie de v.a.r.
indépendantes, notées X1 , . . . , Xn t.q. PXk = pk pour tout k ∈ {0, . . . , n}.
2. Il existe un un espace probabilisé, noté (Ω, A, P ), et une suite de v.a.r. indépendantes, notée
(Xn )n∈N? t.q. PXn = pn pour tout n ∈ N? .

Démonstration : Nous démontrons ici le premier item. Le second (plus difficile) sera admis. Soit
n ∈ N? . Un raisonnement par récurrence utilisant le théorème d’existe