Vous êtes sur la page 1sur 131

Théorie de la Mesure 1

S. Friedli

Departamento de Matemática, UFMG E-mail address: sacha@mat.ufmg.br

1. Cours donné à l’Institut de Mathématiques (UNIGE), automne 2010 et 2013.

Table des matières

1.

Conventions

1

Chapitre 1. Introduction

 

3

1. L’Intégrale selon Riemann

3

2. L’idée originale de Lebesgue

7

3. La Mesure de Lebesgue sur [0, 1]

9

4. À propos de la bibliographie

17

Chapitre 2. Tribus et Mesures

 

19

1. Tribus

19

2. Mesures

22

3. Un Critère d’unicité

26

4. Le Théorème d’Extension de Carathéodory

28

5. Mesures de Lebesgue-Stieltjes sur R

31

6. La mesure de Lebesgue sur R d

35

Chapitre 3. Intégrer par rapport à une mesure

45

1. Mesurabilité

 

45

2. Intégrer les fonctions étagées

48

3. Intégrer les fonctions mesurables positives

51

4. Propriétés vraies presque partout

54

5. Intégrer les fonctions mesurables

56

6. Intégrer par rapport à la mesure de Lebesgue

58

7. Intégrales dépendant d’un paramètre

67

8. Parenthèse : intégration et probabilités

68

Chapitre 4. Les espaces L p et L p

71

1. Les espaces L p

 

71

2. Les espaces L p

74

3. Remarques sur le cas

p = 2

78

4. Remarques sur le cas

p =

79

Chapitre 5. Suites de fonctions et approximations

81

1. Convergence ponctuelle et uniforme

81

2. Convergence presque-partout et en mesure

81

iii

3. Convergence en norme L p

84

4. Théorèmes de Densité et Approximations dans L p

85

5. Le Théorème d’Egorov

86

Chapitre 6. Produits

89

1. Structure mesurable sur X × Y

89

2. Intégrer les sections

92

3. Le Théorème de Tonelli-Fubini

94

4. Changements de Variables sur R d

97

Chapitre 7. Décomposition et dérivation

99

1. Le Théorème de Radon-Nikodým

99

2. La décomposition de Lebesgue

106

3. Parenthèse : l’espérance conditionnelle

107

4. Dualité L p L q

113

5. Le Théorème de dérivation de Lebesgue

114

Chapitre 8. Le Théorème Fondamental de l’Analyse

121

Bibliographie

127

1. CONVENTIONS

1. Conventions

.}. Les indices i, j, k, l, m, n seront

toujours utilisés pour symboliser ses éléments. La droite réelle : R. La droite achevée : R := R ∪ {+, −∞}. Pour tout x R on a −∞ < x < +. Les opérations arithmétiques standards (+, et ·) s’étendent naturellement à R . Si x R, alors (les lignes qui suivent doivent être interprétées en prenant soit toujours le signe “du haut”, soit celui “du bas”)

Les entiers naturels : N := {1, 2,

(±∞) + (±∞) = ±∞ ,

x ± (±∞) = (±∞) ± x = ±∞ ,

(±∞) · (±∞) = +,

(±∞) · (∓∞) = −∞ ,

x · (±∞) = (±∞) · x =

  ±∞

∓∞

  si x = 0 .

si x > 0, si x < 0,

0

Obs : On ne définit jamais “∞ − ∞”, et la convention 0 · ∞ = 0 jouera un rôle important dans la suite.

Les rationnels : Q. Si I R, Q I := Q I. Limites : Si x n R est une suite monotone non-décroissante conver- geant vers x (évent. ), on notera x n x, ou encore lim n x n = x. De même, si x n R est une suite monotone non-croissante convergeant vers x (évent. −∞), on notera x n x, ou encore lim n x n = x. Ensembles. Si X est un ensemble, alors P(X) dénote la famille de tous les sous-ensembles de X ; P(X) contient aussi . Le complémen- taire de A P(X) s’écrit A c := X\A. Pour des ensembles A α quel- conques, on a les Relations de de Morgan :

α

A α c = A c α ,

α

α

A α c = A c α .

α

La fonction indicatrice de A est définie par

1 A (x) :=

1

0

si A x , sinon.

Si X, Y

f 1 (B) := {x X : f (x) B}. Pour toute collection d’ensembles

B α Y , on a

sont deux ensembles, et f : X Y , alors pour B Y ,

f 1 (B α ) = (f 1 (B α )) c , et

c

f

1

α

B α =

α

f

1 (B α ) ,

f 1

α

B α =

α

f

1 (B α ) .

CHAPITRE 1

Introduction

Dans le but de prouver une affirmation concernant la convergence de la série de Fourier, Henri Léon Lebesgue (1875-1941) fut amené à dé- velopper une nouvelle théorie de l’intégration, qu’il présenta dans sa thèse [11], intitulée Intégrale, longueur, aire. Cette théorie s’avéra plus tard avoir un champ d’application bien plus vaste que celle inventée par Newton et Leibniz au 17ème siècle, et développée par Riemann et ses contemporains au 19ème.

L’intégration au sens de Lebesgue est aujourd’hui utilisée dans prati- quement tous les domaines des mathématiques. Elle joue un rôle par- ticulièrement important dans la formulation rigoureuse de la Théorie des Probabilités (Kolmogorov, 1933) et dans la Théorie des Systèmes Dynamiques.

Ce cours expose les grands chapitres de cette théorie, comme décrite dans la plupart des livres classiques sur le sujet. Une brève description bibliographique se trouve à la fin de cette introduction.

1. L’Intégrale selon Riemann

Rappelons brièvement la définition de l’intégrale définie de Riemann pour une fonction f : [a, b] R, que l’on supposera positive et bornée pour simplifier.

Considérons une partition π de l’intervalle [a, b] : x 0 a < x 1 <

b, et définissons pour chaque intervalle

:=

I i

x 2

<

···

< x n1

<

x n

:= [x i , x i+1 ) les deux nombres m i

:= inf{f (x) :

x

I i }, M i

sup{f (x) : x I i }. On définit alors les fonctions en escalier

f π

:=

n1

i=0

m i 1 I i ,

3

+

f

π

:=

n1

i=0

M i 1 I i ,

1.

L’INTÉGRALE SELON RIEMANN

qui sont deux approximations de f satisfaisant f définit alors les sommes de Riemann

π

f

I(f

π

) :=

n1

i=0

m i (I i ) ,

+

I(f

π

) :=

n1

i=0

M i (I i ) ,

+

f

π

. On

(I) représente la longueur de l’intervalle I, c’est-à-dire

([a, b)) := b a .

f(x)

I , c’est-à-dire ([ a, b )) := b − a . f ( x )

M 3

M 1 M 2 m 3 m 1 m 2
M
1
M
2
m
3
m
1
m
2
M 1 M 2 m 3 m 1 m 2

a

x 1

x 2

b

x

Figure 1. Une fonction f : [a, b] R et les deux ap-

proximations f

± (ici, π = (x 0 a, x 1 , x 2 , x 3 b)), cor-

π

respondant aux sommes de Riemann I(f

π

± ).

(1.1)

La fonction f est intégrable (au sens de Riemann) si

+

inf I(f

π

) = sup I(f

π

π π

) < .

Si f est intégrable, alors la valeur commune des deux nombres ci-dessus est notée

b

a

f (x) dx .

Le procédé qui mène à l’intégrale de Riemann d’une fonction f consiste donc à discrétiser son domaine.

Il est bien connu que les fonctions continues sont intégrables au sens de Riemann. Dans ce cas particulier, l’intégrale de Riemann garantit en plus l’existence d’une primitive de la fonction f :

1.

L’INTÉGRALE SELON RIEMANN

Théorème 1.1 (Théorème Fondamental de l’Analyse). Si f est conti- nue, alors la fonction

x x f (s)ds ,

a

est dérivable, et sa dérivée est égale à f (x). En particulier, si F est une primitive quelconque de f , alors

b

a

f (x) dx = F (b) F (a) .

Même si une fonction n’a pas besoin d’être continue pour être inté- grable, l’ensemble de ses points de discontinuité ne peut pas être trop important : si f possède trop de discontinuités sur un petit intervalle I, alors les termes des sommes de Riemann pour lesquels I i I se comportent mal dans la limite des partitions fines. Donc la continuité apparaît de façon essentielle dans la définition de l’intégrale de Rie- mann. En fait, Lebesgue a montré (on le verra dans le Théorème 3.28) qu’une fonction est intégrable au sens de Riemann si et seulement si l’ensemble de ses points de discontinuités est négligeable 1 .

Malgré son grand succès rencontré en mathématique (calcul différentiel,

géométrie analytique,

) et en ingénierie, l’intégrale de Riemann souffre de quelques défauts importants, dont nous allons énoncer les principaux.

en physique (mécanique, thermodynamique,

),

Passages à la limite. La notion d’intégrabilité au sens de Riemann manque de robustesse, comme le montre l’exemple suivant. Soit x 1 , x 2 , une énumération des rationnels de l’intervalle [0, 1]. Définissons f n :

, x n }. Par le théo-

rème mentionné plus haut, chaque fonction f n est intégrable, puisqu’elle possède un nombre fini de discontinuités. Par contre, la fonction limite f (x) := lim n f n (x) 1 Q[0,1] (x) existe, est bornée, mais discontinue en tout point x [0, 1]. Elle n’est donc pas intégrable.

[0, 1] R par f n (x) := 1 Q n (x), où Q n := {x 1 ,

Échange limite-intégrale. En analyse, on a souvent besoin de pou- voir échanger une limite avec une intégrale. Le résultat suivant est un des seuls qui donne une condition sous laquelle cet échange peut être fait pour l’intégrale de Riemann :

Soit f n : [0, 1] R une suite de fonctions intégrables convergeant uni-

1 f (x)dx =

formément vers une fonction f . Alors f est intégrable, et

0

1. La définition précise d’ensemble négligeable sera donnée plus bas.

1.

L’INTÉGRALE SELON RIEMANN

lim n→∞

1 f n (x)dx.

0

La condition de convergence uniforme est très forte, trop pour que ce théorème soit vraiment utile. Pour le voir, il suffit de considérer la suite de fonctions f n (x) := e nx (avec f (0) = 0). Il est facile de voir que f n

x

1

est intégrable (l’intégrale impropre f n (x)dx existe pour tout n). De plus, comme f n (x) 0 pour tout x [0, 1], il semble raisonnable d’affirmer que

0

n→∞

lim

0

f n (x)dx = 0 .

Pourtant la convergence f n 0 n’est pas uniforme, et il faut donc prouver cette convergence “à la main”.

Un autre exemple de résultat dont la preuve n’utilise que des outils classiques d’analyse mais requiert une certaine ingéniosité :

Soit f n une suite de fonctions continues sur [0, 1], telle que 0 f n 1, et telle que f n (x) 0 pour tout x [0, 1]. Alors

1

0

f n (x)dx 0 .

Les deux exemples précédents sont donc des cas où l’échange de limites

n→∞ 1

lim

0

f n (x)dx = 1 n f n (x)dx

0

lim

peut être justifié, sans que la convergence soit uniforme.

Donc l’intégrale au sens de Riemann n’a pas de théorème général sur l’échange intégrale-limite, et chaque cas doit être considéré séparément.

Non-complétude de C[a, b]. Soit C[a, b] l’espace vectoriel des fonc- tions continues sur [a, b]. Dans diverses situations, on s’intéresse à dé- finir une norme sur C[a, b] à partir de l’intégrale

f := b |f(x)| 2 dx 1/2 .

a

Par exemple, en analyse fonctionnelle, on s’intéresse à ce que muni de cette norme, l’espace C[a, b] soit complet (i.e. que toute suite de Cau- chy converge). Or il est facile de voir que la norme définie ci-dessus ne satisfait justement pas cette propriété.

L’intégrale de Lebesgue permet d’écarter chacune de ces difficultés.

2. L’IDÉE ORIGINALE DE LEBESGUE

2. L’idée originale de Lebesgue

Comme mentionné plus haut, la définition de l’intégrale de Riemann d’une fonction f : [a, b] R repose sur une approximation obtenue à partir de partitions de son domaine [a, b]. L’idée fondamentale à l’ori- gine de la théorie de Lebesgue est d’approximer la fonction par des partitions de son ensemble image, c’est-à-dire f ([a, b]).

Considérons une fonction f : [a, b] R, que l’on supposera à nouveau positive et bornée pour simplifier. Il existe alors deux nombres m < M tels que m f (x) M pour tout x [a, b]. Considérons alors une partition Π de l’intervalle [m, M ] : y 0 m < y 1 ··· < y n M.

f(x)

y

y

y

y

y

5

4

3

2

1

< y n ≡ M . f ( x ) y y y y y 5
< y n ≡ M . f ( x ) y y y y y 5
< y n ≡ M . f ( x ) y y y y y 5
< y n ≡ M . f ( x ) y y y y y 5

a

< y n ≡ M . f ( x ) y y y y y 5

J 3

J 2
J 2
n ≡ M . f ( x ) y y y y y 5 4 3
n ≡ M . f ( x ) y y y y y 5 4 3

b

J 4

M . f ( x ) y y y y y 5 4 3 2 1

x

Figure 2. La même fonction que sur la Figure 1, ap- proximée via un partitionnement de l’ensemble image.

À chaque intervalle [y i , y i+1 ) correspond un sous-ensemble du domaine de f donné par

J i := f 1 ([y i , y i+1 )) .

On définit alors une fonction étagée associée à f et à la partition Π :

et son intégrale :

ϕ Π :=

ϕ Π :=

n1

y i 1 J i ,

(1.2)

i=0

n1

y i (J i ) .

(1.3)

i=0

2. L’IDÉE ORIGINALE DE LEBESGUE

On dit que f est intégrable au sens de Lebesgue si

f := sup

Π

ϕ Π < .

Sans que ça soit évident à première vue, cette nouvelle définition de l’intégrale s’avère être beaucoup plus générale que celle de Riemann, et la contient comme cas particulier (dans le sens où toute fonction inté- grable au sens de Riemann est intégrable au sens de Lebesgue). Voyons quelle est la principale difficulté apparaissant avec cette nouvelle défi- nition.

Suivant le comportement de f , les ensembles J i = f 1 ([y i , y i+1 )) peuvent ne plus être des intervalles, et avoir une structure compliquée. Par exemple, si

f (x) := sin

0

1

x

si

si x = 0 ,

x

(0, 1] ,

(1.4)

alors pour tout [c, d) [1, 1], f 1 ([c, d)) est une union disjointe, infinie dénombrable, d’intervalles contenus dans [0, 1]. Ou encore, si f (x) := 1 K (x), où K est l’ensemble de Cantor sur [0, 1], alors f 1 ([1 δ, 1 + δ)) = K, que l’on sait être un ensemble non-dénombrable, nulle part dense.

Donc pour pouvoir définir n1 y i (J i ), on doit avant tout savoir définir précisément les nombres, “ (J i )”. On doit donc être en possession d’une fonction d’ensemble (·), qui généralise la notion de longueur pour les intervalles, et qui coïncide avec celle-ci sur les intervalles. Cette fonc- tion d’ensemble s’appelle mesure.

i=0

La mesure devra alors satisfaire à quelques propriétés fondamentales. Par exemple, pour la fonction (1.4), on doit s’assurer que la mesure de f 1 ([c, d)) est égale à la somme (infinie) des longueurs des intervalles.

Donc, la construction de l’intégrale de Lebesgue se fera en deux étapes principales. En premier lieu, on commencera par élaborer une Théorie de la Mesure permettant de distinguer les ensembles de la droite aux- quels on sait associer une notion de mesure, qui généralise la notion de longueur pour les intervalles. Ces ensembles seront appelés mesurables. Ensuite, on se restreindra aux fonctions f telles que tous les ensembles de la forme f 1 (I) sont mesurables, et l’intégration de ces fonctions par rapport à la mesure de Lebesgue se fera en suivant les lignes décrites

3. LA MESURE DE LEBESGUE SUR [0, 1]

plus haut.

Nous l’avons vu, pour l’intégrale de Riemann, la continuité est un ingré- dient central, et la convergence des intégrales vers l’intégrale de la limite n’est garantie qu’au prix d’une convergence uniforme. Or la continuité ne disparaît pas complètement dans la théorie de Lebesgue : même si la continuité de la fonction n’est plus essentielle, c’est la continuité de la mesure qui jouera un rôle fondamental dans tous les théorèmes de la théorie de l’intégration : des ensembles proches (dans un sens qui sera rendu précis dans le chapitre suivant) ont des mesures proches.

Dans un but pédagogique, nous construirons la mesure de Lebesgue sur l’intervalle [0, 1], dans la section suivante. Les méthodes introduites dans la construction de la mesure de Lebesgue n’étant pas restreintes aux sous-ensembles de la droite, nous les développerons en toute gé- néralité dans le Chapitre 2. De même, la théorie de l’intégration par rapport à une mesure peut se faire en toute généralité ; nous y consa- crerons le Chapitre 3.

3. La Mesure de Lebesgue sur [0, 1]

Cette section est consacrée à la construction de la mesure de Lebesgue sur l’intervalle [0, 1]. Ce cas particulier est celui sur lequel Lebesgue a originalement élaboré sa théorie, et il montre déjà toutes les difficultés rencontrées dans le problème plus général de construire des mesures sur des espaces abstraits. La construction de la mesure de Lebesgue en dimensions supérieures sera étudiée en détails dans la Section 6 du Chapitre 2.

Notre objectif est donc de pouvoir mesurer le plus possible de sous- ensembles de [0, 1]. Avant de commencer, on peut se demander ce qu’on entend exactement par mesure, et quelles sont les propriétés qu’elle doit satisfaire. Citons de la Vallée Poussin [6] (Chapitre 2, page 1) :

“La mesure des grandeurs repose sur un axiome fon- damental : le tout est la somme des parties. Si une grandeur se partage en parties de même espèce, la mesure du tout sera la somme des mesures des par- ties. Euclide, qui a formulé cet axiome, a fondé sur

3. LA MESURE DE LEBESGUE SUR [0, 1]

lui la théorie de la mesure des figures de la géométrie élémentaire et tous ses successeurs ont fait de même 2 . Toute généralisation de la théorie de la mesure, telle la mesure des ensembles, doit donc se propo- ser comme première condition de respecter le principe précédent. La mesure d’un ensemble E est un nombre, positif ou nul, attaché à cet ensemble et qui en dépend. On exprime cette correspondance en disant que la mesure est une fonction de l’ensemble E. D’après ce qui pré- cède, cette fonction doit satisfaire à deux conditions essentielles :

(1) Elle doit être additive, c’est-à-dire que la mesure d’une somme d’ensembles sans point commun deux à deux doit être la somme des mesures des parties.

(2) Elle doit se réduire à la mesure au sens élémen- taire dans le cas des figures élémentaires, segment, rectangle, etc.

La première de ces deux conditions, l’additivité, peut être étendue de deux manières : une fonction est ad- ditive au sens restreint si elle n’est additive que pour un nombre fini de termes ; elle est additive au sens complet si elle est encore additive pour une infinité dénombrable de termes. Le progrès essentiel obtenu par MM. Borel et Le- besgue dans la théorie de la mesure est d’avoir réalisé l’additivité au sens complet. Toute la supériorité de leur théorie vient de là. Il importe toutefois de dire que la première idée de cette théorie revient à M. Borel. L’oeuvre propre de M. Lebesgue ne commence qu’avec les intégrales définies.”

L’additivité au sens complet dont parle de la Vallée Poussin est com- munément appelée additivité dénombrable (ou σ-additivité) : si (A n ) est une famille dénombrable d’ensembles deux à deux disjoints, alors

A n = (A n ) .

n

n

(1.5)

2. Pour définir la mesure des figures géométriques, il faut au principe précédent joindre celui-ci : des figures égales (superposables) ont même mesure.

3. LA MESURE DE LEBESGUE SUR [0, 1]

Sur les réels, la mesure est donc une généralisation de la notion classique de longueur pour les intervalles. Or la longueur peut être vue comme une fonction d’ensemble

: {intervalles de [0, 1]} → R + ,

telle que pour un intervalle J de la forme [a, b], [a, b), (a, b] ou (a, b),

(1.6)

(J) = b a .

Nous commencerons par définir une fonction d’ensemble sur P([0, 1]), c’est-à-dire sur toutes les parties de [0, 1], appelée mesure extérieure :

: P([0, 1]) R + ,

telle que

(J) = (J)

pour tout intervalle J. Pour obtenir l’additivité dénombrable, nous nous verrons obligés de restreindre à une sous-famille M P([0, 1]) sur laquelle (1.5) est satisfaite. Les ensembles de M seront appelés mesu- rables, et la restriction

: M R +

la mesure de Lebesgue sur [0, 1].

Les principales étapes qui mènent à la mesure de Lebesgue seront uti- lisées à nouveau dans le Chapitre 2, lors de la construction de mesures sur des espaces plus généraux.

3.1. Les ensembles négligeables. Pour commencer, donnons la définition d’ensemble négligeable, mentionnée plus haut.

Un recouvrement d’un ensemble quelconque A [0, 1] est une famille dénombrable d’intervalles ouverts I = {I} telle que A II I.

Définition 1.2. A est négligeable si pour tout > 0 il existe un re- couvrement I = {I} de A tel que II (I) < .

En d’autres termes, A est négligeable si

inf (I) = 0 ,

II

où l’infimum est sur tous les recouvrements de A. Par exemple, un point A = {x} est négligeable.

3. LA MESURE DE LEBESGUE SUR [0, 1]

3.2. Mesure extérieure. Un procédé naturel pour mesurer un ensemble est de l’approximer par des ensembles plus simples que l’on sait déjà mesurer. Comme on l’a fait ci-dessus, on peut le recouvrir par des intervalles ouverts et chercher à minimiser la somme totale des intervalles.

Définition 1.3. Soit A [0, 1]. La mesure extérieure de A est définie par

(A) := inf (I) ,

(1.7)

II

où l’infimum est sur tous les recouvrements de A.

On peut vérifier (exercice) que les recouvrements utilisés pour définir peuvent être pris avec des intervalles quelconques, pas nécessairement ouverts ou fermés.

La mesure extérieure est donc une fonction d’ensemble sur [0, 1], :

P([0, 1]) R + . Pour tout A P([0, 1]), le nombre (A) est tel que pour tout > 0 on peut trouver un recouvrement I de A tel que

II

(I) (A) (I) .

II

Les ensembles négligeables sont donc ceux pour lesquels (A) = 0. Donnons quelques propriétés élémentaires de la mesure extérieure :

Normalisation : () = 0. Consistance : si J [0, 1] est un intervalle, alors (J) = (J). Prenons par exemple J = [a, b]. Alors J peut être recouvert par J = (aδ, b+δ), et donc (J) (J ) = (J)+2δ. Puisque δ est arbitraire, (J) (J). Ensuite, par définition, pour tout > 0 il existe un recouvrement I de J tel que (J) II (I) . Or clairement, II (I) (J) (exer- cice), ce qui montre, comme est arbitraire, que (J) (J).

Monotonicité : si A B, alors (A) (B). En effet, tout recouvre- ment de B est aussi un recouvrement de A.

Par exemple, pour tout A, (A) ([0, 1]) = ([0, 1]) = 1 0 = 1. Sous-additivité dénombrable : si (A n ) n1 est une famille dénombrable, alors

(1.8)

n1 A n

n1

(A n ) .

3. LA MESURE DE LEBESGUE SUR [0, 1]

En particulier, si (A n ) n=1,2,

,N

est finie, alors

N N

n=1 A n

n=1

(A n ) .

(1.9)

En effet, fixons > 0. Pour chaque A n il existe un recouvrement {I n,k } k1 tel que (A n ) k1 (I n,k ) /2 n . Il est clair que {I n,k } n,k est un recouvrement de n1 A n . Donc

n1 A n

n,k

(I n,k ) =

n1


n1


n1

k1

(I n,k )

(A n ) + /2 n

(A n ) + .

On obtient la deuxième affirmation en appliquant la première avec A k = pour tout k N + 1.

La sous-additivité dénombrable implique en particulier que les réunions dénombrables d’ensembles négligeables sont négligeables, et que les en- sembles dénombrables sont négligeables (le contraire n’est pas vrai, voir exercice). Aussi, (A) > 0 seulement si A est non-dénombrable.

3.3. Les ensembles mesurables. La mesure extérieure généra- lise donc la notion de longueur pour les intervalles. Il nous reste à voir si elle satisfait à la condition (1.5) d’additivité dénombrable.

La propriété de sous-additivité finie (1.9) de implique que si A, B sont deux ensembles quelconques, alors

(A B) (A) + (B) .

Si en plus ces ensembles sont disjoints, on s’attend à obtenir une égalité (voir la citation de de la Vallée Poussin) :

(1.10)

(A B) = (A) + (B) .

Cette identité peut être vérifiée dans certains cas simples, par exemple lorsque A et B sont à distance positive (exercice). Ou encore, on sait

par consistance que ([0, 1 2 )) = 1 2 , ([ 1 2 , 1]) = 1 2 , et

([0, 1]) =

1, donc

(1.11)

1

1

([0, 2 )) + ([ 2 , 1]) = ([0, 1]) .

3. LA MESURE DE LEBESGUE SUR [0, 1]

Mais de manière générale, on aimerait que la mesure extérieure satis- fasse (1.10), au moins quand B = A c := [0, 1]\A :

(1.12)

Cette propriété n’est malheureusement pas vraie pour tout ensemble A [0, 1] (voir la Section 6.5 du Chapitre 2). Donc il n’y a aucun espoir de montrer que est σ-additive sur P([0, 1]).

(A) + (A c ) = 1 .

Donc pour pouvoir utiliser effectivement , on doit la restreindre à une sous-classe de P([0, 1]). On pourrait par exemple se restreindre à la classe des ensembles A sur lesquels (1.12) est satisfaite. On verra (exercice) que la définition suivante, bien que plus abstraite, est équi- valente et plus maniable :

Définition 1.4. Un ensemble A [0, 1] est mesurable (au sens de Lebesgue) par rapport à si

(E) = (E A) + (E A c )

E [0, 1] .

(1.13)

Il est clair que si A est mesurable, alors (1.12) est satisfaite. On peut en fait vérifier (exercice) que (1.13) et (1.12) sont deux définitions équi- valentes de la mesurabilité.

Dans la suite, on dénotera par M la famille des ensembles mesurables par rapport à . Pour vérifier qu’un ensemble A est mesurable, il suffit de vérifier

(1.14)

(E) (E A) + (E A c ) .

En effet, l’inégalité contraire est satisfaite par sous-additivité. Com- mençons à étudier les propriétés de M .

Lemme 1.5. M est une algèbre :

(1) M ,

(2) Si A M , alors A c M ,

(3) Si A n M pour tout n = 1,

, N , alors

N n=1 A n M .

Démonstration. Le premier point est évident. Le deuxième suit de la symétrie de (1.13) par rapport à A et A c . Soient ensuite A, B

M . Pour montrer que A B M , on utilise la sous-additivité de :

comme

(E (A B)) (E A) + (E A c B) .

E (A B) = {E A} ∪ {E (A c B)}, on a

3. LA MESURE DE LEBESGUE SUR [0, 1]

Donc, par la mesurabilité de B, puis par celle de A,

(E (A B)) + (E (A B) c )

=

(E

(E

A) +

A)

+

(E

(E

A c B) + (E

A c B) + (E

(A B) c )

A c B c )

= (EA c )

=

(E) ,

donc A B M . La troisième affirmation s’obtient par induction.

On montre ensuite que

Lemme 1.6. Si A n ∈ M ∗ (n = 1, , N ) sont
Lemme 1.6. Si A n ∈ M ∗ (n = 1,
, N ) sont disjoints, alors pour tout
E ∈ P([0, 1]) :
N
N
∗ E ∩
A n =
∗ (E ∩ A n ) .
(1.15)
n=1
n=1
En particulier, ∗ est additive sur M ∗ : si A n ∈ M ∗ (n = 1,
disjoints, alors
, N ) sont
N N
A n =
∗ (A n ) .
(1.16)
n=1
n=1

Démonstration. Pour N = 2, soient A 1 , A 2 M disjoints, et

B := A 1 A 2 . Alors par la mesurabilité de A 2 ,

(E B) = (E B A 2 ) + (E B A c )

2

=A 2

=A 1

=

(E

A 1 ) + (E A 2 ) .

On peut ensuite itérer ce procédé et obtenir (1.15), qui implique (1.16)

en prenant E = [0, 1].

Il nous reste à vérifier que ces propriétés s’étendent à des unions infinies dénombrables.

Lemme 1.7. M est une tribu :

(1) M ,

(2) Si A M , alors A c M ,

(3) Si A n M pour tout n 1, alors n1 A n M .

Démonstration. Les deux premières propriétés ont été prouvées plus haut. Pour la troisième, soient A n M , que l’on commence par

3. LA MESURE DE LEBESGUE SUR [0, 1]

supposer disjoints. Soit A := n A n et B N := nN A n M . Pour tout E,

(E) =

=

(E (E

(E

B N ) + (E B N )

B N ) + (E A n )

c

c

nN

A c ) + (E A n ) .

nN

En prenant N → ∞, et par sous-σ-additivité,

(E) (E A c ) + (E A n )

(E

n

A c ) + (E A) ,

ce qui montre que A M . Si les ensembles A n ne sont pas disjoints, on définit B 1 := A 1 , B n := A n A c ∩···∩A n1 (n 2), qui sont disjoints, et se réduit au cas précédent puisque n A n = n B n M .

1

c

Pour finir,

Lemme 1.8. La fonction d’ensemble : M [0, 1] est une mesure :

(1) () = 0,

(2) est σ-additive : si (A n ) n1 est une famille disjointe d’ensembles mesurables, alors ( n A n ) = n (A n ).

Démonstration. Soient A n M , disjoints deux-à-deux, A :=

n A n . Par sous-additivité, (A) n (A n ). Mais pour tout N , par

(A). On

additivité et monotonicité, nN (A n ) = ( nN A n ) conclut en prenant N → ∞.

Même si M est une classe d’ensembles sur laquelle la mesure extérieure est σ-additive, elle pourrait être vide ! Il est donc important de vérifier qu’elle est suffisamment riche en ensemble. En particulier, on aimerait qu’elle contienne au moins les intervalles :

Lemme 1.9. M contient les intervalles.

Démonstration. Soit par exemple A = (a, b) [0, 1] (les autres cas se traitent de façon similaire), et E [0, 1] un ensemble quelconque. Soit > 0. Alors il existe un recouvrement I = {I} de E tel que (E) I (I) . Définissons alors les intervalles ouverts I := I A, I + := I A c . Par la définition même de longueur pour les intervalles,

(I) = (I ) + (I + ) .

4. À PROPOS DE LA BIBLIOGRAPHIE

Or il est clair que {I } est un recouvrement de E A, et que {I + } est un recouvrement de E A c . Donc

I

(I) = (I ) + (I + ) (E A) + (E A c ) .

I

I

+

Donc (E) (E A) + (E A c ) .

Puisque c’est une tribu, et comme elle contient les intervalles, la classe M contient également tous les ouverts (qui sont des unions dénom- brables d’intervalles ouverts), tous les fermés (dont les complémentaires sont des ouverts), et a fortiori tous les compacts. Donc M contient, de fait, beaucoup d’ensembles. On peut donc se demander si tous les sous-ensembles de [0, 1] sont mesurables. Ce n’est pas le cas ; nous en donnerons un exemple d’ensemble non-mesurable dans la Section 6.5.

Même s’il n’existe pas de caractérisation explicite de tous les ensembles mesurables, nous voyons que tout ensemble A [0, 1] qui peut être construit est mesurable. Ici, par construit on entend construit à partir d’intervalles, par une suite d’opérations élémentaires, à savoir : unions dénombrables, intersections dénombrables, complémentaires.

Définition 1.10. La mesure extérieure , restreinte aux ensembles mesurables M , est appelée la mesure de Lebesgue sur [0, 1]. On l’écrira λ 1 .

Par construction, sur les intervalles, λ 1 coïncide avec . On verra plus tard que λ 1 est l’unique mesure ayant cette propriété.

Remarquons qu’à part dans la preuve de la consistance et du Lemme 1.9, on a assez peu utilisé les particularités de [0, 1] : la restriction de la mesure extérieure à la classe des ensembles mesurables est un procédé tout à fait général et sera réutilisé dans le Chapitre 2.

4. À propos de la bibliographie

La littérature sur la Théorie de la Mesure et de l’Intégration est vaste.

Les ouvrages les plus accessibles sont certainement le petit livre de Bartle [1], ainsi que le livre de Kolmogorov et Fomine [10]. Le livre de Tao [17], plus récent, est également recommandé.

4. À PROPOS DE LA BIBLIOGRAPHIE

Certaines références, plus complètes, sont par exemple Folland [7], Rana [14], ou le livre classique de Rudin [15]. Très précis, l’ouvrage de Gapaillard [8], ou encore celui de Bauer [2].

Comme la Théorie de la Mesure est intimement liée à la Théorie des Probabilités, ces deux théories sont souvent développées en parallèle. Les ouvrages classiques de Billingsley [3], Durrett [13] ou de Shiryaev [16] en sont un bon exemple. Une autre bonne référence est le livre de Neveu [12].

À titre de complément, on pourra également consulter l’ouvrage plus ancien de Halmos [9], le double pavé de Bogachev [4], ainsi que le livre original de Lebesgue [11], ou celui de de la Vallée Poussin [6].

Pour un texte profond, avec une approche historique particulièrement détaillée, on pourra consulter l’ouvrage de Bressoud [5].

CHAPITRE 2

Tribus et Mesures

Dans l’introduction, la recherche d’une fonction d’ensemble σ-additive sur [0, 1] a conduit à distinguer une classe M de sous-ensembles ap- pelés mesurables, formant une tribu. C’est en restreignant la mesure extérieure aux mesurables que nous avons obtenu la mesure de Le- besgue. Le triplet ([0, 1], M , ) est appelé espace mesuré.

On pourrait passer maintenant à l’intégration des fonctions f : [0, 1] R. Or la structure “(ensemble, tribu, mesure)” peut être définie sur des ensembles plus abstraits que [0, 1]. En fait, la construction de la plus grand partie de la théorie de l’intégration selon Lebesgue est basée sur les propriétés élémentaires de la mesure, essentiellement l’additivité dé- nombrable, et non sur la structure détaillée de l’ensemble sous-jacent. On a donc avantage, avant de passer à l’intégration des fonctions sur [0, 1], à développer la théorie de la mesure sur des espaces plus géné- raux.

Ceci sera fait dans le présent chapitre : nous définirons les espaces mesurés (X, F, µ) abstraits, donnerons leurs propriétés et le moyen de les construire. Dans le chapitre suivant, la théorie de l’intégration par rapport à µ sera développée en toute généralité, pour des fonctions à valeurs réelles f : X R. Cette théorie contiendra l’intégration des fonctions f : [0, 1] R par rapport à la mesure de Lebesgue comme cas particulier.

1. Tribus

Soit X un ensemble. Comme précédemment, nous noterons P(X) la famille des parties A X. On suppose toujours que P(X). Le complémentaire d’un ensemble A P(X) s’écrira A c := X\A.

19

1. TRIBUS

Définition 2.1. Une famille de sous ensembles de X, F P(X), est une tribu a si elle satisfait aux conditions suivantes.

(1) F.

 

(2) Si A F, alors A c F.

(3) Si A n F pour tout n, alors n A n F.

Les éléments de F sont appelés ensembles mesurables, et la paire (X, F) est appelée espace mesurable b .

Dans la littérature, on trouve aussi σ-algèbre, ou σ-algèbre de Boole. En an- glais : σ-field, σ-algebra.

a.

b.

On peut interpréter cette terminologie en sachant que les ensembles mesu-

rables sont ceux auxquels on pourra associer une mesure. Une tribu peut donc être

considérée comme le domaine d’une mesure.

Observons que (1) et (2) impliquent que X F. De plus, par (2) et (3), n A n = ( n A n ) c F. Donc une tribu est une famille d’ensembles qui contient X, et qui est stable sous complémentaires, sous unions dé- nombrables et sous intersections dénombrables.

c

La tribu la plus simple sur un ensemble X est la famille F := {, X}, appelée tribu triviale. Ensuite, si E X est non-vide et différent de X, alors F := {, X, E, E c } est aussi une tribu, contenant quatre en- sembles mesurables.

En général, une tribu contient “beaucoup” d’ensembles. Il est clair que la tribu la plus riche en sous-ensembles de X est celle qui contient tous les sous-ensembles : F := P(X), appelée tribu discrète. Cette tribu est utilisée en général quand X est fini ou dénombrable, par exemple quand X = N. Mais quand X n’est pas dénombrable, la tribu discrète contient trop d’ensembles et n’est en général pas utilisable 1 .

Exemple 2.2. La famille F contenant les sous-ensembles E X tels que ou E est dénombrable, ou E c est dénombrable, est une tribu (exer- cice).

Dans la pratique, on a souvent besoin qu’une tribu contienne certains ensembles particuliers. Sur les réels par exemple, il est naturel de vouloir une tribu qui contienne les intervalles, et on peut se poser la question :

sur X = R, quelle est la plus petite tribu qui contient les intervalles ? Il existe un procédé simple permettant de ré