Vous êtes sur la page 1sur 373

Int

egration et Analyse de Fourier


Cours de premi`
ere ann
ee
donn
e`
a lEcole normale sup
erieure de Lyon
ann
ee universitaire 2005-2006

C
edric Villani
Unite de Mathematiques Pures et Appliquees

Ecole
normale superieure de Lyon
46 allee dItalie
69364 Lyon Cedex 07
cvillani@umpa.ens-lyon.fr

Table des mati`


eres
Avant-Propos

Bibliographie

Notations et conventions

13

Introduction : Motivations de lintegrale de Lebesgue

15

CHAPITRE I. Theorie abstraite de la mesure


I-1. Espaces mesures
I-2. Rappels de topologie
I-3. Regularite des espaces mesures
I-4. Prolongement de mesures
I-5. Completion de mesures
I-6. Application : Construction de la mesure de Lebesgue
I-7. Complement : Recouvrement et remplissage

19
19
29
40
47
59
60
61

CHAPITRE II. Integration selon Lebesgue et selon Riesz


II-1. Fonctions mesurables
II-2. Construction de lintegrale
II-3. Lintegrale est une forme lineaire positive
II-4. Le theor`eme de Riesz
II-5. Integration `a valeurs vectorielles

67
67
74
80
83
91

CHAPITRE III. Theor`emes fondamentaux dintegration


III-1. Comportement face aux limites
III-2. Integration sur les espaces produits
III-3. Changement de variable
III-4. Inegalites integrales elementaires

III-5. Equi-int
egrabilite et tension
III-6. Produits infinis
Appendice : Rappels sur les fonctions convexes

95
95
110
121
124
133
137
148

CHAPITRE IV. La mesure de Lebesgue


IV-1. Construction de la mesure de Lebesgue
IV-2. Proprietes fondamentales de la mesure de Lebesgue
IV-3. Lintegrale de Lebesgue generalise lintegrale de Riemann
IV-4. R`egles de calcul associees `a lintegrale de Lebesgue
IV-5. Mesurabilite, non-mesurabilite, et paradoxes de BanachTarski

151
151
154
161
164
170

CHAPITRE V. Les mesures de Hausdorff


V-1. Motivations
V-2. Construction des mesures de Hausdorff

179
179
182

`
TABLE DES MATIERES

(13 juin 2010)

V-3. Identification des mesures de Hausdorff


V-4. Dimension
V-5. Utilisation dans les changements de variables

188
195
201

CHAPITRE VI. Espaces de Lebesgue et mesures signees


VI-1. Espaces Lp de Lebesgue
VI-2. Inegalites et relations entre espaces de Lebesgue
VI-3. Espace des fonctions mesurables
VI-4. Espaces de mesures

203
203
212
224
228

` COMPLETER

CHAPITRE VII. Analyse de Banach - A


VII-1. La completude et ses consequences
VII-2. Regularite des espaces de Banach
VII-3. Projection
VII-4. Dualite
VII-5. Convergence et compacite
VII-6. Integration au sens faible
VII-7. Convexite
VII-8. Retour sur les espaces de Hilbert

243
243
254
270
274
286
314
316
327

` REDIGER

CHAPITRE VIII. Analyse sur les groupes abeliens - A

331

` REDIGER

CHAPITRE IX. Fonction maximale de HardyLittlewood - A

333

CHAPITRE X. Desintegration
X-1. Theor`eme de LebesgueRadonNikodym
X-2. Desintegration
X-3. Desintegration constructive
X-4. Derivation des fonctions absolument continues
X-5. Decomposition des mesures dune infinite de variables

335
335
339
351
351
351

` COMPLETER

CHAPITRE XI. Analyse de Fourier A


XI-1. Theorie de Fourier
XI-2. Fourier calculateur : deux lois fondamentales des probabilites
de la Terre
XI-3. Fourier physicien : lAge
XI-4. Fourier analyste : regularite

353
353
361
369
373

Avant-Propos
Ce cours constitue une introduction `a deux outils fondamentaux de lanalyse :
dune part, la theorie de la mesure et de lintegration, telle quelle a ete developpee
au vingti`eme si`ecle `a partir des idees de Borel et Lebesgue ; dautre part, lanalyse de
Fourier. Ces deux sujets sont tr`es lies, ne serait-ce que pour des raisons historiques.
En redigeant ces notes, jai adopte les principes suivants.
Ce cours nest pas un ouvrage de reference. La bibliographie est volontairement
reduite `a un petit nombre douvrages ceux que jutilise moi-meme reguli`erement.
Pour autant, les perspectives historiques ne seront pas compl`etement negligees,
et seront souvent bri`evement evoquees au moment de lintroduction des nouveaux
concepts. Jai egalement tache de motiver lintroduction de lintegrale de Lebesgue,
et explique en detail pourquoi elle generalise celle de Riemann. Outre linteret historique de cette question, il ma semble quelle etait importante pour les etudiants,
qui ont presque tous commence la theorie de lintegration par lintegrale de Riemann ; et pour les applications pratiques, puisque cest presque toujours lintegrale
de Riemann ou ses variantes que lon utilise pour effectuer des calculs numeriques
dintegrales.
Les liens entre theorie de la mesure et theorie des probabilites dune part, logique
axiomatique dautre part, seront esquisses, mais ces sujets ne seront pas developpes.
En particulier, ce cours ne contient pas dintroduction `a la theorie des probabilites.
Dans mon opinion, une telle introduction devrait se concentrer sur le developpement
de lintuition probabiliste, au detriment de loutil technique que constitue la theorie
de la mesure ; en corollaire, il ma semble naturel dincorporer `a ce cours les principaux resultats de theorie de la mesure qui sont utiles en probabilites (y compris
des resultats assez subtils tels que les theor`emes dexistence de Kolmogorov et de
Ionescu Tulcea, ou la loi du 0-1 de Hewitt et Savage).
Le choix du cadre general dans lequel developper la theorie de la mesure abstraite
nest pas anodin. Traditionnellement, les ouvrages `a tendance probabiliste (comme
ceux de Billingsley) insistent sur la theorie des probabilites dans les espaces polonais
(metriques separables complets), tandis que ceux qui sont plus centres sur lanalyse
fonctionnelle, tout en recherchant une grande generalite, pref`erent le cadre localement compact, non necessairement metrique (cest le cas des ouvrages de Rudin,
Halmos, Bourbaki, etc.). Ce dernier point de vue parat aujourdhui difficile `a soutenir, etant donne le tr`es faible nombre de personnes interessees `a faire de lintegration
dans des espaces localement compacts non Polonais, en regard de la quantite prodigieuse de personnes (dont beaucoup de non-mathematiciens) qui utilisent la theorie
de la mesure et de lintegration dans des espaces polonais non localement compacts
tels que lespace de Wiener.

AVANT-PROPOS

(13 juin 2010)

Cest donc le point de vue des espaces polonais qui est ici developpe prioritairement, et en particulier toutes les preuves seront effectuees dans un cadre metrique.
Jai cependant conserve les hypoth`eses de compacite locale, non necessairement
metrique, dans les enonces o`
u elles semblent naturelles, en particulier le theor`eme
de Riesz. Les rappels necessaires de topologie generale (lemme dUrysohn, theor`eme
de Tychonov) sont donc enonces sans demonstration dans leur version generale,
et demontres dans le cadre metrique. Jai tente par l`a de satisfaire `a la fois les
lecteurs novices qui auront ainsi acc`es `a des demonstrations compl`etes dans un
cadre metrique separable, sans avoir jamais `a manipuler de topologie abstraite ; et
les lecteurs amateurs de topologie, qui pourront facilement reconstituer les preuves
denonces plus abstraits.
On presente assez souvent la completion de la tribu borelienne comme une
operation agreable et peu co
uteuse. Il ne me semble pas clair que cette operation
permette de gagner beaucoup, sinon quelques mots de justification supplementaires
ici ou l`a ; en revanche je suis convaincu quelle apporte des complications inutiles
dans letude de certaines questions naturelles, par exemple sur des sujets tels que le
rearrangement de fonctions. Il est significatif que dans le recent ouvrage danalyse de
Lieb et Loss, seule la tribu borelienne soit utilisee, et ce, sans que les demonstrations
en souffrent aucunement. Jai donc presente au lecteur la completion omme une
operation dont il faut se mefier pour ma part, je ne lutilise pas.
Letude des espaces de Lebesgue est loccasion de developper une introduction
elementaire mais assez compl`ete `a lanalyse fonctionnelle (chapitre VII). En ecrivant
cette partie, par souci de rendre les preuves plus intuitives et plus constructives,
jai soigneusement evite tout recours `a des structures topologiques abstraites (on y
consid`ere uniquement des espaces de Banach), et jai systematiquement utilise des
hypoth`eses de separabilite ou de denombrabilite, quand le besoin sen fait sentir,
pour eviter laxiome du choix. Cest ainsi que le theor`eme de Hahn-Banach nest
demontre que dans le cadre restreint des espaces vectoriels normes separables.
On pourra voir dans ce choix une regression : par endroits, la presentation dans ce
chapitre a plus de points communs avec le traitement originel de Banach, dans les
annees 1930, quavec la theorie des espaces vectoriels topologiques developpee dans
les annees 1950 et 1960.
De meme, pour ce qui est de lanalyse harmonique sur des groupes localement
compacts, jai choisi de presenter des demonstrations compl`etes des enonces les plus
importants (Theor`eme de Haar, dualite de Pontryagin, etc.) mais uniquement dans
le cas de groupes qui, en plus detre localement compacts, sont metrisables et compacts. Ce choix diminue bien s
ur la generalite des enonces demontres, mais il est
suffisant pour traiter la quasi-totalite des groupes que lon rencontre en pratique,
avec des preuves parfois nettement simplifiees.
En ce qui concerne le plan des notes, voici les quelques autres points qui me
paraissent notables.
Les questions de regularite des mesures sont abordees d`es le premier chapitre,
et plus generalement diverses proprietes faisant intervenir topologie et theorie de la
mesure en meme temps. Des theor`emes dextension `a la Caratheodory sont presentes
dans la foulee. Jai pris soin denoncer une version du theor`eme de Caratheodory qui
soit suffisamment generale pour pouvoir etre utilisee dans le theor`eme dexistence de

AVANT-PROPOS

la mesure produit, dans celui de lexistence de la mesure de Lebesgue, mais aussi dans
le theor`eme de representation de Riesz (dont la demonstration classique reprend
certains elements de la demonstration du theor`eme de Caratheodory).
La linearite de lintegrale de Lebesgue est dhabitude etablie comme corollaire
du theor`eme de convergence monotone ; cette approche est economique, mais a linconvenient pedagogique de commencer `a traiter des proprietes de lintegrale par
passage `a la limite, avant de parler de la propriete plus fondamentale (au cahier des
charges de toute notion dintegrale !) de linearite. Jai donc dans un premier temps
etabli la linearite par un argument qui copie la preuve du theor`eme de convergence
monotone, et juste apr`es jai fait le lien avec lapproche de Riesz, basee sur les formes
lineaires. La discussion du theor`eme de convergence monotone est reprise par la suite,
dans un chapitre independant consacre aux proprietes de lintegrale.
Une place importante a ete accordee au theor`eme dEgorov, qui en pratique
se rev`ele souvent plus maniable que le theor`eme de convergence dominee. Pour
faire sentir la puissance de ce theor`eme, jai indique comment on peut lutiliser
pour demontrer le theor`eme de convergence dominee. En fait on pourrait choisir le
theor`eme dEgorov comme point de depart de la theorie des passages `a la limite ;
mais il est sans doute plus naturel de reserver ce role au theor`eme de convergence
monotone, pour son analogie formelle avec la propriete dadditivite denombrable.
Letude des tribus et mesures produits (dans le cadre dun produit fini ou infini)
aurait pu etre exposee d`es le debut du cours, puisque le concept dintegrale nest pas,
strictement parlant, necessaire `a leur introduction. Cependant, jai suivi lusage qui
consiste `a ne pas separer cette etude du theor`eme de Fubini ; en outre la construction
est facilitee par le concept de fonction mesurable. Pour compenser ce defaut de
plan, jai annonce d`es le premier chapitre le resultat dexistence de mesure produit,
apr`es le theor`eme de Caratheodory, et jen ai donne une demonstration dans un
cas particulier. Jai egalement annonce le theor`eme dexistence de Kolmogorov `a cet
endroit.
Lintroduction de la mesure de Lebesgue est loccasion dune discussion assez
precise sur la mesurabilite et la non-mesurabilite, en rapport avec les paradoxes de
Banach-Tarski. Le lecteur y est encourage `a se mefier de laxiome du choix, ou meme
`a ne pas lutiliser du tout. Toute lanalyse classique peut se construire sans la forme
forte de laxiome du choix.
Les mesures de Hausdorff sont absentes de la plupart des traites introductifs
(`a lexception notable de celui de Billingsley) ; ce sujet est dhabitude reserve `a un
public plus averti. En raison de limportance de ce concept dans de nombreuses
branches des mathematiques, et de la popularite du concept de mesure fractale ou
de dimension fractale, il ma semble quon ne devrait pas sen passer, meme dans un
ouvrage dintroduction.
Luniforme convexite des espaces de Lebesgue Lp (p > 1) est demontree `a partir des inegalites de Hanner plutot que des inegalites de Clarkson ; on obtient ainsi
des estimations essentiellement optimales du module de convexite. On propose au
passage une demonstration tr`es simple des inegalites de Hanner, basee sur une application directe de linegalite de Jensen.
Dans le chapitre danalyse fonctionnelle, jai inclus des enonces de compacite
dont je sais par experience quils sont tr`es precieux dans certains probl`emes danalyse, mais dont la demonstration est souvent difficile `a trouver dans les ouvrages de

AVANT-PROPOS

(13 juin 2010)

reference : en particulier, le theor`eme de compacite de Dunford-Pettis, et celui de


Schur.
Le Chapitre ?? traite aussi bien du Theor`eme de RadonNikodym (bien represente
dans les ouvrages de reference) que du probl`eme plus general de la desintegration
de la mesure, dordinaire reserve aux ouvrages probabilistes un peu avances. Jai
adopte des conventions selon lesquelles la representation de RadonNikodym apparat vraiment comme un cas particulier de la notion de desintegration ; je fais
cependant le lien avec dautres notions plus generales de desintegration. Ce chapitre
continue avec des enonces de reconstruction de la densite de RadonNikodym dans
des espaces localement compacts ; jy presente aussi bien le theor`eme classique de
densite de Lebesgue (reconstruction ponctuelle) que des enonces leg`erement moins
precis mais plus simples de reconstruction L1 .
Le Chapitre XI adopte un style different des precedents : moins axe sur la rigueur
et la generalite, il tente de donner une intuition des applications de lanalyse de
Fourier dans des probl`emes divers issus de differents champs scientifiques.
Je remercie ceux qui mont aide `a la redaction de ces notes par des commentaires, rectifications et aides ponctuelles, en particulier Luigi Ambrosio, Guillaume

Aubrun, Ham Brezis, Nassif Ghoussoub, Etienne


Ghys, Francois Japiot, Sebastien
Martineau, Quentin Merigot, Jean-Claude Sikorav.

Bibliographie
Les textes suivants sont particuli`erement recommandes pour approfondir ce cours.
Cours concis :
Le cours de lEcole Polytechnique de J.-M. Bony, Integration et analyse hilbertienne (edition 2001), constitue un excellent expose, concis et clair.
Le cours dA. Gramain, Integration (Hermann, Paris, 1988) est agreable `a lire
et contient egalement des rappels sur lintegrale de Riemann.
Cours plus d
etaill
es sur lint
egration :
Le grand classique est sans conteste louvrage de W. Rudin, Real and Complex
Analysis (McGrawHill, New York, 1987, 3e edition), qui est egalement une reference
precieuse pour lanalyse complexe.
Un expose clair et precis de la theorie de lintegration et de methodes danalyse
reelle en general se trouve dans les premiers chapitres du livre de G. Folland, Real
analysis, (Wiley, New York, 1999, 2e edition).
Louvrage recent de E. Lieb et M. Loss, Analysis (American Mathematical Society, Providence, 2001, 2e edition) est clair, pedagogique et original ; ses chapitres 1
`a 5 constituent une ouverture vivement recommandee.
Une introduction `a la theorie de la mesure peut aussi se trouver dans de nombreux
ouvrages de theorie des probabilites, tels celui de P. Billingsley, Probability and
Measure (Wiley, New York, 1979) ; et dans des ouvrages traitant de sujets lies `a
la theorie de la mesure geometrique. Parmi ces derniers, on recommande la belle
synth`ese exposee au debut de louvrage de recherche de L. Ambrosio, N. Fusco et
D. Pallara, Functions of bounded variation and free discontinuity problems (Oxford
University Press, Oxford, 2000).
Compl
ements sur lanalyse de Fourier :
Deux ouvrages classiques proposent de nombreux developpements de lanalyse
de Fourier, dans des domaines tr`es divers des mathematiques :
Fourier series and integrals, de H. Dym et H.P. McKean (Academic Press,
Boston, 1972), particuli`erement interessant pour les liens avec la theorie des groupes
et lanalyse complexe ;
Fourier analysis, de T.W. K
orner (Cambridge University Press, Cambridge,
1993, 5e edition), un livre merveilleux qui se lit comme un roman ou presque.
Perspectives historiques :

10

BIBLIOGRAPHIE

(13 juin 2010)

Louvrage passionnant de J.-P. Kahane et P.G. Lemari


e-Rieusset, Series de
Fourier et ondelettes (Nouvelle Biblioth`eque Mathematique, Cassini, Paris, 1998),
joue un double role en relation avec ce cours. Dune part, la contribution de Kahane est une remarquable synth`ese de lhistoire des series de Fourier, depuis leur
creation jusqu`a la theorie moderne, en relation avec les progr`es de lintegration. On
y assistera en passant `a la naissance de la theorie des ensembles, developpee par
Cantor pour resoudre des probl`emes de regularite de series enti`eres ! Dautre part, la
contribution de Lemarie-Rieusset presentera lhistoire des ondelettes et leur theorie
moderne.
Louvrage de reference en ce qui concerne la naissance et le developpement
de lintegrale de Lebesgue, et des theories concurrentes, est le magistral traite de
T. Hawkins, Lebesgues theory of integration (Chelsea Publishing Company, The
Bronx, 1970).
Le Cours de H. Lebesgue lui-meme `a lAcademie des Sciences en 1903-1904,
Lecons sur lintegration (deuxi`eme edition Gauthiers-Villars, Paris, 1950) est toujours interessant `a parcourir ! Sa Note aux Comptes Rendus de lAcademie des
Sciences, Sur une generalisation de lintegrale definie, datee du 29 avril 1901, peut
etre consideree comme lacte de naissance de la theorie moderne de lintegration.
Autres ouvrages de r
ef
erence :
Un ouvrage methodique et concis sur lintegration dans Rn et letude fine des
fonctions (derivabilite, etc.) est le traite de L.C. Evans et R. Gariepy, Measure
theory and fine properties of functions, CRC Press, Boca Raton, 1992) ; cet ouvrage
contient presque tous les outils de theorie de la mesure dont se servent les analystes
qui travaillent dans Rn .
Louvrage passionnant de S. Wagon, The Banach-Tarski Paradox (Cambridge
University Press, 1993, 3e edition) fait le point sur les paradoxes et les interrogations
axiomatiques lies `a la mesurabilite et `a la non-mesurabilite, du type de celui de
Banach-Tarski.
Les ouvrages de K. Falconer, The Geometry of fractal sets (Cambridge University Press, 1985) et Fractal Geometry (Wiley, 1989) constituent une excellente
reference sur les mesures et la dimension de Hausdorff (les resultats principaux en
sont repris dans le livre dEvans et Gariepy dej`a mentionne) et leurs applications `a
letude des objets fractals. Le deuxi`eme de ces ouvrages, ecrit pour un public nonspecialiste, contient de nombreuses images de courbes fractales et une excellente
synth`ese sur leur apparition dans divers domaines des mathematiques, de la physique et de la modelisation. Sur ce sujet on pourra egalement consulter louvrage
cel`ebre de B. Mandelbrot, Les objets fractals (...).
Un ouvrage tr`es complet, `a consulter uniquement en cas de recherche sur un
sujet precis : Real Analysis and Probability, de R.M. Dudley (Cambridge University Press, 2002, 2e edition). On y trouve egalement de nombreux commentaires
historiques et bibliographiques. Un autre livre de reference sur les liens entre theorie
de la mesure, analyse fonctionnelle et topologie est la somme de N. Dunford et
J.T. Schwartz, Linear Operators (Interscience Publishers Inc., New York, 1958).
Le livre de J.C. Oxtoby, Measure and Category (A survey of the analogies between topological and measure spaces) (Springer-Verlag, New York, 1980, 2e edition)

BIBLIOGRAPHIE

11

etudie en profondeur le parall`ele entre la theorie de la mesure et la theorie de la


categorie de Baire ; son propos est illustre par de nombreux exemples et contreexemples amusants, quelque peu academiques cependant.
La bible de la theorie geometrique de la mesure est louvrage de H. Federer,
Geometric Measure Theory (Grundlehren der mathematischen Wissenschaft 153,
Springer, Berlin, 1969). Cet ouvrage comprend un expose de la theorie abstraite de
la mesure, et une etude assez systematique des mesures de Hausdorff. Son format
imposant et son caract`ere exhaustif en font une reference peu commode, `a ne consulter quen cas de besoin. Le livre dEvans et Gariepy, dej`a mentionne, contient un
readers digest de cet ouvrage.
Le traite de reference classique sur les fonctions convexes dans Rn est louvrage
de R.T. Rockafellar, Convex Analysis (Princeton University, 1997 ; reproduction
de ledition de 1970).
Pour en savoir plus sur la theorie des probabilites dans des espaces metriques
(en particulier Polonais), on pourra consulter, outre louvrage de Dudley dej`a mentionne, le livre de P. Billingsley, Weak Convergence of Measures : Applications in
Probability (Society for Industrial and Applied Mathematics, Philadelphia, 1971),
ou celui de K.R. Parthasarathy, Probability Measures on Metric Spaces (Academic Press, New York, 1967). Il est egalement recommande de parcourir la synth`ese
claire et concise que lon trouve dans lAppendice D de louvrage de A. Dembo et
O. Zeitouni, Large Deviations techniques and applications (Springer, New York,
1998, 2e edition) ; lAppendice A y fait egalement des rappels de topologie.
Les bases de lanalyse dans les espaces de Banach se trouvent dans de nombreux
ouvrages populaires et pedagogiques, par exemple celui de H. Br
ezis, Analyse fonctionnelle, Theorie et applications (Troisi`eme Tirage, Masson, Paris, 1992), ou celui
de W. Rudin dej`a cite (un autre ouvrage du meme auteur, Functional Analysis
(McGraw-Hill, New York, 1991, 2e edition) nest pas recommande au lecteur non
averti, du fait de son caract`ere general et abstrait). On pourra regretter limportance
accordee par ces auteurs `a laxiome du choix et `a ses avatars. Citons egalement
le gros traite de reference de N. Dunford et J.T. Schwartz, Linear Operators
(Interscience Publishers Inc., New York, 1958), et le livre dEdwards, Functional
Analysis, Theory and Applications (Holt, Rinehart and Winston, New York, 1965),
qui presente une mine dinformations sans tomber dans labstraction `a outrance.
Les proprietes topologiques de lespace des mesures de Radon sont evoquees
dans de nombreux ouvrages traitant de la theorie des distributions, ne serait-ce que
louvrage fondateur de L. Schwartz, Theorie des distributions (Hermann, Paris,
1966).
La theorie des mesures de Haar est lobjet du livre de L. Nachbin, The Haar
Integral (University Series in Higher Mathematics, Van Nostrand, Princeton, 1965),
autocontenu et agreable. Pour des exposes plus complets sur lanalyse harmonique
dans les groupes localement compacts (mesure de Haar, convolution, transformee de
Fourier, theorie des representations, etc.), on pourra consulter L.H. Loomis, An
introduction to abstract harmonic analysis (Van Nostrand, New York, 1953), E. Hewitt et K.A. Ross, Abstract Harmonic Analysis (Springer-Verlag, Berlin, 1963)
et surtout louvrage plus recent de G.B. Folland, A course in abstract harmonic
analysis (CRC Press, Boca Raton, 1995), synthetique et precis. Tous ces ouvrages

12

BIBLIOGRAPHIE

(13 juin 2010)

utilisent des hypoth`eses tr`es generales, qui rendent lexpose quelque peu abstrait et
les demonstrations parfois delicates.
Mon traitement de la desintegration de la mesure est inspire de celui du traite de
Dudley, dej`a mentionne ; on pourra trouver une approche differente dans Dellacherie
Meyer (.....) ou StroockVaradhan (Section 1.1) (....). Pour le probl`eme de la reconstruction dans Rn , louvrage dEvansGariepy dej`a mentionne va plus loin puisquil traite les mesures non doublantes par le lemme de recouvrement de Besicovich
(cette approche est propre `a lespace Rn ).
Le livre dEvansGariepy pourra egalement etre consultee pour les theor`emes
plus avances de differentiation presque partout (theor`eme de Rademacher, theor`eme
dAlexandrov) ; je recommande cependant le traitement applique dans mon propre
ouvrage Optimal transport, old and new (Theor`emes 10.8 et Premier Appendice du
Chapitre 14), o`
u je me suis efforce de presenter les differents resultats dune mani`ere
aussi coherente que possible.
Dans le cours du texte, je ferai systematiquement reference `a ces textes plutot
quaux ouvrages et articles originaux. Je ferai une exception pour larticle suivant, qui
contient de nombreuses remarques et references que lon ne rencontre pas sous forme
de livre : K. Ball, E. Carlen et E. Lieb, Sharp uniform convexity and smoothness
inequalities for trace norms, Invent. Math. 115 (1994), 463482 (Sections I et II).
Je designerai toutes ces references par le nom de leur auteur, suivi le cas echeant
dun numero : par exemple [Falconer1], [Falconer2] pour designer les deux ouvrages
de Falconer mentionnes plus haut (la numerotation suit lordre dapparition dans le
texte ci-dessus).

Notations et conventions
Outre des notations tr`es classiques, jutiliserai les conventions suivantes :
Logique et axiomatique :
A \ B : complementaire de B dans A
P(X) : ensemble des parties de X
1A : fonction indicatrice de A ; 1A (x) = 1 si x A, 0 si x
/A
Ensembles :
N : lensemble des nombres entiers naturels non nuls : N = {1, 2, 3, . . .}
Z : lensemble des entiers positifs ou negatifs
R : lensemble des nombres reels
C : lensemble des nombres complexes
ensemble denombrable = ensemble fini ou en bijection avec N
Calculs dans Rn :
hx, yi : produit scalaire de x et y
|x| : norme euclidienne du vecteur x (valeur absolue si n = 1)
Fonctions :
f+ : partie positive de f , i.e. max(f, 0)
f : partie negative de f , i.e. max(f, 0)
Topologie :
A : fermeture topologique de A
Int(A) : interieur topologique de A
Br (x) = B(x, r) : boule ouverte de centre x, de rayon r
Br] (x) = B(x, r]) : boule fermee de centre x, de rayon r
d(x, A) : distance de x `a A, i.e. inf{d(x, y); y A}
Notations de th
eorie de la mesure :

: mesure exterieure associee `a la fonction densembles


(F ) : tribu engendree par F
f# A : tribu image de A par f
f# : mesure image de par f
A B : tribu produit des tribus A et B
: mesure produit (tensoriel) des mesures et
C(A1 , . . . , AN ) : cylindre de base A1 , . . . , AN
Si est une mesure definie sur R, jabr`egerai souvent [[a, b]] en [a, b], [[a, b[]
en [a, b[, etc.
Convexit
e:
: transformee de Legendre de la fonction

14

NOTATIONS

(13 juin 2010)

p : exposant conjugue de p : p = p/(p 1)


Espaces fonctionnels :
C(X, R) = C(X) : espace des fonctions continues de X dans R
Cb (X, R) = Cb (X) : espace des fonctions continues bornees
C0 (X, R) = C0 (X) : espace des fonctions continues tendant vers 0 `a linfini
Cc (X, R) = Cc (X) : espace des fonctions continues `a support compact
Lp (X, d) : espace de Lebesgue des fonctions p-sommables sur (X, )
kf k : supremum essentiel de |f |
Calcul diff
erentiel :
T : matrice Jacobienne de T : Rn Rm (gradient de T si m = 1)
2 f : matrice Hessienne de f
f : Laplacien de f (trace de 2 f )
le lecteur = le lecteur ou la lectrice

Introduction : Motivations de lint


egrale de Lebesgue
` la fin du dix-neuvi`eme si`ecle, les limitations de la theorie dintegration de
A
Riemann deviennent apparentes et plusieurs mathematiciens cel`ebres (Jordan, Borel,
Young, ...) se mettent en devoir de la generaliser. Cest finalement la theorie de
Lebesgue, exposee dans une note fondatrice de 1901, puis developpee dans le Cours
Peccot, qui sera adoptee par lensemble de la communaute mathematique. Elle se
developpe `a partir du concept de mesure, introduit par Borel vers 1895.
La theorie de la mesure et lintegration de Lebesgue seront ensuite perfectionnees
et generalisees par de nombreux mathematiciens au cours du vingti`eme si`ecle, en particulier (par ordre chronologique approximatif) Caratheodory, Vitali, Radon, Riesz,
Hausdorff, Kolmogorov et Besicovich. Lhistoire de la theorie de la mesure est associee au developpement de la theorie des probabilites, `a celui de lanalyse harmonique moderne et meme `a celui de la logique axiomatique.
Avant dentrer dans le vif du sujet, je vais passer en revue certaines des caracteristiques les plus notables de lintegrale de Lebesgue, par comparaison avec
dautres theories de lintegration.

Elargissement
de la classe des fonctions int
egrables
Le cadre classique le plus simple pour definir une integrale est celui des fonctions en escalier sur un intervalle [a, b], ou sa completion pour la topologie de la
convergence uniforme, lespace des fonctions reglees (admettant une limite finie `a
droite et `a gauche). La theorie de Riemann permet datteindre une plus grande
generalite. Cependant, Riemann lui-meme a conscience que lintegrabilite au sens
de Riemann impose encore des conditions relativement fortes : il demontre quune
fonction f : [a, b] R est integrable si et seulement si, pour tout > 0 donne, on
peut choisir une decomposition de [a, b] en sous-intervalles suffisamment fins pour
que la somme des longueurs des sous-intervalles sur lesquels loscillation de la fonction depasse soit arbitrairement petite [Kahane, p. 64].
Plus tard, Lebesgue montrera quune fonction f : [a, b] R est Riemannintegrable si et seulement si lensemble de ses points de discontinuite est de mesure nulle, au sens o`
u on peut linclure dans une union dintervalles ouverts dont la
somme des longueurs est arbitrairement petite.
Ces conditions peuvent sembler assez faibles, puisquelles autorisent par exemple
une fonction qui ne serait discontinue quen une quantite denombrable de points.
Mais il est facile de construire des fonctions bornees naturelles ne remplissant pas
ces conditions : le contre-exemple qui vient tout de suite `a lesprit est la fonction
indicatrice de Q, ou sa restriction `a un segment. Dans de nombreux probl`emes
danalyse, on rencontre des fonctions qui ne sont pas forcement Riemann-integrables.
Dans la theorie de Lebesgue, la classe des fonctions integrables est beaucoup plus
grande. Par exemple, toute fonction bornee raisonnable (en gros, que lon peut

16

INTRODUCTION

(13 juin 2010)

decrire par un enonce mathematique) est Lebesgue-integrable. En outre, sa theorie


generalise bien celle de Riemann.
Solution du probl`
eme des primitives
Cest par ce probl`eme que Lebesgue motive sa construction dans sa note de 1901.
Lintegrale de Riemann permet dintegrer des fonctions discontinues, mais ne permet
pas dintegrer nimporte quelle fonction derivee, meme bornee ! Si donc f est une
fonction continue sur [a, b] et derivable sur ]a, b[, il nest pas garanti que lidentite
Z b
(1)
f (b) f (a) =
f (t) dt
a

ait un sens. En fait, au debut du si`ecle, divers auteurs (Volterra, Kopcke, Broden,
Schoenflies) construisent des classes de fonctions derivables, dont la derivee est
bornee mais non Riemann-integrable [Hawkins, pp. 57 et 108-110].
Au contraire, dans la theorie de Lebesgue, la derivation et lintegration deviennent des operations inverses, sous des hypoth`eses simples. Cest ainsi que lidentite (1) est automatiquement verifiee d`es que f est continue sur [a, b] et derivable
sur ]a, b[, de derivee bornee.

Bon comportement face aux limites


Peut-on echanger les operations limite et integrale ? Cest un probl`eme classique,
source de milliers dexercices dans le cadre de lintegrale de Riemann. On ne peut
meme pas y formuler le probl`eme de mani`ere suffisamment generale, car une limite
de fonctions Riemann-integrables nest pas forcement Riemann-integrable, meme si
ces fonctions sont uniformement bornees. Pour sen convaincre, on peut noter que
la fonction indicatrice de [0, 1] Q, non integrable au sens de Riemann, est limite
de limites de fonctions continues puisque
1Q (x) = lim lim [cos(2n!x)]m .
n m

Au contraire, Lebesgue parvient `a definir un concept de fonctions integrables


qui est stable par passage `a la limite dans de nombreuses situations, et pour lequel
lechange integrale-limite est presque automatique, sous des hypoth`eses simples et
faciles `a verifier. Ce bon comportement par rapport aux limites trouve un interet
meme dans le cadre des fonctions Riemann-integrables ! Pour sen convaincre, on
pourra mediter sur lexercice suivant :
Soit (fn )nN une suite de fonctions continues [a, b] [0, 1], convergeant (poncRb
tuellement) vers 0. Alors a fn 0.

Cet enonce a bien s


ur un sens dans le cadre de lintegrale de Riemann, pourtant
sa demonstration au moyen doutils classiques est delicate (lhypoth`ese naturelle
dans cette theorie est la convergence uniforme et non la convergence simple) ; alors
que la theorie de Lebesgue resout le probl`eme sans douleur !
Mauvais traitement des compensations
Pour puissante quelle soit, la theorie de Lebesgue est impuissante `a traiter la
semi-convergence des integrales, cest-`a-dire les situations o`
u une fonction f se
trouve etre integrable du fait de compensations entre valeurs positives et negatives,
alors que sa valeur absolue |f | nest pas integrable. Dautres theories sont plus habiles
`a tirer parti des compensations : ainsi les integrales M (integrale de Denjoy-Perron)
ou M 2 presentees dans [Zygmund, T.2, pp.8391].

INTRODUCTION

17

Pourquoi alors nenseigne-t-on pas ces theories alternatives plutot que celle de
Lebesgue ? Dune part, parce que dans limmense majorite des applications, le mauvais traitement des integrales semi-convergentes sav`ere sans gravite (il sagit en fait
de situations relativement exceptionnelles) ; dautre part, parce que la theorie de
Lebesgue dispose dune grande souplesse qui lui permet de se generaliser de mani`ere
abstraite, comme il est explique ci-apr`es.
Insensibilit
e`
a la topologie
Dans lintegrale de Riemann, un role particulier est joue par les proprietes de
regularite, en un sens tr`es lache, des fonctions que lon veut integrer (variation
importante au voisinage dun point...) On a dej`a mentionne, par exemple, des crit`eres
dintegrabilite faisant intervenir lensemble lensemble des points de discontinuite.
La topologie de lespace de definition des fonctions (en loccurrence la droite reelle)
intervient donc. Cela se refl`ete sur les generalisations abstraites : pour adapter la
construction de Riemann `a des espaces plus generaux, on est tout de suite amene `a
faire des hypoth`eses de nature topologique assez fortes. (Ce constat vaut aussi pour
les integrales de Denjoy-Perron ou M 2 .)
Au contraire, comme le comprit Radon vers 1913, lintegrale construite par Lebesgue peut etre adaptee `a un cadre extremement general, sans quaucune hypoth`ese
topologique ne soit faite sur lespace dintegration, et lexperience montre que lon
peut construire ainsi des theories maniables. Le cas echeant, cet espace pourra meme
etre un espace fonctionnel de dimension infinie : un exemple classique et tr`es important dans les applications est lespace de Wiener, qui nest autre que lespace
C([0, 1], Rd) des fonctions continues sur [0, 1] `a valeurs dans Rd . La mesure de
Wiener est une mesure gaussienne sur cet espace, dimportance capitale en probabilites et en physique (mouvement brownien).
Id
ee de d
epart : int
egration par tranches
Lidee de depart de Lebesgue semble tr`es simple. Comme dans le cas de lintegrale
de Riemann, il sagit dapprocher laire sous le graphe de la fonction par une union
de rectangles. Mais ces rectangles sont definis de mani`ere differente ! Dans le cas de
Riemann, on sinteresse aux variations de la fonction sur son domaine de definition :
une base etant donnee, on definit le rectangle comme lensemble des points au-dessus
de cette base, qui sont situes en-dessous de la courbe. Au contraire, dans le cas de
Lebesgue, on definit le rectangle en fonction des valeurs de la fonction, sans jamais
sinteresser trop `a lespace de depart. Ce nest donc pas la base du rectangle que lon
se donnera au depart, mais une variation dans les valeurs atteintes (cote vertical).
Evidemment, on doit admettre que plusieurs rectangles partagent un meme cote
vertical. Cest ici que lintegrale de Lebesgue va gagner toute sa complexite : alors
que dans lintegrale de Riemann, une brique elementaire est un simple rectangle, dans
celle de Lebesgue, il pourra sagir de plusieurs ou meme dune infinite de rectangles.
Lexemple de la fonction indicatrice de Q est revelateur : bien que discontinue
partout, cette fonction est tr`es facile `a decrire en fonction de ses valeurs. Dans la
theorie de Riemann, on tenterait vainement de decouper le segment [0, 1] en tout
petits intervalles o`
u cette fonction ne varie gu`ere ; dans celle de Lebesgue, on partage
[0, 1] en seulement deux morceaux qui sont assez complexes (totalement discontinus)
mais sur chacun desquels la fonction est effectivement constante.

18

INTRODUCTION

Fig. 1. Procede de Riemann vs. procede de Lebesgue

(13 juin 2010)

CHAPITRE I

Th
eorie abstraite de la mesure
Ce chapitre est consacre `a une exposition abstraite de la theorie de la mesure,
dans une perspective resolument ensembliste o`
u une mesure est vue comme une fonction definie sur les parties mesurables. Dans la section I-1, jintroduirai le concept
despace mesure, sur lequel repose la theorie de Lebesgue. La section I-2 est consacree
`a des rappels de topologie, avec un accent particulier sur les notions les plus utiles en
theorie de la mesure. La section I-3 recense les principales proprietes de regularite
dont peuvent etre dotes les espaces mesures. Dans la section I-4 se trouvent lenonce
et la demonstration de limportant theor`eme de prolongement de Caratheodory,
outil-cle de la construction de nombreuses mesures. Cette section est loccasion de
developpements plus avances, tels que lenonce du theor`eme dexistence de Kolmogorov sur des produits infinis (dont la demonstration est remise au Chapitre III).
La section I-5 etudie loperation de completion dune mesure. Enfin, la section I-7
est consacree `a letude de recouvrements par de petites boules ; son interet principal
apparatra beaucoup plus tard, dans le Chapitre ??.
Seule la section I-1 est indispensable `a la comprehension de la suite du cours ;
toutes les autres pourront etre omises en premi`ere lecture, et consultees quand le
besoin sen fera sentir.
I-1. Espaces mesur
es
On ne peut gu`ere separer les notions dintegrale et de volume. On pense en
particulier au volume dun ensemble comme lintegrale de la fonction indicatrice de
cet ensemble ; et reciproquement, en pratique on calcule une integrale en decoupant
laire sous la fonction en petites tranches superposees dont on estime le volume.
En dautres termes, on doit avoir les relations
Z

vol(A) = 1A

Z
Z

f=

vol({f t}) dt

o`
u {f t} est lensemble des x tels que f (x) t, et f est supposee positive.
La theorie de Lebesgue se developpe sur le concept de mesure, et cest ce qui
joue le role du volume. Les mesures ont ete introduites par Borel, quelques annees
avant les travaux de Lebesgue, afin de quantifier les tailles de certains ensembles, et
de construire des fonctions verifiant certaines proprietes.
Avant de preciser la definition dune mesure, cherchons `a etablir un cahier des
charges. On souhaite definir une mesure comme une fonction qui associe `a un
ensemble A un poids positif (fini ou infini), note [A] ou (A).
Cest bien le minimum dimposer quune mesure soit additive : si A et B sont
disjoints, alors la mesure de A B doit etre la somme des mesures de A et de B.

20

CHAPITRE I

(13 juin 2010)

Cette relation dadditivite est fondamentale et implique toutes les r`egles de calcul
habituel des volumes : par exemple,
- si A B, on peut appliquer la relation dadditivite `a B = (B \ A) A et
trouver que
[B] = [A] + [B \ A] [A];
la mesure est donc une fonction croissante densembles ;
- en utilisant les identites A B = (A \ B) B et A = (A \ B) (A B), on
obtient facilement
(2)

[A B] < =

[A B] = [A] + [B] [A B],

formule qui sert souvent dans les calculs de volume.


Enfin, en pratique on connatra la valeur de sur certains ensembles particuliers,
ou bien on imposera certaines proprietes dinvariance. Par exemple, pour definir le
volume usuel dans R3 il est naturel de demander que le volume dun pave soit egal
au produit des longueurs de ses cotes (volume euclidien), et dimposer que le volume
soit invariant par rotation et translation.
Ce cahier des charges parat raisonnable. Le theor`eme suivant pourra donc apparatre comme un choc : Il est impossible de demontrer lexistence1 dune fonction
densembles : P(R3 ) [0, +] additive, invariante par rotation et translation,
telle que [[0, 1]3 ] = 1.
Une fois le choc passe, il nest pas tr`es difficile de trouver un rem`ede. Au lieu de
definir une mesure comme une fonction sur P(X), lensemble de toutes les parties
dun ensemble X, on va la definir sur un sous-ensemble de P(X), constitue de
parties que lon appelle mesurables. On aura alors des relations du type de (2),
mais seulement quand on reste dans la classe des parties mesurables.
Nous sommes donc menes `a nous interesser aux classes de parties stables par
union, intersection, soustraction : on les appellera des alg`
ebres. Les alg`ebres sont
le cadre naturel sur lequel definir des fonctions additives densembles.
I-1.1. Alg`
ebres.
D
efinition I-1 (Alg`ebre). Soit X un ensemble quelconque, et soit P(X) lensemble de toutes les parties de X. Un sous-ensemble A de P(X) est appele une
alg`ebre (ou alg`ebre de parties de X) si
(i) A ;
(ii) A A = X \ A A ;
(iii) A, B A = A B A.
Remarque I-2. De nombreuses variantes equivalentes de ces trois axiomes sont
possibles. Par exemple, `a titre dexercice on pourra verifier que la reunion des
axiomes (i)-(iii) ci-dessus est equivalente `a la reunion des quatre axiomes suivants :
(i) , X A, (ii) Si A, B A, alors A B A, (iii) Si A, B A, alors A B A,
(iv) Si A, B A, alors A \ B A.
Remarque I-3. Une alg`ebre est automatiquement stable par union finie, intersection finie, difference et difference symetrique. (La difference de deux ensembles A
et B est A \ B, tandis que leur difference symetrique est (A \ B) (B \ A).)
1Plus pr
ecisement : en utilisant laxiome du choix, on peut montrer quune telle fonction nexiste

pas. Jen reparlerai dans le Chapitre IV.


THEORIE
ABSTRAITE DE LA MESURE

21

Exemples I-4.
(i) Alg`ebres associees `a des partitions. Si X est un ensemble
quelconque, on appelle partition de X une collection finie de parties non
vides, deux `a deux disjointes, dont la reunion est X tout entier. Si est une
partition de X, alors lensemble A de toutes les reunions finies delements de
constitue une alg`ebre de parties de X. Son cardinal est 2# , o`
u # est le
cardinal de . On peut montrer que toute alg`ebre finie est de cette forme :
pour cela, on identifie les elements de comme les elements minimaux de A.

(ii) Alg`ebres associees `a des familles stables par intersection. Une famille
F est dite stable par intersection si lintersection de deux membres A et B
de F est elle-meme un element de F (en consequence de quoi lintersection
dun nombre fini arbitraire delements de F est egalement un element de F ).
Soient X un ensemble quelconque, F une famille de parties de X, stable par
intersection, contenant X et telle que le complementaire de tout element de F
est une union finie delements de F ; alors lensemble A de toutes les unions
finies delements de F est une alg`ebre de parties de X.

(iii) Alg`ebre engendree par les pav


es. Cest un cas particulier de (ii). On se donne
(Xk )1kK une famille finie densembles, et pour
Q chaque Xk on se donne une
alg`ebre Ak de parties de Xk . On pose X = Xk , le probl`eme est de definir
une alg`ebre naturelle
Q sur X. Pour cela on consid`ere la famille F formee des
paves, i.e. les P = Ak , o`
u chaque Ak est un element de Ak . La famille F
est alors stable par intersection, et le complementaire dun pave peut secrire
comme une union finie de paves : par exemple, pour K = 2 on a
(X1 X2 ) \ (A1 A2 ) = (X1 \ A1 ) (X2 \ A2 ) (X1 \ A1 ) X2 X1 (X2 \ A2 ).

Dapr`es (ii), on sait alors que lensemble des unions finies de paves forme une
alg`ebre de parties de X. Ce point est illustre graphiquement sur la figure 1,
dans lespace produit X = R2 .
1
2
3

Fig. 1. La difference symetrique de deux paves est une union finie de paves
(iv) Alg`ebre engendree par les cylindres. Cest encore un cas particulier de (ii),
dune importance considerable en theorie des probabilites. Il sagit de definir
une alg`ebre naturelle sur un produit infini densembles dont chacun est muni
de sa propre alg`ebre. Je vais commencer par considerer le cas simple dun
produit denombrable densembles finis Xk munis de leur alg`ebre P(Xk ). (Le
choixQ
trivial o`
u chaque Xk est lespace {0, 1} est dej`a non-trivial !) Lespace
X = Xk est donc lespace des suites (xk )kN telles que xk Xk pour tout k,
et on va alors definir un cylindre elementaire comme une partie de X qui ne

22

CHAPITRE I

1111111111111111111
0000000000000000000
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111

(13 juin 2010)

1111111111111111111111
0000000000000000000000
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111

Fig. 2. Deux membres de lalg`ebre engendree par les paves dans R R


depend que dun nombre fini de coordonnees : pour tout K et tout choix de
(a1 , . . . , aK ) X1 . . . XK , on posera donc
CK (a1 , . . . , aK ) = {x X; 1 k K xk = ak }.

Il est facile de verifier que la famille de ces cylindres est stable par intersection, et que le complementaire dun cylindre elementaire est une union finie de
cylindres elementaires. Par (ii), on sait donc que lensemble des unions finies
de cylindres elementaires forme une alg`ebre.
Cette construction se generalise comme suit au cas o`
u lensemble des indices
nest pas forcement denombrable. Soit (Xt )tT une famille densembles, indexee
par un ensemble T quelconque ; pour chaque Xt on se donne une alg`ebre At de
parties de Xt . Pour tout entier K et tout choix de (t1 , . . . , tK ), dans T K , pour
tout j {1, . . . , K} on choisit Atj dans Atj et on definit le cylindre elementaire
C(t1 ,...,tK ) (At1 , . . . , AtK ) par la formule
)
(
Y
C(t1 ,...,tK ) (At1 , . . . , AtK ) = x
Xt ; j {1, . . . , K}, xtj Atj .
tT

Lensemble des unions finies de cylindres elementaires est alors une alg`ebre.

I-1.2. Sigma-alg`
ebres. La theorie de Lebesgue nest pas construite sur la base
des alg`ebres, mais sur celle des -alg`ebres, ou tribus. Le prefixe indique une
propriete de stabilite vis-`a-vis des operations denombrables. La difference entre le
concept dalg`ebre et celui de -alg`ebre peut senoncer comme suit. Rappelons-nous
que si (Ak )1kK est une famille finie delements dune alg`ebre A, alors lunion
Ak est toujours un element de lalg`ebre. Dans la definition dune -alg`ebre, on
impose que cette propriete soit egalement vraie quand on consid`ere une famille
d
enombrable de parties.
D
efinition I-5 (-alg`ebre). Soit X un ensemble quelconque, et soit P(X) lensemble de toutes les parties de X. Un sous-ensemble A de P(X) est appele une
-alg`ebre (ou -alg`ebre de parties, ou tribu) si
(i) A ;
(ii) A A = X \ A A ;
[
(iii) [k N, Ak A] =
Ak A.
kN


THEORIE
ABSTRAITE DE LA MESURE

23

Exemple I-6. Lensemble des unions finies dintervalles de R est une alg`ebre,
mais ce nest pas une -alg`ebre.
Remarque I-7. Une -alg`ebre est automatiquement stable par intersection
d
enombrable, comme on le voit en passant aux complementaires dans (iii).
Remarque I-8. Le lecteur tant soit peu familier avec la topologie aura remarque
une certaine analogie entre la notion de -alg`ebre et celle de topologie. Rappelons que, par definition, une topologie sur un ensemble quelconque X est un sousensemble O de parties de X tel que (i) , X O, (ii) O1 , O2 O = O1 O2 O,
(iii) i, Oi O = Oi O. Noter que dans (iii), la famille I indexant les Oi est
arbitraire (pas necessairement denombrable). Les elements de O sont appeles des
ouverts, et leurs complementaires sont appeles des fermes. Lexemple le plus important de topologie est la topologie definie par une distance : on definit un ouvert
comme une union de boules ouvertes. Des rappels plus detailles seront effectues dans
la section I-2.
D
efinition I-9 (espace mesurable). On appelle espace mesurable un couple
(X, A), o`
u A P(X) est une -alg`ebre. Les elements de A seront alors appeles
parties mesurables ou ensembles mesurables.
Par abus de langage, on dira souvent que X est un espace mesurable. Bien s
ur,
cette terminologie na de sens que si lon fait reference implicite `a une certaine tribu :
apr`es tout, nimporte quel espace X est mesurable quand on le munit de la tribu
triviale P(X) (ou de {, X}, non moins triviale).
Proposition I-10 (tribu engendree). Soient X un ensemble quelconque, et F
un sous-ensemble quelconque de P(X). Lintersection de toutes les -alg`ebres contenant F est une -alg`ebre, et cest la plus petite qui contienne F . On lappelle tribu
engendree par F et on la notera (F ).
On laisse en exercice la demonstration de cette proposition. (Notons que lintersection apparaissant dans lenonce nest pas vide car P(X) est une -alg`ebre
contenant F .)

Considerer des -alg`ebres plutot que des alg`ebres est a priori assez seduisant
car on obtient ainsi des familles riches qui se comportent bien vis-`a-vis des unions
infinies, limites, etc. On sait, par exemple, que tout ouvert de R peut secrire
comme union disjointe denombrable dintervalles ouverts. La -alg`ebre engendree
par les intervalles ouverts de R contient donc tous les ensembles ouverts, et cest
par consequent la -alg`ebre engendree par les ouverts de R ; on lappelle tribu des
bor
eliens de R. Elle contient tous les ouverts, donc tous les fermes, mais aussi
les unions denombrables densembles ouverts ou fermes, les unions denombrables
dintersections denombrables dunions denombrables dintersections denombrables
densembles ouverts ou fermes, etc. et plus encore. Cette richesse est `a la fois
une force et une faiblesse : il est tr`es difficile de decrire explicitement un ensemble
borelien. Pour autant, la tribu borelienne est strictement plus petite que P(R) (elle
a seulement la puissance du continu, son cardinal est 2N ) : en se limitant `a cette
tribu, on selectionne des parties de R qui ont une certaine regularite.
Exemples I-11.
(i) Tribu bor
elienne abstraite : soit X un espace topologique abstrait (i.e. quelconque). On definit sa tribu borelienne B(X) comme

24

CHAPITRE I

(13 juin 2010)

la -alg`ebre engendree par les ouverts de X. Cest egalement, bien s


ur, la
-alg`ebre engendree par les fermes de X.
(ii) Tribu bor
elienne r
eelle : Dans le cas o`
u X = Rn , on peut trouver de
nombreuses familles generatrices beaucoup plus restreintes que la collection de
tous les ouverts ou tous lesQfermes. Par exemple :
- les paves fermes Q[ak , bk ] ;
- les paves ouverts ]akQ
, bk [ ;
- les paves semi-ouverts
[ak , bk [ ;
Q
- les cubes fermes [ak , ak +Q
c] (ou ouverts, ou semi-ouverts) ;
- les cubes fermes dyadiques [mk 2k , (mk + 1)2k ] (ou ouverts, ou
semi-ouverts) ;
- les boules ouvertes (ou fermees) dans Rn .
(iii) Tribu produit : Cette construction suit celle de lExemple I-4(iii). Soient X
et Y deux espaces mesurables, avec leurs tribus respectives A et B. On appelle
pave mesurable un ensemble de la forme A B, o`
u A A et B B. La tribu
engendree par les paves mesurables est appelee tribu produit, et notee A B.
On ne peut gu`ere la decrire explicitement... Cette construction se generalise
facilement au produit dun nombre fini despaces mesurables.
Q
(iv) Tribu cylindrique : Si maintenant X =
Xt est un produit infini (denombrable ou non) despaces Xt dont chacun est muni dune tribu At , alors
on peut munir X de la -alg`ebre engendree par les cylindres elementaires,
suivant la construction de lExemple I-4(iv). Il sagit en fait de la generalisation
naturelle du concept de tribu produit. La tribu cylindrique est la -alg`ebre
classique que lon introduit sur un produit infini ; cependant, ce nest pas la
seule possible, et certaines constructions alternatives jouent un role important
en recherche contemporaine.
Exemple I-12. Considerons X = {0, 1}N , o`
u chaque facteur est muni de la tribu
triviale. Alors les singletons sont mesurables pour la tribu cylindrique. En effet, si
x {0, 1}N alors {x} = Ck o`
u
n
o
N
Ck = y {0, 1} ; j k, yj = xj .

En revanche, il est impossible2 de decrire une partie de {0, 1}N qui ne soit pas
mesurable pour la tribu cylindrique.

Remarque I-13. La construction de la tribu produit est tr`es similaire `a celle


de la topologie produit, qui sera rappelee dans la section I-2.4. Ces constructions
abstraites sont tr`es simples, mais cachent certaines subtilites, que nous aurons loccasion de retrouver en etudiant lintegrale sur les espaces produits, au Chapitre III.
Pour se donner une idee des probl`emes proprement vertigineux que lon peut ren
contrer, le lecteur peut se poser la question suivante. Etant
donnes X et Y deux
espaces topologiques, munis de leur tribu borelienne, il existe deux tribus naturelles
sur X Y : la tribu borelienne (pour la topologie produit), et la tribu produit (des
tribus boreliennes). Ces deux tribus concident-elles ?
2En

fait, la non-existence de parties non mesurables de {0, 1}N est coherente avec les axiomes
classiques autres que laxiome du choix ; jy reviendrai.


THEORIE
ABSTRAITE DE LA MESURE

25

Exercice I-14. Demontrer lassertion faite dans lExemple I-11(ii), selon laquelle la tribu borelienne de Rn est engendree par les paves ouverts bornes. Il suffit
bien s
ur de verifier que tout ouvert appartient `a la tribu T engendree par les paves
ouverts. On pourra montrer successivement que
- T contient les paves ouverts non bornes ;
- T contient les paves fermes ;
- T contient les paves semi-ouverts ;
- T contient les ouverts.
On pourra noter que tout ouvert secrit comme une reunion denombrable disjointe de paves (obtenus en considerant des maillages de plus en plus fins, par
exemple).

1111111111111111111111
0000000000000000000000
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111

Fig. 3. Approximation dun ouvert de Rn par une union de petits paves

Exercice I-15. Soient m, n N. En utilisant le resultat de lexercice I-14,


montrer que B(Rm ) B(Rn ) = B(Rm+n ).
I-1.3. Mesures. Les -alg`ebres sont le cadre naturel sur lequel sont definies les
mesures, au sens de Lebesgue.
D
efinition I-16. Soit (X, A) un espace mesurable. On appelle mesure (ou mesure -additive, ou mesure positive) sur X une application definie sur A, `a valeurs
dans [0, +] et verifiant laxiome dit de -additivite : pour toute famille denombrable
(Ak )kN densembles mesurables disjoints,
X
[ 
[Ak ].
Ak =
(3)

kN

kN

Le triplet (X, A, ) est alors appele un espace mesure.

26

CHAPITRE I

(13 juin 2010)

Par abus de notation, on dira souvent que (X, ) est un espace mesure, la tribu
A etant alors implicite ; ou meme que X est un espace mesure, la tribu A et la
mesure etant alors implicites.
Remarques I-17.
(i) La somme apparaissant au membre de droite de (3)
converge toujours dans [0, +].
(ii) Comme cas particulier de la definition (choisir Ak = pour tout k), on a
bien s
ur [] = 0. Les mesures verifient egalement les r`egles habituelles de
calcul des volumes : par exemple
A B = [A] [B],

[A B] < =

[A B] = [A] + [B] [A B].

(iii) On obtient une mesure quand on ajoute deux mesures, ou quand on multiplie
une mesure par un nombre reel positif.
(iv) Si (X, ) est un espace mesure, et Y une partie mesurable de X, alors
induit sur Y une structure despace mesure par restriction `a la tribu des
parties mesurables de X qui sont incluses dans Y . La mesure , definie comme
restriction de `a Y , est notee
= |Y

ou

= Y .

Exercice I-18. Soit une mesure. Montrer que pour toute famille denombrable
(Ak ) de parties mesurables,
X
[ 

Ak
[Ak ].
kN

kN

Grace aux axiomes des -alg`ebres, les proprietes exprimees en termes dunions
disjointes peuvent etre reformulees en termes dunions croissantes, ou dintersections
decroissantes. Rappelons quune famille (Ak )kN densembles est dite croissante si
on a Ak Ak+1 pour tout k, et decroissante si on a Ak+1 Ak pour tout k.
Proposition I-19. Soit (X, ) un espace mesure.
(i) Soit (Ak )kN une famille croissante de parties mesurables, alors
[ 

Ak = lim [Ak ] = sup [Ak ].


kN

kN

(ii) Soit (Ak )kN une famille decroissante de parties mesurables, lun au moins
des Ak etant de mesure finie. Alors
\ 
Ak = lim [Ak ] = inf [Ak ].

kN

kN

D
emonstration. Demontrons (i). Si [A ] tend vers linfini quand ,
alors forcement [Ak ] = , et lassertion est vraie. Dans le cas contraire, la suite
croissante [A ] converge vers une limite finie quand . On ecrit alors Ak
comme la reunion disjointe de B0 = A0 et des Bj = Aj \ Bj1, pour 1 j k. Par
-additivite,
X
[Ak ] = [A0 ] +
[Bj ].
j1


THEORIE
ABSTRAITE DE LA MESURE

27

La serie de droite est donc convergente, et on a


[A0 ] +

X
j1

[Bj ] = lim

[A0 ] +

1j

[Bj ]

= lim [A ].

Pour demontrer (ii), supposons sans perte de generalite que A0 est de mesure
finie ; alors definit (par restriction) une mesure sur A0 , et on peut appliquer la
partie (i) de la proposition `a la famille croissante (A0 \ Ak ).

Exercice I-20. Montrer que la propriete (i) est en fait equivalente `a laxiome
de -additivite. Trouver un contre-exemple `a la propriete (ii) si lon ne suppose pas
que lun des Ak est de mesure finie. (On pourra utiliser la fonction cardinal sur
N.) Faire lanalogie avec un contre-exemple classique de topologie montrant quune
intersection decroissante de fermes peut etre vide.
Remarque I-21. Nous sommes en train de developper une theorie des mesures
-additives sur des -alg`ebres. Pourquoi ne pas developper une theorie des fonctions finiment additives definies sur des alg`ebres ? Autrement dit, pourquoi utiliser
laxiome de -additivite au lieu de laxiome plus naturel
A B = = [A B] = [A] + [B] ?

Une reponse possible est que la relation de -additivite sera precieuse et puissante
pour resoudre certains probl`emes. Mais surtout, il nexiste pas `a lheure actuelle de
consensus autour dune theorie des mesures finiment additives (voir les references
dans [Dudley, p. 112]). Cela dit, peut-etre la theorie de la mesure actuelle sera-t-elle
un jour remplacee par une autre theorie plus generale.....
Remarque I-22. On peut egalement poser la question dans le sens contraire :
pourquoi se limiter aux mesures -additives, et ne pas considerer des mesures qui
soient additives pour des familles disjointes densembles, pas necessairement denombrables ? La reponse est cette fois assez facile : on tomberait immediatement sur
des paradoxes choquants. Par exemple, la longueur dun singleton de [0, 1] est
evidemment 0, lintervalle [0, 1] est union de singletons, mais sa longueur est 1 et
non pas 0...
Exemples I-23. Si la construction des -alg`ebres est souvent un exercice facile,
la construction des mesures peut poser des probl`emes considerables. Voici quelques
mesures cel`ebres.
(i) Lexemple non trivial le plus simple dune mesure est ce que lon appelle une
masse de Dirac : soit X un espace mesurable, et x0 un point de X, on note
x0 la mesure definie par
(
1 si x0 A,
x0 [A] =
0 si x0
/ A.
On peut se representer cette mesure comme une masse ponctuelle situee au
point x0 . Malgre sa simplicite, la masse de Dirac peut etre consideree comme
la brique elementaire des mesures : de larges classes de mesures peuvent en
effet etre approchees par des combinaisons de masses de Dirac.
(ii) La mesure de comptage nest autre que la fonction cardinal, `a valeurs
dans N {+}.

28

CHAPITRE I

(13 juin 2010)

(iii) La mesure de Lebesgue dans Rn est la mesure de reference naturelle


dans un cadre euclidien. Elle correspond aux notions habituelles de longueur
(n = 1), surface (n = 2) ou volume (n = 3). On peut la definir en specifiant
le volume des paves, ou celui des boules, selon les formules dont nous avons
lhabitude. Son existence na rien devident et nous parlerons en detail de sa
construction dans le chapitre IV.
(iv) Les mesures de Hausdorff permettent de definir des notions de volume ddimensionnel dans un espace de dimension n : longueur dune courbe tracee
dans R3 , etc. A chaque dimension d 0 (enti`ere ou non) est associee une
mesure de Hausdorff ; quand d nest pas entier on parle souvent de mesure
fractale. La mesure de Hausdorff n-dimensionnelle dans Rn concide avec la
mesure de Lebesgue, ce qui nest pas evident a priori ; quant `a la mesure de
Hausdorff 0-dimensionnelle, ce nest autre que la mesure de comptage. Les
mesures de Hausdorff se definissent naturellement dans des espaces metriques
arbitraires et pas seulement dans Rn .
(v) La mesure de Haar est une autre generalisation de la mesure de Lebesgue ;
on la construit sur un groupe topologique localement compact ; on reviendra sur
ces concepts. La mesure de Haar est caracterisee par certaines proprietes, dont
la principale est linvariance vis-`a-vis de laction du groupe (disons action `a
gauche), cest-`a-dire laction des translations a : x 7 (a.x). Par exemple, la
mesure de Haar sur le groupe localement compact Rn nest autre que la mesure
de Lebesgue. Un autre exemple est le tore Rn /Zn , que lon peut identifier
`a [0, 1[n ; il sagit dun groupe compact, et sa mesure de Haar est encore la
(restriction de la) mesure de Lebesgue.
(vi) La mesure de volume, sur une variete riemannienne (M, g) de classe C 2
(se reporter `a un cours de geometrie differentielle pour des explications !), est
encore une autre generalisation de la mesure de Lebesgue. On peut la definir
comme la mesure de Hausdorff n-dimensionnelle, o`
u n est la dimension de la
variete, et on a fait de M un espace metrique en le munissant de la distance
geodesique ; mais on dispose aussi dune formule explicite, que lon peut ecrire
dans des cartes, en fonction du determinant de la metrique g et de la mesure
de Lebesgue.
(vii) La mesure de Wiener, definie sur C([0, 1], Rd ), est liee au mouvement
brownien. On peut la comprendre intuitivement ainsi : soit une particule partant dun point donne (lorigine) et decrivant une trajectoire brownienne, observee sur lintervalle de temps [0, T ]. La probabilite pour que la trajectoire de
cette particule poss`ede une certaine propriete (P) est la mesure (de Wiener)
de lensemble de tous les chemins dans C([0, T ], Rd) qui poss`edent la propriete
(P). Depuis les travaux dEinstein et de Smoluchowski au debut du si`ecle, on
connaissait les valeurs de cette mesure sur tous les cylindres, un cylindre etant
lensemble de toutes les fonctions f telles que (f (t1 ), . . . , f (tk )) appartient `a un
certain ensemble mesurable de Rk , pour toute famille finie arbitraire de temps
(t1 , . . . , tk ). Il a cependant fallu attendre 1921 pour que Wiener reussisse `a
demontrer lexistence de cette mesure sur la tribu engendree par les cylindres.


THEORIE
ABSTRAITE DE LA MESURE

29

I-2. Rappels de topologie


Dans la section precedente, les concepts de nature topologique ne jouaient aucun
role ; mais dans toute la suite du cours, ils interviendront de mani`ere importante. Je
vais bri`evement passer en revue les notions qui nous seront utiles ; le lecteur pourra
dans la plupart des cas completer lui-meme les demonstrations, ou bien les trouver
dans la plupart des ouvrages dintroduction `a la topologie.
Pr
eliminaires
Soit X un ensemble quelconque ; on le munit dune structure topologique en lui
associant une famille O de parties de X, appelees ouverts, telles que
(i) lensemble vide et X sont des ouverts,
(ii) lintersection de deux ouverts est un ouvert,
(iii) la reunion dune famille quelconque douverts est un ouvert.
Lintersection dun nombre fini douverts, une union quelconque douverts sont
donc des ouverts.
Si une partie V contient un ouvert contenant un element x, on dit que V est
voisinage de x.
Le complementaire dun ouvert est appele ferm
e. Lensemble vide, lespace X
tout entier, lunion dun nombre fini douverts, une intersection quelconque de fermes
sont fermes.
On dit quun espace topologique X est s
epar
e (terminologie anglo-saxonne :
espace de Hausdorff) si, etant donnes deux elements distincts x et y de X, on peut
toujours leur trouver des voisinages disjoints.
Soit F une famille de parties de X. Lintersection de toutes les topologies sur X
contenant F est une topologie, et cest la plus petite qui fasse de tous les elements
de F des ouverts. On lappelle topologie engendree par F .
Un ensemble A X etant donne, on definit ladh
erence A de A comme le plus
petit ferme contenant A, cest-`a-dire lintersection de tous les fermes contenant A ;
et lint
erieur de A comme le plus grand ouvert contenu dans A, cest-`a-dire lunion
de tous les ouverts contenus dans A. Une partie A est dite dense dans X si A = X.
Un sous-ensemble arbitraire A de X peut etre vu comme un espace topologique
si on le munit de la topologie definie par les intersections de A avec les ouverts de
X. Cette topologie est dite topologie induite.
On dit quune suite (xn )nN converge vers x X si, pour tout voisinage V de
x on peut trouver N N tel que n N = xn V . En dautres termes, pour
n assez grand, xn est confine dans nimporte quel voisinage de x fixe a priori. On
dit alors que x est la limite de la suite (xn ) et on note xn x. On appelle valeur
dadherence de (xn ) tout x X qui peut etre obtenu comme limite dune suite
extraite (xk(n) )nN .
Etant donnes deux espaces topologiques X et Y , on dit quune fonction f : X
Y est continue si f 1 (O) est un ouvert de X, pour tout ouvert O de Y . Si X nest
pas a priori muni dune topologie, on appelle topologie engendree par f la plus petite
topologie qui rende f continue : cest lensemble de toutes les images reciproques
douverts de Y par f .
Un espace topologique X est dit connexe si on ne peut le separer en deux
ouverts disjoints non vides. Un espace topologique arbitraire etant donne, on peut
toujours le decomposer en composantes connexes, qui sont les plus grands (au sens
de linclusion, vue comme ordre partiel) ensembles connexes contenus dans X. Un

30

CHAPITRE I

(13 juin 2010)

point x X est dit isol


e si le singleton {x} est un ouvert, ou de mani`ere equivalente
si sa composante connexe est reduite `a lui-meme.
La notion de topologie peut etre vue comme une abstraction extreme de la notion
de proximite : quand on se donne un voisinage V dun point x, on definit en
quelque sorte les points qui sont proches de x (qui appartiennent `a ce voisinage).
Les composantes connexes sont en quelque sorte des parcelles disjointes de lespace,
telles que lon puisse se deplacer contin
ument `a linterieur dune meme parcelle,
sans pouvoir passer de parcelle en parcelle.
Les topologies que lon rencontre le plus souvent sont celles qui sont engendrees
par une m
etrique ; elles font lobjet de la section suivante.
De mani`ere generale, de nombreuses metriques peuvent etre associees `a une meme
topologie (elles sont alors dites equivalentes du point de vue topologique) ; ce qui
laisse penser que le concept de topologie est plus satisfaisant que celui de metrique.
Cependant,
(a) en general, une topologie abstraite peut presenter des proprietes pathologiques qui sont interdites si la topologie provient dune metrique ;
(b) une metrique permet de quantifier la notion de proximite, ce qui peut etre
precieux dans des probl`emes pratiques ;
(c) en analyse3, on peut (presque) toujours en pratique se ramener `a des topologies metriques.
I-2.1. Espaces m
etriques. Soit X un ensemble quelconque ; on dit quune
application d : X X R+ est une metrique, ou distance, si elle satisfait aux deux
axiomes
(i) x, y, z X, d(x, z) d(x, y) + d(y, z) ;
(ii) [d(x, y) = 0] x = y.

On appelle espace m
etrique un couple (X, d), o`
u d est une distance sur lensemble X. Par abus de langage, on dira souvent que X est un espace metrique, la
distance d etant alors implicite.
Soient (X, d) un espace metrique, x X et r 0. On definit la boule ouverte
Br (x) = B(x, r), centree en x et de rayon r, et la boule ferm
ee Br] (x) = B(x, r]),
par les formules
Br (x) := {y X; d(x, y) < r};

Br] (x) := {y X; d(x, y) r}.

Si (X, d) est un espace metrique, on introduit une topologie separee sur X en


definissant les ouverts comme les unions de boules ouvertes. On a alors les proprietes
suivantes :
- les boules ouvertes sont ouvertes, les boules fermees sont fermees ;
- un ensemble V est voisinage dun point x si et seulement si il existe r > 0 tel
que Br (x) V ;
- un ensemble O est ouvert si et seulement si il est voisinage de tous ses points ;
- une fonction f : (X, d) (X , d ) definie entre deux espaces metriques est
continue si et seulement si

x X > 0 > 0;
d(x, y) = d f (x), f (y) .
3Ce

nest pas vrai en geometrie algebrique, o`


u la topologie de Zariski, dusage frequent, est
resolument non metrique.


THEORIE
ABSTRAITE DE LA MESURE

31

Les suites sont souvent dune aide precieuse dans les espaces metriques ; plusieurs des proprietes que nous avons mentionnees precedemment admettent des caracterisations simples en termes de suites convergentes. Ainsi, notons que
- une suite (xn )nN `a valeurs dans X converge vers x X si et seulement si
d(xn , x) 0 quand n ;
- ladherence dun ensemble A X est lensemble de toutes les limites de suites
`a valeurs dans A ; en particulier, un ensemble F est ferme si et seulement si il est
stable par passage `a la limite : les assertions xn F , xn x X impliquent
xF;
- une fonction f definie entre espaces metriques est continue si et seulement si
elle preserve les limites : f (xn ) f (x) d`es que xn xn .
Si A est une partie dun espace metrique (X, d) et x X, on pose d(x, A) =
inf{d(x, y); y A} : cest la distance de x `a A. Ladherence de A est lensemble des
points qui sont `a distance nulle de A ; en particulier, si F est un ferme, les assertions
d(x, F ) = 0 et x F sont equivalentes.
I-2.2. R
egularit
e des espaces topologiques. La zoologie des espaces topologiques est tr`es riche ; les proprietes dusage le plus courant sont la separabilite, la
compacite et la completude.
Un espace topologique X est dit s
eparable sil admet une famille denombrable
dense. Dire quun espace metrique X est separable revient `a dire quil existe une
famille (xk )kN , telle que pour tout x X il existe une application n k(n), definie
de N dans N, telle que xk(n) x.
Une suite (xn )nN dans un espace metrique (X, d) est dite de Cauchy si d(xm , xn )
0 quand (m, n) ; en dautres termes,
> 0 N N;

n, m N = d(xm , xn ) .

Un espace metrique (X, d) est dit complet si toute suite de Cauchy dans X converge.
Un espace topologique X separe est dit compact si, de tout recouvrement de X
par une famille douverts (Oi )iI , on peut extraire un sous-recouvrement fini, i.e. il
existe une famille finie J I telle que X jJ Oj . Si X est un espace topologique
separe et K une partie de X, on dit que K est un compact de X si la topologie
induite par X sur K en fait un espace topologique compact.
Si X est un espace topologique separe, et A un sous-ensemble de X, on dit que
A est pr
ecompact4 si son adherence A est un compact.
Un espace metrique (X, d) etant donne, on appelle diam`etre de X le supremum
de d sur X X ; lespace X est dit born
e si son diam`etre est fini.
Les proprietes suivantes se prouvent sans difficulte :
- un espace compact est ferme, et une partie fermee dun compact est compacte ;
4Jadopte

ici la terminologie anglo-saxonne (precompact) au lieu de la terminologie francaise


courante relativement compact. En francais on reserve dhabitude le terme precompact pour
ce qui sera appele plus loin totalement borne. La difference nest pas cruciale : Dans un espace
metrique separable complet, il est equivalent de dire quune partie est relativement compacte, ou
quelle est totalement bornee ; Cf. le Theor`eme I-32.

32

CHAPITRE I

(13 juin 2010)

- lunion de deux compacts est un compact, et le produit de deux compacts aussi ;


plus generalement, une union finie de compacts et un produit fini de compacts sont
des compacts (on reparlera plus tard de produits infinis) ;
- limage par une fonction continue dun compact est un compact ; en particulier,
une fonction continue sur un compact, `a valeurs dans R, est bornee et atteint ses
bornes ;
- si K1 et K2 sont deux compacts dans un espace metrique (X, d), alors il existe
x1 K1 et x2 K2 tels que
n
o
d(x1 , x2 ) = inf d(y1 , y2 ), y1 K1 , y2 K2

(consequence de ce que la fonction distance atteint son infimum sur le compact


K1 K2 ) ;
- un espace metrique compact est complet et borne ;

- un espace metrique X est compact si et seulement si toute suite (xn )nN `a valeurs dans X admet une valeur dadherence (theor`eme de Bolzano-Weierstrass) ;
- une fonction f continue entre un espace metrique compact (X, d) et un espace
metrique (Y, d) est automatiquement uniform
ement continue : pour tout > 0
il existe > 0 tel que

x, y X
d(x, y) = d f (x), f (y) .
On peut alors definir le module de continuite de f par
n
o
mf () := sup d (f (x), f (y)); d(x, y) :

cest une fonction croissante, continue, verifiant mf (0) = 0.

Exemples I-24. Une partie finie est compacte. Une partie bornee et fermee de
R , ou de nimporte quelle variete de dimension finie, est compacte. Lespace Rn
tout entier est complet mais pas compact.
n

Intuitivement, une partie compacte est une partie petite au sens image o`
u,
quand on cherche `a lexplorer (au moyen des valeurs dune suite, par exemple), on
revient toujours sur ses pas (il existe un x pr`es duquel on revient une infinite de
fois). La topologie moderne sest developpee sur la base des concepts douvert et de
compact.
Les definitions suivantes introduisent les hypoth`eses de regularite les plus utilisees
en theorie de la mesure.
D
efinition I-25 (-compacite). Un espace topologique X est dit -compact sil
est union denombrable de compacts.
D
efinition I-26 (compacite locale). Un espace topologique X est dit localement compact si tout x X admet un voisinage compact.
D
efinition I-27 (espace polonais). Un espace topologique X est dit polonais
si cest un espace metrique separable et complet.


THEORIE
ABSTRAITE DE LA MESURE

33

Exemple I-28. Lespace Rn , et plus generalement nimporte quelle variete riemannienne lisse compl`ete de dimension finie (munie de sa distance geodesique), sont
tous localement compacts, -compacts et polonais. En revanche, lespace de Wiener
C([0, 1], Rn ), muni de la norme du supremum, est polonais mais nest ni localement
compact, ni -compact (tous les compacts y sont dinterieur vide).
Remarque I-29. Les specialistes de theorie de la mesure moderne utilisent des
notions plus fines : espaces de Lusin, espaces de Suslin, etc., dont les espaces polonais
sont des cas particuliers.
I-2.3. Th
eor`
emes dextension et de s
eparation. Voici maintenant quelques
theor`emes dextension qui nous serviront dans la suite du cours :
- Si (X, d) et (Y, d ) sont des espaces metriques complets, et f est une application
uniformement continue sur une partie A de X, `a valeurs dans Y , alors elle admet
un unique prolongement continu de A dans Y . Ce prolongement peut se definir par
lidentite f (x) = lim f (xn ), o`
u xn est une suite arbitraire convergeant vers x.
- Si (X, d) est un espace metrique et F0 , F1 sont deux fermes disjoints de X,
alors la fonction f valant 0 sur F0 et 1 sur F1 admet un prolongement continu `a X
tout entier, `a valeurs dans [0, 1]. Pour le voir, il suffit de poser
f (x) :=

d(x, F0 )
d(x, F0 ) + d(x, F1 )

(Si F0 (resp. F1 ) est vide, on pose f 1 (resp. f 0).) Bien s


ur, on en deduit
quune fonction qui vaut a0 sur F0 et a1 sur F1 admet un prolongement continu `a
valeurs dans [a0 , a1 ].
- Si (X, d) est un espace metrique et A un ensemble quelconque de X, alors toute
fonction Lipschitzienne f : A R admet un prolongement Lipschitzien `a X tout
entier (a priori non unique). Pour le voir, il suffit de poser


f (x) = inf d(x, y) + f (y) .
yA

- Si (X, d) est un espace metrique et F est un ferme de X, alors toute fonction


continue f : F R admet un prolongement continu (a priori non unique) `a X tout
entier, verifiant supX f = supF f , inf X f = inf F f . Cest le Th
eor`
eme dextension
de Tietze-Urysohn, dont je vais esquisser la demonstration.

Preuve du Th
eor`
eme de Tietze-Urysohn. En decomposant f en f+ et
f , on se ram`ene au cas o`
u f est `a valeurs positives.
Si f est bornee, on peut sans perte de generalite supposer que f est `a valeurs
dans [0, 1]. On construit alors une serie dapproximations continues `a f , comme
suit. On introduit dabord une fonction g1 continue, `a valeurs dans [0, 1/2], qui vaut
identiquement 0 sur le ferme {f = 0} et identiquement 1/2 sur le ferme {f 1/2}.
On a alors 0 f g1 1/2 sur F . On introduit ensuite g2 , `a valeurs dans [0, 1/4],
identiquement egale `a 0 sur le ferme {f g1 } = 0 et identiquement egale `a 1/4 sur
le ferme {f g1 } 1/4 ; on a alors 0 f g1 g2 1/4 sur F .
Par recurrence, on construit ainsi une suite de fonctions (gn )nN telle que |gn |
2n et |f (g0 + . . . + gn )| 2n sur F . Cette serie converge uniformement dans X
tout entier vers une fonction continue g, qui concide avec f sur F .
Si maintenant f est non bornee, on applique le resultat precedent `a fe := f /(1 +
f ), construisant ainsi une fonction continue e
g sur X, `a valeurs dans [0, 1]. Lensemble

34

CHAPITRE I

(13 juin 2010)

F := {e
g = 1} est un ferme disjoint de F , on peut donc trouver une fonction h
continue, `a valeurs dans [0, 1], valant 0 sur F et 1 sur F ; la fonction he
g est alors `a
valeurs dans [0, 1[, et g := (he
g )/(he
g 1) est une extension continue de f .


Enfin, voici pour conclure un resultat utile de separation : soient F0 et F1 des


fermes disjoints dans un espace metrique ; alors on peut trouver des ouverts disjoints
O0 et O1 tels que F0 O0 , F1 O1 . En effet, on sait construire une fonction continue
f `a valeurs dans [0, 1], valant 0 sur F0 et 1 sur F1 ; il suffit de poser O0 = {x; f (x) <
1/3}, O1 = {x; f (x) > 2/3}.

I-2.4. Espaces produits. Si (Xt )tT est une famille despaces topologiques,
Q
indexee par un ensemble quelconque, considerons leur produit cartesien X = Xt :
cest lensemble des fonctions x definies sur T , telles que x(t) Xt pour tout t.
Dans cet ensemble on peut definir les cylindres : si Atk est une partie de Xtk , pour
1 k K, alors
C(t1 ,...,tK ) (At1 , . . . , AtK ) := {x X; xtk Atk }.

On peut alors definir la topologie produit comme la topologie engendree par les
ouverts cylindriques, i.e. les ouverts de la forme C(Ot1 , . . . , OtK ), chaque Otk etant
un ouvert de Xtk .
Si lensemble T est quelconque, la topologie produit est en general non metrique ;
un exemple typique est [0, 1][0,1] . En revanche, un produit denombrable despaces
metriques reste un espace metrique. Precisons un peu Q
les choses. Soit (Xk , dk )kN
une famille denombrable despaces metriques, et X = Xk . La topologie produit
sur X est engendree par les cylindres de la forme C(A1 , . . . , An ), o`
u chaque Ai est
k
un ouvert de Xi . Dire quune suite (x )kN delements de X converge vers x X
revient donc `a dire que pour tout indice i, la suite (xki )kN converge vers xi quand
k . Il est alors facile de verifier que X est un espace metrique quand on le
munit de la distance
di (xi , yi )
dX (x, y) = sup 2i
.
1 + di (xi , yi)
iN
(Noter que la distance di /(1 + di ) est topologiquement equivalente `a di, tout en
etant automatiquement bornee.) En pratique, la convergence dans lespace X est la
convergence composante par composante.
or`
The
eme I-30 (produits denombrables despaces m
etriques). Soit (Xk , dk )kN
Q
une famille denombrable despaces metriques, et soit X = Xk , muni de la topologie
produit. Alors
(i) Si chaque Xk est compact, alors X est compact ;
(ii) Si chaque Xk est polonais, alors X est polonais.
Remarque I-31. Si lon admet laxiome du choix, alors lenonce (i) se generalise
`a des familles arbitraires de compacts, eventuellement non denombrables ; cest
un cel`ebre resultat de topologie generale appele th
eor`
eme de Tychonov. La
demonstration de ce theor`eme est un remarquable exercice dabstract nonsense, que lon pourra trouver dans de nombreux ouvrages de reference, par exemple
[Dunford-Schwartz]. La preuve de lenonce (i) est beaucoup plus simple.
D
emonstration. (i) Cest loccasion dintroduire le concept dextraction diagonale (ou argument diagonal de Cantor), qui servira souvent par la suite. Soit
(xn )nN une suite delements de X ; chaque xn est une suite (xnk )kN , avec xnk Xk .


THEORIE
ABSTRAITE DE LA MESURE

35

De la famille des (xn1 )nN , `a valeurs dans le compact K1 , on peut extraire une sous (n)
(n)
suite convergente, notee x1 1 . De la famille x2 1 , `a valeurs dans le compact K2 , on
(n)
peut extraire une sous-suite convergente notee x2 1 2 . Par recurrence, on construit
...k (n)
des applications strictement croissantes k : N N, telles que la suite xk 1
est convergente dans Xk . On pose alors
(n) = 1 2 . . . n (n).
Pour tout k n, on peut ecrire
(n) = (1 . . . k ) k (n),

(n)

o`
u k est une fonction croissante. Il sensuit que, pour n k, la suite (xk ) est
...k (n)
extraite de xk 1
, et converge donc dans Xk vers une limite xk Xk . Par
definition de la topologie cylindrique, la suite (de suites) x(n) converge vers la suite
x = (xk )kN . La suite (xn )nN admet donc x pour valeur dadherence, ce qui prouve
la compacite de X.
(ii) Soit dn une metrique rendant Xn complet ; on verifie alors que la metrique
d(x, y) := sup
nN

2n dn (xn , yn )
1 + dn (xn , yn )

metrise la topologie produit de X et le rend complet.


Par ailleurs, si (xnk )kN est une suite dense dans Xn , on verifie que la famille des
suites
(xk11 , xk22 , . . . , xkNN , x1N +1 , x1N +2 , x1N +3 , . . .)
o`
u (k1 , . . . , kN ) NN et N N, est denombrable, et dense dans X (cest une suite
de suites !). Lespace X est donc separable.

I-2.5. Quel cadre topologique pour la th
eorie de la mesure ? Meme si
leurs fondements axiomatiques presentent des similitudes, theorie de la mesure et
topologie font souvent mauvais menage, et peuvent mener `a des descriptions qualitatives tr`es differentes. Ainsi, un ensemble peut etre gros au sens de la topologie (par
exemple un ensemble gras au sens de Baire, i.e. une intersection dense douverts) et
tr`es petit au sens de la mesure (i.e. de mesure tr`es petite) ; et inversement.
Dans de nombreux domaines, les notions de genericite au sens topologique
et au sens de la theorie de la mesure sont differentes ; un exemple cel`ebre est le
theor`eme KAM en mecanique Hamiltonienne, pour lequel linstabilite generique (au
sens topologique) est compatible avec une stabilite tr`es probable.
Pour autant, theorie de la mesure et topologie ne sont pas des concepts etrangers.
Nous verrons dans la section suivante que les proprietes topologiques dun espace
metrique determinent en partie ses proprietes en tant quespace mesure, quand on
le munit de la tribu borelienne. Il est donc legitime de se demander sil existe un
cadre topologique naturel pour developper la theorie de la mesure.
Dans les annees 1950 et 1960, il a pu sembler quun tel cadre etait celui des espaces localement compacts, non necessairement metriques, Plusieurs resultats
fondamentaux ont ete etablis pour ces espaces ; parmi les plus remarquables se
trouvent le Theor`eme de Representation de Riesz, dont je parlerai au Chapitre II ;
et le Theor`eme de Haar, que nous rencontrerons vers la fin du cours. La theorie de
la mesure dans les espaces localement compacts occupait alors une place importante

36

CHAPITRE I

(13 juin 2010)

dans nombre de traites de reference tels que ceux de Bourbaki et Halmos, et meme
dans louvrage plus concis de Rudin, dont la popularite reste intacte.
En revanche, les probabilistes nont jamais pu admettre ce cadre, qui exclut les
espaces fonctionnels naturels tels que lespace de Wiener (connu depuis les annees
1920). Depuis Kolmogorov, lessentiel de la theorie des probabilites a ete developpe
dans le cadre des espaces metriques separables, le plus souvent complets ; autrement
dit, des espaces polonais.
Deux theories concurrentes se sont donc developpees parallelement au cours du
vingti`eme si`ecle : les espaces localement compacts dun cote, les espaces polonais de
lautre. Pour apprecier un peu mieux cette distinction, voici quelques exemples :
- un espace metrique compact est bien s
ur localement compact, et automatiquement polonais ;
- lespace euclidien Rn , ou plus generalement nimporte quelle variete riemannienne compl`ete, est `a la fois un espace localement compact et un espace polonais ;
- lespace [0, 1][0,1] , muni de la topologie de la convergence simple, est compact
mais nest pas polonais (car non metrique) ;
- lespace C([0, 1]; R), muni de la topologie de la convergence uniforme, est polonais mais non localement compact.
Il semble clair aujourdhui que le cadre des espaces polonais est plus naturel et
concerne une communaute scientifique considerablement plus importante. En outre,
la theorie de la mesure dans des espaces non metriques (meme compacts) m`ene
`a diverses pathologies [Dudley, Appendice E]. Pour toutes ces raisons, il semble
maintenant que le bon contexte mathematique de la theorie de la mesure soit
celui des espaces polonais. Cela nempeche pas que des hypoth`eses additionnelles de
compacite locale aient des consequences fort utiles.
Pour autant, je nai pas banni compl`etement de ces notes les enonces faisant
intervenir des espaces localement compacts abstraits ; la principale motivation en
est la volonte de preserver toute la splendeur ( !) des theor`emes de Riesz et de
Haar. De mani`ere generale, je proposerai donc des preuves compl`etes dans le cas des
espaces polonais, et des preuves presque compl`etes dans le cas localement compact ;
le lecteur curieux pourra en reconstituer les details.
I-2.6. Pourquoi les espaces polonais sont-ils agr
eables ? Les axiomes des
espaces polonais en font des espaces particuli`erement bien adaptes `a la propriete de
-additivite des mesures : dans de nombreux probl`emes, on peut se ramener `a une
question portant sur une famille d
enombrable densembles simples tels que des
boules. Voici un bon exemple.
or`
The
eme I-32 (ouverts et compacts dun polonais). Soit (X, d) un espace
metrique separable, soit (xn )nN une suite dense dans X, et soit (k )kN une suite de
nombres positifs decroissant vers 0. Soit Bk lensemble des boules ouvertes de rayon
xn , de rayon k , et B la reunion des Bk . Alors
(i) une partie O de X est ouverte si et seulement si elle est union denombrable
delements de B ;
(ii) si X est en outre complet (donc polonais), alors une partie K de X est compacte si et seulement si elle secrit comme une intersection dunions finies dadherences


THEORIE
ABSTRAITE DE LA MESURE

37

delements de Bk ; en dautres termes,


\ [
Bk (xn(k,j) ).
(4)
K=
kN 1jNk

or`
Preuve du The
eme I-32. (i) Il est clair quune union delements de B est
ouverte. Pour verifier la reciproque, il suffit de prouver que tout x O appartient
`a un element de B. Puisque O est ouvert, il existe r > 0 tel que Br (x) O. Soit
k tel que k < r/2, et soit n tel que d(xn , x) < k . Nous allons constater que
Bk (xn ) O, ce qui conclura largument. Soit donc y tel que d(xn , y) < k ; alors
d(x, y) d(x, xn ) + d(xn , y) < k + k < r, donc y Br (x) et donc y O.
(ii) Montrons quune partie K de la forme (4) est compacte. Une union finie
de parties fermees etant fermee, K secrit comme une intersection (denombrable)
de parties fermees ; cest donc un ferme. Si lon parvient a` montrer que toute suite
`a valeurs dans K converge dans X, on saura que la limite est aussi dans K, et le
crit`ere de Bolzano-Weierstrass assurera que K est compact.
Soit donc (y )N une suite `a valeurs dans K. Par hypoth`ese, elle prend ses valeurs
dans un nombre fini de boules de rayon 1 ; lune de ces boules au moins contient
donc une infinite de termes de la suite. On peut donc extraire de (y ) une sous-suite
dont tous les elements sont `a distance au plus 1 les uns des autres. Mais la suite (y )
ainsi extraite est egalement `a valeurs dans une union finie de boules de rayon 2 ;
lune de ces boules au moins contient donc une infinite de termes de la suite, et on
peut extraire `a nouveau une sous-suite dont tous les elements sont `a distance au plus
2 les uns des autres. On continue ainsi le processus : par un procede dextraction
diagonale, il est possible de construire une suite extraite, toujours notee (y ), telle
que tous les y pour k sont `a distance au plus k les uns des autres. Cest donc
une suite de Cauchy, et grace `a lhypoth`ese de completude elle converge dans X, ce
qui conclut largument.
Reciproquement, soit K un compact, montrons quil peut secrire sous la forme (4).
Pour tout k, et pour tout x K, on peut trouver n tel que d(x, xn ) < k ; on
peut donc inclure K dans lunion des Bk (xn ), avec d(xn , K) < k . Par compacite
on peut extraire un sous-recouvrement ouvert. Il existe donc des elements xn(k,j)
(1 j Nk ) tels que K soit inclus dans lunion des Bk (xn(k,j)), a fortiori dans
lunion des Bk (xn(k,j) ), avec d(xn(k,j), K) < k . Cela etant valable pour tout k, on a
\ [
K K :=
Bk (xn(k,j)).
kN 1jNk

Soit maintenant y K , et soit k N. Par hypoth`ese, il existe xn tel que


y Bk (xn ), avec d(xn , K) < k . On a alors d(xn , y) k , et donc d(y, K)
k + k = 2k . Puisque k etait arbitraire, d(y, K) = 0, ce qui entrane y K. On
conclut que K = K, ce qui etait notre but.

I-2.7. Pourquoi les espaces localement compacts sont-ils agr
eables ? La
popularite des espaces localement compacts tient pour beaucoup `a ce que dans de
tels espaces on peut, dans de nombreuses situations, remplacer les ensembles ouverts
(identifies `a leurs fonctions indicatrices) par des fonctions plateaux, `a valeurs dans
[0, 1], continues et `a support compact. Cest ce quexpriment les deux theor`emes
suivants [Rudin, Theor`emes 2.12 et 2.13].

38

CHAPITRE I

(13 juin 2010)

or`
The
eme I-33 (lemme dUrysohn). Soit X un espace separe localement compact, O un ouvert et K un compact de X, K O. Alors il existe une fonction f ,
continue, `a valeurs dans [0, 1], qui vaut identiquement 1 au voisinage de K, et dont
le support est compact et inclus dans O. En particulier,
1K f 1O .

Th
eor`
eme I-34 (partition de lunite). Soient X un espace separe localement
compact, K un compact de X, et O1 , . . . , On une collection finie douverts, tels que
K Ok . Alors il existe des fonctions continues f1 , . . . , fn , `a valeurs dans [0, 1],
telles que chaque fk ait son support compact et inclus dans Ok , et
X
x K =
fk (x) = 1.
k

Si lon se donne un recouvrement quelconque O de K par des ouverts, alors on


peut en extraire un sous-recouvrement fini {O1 , . . . , On }, et la conclusion precedente
reste vraie.

f =0

f =1

Fig. 4. Le lemme dUrysohn


Le lemme suivant est egalement utile. On peut le voir comme une consequence
directe du lemme dUrysohn (pourquoi ?), mais on peut aussi considerer quil prec`ede
logiquement cet enonce.
Lemme I-35 (voisinages compacts). Soient X un espace localement compact, K
un compact de X, et O un voisinage ouvert de K. Alors il existe un compact K et
un ouvert O de X tels que
K O K O.

Preuve du Lemme I-35 dans le cas m


etrique. Soit F := X\O. Pour tout
x K, on a d(x, F ) > 0 ; on peut donc trouver rx > 0 tel que la boule Brx (x)
nintersecte pas X \ O, et soit par consequent incluse dans O. Par hypoth`ese, il
existe egalement un voisinage compact Kx de x. Considerons Cx := B rx /2 (x) Kx :
cest un voisinage compact de x, inclus dans O. Soit Vx un sous-ensemble ouvert
de Cx contenant x : les Vx recouvrent K ; par compacite on peut donc en extraire


THEORIE
ABSTRAITE DE LA MESURE

39

un sous-recouvrement fini Vx1 , . . . , VxK , et la famille des Cxk recouvre egalement K.


Lunion des Cxk est alors un voisinage compact de K, inclus dans O.

Preuve du Th
eor`
eme I-33 dans le cas m
etrique. Soient K et O comme
dans le Lemme I-35. On pose alors
f (x) :=

d(x, X \ K )
d(x, X \ K ) + d(x, O )

(noter que le denominateur ne sannule jamais).

trique. On ne demontrera que


Preuve du Th
eor`
eme I-34 dans le cas me
la premi`ere partie de lenonce, la deuxi`eme en decoulant facilement. Pour tout j, on
note Fj le complementaire dans X de lunion des ensembles Oi , pour i 6= j : cest
alors un ferme, et
\
\
K Fj ( Oi ) \ ( Oi ) Oj .
i

i6=j

Grace au Theor`eme I-33, on peut trouver une fonction fj `a support compact dans
Oj , `a valeurs dans [0, 1], qui vaille identiquement 1 sur un voisinage de K Fj . On
definit alors

fj (x)
si x K Fj

fj (x) :=
[
fj (x)

P
si
x

(
Oi )

i=1 fi (x)
i6=j

et on verifie que cette famille remplit toutes les conditions requises.

Voici pour finir un theor`eme enoncant que lon peut epuiser un espace localement compact et -compact par une famille de compacts gentiment embotes
(souvent appelee suite exhaustive de compacts) :
or`
The
eme I-36. Soit X un espace localement compact et -compact. Alors X
peut secrire comme lunion croissante dune famille de compacts (Kn )nN , telle que
Kn+1 soit voisinage de Kn . Pour tout compact K de X, il existe alors n0 N tel
que K soit inclus dans linterieur de Kn pour n n0 .
D
emonstration. Par hypoth`ese, on peut trouver des compacts (Cn )nN dont
lunion est X entier. Posons K1 = C1 . On va montrer quil existe un compact K2
qui contienne un voisinage de K1 , et C2 .
Pour chaque n on peut construire un ouvert On et un compact Cn , de sorte que
Cn On Cn . Il est clair que les On recouvrent X. En particulier, le compact C1 est
recouvert par un nombre fini des On : il existe N1 N tel que C1 O1 O2 . . .ON1 .
En particulier, le compact C1 . . . CN 1 est voisinage de C1 . Il suffit alors de poser
K2 := C1 . . . Cmax(2,N1 ) .
En repetant ce raisonnement, on construit par recurrence une suite (Kn )nN telle
que Kn+1 soit voisinage de Kn et contienne C1 . . . Cn+1 . La reunion des Kn est
donc X tout entier.
Soit Vn linterieur de Kn . Puisque Vn contient Kn1 , lunion croissante des Vn est
X tout entier. Si K est un compact de X, il est donc inclus dans Vn pour n assez
grand, ce qui conclut la preuve.


40

CHAPITRE I

(13 juin 2010)

I-3. R
egularit
e des espaces mesur
es
Comme on la dit, les mesures peuvent etre etudiees dans un cadre tr`es general.
Cependant, dans la pratique on utilise souvent certaines proprietes bien utiles de
regularite, en un sens vague, qui melent des hypoth`eses topologiques et des hypoth`eses de theorie de la mesure.
I-3.1. Vocabulaire de base.
D
efinition I-37 (finitude et -finitude). Une mesure sur un espace mesure X
est dite finie si X est de mesure finie ; elle est dite -finie si X peut secrire comme
une union denombrable densembles Ak de mesure finie.
Remarque I-38. Certains theor`emes importants dintegration sur les espaces
produits utiliseront crucialement des hypoth`eses de -finitude.
efinition I-39 (probabilite). Un espace mesure (X, ) est appele espace de
D
probabilite si [X] = 1.
Remarque I-40. Cette definition semble particuli`erement triviale, mais il ne
faut pas oublier quil a fallu attendre longtemps avant que lon comprenne que la
theorie de la mesure etait un cadre conceptuel naturel pour developper la theorie
des probabilites. Cette intuition est due `a Kolmogorov et (independamment) Ulam.
D
efinition I-41 (atome). On dit que x X est un atome pour la mesure si
[{x}] > 0.
Le choix de cette terminologie est transparent : un atome est une partie que lon
ne peut decouper, au sens de la theorie de la mesure, en morceaux plus petits.
D
efinition I-42 (concentration, negligeabilite). Soit (X, A, ) un espace mesure.
(i) Soit C un sous-ensemble quelconque de X ; on dit que est concentree sur
C si, pour toute partie mesurable A contenant C, on a [X \ A] = 0.
(ii) Soit N un sous-ensemble quelconque de X ; on dit que N est -negligeable si
N est contenu dans un ensemble mesurable A tel que [A] = 0.
(iii) Soit C un sous-ensemble quelconque de X ; on dit que charge C si, pour
toute partie mesurable A contenant C, on a [C] > 0.
Remarque I-43. Ces definitions se simplifient quand on se restreint `a des parties
mesurables : si A est mesurable,
est concentree sur A si et seulement si [X \ A] = 0 ;
A est -negligeable si et seulement si [A] = 0 ;
charge C si et seulement si [C] > 0.
Exemple I-44. La mesure x est concentree sur {x}, qui nest pas forcement
mesurable.

Intuitivement, les ensembles negligeables sont ceux qui ne devraient jouer aucun
role en integration. Cependant, il est parfois delicat de traduire cette intuition quand
ces ensembles ne sont pas mesurables. Ceci motive la notion suivante :
efinition I-45 (completude). Un espace mesure est dit complet sil poss`ede la
D
propriete suivante : si A est negligeable et B est inclus dans A, alors B est mesurable
(et donc automatiquement negligeable).


THEORIE
ABSTRAITE DE LA MESURE

41

Remarques I-46.
(i) Le sens du mot complet est different de celui quil
a dans espace metrique complet.
(ii) La completude est une propriete subtile, parfois bien commode, parfois source
de complications infinies. On verra plus tard que lon peut toujours completer
une mesure.
I-3.2. Mesures de Borel et r
egularit
e.
D
efinition I-47 (mesure de Borel). Soit X un espace topologique. La tribu B(X)
engendree par les ouverts de X est appelee tribu borelienne de X, et les mesures
definies sur cette tribu sont dites mesures de Borel.
La definition suivante est particuli`erement importante. Elle exprime le fait que
les ensembles boreliens, pour compliques quils soient, peuvent etre approches au
sens de la mesure, de linterieur par des ensembles topologiquement petits (des
compacts), et de lexterieur par des ensembles topologiquement gros (des ouverts).
efinition I-48 (regularite). Soit (X, ) un espace topologique et une mesure
D
definie sur une tribu A de X contenant la tribu borelienne. On dit que est reguli`ere
si elle verifie la propriete caracteristique suivante : pour tout ensemble mesurable
A A on a


[A] = inf [O]; O ouvert, A O


= sup [K]; K compact, K A .
La regularite dune mesure implique automatiquement que les ensembles mesurables se decomposent en une partie reguli`ere et une partie de mesure nulle, au
sens de la proposition suivante.

Proposition I-49 (mesurabilite, F et G ). Soit X un espace topologique et


soit une mesure reguli`ere sur X, definie sur une -alg`ebre A contenant la tribu
borelienne. Alors, toute partie A A (et en particulier tout Borelien), de mesure
finie, peut secrire sous la forme F N, o`
u F est une union denombrable de fermes
(un F ) et N un ensemble negligeable ; elle peut egalement secrire sous la forme
G \ N , o`
u G est une intersection denombrable douverts (un G ) et N un ensemble
negligeable.
D
emonstration. Par regularite, on peut trouver une suite de compacts Kj et
douverts Oj tels que Kj A Oj et [Kj ] [E], [Oj ] [E]. Quitte `a poser

K1 = K1 , Kj = Kj1
Kj , O1 = O1 , Oj = Oj1
Oj , on peut supposer que les
Kj sont croissants et les Oj decroissants. On pose alors F = Kj et G = Oj . La
conclusion decoule de la -additivite de .

La regularite va souvent de pair avec la propriete suivante :
efinition I-50 (finitude sur les compacts). Une mesure de Borel sur un
D
espace topologique X est dite finie sur les compacts5 si pour tout compact K de X
on a [K] < +.
5Une

mesure de Borel finie sur les compacts est parfois appelee mesure de Radon ; parfois on
impose aussi des proprietes de regularite, au sens indique plus loin [Evans-Gariepy].

42

CHAPITRE I

(13 juin 2010)

Exemple I-51. La mesure de comptage sur R nest ni finie sur les compacts,
ni reguli`ere, puisque la mesure de tout segment non trivial, et de tout ouvert non
trivial, est +.
Enfin la regularite est liee de mani`ere quelque peu subtile `a la propriete de additivite, comme le montre lenonce suivant (que lon peut considerer `a ce stade
comme une curiosite, mais qui sav`erera utile dans le Chapitre ??) :
Proposition I-52. Soient A et B deux alg`ebres, avec A B, et : B R+ une
fonction additive densembles, verifiant la propriete de regularite interieure partielle
n
o
(5)
B B [B] = sup [K]; K compact, K B, K A .

Alors est -additive sur A.

Remarque I-53. La Remarque VI-62 montrera que lhypoth`ese 5 est cruciale.


Preuve de la Proposition I-52. Soit verifiant les hypoth`eses du theor`eme.
Par
P aditivite on a, pour toute famille (Ak )kN densembles mesurables disjoints,
u
1kN [Ak ] [kN Ak ], do`
X
[ 
[Ak ]
Ak .
kN

kN

P
Si nest pas -additive, il existe des (Ak )kN disjoints tels que
kN [Ak ] <
[Ak ], en dautres termes on peut trouver > 0 tel que pour tout N N,
N
X
k=1

[Ak ] [kN Ak ] =

N
X
k=1

[Ak ] +

 [

kN +1


Ak ;

do`
u [kN +1 Ak ] (ici on utilise le fait que est `a valeurs finies). Posons
C = k+1 Ak : alors (C )N est une suite decroissante de compacts dintersection
vide, et [C ] pour tout .
Pour chaque N, soit K un compact tel que K C , K A, et [C \ K ]
(+1)
2
. Alors K1 . . . K A et
X

K1 . . . K ] [C ]
2(j+1) /2 = /2;

en particulier K1 . . . K est non vide. Les compacts (K1 . . . K )N forment


une suite decroissante de compacts non vides, leur intersection est donc non vide,
en contradiction avec le fait que les C eux-memes sont dintersection vide.

I-3.3. Th
eor`
emes de r
egularit
e automatique. Les espaces polonais dune
part, les espaces localement compacts dautre part, jouissent de proprietes bien commodes. En particulier, on a le resultat suivant, qui peut paratre surprenant au
premier abord :

Th
eor`
eme I-54 (Regularite des mesures sur les espaces polonais). Soit X un espace polonais muni dune mesure borelienne , -finie. Alors est automatiquement
reguli`ere, et concentree sur un ensemble -compact.
Dans le cas o`
u [X] < +, la derni`ere assertion de ce theor`eme est connue sous
le nom de lemme dUlam. Voici un corollaire immediat du Theor`eme I-54.
Corollaire I-55 (Regularite des mesures sur Rn ). Soit une mesure de Borel
sur Rn , finie sur les compacts ; alors est reguli`ere.


THEORIE
ABSTRAITE DE LA MESURE

43

Avant de demontrer le Theor`eme I-54, mentionnons sans demonstration une


variante qui sapplique `a des espaces topologiques localement compacts [Rudin,
Theor`eme 2.18], et implique egalement le Corollaire I-55.
ore
`me I-56 (Regularite des mesures dans un espace localement compact).
The
Soit X un espace separe localement compact, dans lequel tout ouvert est -compact,
muni dune mesure de Borel , finie sur les compacts. Alors est automatiquement
reguli`ere.
Remarque I-57. Il est facile de verifier que les ouverts de Rn , ou dune variete de
dimension finie, sont -compacts. Par ailleurs, on trouvera dans [Rudin, Chapitre 2,
exercice 18] un contre-exemple montrant que la conclusion du Theor`eme I-56 nest
pas forcement vraie sans lhypoth`ese quelque peu etrange de -compacite des ouverts.
Voici maintenant une preuve du Theor`eme I-54, inspiree de celle que lon trouve
par exemple dans [Dudley, p. 225]. La demonstration utilisera un resultat dont la
preuve se trouve plus loin (Theor`eme I-68), mais bien s
ur il ny a pas de cercle
vicieux !
Preuve du th
eor`
eme I-54. 1. Dans le debut de cette preuve, on suppose que
est finie. Soit > 0, montrons quil existe un compact K tel que [X \ K ] .
De ce resultat il sera facile de deduire (exercice) que est concentree sur lensemble
-compact S := kN K1/k .
Par hypoth`ese, il existe une suite (xn )nN dense dans X. En particulier,
X = n1 B(xn , 1),

et donc [X] = limn [kn B(xk , 1)]. Comme [X] < +, on peut donc trouver
n1 tel que


X \ (kn1 B(xk , 1)) .
2
De meme, pour tout j on peut trouver nj tel que



X \ (knj B(xk , 1/j)) j .


2
Posons

\
knj B(xk , 1/j) .
K :=
j1

Dune part, K est totalement borne : en effet, si > 0 est donne on peut choisir
j 1/ et on a
K knj B(xk , 1/j) knj B(xk , ).
Dautre part, K est ferme car intersection de fermes ; comme lespace ambiant X
est complet, il sensuit que K est egalement complet. Etant complet et totalement
borne, il est compact. Enfin,
[X \ K ] = [j (X \ knj B(xk , 1/j))]

[j (X \ knj B(xk , 1/j))]


X

[X \ (knj B(xk , 1/j))]


j1

X
j1

2j = .

44

CHAPITRE I

(13 juin 2010)

2. Montrons maintenant que est reguli`ere. Soit A un ensemble mesurable, et


> 0, nous voulons montrer quil existe un ouvert O contenant A et un compact K
inclus dans A tels que
[O] [A] [K] + .

On va dabord supposer que X est compact : il y a alors identite entre compacts


et fermes. Definissons F comme la famille de toutes les parties boreliennes A de X
telles que, pour tout > 0 on peut trouver un ouvert O contenant A, et un ferme
F contenu dans A, satisfaisant `a
(6)

[O] [A] [F ] + .

Clairement, notre but est de montrer que F concide avec lensemble de la tribu des
boreliens. Il est tr`es facile de montrer que F est stable par passage au complementaire.
Il est egalement stable par union croissante : en effet, si Ak est une famille croissante
delements de F , et A = Ak , on peut choisir k0 tel que [Ak0 ] [A] /2, et un
compact K contenu dans Ak0 tel que [Ak0 ] [K] + /2, ce qui impliquera
[A] [Ak0 ] + /2 [K] + .
On peut egalement, pour tout k N, introduire un ouvert Ok contenant Ak , tel que
[Ok ] [Ak ] + 2k ; alors O = Ok verifie A O et O \ A (Ok \ A), donc
X
2k = .
[O \ A]
kN

3. Si lon montre que F contient tous les ensembles ouverts, le Lemme de


Classe monotone (Theor`eme I-68, demontre plus loin) impliquera que F est la tribu
borelienne tout enti`ere. Si A est ouvert, linegalite de gauche dans (6) est trivialement verifiee par O = A ; pour montrer linegalite de droite, il suffit de prouver
lexistence dune famille croissante densembles fermes Fk inclus dans A tels que
[Fk ] [A]. Introduisons, pour k N,
n
o
Fk := x A; d(x, X \ A) 1/k .

Soit x A ; comme A est ouvert, on peut inclure dans A une boule ouverte centree
en x, et donc x est `a une distance positive de X \ A. Le point x appartient donc
`a Fk pour k assez grand, on conclut que lunion des Fk est A tout entier. Les Fk
formant une famille croissante, on a donc [Fk ] [A]. Or chaque Fk est ferme,
puisque image reciproque de lintervalle ferme [1/k, +[ par lapplication continue
(et meme 1-Lipschitzienne) x 7 d(x, A).
4. Eliminons maintenant lhypoth`ese de compacite de X. Soient A mesurable
et > 0. Comme est concentree sur un ensemble -compact, on peut trouver
un compact X X tel que [X \ X ] /2. Lespace X est metrique, separable
et complet, il est en outre compact, on sait donc que la restriction de `a X est
reguli`ere. Il existe donc un ouvert O de X , contenant A = X A, et un compact
K de X , contenu dans A , tels que
[O ] /2 [A ] [K ] + /2.


THEORIE
ABSTRAITE DE LA MESURE

45

Comme intersection de compacts, K est automatiquement compact. Par ailleurs,


on peut ecrire O = X O pour un certain ouvert O contenant A. Mais alors,
[O] [O ] + [X \ X ] [O ] + /2 [A ] + [A] + ,

et
[A] [A ] + [X \ X ] [A ] + /2 [K ] + .

On en deduit que est bien reguli`ere.


5. Eliminons finalement lhypoth`ese de finitude de . Par hypoth`ese, il existe
une famille (Xn )n1 de parties de X de mesure finie, dont lunion est X entier. Sans
perte de generalite, on peut supposer que Xn est une famille croissante. Definissons
une famille de mesures n par
n [A] := [A Xn ].
Il est clair que n est finie ; dapr`es le morceau de demonstration dej`a effectue, elle
est donc concentree sur un ensemble -compact Sn . Par consequent, est concentree
sur lunion des Sn , qui est une union denombrable dunions denombrables de compacts ; et donc une union denombrable de compacts. On verifie enfin la propriete de
regularite. Soit A un ensemble mesurable de X, et soit > 0. Pour tout n, on peut
trouver un compact Kn et un ouvert On tels que
K n A Xn O n ,

avec [O \ (A Xn )] < 2n ; et [(A Xn ) \ Kn ] < /2. On pose O = On : alors


O est un ouvert contenant (A Xn ) = A, et
X
X
[O \ A] = [(On ) \ ((A Xn ))]
[On \ (A Xn )] < (
2n ) = .
n

Pour lautre sens, distinguons deux cas. Si [A] = +, alors [A Xn ] +, et


linegalite [Kn ] [A Xn ] implique [Kn ] . Si en revanche [A] < +,
alors on peut trouver N N tel que

[A XN ] [A] .
2
Il sensuivra

[KN ] [A XN ] [A] .
2
Dans tous les cas, on a bien [A] = sup{[K]}, o`
u K decrit lensemble des compacts
inclus dans A. Ceci ach`eve de prouver la regularite.

I-3.4. Concentration et caract`
ere diffus. Une mesure borelienne sur un
espace mesure X peut etre concentree sur un petit sous-ensemble de X, ou au
contraire voir tout X. La notion de support permet de preciser cette intuition :
le support est le plus petit ferme sur lequel est concentree.
Th
eor`
eme I-58 (support). Soit X un espace topologique separe et une mesure borelienne reguli`ere sur X. On peut alors definir le support de comme le
complementaire du plus grand ouvert sur lequel est identiquement nulle.
Corollaire I-59. Si (X, ) est un espace polonais -fini, alors on peut definir
le support de .

46

CHAPITRE I

(13 juin 2010)

Remarque I-60. On pourra comparer la notion de support dune mesure `a celle


de support dune fonction continue `a valeurs reelles, que lon definit comme le plus
petit ferme en-dehors duquel f est identiquement nulle.
D
emonstration du Th
eor`
eme I-58. Soit la reunion de tous les ouverts
X tels que [] = 0. Par construction contient tout ouvert o`
u sannule ;
le but est de montrer que [] = 0, et bien s
ur cela nest pas evident car cest une
union a priori non denombrable.
Supposons que [] soit strictement positif ; par regularite il existe alors un
compact K tel que [K] > 0. Pour tout x K il existe un ouvert = x
contenant x, tel que [x ] = 0. Par compacite on peut trouver
J N et x1 , . . . , xJ
P
K tels que K {xj ; 1 j J}. Alors [K]
[xj ] = 0, ce qui est en
contradiction avec lhypoth`ese. On conclut effectivement que [] = 0.

Remarque I-61. Le corollaire I-59 decoule directement du Theor`eme I-58 et
du theor`eme de regularite automatique dans les espaces polonais (Theor`eme I-54).
Cependant on peut aussi le demontrer plus simplement, en notant quun espace
polonais admet une base B denombrable douverts (comme dans le Theor`eme I32). Le support de peut alors etre construit comme le complementaire de lunion
(forcement denombrable) de tous les ouverts de B tels que [] = 0.
Si une mesure est diffuse, on peut le quantifier par la propriete davoir un
support plein (Spt = X). On peut egalement raffiner en introduisant la propriete
de doublement.
D
efinition I-62 (doublement). Soient (X, d) un espace metrique muni de sa
tribu borelienne, et une mesure de Borel sur X. Soit C 0 une constante ; on dit
que est C-doublante si, pour tout x X et r > 0 on a
[B2r (x)] C [Br (x)].

On dit que est doublante si elle est C-doublante pour un C 0.


Remarque I-63. Il est equivalent de definir ce concept en termes de boules
ouvertes ou de boules fermees. En effet, par -additivite,
[Br (x)] = lim [Brn1 ] (x)],
n

[Br] (x)] = lim [Br+n1 (x)].


n

Exemples I-64. Nous verrons plus tard que la mesure de Lebesgue en dimension
n est 2n -doublante. La mesure de volume sur une variete riemannienne compacte
(ou plus generalement, de courbure
P minoree, en un sens adequat) est egalement
doublante. En revanche la mesure nN n sur N (ou R) nest pas doublante : par
exemple, la boule B1/2 (1/2) a pour masse 0, alors que la boule B1 (1/2) a pour
masse 2.
Intuitivement, une mesure doublante est bien repartie : quand on fait varier le
rayon dune boule, on nobserve pas de variations trop brusques de la mesure... Le
theor`eme suivant precise cette idee.
or`
The
eme I-65. Soit une mesure reguli`ere doublante sur un espace metrique
(X, d), non identiquement egale `a 0 ou +. Alors
- pour tout x X et r > 0 on a 0 < [Br (x)] < + ;
- la mesure ne peut avoir datome en dehors des points isoles de X.


THEORIE
ABSTRAITE DE LA MESURE

47

D
emonstration. Soit C telle que soit C-doublante. Supposons dabord quil
existe x X et r > 0 avec [Br (x)] = 0. Alors [B2r (x)] C[Br (x)] = 0. Par
recurrence, [B2k r (x)] = 0 pour tout k. Puisque X est lunion croissante des boules
B2k r (x), [X] = 0 par -additivite, ce qui est contraire `a lhypoth`ese. On conclut
que [Br (x)] > 0.
Puisque nest pas identiquement +, il existe au moins un x0 X tel que
[{x0 }] < +. Par regularite, il existe un ouvert contenant x0 dont la mesure soit
finie, et donc une boule Br0 (x0 ) dont la mesure soit finie. Par le meme raisonnement
que ci-dessus, toutes les boules B2k r0 (x0 ) sont de mesure finie. Si x X et r > 0
sont donnees, on peut toujours trouver k tel que Br (x) B2k r0 (x0 ), ce qui implique
que Br (x) est aussi de mesure finie.
Soit maintenant x X, qui ne soit pas un point isole ; montrons que [{x}] = 0.
Supposons par labsurde que [{x}] = > 0, et soit > 0, `a choisir plus tard. Par
regularite on peut trouver > 0 tel que [B (x)] + . Comme x nest pas isole,
la boule B/2 (x) ne se reduit pas `a x ; soit donc y 6= x tel que d(x, y) < /2. On
pose r := d(x, y). La boule Br (y) est tout enti`ere contenue dans B (x) (pour tout
z Br (y) on a d(x, z) d(x, y) + d(y, z) < r + r < ). Comme par ailleurs Br (y) ne
contient pas x, on a
+ [Br (y)] = [{x}] + [Br (y)] = [{x} Br (y)] [Br (y)] + .

On en deduit que [Br (y)] . Dautre part, x B2r (y), do`


u [B2r (y)] . La
mesure etant C-doublante, on a
[B2r (y)] C[Br (y)] C.

On obtient une contradiction en choisissant = /(2C).

I-4. Prolongement de mesures


Comme on la dej`a dit, on veut souvent definir a priori la valeur dune mesure sur
une certaine classe densembles : par exemple, les paves dans R2 ou Rd . En general,
il nest pas evident que lon puisse le faire, cest-`a-dire quil existe une mesure qui
attribue des valeurs specifiees a priori sur certains ensembles. Un tel resultat est
appele th
eor`
eme de prolongement (ou dextension).
Le theor`eme de prolongement le plus cel`ebre et le plus utile a ete demontre
vers 1914 par Caratheodory, qui `a cette occasion a developpe le concept important
de mesure ext
erieure6, ou mesure de Caratheodory.
Avant de demontrer ce theor`eme, nous allons examiner un resultat beaucoup
plus simple, qui est loutil le plus utilise pour montrer que deux mesures concident
sur une tribu enti`ere : le lemme de classe monotone (dej`a utilise dans la preuve
du Theor`eme I-54).
I-4.1. Lemme de classe monotone.
D
efinition I-66 (classe monotone). On appelle classe monotone une famille C
de parties dun ensemble X, stable par limite croissante et par difference :
[
Ak C, Ak Ak+1 =
Ak C,
kN

[A, B C, A B] = B \ A C.

6que

certains auteurs appellent tout simplement mesure [Evans-Gariepy]

48

CHAPITRE I

(13 juin 2010)

Remarque I-67. Noter que dans cette definition on a impose B \ A C seulement dans le cas o`
u A B.
Bien s
ur, une -alg`ebre est une classe monotone ; et reciproquement, il ne manque
pas grand chose `a une classe monotone pour etre une -alg`ebre : seulement la stabilite
par intersection, et la condition de contenir X. Le lemme suivant donne une condition
suffisante pour quil y ait identite.
or`
The
eme I-68 (Lemme de classe monotone). Soit F une famille de parties
dun ensemble X, stable par intersection finie. Soit C la plus petite classe monotone
contenant F ; on suppose que X C. Alors C concide avec la tribu (F ) engendree
par F .
D
emonstration. Il suffit bien s
ur de verifier que C est une tribu : en effet,
toute tribu contenant F doit forcement contenir C.
Notre but est donc de verifier que pour tout A et B dans C, on a A B C ;
cette propriete, combinee aux axiomes de classe monotone, garantira que C est une
tribu. Cependant ce resultat de stabilite par intersection semble a priori delicat car
nous navons aucun moyen de decrire C ; nous allons contourner cette difficulte en
utilisant un raisonnement classique.
Soit dabord A F , et
CA = {B C; A B C}.

Par hypoth`ese, CA contient F . Dautre part, on verifie aisement que CA est stable par
difference et limite croissante ; il sensuit que cest une classe monotone contenant
F , et cest donc C tout enti`ere. On a donc demontre que pour tout A F , et B C,
on a A B C.
Maintenant, pour A C, on definit `a nouveau
CA = {B C; A B C}.

La premi`ere etape nous montre que CA contient F . On conclut comme precedemment


que CA = C.

Le lemme de classe monotone est un outil dusage universel en theorie de la
mesure, car ses hypoth`eses saccordent bien avec la propriete de -additivite des
mesures (finies). En effet, si A et B sont deux ensembles mesurables et une mesure,
en general on ne sait pas calculer [AB] en fonction de [A] et [B] ; mais si A B
on sait que [B\A] = [B][A]. De meme, si lon a une suite croissante densembles
mesurables Ak , on sait que [Ak ] = lim [Ak ].
I-4.2. Th
eor`
eme de prolongement de Carath
eodory. Soient A une alg`ebre
de parties de X, et une fonction additive sur A, i.e. une fonction positive verifiant
laxiome dadditivite [A B] = [A] + [B] pour A et B disjoints. Peut-on etendre
en une mesure -additive sur la -alg`ebre engendree par A ? Pour cela il faut
bien s
ur que soit -additive sur A lui-meme : supposant quun element A de A
secrive comme union disjointe delements Ak de A (par exemple, un rectangle dans
R2 peut secrire comme une union denombrable de rectangles disjoints, dune infinite
de mani`eres differentes), on doit avoir
X
[A] =
[Ak ].
kN


THEORIE
ABSTRAITE DE LA MESURE

49

or`
The
eme I-69 (theor`eme de prolongement de Caratheodory). Soient X un
ensemble, A une alg`ebre de parties de X, et une fonction positive -additive sur
A, telle que X peut secrire comme union denombrable de Ak A avec [Ak ] < +.
Alors il existe un unique prolongement de en une mesure (-additive) definie sur
la -alg`ebre (A).
Remarque I-70. La propriete de -additivite sur A nest pas forcement evidente
`a verifier. Si [X] < +, elle est equivalente `a la condition suivante, parfois plus
commode : pour toute suite decroissante (Ak )kN delements de A,
(Ak = ) = lim [Ak ] = 0.
k

Si [X] = +, il existe aussi une reformulation analogue, mais elle est un


tout petit peu plus delicate. Par hypoth`ese, X est union croissante de parties Xk
appartenant `a A, de mesure finie. Soit B un element de A de mesure infinie, on peut
ecrire B comme lunion croissante des [B Xk ], et une condition necessaire `a la
-additivite sur A est limk [B Xk ] = [B] = +. Il est en fait assez facile de
montrer que lhypoth`ese de -additivite sur A est equivalente `a la conjonction des
deux hypoth`eses suivantes :
(i) pour toute suite decroissante (Ak )kN delements de A,

[A0 ] < + et Ak = = lim [Ak ] = 0;
k

(ii) pour tout B A tel que [B] = +, on a

lim [B Xk ] = +.

On peut trouver des preuves du Theor`eme I-69 dans diverses sources, par exemple
[Bony, section 1.6], [Gramain, section VI.1] ou [Dudley, Theor`eme 3.1.4]. Je vais
maintenant adapter ces preuves pour demontrer un enonce plus general, qui contient
le Theor`eme de Caratheodory comme cas particulier. Linteret propre de lenonce
generalise apparatra par la suite.
Th
eor`
eme I-71 (theor`eme de Caratheodory generalise). Soient X un ensemble,
et F une famille de parties de X, stable par intersection finie. Soit une fonction
definie sur F , `a valeurs dans [0, +]. Alors
(i) Si X est union denombrable dune famille croissante delements Xk de F tels
que [Xk ] < +, alors il existe au plus un prolongement de en une mesure sur
(F ) ;
(ii) Soit, pour toute partie A de X,
)
(
X
[Ak ]; Ak F ; A Ak .
[A] := inf
k=1

On suppose que
(7)

A, B F ,

[A B] + [A \ B] = [A].

Alors definit sur (F ) une mesure qui prolonge . En outre, cette mesure est
-additive sur la -alg`ebre M, contenant (F ), definie par


M := A X; B X, [B A] + [B \ A] = [B] .

50

CHAPITRE I

(13 juin 2010)

Les elements de M sont dits -mesurables ; la tribu M, munie de , est automatiquement compl`ete.
(iii) On suppose maintenant que non seulement F est stable par intersection finie, mais quen outre le compl
ementaire de tout
el
ement de F peut s
ecrire
comme une union finie disjointe d
el
ements de F . Alors la condition (7) est satisfaite si et seulement si est -additive sur F ; i.e. pour toute famille denombrable
(An )nN delements disjoints de F tels que An appartient `a F , on a
[
X
[
An ] =
[An ].
nN

nN

En particulier, admet un prolongement -additif `a (F ) si et seulement si


est -additive sur F .
Remarques I-72.
(i) La fonction est appelee mesure ext
erieure associee `a (et `a la famille F ). Bien noter quelle est definie pour toute partie
A de X. Ce nest pas a priori une mesure ; en revanche elle est croissante,
et verifie laxiome de sous-additivit
e d
enombrable : pour toute famille
denombrable (Ak )kN de parties de X,
X
[Ak ].
[Ak ]
k

Noter que dans cette definition il est inutile de supposer les Ak disjoints. Par
extension, on appelle mesure exterieure nimporte quelle application definie
sur lensemble des parties dun ensemble, `a valeurs dans [0, +], qui soit
croissante, attribue la valeur 0 `a lensemble vide, et verifie laxiome de sousadditivite denombrable.

(ii) Il est crucial, dans la definition de la mesure exterieure, dautoriser une union
denombrable et pas seulement une union finie de Ak . Pour sen convaincre, on
peut penser au cas de la mesure de Lebesgue sur lintervalle [0, 1], que lon
peut construire `a partir de la mesure exterieure associee `a lensemble F des
sous-intervalles de [0, 1], et `a la fonction =longueur. En effet, si lon cherche
`a recouvrir Q [0, 1] par une famille finie dintervalles, la somme des longueurs
de ces intervalles est forcement superieure ou egale `a 1. En revanche, pour tout
on peut recouvrir Q [0, 1] par une famille d
enombrable dintervalles dont
la somme des longueurs est plus petite que .
(iii) Sans lhypoth`ese de -finitude faite en (i), il ny a pas forcement unicite
du prolongement. Quand elle prolonge effectivement , la mesure exterieure
est alors le plus grand prolongement possible [Gramain, p. 116].
(iv) Une partie F qui verifie les hypoth`eses de la partie (iii) du theor`eme, `a
savoir : F est stable par intersection binaire ; et le complementaire de tout
element de F est reunion dun nombre fini delements disjoints de F ; est parfois
appele une semi-alg`
ebre. Une alg`ebre etant un cas particulier de semi-alg`ebre,
la conclusion de ce theor`eme implique bien s
ur celle du Theor`eme I-69.
La partie (ii) du Theor`eme I-71 est assez subtile. En revanche, la partie (i) est
une application simple du Lemme de classe monotone.


THEORIE
ABSTRAITE DE LA MESURE

51

D
emonstration du Th
eor`
eme I-71. Commencons par demontrer (i) sous
lhypoth`ese [X] < +. Le Lemme de classe monotone (Theor`eme I-68) sapplique
puisque X est par hypoth`ese limite croissante delements de F . Donc la -alg`ebre
(F ) nest autre que la classe monotone C engendree par F . Soient et
e deux
prolongements possibles. On pose
B = {C C; [A] =
e[A]}.

Par hypoth`ese, B contient F . Comme et


e sont compatibles avec les operations
de limite croissante et de soustraction, au sens o`
u
(8)

A B = [B \ A] = [B] [A],

etc.,

on voit que B est une classe monotone. Il sensuit que B = C, ce qui conclut la preuve
de (i). Notons que lhypoth`ese de finitude a ete utilisee implicitement quand nous
avons ecrit (8), qui naurait gu`ere de sens si [B] = [A] = +.
Passons maintenant `a la demonstration de (i) dans le cas general. Soient et
e
deux prolongements possibles ; par le raisonnement precedent on sait que [Xk A] =

e[Xk A] pour tout A mesurable. La famille (Xk ) etant croissante, la famille (Xk A)
lest aussi, et son union est X A = A. Par -additivite, on peut passer `a la limite
quand k et obtenir [A] =
e[A], ce qui conclut la preuve de (i).
On sattelle ensuite `a la demonstration de (ii). Comme dans lenonce, on definit


M := A X; B X, [B A] + [B \ A] = [B] .

Nous allons montrer que M est une -alg`


ebre, et une mesure sur M ; cette
-alg`ebre est en outre compl`ete. Cet enonce est independant de lhypoth`ese (7). On
divise la preuve en sept etapes.
1. est croissante. En effet, si A A, linfimum qui definit [A ] est pris sur
une classe de familles de parties plus vaste que celui qui definit [A].
2. est denombrablement sous-additive. En dautres termes, si (Ak )kN est une
famille de parties de X, on a
X
[Ak ]
[Ak ].

Si [Ak ] = + pour un certain Ak , alors bien s


ur il ny a rien `a demontrer. Dans
le cas contraire, par definition de la borne inferieure, pour tout k on peut trouver
une famille (Fjk )jN delements de F tels que
X
Ak j Fjk ,
[Fjk ] [Ak ] + 2k ,
j

o`
u > 0 est arbitrairement petit. En particulier,
[
X
X
(Ak )
Fjk ,
[Fjk ]
[Ak ] + .
jk

jk

Il sensuit que [Ak ]


[Ak ] + , et on obtient la conclusion souhaitee en
faisant tendre vers 0.
Notons en particulier que pour toutes parties A et B de X,
[B] [B A] + [B \ A].

Pour prouver lappartenance dune partie A `a M, il suffit donc detablir linegalite


inverse.

52

CHAPITRE I

(13 juin 2010)

3. M est une alg`ebre. Dune part, il est clair que appartient `a M ; et il est
evident que M est stable par passage au complementaire. Il suffit donc de verifier
que M est stable par intersection. Soient A1 et A2 deux elements de M, et soit B
une partie quelconque de X. Notre but est de montrer que
[B (A1 A2 )] + [B \ (A1 A2 )] [B].

Pour cela, on note que B \ (A1 A2 ) = ((B A1 ) \ A2 ) (B \ A1 ), do`


u, par
sous-additivite,
[B \ (A1 A2 )] [((B A1 ) \ A2 )] + [B \ A1 ].

En combinant cette inegalite avec lappartenance de A1 et de A2 `a M, on obtient

[B A1 A2 ]+ [B \ (A1 A2 )] [(B A1 ) A2 ]+ [(B A1 ) \ A2 ]+ [B \ A1 ]

= [B A1 ] + [B \ A1 ] = [B],
ce qui conclut largument.
4. est additive sur M. En effet, considerons A et B deux elements disjoints
de M ; puisque B M, on a
[A B] = [(A B) A] + [(A B) \ A] = [A] + [B],

ce qui prouve ladditivite de .


Par ailleurs, si A1 et A2 sont deux elements disjoints de M, alors pour toute
partie B de X,
[B(A1 A2 )] = [(B(A1 A2 )A1 ] [(B(A1 A2 ))\A1 ] = [BA1 ]+ [BA2 ];
par recurrence on obtient que si on se donne des elements Ak de M, disjoints et en
nombre fini, alors, pour toute partie B de X on a
X
[B (Ak )] =
[B Ak ].

5. M est une -alg`ebre. Pour montrer cela, il nous suffit de verifier que pour
toute famille denombrable de parties Ak disjointes, elements de M, et pour toute
partie B de X,
[B (Ak )] + [B \ (Ak )] [B].
Posons An = nk=1 Ak , A =
es lidentite etablie `a letape 4, et la
k=1 Ak . Dapr`

croissance de , on sait que pour tout n,


n
X

n
[B] = [B A ] + [B \ A ]
[B Ak ] + [B \ A ].
k=1

En passant `a la limite n , et en utilisant la sous-additivite, on trouve

[B]

X
k=1

[B Ak ] + [B \ A ]
[B A ] + [B \ A ] [B].

Les trois membres de linegalite sont donc egaux, ce qui prouve que A M. En
particulier,
[B A ] + [B \ A ] = [B].


THEORIE
ABSTRAITE DE LA MESURE

53

6. est -additive sur M. Pour sen convaincre, il suffit de poser B = X dans


legalite precedente.
7. (X, M, ) est un espace complet. Soit A M avec [A] = 0 ; en particulier,
pour tout B X on a [B \ A] = [B]. Soient A A et B X, alors [A
B] [A] = 0, et [B] [B \ A ] [B \ A] = [B]. On conclut que
[B \ A ] = [B], et [A ] = 0, donc A est -mesurable.
Recapitulons : nous avons defini une -alg`ebre M et une mesure sur M.
Pour conclure la preuve de (ii), il nous suffit de prouver que M contient F (ce
qui impliquera que (F ) M), et que concide avec sur F . Cest ici que
lhypoth`ese (7) va intervenir.
Posons B = dans (7), on trouve [A] = [A] pour tout A F , ce qui montre
que la restriction de `a F est bien .
Soient maintenant A F , et B X. Soit (Ak ) une famille delements de F
recouvrant B ; la famille (Ak A) recouvre alors B A, et tous ses elements appartiennent `a F grace `a la propriete de stabilite par intersection finie. En appliquant
successivement la definition de , sa sous-additivite et lhypoth`ese (7), on trouve
X
[B A] + [B \ A]
[Ak A] + [B \ A]
k

X
k

 X
[Ak A] + [Ak \ A] =
[Ak ].
k

En prenant la borne inferieure sur tous les recouvrements (Ak ) admissibles, on parvient `a
[B A] + [B \ A] [B];

linegalite reciproque est toujours verifiee, il y a donc egalite, ce qui signifie que
A M. La preuve est compl`ete.

Passons enfin `a la partie (iii) du Theor`eme I-71. Si le crit`ere (7) est verifie, alors
se prolonge en une mesure -additive , et en particulier elle est -additive sur
F ; cest bien s
ur la reciproque qui est delicate. On va donc supposer que est
-additive sur F et etablir (7). On proc`ede en trois etapes.
1. est croissante sur F. Soient A et B deux elements de F avec A B. Par
hypoth`ese on peut ecrire X \ A = Cj , o`
u les Cj sont des elements de F , disjoints ;
alors
[
B = A (B \ A) = A (A Cj ),
j

o`
u le membre de droite est une union delements disjoints de F ; par additivite de
on a
X
[B] = [A] +
[A Cj ] [A],
j

ce qui prouve que est bien croissante.


2. concide avec sur F. Dapr`es la definition de , on a toujours [A]
[A] pour tout A F . Dautre part, soit A F et soit (An )nN un recouvrement
arbitraire de A par des elements de F , cest-`a-dire A An . On pose
A1 = A1 ,

A2 = A2 \ A1 ,

A3 = A3 \ (A1 A2 ),

A4 = A4 \ (A1 A2 A3 ),

etc.

54

CHAPITRE I

(13 juin 2010)

Verifions que chacun des Aj peut s


ecrire comme une union finie de parties
disjointes appartenant `
a F . En effet, par hypoth`ese, pour chaque j on peut
trouver des parties disjointes Bj,ij , 1 ij Nj , appartenant `a F , telles que
Aj = Aj (X \ A1 ) (X \ A2 ) . . . (X \ Aj1 )
= Aj (
=

N1
[

i1 =1

i1 ,...,ij1

B1,i1 ) (

N2
[

Nj1

i2 =1

B2,i2 ) . . . (

Bj1,ij1 )

ij1 =1

Aj B1,i1 . . . Bj1,ij1 .

Pour chaque j, les Bj,ij sont disjoints ; cela entrane que pour deux choix differents
du multi-indice (i1 , . . . , ij ), les parties A Aj B1,i1 . . . Bj1,ij1 correspondantes
sont disjointes. Pour chaque j donne, la reunion de toutes ces parties constitue Aj , et
par construction les Aj sont deux `a deux disjoints. On conclut que toutes les parties
Aj B1,i1 . . . Bj1,ij1 ,
que lon renumerote Cjk (1 k Mj ) sont disjointes. Par construction, leur union
est egale `a An ; et grace `a la stabilite de F par intersection finie, toutes ces parties
sont des elements de F . En outre, pour tout j on a
[
Aj Ck ;
Aj =
1j, 1kM

do`
u, par -additivite de sur F ,
[Aj ] =

1j, 1kM

[Aj Ck ],

et en particulier (en ne conservant que les termes en = j) on a


X
[Cjk ] [Aj ].
1kMj

En sommant sur tous les indices j, on obtient


X
X
[Cjk ]
[Aj ],
j

jk

puis, comme est croissante,


X
jk

[A Cjk ]

[Aj ].

Les parties A Cjk sont deux `a deux disjointes, appartiennent `a F , et leur union est
A (An ) = A. Par -additivite, le membre de gauche de legalite precedente est
donc [A]. En conclusion, on a montre que pour tout recouvrement arbitraire de A
par une famille (Aj ) delements de F , on avait
X
[A]
[Aj ].
jN

Par definition de , on a donc [A] [A], ce qui ach`eve de prouver que et


concident sur F .


THEORIE
ABSTRAITE DE LA MESURE

55

3. Legalite (7) est satisfaite. Puisque est sous-additive, un corollaire de letape


precedente est
[A] [A B] + [A \ B],
pour toutes parties A et B dans F . Pour prouver la validite de (7), il suffit detablir
linegalite inverse. Pour cela, on remarque que A \ B = A (X \ B) est lintersection
de A avec une union finie disjointe delements de F ; et peut donc secrire comme
une union finie disjointe delements Dk de F . Alors
X
X
[A B] + [Dk ] [A B] +
[Dk ] = [A B] +
[Dk ].
k

Mais A B et les Dk sont des parties disjointes dont la reunion est A ; toujours par
additivite de , la derni`ere somme est donc egale `a [A]. On conclut que
[A B] + [A \ B] [A],

ce qui conclut la preuve de (7) et du Theor`eme I-71.

Exercice I-73. Reecrire la preuve precedente en cherchant `a la simplifier pour


demontrer directement le Theor`eme I-69 et non sa version generalisee (Theor`eme I71).
Remarque I-74. Dans la definition de M, dans le cas o`
u X est de masse totale
finie ([X] < +), on pourrait se contenter de definir les parties mesurables A par
legalite
[A] + [X \ A] = [X].
Ainsi, intuitivement, une partie A de X est -mesurable si lon parvient `a lapprocher exterieurement, au sens de la mesure , par des unions delements de F ,
lapproximation etant suffisamment precise pour que la mesure exterieure ne comptabilise aucune masse appartenant `a X \ A. Notons que Lebesgue utilisait dej`a cette
construction.
Le theor`eme de Caratheodory est capital en theorie de la mesure ; pour lillustrer
on va mentionner d`es `a present deux probl`emes importants quil permet de resoudre.
Dans limmediat, on nen donnera que des preuves partielles ; les preuves compl`etes
viendront plus tard dans le cours.
I-4.3. Produits infinis. Le theor`eme suivant est une consequence importante
du theor`eme de prolongement de Caratheodory.
Th
eor`
eme I-75 (produit infini de probabilites). Soit (Xk , k )kN une famille
denombrable despaces de probabilit
es. Pour tout m et toute famille A1 , . . . , Am
de parties mesurables de X1 , . . . , Xm respectivement, on pose

Y
Xk .
C(A1 , . . . , Am ) = A1 . . . Am
k=m+1

On definit alors

[C(A1 , . . . , Am )] =

m
Y

k [Ak ].

k=1

Cette Q
fonction se prolonge en une unique mesure de probabilite sur le produit
infini Ak , muni de la tribu engendree par les cylindres C(A1 , . . . , Am ), m N.

56

CHAPITRE I

(13 juin 2010)

Dans le cas o`
u les Xk sont des ensembles de cardinal fini, la demonstration de
ce theor`eme est tr`es simple et nous allons la presenter tout de suite. Le cas general
[Dudley, p. 257-259] est plus subtil, et nous attendrons detre plus aguerris pour la
presenter : Cf. Theor`eme III-97 au Chapitre III. Ce theor`eme peut se generaliser de
diverses mani`eres, mais la conclusion est en general fausse si lon nimpose pas de
restriction sur les quantites k [Xk ].
D
emonstration du Th
eor`
eme I-75 pour des espaces de cardinal fini.
Sans perte de generalite, on suppose que
Xk = {0, . . . , Nk };

k =

Nk
X
=1

k ;

Nk
X

k = 1,

=1

et chaque Xk est muni de la tribu triviale P(Xk ). Les cylindres sont de la forme
Q
C = A1 A2 . . . Ak Xk+1 Xk+2 . . . ; on definit alors [C] = kj=1 k [Ak ].
Il est facile de verifier que le complementaire dun cylindre produit est une union
finie de cylindres produits. En outre, [X] = 1. Pour appliquer le Theor`eme I-71
et conclure `a lunicite dun prolongement -additif de , il suffit de verifier la additivite de sur la famille des cylindres produits. Soit donc (Cn )nN une
Q famille
de cylindres produits disjoints, dont lunion est un cylindre produit C = Ak . Par
le Lemme I-76
il ny a quun nombre fini de Cn non vides ; lidentite
P ci-dessous,

[Cn ] = [Cn ] est donc consequence de ladditivite de .



Lemme I-76 (absence de recouvrement denombrable par des cylindres). Soient
(XkQ
)kN une familleSdensembles
finis, et (Cn )nN une famille de cylindres disjoints
Q
de Xk , telle que Cn = Xk . Alors il ny a quun nombre fini de Cn non vides.
Nous allons donner deux demonstrations de ce lemme. La premi`ere est simple
et elementaire, le principe rappelle un peu celui que nous utiliserons dans la suite
pour demontrer le Theor`eme I-75 dans un cadre general. La deuxi`eme, plus compacte, illustrera linteret dun raisonnement topologique, et preparera la voie `a la
demonstration du Theor`eme I-77 ci-dessous ; elle presupposera quelques connaissances en topologie.

`re d
Premie
emonstration. Chacun des cylindres
Q Cn est union disjointe de
cylindres elementaires, de la forme (a1 , a2 , . . . , aK ) kK+1 Xk ; on dit quun tel
cylindre est dordre K et a pour base {a1 , . . . , aK }. Il suffit de demontrer le lemme
dans le cas o`
u tous les Ck sont des cylindres elementaires. On retire les cylindres
non vides ; en particulier les Ck seront supposes tous distincts. On va supposer quil
y a une infinite de Ck , et arriver `a une contradiction.
Considerons lensemble des cylindres dordre 1. Si chaque element de X1 est
le premier element dun cylindre dordre 1, alors il y a exactement |X1 | cylindres
dordre 1, et leur reunion finie couvre X, il ny a donc quun nombre fini de Ck , ce
qui est impossible. Il existe donc un sous-ensemble non vide Y1 = {u1, . . . , u } de
X1 , tel que le cylindre de base Y1 nintersecte aucun des Ck dordre 1, et doit donc
etre recouvert par les cylindres dordre 2 ou plus. Le premier element de chacun
des cylindres dordre 2 ou plus est lun des uj ; comme les uj sont en nombre fini
et quil y a une infinite de cylindres, lun au moins des uj apparat une infinite de
fois en premier element de lun des cylindres dordre 2 ou plus. Appelons-le y1 : le
cylindre de base y1 est donc recouvert par une infinite de cylindres, dont la premi`ere
composante est toujours y1 .


THEORIE
ABSTRAITE DE LA MESURE

57

On montre alors, par un raisonnement similaire, quil existe un element y2 de


X2 , qui nest le deuxi`eme element daucun cylindre dordre 2, tel que le cylindre de
base {y1 , y2} est recouvert par une infinite de cylindres dordre 3 ou plus, dont les
deux premi`eres composantes sont {y1 , y2 }.
Q
Par recurrence, on construit ainsi une suite (yk )kN dans
Xk , telle que pour
tout j N, {y1 , y2, . . . , yj } nest le premier element daucun cylindre dordre j
parmi les Cn . En particulier, cette suite nappartient `a aucun des cylindres Cn , ce
qui fournit une contradiction.

monstration. On munit chaque Xk de la topologie discr`ete,
Deuxi`
eme de
toute partie de Xk est alors ouverte ; par definition, la topologie produit est alors
engendree par les cylindres, qui sont en particulier des ouverts. Dautre part, C est
un produit (infini) de compacts, donc compact par le theor`eme de Tychonov (dans
la version simple o`
u on consid`ere un produit denombrable despaces produits). De
la famille (Ck ) on peut donc extraire un sous-recouvrement fini ; comme ils sont
disjoints, seul un nombre fini dentre eux est non vide.

I-4.4. Th
eor`
eme de prolongement de Kolmogorov. Ce theor`eme est fondamental en theorie des probabilites, et tout particuli`erement des processus stochastiques. Il sagit essentiellement dune generalisation du precedent.
Th
eor`
eme I-77 (theor`eme de prolongement de Kolmogorov). Soit T un ensemble arbitraire, et (Xt )tT une famille despaces polonais ; on definit
Y
X :=
Xt .
tT

Pour toute partie finie F = {t1 , . . . , tK } T , on definit XF := Xt1 . . . XtK ; et


pour tout Borelien AF de XF , on definit le cylindre
C(AF ) := {x X; (xt1 , . . . , xtK ) AF }.

On munit X de la tribu engendree par tous les cylindres C(AF ), pour toutes les
parties finies F de T . On se donne une fonction , qui pour toute partie finie F
de T definit une mesure de probabilite sur la tribuQdes cylindres C(AF ). Alors se
prolonge en une unique mesure de probabilite sur Xt .
Remarques I-78.
(i) Bien noter la condition de compatibilit
e implicite
dans ce theor`eme : si F F , tout cylindre C(AF ) peut aussi etre vu comme
un C(AF ) : il suffit de prendre At = Xt pour tous les t T \ T . Les nombres
ur concider ! On parle de syst`eme
[C(AF )] et [C(AF )] doivent alors bien s
de marginales compatible.

(ii) En theorie des processus stochastiques, lespace T est dhabitude un morceau


de R+ , interprete comme lespace des temps. Le cas particulier o`
u la famille T
nest autre que N (penser `a des temps discrets) rel`eve egalement du theor`eme
dit de Ionescu Tulcea, souvent utilise en theorie des probabilites. Cependant,
le theor`eme de Kolmogorov ne necessite aucune hypoth`ese de regularite sur
T . Pour certaines generalisations, on pourra consulter par exemple [Dudley,
p. 441].
(iii) Apr`es avoir etudie les proprietes principales de lintegration produit, nous
demontrerons ce theor`eme au Chapitre III (voir le Theor`eme III-111).

58

CHAPITRE I

(13 juin 2010)

(iv) Dans la pratique, les modalites de la construction de la probabilite sont


rarement utiles ; cest seulement le resultat dexistence que lon utilise.
I-4.5. Crit`
ere de Carath
eodory. Comme nous lavons vu, le theor`eme de
prolongement de Caratheodory construit une tribu M sur laquelle la mesure exterieure
est automatiquement -additive. Le crit`ere de Caratheodory est une condition
dapparence relativement simple qui entrane que M contient la tribu borelienne.
Cest le crit`ere que lon utilise traditionnellement pour construire les mesures de
Hausdorff dans Rn , que nous etudierons plus tard.
or`
The
eme I-79 (Crit`ere de Caratheodory). Soit (X, d) un espace metrique, et

soit une mesure exterieure sur X, au sens de la Remarque I-72 (i) ; on definit la
tribu M comme dans lenonce du Theor`eme I-71. Si, pour toutes parties A et B de
X telles que


d(A, B) := inf d(x, y); x A, y B > 0,
on a
[A B] = [A] + [B],
alors la tribu M contient la tribu borelienne de X.
D
emonstration. Il suffit de demontrer que la tribu M contient tous les fermes.
Soient donc A un ensemble ferme, et B un ensemble arbitraire, on veut prouver que
[B] = [B A] + [B \ A].

Grace `a la sous-additivite de , il suffit detablir

[B] [B A] + [B \ A].

Sans perte de generalite, on suppose que [B] < +. Pour tout n 1, on definit
An := {x B; d(x, A) 1/n},

et on note que An = A puisque A est ferme. Alors d(B \ An , B A) 1/n > 0,


do`
u
[B \ An ] + [B A] = [(B \ An ) (B A)] [B].
Il suffit donc de prouver que

[B \ An ] [B \ A].
n

Soit alors An,n+1 := An \ An+1 ; en particulier B = B \ An (kn Ak,k+1). Par


sous-additivite de ,

[B \ An ] [B \ A] [B \ An ] +
[Ak,k+1 ],
k=n

et la conclusion sensuivra si lon peut demontrer


X
[Ak,k+1] < +.
k1

Comme d(Ai,i+1 , Aj,j+1) > 0 d`es que j i + 2, on peut etablir par recurrence
N
X
k=1

[A2k,2k+1 ] = [

N
[

k=1

A2k,2k+1] [A] < +;


THEORIE
ABSTRAITE DE LA MESURE

59

et, de meme,
N
X
k=1

[A2k+1,2k+2 ] [A] < +.

On conclut facilement en faisant tendre N vers linfini.

I-5. Compl
etion de mesures
Si le prolongement dune mesure est une operation delicate, sa completion en
revanche est tr`es facile.
or`
The
eme I-80. Soit (X, A, ) un espace mesure, et soit A la famille des parties
E de X qui secrivent A B , o`
u A A et B est inclus dans une partie negligeable
B A, telle que [B] = 0. Alors A est une tribu, et admet un prolongement
unique `a A, tel que (X, A, ) est un espace mesure complet.
D
emonstration. Ce theor`eme pourra etre demontre en guise dexercice : il suffit de poser [E] = [A], et de verifier les axiomes de -additivite. La seule subtilite
consiste `a montrer que cette definition est licite. Pour cela, on pourra remarquer que
si E = A1 B1 = A2 B2 (avec des notations evidentes), alors A1 \ A2 E \ A2
B2 B2 est de mesure nulle, donc [A1 ] = [(A1 A2 )] + [A1 \ A2 ] = [A1 A2 ]
[A2 ]. Par symetrie, [A1 ] = [A2 ].

Remarque I-81. La simplicite de lenonce et de sa preuve masque le fait que
les ensembles ainsi completes peuvent etre extremement compliques. Comme nous
le verrons en parlant dintegration sur des espaces produits, il ne faut pas croire que
loperation de completude est inoffensive.
Le theor`eme I-71 fournissait dej`a un prolongement complet de la mesure ; il
nest pas clair a priori que ce soit le meme que celui qui est fourni par le Theor`eme I80, car une mesure admet en general plusieurs prolongements complets. Il y a cependant unicite quand on impose certaines conditions de regularite.
or`
The
eme I-82 (unicite de la completion reguli`ere). Soit X un espace topologique et une mesure de Borel sur X, definie sur la tribu borelienne A. On suppose que X est -fini et que est reguli`ere. Alors lespace (X, A, ) defini dans le
Theor`eme I-80 est lunique prolongement complet de (X, A, ) en un espace mesure
complet et regulier.
e
D
emonstration. Soit (X, A,
e) un prolongement complet regulier de (X, A, ).
Comme X est -fini, tout element A de Ae peut secrire comme union denombrable
delements Ak de Ae avec
e[Ak ] < +. Par la Proposition I-49, pour chaque Ak il
existe des Boreliens Bk et Ck tels que
e[Bk ] =
e[Ak ] =
e[Ck ], et Bk Ak Ck . En
particulier, Ak secrit comme lunion dun Borelien et dun ensemble inclus dans un
Borelien
e-negligeable, ce qui montre que Ae contient A. On conclut que les deux
tribus sont egales, et la fin de la demonstration en decoule aisement.


En conclusion : tant que lon travaille avec des mesures reguli`eres, on na pas `a
se poser de questions sur le procede de completion.

60

CHAPITRE I

(13 juin 2010)

I-6. Application : Construction de la mesure de Lebesgue


Le theor`eme suivant sera notre premi`ere application du theor`eme de prolongement de Caratheodory. On munira bien s
ur R de sa topologie habituelle.
Th
eor`
eme I-83 (mesure de Lebesgue en dimension 1). Il existe une unique
mesure borelienne sur R telle que la mesure dun intervalle [a, b] (a < b) soit egale
`a sa longueur b a. On lappelle mesure de Lebesgue.
La completion de , egalement appelee mesure de Lebesgue, est definie sur la
tribu des ensembles Lebesgue-mesurables, qui est constituee de toutes les parties
E de R telles quil existe des ensembles Boreliens A et B tels que
A E B;

[B \ A] = 0.

La construction presentee ci-dessous etait dej`a celle quutilisait Lebesgue.


or`
D
emonstration du The
eme I-83. La famille des intervalles est stable par
intersection finie (lintersection de deux intervalle est un intervalle), et R est lunion
des intervalles [k, k] pour k N ; lunicite de la mesure de Lebesgue est donc une
consequence du Theor`eme I-71(i).
Lexistence demandera plus de travail. Considerons la famille F de tous les intervalles de R. Un intervalle I R etant donne, on definit [I] comme etant la longueur
|I| de I. Lintersection de deux intervalles est un intervalle, et le complementaire dun
intervalle est la reunion de deux intervalles ; nous sommes donc dans les conditions
dapplication du Theor`eme de prolongement I-71 (iii). Pour prouver que se prolonge en une mesure sur la tribu engendree par F , qui nest autre que B(R), il suffit

de verifier la -additivite de . Cest un exercice qui senonce ainsi : Etant


donnee
une famille dintervalles (Ik )kN disjoints, dont la reunion est un intervalle I de R,
prouver que
X
(9)
|Ik | = |I|.
kN

Admettons provisoirement ce resultat ; on peut alors appliquer le Theor`eme I-71


(iii) pour construire la mesure de Lebesgue via le concept de mesure exterieure de
Caratheodory. Les proprietes de la completion resultent alors des Theor`emes I-80
et I-82.

D
emonstration de (9). Si lon sait prouver (9) dans le cas o`
u I est un intervalle borne, le cas general sensuivra : en effet, pour tout entier on peut poser
I = I [, [, Ik = Ik [, [ et il est tr`es facile de verifier que
X
X
|I| =
|I |,
|Ik | =
|Ik |.

On suppose donc que I est borne. Si I nest pas ferme, on peut toujours adjoindre `a
I un ou deux pointsP
(qui sont des intervalles particuliers, de longueur nulle !) : cela
ne change ni |I|, ni
|Ik |. Il nous suffit donc de prouver (9) dans le cas particulier
o`
u I = [a, b]. Sans perte de generalite (le probl`eme etant invariant par translation
et dilatation), on pourra meme supposer I = [0, 1]. Il est facile de verifier que pour
tout k,
|I1 | + |I2 | + . . . + |Ik | 1,


THEORIE
ABSTRAITE DE LA MESURE

en particulier

X
kN

61

|Ik | 1.

Cest bien s
ur linegalite inverse qui est (leg`erement) plus subtile.
Si A [0, 1] est reunion dun nombre fini dintervalles disjoints, on definira
|A| comme la somme des longueurs de ces intervalles ; il est intuitivement evident
(mais un tout petit peu fastidieux `a verifier) que cette definition est independante
du choix de la decomposition de A en intervalles disjoints (par exemple, si on ecrit
[a, c] = [a, b[[b, c] on a c a = (b a) + (c b)). On verifie en outre que si
A = I1 . . . In , alors |A| |I1 | + . . . + |In |, que les intervalles Ik soient disjoints
ou non.
Soit > 0, arbitrairement petit. Pour tout k, on definit un intervalle Jk , ouvert
dans [0, 1], contenant Ik , tel que |Jk \Ik | 2k (par exemple, si Ik = [a, b] on pourra
choisir Jk =]a 2k+1 , b + 2k+1 [[0, 1]). Les intervalles ouverts Jk recouvrent [0, 1]
tout entier, puisque les Ik forment dej`a un recouvrement de [0, 1]. Par compacite,
on peut en extraire un sous-recouvrement fini : il existe K N tel que [0, 1]
J1 J2 . . . JK . En particulier,
1

K
X
k=1

|Jk |

K
X
k=1

(|Ik | + 2k ) (

En faisant tendre vers 0, on obtient bien 1

X
k

|Ik |) + .

|Ik |, comme on le souhaitait. 

I-7. Compl
ement : Recouvrement et remplissage
Cette section pourra etre omise en premi`ere lecture ; outre quelle repond `a certaines questions naturelles sur les liens entre ensembles mesurables et boules, elle
sav`erera dun grand interet dans certains chapitres ulterieurs.
Pour etudier une mesure localement au voisinage dun point, on consid`ere la
mesure de petites boules centrees en ce point ; on developpera ce point de vue dans le
Chapitre ??. Il est donc assez naturel de sinteresser `a des recouvrements densembles
par des petites boules. Dans le cadre de la theorie de la mesure, on ne sait gerer les
mesures de familles densembles que lorsquils sont disjoints ; le probl`eme didentifier
des sous-recouvrements disjoints est donc assez naturel. Cependant, si un ensemble
A est recouvert par des boules, on ne peut en general en tirer un sous-recouvrement
disjoint ; au mieux on peut esperer extraire une sous-famille disjointe, qui recouvre
presque lensemble A, au sens o`
u elle continue `a en recouvrir une proportion non
negligeable. Ce probl`eme est lobjet de divers lemmes de recouvrement. On va
ici considerer le plus simple dentre eux, le Lemme de Vitali. Je vais lenoncer avec
des boules fermees, mais on pourrait aussi bien le faire avec des boules ouvertes.
Dans lenonce suivant, si B = B[x, r] est une boule fermee de centre x et de
rayon r et est un nombre positif, on note B la boule de centre x et de rayon r.
(En general cette convention na de sens que si lon consid`ere B comme un couple
(x, r), de sorte que la valeur de r est uniquement determinee par la boule choisie ;
dans un espace metrique general il est tr`es possible que B[x, r] = B[x, r ] sans pour
autant que r soit egal `a r !)
Th
eor`
eme I-84 (Lemme de recouvrement de Vitali). (i) Soient X un espace
metrique separable, et B une famille de boules fermees dans X, de rayon non nul et

62

CHAPITRE I

(13 juin 2010)

majore. Alors de B on peut extraire une famille denombrable Be de boules disjointes


telles que
[
[
B
4B.
BB

BBe

(ii) En outre si est une mesure borelienne C-doublante sur X, on a


[ 
[ 

B C 2
B .
BBe

BB

Avant daborder la preuve du Theor`eme I-84 proprement dite, commencons par


deux lemmes tr`es simples :
Lemme I-85. Soient B et B deux boules fermees dun espace metrique, de rayons
respectifs r et r , telles que
2
B B 6= ;
r r.
3
Alors, avec les notations du Theor`eme I-84, on a B 4B .
Lemme I-86. Si X est un espace metrique separable et B est une famille quelconque de boules de rayon non nul, alors on peut extraire de B une sous-famille
disjointe maximale M, ce qui veut dire que toute sous-famille de B strictement plus
grande que M ne peut etre disjointe.
Preuve du Lemme I-85. On ecrit B = Br] (x), B = Br ] (x ). Par hypoth`ese il
existe z B B . Alors, pour tout y B on a d(x , y) d(x , z) + d(z, y) r + 2r
r + 3r = 4r . (Faire un dessin !)


Preuve du Lemme I-86. Cet enonce rel`eve a priori de la theorie des ensembles,
et peut dailleurs se deduire facilement de laxiome du choix (ou de mani`ere equivalente
du principe de maximalite de Hausdorff). Cependant lhypoth`ese de separabilite permet deviter lusage de laxiome du choix, comme on va le voir.
Soit (zn )nN une suite dense dans X. On va construire par recurrence la famille
M, comme suit.
Si z1 appartient `a lun des elements de B, on choisit dans B une boule B1 contenant z1 et on pose Be1 = {B1 }. Dans le cas contraire, on pose Be1 = .
Si z2 appartient `a lun des elements de B qui nintersectent aucun element de
Be1 , on choisit dans B une boule B2 contenant z2 et nintersectant aucun element de
Be1 ; on pose alors Be2 = Be1 {B2 }. Dans le cas contraire, on pose Be2 = Be1 .
Et ainsi de suite : si zk appartient `a lun des elements de B qui nintersectent
aucun element de Bek1 , on pose Bek = Bek1 {Bk }, o`
u Bk est une boule de B
contenant zk et nintersectant aucun element de Bek1 ; dans le cas contraire, on pose
Bek = Bek1 .
Soit M = {Bi1 , Bi2 , . . . , Bij , . . .} lunion de toutes les familles Bk ainsi construites.
Il est clair que M est denombrable. Si Bk et B appartiennent `a M, supposons par
exemple > k, alors B a ete choisie parmi les boules nintersectant pas les elements
de Be1 , en particulier nintersectant pas Bk ; donc la famille M est disjointe.
Il reste `a montrer que cette famille est maximale. Soit donc B un element de B
nappartenant pas `a M, montrons que M {B} nest pas disjointe. Puisque B est
` letape m de la construction,
de rayon strictement positif, il existe un zm B. A


THEORIE
ABSTRAITE DE LA MESURE

63

- soit une boule Bm contenant zm a ete choisie et incluse dans la famille M ; mais
alors Bm B 6= ;
- soit on na pas fait de tel choix, ce qui veut dire que toutes les boules de B
contenant zm (en particulier la boule B) intersectaient dej`a un element de lensemble
Bem1 .
Dans les deux cas, B rencontre un element de M, ce qui ach`eve la demonstration
de la maximalite.

D
emonstration du Th
eor`
eme I-84. Commencons par traiter le cas simple
o`
u il ny a quun nombre fini de boules. On peut alors classer les boules par ordre
decroissant du rayon : r(B1 ) r(B2 ) r(B3 ) . . .. On construit alors lensemble Be
selon la meme procedure que precedemment : au debut on pose Be1 = {B1 }, puis si
B2 nintersecte pas B1 on pose Be2 = {B1 , B2 }, sinon on pose Be2 = {B1 } ; et ainsi de
` letape k, si Bk nintersecte aucun element de Bek1 on pose Bek = Bek1 {Bk },
suite. A
et sinon on pose Bek = Bek1 .
On definit alors Be = Bek . Soit B = Bk un element quelconque de B. Sil nest
e cest quil intersecte une boule Bj de Bek1 avec bien s
pas dans B,
ur j < k, donc

r(Bj ) r(Bk ). Posons B = Bj , on a alors B B 6= et (avec les memes notations


que dans le Lemme I-85) r r ; do`
u B 3B par un argument similaire `a celui du
Lemme I-85.
Dans le cas general cependant, il est impossible dordonner les boules par ordre de
rayon decroissant (lenonce autorise meme une infinite non denombrable de boules...).
Il convient donc de modifier leg`erement la strategie. Si B = B[x, r] est une boule de
rayon r, on note r = r(B). Par hypoth`ese il existe R > 0 tel que toutes les quantites
r(B) soient majorees par R. Pour tout j N on definit
(
 j
 j1 )
2
2
Bj := B B;
R 2r(B)
R .
3
3
f1
On choisit grace au Lemme I-86 une famille denombrable disjointe maximale M
dans B1 .
f2 dans
On choisit ensuite une famille denombrable disjointe maximale M
n
o
Z2 = B B2 ; B M1 , B B = .

On continue de meme : au rang k, on choisit une famille denombrable disjointe


fk dans
maximale M
n
o
[

e
Zk = B Bk ; B
Bj , B B = .
jk1

On pose enfin Be = Mk . Il est facile de montrer que cette famille est disjointe ;
il reste `a verifier que toute boule de B est incluse dans 4B pour une certaine boule
e
B B.
e le resultat est evident. Sinon, introduisons k tel que
Soit donc B B. Si B B,
ek est une famille disjointe maximale dans lensemble
B Bk . Puisque B
o
n
[
Bej , B B = ,
B Bk ; B
jk1

il ny a que deux possibilites :

64

CHAPITRE I

(13 juin 2010)

- soit B nappartient pas `a Zk , ce qui veut dire que B intersecte un element de lun
fj pour j k 1 ;
des M
- soit B appartient `a Zk , et alors la famille obtenue en adjoignant B `a Mk nest pas
disjointe, ce qui veut dire que B intersecte un element de Mk .
S
fj ; en particulier r(B )
Dans tous les cas, B intersecte un element B de jk M
(2/3)r(B). On applique alors le Lemme I-85 pour conclure que B 4B . Ceci conclut
la preuve de (i).
Passons maintenant `a (ii) : Pour cela on ecrit
X
[ 
[
 X
[ 

B
4B
[4B] C 2
[B] = C 2
B ,
BB

BBe

BBe

BBe

BBe

o`
u lavant-derni`ere inegalite decoule de la propriete de C-doublement, et la derni`ere
provient de ce que la famille B est disjointe.

Voici maintenant un corollaire frappant et utile du Lemme de Vitali ; il enonce
que lon peut remplir, au sens de la theorie de la mesure, un ouvert par de petites
boules (fermees) disjointes :

Corollaire I-87. Soient X un espace metrique separable, une mesure borelienne


sur X, doublante et finie sur les boules fermees de X. Alors, pour tout ouvert O de
X et pour tout > 0 on peut trouver une famille denombrable G de boules fermees
disjointes B[x, r] O, de rayon r , telles que
h
[ i
O\
B = 0.
BG

Exemple I-88. Nous verrons plus tard que la mesure naturelle dans Rn , la mesure de Lebesgue, est 2n -doublante. Il sensuivra que tout ouvert de Rn est, `a un
ensemble de mesure de Lebesgue nulle pr`es, union denombrable de boules euclidiennes fermees disjointes.

Preuve du Corollaire I-87. 1. Traitons dabord le cas o`


u O est inclus dans
une boule fermee, en particulier [O] est fini et est C-doublante sur O. Soit B
lensemble de toutes les boules fermees de rayon au plus , incluses dans O. Puisque O
est ouvert, la reunion de tous les elements de B est exactement O. Par le Theor`eme I84, il existe une famille denombrable disjointe Be B telle que
[ 

B C 2 [O];
do`
u

BBe

[ 

O\
B (1 C 2 )[O].
BBe

e telle que
Par -additivite, il existe une sous-famille finie B B,


[ 

C 2
B 1
O\
[O].
2
BB
S
On pose O1 := O \ BB B : comme intersection finie douverts, cest un ouvert, il
est inclus dans O et de mesure au plus [O] avec = (1 C 2 /2) < 1.
On it`ere alors la construction : par recurrence on construit une suite decroissante
douverts Ok , tel que Ok1 \ Ok est une union finie de boules fermees, et [Ok ]


THEORIE
ABSTRAITE DE LA MESURE

65

[Ok1]. Par -additivite, lintersection des Ok est de mesure nulle, et son complementaire
dans O est une union denombrable de boules fermees.
2. Considerons maintenant le cas general o`
u O nest pas inclus dans une boule.
Soit x0 un element quelconque de X, pour tout r > 0 on pose Sr = {x X; d(x0 , x) =
r}. (Cest la sph`ere de centre x0 et de rayon r.) Puisque X est lunion des boules
B(x0 , k), k N, elle est -finie ; en particulier il y a au plus une infinite denombrable
de r > 0 tels que [Sr ] > 0. Fixons une fois pour toute une suite rk
(k N) telle que [Srk ] = 0. On pose alors C0 = B(x0 , r1 ), et pour k N,
Ck = B(x0 , rk+1 ) \ B[x0 , rk ]. (Les Ck sont donc des coronnes ouvertes disjointes.)
Le complementaire des Ck dans X est de mesure nulle, en particulier O est, `a un
ensemble de mesure nulle pr`es, lunion disjointe des ouverts Ok = O Ck . Par la
premi`ere partie de la preuve, chacun des Ok peut secrire, `a un ensemble de mesure
nulle pr`es, comme une union disjointe de boules fermees Bk,j (j N). Ceci conclut
la preuve du theor`eme.

Remarque I-89. Le Lemme de Vitali est le lemme de recouvrement le plus
simple et le plus connu ; il en existe cependant bien dautres, utilises dans des situations variees. Parmi les plus interessants, mentionnons
- le Lemme de recouvrement de Besicovich [Evans-Gariepy pp. 3035] :
Soit B = {B(x , r )A } une collection de boules de rayon borne dans lespace Euclidien Rn , et soit C lensemble de leurs centres. Alors il existe une constante K, ne
dependant que de n, et des sous-familles disjointes denombrables B1 ,. . . BK de B, qui
recouvrent lensemble C. Ce lemme, qui exploite la structure particuli`ere de lespace
Rn , permet detudier des mesures non necessairement doublantes : par exemple, on
peut lutiliser pour montrer que le Corollaire I-87 reste vrai si O est un ouvert de
Rn et une mesure arbitraire.
- le Lemme de recouvrement de Whitney, tr`es utile en analyse harmonique,
qui permet de remplir un ouvert O de Rn par une famille denombrable de cubes Ck ,
dont les cotes sont parall`eles aux axes, dont les interieurs sont disjoints (au sens o`
u
leurs interieurs sont disjoints), et dont les diam`etres sont `a peu pr`es proportionnels
`a leur distance au bord de O :
diam (Ck ) d(Ck , Rn \ O) 4 diam (Ck ).

Pour en savoir plus, on pourra consulter le passionnant ouvrage dE.M. Stein,


Singular Integrals and Differentiability Properties of Functions (Princeton University
Press, New Jersey, 1970), pp. 1618 et Chapitre VI.

CHAPITRE II

Int
egration selon Lebesgue et selon Riesz
Dans ce chapitre, nous allons definir lintegrale de Lebesgue pour une large classe
de fonctions, que nous appellerons sommables au sens de Lebesgue. Nous nous placerons dans un cadre abstrait, qui inclura comme cas particulier lintegration des
fonctions continues. Le point de depart sera la notion de fonction mesurable, introduite dans la section II-1 ; on definira ensuite lintegrale dans la section II-2, et on
verifiera dans la section II-3 quelle constitue une forme lineaire.
Il existe un autre point de vue pour lintegration, qui consiste `a prendre les fonctions continues comme point de depart. Le th
eor`
eme de Riesz, qui est lobjet de
la section II-4, assure que ces deux points de vue sont equivalents (modulo quelques
subtilites), sous certaines hypoth`eses topologiques sur lespace ambiant. La plus restrictive de ces hypoth`eses est la condition de compacit
e locale, qui est satisfaite
par Rn ou par nimporte quelle variete Riemannienne de dimension finie, mais mise
en defaut par de nombreux espaces interessants, au premier rang desquels se trouve
lespace de Wiener.
Ce chapitre se conclut par quelques mots sur lintegration `a valeurs vectorielles,
qui sera abordee plus en detail dans un chapitre ulterieur.
II-1. Fonctions mesurables
On cherche `a definir une large classe de fonctions susceptibles detre integrees,
que nous appellerons fonctions mesurables. Il est souhaitable que cette classe de
fonctions contienne au moins les fonctions indicatrices densembles mesurables, et
(dans un cadre topologique) les fonctions continues.
En topologie, o`
u les parties ouvertes jouent un role privilegie, on dit quune
fonction entre deux espaces topologiques est continue si limage reciproque de tout
ouvert est un ouvert. En theorie de la mesure, on adopte une demarche similaire
pour definir les fonctions mesurables.
II-1.1. D
efinition.
D
efinition II-1 (fonctions mesurables). Soient X et Y deux espaces mesurables,
et f : X Y . On dit que f est mesurable si limage reciproque f 1 (B) de nimporte
quelle partie mesurable B Y est une partie mesurable de X.
Exemple II-2. Lexemple le plus simple est la fonction indicatrice f = 1A dun
ensemble mesurable A : cest la fonction qui vaut 1 sur A et 0 sur le complementaire.
Limage reciproque dun ensemble quelconque par f est lun des quatre ensembles
, X, A, X \ A, qui sont tous bien s
ur mesurables.
Nous verrons dans la suite des crit`eres pratiques de mesurabilite, permettant de
construire de tr`es nombreuses fonctions mesurables. En fait, comme on le commentera dans la Remarque II-19, la mesurabilite est la r`egle plutot que lexception.

68

CHAPITRE II

(13 juin 2010)

Remarques II-3.
(i) Soient X un espace mesurable, Y un ensemble quelconque, et f : X Y une fonction quelconque. Il est toujours possible de
munir Y dune -alg`ebre pour laquelle f soit une fonction mesurable. Il suffit pour cela de d
efinir une partie mesurable comme une partie dont limage
reciproque est mesurable. On pourra verifier `a titre dexercice que cela definit
bien une tribu. Cette tribu est la plus grande qui rende f mesurable : toute
tribu plus petite a la meme propriete. On lappelle tribu image de A par f et
on la note souvent f# A.
(ii) Soient maintenant X un ensemble quelconque, Y un espace mesurable, et
f : X Y une fonction quelconque. Il est encore possible de munir X dune
-alg`ebre pour laquelle f soit une fonction mesurable. Il suffit pour cela de
considerer les images reciproques des ensembles mesurables. Cette tribu est
la plus petite qui rende f mesurable : toute tribu plus grande a la meme
propriete. On lappelle tribu engendree par f ; nous aurons loccasion de revenir
sur cette notion.
(iii) De meme que limage dun ouvert par une application continue nest en
general pas ouverte, limage dun ensemble mesurable par une application mesurable f nest en general pas mesurable. Cest cependant le cas si f : X Y
est une application bijective entre deux espaces Polonais X et Y munis de
leur tribu borelienne : sous ces hypoth`eses, limage de tout ensemble mesurable
par f est mesurable (voir [Parthasarathy]). En particulier, la reciproque dune
bijection mesurable entre espaces Polonais est automatiquement mesurable.
Le crit`ere pratique qui suit est dusage constant.
Proposition II-4 (crit`ere pratique de mesurabilite). Soient (X, A) et (Y, B)
deux espaces mesurables, et f : X Y . On suppose que la tribu B est engendree
par une famille F de parties de Y : B = (F ). Alors f est mesurable si et seulement
si pour tout F F , f 1 (F ) est mesurable.
D
emonstration. Definissons


C := B B; f 1 (B) A = f# A.

En utilisant les formules

f 1 (Y \ B) = f 1 (Y ) \ f 1 (B),

f 1

 [ 1
Bk =
f (Bk ),

on montre que C est une tribu. Comme elle contient F , elle contient egalement
(F ) = B.

Exemples II-5.
(i) Lexemple le plus courant est le suivant : si X et Y sont
deux espaces topologiques, munis de leur tribu borelienne, et f : X Y
est une fonction quelconque, alors f est mesurable si et seulement si limage
reciproque de tout ouvert de Y est un Borelien de X. On dit alors que f est
bor
elienne. En particulier, toute fonction continue est borelienne.
(ii) Dans le cas o`
u Y = Rn , pour montrer quune fonction f : X Y est mesurable, il suffit de verifier que limage reciproque de tout pave est un Borelien
de X. Par exemple, si on reussit `a montrer que cest une union denombrable
dintersections denombrables dunions denombrables de fermes...


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

69

(iii) Dans le cas o`


u Y = R, il suffit de verifier que limage reciproque de tout
intervalle semi-ouvert, de la forme I = [y, +[, est un Borelien. En particulier,
toute fontion semi-continue inferieurement (ou superieurement) est borelienne.
Mais en general la classe des fonctions boreliennes est beaucoup plus large.
(iv) Dans le cas o`
u Y est un espace produit, muni de la topologie produit, il
suffit de verifier que limage reciproque de tout pave est mesurable. Pour un
produit infini, il suffit de verifier que limage reciproque de tout cylindre est
mesurable.
On va voir au paragraphe suivant comment on peut, via des operations simples,
construire de tr`es nombreuses fonctions boreliennes qui ne sont pas du tout continues, ni continues par morceaux. Toutefois, sous certaines hypoth`eses topologiques,
les fonctions boreliennes peuvent etre bien approch
ees par des fonctions continues, et encore mieux par des fonctions semi-continues ; les theor`emes de Lusin et
Vitali-Caratheodory, que nous evoquerons dans la section II-4.4, en sont une bonne
illustration.
II-1.2. Stabilit
e des fonctions mesurables. Il est tr`es facile de construire
des fonctions discontinues en manipulant des fonctions continues et un peu de theorie
des ensembles : il suffit par exemple de definir une fonction separement sur [a, b]
et ]b, c]. En revanche, en manipulant des fonctions mesurables et des ensembles
mesurables, on ne peut gu`ere construire que des fonctions mesurables !
Proposition II-6 (restriction). Soient (X, A) et (Y, B) deux espaces mesurables,
et A une partie mesurable de X. Soit f : X Y une application mesurable. On
munit A de la tribu induite par A, i.e. lensemble de tous les elements de A qui
sont inclus dans A. Alors la restriction de f `a A est une application mesurable de
A dans Y .
D
emonstration. Cest un simple jeu de maniement des axiomes.

Proposition II-7 (recollement). Dans un espace mesurable X, soit (Ak )kN


une famille denombrable de parties mesurables disjointes, telle que X = Ak . Soit
egalement Y un espace mesurable. Sur chaque Ak (considere comme espace mesurable), on se donne une fonction mesurable fk : Ak Y . Soit f la fonction qui pour
tout k concide avec fk sur Ak . Alors f est mesurable.
D
emonstration. Limage reciproque dun ensemble mesurable B par f est
lunion des ensembles mesurables fk1 (B), cest donc un ensemble mesurable.

Proposition II-8 (produit infini de fonctions mesurables). Soient (Xt )tT et
(Yt )tT des espaces mesures, dependant dun param`etre t T , et soientQ(ft )tT
des fonctions
mesurables de Xt dans Yt respectivement. On munit X =
Xt et
Q
Y = Yt de la tribu produit, i.e.Qla plus petite tribu qui rende mesurable tous les
cylindres. Alors lapplication f = ft est mesurable de X dans Y .
En particulier, si f1 , . . . , fk sont des applications mesurables definies sur X1 , . . . , Xk
respectivement, `a valeurs dans Y1 , . . . , Yk respectivement, alors lapplication f =
(f1 , . . . , fk ) est mesurable de X1 . . . Xk dans Y1 . . . Yk .
D
emonstration. Par le crit`ere II-4, il suffit de montrer que limage reciproque
de tout cylindre est mesurable ; on peut meme se limiter `a le faire pour les cylindres

70

CHAPITRE II

(13 juin 2010)

engendres par des paves :

o
n
C(Bt1 , . . . , BtK ) = y Y ; k {1, . . . , K}, ytk Btk ,

o`
u K est arbitraire et chaque Btk est une partie mesurable de Ytk (pour alleger
lecriture, on na pas incorpore dans les notations le fait que le cylindre depend
explicitement du choix de t1 , . . . , tK , et pas seulement des ensembles Bt1 , . . . , BtK ).
On verifie aisement que
f 1 (C(Bt1 , . . . , BtK )) = C(At1 , . . . , AtK ),

Atk = fk1 (Btk ).

Cest en particulier un ensemble mesurable.

Proposition II-9 (composition). Soient f : X Y et g : Y Z deux applications mesurables entre espaces mesurables, alors leur composition g f est mesurable.
D
emonstration. Cest une consequence immediate de la definition.

Corollaire II-10. Soient X, Y et Z des espaces mesurables, tels que Y et Z


sont des espaces topologiques munis de leur tribu borelienne, soient f : X Y une
application mesurable, et : Y Z une application continue. Alors f : X Z
est une application mesurable.
D
emonstration. Cest une consequence de la proposition precedente, combinee avec lexemple II-5(i).

A laide de ces crit`eres simples, il est facile de trouver beaucoup doperations
elementaires qui preservent la notion de mesurabilite. La proposition suivante rassemble les plus courantes.
Proposition II-11 (operations elementaires). Soient X un espace mesure, et
f, g deux fonctions mesurables de X dans R (muni de la tribu borelienne). Alors les
fonctions f + g, f g, f g, min(f, g), max(f, g) et, si g ne sannule pas, f /g sont
mesurables.
D
emonstration. On applique le corollaire II-10 avec les applications continues
addition, soustraction, etc. Noter que min(f, g) = (f + g)/2 |f g|/2.

Outre ces operations elementaires, une operation frequemment utilisee pour definir
des fonctions est la limite (ou ses avatars tels que serie, etc.). Pour parler de limites,
il sera bien commode de remplacer R par R = R {}, dont on fait un espace
topologique en decidant que les intervalles ]a, +[ et ]a, +] (a R) engendrent
les ouverts. La restriction de cette topologie `a R est la topologie usuelle ; en effet,
les intervalles ]a, +[ engendrent la topologie usuelle de R. On note que R est un
espace metrique compact. On munira toujours R de sa tribu borelienne. La raison
pour considerer R plutot que R est simple : bien souvent, une fonction admettra en
certains points une limite dans R et non dans R.
Proposition II-12 (Boreliens de R). Les Boreliens de R sont engendres par les
intervalles de la forme [a, +] (a R), ou par les intervalles de la forme ]a, +].

D
emonstration. Il suffit par exemple de verifier que la tribu engendree par
les intervalles [a, +] contient tous les intervalles de la forme ]a, +[. En prenant
le complementaire de [a, +] on obtient un intervalle [, a[ ; en prenant lintersection de [, b[ et de [a, +] on obtient un intervalle [a, b[ ; en prenant lunion


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

71

des [a + 1/k, b[ (k N) on obtient lintervalle ouvert ]a, b[ ; enfin ]a, +[ est lunion
denombrable des intervalles ]a, k[.

Remarque II-13. Attention aux operations dans R : loperation (x, y) x + y
nest pas bien definie dans R tout entier `a cause de lindetermination (+)+().
Ainsi, si f et g sont deux fonctions `a valeurs dans R, on ne peut pas affirmer que
f + g soit mesurable. Si on sait que f et g prennent leurs valeurs dans R {+},
alors f + g est bien mesurable ; mais f g nest pas forcement defini...
Th
eor`
eme II-14 (stabilite par limite). (i) Soit (fn )nN une famille de fonctions mesurables sur un espace mesurable X, `a valeurs dans R. Alors les fonctions
lim inf fn et lim sup fn sont mesurables.
(ii) En particulier, si la famille (fn ) converge simplement, i.e. pour chaque x la
suite fn (x) converge dans R, alors la fonction lim fn est mesurable.
(iii) Si la famille (fn ) converge dans R sur une partie C de X, et g est une
fonction mesurable quelconque de X (par exemple la fonction nulle), alors la fonction
f definie par
(
f (x) = lim fn (x)
si x C
f (x) = g(x)
sinon
est mesurable de X dans R.
Les enonces (ii) et (iii) restent vrais si lon remplace R par R.
Remarque II-15. On rappelle que la limite superieure (respectivement inferieure)
dune suite delements de R est sa plus grande (respectivement plus petite) valeur
dadherence dans R. La limite superieure et la limite inferieure existent toujours
dans R, pas forcement dans R.
D
emonstration. Soit (fn ) une famille de fonctions mesurables, on va montrer
par exemple que lim sup fn est mesurable. Il suffit de montrer que pour tout R,
lensemble C := {x X; lim sup fn (x) }, avec R, est mesurable. Dire que
x appartient `a C , cest dire que pour tout k, fn (x) prend une infinite de fois une
valeur superieure ou egale `a 1/k, ou encore : pour tout k, pour tout n il existe
m n tel que fm (x) 1/k. Autrement dit,
\ \ [

1
C =
fm
[ 1/k, +] ,
kN nN mN

et C est bien mesurable, ce qui conclut la demonstration du point (i).


On en deduit en particulier que lensemble C des points de convergence est mesurable : en effet, C est lunion de trois ensembles qui dapr`es (i) sont tous mesurables :
- lensemble o`
u fn +, i.e. lim inf fn = + ;
- lensemble o`
u fn , i.e. lim sup fn = ;
- lensemble o`
u fn converge dans R, i.e. lim inf fn < + et lim sup fn > et
lim sup fn lim inf fn = 0.
On peut donc considerer C comme espace mesure, et on en deduit facilement (ii)
grace `a la Proposition II-6. On prouve (iii) de meme, en appliquant la proposition II7.


72

CHAPITRE II

(13 juin 2010)

Exercice II-16. Dapr`es le theor`eme precedent, si une famille de fonctions (fn )


converge en tout point dans R, la limite est une fonction mesurable. Demontrer
ce resultat sans faire reference `a des lim inf et lim sup, via le crit`ere : une suite
de nombres reels converge si et seulement si elle est de Cauchy. En deduire une
generalisation du point (ii) dans laquelle lespace darrivee R est remplace par un
espace metrique complet arbitraire.
Exemples II-17.
(i) Soit f : R R une fonction derivable, alors sa derivee
est mesurable. En effet, cest la limite simple de la suite de fonctions continues
gk (x) = k[f (x + 1/k) f (x)].

(ii) Une serie de Fourier convergente definit une fonction mesurable. Rappelons
que de telles fonctions peuvent ne pas etre continues.
(iii) Lintegrale de Riemann etant definie par un procede de limite, les fonctions
definies comme des integrales de Riemann `a param`etre sont mesurables. Nous
verrons au Chapitre III que cet enonce se generalise `a des integrales `a param`etre
definies dans le cadre de la theorie de Lebesgue.
Citons pour conclure un dernier resultat de stabilite de la mesurabilite, que nous
admettrons (voir la demonstration dans [Parthasarathy]).
Th
eor`
eme II-18 (mesurabilite de linverse). Soient X et Y deux espaces Polonais, munis de leurs tribus boreliennes respectives, et f une bijection mesurable de
X dans Y . Alors f 1 est mesurable.
Remarques II-19.
(i) En consequence des theor`emes de stabilite que nous
avons enonces, la plupart (sinon la totalite) des fonctions que lon est amene
`a construire pour resoudre des probl`emes concrets dans R ou Rd sont mesurables. Cela ne veut pas dire quil faille forcement se dispenser de montrer
la mesurabilite, quand on applique un theor`eme du cours ! Cependant, dans
la quasi-totalite des probl`emes que lon rencontre en analyse reelle, toutes les
fonctions sont mesurables et, le plus souvent, on ne se donne meme pas la peine
de le mentionner. Cette r`egle admet quelques exceptions ; nous en reparlerons
dans le chapitre IV.
(ii) La situation est un peu differente en theorie des probabilites, surtout dans
letude des processus stochastiques. Dune part, dans ce contexte on consid`ere
souvent des produits infinis, parfois indexes par un ensemble non denombrable,
pour lesquels la mesurabilite peut etre une propriete non triviale. Dautre part,
dans ce domaine on est souvent amene `a definir des tribus plus ou moins
grandes, embotees les unes dans les autres, et la mesurabilite par rapport aux
plus ces tribus pourra etre facilement violee. Voici un exemple classique : soit
X = {0, 1}N , que lon interpr`ete comme lespace des suites de resultats obtenus
quand on fait une infinite denombrable de tirages pile ou face (0 pour face,
1 pour pile). On decide naturellement que toutes les parties de {0, 1} sont
mesurables. Il est naturel dintroduire une fois pour toutes la tribu produit
(infini) sur X, qui rend mesurables toutes les applications coordonnees k :
x 7 xk . Cependant, dans une perspective stochastique, on pref`ere souvent
munir X de la famille de tribus embotees (An )nN , o`
u An est la tribu engendree
par les applications 1 , . . . , n (constituee des parties cylindriques dont la base
est un sous-ensemble arbitraire des n premiers facteurs). Un indice n etant fixe,


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

73

il existe bien s
ur de tr`es nombreuses fonctions qui ne sont pas An -mesurables
(`a commencer par n+1 ).
(iii) Si X est un espace topologique, muni de sa tribu borelienne, on a vu que
toute limite simple dune suite de fonctions continues est mesurable. Il est
naturel de se demander si la reciproque est vraie ; dans un tel cas on pourrait definir les fonctions mesurables comme les limites de fonctions continues.
La reponse est negative : on ne peut pas en general approcher une fonction
mesurable par des fonctions continues. Cependant, sous certaines hypoth`eses
topologiques (compacite locale, par exemple), la reponse devient positive si
on sautorise `a oublier un ensemble de mesure nulle : cest un corollaire du
th
eor`
eme de Lusin, que nous demontrerons `a la fin de ce chapitre. Nous mentionnerons egalement le th
eor`
eme de Vitali-Carath
eodory, qui montre que
lon peut approcher une fonction mesurable par des fonctions semi-continues
plus grandes, ou plus petites, au prix dune erreur arbitrairement petite sur
lintegrale.
II-1.3. Tribu engendr
ee par une fonction mesurable.
or`
The
eme II-20 (tribu engendree par une fonction). (i) Soient X un espace
quelconque et Y un espace mesurable, et soit f une application quelconque de X
dans Y . Il existe alors une plus petite tribu sur X qui rende f mesurable ; on la note
(f ). Elle est faite de tous les ensembles f 1 (B), o`
u B est une partie mesurable
quelconque de Y .
Si au depart X est un espace mesurable, muni dune tribu A, et f est mesurable,
alors (f ) A.
(ii) Plus generalement, soient X un espace quelconque, (Yt )tT une famille despaces mesurables indexes par un ensemble T arbitraire ; pour tout t T on se donne
une fonction ft : X Yt . Alors il existe une plus petite tribu sur X qui rende
mesurables toutes les applications ft ; on la note ((ft )tT ). Si X est au depart
un espace mesurable, muni dune tribu A, et chacune des ft est mesurable, alors
((ft )tT ) A.

D
emonstration. Lenonce (i) est une consequence immediate des definitions,
et des formules
\  \
[  [
f 1
Bk =
f 1 (Bk );
f 1
Bk =
f 1 (Bk ).

Pour lenonce (ii), on construit la tribu ((ft )tT ) comme lintersection de toutes les
tribus contenant toutes les tribus (ft ).

Intuitivement, la tribu engendree par une fonction mesurable f est faite des
parties dont la definition ne fait intervenir que les valeurs de f ; une fonction
mesurable pour la tribu (f ) est donc une fonction qui ne depend que de f une
propriete quil peut etre utile de formaliser dans des contextes tr`es varies. Essayons
de caracteriser ces fonctions. Pour se convaincre que le probl`eme est assez subtil,
expliquer pourquoi la demonstration ci-dessous est incompl`ete.
Pr
etendu Th
eor`
eme II-21 (fonctions mesurables pour (f )). Soient X un
espace quelconque, et Y et Z deux espaces mesurables. On se donne f une fonction
quelconque de X dans Y , et on munit X de la tribu (f ). On suppose en outre que
les singletons de Z sont mesurables. Alors les fonctions mesurables de X dans Z

74

CHAPITRE II

(13 juin 2010)

sont exactement les fonctions de la forme f , o`


u est une fonction mesurable de
Y dans Z.
monstration. Soit g une fonction mesurable de X dans Z. On
pr
etendue de
pose B = f (X). On va construire une fonction mesurable sur B telle que g = f .
On pourra ensuite attribuer une valeur quelconque `a sur Y \ B.
Soit maintenant z Z, par hypoth`ese {z} est mesurable, et Az := g 1 ({z}) est
un element de (f ), il secrit donc f 1 (Bz ) avec Bz mesurable, que lon peut choisir
inclus dans B. Les Bz sont deux `a deux disjoints : si y Bz Bz avec z 6= z , alors
on ecrit y = f (x), do`
u x f 1 (Bz ) f 1 (Bz ) = g 1 ({z}) g 1 ({z }) = . Ils
recouvrent par ailleurs B, puisque tout element y de B secrit sous la forme f (x),
on peut alors poser z = g(x) et on a x Az , do`
u x f 1 (Bz ), do`
u f (x) Bz .
Tout y B appartient donc `a un unique Bz , et on peut alors poser (y) = z.

Nous verrons plus loin comment demontrer rigoureusement un enonce un peu
moins ambitieux.
II-1.4. Fonctions mesurables et compl
etion. Le theor`eme suivant fait le
lien entre fonctions mesurables pour une tribu, et fonctions mesurables pour la tribu
completee.
Th
eor`
eme II-22 (mesurabilite pour la tribu completee). Soit (X, A, ) une
tribu, et A la completion de A pour ; soit f une fonction mesurable pour la tribu
A. Alors il existe une fonction g, mesurable pour la tribu A, telle que f = g -presque
partout.
Nous demontrerons ce theor`eme dans la section II-2.2, grace `a une tr`es efficace
methode dapproximation des fonctions mesurables.
II-2. Construction de lint
egrale
De la meme facon que les ensembles mesurables sont ceux dont on definit la
mesure, les fonctions mesurables sont celles dont on esp`ere definir lintegrale.
Cependant, nous ne parviendrons pas `a definir une integrale pour toutes les
fonctions mesurables. Lintegrale peut bien s
ur diverger (valoir formellement +),
mais ce nest pas tr`es grave : on peut attribuer la valeur +. Plus grave est la
possibilite de compensation entre valeurs positives et valeurs negatives. Dans le
cas de lintegrale de Riemann, on connat bien les difficultes liees au maniement
des integrales semi-convergentes, pour la definition desquelles divers procedes de
limite ad hoc (qui setendent mal `a des espaces plus generaux que R) sont necessaires.
Dans la theorie de Lebesgue, nous eluderons cette difficulte en ne considerant que
des integrales absolument convergentes.
On commencera par definir lintegrale dune fonction positive : cette quantite
sera toujours bien definie, pourvu que lon admette la valeur +. Comme dans
lenonce du theor`eme II-14, il est commode de considerer des fonctions `a valeurs
dans [0, +].
II-2.1. Fonctions simples. Comme dans la theorie de Riemann, nous allons
definir la valeur de lintegrale dune fonction en lapprochant par des fonctions particuli`erement simples, pour lesquelles la valeur de lintegrale est indiscutable.


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

75

D
efinition II-23 (fonction simple). Soit X un espace mesurable. On appelle
fonction etagee, ou fonction simple, une fonction de la forme
f=

N
X

k 1Ak ,

k=1

o`
u les k sont des nombres positifs et les Ak sont des parties mesurables formant
une partition de X.
Remarque II-24. La condition de positivite est imposee uniquement parce que
nous avons pour but de definir dabord lintegrale des fonctions positives.
Les crit`eres suivants sont presque evidents et laisses en exercice.
Proposition II-25 (reformulation de la simplicite). (i) Soit (Ak )1kN une famille finie de parties mesurables dunP
espace mesurable X, et (k )1kN une famille
de nombres reels positifs ; alors f = k 1Ak est simple.
(ii) Une fonction f est simple si et seulement si elle est mesurable, positive et
prend un nombre fini de valeurs.
La definition de lintegrale dune fonction simple tombe sous le sens :
D
efinition II-26 (integrale dune fonction simple). Une fonction simple f etant
donnee sur lespace mesure (X, ), avec les notations de la Definition II-23, on pose
Z

f d =

N
X

k [Ak ],

k=1

avec la convention 0 (+) = 0.


Remarque II-27. Cette definition est independante du choix des k et des Ak ,
comme on pourra le verifier en exercice (fastidieux et pas si facile). Si lon impose que
les k soient tous distincts
et les Ak disjoints, on a alors unicite de la representation
P
de f sous la forme
k 1Ak .

Proposition II-28 (additivite de lintegrale des fonctions simples). Soient f et


g deux fonctions simples, alors pour tous , R+ , la fonction f + g est simple,
et
Z
Z
Z
(f + g) d = f d + g d.
En particulier, si f =

k 1Ak , alors
Z
X
f d =
k [Ak ],

1kN

que les Ak forment une partition ou non.


P
P
D
emonstration. Ecrivons f =
aj 1Aj , gP=
bk 1Bk , o`
u les (Aj ) et les Bk
forment deux partitions de X. Alors f + g = jk (aj + bk )1Aj Bk est bien une

76

CHAPITRE II

(13 juin 2010)

fonction simple, et la valeur de son integrale est


X X
X X
X
bk (
[Aj Bk ])
[Aj Bk ]) +
(aj + bk )[Aj Bk ] =
aj (
j

jk

X
j

X
j

aj [Aj (Bk )] +
aj [Aj ] +

X
k

bk [(Aj ) Bk ]

bk [Bk ].


II-2.2. Approximation des fonctions mesurables. Il est bon de savoir que
toute fonction mesurable positive peut etre approchee par des fonctions simples.
Plus precisement, nous allons demontrer lenonce suivant.
or`
The
eme II-29 (approximation par des fonctions simples). Soit f une fonction
mesurable sur un espace X, `a valeurs dans R+ {+}. Alors il existe une suite
croissante (n )nN de fonctions simples, qui converge simplement vers f .
Si f est bornee par M, on peut en outre imposer n n1 M/2n , 0 = 0 ; et
si f est non bornee, on peut imposer n n1 1|f |n + 2n .
Si X est muni dune mesure -finie , on peut en outre imposer `a chaque n
detre nulle en-dehors dun ensemble de mesure finie.
emonstration. Soit n = 2n , on pose n (x) = kn si f (x) [kn , (k + 1)n [
D
et f (x) < n ; n (x) = n si f (x) n. Il est facile de verifier que n (x) converge vers
f (x) pour tout x. Dautre part, si f (x) [kn , (k + 1)n [, alors f (x) [2kn+1 , (2k +
2)n+1 [, donc n+1 (x) vaudra soit 2kn+1 , soit (2k + 1)n+1, soit (2k + 2)n+1, et dans
tous les cas sera superieur ou egal `a n (x).
Dans le cas o`
u on se donne une mesure -finie , on a X = Xn , avec [Xn ] <
+, et on peut poser
en = n 1Xn pour prouver la derni`ere partie de lenonce. 
f

n+1

Fig. 1. Approximation dune fonction mesurable par des fonctions simples

Corollaire II-30 (une fonction mesurable est combinaison infinie de fonctions indicatrices). Soit f une fonction mesurable sur un espace X, `a valeurs dans


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

77

R+ {+}. Alors il existe des nombres positifs (ck )k1 et des ensembles mesurables
(Ak )kN tels que

X
ck 1 A k .
f=
k=1

Exercice II-31. Utiliser une variante de la construction precedente pour montrer que lon peut choisir la famille (ck ) a priori parmi lensemble des suites qui
convergent vers 0, et dont la serie diverge (par exemple, ck = 1/k fait laffaire).

Pour illustrer linteret de ce theor`eme dapproximation, nous allons lutiliser pour


resoudre le probl`eme aborde dans le paragraphe II-1.3, dans un cadre leg`erement
restreint ; et pour demontrer le Theor`eme II-22.
or`
The
eme II-32 (fonctions mesurables pour (f )). Soient X un espace quelconque, Y un espace mesurable, et Z = R (muni de sa tribu borelienne). On se donne
f une fonction quelconque de X dans Y , et on munit X de la tribu (f ). Alors les
fonctions mesurables de X dans Z sont exactement les fonctions de la forme f ,
o`
u est une fonction mesurable de Y dans Z.
D
emonstration. 1. Soit g une fonction simple de X dans R+ . Comme g prend
un nombre fini de valeurs, la tentative de demonstration presentee au paragraphe II1.3 aboutit (pourquoi ?) et permet de construire une fonction mesurable, telle que
g = f.
2. Si maintenant g est une fonction positive arbitraire, on peut construire une
famille gn de fonctions simples, (f )-mesurables, convergeant simplement vers g. En
particulier, il existe n mesurable tel que gn = n f . La fonction := lim sup n
est mesurable, et pour tout x X on a

g(x) = lim gn (x) = lim n (f (x)) = lim sup n (f (x)) = (lim sup n )(f (x)) = (f (x)).

3. Enfin, si g est une fonction arbitraire, on peut ecrire g = f , do`


u
g = (+ ) f .

Remarque II-33. Cette preuve se generalise au cas o`
u Z est un espace Polonais
arbitraire. En effet, on a vu dans lExercice II-16 que toute limite de fonctions
mesurables, `a valeurs dans un espace metrique complet, est mesurable. Dautre
part, une fonction mesurable f : X Z etant donnee, o`
u Z est un espace metrique
s
eparable, on peut modifier la preuve du theor`eme dapproximation II-29 pour
montrer que f = lim fn , o`
u chaque fn ne prend quau plus une infinite d
enombrable
de valeurs. Ces enonces sont suffisants pour conclure.
or`
D
emonstration du The
eme II-22. En decomposant f en parties positives et negatives, on se ram`ene au cas o`
u f est positive. Soit f une fonction mesurable pour la tribu A ; dapr`es le Corollaire II-30, on peut ecrire

X
ck 1 A k ,
f=
k=1

o`
u les ck sont des nombres positifs, et les Ak sont des elements de A. Par definition
de la tribu completee, pour tout k on peut ecrire Ak = B
k Ek , Ek Nk , avec
P
Bk , Ek A et [Nk ] = 0. On pose alors N := Nk , et g = ck 1Bk .


78

CHAPITRE II

(13 juin 2010)

Le theor`eme dapproximation des fonctions mesurables par des fonctions simples


rend plausible lidee que lon peut construire lintegrale des fonctions mesurables
positives `a partir de lintegrale des fonctions simples ; cest effectivement ce que
nous allons faire.
II-2.3. Int
egrale des fonctions positives.
D
efinition II-34 (integrale dune fonction positive). Soit (X, ) un espace mesure, et f une fonction mesurable sur X, `a valeurs dans R+ {+}. On appelle
integrale de f pour la mesure , et on note
Z
Z
Z
Z
f d =
f d =
f (x) d(x) =
f (x) (dx)
X

le nombre

sup

Z

g d; g simple; 0 g f

[0, +].

Remarque II-35.
(i) Le supremum est pris sur une classe de fonctions non
vide, puisque la fonction nulle est admissible.
(ii) Si f est une fonction simple, cette definition concide avec celle que nous
avons donnee au paragraphe precedent.
(iii) Nous verrons dans le chapitre suivant que

Z
X 1 
k
f d = lim
,
x; f (x) n
n
n
2
2
kN

ce qui justifie lintuition suggeree par la figure 1. En ce sens, lintegrale de


Lebesgue est bien un procede de sommation par tranches.

(iv) Si A est une Rpartie mesurable de X, on peut considerer A comme un espace


mesure et definir A f comme lintegrale de la restriction de f `a A.

D
efinition II-36 (fonctions integrables). Si f est une fonction mesurable positive dintegrale finie, on dit quelle est integrable, ou sommable.
La proposition suivante rassemble quelques proprietes elementaires de lintegrale.
Comme les ensembles negligeables (de mesure nulle) ne jouent aucun role dans la
valeur de lintegrale, il est commode de lexprimer en utilisant la terminologie ciapr`es.

D
efinition II-37 (presque partout). Soit (X, ) un espace mesure. On dit
quune propriete est vraie presque partout, ou -presque partout, ou d-presque partout, ou p.p., ou -p.p., ou d-p.p., si lensemble des elements de X qui ne verifient
pas cette propriete est de mesure nulle.
Proposition II-38 (Proprietes elementaires de lintegrale des fonctions positives). Soient (X, ) un espace mesure, et f, g deux fonctions positives mesurables
sur X.
R
(i) Si f d < +, alors f est finie presque partout ;
R
(ii) Si f d = 0, alors f est nulle presque partout ;
R
R
(iii) Si f g presque partout, alors f g. En particulier,R si g est
R sommable,
alors f lest aussi. Par ailleurs, si f = g presque partout, alors f = g.


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

79

(iv) Si A et B sont deux parties mesurables disjointes, et f est une fonction


mesurable positive, alors
Z
Z
Z
f=
f+
f.
AB
1

D
emonstration. (i) Si A = f (+) est de mesure strictement positive, alors
la famille de fonctions simples (k1RA )kN montre que le supremum dans la definition
de lintegrale de f est infini,
do`
u f = +.
R
(ii) Supposons que f = 0 ; soit > 0. Si la mesure de F := {x; f (x) }
etait strictement positive, on pourrait construire une fonction simple valant sur
F , positive et dintegrale strictement positive, minorant f , donc lintegrale de f
serait strictement positive. Cest faux par hypoth`ese, donc F est de mesure nulle.
En consequence, lensemble des points o`
u f nest pas nulle est de mesure nulle, car
cest la reunion denombrable des F1/k (k N), qui sont tous de mesure nulle.
Enfin, (iii) est evident par construction : si f g presque partout, soit une
fonction simple minorant f , on redefinit sur lensemble negligeable o`
u f > g, en
lui attribuant la valeur 0 sur cet ensemble. La fonction ainsi obtenue est simple,
minore g et a meme integrale que . On passe ensuite au supremum sur toutes les
fonctions simples minorant f .

II-2.4. Int
egrale des fonctions sommables.
D
efinition II-39 (fonctions sommables). On appelle fonction sommable une
fonction mesurable `a valeurs dans R telle que |f | est sommable. Alors la partie
positive f+ = max(f, 0) de f , et sa partie negative f = max(f, 0), etant majorees
par |f |, sont toutes deux sommables, et on pose
Z
 Z

Z
f d =
f+ d
f d .
Remarque II-40. Plus generalement, on peut definir
lune au moins des fonctions f+ et f est sommable.
La proposition suivante est presque une trivialite.

f d dans R d`es que

Proposition II-41 (proprietes elementaires de lintegrale des fonctions sommables). Soit (X, ) un espace mesure, et f une fonction mesurable de X dans R.
Alors,
(i) Si |f | est majore par une fonction sommable, alors f est sommable ;
(ii) Si f est sommable, alors
Z Z


f |f |;

(iii)R Si f et g sont deux fonctions sommables, et f g presque partout, alors


f g.
(iv) Si A et B sont deux parties mesurables disjointes, et f est une fonction
sommable, alors
Z
Z
Z

f+

f=

AB

f.

Exemple II-42. Si X est de mesure finie, toute fonction bornee est sommable.
En effet, |f | est alors majore par une fonction constante c, dont lintegrale vaut
c[X].

80

CHAPITRE II

(13 juin 2010)

II-3. Lint
egrale est une forme lin
eaire positive
On rappelle quune forme lineaire L sur un espace vectoriel E est une application
lineaire de E dans R compatible avec les operations daddition et de multiplication
par un scalaire. Quand lespace E est un espace de fonctions `a valeurs reelles, on
dit que L est positive si elle prend des valeurs positives sur toutes les fonctions
positives.
Dans le cas present, il est trivial que lintegrale
dune fonction
sommable positive
R
R
est positive. Il est `a peine moins trivial que (f ) = R f pour toute
fonction
f
R
R
sommable et pour tout scalaire . La relation capitale (f + g) = ( f ) + ( g) est
en revanche beaucoup plus subtile !
II-3.1. Addition des fonctions positives.
or`
The
eme II-43 (addition des integrales des fonctions positives). Soient f et g
deux fonctions positives mesurables sur un espace mesure (X, ). Alors
Z
Z
Z
(f + g) d = f d + g d.

En particulier, f + g est sommable si (et seulement si) f et g le sont.


R
R
D
emonstration.
1.
Si
f
=
+
ou
g = +, alors par comparaison on
R
sait que (f + g) = + et il ny a rien `a demontrer. Supposons donc que ces deux
integrales sontR finies.R Soient R et R des fonctions simples telles que 0 f ,
0 g, et f + , g + . Dapr`es la Proposition II-28, + est
simple, et
Z
Z
Z
Z
Z
Z
f + g + + 2 = ( + ) + 2 (f + g) + 2.
En faisant tendre vers 0, on obtient
Z
Z
Z
f + g (f + g).

2. Par la Proposition II-29, on peut trouver des suites croissantes (k ) et (k ) de


fonctions simples telles que 0 k f , 0 k g, convergeant simplement vers
f et g respectivement. Soit (0, 1) arbitraire, on pose
n
o
Ak := x; k (x) (1 )f (x), k (x) (1 )g(x) .

Les Ak forment une famille croissante ; si f (x) + g(x) < +, alors x Ak pour
k assez grand (cest evident si f (x) = 0, tandis que si f (x) 6= 0 la limite de k (x)
est strictement plus grande que (1 )f (x)). On a donc X = Ak Z, o`
u Z est
lensemble des x pour lesquels f (x) = + ou g(x) = +. Puisque f et g sont
sommables, Z est un ensemble negligeable.
Soit une fonction simple minorant f + g. Par additivite de lintegrale des
fonctions simples,
Z
Z
Z
Z
Z
Z
Z
f + g k + k
k +
k =
(k + k ).
Ak

Ak

Ak

Par la definition de Ak et la positivite de lintegrale, on a


Z
Z
Z
(k + k )
(1 ) = (1 )
Ak

Ak

Ak


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

81

P
Ecrivons sous la forme 1jJ j 1Bj . Alors on a, puisque les Ak forment une
famille croissante et que [X \ (Ak )] = 0,
Z
Z
X
X
X
=
j [Ak Bj ]
j [(Ak ) Bj ] =
j [(Ak ) Bj ] = .
Ak

En passant `a la limite quand k dans linegalite


Z
Z
Z
f + g (1 )
,
Ak

on trouve donc

f+

g (1 )

X\Z

= (1 )

En faisant tendre vers 0, on obtient


Z
Z
Z
f + g .

Puisque est une fonction simple arbitraire minorant f + g, on a finalement


Z
Z
Z
f + g (f + g).

Remarque II-44. Dans le chapitre suivant, nous utiliserons un raisonnement


exactement similaire pour demontrer le theor`eme dit de convergence dominee de
Lebesgue. En fait, dans la plupart des ouvrages de reference on demontre dabord le
theor`eme de convergence dominee, et on en deduit ensuite ladditivite de lintegrale.
II-3.2. G
en
eralisation : fonctions sommables. Comme consequence facile
du Theor`eme II-43, nous allons etablir la linearite de lintegrale des fonctions sommables.
or`
The
eme II-45 (linearite de lintegrale). Soient (X, ) un espace mesure ; f ,
g deux fonctions sommables sur X, `a valeurs dans R ; et , deux scalaires. Alors
f + g est sommable, et
Z

Z

Z
(f + g) d =
f d +
g d .

En particulier, lintegrale est une forme lineaire positive sur lespace vectoriel
des fonctions sommables.
R
R
R
emonstration. On note dabord que (f ) d = ( f d), et (g) d =
R D
( g Rd). Il suffit donc
R de montrer
R que si f et g sont sommables de signe quelconque,
alors (f + g) d = ( f d) + ( g d). Pour cela on ecrit
(f + g)+ (f + g) = f + g = (f+ f ) + (g+ g ),

do`
u (quand f et g sont finies, ce qui est vrai en-dehors dun ensemble de mesure
nulle)
(f + g)+ + f + g = f+ + g+ + (f + g) ;
on int`egre alors les deux membres en utilisant le Theor`eme II-43 :
Z
Z
Z
Z
Z
Z
(f + g)+ d + f d + g d = f+ d + g+ d + (f + g) d.

82

CHAPITRE II

(13 juin 2010)

Toutes ces quantites sont finies puisque |f | et |g| sont integrables, on en deduit donc
Z
Z
Z
Z
Z
Z
(f + g)+ d (f + g) d = f+ d f d d + g+ d g d,
R
R
R
soit (f + g) d = f d + g d.
Le raisonnement precedent montre bien que lintegrale par rapport `a est une
formeRlineaire. La positivite quant `a elle est evidente : si f est mesurable positive,
alors f d 0.


D
efinition II-46 (espace de Lebesgue). Lespace vectoriel des fonctions sommables est note L1 , ou L1 (X), ou L1 (), ou L1 (d), ou L1 (X, ), ou L1 (X, d) et
appele espace de Lebesgue dexposant 1.
Remarque II-47. Soient f et g deux fonctions sommables, et R. Alors
Z
Z
Z
|f | = |||f | = || |f |;
Z
Z
Z
Z
|f + g| |f | + |g| = |f | + |g|.

Lapplication

f 7

|f |,

definie sur L1 (d), est donc proche Rde satisfaire les axiomes requis par une norme : il
lui manque seulement la propriete R|f | = 0 = f = 0. Mais cette derni`ere identite
est clairement fausse : on sait que |f | = 0 si et seulement si la fonction f est
nulle hors dun ensemble de mesure nulle (pour ), ce qui nimpose pas `a f detre
identiquement nulle.
R
Si lon veut transformer L1 en espace vectoriel, muni de la norme |f |, il faut
donc quotienter par la relation dequivalence concider presque partout. Deux fonctions qui ne diff`erent que par un ensemble de mesure nulle seront alors considerees
identiques. Insistons sur le fait que cette operation de quotient nest utile que
si lon veut mettre `a profit la structure despace vectoriel norme de lespace ainsi
obtenu.
II-3.3. Action sur les fonctions continues. On a vu que si X est un espace
mesure de mesure finie, alors les fonctions bornees sont integrables. Definissons la
norme de la convergence uniforme sur lespace Cb (X) des fonctions continues
bornees de X dans R par la formule
kf k := sup |f (x)|.
xX

On a alors lenonce suivant.


Proposition II-48 (lintegrale appartient `a (Cb ) ). Soit une mesure de Borel
sur un espace X de mesure finie. Alors definit une forme lineaire positive continue
sur lespace vectoriel Cb (X) des fonctions continues bornees sur X, norme par la
norme de la convergence uniforme.
Remarque II-49. On rappelle que la norme de la convergence uniforme est
definie par
kf k := sup |f (x)|.
xX


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

83

D
emonstration. Bien s
ur, toute fonction continue est borelienne, donc mesurable, et toute fonction mesurable bornee est integrable. En outre, on a
Z Z
Z


f |f | kf k = [X] kf k.

Il sensuit que lintegrale est bien une forme lineaire continue sur Cb (X), dont la
norme est majoree par le nombre positif [X].

On peut construire ainsi de nombreuses formes lineaires continues sur Cb (X),
mais il nest pas clair que ce soient les seules, meme dans des cas simples comme X =
Rd . Pour sen convaincre, le lecteur averti pourra utiliser le theor`eme dextension de
Hahn-Banach pour prolonger lapplication limite `a linfini, definie sur le sousespace ferme des fonctions qui convergent `a linfini, en une application limite `a
linfini definie pour toutes les fonctions continues bornees ! Une telle application
nest pas une mesure. Cest en revanche une mesure finiment additive !
Cependant, si X est compact, le theor`eme de representation de Riesz assure que
toutes les formes lineaires continues sur C(X) correspondent `a des mesures. Dans ce
cas, bien s
ur, toutes les fonctions continues sont bornees. Nous allons donner dans
la prochaine section un enonce un peu plus general.
Remarque II-50. Un lecteur aux fortes convictions pourra objecter aux arguments ci-dessus, car lexistence de lapplication limite `a linfini repose sur lutilisation du theor`eme de Hahn-Banach, qui lui-meme utilise laxiome du choix. Nous reparlerons bientot de ces subtilites logiques. En tous les cas, la construction precedente
montre au moins quil est impossible dexclure lexistence de formes lineaires continues qui ne soient pas des mesures, sauf `a changer laxiomatique traditionnelle.
II-4. Le th
eor`
eme de Riesz
Ce theor`eme est fondamental car il presente une autre approche, alternative `a
celle de Lebesgue, de la construction dune integrale abstraite.
II-4.1. Enonc
e du th
eor`
eme. Commencons par quelques definitions.
D
efinition II-51 (espaces de fonctions continues). Soit X un espace topologique
arbitraire. Si f : X R est une fonction continue, on appelle support de f le plus
petit ferme en-dehors duquel f est identiquement nulle. On note C(X) lespace des
fonctions continues de X dans R, Cb (X) lespace des fonctions continues born
ees
sur X, et Cc (X) lespace des fonctions continues `
a support compact sur X.
Enfin, on note C0 (X) lespace des fonctions f continues sur X qui tendent vers 0
`
a linfini, au sens o`
u pour tout > 0 on peut trouver un compact K X en-dehors
duquel |f | . Clairement,
Cc (X) C0 (X) Cb (X) C(X).

Les espaces Cc (X), C0 (X) et Cb (X), munis de la norme de la convergence uniforme,


sont des espaces vectoriels normes.
Remarque II-52. Lespace Cc (X) nest pas a priori complet (au sens usuel) :
par exemple, on peut facilement construire une fonction sur R, `a support non compact, qui soit limite uniforme de fonctions continues `a support compact. Dans un
espace localement compact, la completion de Cc (X) est lespace C0 (X) des fonctions
continues qui tendent vers 0 `a linfini. Lespace Cb (X), en revanche, est complet.

84

CHAPITRE II

(13 juin 2010)

La definition suivante, interne `a ce cours, servira uniquement dans cette section,


pour abreger quelques formulations.
D
efinition II-53 (presque regularite). Soit une mesure de Borel sur un espace
topologique X. On conviendra de dire que est presque reguli`ere si pour tout Borelien
A de X,


[A] = inf [O]; O ouvert; A O
(regularite exterieure) et pour tout ouvert B de X,


[B] = sup [K]; K compact; K B .

or`
The
eme II-54 (theor`eme de representation de Riesz). Soit X un espace topologique separe, localement compact. Alors on peut identifier (mettre en correspondance bijective)
- dune part, les formes lineaires sur Cc (X), positives ;
- dautre part, les mesures de Borel sur X, presque reguli`eres et finies sur les
compacts ;
via la formule
Z
f = f d.
Avant de continuer, voici une liste de commentaires sur cet enonce, qui admet
quelques variantes plus ou moins subtiles.

Remarques II-55 (Commentaires sur le Theor`eme de Riesz).


(i) Lhypoth`ese
de compacite locale est fondamentale. Lespace de Wiener W = { C([0, 1]; Rn ); (0) =
0} ne la remplit pas : on verifie aisement que ses compacts sont tous dinterieur
vide. Lespace Cc (W ) est donc reduit `a {0} ! Pourtant il existe des mesures non
triviales sur W , telles que les mesures de Dirac, ou la cel`ebre mesure de Wiener.
(ii) Dans lenonce, on ne peut pas remplacer Cc (X) par lespace plus gros Cb (X).
On peut en revanche le remplacer sans dommage par lespace C0 (X), completion
de Cc (X).
(iii) Dans la definition de presque regularite on a impose que lidentite [A] =
sup K A[K] soit verifiee pour tout ouvert. En fait cette identite sera alors
verifiee automatiquement pour tout ensemble mesurable de mesure finie. En
particulier, si une mesure produite par le Theor`eme de Riesz est de masse
totale finie, alors elle est reguli`ere. Cette remarque sav`erera utile plus tard
dans la demonstration du Theor`eme VI-61 ; il ne faut cependant pas y attacher
une grande importance, car en pratique, dans la grande majorite des cas la
regularite est automatique, par exemple grace aux Theor`emes II-58 et II-59
presentes dans la sous-section suivante.
(iv) On peut, si on le souhaite, completer la mesure grace au Theor`eme I-80,
et obtenir donc une mesure compl`ete.
(v) La preuve ne necessite pas vraiment la linearite de lapplication : il suffit de
savoir que est une fonctionnelle positive, croissante (f g = f g) et
sur-additive ((f +g) f +g) sur lespace des fonctions continues positives
`a support compact. Cette remarque aussi sera utile pour la demonstration du
Theor`eme VI-61.


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

85

(vi) Si lon reflechit un peu `a lenonce, on a limpression que lhypoth`ese de


presque regularite peut etre evitee : en effet, toute mesure de Borel finie sur
les compacts definit bien une forme lineaire positive sur Cc (X). Cependant,
si lon nimpose pas la presque regularite, rien ne garantit a priori lunicite de
la mesure correspondant `a .
Voici maintenant deux remarques dordre plus general :
Remarque II-56. Si [X] = +, la forme lineaire definie par nest pas
continue sur Cc (X) considere comme espace vectoriel norme (norme de la convergence uniforme). En revanche, on peut munir Cc (X) dune topologie alternative bien
choisie, de sorte que soit une forme lineaire continue en un sens bien precis. Je
nen dirai pas plus sur ce probl`eme, dont la solution peut etre consideree comme le
point de depart de la theorie des distributions [Schwartz].
Remarque II-57. Le nom de theor`eme de representation de Riesz est egalement
donne `a un autre theor`eme, tr`es different (description du dual dun espace de Hilbert, voir Chapitre VI). Cette concidence na rien de surprenant, Riesz etant, avec
Banach, lun des principaux fondateurs de lanalyse fonctionnelle moderne.
Avant de passer `a la preuve du Theor`eme II-54, je vais maintenant donner deux
enonces simplifies.
II-4.2. Enonc
es simplifi
es. Lhypoth`ese de regularite est souvent verifiee automatiquement, sous des hypoth`eses peu contraignantes sur X. On pourra donc
retenir les variantes explicitees ci-apr`es, qui nutilisent pas explicitement ce concept.
Th
eor`
eme II-58 (theor`eme de representation de Riesz, version simplifiee). Soit
X un espace topologique separe, localement compact, dans lequel tout ouvert est
union denombrable de compacts. Alors on peut identifier
- dune part, les formes lineaires positives sur Cc (X) ;
- dautre part, les mesures boreliennes sur X, finies sur les compacts ;
via la formule
Z
f =

f d.

Ces mesures sont automatiquement reguli`eres.

Th
eor`
eme II-59 (theor`eme de representation de Riesz, cas metrique compact).
Soit X un espace topologique metrique compact. Alors on peut identifier
- dune part, les formes lineaires positives sur C(X) ;
- dautre part, les mesures boreliennes finies sur X ;
via la formule
Z
f =

f d.

Ces mesures sont automatiquement reguli`eres, et ces formes lineaires sont automatiquement continues.
D
emonstration. Les Theor`emes II-58 et II-59 sobtiennent en combinant le
theor`eme de representation de Riesz avec les theor`emes de regularite I-56 et I-54,
respectivement.


86

CHAPITRE II

(13 juin 2010)

On trouvera une demonstration compacte ( !), en apparence assez delicate, du


Theor`eme de Riesz, dans [Rudin, pp. 40-47]. Pour les besoins de ce cours, nous
allons etablir ce theor`eme comme une consequence relativement simple du Theor`eme
de Caratheodory generalise etabli au Chapitre I, Theor`eme I-71 ; on remarquera
dailleurs que la demonstration de [Rudin] reprend plusieurs des arguments utilises
dans la preuve du Theor`eme I-71. Notons au passage linteret du Theor`eme I-71 :
demontrer le theor`eme de Riesz via le Theor`eme de Caratheodory lui-meme, sous
la forme du Theor`eme I-69, est un casse-tete formidable ! Une variante de cette
derni`ere demarche est menee `a bien dans [Dudley], via un intermediaire delicat
appele theor`eme de Daniell-Stone, qui traite de prolongement des fonctionnelles
lineaires positives (voir aussi [Rudin, p. 398] ; in fine, la demonstration du Theor`eme
de Riesz y fait intervenir le theor`eme de convergence uniforme de Dini.
II-4.3. Preuve du th
eor`
eme de Riesz. Soit X un espace separe, localement
compact, et soit une mesure finie sur les compacts. Si f est une fonction continue
`a support compact K, elle est bornee par la fonction
sommable kf k 1K , donc somR
mable. La forme lineaire definie par f := f d est donc bien definie sur Cc (X),
et elle est evidemment positive.
Cest bien s
ur la reciproque qui est delicate. Soit une forme lineaire positive
sur Cc (X), montrons quil existe au plus une mesure , satisfaisant aux hypoth`eses
du Theor`eme de Riesz, qui puisse la representer. Soient 1 et 2 deux mesures
admissibles, et soit K un compact. Comme 1 est finie sur les compacts, et presque
reguli`ere, au sens de la Definition II-53, on sait quil existe un ouvert O contenant K
tel que 1 [K] 1 [O], o`
u > 0 est arbitrairement petit. Par le lemme dUrysohn,
on peut construire une fonction continue encadree par les fonctions indicatrices
1K et 1O . On a donc
Z
Z
Z
Z
2 [K] = 1K d2 d2 = d1 1O d1 = 1 [O] 1 [K] + .

On conclut en faisant tendre vers 0 que 2 [K] 1 [K], et par symetrie 1 [K] =
2 [K]. Il sensuit que 1 et 2 concident sur les compacts ; comme elles sont presque
reguli`eres, elles concident egalement sur les ouverts, et par suite (toujours par
presque regularite) sur tous les ensembles mesurables. Cela prouve lunicite de .
Passons maintenant `a la construction de . Lidee est encore une fois dapprocher
les fonctions indicatrices des ouverts par des fonctions continues. Pour tout ensemble
ouvert O, on pose donc


[O] = sup f ; f Cc (X); 0 f 1O .

Le probl`eme est maintenant de prolonger `a la tribu borelienne tout enti`ere. Comme


lensemble F de tous les ouverts de X est stable par intersection finie, le Theor`eme I71(ii) assure lexistence dun tel prolongement si la condition (7) est satisfaite pour
tous A, B ouverts.
Dans un premier temps, verifions que est denombrablement sous-additive sur
lensemble
P des ouverts : si (Ok )kN est une famille douverts, et O := Ok , alors
[O] k [Ok ]. En effet, soit f une fonction `a support compact, 0 f 1O , et soit
K son support. K etant inclus dans lunion des Ok , on peut appliquer le theor`eme I34 de partition de lunite pour trouver des fonctions continues i1 , . . . , in , telles que


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

87

P
0 ij 1, ij a son support inclus dans Oij et
ij = 1 sur K. En particulier,
X
X
f =(
ij )f =
gj ,
j

o`
u chaque fonction gj est `a support compact dans Oij , et prend ses valeurs dans
[0, 1]. On en deduit que
X
X
X
f =
gj
[Oij ]
[Ok ].
j

En passant au supremum sur f , on conclut que


X
[O]
[Ok ].
k

Comme la famille F est egalement stable par union denombrable, la definition


de la mesure exterieure se simplifie : dans le contexte present,


[A] = inf [O]; O ouvert, A O .

En particulier, il est clair que concide avec sur F . Donc, si A et B sont deux
ouverts de X, linegalite
[A] [A B] + [A \ B]

est consequence de la sous-additivite de . Il nous reste uniquement `a verifier


linegalite inverse, `a savoir : pour tous ouverts A et B de X,
(10)

[A B] + [A \ B] [A].

Nous allons demontrer cette inegalite en deux etapes.


Etape 1 : est sur-additive (et donc additive) sur F . Soient U et V deux ouverts
disjoints, nous allons voir que
[U] + [V ] [U V ],

ce qui est un cas particulier de (10). Soient f et g deux fonctions continues `a supports
compacts inclus dans U et V respectivement, `a valeurs dans [0, 1]. Les supports de
f et g etant disjoints, la fonction continue f + g est toujours `a valeurs dans [0, 1] ;
et bien s
ur, son support est inclus dans U V . Il sensuit
f + g = (f + g) [U V ].

On conclut en passant au supremum sur toutes les fonctions f et g admissibles.


Etape 2 : cas general. Cest seulement `a ce niveau de la construction que lhypoth`ese de compacite locale va intervenir. Soient deux ouverts A et B de X, et soit
f une fonction `a support compact K A B, `a valeurs dans [0, 1]. Dapr`es le
Lemme I-35, il existe un compact K et un ouvert O tels que
En particulier,
Par ailleurs,

K O K A B.
f [O ].

A \ B = A \ (A B) A \ K ,
et A \ K est un ouvert, do`
u

[A \ B] [A \ K ] = [A \ K ].

88

CHAPITRE II

(13 juin 2010)

On a finalement
f + [A \ B] [O ] + [A \ K ].
Les ouverts O et A \ K sont disjoints et leur union est incluse dans A ; grace au
resultat de lEtape 1, on peut completer linegalite precedente comme suit :
f + [A \ B] [O ] + [A \ K ] = [O (A \ K )] [A],
ce qui ach`eve la demonstration du theor`eme.
Les Remarques II-55 ne necessitent pas de justification, sauf le point (iii) que je
vais maintenant considerer.
D
emonstration de la Remarque II-55(iii). Soit A la famille de toutes les
parties mesurables, et B lensemble de toutes les parties A A tels que (a) [A] <
; (b) [A] = sup {[K]; Kcompact A}. Le but est de montrer que B est
exactement lensemble de toutes les parties de mesure finie. Nous allons proceder en
deux temps.
1. On verifie que A C B, pour tout compact C et pour tout A A. Pour
cela, on introduit


C := A A; A C B pour tout compact C .

Il est clair que C contient X ; et plus generalement tous les fermes (car lintersection
dun ferme et dun compact est compacte). Si lon montre que C est une classe
monotone, alors le Theor`eme I-68 (Lemme de classe monotone) impliquera que C
concide avec la tribu engendree par les fermes, qui est A tout enti`ere.
Montrons donc que C est une classe monotone. Si (A )N est une famille croissante delements de C, et C est un compact, pour tout N et pour tout > 0 on
peut trouver un compact K tel que [(A C) \ K ] 2 . Quitte `a remplacer K
par K1 . . . K , on peut supposer que la suite (K ) est croissante ; et on a toujours
[(A C) \ K ] . La suite ([K ])N est croissante et majoree par [A C], elle
converge donc, et il existe 0 N tel que pour tout 0 on ait [K \ K0 ] . On
conclut facilement que [(A C)\K0 ] 2, et la meme estimation vaut pour AC,
o`
u A est lunion des A . La conclusion est que C est stable par limite croissante.
Soient maintenant A et B dans C, soit C un compact et soit > 0. Soit K AC
un compact tel que [(A C) \ K] . Par ailleurs il existe un ouvert O contenant
B C tel que [O \ (B C)] . On en deduit que [(A \ B) O \ (K \ O)]
[(A C) \ K] + [O \ (B C)] 2. On en deduit que A \ B C, et C est
donc stable par difference. Ceci ach`eve de prouver que C est une classe monotone,
et conclut largument.
2. On verifie que tout A A de mesure finie est en fait un element de B. Soit
en effet A une telle partie, et soit > 0. Il existe un ouvert O contenant A tel que
[O] [A] + . Il existe un compact K contenu dans O tel que [O] [K] ;
en particulier [O \ K] 2. Puisque A K B (par letape 1), il existe un
compact K contenu dans A K tel que [(A K) \ K ] . On en deduit que
[A \ K ] [(A K) \ K ] + [A \ K] [(A K) \ K ] + [O \ K] + 2 = 3,
ce qui ach`eve largument.



INTEGRATION
SELON LEBESGUE ET SELON RIESZ

89

II-4.4. Compl
ement : approximation des fonctions mesurables par des
fonctions continues ou semi-continues. Le theor`eme de Riesz montre que sous
certaines hypoth`eses topologiques, on peut choisir les fonctions continues comme
point de depart de la theorie de lintegration, au lieu des fonctions simples. On peut
se demander si cette idee peut etre poursuivie plus loin, et sil est possible detablir
un analogue du theor`eme dapproximation par des fonctions simples, exprime en
termes de fonctions continues. Les theor`emes de Lusin et de Vitali-Caratheodory
donnent une reponse positive `a cette question. Tous deux sautorisent une erreur
arbitrairement petite, au sens de la mesure.
Th
eor`
eme II-60 (Theor`eme de Lusin). Soit X un espace topologique separe
localement compact, et soit une mesure de Borel reguli`ere sur X. Soit f : X R
une fonction mesurable, nulle en-dehors dun ensemble de mesure finie. Alors,
(i) pour tout > 0 il existe une fonction continue f , `a support compact, telle
que
inf f inf f sup f sup f
et f concide avec f en-dehors dun ensemble de mesure inferieure ou egale `a .
(ii) En-dehors dun ensemble de mesure nulle, f est limite dune suite (fn ) de
fonctions continues `a support compact, prenant toutes leurs valeurs dans [inf f, sup f ].
En utilisant de mani`ere anticipee le theor`eme de convergence dominee, qui sera
demontre dans le chapitre suivant, on peut deduire du theor`eme precedent le corollaire suivant :
Corollaire II-61 (Densite des fonctions continues). Soit X un espace topologique separe localement compact, et soit une mesure de Borel reguli`ere sur X,
-finie. Alors, pour toute fonction integrable f sur X on peut trouver une suite
(fn )nN de fonctions continues `a support compact, telle que
Z
|fn f | d 0.
n

eme II-60. Nous allons demontrer les deux enonces


eor`
emonstration du Th
D
en meme temps, en construisant une famille (fn )nN de fonctions continues `a support
compact, toutes comprises entre inf f et sup f , telles que [{x; f (x) 6= fn (x)}]
1/n, et pour presque tout x X, f (x) = fn (x) pour n assez grand.
Supposons dabord que f est la fonction indicatrice dun ensemble mesurable
A de mesure finie. Comme est reguli`ere, il existe une suite (Kn )nN de compacts
inclus dans A, et une suite (On )nN douverts contenant A, tels que [On \Kn ] 1/n.
Sans perte de generalite, on peut supposer la suite (Kn ) croissante et la suite (On )
decroissante. Par le Lemme dUrysohn I-33, pour chaque n il existe une fonction
continue n , `a support compact dans On , `a valeurs dans [0, 1], identiquement egale
`a 1 sur Kn . La fonction n concide avec f en-dehors de On \ Kn , qui est de mesure
inferieure ou egale `a 1/n. En outre, si lon pose G = On et F = Kn , N = G \ F ,
alors [N] = 0 ; tout x X \ N appartient `a Kn pour n assez grand, ou `a X \ On
pour n assez grand, et dans tous les cas on a alors n (x) = f (x). En conclusion,
(n )nN remplit le cahier des charges.
Par combinaison lineaire, le resultat setend instantanement au cas o`
u f est une
fonction simple, nulle en-dehors dun ensemble de mesure finie. Soit maintenant f
une fonction mesurable positive bornee, nulle en-dehors dun ensemble S de mesure

90

CHAPITRE II

(13 juin 2010)

finie ; sans perte de generalite on suppose f 1 ; on sait alors que f est limite
dune suite croissante (gk )kN de fonctions simples, nulles en-dehors de S, telles que
gk gk1 2k . Chacune de ces fonctions est egalement limite dune famille (k,n )n1
de fonctions continues `a support compact, telles quil existe une famille decroissante
de parties mesurables Ak,n verifiant
{x; k,n (x) 6= gk (x) gk1(x)} Ak,n ;

On definit alors

fn (x) =

[Ak,n ] 2k /n.

k,n (x).

k=0

Par
P convergence uniforme, fn est continue ; elle est bornee par sup f , et concide avec
k gk1 ) = f en-dehors de lensemble An := k Ak,n , dont la mesure est au plus
P(g

k
ecroissante, son intersection
k=0 2 /n = 2/n. En outre, la famille des An est d
est donc de mesure nulle, et tout x X \ (An ) verifie fn (x) = f (x) pour n = n(x)
assez grand. La famille (fn ) remplit donc toutes les conditions souhaitees.
Si f est positive mais non bornee, on definit Em := {x X; f (x) m}. Comme
f est mesurable et `a valeurs dans R, lintersection decroissante des Em est vide, et
par -additivite [Em ] 0 quand m . On peut alors effectuer un raisonnement
similaire au raisonnement ci-dessus. Enfin, si f nest pas positive, on separe f en
partie positive et negative f+ et f , et on conclut en appliquant le theor`eme `a f+ et
f separement.

D
emonstration du Corollaire II-61. Par hypoth`ese, on peut ecrire X comme
la reunion croissante des Xk (k N), avec Xk mesurable et [Xk ] < +. Soit
gn = f 1Xn 1|f |n . Puisque f est integrable, |f | est fini -presque partout, et donc
gn converge presque partout vers f . Le theor`eme III-11 de convergence dominee de
Lebesgue implique alors
Z
|f gn | d 0.

Pour chaque n, la fonction gn est nulle en-dehors de lensemble de mesure finie


Xn , et bornee par n. Par le theor`eme de Lusin, on peut trouver une fonction fn
continue `a support compact, bornee par n, qui concide avec gn en-dehors dun
ensemble An de mesure inferieure `a 1/n2 ). En particulier,
Z
2n
|gn fn | sup(|fn | + |gn |) [An ] 2 0.
n
R
Il sensuit que |f fn | 0.


Remarque II-62. Ce theor`eme de densite est tr`es general, mais pas tr`es explicite. Nous verrons plus tard que dans le cas o`
u X = Rn , on peut construire, grace
`a loperation de convolution, des approximations beaucoup plus explicites dune
fonction integrable.
Dans le theor`eme de Lusin, il est en general impossible dimposer f f , alors
que lon peut le faire quand on approche f par une famille de fonctions simples. Le
theor`eme suivant remedie partiellement `a ce probl`eme.
or`
The
eme II-63 (Theor`eme de Vitali-Caratheodory). Soit X un espace topologique localement compact, et soit une mesure de Borel reguli`ere sur X. Soit
f : X R une fonction mesurable. Alors, pour tout > 0 il existe des fonctions f +


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

91

et f , telles que f f f + , f est semi-continue superieurement et majoree, f


est semi-continue inferieurement et minoree, et
Z
Z
Z
+
f d f f d + .

D
emonstration. Quitte `a separer f en parties positive et negative, on peut
supposer f 0. En approchant f par une suite de fonctions simples, on constate
que lon peut ecrire

X
X
ci [Ei ] < +.
ci 1 E i ,
f=
i=1

i=1

Pour chaque i on choisit un ouvert Oi contenant Ei , et un compact Ki contenu dans


Ei , tels que
[Oi \ Ki ] /2i+1.
On pose alors

N
X
X
ci 1 K i ,
f+ =
ci 1 O i ,
f =
i=1

o`
u N est choisi de telle sorte que

i=N +1

On verifie facilement que f

i=1

ci [Ei ] /2.

et f verifient toutes les conditions requises.

II-5. Int
egration `
a valeurs vectorielles
Jusquici, nous avons seulement cherche `a integrer des fonctions `a valeurs dans
R ou R. Il est facile den deduire une theorie de lintegration des fonctions `a valeurs
dans un espace vectoriel de dimension finie, par exemple Rn ou C : il suffit dintegrer
composante par composante. On demontre facilement la proposition suivante.
Proposition II-64 (integration `a valeurs dans un espace vectoriel de dimension
finie). Soient (X, ) un espace mesure, et E = Rn (resp. E = C), muni dune norme
(resp. du module complexe) | |. On dit quune fonction mesurable f : X E est
integrable, ou sommable, si la fonction |f |, definie sur X et `a valeurs dans R+ , est
sommable. Une base (ek )1kn de E en tant que R-espace vectoriel etant donnee, on
peut decomposer la fonction f sous la forme
X
f=
fk ek ,

o`
u les fonctions fk sont mesurables de X dans R. Si f est sommable, toutes les
fonctions fk le sont, et on definit

Z
X Z
fk d ek .
f d =
X

Le vecteur ainsi defini ne depend pas du choix de la base (ek ), et loperation dintegration
ainsi construite satisfait aux r`egles de calcul suivantes : pour toutes fonctions sommables f et g, et pour tout R (resp. C),
Z
Z
(f ) d = f d,

92

CHAPITRE II
Z

(f + g) d =

f d +

(13 juin 2010)

g d,

Z
Z


f d |f | d.

En outre, si E = Rn et | | est la norme euclidienne (resp. E = C et | | est


le module), il ne peut y avoir egalite dans la derni`ere inegalite que si limage de f
est, hors dun ensemble negligeable, contenue dans une droite de Rn (resp. de C, vu
comme R-espace vectoriel).
On peut maintenant se poser la question de lintegration de fonctions `a valeurs
dans des espaces vectoriels plus generaux, eventuellement de dimension infinie. Cest
ce que lon appelle la th
eorie de lint
egration `
a valeurs vectorielles, ou theorie
de lint
egrale de Bochner. Cette question est assez naturelle quand on consid`ere
des fonctions `a plusieurs variables comme des fonctions dune variable `a valeurs
vectorielles, demarche classique en theorie des equations aux derivees partielles par
exemple, ou en theorie de linterpolation.
La definition de la sommabilite tombe sous le sens : une fonction mesurable f de
X dans un espace vectoriel abstrait E muni dune norme k k est dite integrable si la
fonction kf k est integrable sur X. Cependant, il est beaucoup plus delicat de definir
lintegrale de f : on ne peut pas, en general, se contenter de la definir composante
par composante.
On peut developper la theorie de lintegration `a valeurs vectorielles dune mani`ere
assez similaire `a la theorie de lintegration des fonctions `a valeurs reelles, avec
quelques subtilites cependant. Par exemple, pour passer de lintegrale des fonctions
`a valeurs positives `a lintegrale des fonctions `a valeurs reelles, nous avons tout simplement utilise le fait que tout nombre reel peut secrire comme difference de deux
nombres positifs. Mais si lespace des valeurs est un espace fonctionnel E, il nest
pas forcement vrai que toute fonction de E puisse secrire comme difference de deux
fonctions de E `a valeurs positives. On peut parfois elargir E pour sy ramener ; on
peut aussi developper la theorie directement, sans passer par les fonctions positives.
Ce faisant, on peut etre amene `a modifier leg`erement la definition des fonctions
simples pour que leur integration soit toujours possible, en consid`ererant uniquement des combinaisons lineaires de fonctions indicatrices densembles de mesure
finie, etc.
Il arrive aussi que les deux demarches (passage par les fonctions `a valeurs positives, ou approche directe) soient possibles ; au Chapitre ?? on etudiera un exemple,
le Theor`eme de Desintegration de la mesure, quil est plus facile de traiter de mani`ere
directe.
Les resultats principaux de la theorie de lintegrale de Bochner sont tr`es similaires
aux resultats classiques que nous avons etudies jusqu`a present, ne reservent gu`ere
de surprise, et peuvent presque toujours etre formules in fine dans le langage de
lintegrale classique : ainsi, lassertion u L1 (X; C(Y )) peut se transcrire en
Z


sup |u(x, y)| d(x) < +;
Y


INTEGRATION
SELON LEBESGUE ET SELON RIESZ

93

R
quant `a lintegrale vectorielle X u(x,
R ) d(x), on peut toujours se la representer
comme la fonction qui `a y associe X u(x, y) d(x). Avec de tels reflexes, le lecteur ne devrait pas rencontrer de difficultes dans linterpretation des resultats de
lintegration `a valeurs vectorielles.
Sans developper la theorie compl`ete, nous montrerons au chapitre VII comment
definir une theorie simple et satisfaisante dintegration `a valeurs vectorielles qui
couvre la plupart des espaces habituels. Pour cela, nous attendrons detre un peu
plus aguerris dans le domaine de lanalyse fonctionnelle.

CHAPITRE III

Th
eor`
emes fondamentaux dint
egration
Passons maintenant `a letude des proprietes fondamentales de lintegrale, telle
que nous lavons definie au chapitre precedent. Par fondamentales il faut juste
comprendre les proprietes qui servent constamment.
Nous etudierons dans un cadre tr`es general les outils-cles de la theorie de la
mesure : (i) des theor`emes de passage `a la limite sous lintegrale, (ii) des theor`emes
de changement de variable vus sous langle des mesures, (iii) des theor`emes sur
lintegrale produit, et (iv) quelques inegalites elementaires portant sur des expressions integrales. Ce materiel est developpe dans les sections III-1 `a III-4, qui est probablement la partie la plus importante du cours. Les sections III-5 et III-6 traitent
de sujets plus avances : lequi-integrabilite, la tension et la construction de mesures
produits avec un nombre infini de facteurs ; elles pourront etre omises en premi`ere
lecture, et consultees en cas de besoin.
Dans tout ce chapitre nous travaillerons avec des mesures fixees une fois pour
toutes : typiquement, un theor`eme fera intervenir une mesure fixee. Au contraire,
dans le Chapitre VI, nous developperons un autre point de vue en considerant des
espaces de mesures.
Pour illustrer certains theor`emes ou enoncer certains contre-exemples, nous admettrons lexistence de la mesure de Lebesgue sur R, qui sera etudiee plus en detail au
Chapitre IV ; pour linstant, il suffira de savoir que la mesure de Lebesgue dun intervalle de R est simplement sa longueur, et que lintegrale associee prolonge lintegrale
de Riemann des fonctions continues par morceaux.
III-1. Comportement face aux limites
Soit (fn )nN une suite de fonctions mesurables, definies sur un espace mesure
(X, ), `a valeurs reelles. Nous allons considerer quatre probl`emes differents :
On suppose dabord que la suite converge en un sens tr`es fort : de mani`ere
monotone, par exemple en croissant. Peut-on passer `a la limite sous le signe de
sommation ? Le Th
eor`
eme de convergence monotone de Beppo Levi assure
que cest toujours possible.
On suppose maintenant que la suite converge, sans que la convergence soit
monotone ; onR sait alors que sa limite est mesurable. Peut-on passer `a la limite
sous le signe ? Dans de nombreuses situations, le Th
eor`
eme de convergence
domin
ee de Lebesgue permet de le faire.
Enfin, on consid`ere le cas o`
u la suite (fn ) ne converge pas necessairement ; on
sait alors que sa lim inf et sa lim sup sont mesurables. Peut-on relier les integrales
de ces fonctions `a lintegrale des fn ? Cest `a ce probl`eme que repond le Lemme de
Fatou.
Quand on sinteresse aux fonctions continues, une hypoth`ese tr`es forte que lon
etudie souvent est la convergence uniforme, qui permet en particulier de passer

96

CHAPITRE III

(13 juin 2010)

`a la limite dans lintegrale de Riemann. Nous naurons pas de theor`eme de limite


dintegrale sous hypoth`ese de convergence uniforme, car toutes ces situations seraient
en pratique couvertes par le theor`eme de convergence dominee, qui suppose seulement la convergence simple. On peut se demander `a quel point la notion de convergence uniforme est plus forte que la notion de convergence simple. Le Th
eor`
eme
dEgorov implique que, du point de vue de la mesure, la difference nest pas si
grande.
III-1.1. Convergence monotone. De meme que toutes les proprietes cruciales des mesures decoulent de la propriete de -additivite, toutes les proprietes
importantes de passage `a la limite dans lintegrale decoulent du theor`eme suivant,
appele theor`eme de convergence monotone de Beppo Levi, ou tout simplement
theor`eme de convergence monotone. On rappelle quune suite (fn ) de fonctions `a
valeurs dans R est dite croissante si, pour tout x, la suite (fn (x)) est croissante.
or`
The
eme III-1 (theor`eme de convergence monotone de Beppo Levi). (i) Soit
(fn )nN une suite croissante de fonctions mesurables sur un espace mesure (X, ),
`a valeurs dans [0, +]. Alors
Z
Z
fn d.
(11)
lim fn d = lim
X n

En particulier, la fonction (lim fn ), definie


R sur X et `a valeurs dans [0, +], est
sommable si et seulement si la limite des fn est finie.
(ii) La meme conclusion est vraie si (fn ) est une suite croissante (resp. decroissante)
de fonctions mesurables `a valeurs dans R, pourvu que lune des fonctions fn soit minoree (resp. majoree) par une fonction sommable.
Le corollaire qui suit sobtient en remarquant que les sommes partielles dune
serie `a termes positifs forment une famille croissante.
Corollaire III-2 (interversion de serie et sommation pour des fonctions positives). Soit (fn ) une famille de fonctions mesurables, definies sur un espace mesure
(X, ), `a valeurs dans [0, +]. Alors
Z X !
XZ
fn d.
(12)
fn d =
nN

nN

Exemple III-3. Soient (m )mN une suite croissante de mesures. On se donne


des parties disjointes (Aj )jN , et on note A = Aj . Pour tout m on a
X
m [Aj ],
m [A] =
jN

et donc

lim m [A] =

X
jN

( lim m [Aj ]).


m

Il sensuit que une limite croissante de mesures est une mesure.


Remarques III-4.
(i) Soit (An )nN une famille croissante densembles mesurables, A = An , et soit fn = 1An ; il est facile de verifier que la fonction
indicatrice 1A est la limite croissante des fn , et la formule (11) devient donc
[Ak ] = lim [An ].
n

THEOR
EMES
FONDAMENTAUX DINTEGRATION

97

Si en revanche les An sont supposes disjoints, on verifie sans peine que 1A est
la somme de la serie des fn , et la formule (12) se transforme en
X
[An ] =
[An ].
n

On retrouve donc les deux formulations habituelles de la -additivite de .


En conclusion, le theor`eme de convergence monotone nest autre que la relation de -additivit
e exprim
ee en termes de fonctions plut
ot que
densembles mesurables.
(ii) Il est clair que les enonces precedents sont egalement valables si les conditions
de croissance ou de decroissance ne sont verifiees que presque partout.
D
emonstration du Th
eor`
eme III-1. Il est facile de voir que lenonce (ii) est
une consequence de lenonce (i) : si (fn ) est une suite croissante de fonctions, avec
fk0 g sommable pour un certain k0 , alors la famille (fk0 g) verifie les hypoth`eses
de (i), et comme g est sommable on a
Z
Z
Z
Z
Z
Z
lim fn =
lim (fn g) + g = lim (fn g) + g = lim
fn .
n

On traite lautre cas en changeant fn en fn . Il nous suffit donc detablir (i).R


R Soit f := lim
R fn ; dapr`es nos hypoth`eses on a fn f , et il sensuit donc fn
f . La suite ( fn ) etant croissante, elle converge dans R, et on a
Z
Z
lim fn f.

Il nous reste `a etablir linegalite inverse, qui est le coeur du probl`eme. Nous allons pour cela reprendre largument dej`a utilise dans la preuve de ladditivite de
lintegrale.
Soit une fonction simple qui minore f , et soit ]0, 1[, on pose
An := {x X; fn (x) (1 )(x)}.

Par croissance de fn , les parties An forment une famille croissante ; en traitant `a


part les x tels que (x) = 0, P
on verifie sans peine la reunion des An est lespace X
tout entier. Si lon ecrit = 1jJ j 1Bj ,
Z X
Z
Z
J
J
J
X
X
1An =
j [An Bj ]
j [X Bj ] = .
j 1An Bj =
j=1

j=1

j=1

Dautre part, par positivite de lintegrale,


Z
Z
Z
fn fn 1An (1 ) 1An .

En passant `a la limite dans les deux membres, on trouve


Z
Z
lim
fn (1 ) .
n

En prenant le supremum sur toutes les fonctions simples minorant f , et en faisant


tendre vers 0, on aboutit bien `a
Z
Z
lim
fn f.
n

98

CHAPITRE III

(13 juin 2010)

Exercice III-5. Retrouver ladditivite de lintegrale en combinant le theor`eme


de convergence monotone et la Proposition II-29.
Voici maintenant une consequence simple et importante du theor`eme de convergence monotone.
Proposition III-6 (lintegrale restreinte definit une mesure). Soit f une fonction mesurable definie sur un espace mesure (X, ), `a valeurs dans [0, +]. Alors
lapplication
Z
Z
(13)
f : A 7 f [A] :=
f d =
f 1A d
A

definit une mesure sur la -alg`ebre des parties mesurables. En outre, elle verifie
[A] = 0 = f [A] = 0.

D
emonstration. Soit (Ak )kN une famille de parties disjointes,
et A leur union.
P
Comme on la dej`a mentionne, on verifie sans peine que 1A = 1Ak , et il en decoule
que
X
f 1A =
(f 1Ak ).
Le Corollaire III-2 implique donc
Z
XZ
(f 1Ak ) d =
k

soit

XZ
k

Ak

f 1Ak

f d =

d =

(f 1A ) d,

f d.

Ak

Cette propriete de -additivite implique que f est bien une mesure.

La derni`ere propriete du Corollaire III-6 est importante et merite un nom :


efinition III-7 (absolue continuite). Soient et deux mesures definies sur
D
une -alg`ebre commune. On dit que est absolument continue par rapport `a , et
on note parfois , si pour tout A mesurable,
[A] = 0 = [A] = 0.

Nous verrons au Chapitre ?? que, sous certaines conditions, les mesures absolument continues par rapport `a une mesure sont exactement les mesures f . Notons
une derni`ere propriete importante de ces mesures :
Proposition III-8 (changement de densite de reference). Sur (X, ) un espace
mesure,
(i) Soient f et g deux fonctions mesurables `a valeurs dans [0, +]. Alors
Z
Z
f g d = f d(g);
(ii) Soient h et g deux fonctions mesurables `a valeurs dans [0, +], telles que
g(x) {0, +} = h(x) = 0.

Alors, avec les conventions 1/0 = +, 0 + = 0/0 = +/ + = 0, on a


Z
Z
h
h d =
d(g).
g

THEOR
EMES
FONDAMENTAUX DINTEGRATION

99

D
emonstration. (i) Soit (fn ) une suite
en
R de fonctions simples
R convergeant
R
croissant
R vers f . Par convergence monotone, fn g d converge vers f g d et fn d(g)
vers f d(g). Il suffit donc de prouver le resultat quand f est une fonction simple,
et par linearite il suffit de le prouver quand f est de la forme 1A . On reconnat alors
la definition de la mesure g.
(ii) Sous les hypoth`eses que nous avons faites sur les valeurs de g et h, on a
legalite
 
h
h=
g,
g
ce qui permet dappliquer (i) avec f = h/g.

III-1.2. Lemme de Fatou.
Th
eor`
eme III-9 (lemme de Fatou). (i) Soient (fn ) une suite de fonctions
definies sur un espace mesure (X, ), `a valeurs dans [0, +]. Alors
Z
Z
(lim inf fn ) d lim inf fn d.
n

(ii) Cette conclusion est toujours valable si les fn sont toutes minorees par une
fonction sommable.

D
emonstration. L`a encore, lenonce (ii) est une consequence immediate de
lenonce (i), que nous allons demontrer. Soit gn := inf kn fk . On verifie facilement
que gn est mesurable, et definit une suite croissante qui converge partout vers f :=
lim inf fk . Bien s
ur, gn fn . En appliquant le theor`eme de convergence monotone
et en passant `a la lim inf, on trouve
Z
Z
Z
f = lim
gn lim inf fn .
n

Remarque III-10. Il est tr`es facile de construire des exemples o`


u
Z
Z
lim inf fn < lim inf fn ,

m
eme si la convergence a lieu presque partout. Voici trois situations typiques,
sur lespace R muni de la mesure de Lebesgue. Soit une fonction continue, positive,
nulle en-dehors de lintervalle [0, 1], non identiquement nulle. Pour n 1 on definit

fn (x) = n(nx);
gn (x) = n1 (n1 x);

h (x) = (x n).
n

Alors les suites de fonctions (fn ), (gn ) et (hn ) convergent vers 0 partout sur R,
pourtant
R
R il estR facile de montrer, par des changements de variables evidents, que
fn = gn = hn = 1. On dit que la suite (fn ) illustre un phenom`ene de concentration (toute la masse de la suite se concentre pr`es de 0), la suite (gn ) un phenom`ene
d
evanescence (toute la masse part `a linfini de mani`ere diffuse), tandis que la suite
(hn ) presente un comportement de bosse glissante (la masse glisse `a linfini, sans
setaler).

100

CHAPITRE III

(13 juin 2010)

f3

f2

f1

g2

g4

h1

h0

h3

h2

Fig. 1. concentration des fn , evanescence des gn , bosse glissante hn

III-1.3. Convergence domin


ee.
Th
eor`
eme III-11 (theor`eme de convergence dominee de Lebesgue). Soit (fn )nN
une famille de fonctions definies sur un espace mesure (X, ), `a valeurs dans R. On
suppose que (fn ) est dominee, i.e.
(i) Il existe g sommable tel que |fn | g -presque partout pour tout n ;
alors
Z
Z
Z
Z
fn d
lim sup fn d.
(14)
lim inf fn d lim inf
fn d lim sup
X

En particulier, si (fn ) est dominee et verifie


(ii) fn converge presque partout vers f ,
alors f est integrable et on a
Z
Z
Z
(15)
lim
|fn f | d = 0;
et
(lim fn ) d = lim
fn d.
n

En outre, on peut remplacer dans cet enonce lhypoth`ese de domination par la


condition plus faible
R (i) Pour tout
R n il existe gn sommable tel que |fn | gn -presque partout, et
(lim gn ) = lim gn < +.
En introduisant les sommes partielles de series de fonctions, on deduit facilement
de ce theor`eme le corollaire suivant :

THEOR
EMES
FONDAMENTAUX DINTEGRATION

101

Corollaire III-12 (interversion de serie et sommation sous hypoth`ese de domination). Soit (fn )nN une famille de fonctions mesurables definies sur un espace
mesure (X, ), `a valeurs dans R. Si
!
Z X
|fn | d < +,
nN

R
alors chaque fn est sommable, la serie de terme general fn d converge, et
Z X !
XZ
fn d.
fn d =
nN

nN

Remarques III-13.
(i) La fonction (lim fn ) nest definie quen dehors dun
ensemble de mesure nulle ; pour que lenonce precedent ait un sens, il convient
donc de letendre en une fonction mesurable sur X tout entier, grace au
Theor`eme II-14(iii).
(ii) La condition (ii) est appelee condition de domination : toutes les fn sont
dominees par une fonction integrable g. Elle est equivalente `a lhypoth`ese
Z
sup |fn | d < +.
nN

Bien s
ur, cette condition netait pas satisfaite par les exemples presentes dans
la Remarque III-10.
(iii) Lhypoth`ese de domination de la suite (fn ) peut etre affaiblie comme suit :
de toute suite extraite de (fn ) on peut extraire une sous-suite dominee. En
effet, si une suite (xn ) de nombres reels est telle que toute suite extraite admet
une sous-suite convergeant vers
R R, alors la suite (xn ) tout enti`ere converge
vers (en loccurrence, = f ).

Exemple III-14. Sachant que lintegrale de Lebesgue generalise lintegrale de


Riemann, on deduit facilement du Theor`eme III-11 lenonce suivant : soit (fn ) une
suite de fonctions continues par morceaux sur [a, b] R,
R bornee uniform
R ement, et
convergeant simplement vers une fonction f . Alors lim fn (x) dx = f (x) dx. En
effet, lhypoth`ese de borne uniforme revient `a une hypoth`ese de domination par une
fonction constante, qui est clairement integrable sur un intervalle borne.
or`
D
emonstration du The
eme III-11. Nous allons partir de lhypoth`ese (i) ;
on note g = lim gn . Chaque fn est bien s
ur integrable puisque
R sa valeur absoR
lue est majoree par une fonction integrableR; en outre
lim
inf
fn et lim sup fn
R
sont majorees en valeur absolue par lim sup gn = g < +. Enfin lim inf fn et
lim sup fn sont majorees en valeur absolue par g ; ce sont donc egalement des fonctions integrables.
Lenonce que nous voulons demontrer est une consequence simple du Lemme de
Fatou. En effet, la fonction gn + fn est positive, donc
Z
Z
lim inf(gn + fn ) lim inf (gn + fn ).

102

CHAPITRE III

(13 juin 2010)

En combinant cela avec lhypoth`ese (i), on obtient


Z
Z
Z
Z
g + (lim inf fn ) = (g + lim inf fn ) = lim inf(gn + fn )
Z
Z
Z
lim inf (gn + fn ) = g + lim inf fn .
On conclut que

(lim inf fn ) lim inf

fn .

En changeant fn en fn , on obtient de meme


Z
Z
lim sup fn (lim sup fn ).

Les inegalites (14) sont donc bien satisfaites.


R Supposons maintenant que fn converge presque partout vers f , et montrons que
|fnR f | 0 ; puisque f Rest integrable, il en resultera par inegalite triangulaire
que fn converge bien vers f . On applique lenonce precedent en remplacant fn
et gn par fen = |fn f | et e
gn = gn + |f |. Lhypoth`ese (i) est bien verifiee, et on a
donc
Z
Z
0 lim sup |fn f | lim sup |fn f | = 0,
do`
u la conclusion.

Exercice III-15. Retrouver en cas particulier de ce theor`eme le crit`ere connu :


une serie (xn ) absolument convergente de nombres reels est commutativement convergente, i.e. (x(n) ) converge pour toute bijection : N N, et la valeur de la somme
ne depend pas de .
En guise dapplication du theor`eme de convergence dominee, voici un theor`eme
simple de continuite des integrales `a param`etre.
Th
eor`
eme III-16 (continuite des integrales `a param`etre). Soient (X, A, ) un
espace mesure, et Z un espace metrique. On se donne f : X Z [, +] une
fonction telle que
(i) Pour tout z Z, x 7 f (x, z) est mesurable ;
(ii) Pour tout x X, z 7 f (x, z) est continue ;
(iii) Pour tout (x,
u g est une fonction
R z) X Z on a |f (x, z)| g(x), o`
mesurable telle que g(x) d(x) < +.
R
Alors lapplication (z) = f (x, z) d(x) est bien definie et continue sur Z.
emonstration.
Lhypoth`ese (iii) implique la sommabilite de |f (, z)| pour
D
R
tout z ; lintegrale f (x, z) d(x) est donc bien definie. Soit zn une suite convergeant
vers z ; le probl`eme est de montrer que (zn ) (z). Posons fn (x) = f (x, zn ), et
f (x) = f (x, z). Par (ii), on a convergence (partout) de f vers fn ; et par (iii) la
famille (fn ) est dominee par g. La conclusion sensuit du theor`eme de convergence
dominee, applique `a la famille (fn ).


Remarque III-17. La question de la mesurabilite et de lintegrabilite des integrales


`a param`etre sera abordee plus loin dans ce chapitre ; voir le Theor`eme III-50.
Voici un corollaire pratique du Theor`eme III-16 :

THEOR
EMES
FONDAMENTAUX DINTEGRATION

103

Corollaire III-18 (Derivation des integrales `a param`etre). Soient (X, A, )


un espace mesure, I un intervalle de R, et f : X I R. On suppose que
R
(i) Pour tout t I, x 7 f (x, t) est mesurable et |f (x, t)| d(x) < + ;
(ii) Pour tout x X, t 7 f (x, t) est contin
ument differentiable ;
(iii) Pour tout (x, t) X I,


f

(x, t) g(x),
t

R
o`
u g est une fonction mesurable telle que g(x) d(x) < +.
R
Alors F : t 7 f (x, t) d(x) est derivable sur I, et pour tout t I on a
Z
f

(x, t) d(x).
F (t) =
X t
D
emonstration. Soit t I fixe, et > 0 tel que [t , t + ] I. Pour x X
et s [, ] on definit

f (x, t s) f (x)

si 0 < |s| <

s
h(x, s) =

f (x, t) si s = 0.
t
La fonction h(x, s) est alors mesurable en x, continue en s, et majoree uniformement
par g(x)
R en vertu du theor`
R eme des accroissements finis. Dapr`es le Theor`eme III-16,
lims0 h(x, s) d(x) = h(x, 0) d(x), ce qui est equivalent au resultat recherche.


Exercice III-19. Enoncer


et prouver une variante du Corollaire III-18 qui sapplique `a des fonctions convexes plutot que lipschitziennes, et qui soit basee sur le
Theor`eme de Convergence Monotone plutot que sur le Theor`eme de Convergence
Dominee.

III-1.4. Que penser de lhypoth`


ese de domination ? Dans le theor`eme de
convergence dominee, la condition de domination peut sembler un peu forte, mais
les Exemples III-10 montrent que lon ne peut leliminer purement et simplement de
lenonce du Theor`eme III-11. On peut se demander toutefois si on peut la remplacer
par une hypoth`ese moins contraignante. En particulier, existe-t-il des situations o`
u la
convergence des integrales est vraie sans quil y ait domination ? Voici deux exemples
faisant intervenir la mesure de Lebesgue sur R :
Exemples III-20 (la convergence peut avoir lieu sans domination).
(i) Soit (an )
une famille de nombres positifs, tendant vers 0, dont la somme diverge, et soit,
sur R, la fonction fn = an 1[n,n+1[. Alors fn converge vers 0, et lintegrale de
fn egalement ; cependant la fonction sup fn est la fonction constante par morceaux valant an sur lintervalle [n, n + 1[, qui nest pas integrable. La suite (fn )
nest donc pas dominee.
En revanche, on peut extraire de (fn ) une sous-suite qui verifie lhypoth`ese
de domination. Et meme, de toute sous-suite de (fn ) on peut extraire une
sous-suite qui soit dominee.

104

CHAPITRE III

(13 juin 2010)

(ii) Soit fn definie sur R par :

n
si

x < 0;

fn (x) = +n si 0 < x 1 ;

0 sinon.

Alors chaque fn est sommable, dintegrale nulle, et fn converge simplement


vers la fonction nulle, mais la suite (fn ) nest pas dominee, ni aucune de ses
sous-suites extraites. En effet, si une sous-suite extraite, toujours denotee (fn ),
etait dominee, alors il en serait de meme de (fn 1x0 ), et lintegrale de fn sur
R+ convergerait vers 0 ; or elle est toujours egale `a 1.

f7

f4

Fig. 2. compensation entre grandes valeurs positives et negatives

Dans le deuxi`eme exemple, on peut attribuer le phenom`ene de non-domination au


fait que de grandes valeurs positives et de grandes valeurs negatives se compensent.
La theorie de Lebesgue est impuissante `a exploiter de tels phenom`enes. En revanche,
d`es que lon exclut cette possibilite, par exemple en minorant f par une fonction
integrable, la domination devient la r`egle, pourvu que lon autorise lextraction de
sous-suites comme dans le premier exemple ci-dessus.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

105

or`
The
eme III-21 (en labsence de fortes compensations, la domination est
necessaire). Soit (fn ) une famille de fonctions mesurables, definies sur un espace
mesure (X, ), `a valeurs dans R, convergeant presque partout vers une fonction
sommable.
(i) On suppose queR la famille
R (fn ) est uniformement minoree par une fonction
integrable, et que lim( fn ) = (lim fn ). Alors, il existe une sous-suite extraite de
(fn ), notee (fn ), et une fonction g integrable, telle que |fn | g presque partout.
(ii) Si
Z
Z
lim

|fn | =

| lim fn |,
n

alors il existe une sous-suite extraite de (fn ) qui verifie lhypoth`ese de domination.

Il est clair que lenonce (ii) est une consequence de (i). Nous demontrerons ce
theor`eme dans le paragraphe suivant, comme consequence du Theor`eme dEgorov.
Remarque III-22. Lenonce (ii) du Theor`eme III-21 peut se demontrer, dans le
cas particulier o`
u les fn tendent vers 0, comme une consequence de la completude
1
de lespace L , dont nous reparlerons au Chapitre VI.
En combinant les Theor`emes III-11 et III-21, on obtient facilement le corollaire
suivant.
Corollaire III-23 (en labsence de fortes compensations, lechange limite
somme est presque equivalent `a la domination). Soient un espace mesure, et
(fn )nN une famille de fonctions mesurables, definies de X dans R, uniformement
minoree par une fonction sommable. On suppose que fn converge presque partout
vers une fonction sommable. Alors les deux enonces
Z
Z
lim fn d = (lim fn ) d

et

De toute suite extraite (fn ) on peut extraire une sous-suite dominee


sont equivalents.
III-1.5. Th
eor`
eme dEgorov. Comment faire le lien entre la notion naturelle
de convergence dans la theorie de Lebesgue, cest-`a-dire la convergence presque partout, et la notion naturelle de convergence des fonctions continues, cest-`a-dire la
convergence uniforme ? Par definition, la convergence uniforme implique la convergence simple, en particulier presque partout. Du point de vue des fonctions continues,
la difference entre les deux notions est considerable : par exemple, une limite simple
de fonctions continues nest en general pas continue. Cependant, du point de vue de
la theorie de la mesure, la difference nest pas si grande, au sens de lenonce suivant.
Th
eor`
eme III-24 (Theor`eme dEgorov). Soit (X, ) un espace mesure, [X] <
+, et soit (fn )nN une famille de fonctions mesurables, definies sur X, `a valeurs
dans R. On suppose que (fn ) converge presque partout dans R. Alors, (fn ) converge
uniformement en-dehors dun ensemble de mesure arbitrairement petite. En dautres
termes, pour tout > 0 il existe un ensemble mesurable A X tel que [A ] < ,
et (fn ) converge uniformement vers sa limite sur X \ A .

106

CHAPITRE III

(13 juin 2010)

Exemple III-25. Un exemple traditionnel de suite qui converge simplement mais


non uniformement est la famille des fonctions fn : x 7 xn sur [0, 1]. Cette suite
converge simplement vers la fonction valant 1 en 1, et 0 ailleurs ; pour tout n on
a sup[0,1] |fn f | = 1, la convergence nest donc pas uniforme. Cependant, elle est
uniforme sur tout intervalle [0, 1 ], > 0.
Remarque III-26. Puisque la convergence uniforme laisse stable la classe des
fonctions continues, le theor`eme dEgorov admet le corollaire suivant :
Corollaire III-27 (une limite de fonctions continues est presque continue).
Soit X un espace topologique, muni de sa tribu borelienne, et soit une mesure
de Borel finie sur X. Soit (fn )nN une suite de fonctions continues `a valeurs dans
R, convergeant simplement vers une fonction f : X R. Alors f est continue
en-dehors dun ensemble de mesure arbitrairement petite.
On retrouve ainsi un enonce tr`es proche du theor`eme de Lusin II-60. Cet enonce
nimplique pas le theor`eme de Lusin, car il ne sapplique quaux limites de fonctions
continues, et pas `a des fonctions mesurables arbitraires ; en revanche il est valable
sans hypoth`ese topologique sur X.
Remarque III-28. Il est impossible de supprimer lhypoth`ese de finitude de
dans le Theor`eme III-24 ; pour sen convaincre, on peut considerer le cas o`
u est la
mesure de comptage sur N, et la suite de fonctions fn est definie par fn (k) = 1kn .
Preuve du Th
eor`
eme dEgorov. Quitte `a poser fn (x) = 0 sur le complementaire
de lensemble o`
u (fn ) ne converge pas, on peut supposer que (fn ) converge partout
vers une fonction mesurable f `a valeurs dans R. Soit, pour tout k N, n N,
lensemble mesurable
o
\n
x X; |fj (x) fi (x)| 1/k .
Sn,k :=
i,jn

Pour tout k, la famille (Sn,k ) est croissante en n, et par hypoth`ese,


[
k,
Sn,k = X.
n

Pour tout k, on peut donc trouver n = nk tel que

[X \ Snk ,k ] < 2k .
Posons
S := k1 Snk ,k .

Si x S, alors x Snk ,k pour tout k, ce qui veut dire que pour tout k il existe nk ,
d
ependant seulement de k et pas de x, tel que pour tous i, j nk , |fj (x)
fi (x)| 1/k. En faisant tendre i vers linfini dans cet enonce, on voit que pour tout
k il existe nk tel que pour tous i, j nk , |fj (x) f (x)| 1/k. En dautres termes,
(fn ) converge uniformement sur S. Dautre part,
[X \ S]

X
k=1

[X \ Snk ,k ] < .

Lensemble A = X \ S verifie donc la conclusion du theor`eme.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

107

Pour illustrer lefficacite du theor`eme dEgorov, montrons comment on peut en


deduire le theor`eme de convergence dominee de Lebesgue, et comment on peut lutiliser pour demontrer le Theor`eme III-21. En fait on aurait pu presenter toute cette section en prenant comme point de depart le theor`eme dEgorov plutot que le theor`eme
de convergence monotone.
ore
`me III-11. Soit (fn ) une suite de foncNouvelle d
emonstration du The
tions convergeant presque partout, dominee par la fonction integrable g. Soit Z lensemble negligeable o`
u g vaut +, on redefinit fn (x) = 0 et f (x) = 0 pour tout x Z,
sans changer les valeurs des integrales des fn ou de f , ni lhypoth`ese de convergence
presque partout. Dautre part, de la domination il sensuit que fn (x) = 0 d`es que
g(x) = 0. On peut donc appliquer la Proposition III-8 :
Z
Z
Z
Z
fn d = hn d,
f d = h d,
fn
f
,
h= ,
= g.
g
g
Lensemble des points o`
u g sannule est de mesure nulle pour ; en-dehors de cet
ensemble, hn converge vers h := f /g. Par ailleurs, est une mesure finie. On peut
donc appliquer le theor`eme dEgorov `a la famille (hn ) et `a la mesure , et on trouve
que pour tout > 0 il existe A tel que [A ] < , et hn converge uniformement vers
h sur X \ A . Par hypoth`ese de domination, hn est borne par 1, donc h egalement.
Do`
u


Z
Z







h d .
hn d ,


hn =

X\A

X\A

On conclut que

Z
Z
Z


hn d h d

X\A



(hn h) d + 2.

Pour tout fixe, grace `a la convergence uniforme on a


!

Z



sup |hn h| [X] 0.
(hn h) d

Il sensuit que

xX\A

X\A

Z

Z



lim sup hn d h d 2.
n

On conclut en faisant tendre vers 0.

D
emonstration du Th
eor`
eme III-21. Comme nous lavions dit, il suffit de
demontrer la partie (i) de ce theor`eme ; on se donne donc une famille (fn )nN de
fonctions
positives,
convergeant presque partout vers une limite f , integrable, telle
R
R
que fn f .
Soit A un ensemble mesurable arbitraire. En appliquant le Lemme de Fatou et
linegalite lim inf an + lim inf bn lim inf(an + bn ), laissee en exercice, on a
Z
Z
Z
Z
Z
Z
Z
f=
f+
f lim inf
fn + lim inf
fn lim inf
fn =
f.
X

X\A

X\A

108

CHAPITRE III

(13 juin 2010)

Les deux membres etant egaux, il y a egalite `a chaque etape, do`


u
Z
Z
(16)
f d = lim inf
fn d.
n

Soit := f ; comme f est sommable, la mesure est finie. Pour tout k N, on


pose
Bk := {x; f (x) 1/k}.
Les Bk forment une famille decroissante, dont lintersection est lensemble o`
u f sannule, de mesure nulle pour . Pour > 0 arbitrairement petit, on peut donc choisir
k assez grand pour que [Bk ] . Par le Theor`eme dEgorov, on sait egalement
quil existe E tel que [E] < et fn converge uniformement vers f en-dehors de E.
Si lon pose C = Bk E, on a construit un ensemble de -mesure plus petite que
2, tel que pour tout x X \ C on ait f (x) > 1/k et fn converge uniformement vers
f sur X \ C. En particulier, pour tout n m assez grand, on aura
x X \ C = fn (x) 2f (x).
R
Dapr`es (16), applique `a A = C, on sait que lim inf A fn 2. En particulier,
on peut trouver N m tel que
Z
fN 4.
C

Recapitulons : pour tout > 0, pourRtout p N, nous pouvons construire un


ensemble C et un entier N p tels que C fN 4, et fN 2f en-dehors de C.
On rep`ete cette construction avec = 2k : nk etant donne, on construit C = Ck et
N = nk+1 nk tels que
Z
fnk 4 2k ;
x X \ Ck fnk (x) 2f (x).
Ck

On definit alors

g := 2f +

fnk 1Ck .

kN

Par construction, g majore tous les fnk ; dautre part, g est sommable car f elle-meme
est sommable, et
Z X
X
XZ
fnk 4
2k < +.
fnk 1Ck =
kN

kN

Ck

kN

III-1.6. Formule de sommation par tranches. Nous allons maintenant presenter


une application importante des theor`emes vus precedemment. Soit la mesure de
Lebesgue sur R, telle que nous lavons construire dans la section I-6. Si f est mesurable, on notera {f > t} = {x; f (x) > t}.
Th
eor`
eme III-29 (Formule de sommation par tranches). Soient (X, ) un espace mesure, et f une fonction mesurable positive ; alors
Z
Z
[{f > t}] d(t)
f (x) d(x) =
X
R+

X 1 
k
= lim
.
x; f (x) n
n
n
2
2
kN

THEOR
EMES
FONDAMENTAUX DINTEGRATION

109

Remarque III-30. Cet enonce justifie en quelque sorte le dessin de la figure 1


presente dans lintroduction.
D
emonstration du Th
eor`
eme III-29. Dans le cas o`
u f = 1A , A etant un
ensemble mesurable quelconque, les trois quantites ci-dessus valent [A] et sont donc
egales.
Considerons ensuite le cas o`
u f est une fonction simple, prenant donc un nombre
fini de valeurs non nulles, toutes de la forme k/2n0 .P
Pour n fixe, on pose Ak,n =
{f k/2n }. D`es que n n0 , on peut ecrire f =
2n 1Ak,n , et pour tout t
[(k 1)2n , k2n [ on a {f > t} = [Ak,n ]. Alors il est facile de se convaincre que les
trois quantites apparaissant dans lenonce du Theor`eme III-29 sont encore egales.
Soit enfin f une fonction mesurable positive. Par le Theor`eme II-29, on peut
construire une suite (fn ) de fonctions simples telles que 0 fn f , fn converge en
croissant vers f , et fn prend ses valeurs dans N/2n . Dapr`es le resultat precedent,
on sait que
Z
Z
fn d =
[{fn > t}] d(t).
X
R
R
R
Par le Theor`eme de Convergence Monotone, fn d converge vers f d. Dautre
part, il est equivalent de dire que f (x) > t ou que fn (x) > t pour n assez grand ; en
particulier, {f > t} est lunion croissante des {fn > t}. Par -additivite,
[{f > t}] = lim [{fn > t}].
n

On peut alors appliquer le Theor`eme de Convergence Monotone une seconde fois, `a


la suite de fonctions (dans la variable t !) [{fn > t}], pour decouvrir que
Z
Z
[{fn > t}] d(t)
[{f > t}] d(t).
n

On conclut que

f d =
X

[{f > t}] d(t).

Enfin, posons (t) = [{f > t}], et soit n (t) la fonction (constante par morceaux) egale `a (k2n ) sur chaque intervalle ](k 1)2n , k2n ] (on pose n (0) =
(0)). La fonction etant decroissante, on a 0 n , et on verifie facilement
que n converge en croissant vers . On peut donc encore appliquer le Theor`eme de
Convergence Monotone pour obtenir
Z
Z
(t) d(t) = lim
n (t) d(t),
R

ce qui revient `a
Z


X 1 
k
[{f > t}] d(t) = lim
.
x; f (x) n
n
2n
2
R
kN


La formule de sommation par tranches admet une generalisation importante :

110

CHAPITRE III

(13 juin 2010)

or`
The
eme III-31 (Sommation par tranches, encore). Soient (X, ) un espace
mesure, f une fonction mesurable positive, et une mesure de Borel sur R+ . Pour
tout r 0, on definit (r) = [ [0, r[ ]. Alors,
Z
Z
(f (x)) d(x) =
[{f > t}] d(t)
X
R


X 

k
n
n
](k 1)2 , k2 ] x; f (x) n
= lim
n
2
kN
Remarque III-32. On retrouve le Theor`eme III-29 via le cas particulier = .

Exemple III-33. Soit une fonction positive continue par morceaux sur R+ , et
sa primitive (avec (0) = 0). Alors
Z
Z
(f (x)) d(x) =
[{f > t}] (t) d(t).
X

Par exemple,
(17)

|f | d =

[{f > t}] ptp1 dt.

NousRdemontrerons le Th
Reor`eme III-31 plus tard. Il est clair quil suffit detablir
legalite X (f (x)) d(x) = R [{f > t}] d(t) ; la suite de la conclusion en decoule
facilement. On donnera dabord une demonstration dans le cas particulier o`
u X est
-fini, comme consequence du Theor`eme de Fubini ; il sagit de la demonstration la
plus simple. Le cas general sera ensuite traite comme consequence dun theor`eme de
changement de variables.
III-2. Int
egration sur les espaces produits
La theorie abstraite de lintegrale de Lebesgue permet daborder efficacement les
integrales multiples, pourvu que lon prenne garde `a quelques subtilites.
III-2.1. Rappels et compl
ements sur la tribu produit.
D
efinition III-34 (tribu produit). Soient (X, A) et (Y, B) deux espaces mesures. On appelle tribu produit de A et B, et on note A B, la -alg`ebre engendree
par les paves AB, o`
u A et B sont des parties mesurables de X et Y respectivement.
Proposition III-35 (generation de la tribu produit). Soient X et Y deux ensembles. On se donne F une famille de parties de X, et G une famille de parties de Y .
On suppose que X est union denombrable delements de F , et Y union denombrable
delements de G. Alors la famille F G des paves A B, o`
u A F et B G, gen`ere
la tribu produit (F ) (G). En dautres termes,
(F G) = (F ) (G).

emonstration. Une inclusion est immediate : (F G) est la tribu engendree


D
par la famille des paves de la forme AB, o`
u A F et B G ; alors que (F )(G)
est engendree par la famille des paves de la forme A B, o`
u A (F ) et B (G).
Il sensuit que
(F G) (F ) (G).
Cest linclusion reciproque quil faut etablir. Pour cela, il suffit de montrer que
A (F ),

B (G),

A B (F G).

THEOR
EMES
FONDAMENTAUX DINTEGRATION

111

Pour cela, on remarque tout dabord que pour tous A F , B G, les ensembles
A Y et X B appartiennent `a (F G) : en effet, on peut les ecrire comme
unions denombrables delements de F G. A partir de l`a, la demonstration suit
encore une fois un schema classique, que nous avons dej`a utilise dans la preuve du
Theor`eme I-68. On montre dans un premier temps que A B (F G) pour tout
A (F ), B G ; pour cela on verifie que, B etant fixe dans G, lensemble des A
tels que A B (F G) est une -alg`ebre contenant F . Enfin on montre que
A B (F G) pour tout A (F ), B (G), par un argument similaire. 
Dans un cadre abstrait, la tribu produit peut etre tr`es difficile `a decrire. Mais
dans le cadre des tribus boreliennes, le probl`eme se simplifie grace `a la proposition
suivante.

Proposition III-36 (produits de tribus boreliennes). Soient X et Y deux espaces topologiques, munis de leurs tribus boreliennes respectives B(X) et B(Y ). Si
X et Y sont des espaces metriques separables, alors
B(X Y ) = B(X) B(Y ).

D
emonstration. 1. Appliquons la Proposition III-35 avec F la famille des
ouverts de X, et G la famille des ouverts de Y : on obtient que B(X) B(Y ) est la
tribu engendree par les ouverts de la forme A B o`
u A est un ouvert de X et B un
ouvert de Y . En particulier,
B(X) B(Y ) B(X Y ).

Cette conclusion ne fait pas appel `a lhypoth`ese de separabilite, qui sera utilisee
seulement pour etablir linclusion inverse.
2. Comme X est metrique separable, il contient une base d
enombrable douverts : les boules ouvertes B(xk , 1/n), o`
u (xk ) est une suite dense. Cela veut dire
que tout ouvert U est reunion denombrable de telles boules : comme dans la preuve
du Theor`eme I-32, il suffit decrire
[
U=
B(xk , 1/n).
B(xk ,1/n)O

En effet, si x U, alors il existe une boule B(x, r) incluse dans U, et une sous-suite
extraite de (xk ) qui converge vers x, et en particulier x B(xk , 1/n) O d`es que
d(xk , x) r/4 et 1/n r/2.
Soient maintenant O un ouvert de X Y , et (x, y) O. Par definition de la
topologie produit, il existe un ouvert O = U V inclus dans O et contenant x, o`
u
U est un ouvert de X et V un ouvert de Y . En particulier, (x, y) B(xk , 1/n)
B(y , 1/m) pour k, , m, n bien choisis. La conclusion est que O secrit comme une
union denombrable de B(xk , 1/n)B(y , 1/m) ; en particulier O appartient `a la tribu
produit B(X)B(Y ). Par definition de la tribu borelienne, B(XY ) B(X)B(Y ),
ce qui conclut la preuve.

Exemple III-37. B(Rm+n ) = B(Rm ) B(Rn ).

Remarque III-38. La completion en revanche passe mal au produit tensoriel.


Soient A et B deux tribus sur X et Y respectivement, et A, B leurs tribus completees,
construites `a laide du Theor`eme I-80. Soit dautre part A B la completion de la
tribu produit A B. En general,
AB =
6 (A B).

112

CHAPITRE III

(13 juin 2010)

Nous verrons au Chapitre IV que ces deux tribus sont distinctes meme dans le cas
o`
u A = B est la tribu borelienne sur [0, 1].
III-2.2. Applications partielles. On parle ici dapplication partielle dans le
meme sens que derivee partielle, i.e. quand on consid`ere une fonction de deux
variables comme fonction dune seule de ces variables, lautre etant fixee.
La terminologie suivante nest pas courante, et nous servira seulement `a fixer les
idees.
D
efinition III-39 (tranche). Soit C un ensemble mesurable dans un espace
produit X Y , muni de la tribu produit. On appelle tranche de C le long de Y toute
partie de la forme
Cx := {y Y ; (x, y) C}.
Proposition III-40 (les tranches sont mesurables). Soient (X, A) et (Y, B) deux
espaces mesurables, on munit X Y de la tribu produit A B. Alors, pour toute
partie C mesurable de X Y , et pour tout x X, la tranche Cx est une partie
mesurable de Y .
D
emonstration. Soit x X, on definit
C := {C X Y ; Cx B}.
Il est clair que C est une tribu ; en fait cest la tribu image de A par lapplication
x : y 7 (x, y). Si P = A B est un pave, alors Px vaut soit B (si x A), soit
(si x
/ A), et dans les deux cas cest une partie mesurable de Y . Il sensuit que C
contient tous les paves, et donc toute la tribu produit.

Remarque III-41. La conclusion de la proposition precedente est mise en defaut
par des tribus dusage courant qui sont plus grandes que la tribu produit ne
serait-ce que la tribu des ensembles Lebesgue-mesurables dans R R, comme nous
le verrons au chapitre suivant. Cest la completude qui est en cause.
Le theor`eme simple ci-dessous est le premier pas vers la construction des integrales
multiples : etant donnee une fonction de plusieurs variables, il permettra dintegrer
dabord par rapport `a une variable.
or`
The
eme III-42 (mesurabilite par rapport `a une composante). Soient X et Y
deux espaces mesurables, et f : X Y R une fonction mesurable pour la tribu
produit sur X Y . Alors, pour tout x X, la fonction y 7 f (x, y) est mesurable
de X dans R.
D
emonstration. On sait que
P f est limite dune suite de fonctions simples fn .
Chaque fnP
secrit sous la forme
k 1Ck , lapplication partielle y 7 fn (x, y) nest
autre que
k 1(Ck )x . Par la Proposition III-40, cette application est mesurable sur
Y ; comme elle ne prend quun nombre fini de valeurs elle est simple. En consequence,
f (x, ) = lim fn (x, ) est egalement limite de fonctions simples, donc mesurable. 
III-2.3. D
efinition de la mesure produit. Dans R2 , il est naturel de definir
laire dun rectangle comme le produit des longueurs des cotes. On generalise cette
demarche `a un cadre abstrait.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

113

or`
The
eme III-43 (mesure produit). (i) Soient (X, A, ) et (Y, B, ) deux espaces mesures, -finis. On munit X Y de la tribu produit. Alors il existe une unique
mesure sur X Y telle que
(A, B) A B,

[A B] = [A] [B].

Cette mesure est appelee mesure produit de par et notee .


(ii) En outre, si F (resp. G) est une famille de parties de X (resp. Y ), stable par
intersection finie, telle que A = (F ) (resp. B = (G)), X est union denombrable
croissante delements de F (resp. Y est union denombrable delements de G), alors
la mesure produit sur X Y est caracterisee par la propriete
(A, B) F G,

[A B] = [A] [B].

D
emonstration. Nous allons prouver ce theor`eme par application du Theor`eme
de prolongement I-71. On definit F comme lensemble de tous les paves P = A B,
o`
u A A et B B, et [P ] = [A] [B]. Il est clair que F est stable par
intersection. Dautre part, si (Xk ) (resp. Yk ) est une suite croissante densembles
mesurables dont lunion est X (resp. Y ), alors X Y est reunion croissante des ensembles Xk Yk , qui verifient [Xk Yk ] < +. Lunicite du prolongement eventuel
de est donc assuree par la partie (i) du Theor`eme I-71.
Soient A1 B1 et A2 B2 deux paves ; leur intersection (A1 A2 ) (B1 B2 )
est un pave ; et leur difference est lunion de deux paves disjoints, (A1 \ A2 ) B1 ,
et (A2 \ A1 ) (B1 \ B2 ) (faire un dessin ou se rappeler la figure 1 !). Les hypoth`eses
de la partie (iii) du Theor`eme I-71 sont donc verifiees, et nous avons seulement `a
verifier la -additivite de sur lensemble des paves.
Soit P = AB un pave, et (Pk )kN un recouvrement de P par des paves disjoints
de la forme P
Ak Bk (comme suggere sur la figure III-2.3) ; notre but est de prouver
que [P ] = [Pk ].
P2

P1
P3
P4

P5

etc.

Fig. 3. Recouvrement (infini) de P par des paves Pk

Quitte `a intersecter P et les Pk avec les paves Xn Yn , on peut toujours supposer


que [A] < +, [B] < +. Pour tout k on definit
fk = [Bk ]1Ak .
Clairement, fk est une fonction mesurable positive, et son integrale vaut [Bk ][Ak ] =
[Pk ]. Pour tout x A, la fonction 1(x,y)Pk est clairement mesurable sur B (si

114

CHAPITRE III

(13 juin 2010)

x Bk , cest la fonction indicatrice de Ak , sinon cest la fonction nulle) ; on peut


donc ecrire
XZ
X
XZ
1(x,y)Pk d(y)
1Bk (y)1Ak (x) d(y) =
fk (x) =
k

Z X
B

1(x,y)Pk d(y).

Puisque chaque (x, y) de P appartient `a un et un seul des Pk , la somme `a linterieur


de lintegrale est identiquement egale `a 1. Il sensuit, pour tout x A,
X
[Bk ]1Ak (x) = [B].
k

Pour tout x
/ A, cette somme est clairement nulle, do`
u finalement
X
[Bk ]1Ak (x) = [B]1A (x).
k

Les fonctions fk etant positives, on peut alors echanger somme et integrale, et


trouver
Z X
Z
X
XZ
fk d =
fk = [B]1A d = [B][A] = [P ],
[Pk ] =
k

ce qui ach`eve la demonstration du point (i).


Pour prouver le point (ii), il suffit de remarquer que la famille F G gen`ere
la tribu produit dapr`es la Proposition III-35, et que X Y est reunion croissante
dune suite delements de cette famille. On peut alors appliquer le Theor`eme I-71
(ii) pour conclure `a lunicite dune mesure satisfaisant aux conditions requises. 
Remarque III-44. La demonstration du point (i) nest pas tr`es intuitive. Voici
une esquisse dargument plus intuitif, mais qui ne marche pas ! Introduisons une
partition de A plus fine que tous les ensembles Ak , et une partition de B plus fine
que tous les Bk . Chaque pave Ak Bk peut se redecouper en une union (au plus
denombrable) disjointe de paves obtenus `a partir des partitions plus fines : P est donc
u tous les Ak sont disjoints,
recouvert par une union denombrable de paves Ak B , o`
et tous les B sont disjoints. Tous les couples (k, ) sont forcement representes, sinon
lunion de tous les Ak B ne recouvrirait pas A B. On se ram`ene alors `a montrer
que
X
[Ak ][B ] = [A] [B],
k,

ce qui est vrai puisque toutes deux quantites sont egales a`


X
X
(
[Ak ])(
[B ]).
k

Lerreur dans ce raisonnement est quil est impossible en general de definir une
partition denombrable qui soit plus fine quune famille denombrable de partitions
finies. Ainsi, sur [0, 1], la seule partition qui soit plus fine que toutes les partitions
[0, qn [[qn , 1], o`
u (qn )nN est une enumeration des rationnels de [0, 1], est la partition
triviale, non denombrable, de tous les singletons.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

115

Remarque III-45. La mesure produit a une importance considerable en theorie


des probabilites, o`
u elle est associee `a la notion dind
ependance. Cest assez naturel : pour calculer la probabilite jointe de deux evenements A et B qui nont rien
`a voir lun avec lautre, on consid`ere comme normal de multiplier les probabilites
respectives de ces deux evenements.
Exemple III-46. Soit 1 = la mesure de Lebesgue sur R ; on peut definir
2 = , cest une mesure borelienne sur R2 , appelee mesure de Lebesgue 2dimensionnelle. Alors que 1 mesure les longueurs, 2 mesure les aires. Nous reviendrons par la suite sur les proprietes de cette mesure et de ses analogues en dimension
plus grande.
III-2.4. G
en
eralisation : mesures d
ependant dun param`
etre.
Proposition III-47 (produit tensoriel par une famille de mesures). Soient (X, )
un espace mesure, et Y un espace mesurable. Soit une famille (x )xX de mesures
definies sur Y . On suppose que x 7 x est mesurable, au sens o`
u pour tout B Y
lapplication
x 7 x [B]
est mesurable sur X. On suppose egalement que Y = Yk , o`
u chaque Yk est un
ensemble mesurable de x -mesure finie pour tout x. On peut alors definir sur la
tribu produit une mesure x par la formule
Z
( x )[A] =
x [Ax ] d(x).
X

D
emonstration. Il y a deux choses `a verifier : (i) que la fonction x 7 x [Ax ]
est mesurable, et (ii) que la formule precedente definit bien une mesure. Sans perte
de generalite, on peut supposer les Yk disjoints ; alors les ensembles A Yk induisent
des tranches (Yk )x disjointes, et
X
x [Ax ] = x [k (A Yk )x ] =
x [(A Yk )x ].
k

Il suffit donc de verifier que chaque application x 7 x [(A Yk )x ] est mesurable ;


on supposera donc, sans perte de generalite, que x est finie pour tout x.
Pour lassertion (i), soit A lensemble des elements de la tribu produit tels que
x [Ax ] soit mesurable. Par hypoth`ese, A contient tous les paves. Il est facile de voir
que A est stable par union disjointe : deux ensembles disjoints A1 et A2 donnent lieu
`a des tranches distinctes A1x et A2x le long de Y , pour chaque x, do`
u x [(A1 A2 )x ] =
x [A1x ]+x [A2x ]. On montre de meme que cet ensemble est stable par limite croissante.
En utilisant la finitude de x , on montre egalement quil est stable par difference :
si A, B A, B A, alors B \ A A. En particulier, A contient la classe monotone
engendree par les paves. Comme lensemble des paves est stable par intersection
finie, le Lemme de Classe Monotone assure que cette classe monotone concide avec
la tribu produit tout enti`ere.
Pour lassertion (ii) on note que, si (An ) est une famille densembles mesurables
disjoints, alors pour tout x les tranches Anx sont disjointes, do`
u
Z
Z X
Z
X
x [(An )x ] d(x) =
x [Anx ] d(x) =
x [An ] d(x).
X

116

CHAPITRE III

(13 juin 2010)

Remarque III-48. Si [A] = 0 alors ( x )[A Y ] = 0 ; Nous verrons dans


la Section X-2 que sous certaines hypoth`eses peu contraignantes, cette propriete
caracterise les mesures qui peuvent secrire sous la forme x .

Exemple III-49. Soit f une fonction integrable positive sur R2 par rapport `a la
mesure (mesure de Lebesgue 2-dimensionnelle). Alors la mesure f (x, y) (dx) (dy)
peut etre consideree de deux mani`eres equivalentes : soit comme la mesure de
densite f par rapport `a , soit comme le produit tensoriel (dx) x , o`
u
x (dy) = f (x, y) (dy).
III-2.5. Th
eor`
eme de Fubini-Tonelli-Lebesgue. Le theor`eme de Fubini est
celui qui permet dechanger les integrales de fonctions Riemann-integrables ; en voici
la version dans le cadre de la theorie abstraite de lintegration de Lebesgue. On
lui donne parfois le nom de theor`eme de Tonelli quand on consid`ere des fonctions
positives. Dans la pratique, on dira theor`eme de Fubini.

or`
The
eme III-50 (Theor`eme de Fubini-Tonelli-Lebesgue). Soient (X, ) et (Y, )
deux espaces mesures, -finis. On munit X Y de la tribu produit. Alors
(i) Pour toute fonction mesurable f definie sur X Y , `a valeurs dans [0, +],
les fonctions
Z
Z
x 7
f (x, y) d(y),
y 7
f (x, y) d(x)
Y

sont mesurables sur X et Y respectivement. En outre,



Z
Z Z
f (x, y) d( )(x, y) =
f (x, y) d(y) d(x) =
XY
X
Y

Z Z
f (x, y) d(x) d(y).
Y

(ii) Soit f une fonction mesurable definie sur X Y , `a valeurs dans R. Si


Z
|f (x, y)| d( )(x, y) < +,
XY

alors, pour -presque tout x, la fonction f (x, ) est -sommable ; et pour -presque
tout y, la fonction f (, y) est -sommable. La fonction
Z
: y 7
f (x, y) d(x)
X

est alors -sommable sur lensemble SY des y tels que f (, y) est -sommable ; et la
fonction
Z
: x 7
f (x, y) d(y)
Y

est -sommable sur lensemble SX des x tels que f (x, ) est -sommable. En outre,
si lon redefinit arbitrairement les valeurs de (resp. ) sur le complementaire de
SX (resp. SY ), on a legalite

Z
Z Z
(18)
f (x, y) d( )(x, y) =
f (x, y) d(y) d(x)
XY
X
Y

Z Z
=
f (x, y) d(x) d(y).
Y

THEOR
EMES
FONDAMENTAUX DINTEGRATION

117

Remarque III-51. Si lon applique ce theor`eme dans le cas particulier o`


uY =N
et est la mesure de comptage, on retrouve les enonces dinterversion somme-serie
que nous avons vus en corollaire des theor`emes de convergence monotone, et de
convergence dominee.
D
emonstration du Th
eor`
eme III-50. Il est assez facile de se convaincre que
(ii) est une consequence de (i). En effet, en appliquant (i) a` la fonction positive
|f (x, y)|, on constate que les fonctions
Z
Z
x 7
|f (x, y)| d(y),
y 7
|f (x, y)| d(x)
Y

sont sommables ; en particulier, elles sont finies presque partout, ce qui assure que
pour -presque tout x, la fonction f (x, y) est -sommable ; et de meme, pour presque tout y, cette fonction est -sommable. Les fonctions et sont donc bien
definies presque partout. La fonction
Z
x 7
|f (x, y)| d(y)
X

etant mesurable, lensemble SX des x pour lesquels f (x, ) est non sommable est
mesurable ; de meme pour SY . On peut donc redefinir et en-dehors de ces
ensembles, sans alterer leur mesurabilite. Linegalite
Z
Z


f (x, y) d(y)
|f (x, y)| d(y)


Y

assure alors que la fonction est effectivement -sommable sur SX ; par symetrie, il
en est de meme pour . Enfin, pour etablir (18) on decompose f en partie positive
et partie negative, et on applique (i) `a chacune de ces fonctions.

Il reste `a etablir (i). La preuve de ce theor`eme est assez laborieuse et utilise des
schemas que nous avons dej`a rencontres : remplacer les fonctions mesurables par des
fonctions indicatrices, remplacer les ensembles mesurables par des paves. Nous allons
demontrer en m
eme temps lassertion de mesurabilite et la formule dechange des
integrales. Soit G lensemble des fonctions f verifiant (i), et A lensemble des parties
mesurables de X Y dont la fonction indicatrice appartient `a G. Dans un premier
temps, on supposera que et sont finies.
R
1. A contient les paves. En effet, dans ce cas lapplication x 7 f (x, y) d(y)
est un multiple de la fonction indicatrice dun ensemble mesurable, donc mesurable.
En outre, le theor`eme de Fubini se reduit alors `a la definition de la mesure produit
sur les paves.
2. A est stable par limite croissante. Pour le montrer, on ecrit, pour tout x
Z
Z
1Ak (x, y) d(y),
1An (x, y) d(y) = lim
Y

ce qui est une consequence du theor`eme de convergence monotone ; et une relation similaire en echangeant les roles de X et Y . On applique une deuxi`eme fois le
theor`eme de convergence monotone pour etablir la formule de Fubini.
3. A est stable par soustraction. Pour le voir, on ecrit simplement que
R 1B\A =
1B 1A si A B, et on applique les r`egles daddition de lintegrale : (f g) =

118

CHAPITRE III

(13 juin 2010)

R
f g. On note que la finitude de et est utilis
ee ici ; sans cette hypoth`ese
nous aurions des indeterminations du type (+) (+).

4. A contient donc toute la tribu produit. Cest une consequence du Lemme de


Classe Monotone. En termes equivalents, G contient toutes les fonctions indicatrices
mesurables.
5. G contient toutes les fonctions simples. Cest evident par linearite de lintegrale
(on utilise ici la linearite des deux integrales, par rapport `a et par rapport `a ).
6. G contient toutes les fonctions mesurables. Pour le voir, on approche f mesurable par une suite croissante de fonctions simples, et on passe `a la limite dans toutes
les expressions en jeu en utilisant le Theor`eme de Convergence Monotone comme en
2).
Pour conclure la preuve, il ne reste plus qu`a remplacer lhypoth`ese de finitude
par celle de -finitude. Par hypoth`ese, X est une union densembles mesurables Xk
de mesure finie, et Y une union densembles mesurables Yk de mesure finie. Pour
tout k, les conclusions de (i) sont donc verifiees si lon remplace X et Xk par Y et
Yk ; ou, de mani`ere equivalente, si lon remplace f par f 1Xk Yk . Puisque f est la
limite croissante des f 1Xk Yk , on conclut par application repetee du Theor`eme de
Convergence Monotone, comme en 2).

Remarque III-52. Dans lenonce, on a pris soin de definir (arbitrairement) les
fonctions , en-dehors de certains ensembles negligeables o`
u leur valeur netait pas
definie (on ne definit pas lintegrale dune fonction non sommable dont le signe nest
pas constant). Une alternative classique consisterait `a admettre que les fonctions
, ne soient definies quen-dehors dun ensemble negligeable. Dans tout ce cours, on
pref`ere eviter ce point de vue, et ne parler que de fonctions qui soient definies partout.
Dans le meme esprit, on evitera didentifier a priori des fonctions qui concident
hors dun ensemble de mesure nulle. Indispensable dans lanalyse (fonctionnelle) des
espaces de Lebesgue, cette identification est nuisible dans dautres situations.
Cest loccasion denoncer quelques remarques sur le Theor`eme de Fubini-TonelliLebesgue, que nous illustrerons en utilisant la mesure de Lebesgue sur R.
Remarque III-53. La -finitude de X et Y est une hypoth`ese importante dans
le Theor`eme III-50. Un contre-exemple classique consiste `a considerer la mesure
de Lebesgue sur [0, 1] dune part, la mesure de comptage sur [0, 1] dautre part
(clairement, la mesure de comptage nest pas -finie, sinon [0, 1] serait denombrable).
Si lon int`egre la diagonale := {(x, x); x [0, 1]} de deux facons differentes, on
trouve
Z
Z
y,
1 (x, y) d(x) = 0;
x,
1 (x, y) d(y) = 1.
En particulier,
Z Z

1 (x, y) d(x) d(y) = 0;

Z Z

1 (x, y) d(y) d(x) = 1.

Noter que est mesurable puisque intersection dune famille denombrable dunion
de paves (comme suggere par la figure 4). Noter egalement que nos hypoth`eses ne
garantissent pas que la mesure produit soit bien definie ; est bien definie en
revanche la mesure exterieure ( ) associee aux recouvrements par des paves.
En loccurrence, on se convainc facilement que ( ) [] = +.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

119

0
1
0
11
0
0
1
0
1
01
1
0
0
01
1
0
1
0
1
01
1
0
0
01
1
0
1
0
1
01
1
0
0
01
1
0
1
0
1
01
1
0
0
01
1
0
1
0
1
01
1
0
0
1
0
1

Fig. 4. La diagonale est limite dune union de petits carres

Remarque III-54. Il est egalement important que la fonction f soit mesurable


pour la tribu produit ! Un contre-exemple surprenant d
u `a Sierpinski [Rudin, p. 167]
montre que les integrales doubles
Z

Z

Z
Z
f (x, y) d(y) d(x);
f (x, y) d(x) d(y)
[0,1]

[0,1]

[0,1]

[0,1]

peuvent etre toutes deux bien definies comme integrales de fonctions positives mesurables, et pourtant differentes ! On peut toutefois exclure ce type de pathologie
par des hypoth`eses topologiques : par exemple, si f : R2 R est telle que les applications partielles f (x, ) et f (, y) sont respectivement Borel-mesurables pour tout
x, et continues pour tout y, alors f est automatiquement Borel-mesurable [Rudin,
p. 176]. Notons egalement que le contre-exemple de Sierpinski utilise laxiome du
choix et lhypoth`ese du continu, dont nous reparlerons dans le Chapitre IV.
En utilisant le Theor`eme de Fubini, nous allons maintenant demontrer la formule
de sommation par tranches generalisee (sous une hypoth`ese de -finitude).
D
emonstration du Th
eor`
eme III-31 quand X est -fini. Puisque (f ) =
[[0, f [], on peut ecrire, en utilisant Fubini-Tonelli-Lebesgue,
Z
Z Z
(f (x)) d(x) =
1[0,f (x)[ (t) (dt) d(x)
X
X R

Z Z
1[0,f (x)[ (t) d(x) (dt)
=
X
R
Z
=
[{f > t}] (dt).
R


III-2.6. G
en
eralisation : int
egrales multiples. Il ny a aucune difficulte `a
generaliser les constructions precedentes `a un produit fini dun nombre quelconque
despaces mesures ; on obtient ainsi le theor`eme ci-dessous, dont la preuve pourra
etre traitee en exercice.
Th
eor`
eme III-55 (produits multiples et integrales multiples). (i) Soient (X1 , A1 ),
. . ., (Xn , An ) des espaces mesures. Alors la tribu (((A1 A2 ) A3 ) . . . An ) est la

120

CHAPITRE III

(13 juin 2010)

tribu engendree par les paves multiples, de la forme A1 . . . An , o`


u Ai Ai pour
tout i. On lappelle tribu produit de A1 , . . . , An et on la note
A1 A2 . . . An .
(ii) Soient X1 , . . . , Xn des ensembles quelconques, et F1 , . . . , Fn des familles de
parties de X1 , . . . , Xn respectivement. On suppose que Xi est reunion denombrable
delements de Fi, pour tout i {1, . . . , n}. Alors la tribu produit (F1 ) (F2 ) . . .
(Fn ) est engendree par les paves de la forme A1 . . . An , o`
u Ai Fi pour tout
i.
(iii) Soient X1 , . . . , Xn des espaces metriques separables, munis de leurs tribus
boreliennes respectives. Alors la tribu produit sur X1 . . .Xn concide avec la tribu
borelienne sur X1 . . . Xn .
Q
(iv) Soient (X1 , A1 ), . . . , (Xn , An ) des espaces mesurables, et soit A Xi un
ensemble mesurable pour la tribu produit. Alors pour tout k les (n k)-tranches
{(x1 , . . . , xnk ) X1 . . . Xnk ; (x1 , . . . , xn ) A}
sont mesurables pour la tribu produit A1 . . . Ank .
(iv) Soient (X1 , A1 , 1 ), . . . , (Xn , An , n ) des espaces mesures -finis. Alors sur
X1 . . . Xn , muni de la tribu produit, il existe une unique mesure telle que pour
tout pave P = A1 . . . An , o`
u Ai Ai pour tout i,
[P ] =

n
Y

i [Ai ].

i=1

Cette mesure concide avec ((1 2 ) . . .) n ; on lappelle mesure produit de


1 , . . . , n et on la note
1 2 . . . n .

Si F1 , . . . , Fn sont des familles de parties de X1 , . . . , Xn telles que pour tout i, Ai =


(Fi), Fi est stable par intersection finie, et Xi est union denombrable dune famille
croissante delements de Fi , alors la mesure produit est caracterisee par la propriete
i, Ai Fi = [A1 . . . An ] =

n
Y

i [Ai ].

i=1

(v) Soient (X0 , A0 ), . . . (Xn , An )nN des espaces mesurables. On se donne une
mesure 0 sur X0 ; et pour tout j {1, . . . , n 1} on se donne une famille
Q de
mesures xj sur Xj+1 , dependant mesurablement de xj Xj . On pose X := Xj
et on le munit de la tribu produit. Alors il existe une unique mesure sur X telle
que pour toutes parties mesurables Ai de Xi ,
Z
Z
Z Z
Y
dxn1 (xn ) dxn2 (xn1 ) . . . dx0 (x1 ) d(x0).
...
[ Ai ] =
A0

A1

An1

An

On la note 0 x0 . . . xn1 .
(vi) Soient (X1 , A1, 1 ), . . . , (Xn , An , n ) des espaces mesures -finis. On munit
X k := X1 . . . Xk de la tribu produit A1 . . . Ak . Alors, pour tout k

THEOR
EMES
FONDAMENTAUX DINTEGRATION

121

{1, . . . , n 1} et toute fonction mesurable f definie sur X n , `a valeurs dans [0, +],
la fonction
Z
(xk+1 , . . . , xn ) 7
f (x1 , . . . , xn ) d(1 . . . k )(x1 , . . . , xk )
X1 ...Xk

est mesurable sur Xk+1 . . . Xn . En outre


Z
Z
f (x1 , . . . , xn ) d(1. . .n )(x1 , . . . , xn ) =
Xn

...
Xn

f (x1 , . . . , xn ) d1 (x1 ) . . . dn (xn ).

X1

En outre, si f est une fonction mesurable definie sur X n , `a valeurs dans R, telle que
Z
|f (x1 , . . . , xn )| d(1 . . . n )(x1 , . . . , xn ) < +,
Xn

alors pour chaque k la fonction


Z
(xk+1 , . . . , xn ) 7

X1 ...Xk

f (x1 , . . . , xn ) d(1 . . . k )(x1 , . . . , xk )

est bien definie et sommable hors dun ensemble negligeable Zk ; quitte `a la redefinir
arbitrairement sur Zk , on a
Z
Z
Z
f (x1 , . . . , xn ) d1 (x1 ) . . . dn (xn )
...
f (x1 , . . . , xn ) d(1. . .n )(x1 , . . . , xn ) =
Xn

X(n)

...

Xn

X1

f (x1 , . . . , xn ) d(1) (x(1) ) . . . d(n) (x(n) )

X(1)

pour toute permutation de {1, . . . , n}.


Exemple III-56. On peut definir la mesure de Lebesgue en dimension n par
n = n .
Remarque III-57. Nous verrons plus loin que lon peut, sous certaines conditions, definir des produits infinis de mesures. Cette operation nest pas toujours
permise, ainsi le produit na pas de sens.
III-3. Changement de variable
Nous allons maintenant considerer des changements de variable dans un cadre
mesurable. Bien s
ur, dans un cadre abstrait, il nest pas question de parler de
diffeomorphisme, de Jacobien, etc. Nous verrons plus tard comment faire le lien
avec les notions habituelles de changement de variable. Ce theor`eme est base sur la
notion importante de mesure image.
III-3.1. Image dune mesure par une fonction mesurable.
Proposition III-58 (Tribu image). Soit (X, A) un espace mesurable, Y un ensemble quelconque, et f : X Y . On peut definir une tribu, notee f# A, ou f #A,
ou f A, ou f A, sur Y , par


f# A = B Y ; f 1 (B) A .

Cette tribu est appelee tribu image de A par f , et cest la plus grande tribu qui rende
f mesurable.
Si Y est au depart un espace mesurable, muni dune tribu B et f une application
mesurable, alors B f# A.

122

CHAPITRE III

(13 juin 2010)

D
efinition III-59 (Mesure image). Soit (X, A, ) un espace mesure, et f : X
Y . Alors la formule
[B] := [f 1 (B)]
definit une mesure sur la tribu image f# A, appelee mesure image de par f et notee
f# , ou f #, ou f , ou plus rarement f .
Si (Y, B) est au depart un espace mesurable, et f est une application mesurable,
alors f# definit par restriction une mesure sur B.
La preuve des assertions enoncees ci-dessus est un exercice simple de maniement
des axiomes de theorie de la mesure.
III-3.2. Th
eor`
eme de changement de variable.
Th
eor`
eme III-60. Soient X, Y deux espaces mesurables, et : X Y une
application mesurable. On suppose que X est muni dune mesure . Alors,
(i) Pour toute fonction f mesurable sur Y , `a valeurs dans [0, +],
Z
Z
(19)
f d(# ) = (f ) d.

(ii) Pour toute fonction f mesurable sur Y , `a valeurs dans R, la fonction f


est -sommable si et seulement si la fonction f est (# )-sommable, et legalite
ci-dessus est alors verifiee.
D
emonstration. Il est facile de voir que (ii) est une consequence de (i) ; on
va donc se contenter de demontrer (i). Si f est une fonction simple, legalite (19)
est une consequence de la definition de # . Dans le cas general o`
u f est seulement
supposee mesurable, on peut approcher f par une famille croissante de fonctions
simples fn ; alors fn est une famille croissante de fonctions simples convergeant
vers f , et on peut passer `a la limite grace au Theor`eme de convergence monotone
de Beppo Levi.

Remarque III-61. Il peut se produire que f soit mesurable sans que f le
soit. Cest le cas par exemple d`es que (X) nest pas mesurable, pour la fonction
f = 1(X) .

III-3.3. Morphismes despaces mesur


es. Le theor`eme de changement de
variables que nous avons vu ne suppose aucune regularite et pourra etre interessant
dans des questions theoriques abstraites.
Soit la situation o`
u (X, A, ) est un espace mesure, une application X Y , et
Y est muni de la tribu image # A et de la mesure image # . Tout enonce faisant
intervenir la mesure et des ensembles mesurables, ou des integrales de fonctions
mesurables, se traduira en un enonce similaire sur (Y, # A, # ). On peut dire que
realise un morphisme entre les espaces mesures X et Y .
Si maintenant f est bijective, de reciproque mesurable (on dit parfois bimesurable), alors f 1 realisera egalement un morphisme entre Y et X, et les enonces de
theorie de la mesure faisant intervenir (X, ) seront equivalents aux enonces correspondants faisant intervenir (Y, f #). On dit que f realise un isomorphisme entre
les espaces mesures X et Y . Cette notion permet parfois de ramener des probl`emes
definis sur un espace en apparence complique, `a des probl`emes definis sur un espace
beaucoup plus familier ; il sagit dune abstraction de la procedure de changement
de variable.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

123

A titre dexemple, citons un resultat de classification surprenant qui montre que


dans le cadre de nimporte quel espace Polonais, on peut effectuer un changement
de variable abstrait pour se ramener `a lintervalle [0, 1].
Th
eor`
eme III-62 (representation des espaces Polonais). Soit (X, ) un espace
Polonais muni dune mesure de Borel finie. Soit I lintervalle [0, 1] muni de sa tribu
borelienne. Alors
(i) Il existe une mesure finie sur I, et une application mesurable f : I X
qui realise un morphisme entre (I, ) et (X, ). Autrement dit, toute mesure finie
sur un Polonais est image dune mesure finie sur [0, 1].
(ii) Si est sans atome, alors on peut choisir la fonction f bijective. Autrement
dit, toute mesure finie sans atome sur un Polonais est isomorphe `a une mesure finie
sans atome sur [0, 1].
Remarque III-63. Lhypoth`ese de non-atomicite equivaut `a dire que les points
sont negligeables ; cest bien s
ur une condition necessaire `a lexistence dun isomorphisme. Rappelons egalement (Theor`eme II-18) que la reciproque dune bijection
mesurable entre espaces Polonais est automatiquement mesurable.
Exemple III-64. Comme nous le verrons au Chapitre IV, lespace [0, 1], muni de
la mesure de Lebesgue, est isomorphe `a lespace {0, 1}N , muni de la mesure produit
(infini) obtenue par produit tensoriel de la mesure de Bernoulli sur {0, 1}, i.e. la
mesure qui attribue un poids 1/2 `a 0 et `a 1. Pour autant, R et {0, 1}N ne sont pas
topologiquement isomorphes : ainsi, le premier est connexe, alors que le second est
totalement discontinu (ses composantes connexes sont des points).
Nous allons maintenant utiliser le theor`eme de changement de variables pour
prouver le Theor`eme III-31 dans le cas general (rappelons que ce theor`eme a ete
demontre dans le cas o`
u X est -fini `a laide du Theor`eme de Fubini).
D
emonstration du Th
eor`
eme III-31. Appliquons le Theor`eme III-29 `a la
fonction positive f : on a
Z
Z
[{ f > t}] d(t).
f d =
X

R+

De par sa definition, la fonction est croissante et continue `a gauche (en effet,


[[0, x[] = limk [0, x k 1 []). On definit son inverse generalise par la formule
1 (t) := inf{s 0;

(s) > t}.

Il est facile de verifier que 1 est croissante et continue `a droite. Par definition de
1 , si f > 1 (t) alors (f ) > t. Si maintenant (f ) > t, par continuite de `a
gauche on peut trouver > 0 tel que (f ) > t, et par definition de 1 on a
1 (t) f < f . On a donc
(f ) > t f > 1 (t).

Il sensuit
Z
Z
Z
1
[{ f > t}] d(t) =
[{f > (t)}] d(t) =
[{f > s}] d(1 )# (s).
R

Pour conclure, il suffit detablir que

(1 )# = .

124

CHAPITRE III

(13 juin 2010)

Or la tribu borelienne sur R+ est engendree par les intervalles de la forme [0, s[ ; il
suffit donc de verifier que
[{1 < s}] = [[0, s[].
Or la premi`ere quantite est [[0, (s)[] = (s), puisque 1 (t) < s equivaut `a
t < (s) ; et la deuxi`eme quantite est par definition (s).

III-4. In
egalit
es int
egrales
el
ementaires
Pour etablir des majorations sur des quantites faisant intervenir des integrales, on
utilise le plus souvent un petit nombre dinegalites souples et puissantes, qui apparaissent dans un nombre incalculable de contextes differents. Ces inegalites, qui sont
valables en toute generalite, sont les inegalites de Chebyshev, Jensen, et H
older.
Une quatri`eme inegalite dusage tr`es frequent, appelee inegalite de Minkowski sera
etudiee plus tard, au Chapitre VI.
Une certaine familiarite avec les proprietes des fonctions convexes sera utile pour
lire cette section ; en cas de besoin on pourra se reporter aux rappels contenus dans
lAppendice en fin de chapitre.
III-4.1. In
egalit
e de Chebyshev. Linegalite de Chebyshev1 est aussi elementaire
quutile, particuli`erement dans le domaine des probabilites.
or`
The
eme III-65 (inegalite de Chebyshev). (i) Soient (X, ) un espace mesure
et f : X R+ une fonction mesurable positive. Alors, pour tout a > 0,
h
i 1Z
(20)
{x X; f (x) a}
f d.
a X
(ii) Soient (X, ) un espace mesure, f : X R+ une fonction mesurable positive,
et : R+ R+ une fonction mesurable croissante. Alors, pour tout a 0,
Z
h
i
1
{x X; f (x) a}
(f (x)) d(x).
(a) X
Remarque III-66. Dans le cas degenere o`
u a = 0 et f est nulle presque partout,
linegalite (20) est a priori fausse (si lon adopte la convention habituelle 0/0 = 0).

Remarque III-67. Lenonce (i) est souvent appele inegalite de Markov ; lenonce
(ii) est souvent appele inegalite de Bienayme-Chebyshev quand (r) = r 2 , et inegalite
de Chebyshev exponentielle quand (r) = er . Si lon peut choisir des fonctions
croissant tr`es vite `a linfini, mais telles que f soit toujours integrable, on peut
obtenir des estimations de decroissance tr`es rapide de la mesure de {x; f (x) a}
quand a . En fait, dans la plupart des situations concr`etes, on obtient des
estimations de decroissance presque optimales par un choix convenable de .
D
emonstration du Th
eor`
eme III-65. Posons A := {x X; f (x) a}.
Comme f est positive, on a
f a1A .
En integrant cette inegalite contre et en divisant par le nombre positif a, on obtient
lenonce (i).
1On

ne discutera pas ici des multiples orthographes que le nom Chebyshev peut revetir...

THEOR
EMES
FONDAMENTAUX DINTEGRATION

125

Pour en deduire lenonce (ii), il suffit dappliquer (i) avec f remplace par f ,
et de noter que, etant croissante,
n
o
{x; f (x) a} x; (f (x)) (a) .


Remarque III-68. Il est facile de verifier que lenonce est en general faux si
f nest pas positive ! Dans la pratique, on cherchera donc toujours `a sy ramener,
par exemple en prenant la valeur absolue. En utilisant des normes, on peut aussi
appliquer ce theor`eme `a des estimations de fonctions `a valeurs vectorielles.
III-4.2. In
egalit
e de Jensen.
or`
The
eme III-69 (inegalite de Jensen dans Rn ). Soient X un espace mesure,
une mesure de probabilite sur X, f : X Rn une fonction mesurable dont chaque
n
composante est -sommable, et : R
R {+} une fonction convexe. On
R
1
suppose que Rf L (), et on note f d le vecteur de Rn dont la composante
dordre i est fi d. Alors
Z
Z
( f d) f d.
De plus, si les deux membres de linegalite sont finis, il y a egalite si et seulement si
concide, f# -presque partout, avec une fonction affine ; en particulier, si est
strictement convexe, f doit etre egale `a une constante, -presque partout.
Corollaire III-70 (inegalite de Jensen pour des puissances). Soient X un espace mesure, une mesure de probabilite sur X, f : X Rn une fonction
mesurable
R
dont chaque composante est -sommable,
R et p [1, +[. On note f d le vecteur
de Rn dont la composante dordre i est fi d. Alors
p Z
Z


f d |f |p d.


De plus, si le membre de droite de linegalite est fini et p > 1, il y a egalite si et
seulement si il existe une constante a Rn telle que, -presque partout, f = a.

Remarques III-71.
(i) Quand = x + (1 )y , linegalite de Jensen
se reduit `a la deP
finition de la convexite. Plus generalement, si lon pose X =
{1, . . . , N}, = i i et f (i) = xi , linegalite de Jensen se reduit `a linegalite
X
X
(
i xi )
i (xi ),

que lon peut egalement adopter comme definition de la convexite. Linegalite


de Jensen nest quune limite continue de linegalite ci-dessus.
(ii) Linegalite de Jensen setend `a nimporte quelle notion raisonnable dintegrale
`a valeurs vectorielles, meme si lespace darrivee de f est de dimension infinie ;
voir le Theor`eme VII-193. En fait, compte tenu de son importance dans des
contextes tr`es divers, on pourrait ajouter linegalite de Jensen au cahier des
charges dune integrale abstraite.

D
emonstration de lin
egalit
e de Jensen. Je vais dabord presenter une
demonstration generale, qui ne craindra pas les valeurs infinies, mais ne permettra
pas de traiter les cas degalite.

126

CHAPITRE III

(13 juin 2010)

Considerons dabord le cas o`


u f prend un nombre fini de valeurs y1 , . . .P
, y k Rn ,
et notons Ak = f 1 (yk ), k = [Ak ]. Les ensembles Ak sont mesurables et k = 1.
Par convexite de ,
Z

Z
X
X

f d = (
k yk )
k (yk ) = f d.

Supposons maintenant que est lipschitzienne. Par hypoth`ese f L1 (), donc


()
chaque composante fj de f peut etre approchee dans L1 () par une famille (gj )N
de fonctions prenant un nombre fini de valeurs reelles. On en deduit
Z
R
()
g d f d,

donc

Z

()

Z

f d ;

et par lipschitzianite de ,
Z
Z
Z
Z


(f (x)) d(x) (g () (x)) d(x) |(f (x))(g () (x))| d(x) kkLip |f (x)g () (x)| d(x)


On peut donc passer `a la limite dans linegalite de Jensen appliquee `a chaque fonction
g () , et obtenir linegalite de Jensen pour la fonction f .
Pour conclure, on note que si est convexe semi-continue inferieurement, `a valeurs dans R {+}, on peut ecrire = supkN k , o`
u chaque k est lipschitzienne.
On a donc
Z

Z

Z
Z

f d = sup k
f d sup k f d f d.
kN

kN

Pour obtenir les cas degalite, nous devrons travailler un peu plus. Sans perte de
generalite, on peut supposer que f (x) = x : pour sy ramener, il suffit de remplacer
par f# . Linegalite devient alors
Z
Z
() d,
= x d(x).
R
(En dautres termes, est le barycentre de .) Supposons donc que () = d.
1
Placons-nous dans lespace affine E engendre par le support
R de . Soit = (R)
E le domaine de , ou plutot de sa restriction `a E. Si d < +, forcement
[E \ ] = [ = +] = 0, autrement dit peut etre considere comme une mesure
de probabilite sur . Par le lemme III-73 ci-dessous, est interieur `a (dans E) ;
le sous-differentiel () est donc non nul (on demontrera plus tard ce resultat sous
des hypoth`eses plus generales, voir le Corollaire VII-190). Soit y () ; pour tout
z E, on a
(z) () hy, z i 0.
Comme lintegrale de cette fonction vaut
Z
 Z
Z
Z
d () hy, z i d(z) =
d () hy, i = 0 0 = 0,
elle est forcement nulle. On conclut que

(z) = () + hy, z i,

THEOR
EMES
FONDAMENTAUX DINTEGRATION

127

-presque partout, ce qui demontre la conclusion.

Remarque III-72. Dans la preuve des cas degalite, on a en fait redemontre


linegalite de Jensen, sous lhypoth`ese supplementaire que est finie -presque partout.
Lemme III-73. Soit Rn un convexe (non necessairementR ouvert ou ferme),
et soit une mesure de probabilite borelienne sur , telle que |x| d(x)R < +.
On note E lespace affine euclidien engendre par le support de , et = x d(x)
le barycentre de . Alors est interieur `a E dans E.
D
emonstration. On note = E. Supposons que ; par le Theor`eme
de separation de HahnBanach (dont la demonstration sera rappelee plus tard dans
un cadre general, voir le Theor`eme VII-84) il existe une forme lineaire E , et
R, tels que sur et () = . On consid`ere = # : cest une mesure
sur (, ] dont le barycentre est egal `a ; elle est donc forcement egale `a . On
en deduit que est concentree sur un hyperplan de E, ce qui est en contradiction
avec la definition de E.

Il faut prendre bien garde, quand on applique linegalite de Jensen, `a lhypoth`ese
sur la mesure : ce doit etre une mesure de probabilite. Il existe cependant un
cas interessant o`
u cette hypoth`ese peut etre omise : cest celui o`
u la fonction est
homog`
ene de degr
e 1, au sens o`
u
R, x Rn ,

(x) = (x).

or`
The
eme III-74 (inegalite de Jensen pour des fonctions convexes homog`enes).
Soient X un espace mesure, une mesure sur X, f : X Rn une fonction mesurable dont chaque composante est -sommable, et : Rn R {+} une fonction
convexe, semi-continue inferieurement, homog`ene de degre 1. Alors
Z
Z
( f d) f d,
o`
u lon convient que le membre de droite vaut + si f nest pas sommable.

Remarque III-75. La convention sur le membre de droite est tr`es naturelle :


on peut montrer que est minoree par une fonction affine, et il sensuit que f
est minoree par une fonction integrable ; f est donc la somme dune fonction
sommable et dune fonction positive.
D
emonstration du Th
eor`
eme III-74. La -sommabilite de chaque composante de f implique celle de |f |. Pour tout entier k 1, notons Ak := {x
X; |f (x)| k 1 }. Linegalite de Chebyshev implique
Z
[Ak ] k |f | d.
En particulier, [Ak ] est fini. Soit k la mesure de probabilite definie par
k [B] :=
Linegalite de Jensen implique
(

[Ak B]
.
[Ak ]

f dk )

f dk .

128

CHAPITRE III

(13 juin 2010)

En utilisant lhomogeneite de , on en deduit




Z

Z
Z
[Ak ] f dk = [Ak ]
f dk [Ak ] f dk .
En resume,
(21)

Z

f d
Ak

Ak

f d.

En distinguant les cas f (x) = 0 et f (x) 6= 0, on voit que f 1Ak converge partout vers
f quand k . Par convergence dominee,
Z
Z
f d,
f d
k

Ak

et par semi-continuite inferieure de ,


Z

Z
(22)

f d lim inf
k

Ak

f d.

Dautre part, lhomogeneite de impose (0) = 0, ce qui permet de montrer que


la fonction ( f )1Ak converge partout vers f . Si cette fonction est integrable,
alors on a, par convergence dominee,
Z
Z
f d.
f d
k

Ak

Cela conclut largument.

Remarque III-76. Soit une fonction convexe sur Rn1 ; alors la fonction definie
sur Rn1 R+ par
x
(x, z) = z
z
est convexe, comme on peut le voir en revenant `a la definition de la convexite (exercice).
III-4.3. In
egalit
es de Young int
egr
ees. Pour toutes fonctions f et g `a valeurs reelles, definies sur un espace X quelconque, et toute fonction convexe sur
R, on peut ecrire
f (x)g(x) (f (x)) + (g(x)).

Si X est muni dune mesure et que toutes ces fonctions sont integrables, on a alors
Z
Z
Z
f g d
f d +
g d.
X

Plus generalement, si f et g sont `a valeurs dans Rn , on peut ecrire


Z
Z
Z
hf, gi d
f d +
g d.
X

Ces inegalites aussi elementaires que cruciales peuvent parfois etre ameliorees,
en particulier quand presente certaines proprietes dhomog
en
eit
e, comme nous
allons maintenant le voir.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

129

III-4.4. In
egalit
e de H
older. Tr`es souvent, quand on majore des produits de
fonctions, on cherche `a utiliser des integrabilites differentes pour les deux facteurs.
Un exemple evident est linegalite utile
Z

Z




|f | C -presque partout = f g d C |g| d.

Linegalite de Holder affine cette inegalite grace `a lusage de fonctions puissances.


or`
The
eme III-77 (inegalite de Holder). Soit (X, ) un espace mesure, soit p
]1, +[, et soit p = p/(p 1) lexposant conjugue de p. Soient f et g deux fonctions
mesurables sur X, `a valeurs dans R. Alors
Z
Z
1/p Z
1/p


p
q
f g d
,
|f | d
|g| d

o`
u lon convient que le membre de gauche vaut + si f g nest pas integrable. De
plus, si le membre de droite de linegalite est fini et non nul, il y a egalite si et
seulement si il existe > 0, {1} tel que, -presque partout, f et g ont meme

signe et |f |p = |g|p , ce qui revient `a g = |f |p2f .


Les memes conclusions valent si f et g sont `a valeurs dans Rn , quitte `a remplacer
le produit f g par le produit scalaire hf, gi, et `a interpreter |f | et |g| comme les normes
euclidiennes de f et g.
Remarques III-78. (i) Dans le cas o`
u p = p = 2, linegalite de Holder est
appelee in
egalit
e de CauchySchwarz ; on peut alors la demontrer par un
argument abstrait, valable pour nimporte quel espace de Hilbert.
(ii) Nous rencontrerons au chapitre VI une autre inegalite importante faisant intervenir des fonctions puissances et de la convexite, appelee in
egalit
e
de Minkowski.
(iii) Linegalite de Holder reste vraie pour p = 1 ou p = , si lon convient
de poser
1/
Z
n
o

|g| d
:= inf C R; |g| C -presque partout .

Cette derni`ere quantite est appelee le supremum essentiel de |g| ; il sagit


de la definition habituelle du supremum, `a laquelle on a ajoutee les mots presque partout.
(iv) Pour 0 < p < 1, linegalite reste vraie avec f, g positives, et q :=
p/(1 p)... au signe pr`es ! Il faut en effet remplacer par .
monstration de line
galite
de Ho
lder. Si lune des integrales du membre
De
de droite est nulle, alors, -presque partout, f g = 0, et linegalite est satisfaite. Si
lune de ces integrales est infinie et lautre non nulle, alors linegalite est bien s
ur
satisfaite. Supposons
donc
que
les
deux
int
e
grales
sont
strictement
positives
et
finies.
R
R
R
R

On pose f = f /( |f |p )1/p , g = g/( |g|p )1/p , on a alors |f |p = |g |p = 1 et on


doit prouver

Z

f g d 1.


On sait dej`a que

Z
Z

f g d |f g | d,

130

CHAPITRE III

(13 juin 2010)

et si le membre de droite est fini, legalite nest possible que si, -presque partout,
f g = |f g |, cest-`a-dire si f et g ont meme signe. Pour recapituler, nous nous
sommes ramenes, par cet argument dhomogeneite, au cas particulier suivant : montrer que, si f et g sont deux fonctions positives,
Z
Z
Z
p
p
f = g = 1 = f g 1,
avec egalite si et seulement si f = g presque partout. On ecrit alors linegalite du
Lemme III-118 avec a := f (x), b := g(x), et on int`egre par rapport `a : on trouve
Z
1
1
f g d + = 1;
p p
avec egalite si et seulement si f = g presque partout. La preuve est compl`ete.

Linegalite de Holder admet plusieurs avatars simples et interessants.


or`
The
eme III-79 (variantes de linegalite de Holder). (i) Soit (X, ) un espace
mesure, soit p ]1, +[ et soit p = p/(p 1) son exposant conjugue. Soient f et g
deux fonctions mesurables sur X, `a valeurs dans R. Alors, pour tout > 0,
Z

Z
p Z


1
p
f g d
|f | d + q q |g|q d,


p

o`
u lon convient que le membre de gauche vaut + si f g nest pas integrable.
(ii) Soit (X, ) un espace mesure, soient p1 , . . . , pk ]1, +[ tels que
k
X
1
= 1,
p
i
i=1

et soient f1 , . . . , fk des fonctions mesurables sur X, `a valeurs dans R. Alors



Z
1/pi
Y Z
Y


pi
|fi | d
,
( fi ) d


i
i
Q
o`
u lon convient que le membre de gauche vaut + si fi nest pas integrable.

(iii) Soient (X, ) un espace mesure -fini et (Y, ) un espace de probabilite.


Alors, pour toute fonction F mesurable de X Y dans R+ {+}, on a
Z

Z
Z


Z
exp
log F (x, y) d(y) d(x) exp
log
F (x, y) d(x) d(y) .
X

(iv) Soient X et Y deux ensembles quelconques, et L un operateur lineaire, defini


sur un sous-espace vectoriel de lensemble des fonctions de X dans R, `a valeurs dans
lensemble des fonctions de Y dans R. On suppose que L est positif, i.e. Lf 0 si
f 0. Soient f, g 0 dans le domaine de L, soit p ]1, +[ et p = p/(p 1) son
exposant conjugue. Alors

L(f g) [L(f p )]1/p [L(g p )]1/p ,


ce qui est une inegalite entre deux fonctions de Y dans R.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

131

(v) Soient (X, ) un espace mesure, E un espace vectoriel norme, et E lespace


des formes lineaires continues sur E, muni de sa norme naturelle. Soient f : X
E et g : X E des fonctions mesurables, soit p ]1, +[ et q := p/(p 1). Alors
Z
Z
1/p
1/p Z

p
p
hf, giE E di
,
kgkE
kf kE

o`
u lon convient que le membre de gauche vaut + si hf, gi nest pas integrable.
(vi) Soit (X, ) un espace mesure, f, g : X C deux fonctions mesurables `
a
valeurs complexes, p ]1, +[ et q := p/(p 1). Alors
Z
Z
1/p Z
1/p x

p
p
f g d
|f | d
|g| d
,


o`
u lon convient que le membre de gauche vaut + si f g nest pas integrable. De
plus, si le membre de droite de linegalite est fini et non nul, il y a egalite si et
seulement si il existe > 0 et R tels que, -presque partout, f g ei R et
|f |p = |g|q .
D
emonstration. (i) Il suffit de remarquer que
 pZ
1/p
1/p Z
 Z
Z

1
p
p
p
p
inf
.
|g| d
|f | d
|f | d + p |g|
=
[0,1]
p
p
Cette facon de proceder fournit dailleurs la base dune autre demonstration de
linegalite de Holder : on commence par appliquer linegalite du Lemme III-118 avec
a := f (x), b := g(x)/, o`
u > 0 est arbitraire. On int`egre linegalite obtenue par
rapport `a , puis on optimise par rapport au param`etre .
(ii) Sans perte de generalite, on peut supposer que toutes les fonctions fi sont
positives ; linegalite `a demontrer sobtient alors `a partir de linegalite de Holder par
recurrence.
(iii) Par homogeneite, on peut supposer que
Z
F (x, y) d(x) = 1,
y Y,
X

auquel cas linegalite `a etablir est


Z

Z
log F (x, y) d(y) d(x) 1.
exp
X

Cest alors une consequence immediate de linegalite de Jensen pour la fonction


convexe log et pour la mesure de probabilite , combinee avec le theor`eme de
Fubini.
Les enonces (iv), (v) et (vi) se demontrent sans difficulte en adaptant la preuve de
linegalite de Holder ou en sy ramenant, par exemple en ecrivant que hf, giE E

kf kE kgkE .
Remarque III-80. Pour comprendre en quoi lenonce (iii) est une variante de
linegalite de Holder dans le cas o`
u les fonctions f et g sont strictement positives, il
suffit de poser Y := {0, 1}, := (1/p)0 +(1/q)1 , F (x, 0) := f (x)p , F (x, 1) := g(x)q .
En fait, on peut facilement se convaincre que lenonce (iii) est une limite continue
de lenonce (ii). Lenonce (iii) nest pas tr`es utile en pratique, son principal interet
pour nous est de mettre en evidence un lien etroit entre les inegalites de Holder et

132

CHAPITRE III

(13 juin 2010)

de Jensen. Lenonce (iv) quant `a lui a le merite de montrer que linegalite de Holder
est vraie dans un cadre beaucoup plus general que celui de lintegration ; noter que
linegalite de Holder correspond au cas o`
u Y est reduit `a un point.
III-4.5. In
egalit
es entropiques. Linegalite de Holder fait intervenir des puissances des fonctions en jeu, ce qui est largement suffisant pour la majorite des
probl`emes. Cependant, il arrive que lon consid`ere, par commodite ou par necessite,
dautres fonctions. Cest le cas en particulier quand on etudie lentropie dune fonction positive :
D
efinition III-81 (entropie). Soient (X, ) un espace mesure et f : X R+
{+} une fonction positive. On appelle entropie de f par rapport `a la quantite
Z
S (f ) :=
f log f d.
X

On appelle information de Kullback de f par rapport `a la quantite


Z
H(f |) :=
(f log f f + 1) d.
X

Remarque III-82. La fonction f 7 f log f f + 1 est positive, et donc linformation de Kullback toujours positive, alors que lentropie peut prendre nimporte
quel signe.
En physique statistique, si f est une densite de probabilite par rapport `a la mesure := L, mesure de Lebesgue sur Rn , on appelle S (f ) lentropie de Boltzmann ;
en theorie de linformation, on appelle S (f ) lentropie de Shannon.R Par ailleurs,
R
linformation de Kullback concide avec loppose de lentropie d`es que f d = d,
ce qui est tr`es souvent le cas. Dans chacun de ces domaines, lentropie joue un role
fondamental. Linegalite suivante remplace alors linegalite de Holder :
Th
eor`
eme III-83 (inegalite de convexite pour lentropie). Soit (X, ) un espace
de probabilite, et soient f, g : X R+ {+} deux fonctions mesurables positives.
Alors,
Z
Z
Z
f g d

(f log f f + 1) d + log

eg d.

D
emonstration
du Th
eor`
eme III-83. Par homogeneite, on peut se ramener
R
au cas o`
u eg d = 1, et il sagit alors de prouver que
Z
Z
f g d (f log f f + 1) d.

Pour cela on ecrit linegalite de Young logarithmique ci-dessus avec a := f (x),


b := g(x), et on lint`egre contre . Il vient
Z
Z
Z
f g d (f log f f + 1) d + (eg 1) d,
R
et la derni`ere integrale sannule car eg = 1 et est une mesure de probabilite. 

Une autre question naturelle que lon peut se poser est la facon dont lentropie
se compare aux fonctions definies par des puissances. On ne peut bien s
ur esperer
controler par lentropie aucune puissance de f strictement superieure `a 1. Linegalite
suivante, dite de Csisz
ar-Kullback-Pinsker, que nous abregerons en CKP, repond
de mani`ere assez precise `a cette question.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

133

or`
The
eme III-84 (inegalite CKP). Soit (X, ) un espace de probabilite, et soit
f une densite de probabilite, i.e. f est une mesure de probabilite sur X. Alors
s Z
Z
|f 1| d 2 (f log f f + 1) d.
X

D
emonstration. Par formule de Taylor avec reste integrale,
Z 1
(1 t) dt
2
.
f log f f + 1 = (f 1)
0 1 + t(f 1)

La mesure etant finie, on est en droit dappliquer le theor`eme de Fubini, do`


u

Z
Z
Z 1
2
(f 1)
d dt.
(f log f f + 1) d =
(1 t)
0
X 1 + t(f 1)

Par inegalite de Cauchy-Schwarz, pour tout t [0, 1],


Z
2 Z
 Z
 Z
(f 1)2
(f 1)2
|f 1| d
d
(1 + t(f 1)) d =
d,
X 1 + t(f 1)
X 1 + t(f 1)
puisque et f sont toutes deux des mesures de probabilite. On conclut que
Z 1
 Z
2 Z
(1 t) dt
|f 1| d (f log f f + 1) d,
0

ce qui est equivalent `a la conclusion souhaitee.

III-5. Equi-int
egrabilit
e et tension
Cette section pourra etre omise en premi`ere lecture.

III-5.1. Equi-int
egrabilit
e. On dit quun ensemble F de fonctions definies sur
un espace metrique est equicontinu sil admet un module de continuite uniforme :
pour tout > 0 il existe > 0 tel que pour tous x, y distants dau plus , les
images f (x) et f (y) soient distantes dau plus , et ce pour tout f F ( est donc
independant de f ). Ce concept joue un role important, par exemple dans letude de
la compacite dans des espaces de fonctions continues. Bien evidemment, si F est
equicontinu, alors tout f F est uniformement continu ; et la reciproque est fausse.
En theorie de la mesure, un concept analogue est lequi-integrabilite :
D
efinition III-85. Soit (X, ) un espace mesure.
(i) On dit quun ensemble F de fonctions f : X R est equi-integrable si pour
tout > 0 il existe > 0 tel que
Z
(23)
[A] =
f F ,
|f | d .
A

(ii) On dit que F est equi-integrable a` linfini si pour tout > 0 il existe une
partie Y X, de mesure finie, telle que
Z
|f | d .
(24)
f F ,
X\Y

Lequi-integrabilite se prouve le plus souvent grace au crit`ere suivant :

134

CHAPITRE III

(13 juin 2010)

Proposition III-86. Soient (X, ) un espace mesure, et F un ensemble de


fonctions mesurables de X dans R, tel que
Z
sup |f | d < +.
f F

Alors
(i) F est equi-integrable si et seulement si il existe une fonction : R+ R+ ,
telle que
Z
(r)
(25)
lim
(|f |) d < +.
= +
et
sup
r r
f F X

En outre, sans perte de generalite, on peut choisir la fonction convexe et reguli`ere.


(ii) F est equi-integrable `a linfini sil une fonction : X R+ telle que
Z
|f | d < +.
r > 0,
[{ r}] < +;
sup
f F

D
emonstration. CommencRons par la propriete (i). Supposons (25) realise, et
soit > 0. On pose I := supf F (|f |)|, d, et on choisit R assez grand pour que

C
(r)
.
r
2
On pose ensuite := /(2R). Alors, pour tout f F ,
Z
Z
Z

|f | d
(|f |) d .
2C |f |R X
2
|f |R
r R =

Donc, pour tout ensemble A de mesure [A] et pour tout f F ,


Z
Z

|f | d + R[A] + ;
|f | d +
2
2
2 2
A{|f |R}
A

et
R F est bien equi-integrable. (Cette implication nutilise pas la borne sur les integrales
|f | d.)
R
Reciproquement, supposons que F est equi-integrable, et |f | d C. Par
linegalite de Chebyshev, pour tout N 1 on a
R
|f | d
C
[{|f | N}]
.
N
N
Pour > 0, soit comme dans (23), et N tel que C/N . Alors on a, pour tout
f F,
Z
|f | d .
|f |N

En consequence,

> 0,

N() 1;

f F ,

|f |N ()

|f | .

On pose N0 = 0 et on construit par recurrence une suite dentiers (Nk )k1 tels que
pour tout k 1,
Z
2k .
Nk > 2Nk1,
et
sup
f F

|f |Nk

THEOR
EMES
FONDAMENTAUX DINTEGRATION

135

La suite (Nk )kN tend bien s


ur vers linfini, et pour tout x 0 il existe un nombre
fini dindices k tels que Nk x. On definit
X
(x) := x
k.
Nk x

Il est clair que (x)/x + quand x . Dautre part, pour tout f F on a


Z
Z
X Z
X
X
k d =
k
|f |1|f |Nk d
k2k < +.
(|f |) d =
|f |
X

|f |Nk

kN

kN

En particulier, les quantites (|f |) d sont bien majorees uniformement pour f


F.
La fonction ainsi construite est affine par morceaux, et discontinue. On definit
c comme son enveloppe affine continue, i.e. la plus grande fonction affine par
morceaux et continue qui minore f , obtenue en joignant les points (Nk , (Nk )).
Sur lintervalle [Nk , Nk+1 ] cette fonction varie dune quantite kNk+1 (k 1)Nk , sa
pente est donc
kNk+1 (k 1)Nk
Nk
pk =
=k+
.
Nk+1 Nk
Nk+1 Nk
Par construction, Nk+1 > 2Nk , donc Nk /(Nk+1 Nk ) < 1. On a donc k pk < k + 1,
ce qui montre que la suite pk est strictement croissante, et la fonction c est donc
convexe.
Pour conclure, il suffit de verifier quon peut trouver une fonction convexe positive
, de classe C , telle que c 1 . Cest un simple exercice qui est laisse
au lecteur.
On passe ensuite `a la partie (ii),
R qui est plus simple. Cette partie nutilise pas non
plus la borne uniforme sur les |f | d. Soit
R F un ensemble de fonctions verifiant
la condition indiquee, on pose C = sup{ |f | d; f F }. Soient r = C/ et
Ar := {x; > r}. Pour tout f F , on applique linegalite de Chebyshev `a la
fonction et `a la mesure |f | :
Z
C
|f | d
.
r
Ar
Puisque Ar est de mesure finie, lensemble F est bien equi-integrable `a linfini.
Reciproquement, supposons que F est equi-integrable `a linfini. Par recurrence,
on
une suite croissante densembles Yk , de mesure finie, tels que
R peut construire
k
|f
|
d

2
pour
tout f F . Posons Y = Yk . Si f F est fixe, on a par
X\Yk
convergence monotone
Z
Z
|f | d = 0.
|f | d = lim
X\Y

X\Yk

Il sensuit que f est nul presque partout en-dehors de Y .


On pose
X
=
k1Yk .
kN

En outre on definit (x) = + sur X \ Y . Si (x) k, alors x nappartient `a aucun


des Yj pour j > k, et nappartient pas non plus `a X \ Y ; x appartient donc `a Yk , qui

136

CHAPITRE III

(13 juin 2010)

est un ensemble de mesure finie. Autrement dit, lensemble { < k} est de mesure
finie. Dautre part, pour tout f F ,
Z
Z
X Z
X k
f d =
f d =
k
|f | d
< +.
2k
X
Y
Ak
kN


On sait bien quune fonction continue sur un espace metrique compact X est
automatiquement uniformement continue, et que donc un singleton dans C(X) est
equicontinu (ce qui revient `a dire quun singleton est compact !) Un theor`eme analogue est valable dans le cadre de lequi-integrabilite :
Proposition III-87. Soit f une fonction sommable dans un espace mesure
(X, ). Alors f est uniformement integrable, au sens o`
u lensemble {f } est equiintegrable, et equi-integrable `a linfini.
D
emonstration. Soit fM := max(M, min(f, M)) (on tronque f aux hauteurs
M et M). Par convergence dominee,
Z
(M) :=
|fM f | d 0.
|f |M

Il sensuit que, pour toute partie mesurable A avec [A] ,


Z
Z
|f | d
|fM | d + (M) M + (M).
A

Si > 0 est donne, on choisit donc M assez grand pour que (M) /2, et
= /(2M). Ceci prouve lequi-integrabilite.
Pour obtenir lequi-integrabilite `a linfini, si > 0 est donne, on pose Ak = {x
X; |f (x)| k 1 }. Linegalite de Chebyshev entrane que Ak est de mesure finie
pour tout k. Dautre part, la fonction |f |1|f |<k1 converge vers 0 partout, et elle est
majoree par la fonction integrable |f |. Donc, par convergence dominee,
Z
Z
|f | d = 1|f |<k1 |f | d 0.
k

X\Ak

On peut donc trouver k assez grand pour que cette quantite soit majoree par . 
Remarque III-88. Ce resultat, de demonstration simple, est conceptuellement
subtil ! ! Il entrane que si une fonction f est integrable, alors il existe une fonction
positive, avec (r)/r , telle que
Z
(|f |) d < +.
X

En un certain sens, si une fonction est integrable, alors elle est un petit mieux
quintegrable... !
Remarque III-89. Nous verrons au Chapitre VII que lequi-integrabilite est
associee `a un crit`ere de compacite, ce qui est en accord avec le fait que cette propriete soit automatiquement verifiee par les singletons, ou plus generalement par les
ensembles finis.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

137

III-5.2. Tension. La tension est lanalogue naturel de la propriete dequi-integrabilite


quand on parle de familles de mesures sur une -alg`ebre donnee, et non plus de
familles de fonctions integrables sur un espace mesure. Elle sexprime en termes
densembles compacts et non en termes densembles de mesure finie.
D
efinition III-90. Soient X un espace topologique, muni de sa tribu borelienne,
et M un ensemble de mesures de Borel sur X. On dit que M est tendu si, pour tout
> 0 on peut trouver un compact K dans X tel que
sup [X \ K ] .

Il est clair que cette notion nest pas compl`etement sans rapport avec lintegrabilite
`a linfini : d`es que les compacts sont de mesure finie, la tension dune famille de mesures de la forme f , o`
u F est une famille de fonctions positives -integrables,
implique son equi-integrabilite `a linfini. Il y a une formulation equivalente de la
tension, tr`es semblable `a celle de lequi-integrabilite `a linfini :
Proposition III-91. Soient X un espace metrique, muni de sa tribu borelienne,
et M un ensemble de mesures de Borel sur X. Alors M est tendu si et seulement
si il existe une fonction : X R+ , tendant vers linfini `a linfini, au sens o`
u pour
tout r > 0 il existe un compact Kr tel que x
/ Kr = (x) r, et telle que
Z
sup
d < +.
M

En outre, si X est localement compact, on peut sans perte de generalite choisir la


fonction continue.
D
emonstration. Supposons
R lexistence de tendant vers linfini `a linfini, et
telle que pour tout M, d C. On pose r = C/ : par inegalite de
Chebyshev,
[{ r}] C/r = .

Soit Kr comme dans lenonce ; on a alors X \ Kr { r}, do`


u [Kr ] .
Reciproquement, soit M un ensemble tendu. Par recurrence, on peut construire
une suite croissante de compacts Kn tels que pour tout M,
[Kn ] 2n .

P
On pose alors = n1X\Kn , et on effectue un raisonnement similaire `a celui de la
demonstration de la Proposition III-86(ii).
La derni`ere assertion (on peut choisir continue si X est localement compact)
est laissee en exercice.

III-6. Produits infinis
Cette section pourra etre omise en premi`ere lecture. La theorie de la mesure dans
des produits infinis a une importance considerable en theorie des probabilites. Avec
le materiel de la section III-2, nous sommes en mesure de demontrer les principaux
resultats de ce sujet.

138

CHAPITRE III

(13 juin 2010)

III-6.1. Tribu et topologie dun produit infini. Commencons par rappeler la definition de la tribu produit dans le cas dun produit infini (pas forcement
denombrable) despaces mesures.
D
efinition III-92 (cylindre). Soit T un ensemble arbitraire
Q et (Xt )tT une famille densembles indexes par
Q le param`etre T ; on pose X = Xt . Pour toute partie
finie F T , on pose XF = tF Xt . Pour tout sous-ensemble AF de XF , on definit
le cylindre CF (AF ), note abusivement C(AF ), par


C(AF ) = (xt )tT ; (xt )tF AF .
Remarques III-93. Comme dans le langage courant, un cylindre nest pas
forcement un pave. Dautre part, le concept na dinteret que pour un ensemble
dindices infini : si T est fini, alors tout ensemble mesurable est un cylindre.

D
efinition III-94 (tribu produit infini). Soit T un ensemble arbitraire et (X
Qt , At )tT
une famille densembles mesurables, indexes parQ
le param`etre T ; on pose X = Xt .
Pour toute partie finie F T , on pose XF = tF Xt , que lon munit de la tribu
produit. Pour toute partie mesurable AF de
Q XF , on appelle C(AF ) le cylindre mesurable de base AF . Si AF est de la forme tF At , avec At At , on dit que C(AF )
est un cylindre mesurable produit.
On definit alors la tribu produit sur X comme la tribu engendree par les cylindres
mesurables, ou de mani`ere equivalente comme la tribu engendree par les cylindres
mesurables produits.
Cette definition est formellement analogue `a celle de la topologie produit.
D
efinition III-95 (topologie produit infini). Soit T un ensemble arbitraire et
(Xt , AQ
es parQ
le param`etre T ; on pose
t )tT une famille densembles mesurables, index
X = Xt . Pour toute partie finie F T , on pose XF = tF Xt , que lon munit
de la topologie produit. Pour tout ouvert OQ
F de XF , on appelle C(OF ) le cylindre
ouvert de base OF . Si OF est de la forme tF Ot , o`
u chaque Ot est un ouvert de
Xt , on dit que C(OF ) est un cylindre ouvert produit.
On definit alors la topologie produit sur X comme la topologie engendree par les
cylindres ouverts, ou de mani`ere equivalente comme la topologie engendree par les
cylindres ouverts produits.
Remarques III-96.
(i) Soit C(AF ) un cylindre produit ; alors cest lintersection des cylindres C(At ) pour t F . Aussi bien les tribus que les topologies etant stables par intersection finie, on pourrait donc, dans les definitions
precedentes, se limiter `a des familles F ne contenant quun element.
(ii) Soit S T ; pour tout s S on se donne As une partie
Q mesurable (resp.
ouverte) de Xs . En general, on ne peut rien dire de AS = sS As . Si la famille
S est d
enombrable et les As sont mesurables, alors AS est mesurable. Si la
famille S est finie et les As sont ouverts, alors AS est ouvert.
(iii) Si t T , on peut definir un operateur de projection t qui `a x X associe
xt ; et si F est une partie finie de T , on peut definir un operateur de projection
F , qui `a toute partie de (Xt )tT associe par restriction une partie de (Xt )tF .
La tribu produit est alors la plus petite tribu qui rende mesurables toutes
les applications F , ou, de mani`ere equivalente, la plus petite tribu qui rende
mesurable toutes les applications t . De meme, la topologie produit est la plus
grossi`ere topologie qui rende continues toutes ces applications.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

139

La tribu produit sera lobjet de la suite de ce chapitre.


III-6.2. Produit infini de mesures. Dans le Chapitre I, nous avions prouve
le Theor`eme I-75 uniquement dans le cas particulier o`
u les espaces consideres etaient
de cardinal fini. On va maintenant proposer une demonstration dans le cas general.
On pourra consulter [Dudley, p. 257-259] pour une variante.
or`
The
eme III-97 (produit denombrable de mesures). Soient (Xk , k )kN une
famille despaces mesures, tels que
Y
k [Xk ] < +.
k1

Q
Alors il existe une unique mesure sur X := Xk telle que pour tout n 1, et
pour toutes parties mesurables Ai de Xi , 1 i n,
Y
Y
[A1 . . . An
Xi ] = 1 [A1 ] . . . n [An ]
i [Ai ].
in+1

in+1

On a alors, pour toutes parties mesurables Ak de Xk ,


Y
Y
[ Ak ] =
k [Ak ].
2

Exemple III-98. Soit (dx) = (2)1/2 ex /2 dx la mesure gaussienne standard


sur R. On peut definir la mesure gaussienne standard n sur Rn par n = n , mais
aussi la mesure gaussienne standard = sur R (que lon peut identifier `a
2 ).
ore
`me III-97. Si A1 , . . . , An sont des parties mesuD
emonstration du The
rables de X1 , . . . , Xn respectivement. On note C lensemble des cylindres produits :
C(A1 . . . An ) = {x X; i n, xi Ai }.

Il est facile de verifier que C engendre la tribu produit, est stable par intersection
finie, et que le complementaire de tout element de C est une reunion finie disjointe
delements de C. Comme [X] < +, le Theor`eme I-71(i) garantit lunicite du
prolongement eventuel. Pour prouver lexistence de ce prolongement, en vertu du
Theor`eme I-71(iii) il suffit de verifier la -additivite de sur C.
Soient donc C un cylindre produit, et (Ck )kN une famille de cylindres produits ;
on suppose
Pqueles Ck sont disjoints et dunion egale `a C, et on cherche `a montrer que

[C] = k [Ck ]. Quitte `a restreindre chaque mesure k `a la k-`eme composante


de C, on peut supposer que le cylindre C est lespace tout entier ; on fera cette
hypoth`ese dans la suite.
Supposons par labsurde que
X
(26)
[Ck ] < [X].

Sans perte de generalite, on supposera tous les Ck non vides.


Un cylindre produit (ou pave) Ck etant donne, on definit son ordre comme le plus
petit entier K tel que Ck secrive sous la forme C(A1 , . . . , AK ) ; et sa composante
dordre comme A . On verifie facilement, grace `a lexistence de la mesure produit
1 . . .K , que pour tout K, est -additive sur
des cylindres dordre
P lensemble
inferieur ou egal `a K. En particulier, la relation
[Ck ] < [X] implique quil
y a des Ck dordre arbitrairement grand. Il est egalement clair que la mesure de la
projection dun cylindre est au moins egale `a la mesure du cylindre lui-meme.

140

CHAPITRE III

(13 juin 2010)

La mesure de lunion des cylindres Ck dordre 1 est la somme des mesures de


ces cylindres, strictement inferieure `a [X]. Soit Z1 le complementaire de lunion
des bases de ces cylindres : cest un sous-ensemble mesurable, de mesure 1 > 0. il
est recouvert par les cylindres dordre 2 ou plus, et Q
la somme des mesures de ces
cylindres est strictement inferieure `a M2 1 , o`
u M2 = j2 j [Xj ]. (sinon (26) serait
contredit).
Chaque cylindre Ck secrit comme un produit infini de Ajk pour j N, Ajk Aj .
Soit, pour x1 Z1 ,
Y

X
1 (x1 ) :=
j [Ajk ]1x1 A1k .
k=1 j=2

La fonction 1 est mesurable, et son integrale vaut


Z
Y

X
1 =
j [Ajk ]1 [A1k Z1 ].
Z1

k=1 j=2

Pour tout pave Ck dordre 1,RA1k Z1 = ; et pour tout pave Ck dordre 2 ou plus,
A1k Z1 . On en deduit que Z1 1 vaut la somme des mesures des paves dordre 2
ou plus. En particulier,
Z
1 (x1 ) d1(x1 ) < 1 [Z1 ] = M2 1 .
Z1

Q
Il existe donc au moins un x1 dans Z1 tel que 1 (x1 ) < M2 = j2 j [Xj ]. On
1

decompose chaque pave CkQdont la premi`ere projection contient


Qx1 , en Ak Ck . Les

Ck recouvrent alors X := j=2 Xj , et, si lon note [Ck ] = j=2[Ak ], on trouve

[Ck ] < [X ].

k=1

On note que les composantes dordre des Ck sont exactement les composantes
dordre + 1 des Ck , et que x1 a ete construit de telle sorte quil nest premi`ere
composante daucun cylindre Ck dordre 1. En particulier, il est equivalent de dire
que (x1 , x2 ) appartiennent aux deux premi`eres composantes dun des cylindres Ck ,
ou de dire que x1 appartient `a la premi`ere composante de Ck , que Ck se decompose
en A1 Ck , et que x2 appartient `a la premi`ere composante de Ck .
On peut alors recommencer le meme raisonnement avec X et les Ck en place
de X et des Ck ... Par recurrence, on construit une suite x = (x1 , x2 , . . .) telle que
pour tout K, (x1 , . . . , xK ) ne sont les K premi`eres composantes daucun cylindre
dordre K. Comme x appartient necessairement `a lun des cylindres Ck , on aboutit
`a une contradiction. Ceci ach`eve la preuve de lexistence de .
La derni`ere assertion de lenonce sobtient
Q sans peine par -additivit
Q e, si lon
note que les ensembles A1 . . . An jn+1 Xj decroissent vers
Ak quand
n , et que [X] < +.

Pour generaliser ce resultat `a un produit infini quelconque densembles mesures
Xt , il est naturel dimposer des conditions plus fortes sur les mesures des Xt ; par
exemple, pour que ce produit ne soit ni 0 ni +, il est necessaire quau plus une
infinite denombrable des nombres t [Xt ] soit differente de 1. Il est donc naturel,
dans ce cadre general, dimposer toutes ces mesures egales `a 1, autrement dit de se
restreindre `a des espaces de probabilites.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

141

or`
The
eme III-99 (produit infini de mesures de probabilites). Soient T un ensemble quelconque,
Q et (Xt , At , t )tT une famille despaces mesures de probabilites ;
on pose X :=
Xt , et on le munit de la tribu produit. Pour toute famille finie
F T , et pour toute famille densembles mesurables AF = (At )tF , on definit le
cylindre produit de base AF , note CF (AF ), ou par abus de notation C(AF ), par


C(AF ) := x X; t F, xt At .
Alors il existe une unique mesure de probabilites sur X telle que pour toute famille
finie F T , et tout cylindre produit C(AF ), on ait
Y
t [At ].
[C(AF )] =
tF

EnQdautres termes, si F designe la projection de XT dans XF =


F = tF t , alors pour toute famille finie F T on a

tF

Xt , et

(F )# = F .

En outre, si pour chaque t T on se donne une famille Ft qui engendre la tribu


At , alors est caract
Q erisee par les valeurs quelle attribue aux cylindres produits
C(AF ) pour AF tF Ft .

D
emonstration. La preuve de lunicite est facile : les cylindres dont la base
est choisie parmi les produits delements de Ft (t F ) engendrent les cylindres
dont la base est choisie parmi les produits delements de At , grace `a la partie (ii)
du Theor`eme III-55 (noter que chaque Xt est de mesure finie) ; on en deduit que ces
cylindres particuliers suffisent `a engendrer toute la tribu produit, et lunicite decoule
du resultat dunicite dans le Theor`eme I-69.
Pour demontrer lexistence, il nous suffit encore une fois de verifier la -additivite
sur les cylindres produits. Comme cette propriete ne concerne quune famille denombrable
de cylindres, dont la definition ne fait intervenir quune famille denombrable dindices
t, on peut toujours, quitte `a changer les notations, supposer que T est denombrable.
La -additivite est alors une consequence du Theor`eme III-97.


Quand le nombre de variables dintegration est infini, la signification meme dun


enonce du type du Theor`eme de Fubini nest pas tr`es claire ; on conserve cependant linvariance par permutation et/ou regroupement des variables, ce que traduit
lenonce suivant, assez abstrait. Sa preuve est une consequence presque immediate
de lunicite dans le Theor`eme III-99.
Proposition III-100 (invariance de lintegrale produit par permutation ou regroupement des variables). Soient T un ensemble arbitraire, et (Xt , t )tT une famille despaces de probabilites.
(i) Soient T un ensemble en bijection avec T , et une application bijective de T
dans T ; induit Q
alors par permutation
des coordonnees un isomorphisme despaces
Q
mesurables entre tT Xt et t T X(t ) , de telle sorte que
Y
Y
#
(t ) =
t .
t T

tT

142

(ii) Si T =

CHAPITRE III
Q

sS (

tTs

Xt ), alors
Y

t =

tT

Y
sS

tTs

(13 juin 2010)

t .

Un exemple simple dapplication de la r`egle precedente est


!
Y
Y
k ,
k = 1 2 . . . N
kN +1

kN

o`
u lon a decompose le produit infini en N + 1 facteurs ; on peut alors appliquer le
theor`eme de Fubini `a ces facteurs, en les permutant, etc.
III-6.3. Approximation cylindrique. Il nest pas facile en general de se
representer les elements de la tribu produit infini, et on cherche le plus souvent
`a se ramener par approximation `a un nombre fini de variables.
Th
eor`
eme III-101 (approximation cylindrique pour
Q la mesure produit). Soit
(Xn )nN une famille despaces mesures ; on munit X = Xn de la tribu produit, et
on se donne une mesure finie sur X. Alors, pour toute partie mesurable A de X
il existe une suite (Cn )nN de cylindres tels que
(27)

[Cn \ A] + [A \ Cn ] 0.
n

D
emonstration. Soit C lensemble des parties mesurables A de X telles quil
existe une suite (An )nN de cylindres satisfaisant (27). Il est clair que C contient les
cylindres ; pour conclure il nous suffit de montrer que cest une tribu.
Le complementaire dun cylindre etant un cylindre, il est evident que C est stable
par passage au complementaire. De meme, lunion de deux cylindres etant un cylindre, C est stable par union finie. Soit maintenant (Ak )kN une suite delements de
C, et A leur union. Soit > 0, notre but est de prouver quil existe un cylindre C
tel que
[C \ A] + [A \ C] .
Puisque est finie, par -additivite il existe N tel que
h
i
A \ (1kN Ak ) /2.
Dautre part, puisque C est stable par union finie, il existe un cylindre C tel que
h
i
h
i
k
k
C \ (1kN A ) + (1kN A ) \ C /2.
On en deduit la conclusion souhaitee.

III-6.4. Lois du 0-1. Les lois du 0-1 concernent des probabilites definies sur
des produits infinis, et enoncent que dans certaines circonstances, la probabilite de
certains evenements est forcement triviale. Il y a deux lois du 0-1 cel`ebres ; la
plus connue est celle de Kolmogorov, lautre est celle de Hewitt et Savage. Nous
allons deduire la premi`ere de la seconde. Nous aurons besoin de quelques definitions
preliminaires pour les enoncer.
D
efinition III-102 (permutation finie). Soit : N N une bijection ; on dit
que est une permutation finie sil ny a quun nombre fini dentiers j tels que
(j) 6= j.

THEOR
EMES
FONDAMENTAUX DINTEGRATION

143

D
efinition III-103 (ensemble symetrique). Soit X un ensemble quelconque ;
une partie A X N est dite symetrique si pour toute permutation finie ,
(xn )nN A

(x(n) )nN A.

D
efinition III-104 (tribu asymptotique). Soit
Q (Xn )nN une suite despaces mesurables. On definit la projection n , de X := Xk dans Xn , par restriction. On
definit Am comme la plus petite tribu qui rende mesurables toutes les applications n
pour n m. On definit la tribu asymptotique, A , comme lintersection de toutes
les tribus Am .
Remarque III-105. Intuitivement, la tribu asymptotique est celle qui rassemble
tous les ensembles dont la definition peut sexprimer en fonction de variables dordre
arbitrairement grand.
Exemples III-106. On pose X = R+ , de sorte que X N estPlensemble des
suites reelles positives. Lensemble des suites (xn ) pour lesquelles
nxn = 1 nest
pas symetrique. Lensemble des suites (xn ) dont la somme vaut 1 est un ensemble
symetrique, mais non mesurable pour la tribu asymptotique : sa definition fait intervenir la valeur x1 . Lensemble des suites qui convergent, ou lensemble des suites
qui convergent vers 1, ou lensemble des suites dont la somme converge, sont des
ensembles symetriques et mesurables pour la tribu asymptotique.
Dans tous les exemples precedents, les ensembles asymptotiques se trouvaient
egalement etre symetriques. La proposition suivante assure que cest la r`egle.
Proposition III-107 (asymptotique implique symetrique). Soit X un espace
mesurable, et soit A un ensemble mesurable pour la tribu asymptotique sur X N .
Alors A est symetrique.
D
emonstration. On note, comme ci-dessus, An la plus petite tribu qui rende
mesurable les projections m pour m n ; de mani`ere equivalente, cest la tribu
engendree par les cylindres
C(m, B) := {x X N ; xm B},
o`
u m n et B decrit lensemble des parties mesurables de X.
Pour prouver la Proposition III-107, il suffit de montrer que si A An , alors A est
invariant par les permutations finies qui naffectent que les entiers {0, . . . , n1}. Soit
donc C lensemble des parties de An qui sont invariantes par de telles permutations.
Il est clair que A laisse invariants tous les cylindres C(m, B) ; il suffit donc de verifier
que C est une alg`ebre.
Soit A C, et soit une permutation naffectant que les entiers {0, . . . , n}. Si
x X \ A, alors x
/ A, do`
u (x)
/ A, i.e. (x) X \ A. De meme, si x
/ X \ A,
alors (x)
/ X \ A. On voit donc que X \ A C.
Soit (Ak )kN une suite delements de C, et soit une permutation naffectant que
les entiers {0, . . . , n}. Si x (Ak ), alors il existe k tel que x Ak , do`
u (x) Ak ,
en particulier (x) (Ak ). La reciproque est identique, et on conclut que Ak C.
Lensemble C est bien stable par passage au complementaire et union denombrable,
ce qui ach`eve la preuve.

Nous pouvons maintenant passer aux lois du 0-1 proprement dites.

144

CHAPITRE III

(13 juin 2010)

or`
The
eme III-108 (loi du 0-1 de Hewitt-Savage). Soit (X, ) un espace de probabilite ; on munit X N de la tribu produit, et de la probabilite produit N . Soit A
une partie mesurable symetrique de X N , alors N [A] vaut soit 0, soit 1.
En combinant cet enonce avec la Proposition III-107, on obtient le
Corollaire III-109 (loi du 0-1 de Kolmogorov). Soit (X, ) un espace de probabilite ; on munit X N de la tribu produit, et de la probabilite produit N . Soit A un
element de la tribu asymptotique de X N , alors N [A] vaut soit 0, soit 1.
D
emonstration du Th
eor`
eme III-108. Soit > 0 ; par le Theor`eme III101, il existe un cylindre C tel que
N [A \ C] + N [C \ A] .
Q
Le cylindre C est de la forme B kn+1 Xk , o`
u B est une partie mesurable de X n ;
et N [C] = n [B].
Soit une permutation finie qui echange {1, . . . , n} et {n + 1, . . . , 2n}. On fait
agir sur les elements de X N par permutation des coordonnees. Linvariance de
N par permutation (Proposition III-100) se traduit par
(28)

N [(A) \ (C)] + N [(C) \ (A)] .


Par hypoth`ese (A) = A, do`
u en fait
N [A \ (C)] + N [(C) \ A] .
En combinant cela avec (28), on obtient
N [C \ (C)] + N [(C) \ C] 2.
Autrement dit,
2n [(B X n ) \ (X n B)] + 2n [(X n B) \ (B X n )] 2,
Chacun des deux termes du membre de gauche est egal `a
2n [B (X n \ B)] = n [B]n [X n \ B] = n [B](1 n [B]).
On a donc montre que
n [B](1 n [X n \ B]) .
Posons b := n [B], a := N [A]. On a donc
a(1 a) (b + )(1 b + ) = b(1 b) + + 2 2 + 2 .
En faisant tendre vers 0, on trouve a(1 a) = 0, ce qui conclut la preuve.

Remarque III-110. On peut aussi etablir la loi du 0-1 de Kolmogorov directement, par un argument assez similaire `a celui qui est presente ci-dessus. Il est
egalement possible, mais beaucoup plus delicat, de deduire la loi de Hewitt-Savage
de celle de Kolmogorov [Dudley, p. 272].

THEOR
EMES
FONDAMENTAUX DINTEGRATION

145

III-6.5. Th
eor`
eme de prolongement de Kolmogorov. Pour conclure cette
section sur les produits infinis, demontrons le Theor`eme I-77. Pour le confort du
lecteur, nous allons rappeler son enonce (sous une forme un peu differente mais
equivalente) et le preciser tr`es leg`erement.
or`
The
eme III-111 (theor`eme de prolongement de Kolmogorov). Soit T un ensemble arbitraire, et (Xt )tT une famille despaces Polonais ; on definit
Y
X :=
Xt ,
tT

que lon munit de la tribu produit. Pour toute partie finie F = {t1 , . . . , tK } T ,
on definit XF := Xt1 . . . XtK ; et pour tout Borelien AF de XF , on definit le
cylindre CF (AF ), note abusivement C(AF ), par


C(AF ) := x X; (xt1 , . . . , xtK ) AF .

Pour toute partie finie F de T on se donne une mesure de probabilite F sur XF .


On suppose que les F sont compatibles, au sens o`
u pour toutes parties finies F et
F , et pour tous Boreliens AF et BF de XF et XF respectivement,
C(AF ) = C(BF ) = F [AF ] = F [BF ].
Alors on peut definir une unique mesure de probabilite sur X, telle que pour toute
partie F finie de T , et pour tout Borelien AF de XF ,
[C(AF )] = F [AF ].
Si pour tout t la tribu Borelienne sur Xt est engendree par une famille Ft , alors
est caracterisee par la valeur quelle attribue aux ensembles elementaires, i.e. les
ensembles C(AF ) avec
AF = At1 . . . AtK ,
chacun des At appartenant `a Ft .

Preuve du Th
eor`
eme III-111. On verifie facilement que lensemble A de
tous les cylindres C(AF ) est une alg`ebre, qui contient X. La condition de compatibilite nous permet de definir sur cette alg`ebre, et de prouver quelle y est
additive. Par le Theor`eme I-69, lexistence et lunicite du prolongement de seront
assurees si lon prouve la -additivite de sur A. Pour etablir la fin de lenonce, il
suffit de remarquer que les cylindres elementaires engendrent la tribu compl`ete, et
que tous les espaces Xt sont de mesure finie.
Soient donc A et (Ak )k1 des cylindres, tels que A = Ak ; on doit prouver que
X
[Ak ].
[A] =
k1

Pour tout N, les cylindres A, A1 , . . . , AN peuvent sinclure dans un meme cylindre,


et comme on sait que est -additive sur les cylindres on aura
X
[Ak ] [A].
1kN

En passant `a la limite quand N , on obtient


X
[Ak ] [A].
k1

Notre probl`eme est maintenant detablir linegalite inverse, beaucoup plus delicate.

146

CHAPITRE III

(13 juin 2010)

La definition des cylindres A, Ak , et de leur mesure, ne fait intervenir quune


partie denombrable des espaces (Xt )tT ; quitte `a changer les notations, on peut oublier les autres espaces, et supposer que T est denombrable ; sans perte de generalite
T = {1, 2, . . .}. On definit alors n = F pour F = {1, . . . , n}. La condition de
compatibilite implique bien s
ur que n+1 prolonge n .
On conviendra quun cylindre C est dordre n si n est le plus petit indice tel que
la definition de C ne fasse
Q intervenir que les n premiers espaces Xj . Un tel cylindre
est de la forme B ( jn+1 Xj ) ; on dit alors que B est sa base. En particulier,
[C] = n [B]. On introduit n0 lordre de A, et nk lordre de Ak , pour tout k 1 ;
on definit egalement B comme la base de A, et Bk comme la base de Ak . On pose
enfin X n = X1 . . . Xn .
Lespace X n0 est produit fini despaces Polonais, donc Polonais lui-meme. Par le
Theor`eme de regularite I-54, la mesure n0 est reguli`ere, et en particulier on peut
trouver un compact Kn0 contenu dans B tel que
En particulier,

n0 [Kn0 ] n0 [B] = [A] .

n0 +1 [Kn0 Xn0 +1 ] [A] .


Par regularite de la mesure n0 +1 [K ], on peut trouver un compact Kn0 +1 de
Xn0 +1 , tel que
n0 +1 [Kn0 Kn0 +1 ] [A] 3/2.
Par recurrence, on construit ainsi une famille de compacts Kn Xn , n n0 , tels
que pour tout n
n [Kn0 . . . Kn ] [A] 2.
Le produit infini de ces compacts est un compact K contenu dans A.
De meme, lespace X nk etant Polonais, pour tout k on peut trouver un ouvert
Ok , contenant Bk et tel que
[Ok ] nk [Bk ] + 2k = [Ak ] + 2k .
Q
On definit alors Uk = Ok jnk+1 Xj : cest un cylindre ouvert, qui contient Ak ,
tel que [Uk ] [Ak ] + 2k .
Puisque K A Ak Uk , que K est compact et que les Uk sont ouverts,
on peut extraire des Uk un sous-recouvrement fini, soit U1 , . . . , UN . Leur union est
un cylindre, dordre fini M ; comme ils recouvrent K, ils recouvrent egalement le
cylindre dordre M
CM (K) := Kn0 Kn1 . . . KM XM +1 XM +2 . . .
P
En particulier, [CM (K)] N
k=1 [Uk ]. Mais, par construction,
et

[CM (K)] = M [Kn0 . . . KM ] [A] 2


X
k

On conclut que

[Uk ]

[A]

[Ak ] + .

[Ak ] + 3.

Comme est arbitraire, il sensuit que [A]

[Ak ], ce qui etait notre but. 

THEOR
EMES
FONDAMENTAUX DINTEGRATION

147

Remarque III-112. Comme on la vu, meme si T est un ensemble arbitraire,


on se ram`ene dans la preuve `a ne considerer quune famille denombrable.
On pourra trouver dans [Dudley, p. 441443] une version leg`erement differente de
largument presente ci-dessus, et des hypoth`eses topologiques un peu plus generales,
sans que le gain de generalite soit tr`es appreciable.
Exemple III-113. Le lecteur peut verifier que lenonce du Theor`eme de Kolmogorov implique le resultat suivant, qui permet de fonder la theorie des chanes de
Markov en probabilites :
Th
eor`
eme III-114 (Theor`eme de Ionescu Tulcea). Soient (Xn , An )nN des espaces mesurables. On se donne une mesure de probabilite 0 sur X0 ; et pour tout
n N on se donne une famille de mesures Q
de probabilites xn sur Xn+1 , dependant
mesurablement de xn Xn . On pose X := Xn et on le munit de la tribu produit.

Alors il existe une unique mesure de


Qprobabilite sur X telle que pour tout cylindre
C := A0 A1 A2 . . . An ( jn+1 Xj ) de X,
Z
Z
Z Z
...
dxn1 (xn ) dxn2 (xn1 ) . . . dx1 (x0 ) d(x0).
[C] =
A0

A1

An

An1

Voici maintenant un exemple o`


u lespace T nest pas denombrable.

Th
eor`
eme III-115 (Existence de processus stochastique). Soient T = R+ et X
un espace Polonais, muni de sa tribu borelienne. On se donne une probabilite 0 sur
X, et une famille de mesures (t,x )t0, xX , dependant mesurablement du param`etre
(t, x) R+ X, satisfaisant
Z
s,y ts,x (dy) = t,x
X

pour tous (s, t) in R+ R+ , 0 s t, et pour tout x X. Pour toute famille


finie F = {t0 , . . . , tN }, 0 = t0 t1 t2 . . . tN , pour toutes parties mesurables
A0 , A1 , . . . , AN de X, on defnit le cylindre
CF (A0 , . . . , AN ) = {x X R+ ; k {0, . . . , N}, xtk Ak }.

Alors il existe une unique mesure de probabilite sur X R+ telle que pour tout cylindre
CF (A0 , . . . , AN ),
Z
[CF (A0 , . . . , AN )] =
dt0 (x0 ) dt1t0 ,x0 (x1 ) dt2 t1 (x2 ) . . . dtN tN1 (xN ).
A0 ...AN

En outre, si F est une famille de parties de X engendrant la tribu borelienne,


telle que X est union denombrable dune suite croissante delements de F , alors
est uniquement determinee par sa valeur sur les cylindres CF (A0 , . . . , AN ), o`
u F est
une partie finie arbitraire de T , et les Aj sont des elements arbitraires de F .

Exemple III-116. Lexemple le plus cel`ebre est certainement celui o`


u X = R,
0 = 0 , F est (par exemple) la famille des intervalles compacts, et
Z b |yx|2
e 2t

t,x [[a, b]] =


dy.
2
a
Dans ce cas, la mesure est appelee processus stochastique Brownien sur RR+ :
cest une mesure de probabilite definie sur lensemble de toutes les trajectoires, au
sens de fonctions de R+ dans R.

148

CHAPITRE III

(13 juin 2010)

Le theor`eme precedent est cependant tr`es loin dimpliquer lexistence de la mesure de Wiener : en effet, la probabilite que nous avons construite est definie sur
RR+ ; il est considerablement plus delicat de prouver quelle est en fait concentree
sur lespace C(R+ ) des trajectoires continues.
Appendice : Rappels sur les fonctions convexes
Les fonctions convexes, qui jouent un role aussi important dans des espaces
vectoriels generaux, que les fonctions croissantes sur R. Cest loccasion de faire
quelques rappels sur la theorie des fonctions convexes dans Rn . Le traite de reference
en la mati`ere est [Rockafellar]. On se limitera ici aux fonctions convexes sur Rn ; plus
tard dans le cours, on parlera de convexite dans des espaces plus generaux.
On dit que C Rn est une partie convexe de Rn si, pour tous x, y C, [0, 1],
la combinaison convexe x + (1 y) est un element de C. On dit que : Rn
R {+} est une fonction convexe si, pour tous x, y X, [0, 1],
(x + (1 y)) (x) + (1 )(y).
Du point de vue geometrique, cela veut dire que entre deux points x et y, le graphe
de est situe en-dessous de la corde joignant [x, (x)] et [y, (y)].
n
Il est equivalent
P dimposer que pour tout N N, et tous x1 , . . . , xN R ,
1 , . . . , N 0,
i = 1,
X
X
(
i xi )
i (xi ).

Lensemble des x tels que (x) < + est appele domaine de . Cest un convexe
(qui peut etre ouvert, ferme, ou ni lun ni lautre).
Il est equivalent de dire quune fonction est convexe dans Rn , ou que sa restriction
`a tout segment [x, y] de Rn est convexe.
Une fonction convexe sur Rn est automatiquement continue dans linterieur de
son domaine. En particulier, si elle est `a valeurs dans R, elle est continue sur tout
Rn . Dans le cas o`
u cette fonction prend la valeur +, il est naturel dimposer que
ne soit pas identiquement + ;
soit semi-continue inferieurement. Comme est continue dans linterieur
de son domaine , et vaut + identiquement `a lexterieur, cette hypoth`ese
ne concerne en fait que le bord du domaine. Elle revient `a imposer que
pour tout segment [x0 , x1 ], avec x0 dans linterieur de et x1 , on ait
(xt ) (x1 ) quand t 1, o`
u xt := (1 t)x0 + tx1 .

Si une fonction est donnee par un supremum de fonctions affines, elle est automatiquement convexe et semi-continue inferieurement.
Une fonction convexe nest pas forcement differentiable, mais toujours sousdiff
erentiable : en tout point x de linterieur du domaine de on peut trouver au
moins un vecteur z = z(x) tel que
(29)

y Rn ,

(y) (x) + hz, y xi.

Geometriquement, cette inegalite exprime le fait que le graphe de est situe audessus de lhyperplan (dans Rn+1 ) passant par (x, (x)) et orthogonal au vecteur
(z, 1). Lensemble de tous les z admissibles dans (29) est appele sous-diff
erentiel
de en x, et note (x).

THEOR
EMES
FONDAMENTAUX DINTEGRATION

149

Soit x dans linterieur du domaine de . Si est differentiable en x, alors (x)


contient le vecteur (x) constitue des derivees partielles de en x. En dautres
termes,
y Rn ,
(y) (x) + h(x), y xi.

En fait, (x) ne contient que ce vecteur : (x) = {(x)}. Reciproquement, si


le sous-differentiel au point x se limite `a un singleton z, alors est differentiable en
x, et z = (x).
Soit une fonction deux fois derivable dans un ouvert convexe deRn . Alors
est convexe si et seulement si sa matrice Hessienne 2 est positive sur . Cest le
crit`ere que lon utilise le plus souvent, en pratique, pour verifier la convexite.
Une fonction : Rn R {+} etant donnee, on peut definir sa transform
ee
de Legendre :


(y) := sup hx, yi (x) .
xRn

Comme supremum de fonctions affines, cest une fonction convexe et semi-continue


inferieurement.
Si est une fonction convexe et semi-continue inferieurement, alors
= .

Cest un cas particulier de la dualit


e de Fenchel-Rockafellar. Si est convexe
mais pas semi-continue inferieurement, alors concide avec dans linterieur
et lexterieur du domaine de , mais pas sur le bord de ce domaine. Si nest
pas convexe, alors est lenveloppe convexe de : cest la plus grande fonction
convexe (semi-continue inferieurement) qui minore .
Soit une fonction convexe semi-continue inferieurement. Par definition de la
transformee de Legendre, on a, pour tous x, y Rn ,
hx, yi (x) + (y).

Cette inegalite est appelee in


egalit
e de Young. On a lequivalence
hx, yi = (x) + (y) y (x).
En particulier, si est differentiable en x, alors
hx, (x)i = (x) + ((x)),
et le vecteur (x) est le seul vecteur possedant cette propriete.
Les fonctions et sont inverses lune de lautre : si est differentiable en
x et differentiable en (x), alors ((x)) = x. Cest cette propriete que
lon utilise le plus souvent en pratique pour calculer les transformees de Legendre.
Exercice III-117. Verifier que, pour tout p [1, +[,
|x|p
(x) =
=
p

|y|p
(y) = ,
p

p =

p
.
p1

Cette identite est vraie dans R ou plus generalement dans Rn . Verifier egalement
que, sur R+ ,
(x) = x log x x =
(y) = ey .
La proposition qui suit est une consequence immediate de lexercice.

150

CHAPITRE III

(13 juin 2010)

Proposition III-118 (inegalites de convexite de Young pour les puissances).


Soient x, y Rn , p [1, +] et p := p/(p 1). Alors

|x|p |y|p
+ ;
xy
p
p
si p
/ {1, +}, linegalite precedente est une egalite si et seulement si x et y sont

colineaires et |x|p = |y|p , autrement dit |y| = |x|p2x.


Ces resultats sont dusage constant, ce qui motive la definition suivante.
D
efinition III-119 (exposant conjugue). Soit p [1, +] ; on appelle exposant
conjugue de p le nombre p = p/(p 1) 1, caracterise par lidentite
1
1
+ = 1.
p p
Remarque III-120. Lexposant p est tr`es souvent note q, ce qui a linconvenient
de ne pas imposer de lien notationnel avec p ; en outre, en theorie des probabilites,
la convention dusage est q = 1 p... Cest pourquoi on pref`ere ici la notation p
(egalement tr`es courante). Bien s
ur, (p ) = p.

La deuxi`eme partie de lexercice III-117 m`ene `a linegalite suivante, egalement


fort utile.
Proposition III-121 (inegalite de convexite de Young logarithmique). Soient
a, b deux nombres reels positifs. Alors
ab (a log a a + 1) + (eb 1).

CHAPITRE IV

La mesure de Lebesgue
Jusqu`a present, nous avons etudie la theorie de Lebesgue dans le cadre abstrait
developpe par Radon et ses successeurs. Dans ce chapitre et le suivant, nous allons
etudier de plus pr`es des mesures particuli`eres dans lespace Euclidien Rn : la mesure
de Lebesgue dune part ; et ses generalisations appelees mesures de Hausdorff dautre
part. La mesure de Lebesgue est celle que lon utilise couramment, par defaut, dans
Rn , et il est vital, en analyse reelle, detre familier avec ses principales proprietes.
Apr`es avoir explique comment on peut construire la mesure de Lebesgue (i.e.
prouver son existence), nous etudierons quelques-unes de ses proprietes dinvariance
qui expliquent pourquoi elle est si naturelle. Nous verrons ensuite que lintegrale qui
est associee `a la mesure de Lebesgue generalise le concept dintegrale de Riemann.
Puis nous passerons en revue quelques-unes des principales proprietes de lintegrale
de Lebesgue, en particulier la formule de changement de variables. Pour finir, on
sinterrogera sur la mesurabilite au sens de Lebesgue, dun point de vue axiomatique.
IV-1. Construction de la mesure de Lebesgue
La mesure de Lebesgue est celle que lon utilise couramment dans Rn ; lintegrale
qui lui est associee prolonge le concept dintegrale de Riemann. Voici une facon de
la definir.
D
efinition IV-1 (mesure de Lebesgue). Soit n 1 un entier, et B(Rn ) la tribu
borelienne sur Rn .
(i) Il existe sur B(Rn ) une unique mesure n telle que pour tout pave P =
[a1 , b1 ] . . . [an , bn ] Rn , on ait
n
Y
(30)
n [P ] =
(bj aj ).
j=1

Cette mesure est appelee mesure de Lebesgue n-dimensionnelle et notee n , ,


Ln , Ln , ou L. On note egalement
n [A] = |A|n = |A|.

(ii) Si f : Rn R est une fonction borelienne -sommable, on note


Z
Z
Z
n
f (x) dn (x) =
f (x) d x =
f (x) dx
Rn

Rn

Rn

et on dit que f est Lebesgue-integrable. Si n = 1, on note egalement


Z
Z b
Z b
f d1 =
f (x) dx =
f.
[a,b]

152

CHAPITRE IV

(13 juin 2010)

(iii) La completion de n est egalement appelee mesure de Lebesgue ; elle est


definie sur la tribu des ensembles Lebesgue-mesurables, constituee de toutes les
parties E de Rn telles quil existe des ensembles Boreliens A et B tels que
A E B;

n [B \ A] = 0.

Une fonction f : Rn R, mesurable pour cette tribu, est dite Lebesgue-mesurable.


La definition de la tribu completee en (iii) suit celle du Theor`eme I-80 ; on reparlera dans la section IV-5 de la structure des ensembles Lebesgue-mesurables. Pour
linstant, commencons par verifier que la Definition IV-1 est licite, au sens o`
u elle
definit bien la mesure de Lebesgue sans equivoque. La famille des paves est stable
par intersection finie (lintersection de deux paves est un pave), et Rn est lunion
des paves [k, k]n pour k N ; lunicite de la mesure de Lebesgue est donc une
consequence directe du Theor`eme I-71(i). En revanche, etablir lexistence de la
mesure de Lebesgue necessite un peu plus de travail. Comme nous allons le voir, on
peut le faire de plusieurs facons leg`erement differentes ; le resultat dunicite assure
que toutes sont equivalentes. Toutes les methodes presentees ci-apr`es reposent in
fine sur le theor`eme de prolongement de Caratheodory.
IV-1.1. De la dimension 1 `
a la dimension n. Supposons construite la mesure de Lebesgue = 1 sur B(R). On peut alors definir la mesure produit n
sur B(R)n , qui dapr`es la Proposition III-36 nest autre que B(Rn ). Par definition
de la mesure produit, cette mesure verifie (30), cest donc la mesure de Lebesgue.
En conclusion, il est equivalent de construire directement la mesure de Lebesgue en
dimension n, ou de lobtenir par tensorisation successive de la mesure de Lebesgue
en dimension 1. Une autre consequence est lidentite
m n = m+n ,
vue comme une egalite entre mesures definies sur B(Rm+n ).
Dans la suite, on se bornera donc `a construire 1 ; au demeurant il nest pas tr`es
difficile dadapter les preuves pour obtenir des constructions directes de n .
IV-1.2. Via le th
eor`
eme de prolongement de Carath
eodory. Cest la
demonstration qui a dej`a ete presentee dans la section I-6.
IV-1.3. Via le th
eor`
eme dexistence de produit infini. Cette construction
va utiliser un changement de variables mesurable. Il est bien connu que tout
nombre reel dans [0, 1] admet une ecriture binaire,
X
x=
xk 2k ,
xk {0, 1}.
k1

Cette ecriture est unique si lon exclut les nombres dyadiques, i.e. de la forme x =
p/2k , p, k N (on peut conserver 0 et 1). Lapplication ecriture binaire nous
permet de changer la variable x [0, 1] en une variable x {0, 1}N .
Munissons lensemble {0, 1} de la mesure de Bernoulli, i.e. la mesure definie
par
1
1
[{0}] = , [{1}] = .
2
2

LA MESURE DE LEBESGUE

153

Comme cest une mesure de probabilite, on peut considerer son produit tensoriel
infini, N , bien defini par le Theor`eme I-75. On peut alors transporter la mesure
N sur lintervalle [0, 1], via lapplication
X
: (xk )kN 7
xk 2k .
k1

Lensemble des nombres de [0, 1] dont le developpement en base 2 commence par une
suite donnee (x1 , . . . , xk ) est un intervalle de [0, 1] appele intervalle dyadique (de
la forme [p2k , (p + 1)2k ]) ; limage reciproque par dun intervalle dyadique est
donc lunion dun cylindre et dun ou deux points (les nombres dyadiques admettent
deux ecritures differentes). Un point de {0, 1}N est mesurable car intersection de
cylindres, on conclut que limage reciproque dun intervalle dyadique est mesurable.
On verifie aisement que tout intervalle ouvert peut secrire comme reunion dintervalles dyadiques ; la tribu engendree par les intervalles dyadiques est donc la tribu
borelienne tout enti`ere, et est bien mesurable pour la tribu borelienne.
La mesure image
:= # N
est donc bien definie sur la tribu borelienne. Et cest la mesure de Lebesgue sur
[0, 1] ! Pour sen convaincre, il suffit de remarquer que tous les intervalles dyadiques
de la forme [p2k , (p + 1)2k ], ont mesure 2k : en effet, limage reciproque dun tel
intervalle est lunion disjointe dun cylindre de mesure 2k et dun ou deux points,
de mesure nulle (correspondant aux ecritures impopres : les entiers dyadiques
admettent deux ecritures binaires distinctes). Par exemple, limage reciproque de
[1/4, 3/8] est constituee du cylindre (0, 1, 0) {0, 1}N (ecritures propres des nombres
dans [1/4, 3/8[ et ecriture impropre de 3/8), du point (0, 0, 1, 1, 1, 1, 1, . . .) (ecriture
impropre de 1/4) et du point (0, 1, 1, 0, 0, 0, 0, 0, . . .) (ecriture propre de 3/8).
Comme les intervalles dyadiques engendrent la tribu borelienne et que la mesure
que nous venons de definir concide avec la mesure de Lebesgue sur les intervalles dyadiques, elle concide avec la mesure de Lebesgue sur lensemble de tous les boreliens
de [0, 1].
IV-1.4. Via le th
eor`
eme de repr
esentation de Riesz. Une autre facon de
construire la mesure de Lebesgue consiste `a faire appel au Theor`eme de Riesz II-54,
ou meme `a sa version simplifiee II-58. Dans ce cas, la forme lineaire positive que
nous allons considerer est tout simplement lint
egrale de Riemann des fonctions
continues `a support compact dans R. Le th
e
or`
e
me
deR Riesz assure quil existe une
R
mesure sur la tribu borelienne, telle que f d = f (x) dx, pour toute fonction
f continue `a support compact.
Nous allons verifier que est la mesure de Lebesgue ; il suffit de montrer que
attribue `a un intervalle I = [a, b] la mesure b a. Pour cela on se donne > 0 et
on construit deux fonctions continues f et g, `a support compact et `a valeurs dans
[0, 1], telles que
Z
Z
Z
Z
f 1I g,
f d =
f = (b a) ,
g d =
g = (b a) + ,
R

Riem

Riem

o`
u Riem designe bien s
ur lintegrale au sens de Riemann. On en deduit que [I]
est compris entre b a et b a + ; en faisant tendre vers 0 on conclut que
[I] = b a. La mesure est donc bien la mesure de Lebesgue.

154

CHAPITRE IV

(13 juin 2010)

graphe de g
graphe de f
aa

b+

Fig. 1. Fonctions continues approchant 1[a,b]


Remarque IV-2. Lespace euclidien Rn est non seulement localement compact,
mais muni dune structure differentiable : on a une notion de fonctions differentiables,
et meme indefiniment differentiables, sur Rn . Les mesures boreliennes finies sur les
compacts font partie de la grande famille des distributions, qui sont des formes
lineaires sur lespace vectoriel des fonctions indefiniment differentiables et `a support
compact, satisfaisant certaines proprietes de continuite. Un resultat remarquable
stipule que les distributions positives sont exactement les mesures de Borel finies sur
les compacts.
IV-2. Propri
et
es fondamentales de la mesure de Lebesgue
Dans cette section nous allons etablir diverses proprietes importantes et intuitives
de la mesure de Lebesgue, que lon est en droit dexiger de toute notion raisonnable
de volume dans lespace euclidien :
a) le volume est diffus et bien reparti dans lespace ;
b) le volume est invariant par translation, et plus generalement par isometrie ;
c) multiplier les distances par un facteur > 0 entrane une multiplication du
volume par un facteur n ;
d) contracter les distances diminue le volume ;
e) le volume dun parallelepip`ede concide avec son volume algebrique, defini
grace au determinant des vecteurs qui lengendrent.
Pour traduire la propriete a), nous utiliserons la notion de mesure doublante (Definition I-62) ; la propriete souhaitee decoulera alors de c). En chemin, on
reviendra sur la notion de Lebesgue-negligeabilite.
IV-2.1. Invariance par translation. Si P est un pave de Rn et : x x + h
est une translation de vecteur h Rn fixe, il est evident que le produit des longueurs
de P est identique au produit des longueurs de (P ). Ceci, et la construction de la
mesure de Lebesgue, implique immediatement que n est invariante par translation :
# n = n pour toute translation .
Il est interessant de noter que cette propriete caract
erise la mesure de Lebesgue.
n
Du fait de la structure despace affine de R , linvariance par translation est une autre
justification du caract`ere naturel (voire incontournable) de la mesure de Lebesgue.
or`
The
eme IV-3 (caracterisation via linvariance par translation). La mesure de
Lebesgue est, `a multiplication scalaire pr`es, lunique mesure de Borel sur Rn , finie
sur les compacts, qui soit invariante par translation.
D
emonstration. Soit une mesure verifiant le cahier des charges ci-dessus.
Puisque est finie sur les compacts, [C] < +. Soit Ck := [0, 1/k[n ; on peut

LA MESURE DE LEBESGUE

155

recouvrir C par une union disjointe de k n cubes semi-ouverts de rayon 1/k, obtenus
par translation de Ck . Il sensuit que [C] = k n [Ck ]. Les mesures et [C] n
attribuent donc la meme mesure `a tous les cubes semi-ouverts de cote 1/k, et cette
famille suffit `a engendrer la tribu borelienne (Exemple I-11 (ii)). Il sensuit que
= [C] n .

IV-2.2. Passage au quotient. Une consequence presque immediate de linvariance par translation est la possibilite de passer au quotient par un reseau regulier,
par exemple Zn . On definit le tore Tn comme le quotient de Rn par Zn , autrement
dit par la relation dequivalence : xRy x y Zn . Le tore Tn est aussi le produit
de n copies du tore T1 . Cest un espace metrique compact, en bijection naturelle avec
C = [0, 1[n , puisque toute classe dequivalence dans Tn admet un unique representant
dans C. En particulier, Rn = C + Zn : tout element de Rn est obtenu en ajoutant
des coordonnees enti`eres `a un element de C.
On utilise cette bijection f pour identifier Tn et C en tant quespaces mesures :
si est une mesure sur C, on en deduit une mesure f# sur Tn , et reciproquement.
Proposition IV-4 (quotient de la mesure de Lebesgue). La mesure de Lebesgue
n induit par restriction `a C = [0, 1[n une mesure de probabilite sur Tn , invariante
par addition modulo Zn .
D
emonstration. On peut ecrire Rn comme lunion disjointe des Ck , o`
u Ck =
n
n
C + k, et k Z . Pour tout A C, pour tout x R , on peut decomposer A + x
en lunion denombrable disjointe des Bk = Ck (A + x) (seul un nombre fini de ces
ensembles sont non vides). Les ensembles Bk x sont disjoints : si y etait un element
commun `a deux tels ensembles, par difference on trouverait deux indices distincts
k et tels que k soit difference de deux elements de A, ce qui est impossible
puisque A C.
On en deduit que A est lunion disjointe des Bk x. Comme A + x( mod Zn ) est
lunion disjointe des Bk , et que Bk x a meme mesure que Bk , on conclut que A et
A + x( mod Zn ) ont meme mesure.

IV-2.3. Action des homoth
eties. Soit f : x x, avec > 0. Lapplication
f est bijective, et limage dun pave P est un pave f (P ) dont toutes les longueurs
ont ete multipliees par ; il sensuit que le volume de f (P ) est egal `a n fois le
volume de P . Bien s
ur f etablit une bijection entre paves, donc la mesure image de
n par f est exactement la mesure de Lebesgue, `a un facteur n pr`es. (Pourquoi
n et pas n ?) On en deduit que pour tout Borelien A de Rn ,
n [A] = n n [A].
Plus generalement, pour tout R et tout A B(Rn ),
n [A] = ||n n [A].

IV-2.4. R
egularit
e.
Proposition IV-5. La mesure de Lebesgue sur Rn est reguli`ere, et 2n -doublante.
D
emonstration. La mesure de Lebesgue est (bien s
ur) finie sur les compacts
de Rn . Sa regularite decoule donc du Corollaire I-56. Par ailleurs, si on se donne

156

CHAPITRE IV

1
3

(13 juin 2010)

2
4

Fig. 2. Invariance de la mesure de Lebesgue par translation dans


le tore. La somme des aires des quatre morceaux du chat translate
concide avec laire totale du chat initial.
x Rn et r > 0, la boule B2r (x) est obtenue `a partir de Br (x) par homothetie de
rapport 2, donc dapr`es le paragraphe precedent,
n [B[x, 2r]] 2n n [B[x, r]].

IV-2.5. Lebesgue-n
egligeabilit
e. De la definition de la mesure exterieure on
deduit quun ensemble est Lebesgue-negligeable si et seulement si on peut linclure
dans une famille denombrable de paves (ou de cubes) dont la somme des volumes
est arbitrairement petite. En dimension 1, un ensemble est Lebesgue-negligeable si
et seulement si on peut linclure dans une famille de segments dont la somme des
longueurs est arbitrairement petite : cest la definition quutilisait dej`a Lebesgue.
Exemple IV-6. Tout ensemble denombrable est de mesure nulle (ce que lon
peut deduire dailleurs directement de la -additivite et de labsence datomes).
Tout sous-espace affine strict de Rn est de mesure de Lebesgue (n-dimensionnelle)
nulle. De meme pour un ensemble inclus dans une union denombrable dhyperplans.
Remarque IV-7. Meme en dimension 1, il existe des ensembles non denombrables
de mesure nulle ; par exemple lensemble triadique de Cantor.

LA MESURE DE LEBESGUE

157

Voici maintenant deux crit`eres un peu plus sophistiques de negligeabilite :


Proposition IV-8 (les graphes mesurables sont negligeables). Soient D Rn ,
et f : D Rm une application mesurable, avec m 1. Alors le graphe de f est de
mesure de Lebesgue nulle dans Rn+m .
Proposition IV-9 (limage lipschitzienne dun ensemble negligeable est negligeable).
Soient A un borelien de mesure de Lebesgue nulle dans Rn et f : Rm une
application lipschitzienne, o`
u est un ouvert de Rn contenant A. Alors f (A) est
Lebesgue-negligeable, au sens o`
u il est inclus dans un borelien de mesure nulle.
Preuve de la Proposition IV-8. Pour linstant nous nallons faire la preuve
que dans le cas o`
u f est continue ; on verra le cas general plus tard, comme consequence
du theor`eme de Fubini.
Comme Rn est union denombrable de cubes, on peut supposer que D est inclus
dans le cube unite, auquel cas f est uniformement continue. On recouvre ce cube
par N n cubes Ck de cote = 1/N ; on en deduit un recouvrement du graphe de
f par N n paves de la forme Ck Qk , o`
u Qk est un cube de Rm , de cote 2(),
etant le module de continuite de f . La mesure totale de ces paves est exactement
2m ()m, qui tend vers 0 quand 0.

Preuve de la Proposition IV-9. Soit > 0. Recouvrons A par une famille
denombrable de cubes Cj dont la somme des volumes estau plus . Chaque cube Cj ,
disons de cote cj , est inclus
dans une boule Bj de rayon ncj ; f (Cj ) est alors inclus
u k est la constante de Lipschitz de f , et donc
dans une boule de rayon k ncj , o`

dans un cube Cj de cote kncj . Le volume de Cj est au plus (kn)n fois le volume de
Cj , donc f (A) est inclus dans une union de cubes dont le volume est au plus (kn)n .
Il sensuit que f (A) est Lebesgue-negligeable.

La Proposition IV-9 admet un corollaire interessant :
Corollaire IV-10 (Les applications lipschitziennes preservent la Lebesgue
mesurabilite). Soit un ouvert de Rn , et f : Rm une application lipschitzienne. Soit A un ensemble Lebesgue-mesurable de Rn ; alors f (A) est Lebesguemesurable.
Pour apprecier cet enonce, on notera que limage dun ensemble Lebesgue-mesurable
par une application continue na aucune raison detre Lebesgue-mesurable (les images
continues densembles Lebesgue-mesurables ont dailleurs un nom, ce sont les ensembles sousliniens).
D
emonstration du Corollaire IV-10. Par regularite de la mesure de Lebesgue, on peut ecrire A = (Ki ) N, o`
u les Ki forment une famille denombrable
de compacts, et N est Lebesgue-negligeable. Puisque f est continue, les ensembles
f (Ki ) sont tous compacts, donc leur union forme un ensemble borelien. Alors
f (Ki ) f (A) (f (Ki )) f (N);

la Proposition IV-9 implique que f (N) est Lebesgue-negligeable, et il sensuit que


f (A) est Lebesgue-mesurable.

Terminons cette sous-section avec quelques remarques sur la negligeabilite. Les
ensembles Lebesgue-negligeables peuvent etre beaucoup plus complexes que ceux
que nous avons vus jusqu`a present ; un ensemble negligeable peut meme etre gras
au sens de la topologie, cest-`a-dire intersection denombrable douverts denses.

158

CHAPITRE IV

(13 juin 2010)

Exemple IV-11. Soit I = [0, 1] muni de la mesure de Lebesgue, on enum`ere


tous les rationnels de [0, 1] en une suite (qn )nN . Pour tout > 0 on pose
[
O =
B/n2 (qn ).
nN

(O est constitue de lunion de tous les intervalles ouverts de longueur 2/n2 centres
en qn .) Bien s
ur O est ouvert dans I et dense. En outre
 2
X 1

[O ] 2
.
=
2
n
3
nN

Soit alors

A=

O1/k ;

kN

par -additivite on a bien [A] = 0, bien que A soit gras.


Remarque IV-12. Le complementaire de A dans [0, 1] est alors de mesure pleine
bien que maigre, cest-`a-dire union denombrable de fermes dinterieur vide. Cette
construction se generalise facilement en remplacant I par R tout entier, ou Rn ,
ou nimporte quel ouvert de Rn . Cest un debat classique de savoir si la bonne
notion de negligeabilite est celle que fournit la theorie de la mesure, ou celle que
fournit la topologie, et la plupart des mathematiciens se rangent dans un camp ou
dans lautre en fonction de leur sensibilite, de leur experience personnelle, ou des
probl`emes quils ont lhabitude de considerer. (Le Theor`eme KAM en mecanique
classique est un exemple non academique pour lequel ce debat devient important.)
IV-2.6. Action des contractions. Il est intuitif que la contraction des longueurs induit une contraction du volume. Le theor`eme suivant precise cette idee.
or`
The
eme IV-13 (Reduire les distances reduit les volumes). Soit un ouvert
n
de R , et f : Rn une application 1-lipschitzienne :
Alors
(31)

x, y Rn ,

|f (x) f (y)| |x y|.

n [f ()] n [].

Remarque IV-14. Ce qui rend ce theor`eme non trivial est le fait que la mesure
de Lebesgue est definie en termes de mesures de paves, et que lon ne peut pas dire
grand chose de limage dun pave par une application 1-lipschitzienne. Ce sont les
boules qui se comportent bien vis-`a-vis de lhypoth`ese de lipschitzianite.
Remarque IV-15. Le Theor`eme IV-13 admet une generalisation immediate au
cas o`
u f est seulement supposee L-lipschitzienne, avec L eventuellement different de
1 : il suffit de remplacer (31) par
n [f ()] Ln n [].

Le concept de mesure de Hausdorff nous permettra de demontrer un enonce encore


bien plus general : voir la Proposition V-6.
ore
`me IV-13. Notons pour commencer que f () est mesuPreuve du The
rable en vertu de la Proposition IV-10 ; de toute facon largument qui suit redemontrera
ce resultat.

LA MESURE DE LEBESGUE

159

Si A est une boule fermee B[x, r], alors f (A) est inclus dans la boule B[f (x), r],
qui a meme volume que B[x, r] ; donc
n [f (A)] n [A].

La mesure de Lebesgue etant 2n -doublante, on peut appliquer le Corollaire I-87


pour epuiser par une union denombrable de boules fermees disjointes Bj :
!
[
=
Bj N,
jN

o`
u N est un borelien de mesure nulle.
Par la Proposition IV-9, f (N) est de mesure nulle. Donc
"
!#
"
#
[
[
n [f ()] = n f
Bj
= n
f (Bj )
jN

X
jN

jN

n [f (Bj )]

n [Bj ]

jN

= n

"

jN

o`
u lon a utilise le fait que les boules Bj sont disjointes.

Bj = n [],


Corollaire IV-16 (les isometries preservent le volume). Soit f : Rn Rn une


isometrie ; alors pour tout ensemble mesurable A de Rn on a n [f (A)] = n [A].
D
emonstration. Il suffit dappliquer le Theor`eme IV-13 `a f et `a f 1 .

Remarque IV-17. Une isometrie de Rn est forcement une application affine ;


on peut donc voir le corollaire precedent comme un cas particulier de laction des
applications affines sur la mesure de Lebesgue, que nous allons etudier dans la suite
de ce chapitre.
Remarque IV-18. La classe des transformations (ou changements de variables)
qui preservent la mesure de Lebesgue est infiniment plus vaste que celle des isometries.
Par exemple, sur le segment [0, 1], on peut permuter des sous-intervalles... La figure IV-18 represente les graphes de quelques applications simples preservant la
mesure de Lebesgue sur [0, 1] (les deux premi`eres sont des bijections, la troisi`eme
non ; la premi`ere et la troisi`eme sont continues, la deuxi`eme non).

Fig. 3. Quelques graphes de transformations preservant la mesure de Lebesgue

160

CHAPITRE IV

(13 juin 2010)

En plusieurs dimensions, la classe des applications preservant la mesure de Lebesgue est dune tr`es grande importance dans de nombreux domaines des mathematiques.
Par exemple, en mecanique des fluides, on utilise les bijections preservant la mesure
de Lebesgue (restreinte `a un ouvert de Rn ) pour representer la collection des trajectoires dun fluide incompressible ; lensemble de ces bijections est un espace de
dimension infinie (ce nest pas un espace vectoriel, mais cest un sous-ensemble dune
sph`ere dans un espace vectoriel norme) qui a fait lobjet de nombreuses etudes.
IV-2.7. Action des transformations affines. Le theor`eme suivant fait le lien
entre deux notions naturelles de volume (lune analytique, lautre algebrique) pour
un parallelepip`ede :
or`
The
eme IV-19 (mesure de Lebesgue et determinant). Soient A Mn (R) et
n
b R ; on note T lapplication affine definie par T (x) = Ax + b, C = [0, 1]n le
cube unite de Rn , et P = T (C) le parallelepip`ede forme des vecteurs colonnes de A.
Alors,
(32)

n [P ] = | det A|.

Remarque IV-20. Il sagit ici de volume non oriente.


Avant de donner la preuve, on va sefforcer de faire sentir pourquoi ce resultat est
naturel. Considerons une application lineaire de
1 x1 , . . . , n xn ),
Qla forme T (x1 , . . . , xn ) = (
n
o`
u les i sont des nombres reels. Si P =
[ai , bi ] est un pave de R , le pave
TQ
(P ) a pour
c
o
t
e
s
les
nombres
positifs
|
|
|b
egal `a
i
i ai |, son volume est donc
Q
(Q |i |) |bi ai |, ce qui est le volume initial de P multiplie par le coefficient
|i | = | det T |. Il se peut que certaines longueurs soient allongees, dautres raccourcies, ce qui compte pour evaluer la variation de volume cest le produit des
valeurs propres i . Comme le volume est invariant par changement de base orthonormee (Corollaire IV-16), le meme resultat devrait etre vrai pour toute application
lineaire symetrique (diagonalisable dans une base orthonormee). Lexamen de ce cas
particulier sugg`ere bien que le facteur multiplicatif du volume est la valeur absolue
du determinant.
D
emonstration. Commencons par le cas o`
u A est non inversible. Dune part,
det A = 0 ; dautre part, T (Rn ) est inclus dans un hyperplan affine, donc de mesure
nulle. Les deux membres de (32) sont donc nuls.
Dans le cas o`
u A est inversible (et donc T est bijective Rn Rn ), on va etablir
lenonce plus general
(33)

T# n = | det A|1 n .

Montrons que (32) et (33) sont equivalents. Lequation (33) secrit n [T 1 (B)] =
| det A|1 n [B] pour tout borelien B Rn ; comme T est bijective cela equivaut
`a n [B] = | det A|1 n [T (B)], do`
u (32) par le choix B = C. Reciproquement,
si (32) est vrai, alors la mesure = | det A|1 (T 1 )# n satisfait `a [C] = 1 ;
et est invariante par translation puisque [B + h] = | det A|1 n [T (B + h)] =
| det A|1 n [T (B) + Ah] = | det A|1 n [T (B)] pour tout borelien B Rn et tout
vecteur h Rn . Grace au Theor`eme IV-3, on conclut que = n , ce qui revient
`a (33).
Toujours grace `a linvariance par translation, il suffit de se restreindre au cas o`
u
b = 0, cest-`a-dire T (x) = Ax. Le resultat voulu, soit sous la forme (33), soit sous

LA MESURE DE LEBESGUE

161

la forme (32), peut se demontrer facilement dans un certain nombre de cas simples.
Par exemple,
(I) si A est une matrice de permutation, cest evident puisque AC = C.
(II) si A se contente de multiplier une coordonnee :
Ax = (x1 , x2 , . . . , xn ),
alors limage de C est un pave de cotes ||, 1, . . . , 1 ; donc de volume || = | det A|.
(III) si A est de la forme
Ax = (x1 + x2 , x2 , . . . , xn ),
alors AC = P [0, 1]n2, o`
u P est le parallelogramme (2-dimensionnel) de sommets
(0, 0), (0, 1), (1, 1) et (1, 0). On peut decouper ce parallelogramme en deux triangles
(plus un reste de mesure nulle) que lon peut recoller en le carre [0, 1]2 ; ce qui revient
`a decouper AC en deux morceaux et `a les recoller en le cube [0, 1]n (voir la figure).
Le volume de AC est donc egal `a 1, ce qui est aussi le determinant de A.

Fig. 4. Le parallelogramme a meme aire que le carre

On note ensuite que la formule (33) est invariante par composition : si elle est
vraie pour deux applications A1 et A2 , elle est aussi vraie pour A = A1 A2 puisque
| det A1 A2 | = | det A1 | | det A2 |. Or un argument dalg`ebre lineaire montre que toute
matrice inversible est produit dun nombre fini de matrices du type (I), (II) ou (III).
On conclut `a la validite de (33) pour nimporte quel A inversible.

IV-3. Lint
egrale de Lebesgue g
en
eralise lint
egrale de Riemann
Nous avons dej`a mentionne sans preuve que lintegrale de Lebesgue generalisait
lintegrale de Riemann. Ce fait est important `a plusieurs titres : dune part, lintegrale
de Riemann est un objet simple, avec lequel le lecteur est sans doute familier ; dautre
part, tous les procedes habituels dintegration numerique de fonctions (ou de calcul
daire ou de volume) se ram`enent `a des variantes de lintegrale de Riemann (methode
des rectangles, des trap`ezes, etc.).
Nous limiterons notre discussion `a la dimension 1, meme si les demonstrations se
generalisent sans autre probl`eme que la lourdeur des notations. Pour simplifier, nous
allons egalement nous limiter `a des fonctions positives, le cas general etant concu

162

CHAPITRE IV

(13 juin 2010)

pour sy ramener. On commence par rappeler precisement le concept de Riemannintegrabilite, en ne considerant que des fonctions localement born
ees sur un intervalle J de R, cest-`a-dire les fonctions f qui sont sommables surtout intervalle
compact [a, b] J (par exemple, les fonctions x 7 x ou x 7 1/ x sont localement bornees sur ]0, +[).
D
efinition IV-21 (Riemann-integrabilite). Soit J un intervalle de R, et f :
J R+ une fonction localement bornee sur J. Une subdivision de lintervalle
[a, b] J en sous-intervalles I1 , . . . , IK etant donnee, on definit mk (f ) := inf Ik f ,
Mk (f ) := supIk f , et
X
X
I (f, ) :=
|Ik | mk (f ),
I + (f, ) :=
|Ik | Mk (f ).
k

On pose alors

R
[a,b] (f ) := sup I (f, ),

+
R+
[a,b] (f ) := inf I (f, ),

o`
u est lensemble de toutes les subdivisions de [a, b]. On dit que f est Riemann
integrable sur [a, b] si R+
egrale de
[a,b] (f ) = R[a,b] (f ), et dans ce cas on appelle int
f sur [a, b] la valeur commune de ces deux nombres. On definit enfin lintegrale de
Riemann de f sur J comme la limite de lintegrale de f sur [a, b] quand a et b
tendent respectivement vers les extremites gauche et droite de J.

Fig. 5. Lintegrale de Riemann definie par encadrements : I (f, )


est la somme des aires des rectangles inferieurs, I + (f, ) laire totale
hachuree.
Le principal resultat de cette section est le suivant.
Th
eor`
eme IV-22 (Lintegrale de Lebesgue generalise celle de Riemann). Soient
J un intervalle de R et f : J R+ une fonction bornee sur les compacts de J.
Alors f est Riemann-integrable si et seulement si (i) elle est Lebesgue-mesurable,
et (ii) lensemble de ses points de discontinuite est de mesure nulle. Dans ce cas,
lintegrale de Riemann de f est egale `a lintegrale de Lebesgue de f .

LA MESURE DE LEBESGUE

163

Remarque IV-23. La fonction 1[0,1]Q est un exemple de fonction Lebesguemesurable bornee qui ne soit pas Riemann-integrable.
D
emonstration. 1. On peut trouver des suites (ak )k1 et (bk )k1 , respectiR
vement Rcroissante et decroissante, telles que J = [ak , bk ]. Alors on a J f =
limk [ak ,bk ] f , au sens de Lebesgue, par convergence monotone. En outre, une
reunion denombrable densembles negligeables est negligeable. Pour prouver le theor`eme
dans le cas general, il suffit donc de se limiter au cas particulier o`
u J = [a, b] et f
est bornee.
2. Supposons que f est Riemann-integrable sur [a, b] ; on note R(f ) son integrale
au sens de Riemann. Soit > 0 et soient , deux subdivisions de [a, b] en sousintervalles (Ik )1kK et (I )1L respectivement, telles que
X
X
|Ik | mk (f ) R(f ) ,
|I | M (f ) R(f ) + .
k

Quitte `a remplacer et par une subdivision plus fine, on peut supposer que
= . Pour chaque valeur de m on peut donc construire une subdivision = m
de [a, b] en sous-intervalles Ik , telle que
X
X
1
1
|Ik | mk (f ) R(f ) ,
|Ik | Mk (f ) R(f ) .
m
m
k
k

+
On definit alors les fonctions fm
et fm
par

x Ik =

fm
(x) = mk (f ),

+
fm
(x) = Mk (f ),

en convenant que ces deux fonctions concident avec f aux extremites des sousintervalles.
Quitte `a remplacer m par une subdivision plus fine que 1 , . . . , m , on peut
supposer que les subdivisions m sont de plus en plus fines quand m augmente, auquel
+

cas les fonctions fm


forment une suite decroissante, et les fonctions fm
forment une
+

suite croissante. Appelons f et f les limites respectives de ces suites : les fonctions
f + et f sont mesurables puisque limites de fonctions constantes par morceaux, et
clairement f + f .
Par convergence monotone,
Z
Z
Z
Z
+
+

f = lim fm ,
f = lim fm
,
et par hypoth`ese ces deux limites sont egales `a R(f ). On en deduit que
Z
(f + f ) = 0,

et il sensuit que f = f + presque partout sur [a, b]


R ; en consequence, ces fonctions
concident presque partout avec f . En particulier, f = R(f ).
Soit D lensemble de toutes les extremites des sous-intervalles Ik des subdivisions
m ; comme D est denombrable, il est de mesure nulle. Pour presque tout x
[a, b] \ D, on a f + (x) = f (x), ce qui veut dire que x est point interieur dune
famille dintervalles Jm , decroissante, verifiant


lim inf f = lim sup f = f (x).
m Jm

Jm

164

CHAPITRE IV

(13 juin 2010)

Il sensuit que f est continue en x. Nous avons donc montre que lensemble des points
de discontinuite de f est de mesure nulle.
3. Reciproquement, soit f une fonction bornee, Lebesgue-integrable sur [a, b],
positive, dont lensemble des points de discontinuite est de mesure nulle ; nous allons
montrer que f est Riemann-integrable. Pour tout m 1, on definit une subdivision
m en subdivisant lintervalle [a, b] en 2m intervalles ouverts Ikm , de longueur egale,
+

et on definit les fonctions fm


et fm
comme ci-dessus. Soit D lensemble de toutes les
extremites de ces intervalles, et soit x un point de continuite de f nappartenant pas
`a D. Pour tout m 1, il existe un k tel que x Ikm , et lintervalle Ikm est de longueur
(b a)/2m . Comme f est continue en x, loscillation de f sur Ikm tend vers 0 quand
m , autrement dit
f 0,
sup f inf
m
Ikm

Ik

soit encore fm
(x) fm
(x) 0. La famille (fm
fm
) est une suite de fonctions
positives, born
e
es
sur
[a,
b],
convergeant
vers
0
presque
partout, par convergence
R + R
dominee on a fm
fm 0, ce qui signifie exactement que f est Riemannintegrable. On a dej`a vu quen pareil cas, la valeur de lintegrale de Riemann et celle
de lintegrale de Lebesgue concident.


IV-4. R`
egles de calcul associ
ees `
a lint
egrale de Lebesgue
IV-4.1. D
erivation et int
egration dans R. Nous avons dej`a mentionne que
lune des motivations de Lebesgue etait de construire une theorie dans laquelle
integration et derivation etaient toujours des operations inverses lune de lautre.
Le cadre naturel de son principal resultat en la mati`ere est celui des applications
absolument continues.
D
efinition IV-24 (absolue continuite). Soient I un intervalle de R, et f : I
R une application mesurable. On dit que f est absolument continue sur I si pour
tout > 0 il existe > 0 tel que pour toute famille finie [ak , bk ] dintervalles disjoints
inclus dans I (1 k N),
X
X
|bk ak | =
|f (bk ) f (ak )| .
1kN

1kN

Exemple IV-25. Il est clair quune fonction lipschitzienne est absolument continue : dans la definition ci-dessus on peut choisir = /L, o`
u L est la constante de
Lipschitz de f . En particulier, par la formule des accroissements finis, toute application derivable, dont la derivee est bornee, est lipschitzienne, et donc absolument
continue.
Il est clair par ailleurs que labsolue continuite implique luniforme continuite ; le
concept dabsolue continuite est donc intermediaire entre celui duniforme continuite
et celui de lipschitzianite. Formellement, les applications absolument continues sur
un intervalle borne sont celles dont la d
eriv
ee est sommable ; plus rigoureusement
ce sont celles dont la derivee (au sens des distributions) est une mesure absolument
continue par rapport `a la mesure de Lebesgue.
Th
eor`
eme IV-26 (derivation et integration). Soit f une fonction absolument
continue sur un intervalle I = [a, b] de R. Alors f est derivable presque partout dans

LA MESURE DE LEBESGUE

165

I, et sa derivee f est une application sommable sur I. En outre, pour tout x [a, b],
on a lidentite
Z x
f (x) f (a) =

f (t) dt.

Nous demontrerons ce resultat plus tard, dans le Chapitre ??.

IV-4.2. Th
eor`
eme de Fubini. Lespace (Rn , n ) est bien s
ur -fini ; on peut
donc appliquer le theor`eme de FubiniTonelliLebesgue dans ces espaces. En outre,
comme on la dej`a rappele,
m n = m+n .
Remarque IV-27. Il arrive souvent que lon ait besoin de decouper une integrale
en tranches curvilignes, pour lesquelles le theor`eme de Fubini ne sapplique pas.
La cel`ebre formule de la co-aire permet de traiter de telles situations ; nous en
parlerons dans le Chapitre ??.
` titre dillustration, on va donner deux applications du theor`eme de Fubini : la
A
demonstration generale de la Proposition IV-8 ; puis une demonstration alternative
du Theor`eme IV-19.
Preuve de la Proposition IV-8. Notons dabord que le graphe de f est
mesurable, comme limage reciproque de 0 par lapplication mesurable (x, y) 7
y f (x). En outre, lapplication indicatrice du graphe de f vaut 1f (x)=y (x, y). Ensuite, par Fubini,

Z
Z Z
Z
1f (x)=y (x, y) dn(x) dm (y) =
1y=f (x) (x, y) dm(y) dn (x) =
0 dn (x) = 0.
Rn+m

Rn

Rm

Ceci prouve que le graphe de f est negligeable.

Rn

ore
`me IV-19. Comme dans la preuve vue precedemment,
Preuve alternative du The
on se ram`ene au cas o`
u A est inversible, on montre lequivalence entre (32) et (33)
et linvariance de la formule par composition. La difference est dans le choix des
cas elementaires : on note que toute application lineaire inversible A est produit
dapplications lineaires laissant une coordonnee invariante.
Soit alors A une telle application ; sans perte de generalite (en utilisant linvariance par permutation) on peut supposer que Ax = (A (x1 , . . . , xn ), xn ), et la
sous-matrice An1 formee des n 1 premi`eres lignes et colonnes de A est inversible :

0
..
A
.
n1
A=

0
... 1

On note que det A = det An1 . Soit P = Q [a, b] un pave dans Rn , on note A(P )y
la tranche de P selon xn = y ; cette tranche vaut Q si y [a, b], et sinon. Par
Fubini,
Z b
Z
n [A(P )] =
n1 [A(P )xn ] dxn =
n1 [An1 (Q)] dxn = (b a) n1 [An1 (Q)].
R

On en deduit que


(A1 )# n = (A1
n1 )# n1 1 .

166

CHAPITRE IV

(13 juin 2010)

En particulier, si la formule (33) est vraie pour la sous-matrice An1 , elle sera vraie
egalement pour la matrice A.
Pour conclure, on raisonne par recurrence sur la dimension. Si n = 1, la propriete
souhaitee est evidente. Si la propriete est demontree au rang n 1, soit alors A une
matrice inversible de taille n ; on peut lecrire comme A = A A , o`
u les matrices

A et A preservent chacune une coordonnee. Par hypoth`ese de recurrence, et la


remarque ci-dessus, la formule (33) est vraie pour A et A , elle est donc aussi vraie
pour A grace `a linvariance par produit.

IV-4.3. Changement de variable. Dans la Section
III-3 nous
R
R avons considere
le theor`eme abstrait de changement de variable : f d(T# ) = (f T ) d. Dans
le cadre concret de Rn muni de la mesure de Lebesgue, cette identite peut etre
precisee grace `a une formule qui exprime la mesure image en fonction du determinant
jacobien du changement de variable.
Il existe de nombreuses variantes de ce theor`eme, sous diverses hypoth`eses. Celle
que nous allons voir maintenant semble etre le meilleur compromis entre generalite
et simplicite. On notera dx la differentielle de en x, que lon peut lidentifier `a la
matrice des derivees partielles :


i
[dx ]ij =
.
xj
La notation n A designera la restriction de n au borelien A.
or`
The
eme IV-28 (Changement de variable C 1 dans Rn ). Soient U un ouvert
de Rn , : U V un C 1 -diffeomorphisme, alors
(i) pour tout borelien B U,
Z
n [(B)] =
| det d| dn ;
B

(ii) pour toute fonction f sommable V R (ou pour toute fonction f mesurable
positive V [0, +]),
Z
Z
f dn = (f )| det d| dn;
(U )

(iii) # (n U ) = m n (U ) , o`
u m est la fonction definie par
1
.
m(y) =
det d1 (y)

Remarque IV-29. Une formulation equivalente de lenonce (ii) ci-dessus est :


(ii) pour toute fonction mesurable positive g,
Z
Z
g(x)| det dx | dx =
g(1(y)) dy.
U

(U )

Pour sen convaincre, il suffit de poser g = f , f = g 1 dans (ii).


Remarque IV-30. Les erreurs classiques dans lapplication du Theor`eme IV-28
sont (a) la confusion entre et 1 , surtout au niveau de la formule (iii) ; (b) loubli
des valeurs absolues autour du determinant ; (c) loubli de la restriction `a U et (U)
dans la formulation (iii) ; (d) la non-verification de linjectivite de .

LA MESURE DE LEBESGUE

167

Remarque IV-31. Le Theor`eme IV-19 est un cas particulier du Theor`eme IV28, correspondant au cas o`
u est affine bijective.
` son tour, le Theor`eme IV-28 se generalise considerablement :
Remarque IV-32. A
(a) Lhypoth`ese de regularite C 1 peut etre relachee en regularite lipschitz, ou
meme des hypoth`eses encore beaucoup plus generales telles que la differentiabilite
presque partout (mais la Remarque IV-29 nest plus forcement valide).
(b) Lhypoth`ese de bijectivite de peut etre remplacee par linjectivite en-dehors
dun ensemble negligeable ; en revanche sans cette propriete dinjectivite presque
partout, le theor`eme devient faux, et on a seulement, pour f 0,
Z
Z
f
f | det d|
(U )

(pourquoi ?).
(c) On peut cependant modifier les formules pour traiter des cas o`
u nest pas
injective (il convient alors dintroduire la multiplicite), et o`
u est un changement de
variables Rn Rm avec m > n (formule de laire) ou m < n (formule de la co-aire).
La mesure de Lebesgue doit alors etre remplacee par une mesure de Hausdorff.
On reparlera bri`evement de ces formules dans le Chapitre V.
Ces sujets sont abordes dans le livre [EvansGariepy] ; et dans divers articles de
recherche dont certains sont tr`es recents.
On peut prouver le Theor`eme IV-28 de diverses mani`eres. Lequivalence entre
les enonces (i)(iii) est une consequence facile de la definition de la mesure image
(Definition III-59), du theor`eme abstrait de changement de variable (Theor`eme III60) et de la bijectivite de . Il suffit donc de demontrer nimporte laquelle de ces
trois formules.
Je vais presenter ici deux strategies : la premi`ere, empruntee `a [Gramain], copie
largument utilise `a la fin de la sous-section IV-4.2 pour (re)demontrer le Theor`eme IV19 ; la seconde, au contraire, consid`ere le Theor`eme IV-19 comme une brique elementaire
`a laquelle on peut se ramener par approximation. Cette derni`ere strategie est plus
intuitive, mais aussi plus elaboree puisquelle reposera sur le Theor`eme IV-13, qui
lui-meme fait appel au lemme de recouvrement de Vitali. Les deux preuves utilisent
un argument de localisation.
`re preuve du Th
Premie
eor`
eme IV-28. On va chercher `a demontrer la formule (i). Par regularite de la mesure de Lebesgue (ou tout simplement parce que
les compacts engendrent la tribu borelienne), il suffit de se limiter au cas o`
u B est
compact.
On raisonne par recurrence sur la dimension n. Commencons par n = 1. Comme
les intervalles compacts engendrent la tribu borelienne, il suffit de montrer que pour
tout [a, b] U,
Z b
(34)
[(I)] =
| (x)| dx.
a

Etant
un diffeomorphisme, est soit strictement croissante, soit strictement
R b de croissante
sur [a, b]. Dans le premier cas, la formule (34) devient (b) (a) = a (x) dx,

168

CHAPITRE IV

(13 juin 2010)

ce qui est evidemment vrai. Dans le deuxi`eme cas, (34) se reecrit (a) (b) =
Rb
( (x)) dx, ce qui revient au meme. Le theor`eme est donc vrai pour n = 1.
a
Supposons maintenant le theor`eme demontre en dimension n1 1. Pour traiter
la dimension n, on utilisera le
Lemme IV-33. Soient U et V deux ouverts de Rn et : U V un diffeomorphisme.
Alors localement secrit comme composition de permutations des coordonnees, et
de diffeomorphismes preservant au moins une coordonnee.
Preuve du Lemme IV-33. Soit z U. Il existe des indices j et k tels que
(k /xj )(z) 6= 0. Quitte `a permuter, on suppose k = j = 1. On pose alors
(x1 , . . . , xn ) = (1 (x), x2 , . . . , xn ). Il est clair que detz d = (1 /x1 )(z), donc
par le theor`eme dinversion locale definit un diffeomorphisme dun voisinage O de
z dans (O). Dans louvert O on peut alors ecrire = ( 1 ) , o`
u preserve
les n 1 derni`eres coordonnees, et 1 preserve la premi`ere.

Retournons `a la preuve du Theor`eme IV-28. Montrons que la conclusion est
vraie si preserve la derni`ere coordonnee : (x1 , . . . , xn ) = (1 (x), . . . , n1 (x), xn ).
Notons x = (x1 , . . . , xn1 ). Pour tout z fixe, lapplication z , obtenue en gelant la
variable xn `a la valeur z et en ne conservant que les n 1 premi`eres coordonnees
de , definit un diffeomorphisme de U z = U {xn = z} (vu comme un ouvert de
lhyperplan (xn = z)) sur son image z (U z ). Lhypoth`ese de recurrence sapplique `a
z :
(f z )# (n1 U z ) = | det dx f z |1 (n1 z (U z ) )

= | det d(x ,z) f |1 (n1 z (U z ) ).

En appliquant Fubini, on en deduit, exactement comme dans la demonstration en


fin de sous-section IV-4.2, que f# (n 1U ) = | det dx f |1 (n 1V ). Le theor`eme est donc
vrai dans le cas o`
u preserve lune des coordonnees.
Le theor`eme est egalement (bien s
ur) vrai quand est une permutation de coordonnees. Or le Lemme IV-33 montre que secrit localement comme composee
de permutations et de diffeomorphismes preservant une coordonnee. Grace `a linvariance de la formule (iii) par composition, on conclut que le theor`eme est vrai en
dimension n, pour peu que lon remplace U par un petit voisinage de x (et par sa
restriction `a U).
Pour boucler la recurrence, il reste `a recoller les morceaux, cest-`a-dire etablir
la formule globale (disons pour tout borelien B U) `a partir de la formule locale
(valable pour tout borelien B inclus dans un petit voisinage dun point x fixe).
Fixons donc U, V et , et supposons que tout x U est contenu dans un
voisinage Ux U o`
u la conclusion du theor`eme est vraie (avec U remplace par Ux ,
remplace par sa restriction `a Ux ) ; on va montrer qualors le theor`eme est vrai
pour louvert U tout entier. Comme on la dej`a remarque, il suffit de traiter le cas
o`
u B est un compact K de U. De la famille des {Ux , x K} on extrait un sousrecouvrement fini {Ux1 , . . . , UxN }. On pose alors C1 = K Ux1 , C2 = K (Ux2 \ Ux1 ),
etc. de mani`ere `a definir des ensembles boreliens C1 , . . . , CN deux `a deux disjoints
dont lunion est K. Puisque le theor`eme est vrai dans chaque Uxi , on a
Z
j {1, . . . , N},
n [(Cj )] =
| det dx | dx.
Cj

LA MESURE DE LEBESGUE

169

Comme est bijective, les (Cj ) sont disjoints et leur union est (K). La sommation
en j donne donc
Z
n [(K)] =

| det dx | dx,

ce qui conclut la preuve du theor`eme.

Seconde preuve du Th
eor`
eme IV-28. Lidee est de comparer, au voisinage
dun point x, la mesure image # n `a la mesure image (Tx )# n , o`
u Tx designe
lapplication affine tangente `a en x :
Tx (y) = (x) + (dx )(y x).

Pour cela, on utilise le lemme suivant :

Lemme IV-34. Soient U et V deux ouverts de Rn et : U V un C 1


diffeomorphisme. Alors pour tout ]0, 1[ et pour tout x U il existe r > 0 tel
que Br (x) U et
(a) pour tout y Br (x),
(1 ) | det dy | | det dx | (1 + ) | det dy |;

(b) pour tous y, z Br (x),

(1 ) |Tx (y) Tx (z)| |(y) (z)| (1 + ) |Tx (y) Tx (z)|.

Preuve du Lemme IV-34. Fixons x ; puisque est un diffeomorphisme on a


| det dx | > 0. Par continuite de det d, il existe > 0 tel que
|x y| =

| det dy det dx | | det dx |,

ce qui implique la propriete (a).


Ensuite, soit ]0, 1[. Par continuite de d (fonction `a valeurs dans les appli
cations lineaires), il existe r > 0 tel que kdy dx k pour |x y| r. Etant
donnes y, z dans Br (x), on definit x(t) = (1 t)y + tz, alors
Z 1

(y) (z) =
(dx(t) ) dt (y z);
0

Tx (y) Tx (z) = dx (y z);

do`
u
Z




(y) (z) Tx (y) Tx (z)

1
0


kdx(t) dx k dt |y z| |y z|.

Par ailleurs dx est inversible, donc il existe une constante K > 0, ne dependant
que de x, telle que |dx (y z)| K |y z| (il suffit de choisir K = k(dx )1 k1 ).
On obtient ainsi




(y) (z) Tx (y) Tx (z) (K 1 )|Tx (y) Tx (z)|.
La conclusion decoule du choix = K.

Revenons maintenant `a la preuve du Theor`eme IV-28. Soit ]0, 1[ ; soit x U


et soit r > 0 tels que les enonces (a) et (b) du Lemme IV-34 soient vrais. On pose
Ux = B(x, r) U.
Les applications et Tx sont bijectives, on peut donc definir f = (1 + )1
(Tx )1 , et linegalite de droite dans lenonce (b) montre que f est 1-lipschitzienne

170

CHAPITRE IV

(13 juin 2010)

sur Tx (Ux ). Par le Theor`eme IV-13 (une application contractante reduit les volumes), on sait que pour tout borelien B Tx (Ux ), on a n [f (B )] n [B ].
Si B est un borelien quelconque de Ux , on peut appliquer la relation precedente `a
B = Tx (B) et on trouve, Tx etant bijective, n [(1 + )1 (B)] n [Tx (B)].
Puisque lhomothetie de rapport (1 + )1 contracte les volumes par un facteur
(1 + )n , on conclut que
n [(B)] (1 + )n n [Tx (B)].
(Le lecteur familier avec la notion de mesure de Hausdorff pourra voir que cette
conclusion decoule immediatement de linegalite de droite dans (b) ; ici jai utilise
un chemin leg`erement detourne pour me ramener au Theor`eme IV-13.)
Un raisonnement identique `a partir de linegalite de gauche dans (b) m`ene finalement `a
(35)

(1 )n n [Tx (B)] n [(B)] (1 + )n n [Tx (B)];

cette inegalite est valable pour tout borelien B inclus dans Ux .


Soit maintenant K un compact de U. Par un raisonnement simple rappele au
cours de la premi`ere preuve du Theor`eme IV-28, on peut partitionner K en boreliens
disjoints C1 , . . . , CN tels que chaque Ci est inclus dans un Uxi . On peut alors appliquer (35) `a chaque Ci :
(36)

(1 )n n [Txi (Ci)] n [(Ci )] (1 + )n n [Txi (Ci)].

Pour chaque i, on peut appliquer le Theor`eme IV-19 pour calculer le volume de


Txi (Ci ) :
n [Txi (Ci )] = | det dxi | n [Ci ].

De la condition (a) on deduit alors


Z
Z
(1 )
| det dy | dy n [Txi (Ci )] (1 + )
| det dy | dy.
Ci

Ci

En reportant cette inegalite dans (36) on obtient


Z
Z
n+1
n+1
| det dy | dy.
| det dy | dy n [(Ci )] (1 + )
(1 )
Ci

Ci

Comme les (Ci ) forment une partition de (K), en sommant cette double
inegalite par rapport `a lindice i on trouve
Z
Z
(1 )n
(1 + )n
| det dy | dy n [(K)]
| det dy | dy.
1+ K
1
K
On conclut la preuve en faisant tendre vers 0.

IV-5. Mesurabilit
e, non-mesurabilit
e, et paradoxes de BanachTarski
IV-5.1. Ensembles bor
eliens et Lebesgue-mesurables. Pour passer de la
tribu borelienne `a la tribu des ensembles Lebesgue-mesurables, nous nous sommes
contentes dappliquer loperation de completion. Les ensembles Lebesgue-mesurables
sont donc toutes les parties E de Rn telles quil existe des boreliens A et B verifiant
A E B,

|B \ A| = 0.

LA MESURE DE LEBESGUE

171

En particulier, tout sous-ensemble dun ensemble negligeable est lui-meme negligeable,


ce qui semble naturel. De mani`ere equivalente, les ensembles Lebesgue-mesurables
sont ceux pour lesquels
[X E] + [X \ E] = [X]

pour toute partie X R (on peut se limiter au cas o`


u X decrit lensemble des
paves). Cest cette derni`ere definition quadoptait Lebesgue.
La regularite de la mesure de Lebesgue nous permet de donner une autre caracterisation, en apparence un peu plus precise.
Proposition IV-35 (Lebesgue-mesurabilite, F et G ). Tout ensemble Lebesguemesurable E peut secrire sous la forme A N, o`
u A est une union denombrable
de fermes (un F ) et N un ensemble negligeable ; sil est de mesure finie, il peut
egalement secrire sous la forme B \ N, o`
u B est une intersection denombrable
douverts (un G ) et N un ensemble negligeable.
D
emonstration. Si E est de mesure finie, cest une consequence de la Proposition I-49. Dans le cas o`
u E nest pas de mesure finie, on sy ram`ene en considerant
son intersection avec une suite croissante de paves.

Ces descriptions sont bien s
ur tr`es grossi`eres. Une branche de la th
eorie g
eom
etrique
de la mesure [Federer] sattache `a decrire geometriquement les ensembles Lebesguemesurables.
IV-5.2. Fonctions bor
eliennes. On peut se demander `a quoi ressemble une
fonction borelienne, disons de Rn dans R, et si la classe des fonctions boreliennes
est vraiment beaucoup plus large que la classe des fonctions continues, ou semicontinues... La question est bien s
ur formulee ici de mani`ere trop vague ; cependant,
le theor`eme de Lusin (Theor`eme II-60) implique que toute fonction borelienne f :
Rn R, nulle en-dehors dun ensemble de mesure de Lebesgue finie, concide avec
une fonction continue en-dehors dun ensemble de mesure arbitrairement petite ;
et que f est, en-dehors dun ensemble de mesure nulle, limite simple de fonctions
continues. Son corollaire II-61 indique que pour toute fonction f sommable de Rn
dans R on peut trouver une famille (fk )kN de fonctions continues `a support compact,
telles que
Z
|fk (x) f (x)| dx 0.
k

Le theor`eme de Vitali-Caratheodory (Theor`eme II-63) sapplique aussi, sans restriction, `a la mesure de Lebesgue sur Rn , et permet dencadrer une fonction sommable f par des fonctions semi-continues, au prix dune erreur arbitrairement petite
sur les integrales.

IV-5.3. Existe-t-il des ensembles non mesurables ? Nous allons maintenant aborder quelques-unes des questions tr`es subtiles liees au concept de nonmesurabilite, dont certaines touchent `a rien moins que les fondations logiques des
mathematiques.
Commencons par essayer de resoudre le probl`eme de lexistence de parties non
mesurables par un argument de cardinalite. On peut montrer [Rudin, p. 53] que la
famille des Boreliens de R a meme cardinalite que R. Si lon admet que lensemble
des parties de R est de cardinal strictement superieur `a R lui-meme, il en decoule
que la grande majorite des sous-ensembles de R ne sont pas des Boreliens.

172

CHAPITRE IV

(13 juin 2010)

Le raisonnement precedent nest pas forcement tr`es convaincant car il presuppose


des resultats subtils de theorie des cardinaux. En tous les cas, il ne fonctionne plus
pour la famille des ensembles Lebesgue-mesurables, qui a meme cardinalite que
lensemble de toutes les parties de R : pour sen convaincre, on peut noter que
lensemble triadique de Cantor C sur [0, 1] a meme cardinal que R, et que toutes ses
parties sont mesurables puiquil est de mesure nulle. Si lon admet que lensemble
des parties de R est strictement plus grand que R lui-meme, il en resulte que la
plupart des parties de R ne sont pas des boreliens.
Se pose alors la question de savoir sil existe des parties qui ne soient pas
Lebesgue-mesurables ! La reponse `a cette question est un des resultats les plus frappants de la logique moderne : on peut effectivement construire de telles parties,
mais leur construction necessite laxiome du choix. Si en revanche on ne postule pas cet axiome, la mesurabilite de toutes les parties de R est un probl`eme
indecidable. On peut alors poser comme axiome que toutes les parties de R sont
mesurables, ou au contraire quil existe (au moins) une partie non mesurable ; les
mathematiques que lon pourra developper dans lun et lautre cas seront incompatibles, mais chacune aura a priori sa coherence propre. Cette decouverte majeure est due au cel`ebre logicien Solovay, aide des techniques introduites par Cohen
pour demontrer lindecidabilite de lhypoth`ese du continu (qui enonce, essentiellement, que le plus petit cardinal non denombrable est celui de R). Le theor`eme
dincompletude de Godel, lindecidabilite de lhypoth`ese du continu, et le theor`eme
de Solovay, peuvent etre consideres commes les resultats de logique les plus marquants du vingti`eme si`ecle.
Comment construire un ensemble non mesurable ? On se souvient que dapr`es la
Proposition IV-4, la mesure de Lebesgue induit sur le tore Tn une mesure invariante
par addition modulo Zn . Si lon construit un ensemble non mesurable E dans T = T1 ,
alors E Tn1 constituera un ensemble non mesurable de Tn . Cest precisement ce
que montre le resultat suivant.
Th
eor`
eme IV-36 (Paradoxe de Vitali). Il existe une partie E de T telle que T
puisse secrire comme reunion denombrable disjointe de translates de E. En particulier, E nest pas Lebesgue-mesurable.
D
emonstration. Notons que la seconde partie du theor`eme decoule de la
premi`ere : si E etait mesurable, de mesure positive, alors la mesure de T serait
infinie, ce qui est faux ; et sil etait de mesure nulle, alors la mesure de E serait
nulle, par -additivite.
Pour construire E, on introduit une relation dequivalence R dans T comme suit :
xRy x y Q.
Lensemble T est alors partage en une infinite de classes dequivalence, et on choisit
un representant dans chaque classe ; on note E lensemble des representants ainsi
selectionnes.
Toute classe dequivalence sobtient `a partir de son representant, par addition
(modulo 1) de rationnels ; si lon se limite `a des rationnels de [0, 1[ on obtient des
elements distincts de T. La conclusion est que T est la reunion disjointe denombrable
des qk + E, o`
u les qk sont les rationnels de [0, 1[ et laddition est consideree modulo 1.


LA MESURE DE LEBESGUE

173

Dans le raisonnement precedent, nous avons utilise laxiome du choix pour choisir
arbitrairement un representant dans chaque classe dequivalence. Au vu du theor`eme
de Solovay, cela est inevitable. Notons que le contre-exemple de Sierpinski, mentionne
dans la Remarque III-54, reposait egalement sur laxiome du choix.
Mentionnons pour conclure deux autres paradoxes menant a` lexistence densembles non mesurables ; bien evidemment, tous deux reposent encore sur laxiome
du choix :
Bernstein a construit un sous-ensemble B R tel que B et R \ B intersectent
tout sous-ensemble ferme non denombrable de R. En particulier, tout compact
inclus dans B est au plus denombrable, donc de mesure nulle, et la regularite
de la mesure de Lebesgue impliquerait |B| = 0 si B etait mesurable. De meme
on aurait |R \ B| = 0... Ce paradoxe est etudie dans [Oxtoby, pp.2223]
Sierpinski a construit un ensemble E R2 tel que (i) E intersecte tout ensemble ferme mesurable de R2 de mesure positive, et (ii) on ne peut pas trouver trois points de E alignes. Il sensuit que E nest pas mesurable, sinon le
theor`eme de Fubini impliquerait que |E| = 0 (puisque lintersection de E avec
toute droite verticale est reduite `a au plus deux points), et on pourrait trouver un ensemble de mesure positive dans R2 \ E... On trouvera dans [Oxtoby,
p.5455] une preuve simplifiee (utilisant, outre laxiome du choix, lhypoth`ese
du continu).
` ce stade, on pourrait encore conserver lespoir de definir une mesure sur toutes
A
les parties de R, meme si elle ne pourrait verifier ni linvariance par translation (`a
cause du paradoxe de Vitali), ni la regularite (`a cause du paradoxe de Bernstein),
ni le theor`eme de Fubini (`a cause du paradoxe de Sierpinski). Au vu de toutes ces
restrictions, on peut douter de linteret quaurait une telle mesure ; quoi quil en
soit, ce dernier espoir est ruine par le theor`eme suivant, d
u `a Banach et Kuratowski,
generalise par Ulam [Dudley, pp.526527 ; Billingsley, p.37].
or`
The
eme IV-37. Soit une mesure finie sur la -alg`ebre de toutes les parties
de [0, 1], telle que [{x}] = 0 pour tout x [0, 1]. Alors est identiquement nulle.
Ce theor`eme egalement utilise laxiome du choix et lhypoth`ese du continu. Ici
lobstruction a trait `a la theorie des cardinaux, comme le montre une generalisation
abstraite due `a Ulam (voir [Oxtoby, p. 2526]).
IV-5.4. Contre-exemple de Hausdorff. Lexistence densembles non mesurables pourrait etre consideree comme un defaut majeur de la theorie de la mesure
telle que nous lavons evoquee. Apr`es tout, en mecanique classique, tous les objets
ont une masse, et la theorie de la mesure peut etre vue comme une tentative de formaliser le concept de masse dans un cadre abstrait. Un coupable tout designe serait
le fameux axiome de -additivite, impose pour des raisons mathematiques. Se pose
alors la question naturelle de savoir si lon peut remplacer la mesure de Lebesgue
par une fonction additive densembles, ou mesure finiment additive, `a savoir
une fonction verifiant [] = 0, et [A B] = [A] + [B] quand A et B sont
disjoints, qui serait definie sur lensemble de toutes les parties de Rn . On souhaite
en outre que cette fonction additive conserve la propriete naturelle dinvariance par
isometrie affine. Nous voici donc face `a la
Question : Existe-t-il des fonctions additives densembles definies sur toutes les
parties de Rn , non triviales, finies sur les compacts et invariantes par isometries ?

174

CHAPITRE IV

(13 juin 2010)

La reponse `a cette question est encore negative. Pour lexpliquer, introduisons


le concept densemble paradoxal, qui generalise `a un cadre finiment additif lidee
utilisee dans le contre-exemple de Vitali. Dans la suite, nous emploierons le terme de
mesure pour des fonctions additives qui ne sont pas forcement -additives, aucune
confusion netant possible.
D
efinition IV-38 (decoupage et recollement). Soient A et B deux ensembles
n
de R . On dit que A peut etre decoupe et recolle en B sil existe une partition
finie de A en morceaux A1 , . . . , Ak , et des deplacements (i.e. des isometries affines
de determinant 1) g1 , . . . , gk tels que les morceaux g1 (A1 ), . . . , gk (Ak ) forment une
partition de B.
Remarquons que cette definition ne correspond pas de tr`es pr`es au concept intuitif de decoupage et recollement : il se peut que les parties Ai soient imbriquees
de mani`ere tr`es complexe, de sorte que leur separation physique soit impossible.
Cependant, cest une approximation naturelle de ce concept.
efinition IV-39 (ensemble paradoxal). Un ensemble de Rn est dit paradoxal
D
si on peut le decouper et le recoller en deux copies disjointes de lui-meme.
Il est naturel de penser que de tels ensembles sont forcement de mesure nulle,
sinon on aurait une contradiction apparente avec le fait que les deux copies disjointes
doivent avoir deux fois le volume de lobjet originel. Lexistence meme densembles
paradoxaux semble douteuse. Le theor`eme suivant, d
u `a Hausdorff [Wagon, p. 18],
repond `a cette question.
eme IV-40 (paradoxe de Hausdorff). Il existe un sous-ensemble denombrable
eor`
Th
de la sph`ere S 2 tel que S 2 \ D soit paradoxal.
Ce paradoxe, qui utilise lui aussi laxiome du choix, repose sur la constatation suivante, dune grande importance en theorie des groupes : le groupe SO3
des deplacements lineaires de R3 , qui laisse la sph`ere S 2 invariante, admet pour
sous-groupe une copie du groupe libre `a deux elements. Un syst`eme explicite de
generateurs peut dailleurs etre construit, voir [Wagon, p. 15]. Voyons maintenant
ce que lon peut deduire de ce paradoxe.
Corollaire IV-41 (non-existence de mesures finiment additives). Soit une
mesure finiment additive definie sur toutes les parties de R3 , invariante par deplacement
et finie sur les compacts. Alors [K] = 0 pour tout compact de R3 .
emonstration. Soit une mesure verifiant les hypoth`eses, non nulle sur les
D
compacts ; il existe donc R > 0 tel que [R B 3 ] > 0, o`
u B 3 est la boule unite dans
3
R . Quitte `a remplacer par (m1/R )# , o`
u ma (x) = ax, on peut supposer que
3
[B ] > 0. Tous les singletons ont meme mesure pour , forcement nulle, sinon [A]
serait infini pour toute partie A infinie. La restriction de `a la boule privee de son
centre est donc une mesure finiment additive, bien definie et invariante par laction
de SO3.
Lapplication x 7 x/|x| envoie la boule privee de son centre sur la sph`ere S 2 ,
et transporte donc la mesure en une mesure non nulle sur S 2 , qui reste finiment
additive et invariante par laction de SO3 ; on la notera toujours . En particulier,
si D est la partie denombrable apparaissant dans le paradoxe de Hausdorff, on a
[S 2 \ D] = 2[S 2 \ D],

LA MESURE DE LEBESGUE

175

ce qui montre que [S 2 \ D] = 0.


Il reste `a verifier que D est de mesure nulle pour aboutir `a une contradiction.
Soit une ligne issue de lorigine, nintersectant pas D ; on definit R comme la
rotation dangle autour de . Lensemble des angles tels que R envoie au moins
un element de D dans D est denombrable ; en consequence, il existe au moins un
angle pour lequel D et R (D) sont disjoints. On en deduit que [D ] = 2[D]
[S 2 ], o`
u D = D R (D) ; en particulier [D] [S 2 ]/2. Comme D lui-meme
est denombrable, le meme raisonnement montre que [D ] [S 2 ]/2, en particulier
[D] [S 2 ]/4. Par recurrence, on montre que [D] [S 2 ]/2m pour tout m 1,
do`
u finalement [D] = 0.

IV-5.5. Paradoxe de BanachTarski. Du paradoxe de Hausdorff on pourrait deduire quil est trop ambitieux de chercher `a mesurer toutes les parties de
lespace Euclidien, au moins dans R3 . Les paradoxes dits de BanachTarski vont
plus loin et m`enent `a sinterroger sur le bien-fonde de laxiomatique mathematique
habituelle.
or`
The
eme IV-42 (paradoxes de BanachTarski). (i) Pour tout n 3, la boule
n
unite de R est paradoxale : on peut la decouper et la recoller en deux boules disjointes
de rayon 1 (pour cela, cinq morceaux sont necessaires et suffisants).
(ii) Soient A et B deux parties de Rn dinterieur non vide, n 3. Alors on peut
decouper A et le recoller en B.
Ces paradoxes sont discutes en detail dans [Wagon]. Le premier enonce, considere
par certains comme le theor`eme le plus surprenant de toutes les mathematiques,
est suffisamment incroyable pour quon lenonce sous une forme encore plus explicite : Il est possible de decouper une boule de rayon 1 en 5 morceaux A1 , . . . , A5 et
de trouver des isometries g1 , . . . , g5 telles que lunion des gi (Ai ) forme deux boules
disjointes, chacune etant de rayon 1.
En corollaire, au moins pour n 3, il est impossible de definir une mesure
finiment additive sur lensemble de toutes les parties de Rn , au moins pour n 3.
Il se trouve que la conclusion est differente pour n 2 !
Th
eor`
eme IV-43 (existence de mesure finiment additive dans R2 ). Pour n = 1
ou n = 2, il est possible de definir une mesure finiment additive sur toutes les
parties de Rn , qui soit invariante par deplacement et concide avec la mesure de
Lebesgue sur tous les paves.
Tous ces resultats, et bien dautres qui leur sont lies, sont demontres et commentes dans [Wagon]. Le theor`eme IV-43 ne pretend pas que la mesure concide
avec la mesure de Lebesgue sur tous les Boreliens, ce qui laisse un doute quant `a la
possibilite de lutiliser. Quoi quil en soit, la difference de comportement entre les
dimensions inferieures ou egales `a 2 dune part, et superieures ou egales `a 3 dautre
part, refl`ete des differences fondamentales dans la structure des groupes disometries
correspondants, qui a donne naissance `a la notion de groupe moyennable, aujourdhui
une branche importante de la theorie geometrique des groupes.
La conclusion du paradoxe de BanachTarski, qui ne fait pas intervenir le concept
de mesure, semble si choquante pour le sens commun, que lon peut se demander sil
ne faut pas revoir lensemble des axiomes qui a permis de letablir. Cest loccasion
de discuter un peu plus en detail de laxiome du choix...

176

CHAPITRE IV

(13 juin 2010)

IV-5.6. Axiome du choix. Lecrasante majorite des demonstrations mathematiques,


en-dehors du domaine de la logique, repose sur un ensemble daxiomes incontestables, appele couramment theorie des ensembles ZF (ZermeloFraenkel). Cette
theorie permet de construire les entiers, les rationnels, les reels, etc. On peut ajouter,
ou pas, `a cette theorie laxiome dit axiome du choix, qui enonce, essentiellement, que
le produit densembles non vides est toujours non vide. En clair, etant donnee une
collection densembles non vides, on peut choisir un element dans chacun dentre
eux, et rassembler tous les elements ainsi choisis en un ensemble. Cet axiome peut
paratre inoffensif, mais il est suffisant `a aboutir `a des paradoxes tels que ceux de
Vitali, Hausdorff ou BanachTarski. En outre il nest pas tr`es intuitif, car dans le
cas o`
u la famille densembles est infinie on ne pourra jamais construire explicitement
leurs representants.
Dun autre cote, si lon supprime compl`etement laxiome du choix, on tombe
vite sur des paradoxes qui heurtent le sens mathematique commun. Ainsi, ZF est
compatible avec lassertion selon laquelle R est union denombrable densembles
denombrables... Cela montre bien que nous utilisons sans nous en rendre compte
des versions de laxiome du choix. Largument diagonal de Cantor en fournit un
exemple !
Une variante de laxiome du choix qui permet deviter ce genre de paradoxe,
et en meme temps nest pas assez forte pour impliquer lexistence densembles
non mesurables, est laxiome du choix d
enombrable, qui enonce quun produit
denombrable densembles non vides est non vide.
Une variante leg`erement plus forte est laxiome du choix d
ependant : etant
donne une famille denombrable densembles En , pour tout n on peut choisir xn En ,
dependant de xn1 dune mani`ere que lon specifie. La theorie obtenue en ajoutant
cet axiome `a ZF permet deffectuer (presque) tous les raisonnements habituels en
analyse, et reste compatible avec la non-existence densembles mesurables. En particulier, la demonstration des paradoxes de Vitali, Hausdorff et BanachTarski est
impossible dans ce contexte.
Notons pour finir quil existe un autre axiome cel`ebre que lon peut ou pas imposer, et que nous avons dej`a rencontre dans certains paradoxes, cest lhypoth`
ese
du continu, `a savoir que R est le plus petit ensemble infini non denombrable.
IV-5.7. Quelle attitude adopter ? Au vu de la discussion precedente, il y a
(au moins) trois attitudes possibles :
- lattitude classique : accepter laxiome du choix, se resoudre `a ce que certains
ensembles ne soient pas mesurables, et verifier la mesurabilite des objets avec lesquels
on travaille, quand il y a besoin ;
- lattitude iconoclaste : naccepter que laxiome du choix dependant, postuler la
mesurabilite de toutes les parties de R, et se resoudre `a ce que laxiome du choix ne
soit pas vrai ;
- lattitude sceptique : sinterdire lusage de laxiome du choix, mais sans supposer
a priori la mesurabilite de toutes les parties de Rn .
Lattitude classique est le choix le plus repandu dans les mathematiques des
derni`eres decennies. Laxiome du choix m`ene parfois `a des demonstrations relativement elegantes et `a des enonces synthetiques ; nous le verrons par exemple quand
nous parlerons de mesure de Haar au Chapitre ??. Laxiome du choix apparat sous
de nombreux avatars tels que le Lemme de Zorn, ou le Theor`eme de Tychonov

LA MESURE DE LEBESGUE

177

dans sa version la plus generale (un produit de compacts est compact). Il a bien
s
ur le defaut considerable de mener aux paradoxes de BanachTarski evoques plus
haut ; mais on pourra objecter que les mathematiques contiennent dautres enonces
paradoxaux qui ne necessitent pas laxiome du choix.
Lattitude iconoclaste est quelque peu dangereuse, car cela reclame une discipline
importante que de savoir quels sont les resultats qui necessitent laxiome du choix
et quels sont ceux qui ne le reclament pas. Ainsi, le theor`eme de HahnBanach, ou
le theor`eme de BanachAlaoglu, dans leurs versions les plus generales, necessitent
laxiome du choix. En outre, laxiome que lon adopte (la non-existence de parties
non mesurables) est un axiome tr`es fort, et probablement inutile.
Cest finalement lattitude sceptique que je recommande vivement. Elle nexclut
pas, bien s
ur, de recourir `a laxiome du choix dans une phase prospective de recherche
de preuve.
IV-5.8. Justification pratique de la mesurabilit
e. Comme nous lavons vu,
on ne peut construire une application non mesurable que si on cherche absolument `a
le faire ; justifier la mesurabilite dune application est donc en general une operation
de routine. En pratique, il ny a gu`ere quune situation `a laquelle il faut prendre
garde : si f (x, y) est une fonction de deux variables, disons reelles, il ny a pas de
raison a priori pour que la fonction
f : x 7 sup f (x, y)
y

soit mesurable. Dans la pratique, on cherche toujours, en presence dune telle situation, `a se ramener `a un supremum pris sur une famille denombrable.
Exemple IV-44. Soit f : Rn R une fonction localement n -sommable ; on
definit la fonction maximale de f par
Z
1
Mf (x) := sup
f,
r>0 |Br (x)| Br (x)
o`
u Br (x) designe la boule Euclidienne de rayon r, centree en x. La famille des r > 0
nest pas denombrable, la mesurabilite de Mf nest donc pas evidente a priori.
Cependant, etant donnes deux rationnels q et q tels que q r q , on a
Z
Z
Z
|Bq (x)| |Br (x)| |Bq (x) |;
f
f
f.
Bq (x)

Br (x)

Bq (x)

Le supremum sur tous les nombres reels positifs peut donc etre remplace par un
supremum sur tous les nombres rationnels positifs. La fonction maximale est donc
effectivement mesurable !
Une situation du meme type, dont on ne peut malheureusement pas se tirer si
facilement, survient quand on consid`ere des sommes de Minkowski :


A + B := x Rn ; a A; b B; x = a + b .

Dans un tel cas, la mesurabilite de A et B nimplique pas forcement celle de A + B.


Pour y remedier, on fera par exemple lhypoth`ese que A et B sont compacts, auquel
cas A + B lest egalement ; ou bien on utilisera des mesures exterieures.

178

CHAPITRE IV

(13 juin 2010)

Remarque IV-45. On eprouve parfois le besoin, en theorie geometrique de


la mesure, de definir les ensembles sousliniens comme les images des ensembles
Lebesgue-mesurables par des applications continues ; on peut donner une description
plus ou moins explicite de tels ensembles, en termes dunions transfinies dintersections de fermes, voir [Falconer1, p. 6]. Il est clair que la somme de Minkowski de
deux ensembles mesurables fait partie de cette categorie...
IV-5.9. Subtilit
es li
ees au produit. Plus graves que les exemples precedents
sont les subtilites liees `a la structure de produit tensoriel. En effet, si lon note
L(Rn ) la tribu des ensembles Lebesgue-mesurables en dimension n, et si lon admet
lexistence de parties non mesurables, alors
L(Rm ) L(Rn ) 6= L(Rm+n )!

Pour sen convaincre, il suffit de choisir un ensemble non Lebesgue-mesurable X


dans R, et de lenvoyer sur la diagonale (y = x) dans R2 , via lapplication : x 7
(x, x), ou sur laxe horizontal (y = 0) dans R2 , via lapplication : x 7 (x, 0).
Comme la diagonale (ou laxe horizontal) est de mesure nulle dans R2 , (X) est
negligeable, et en particulier mesurable ; mais son image reciproque par nest pas
mesurable. La conclusion est que la tribu L(R) L(R) ne contient pas (X) ; cette
tribu est en fait strictement plus petite que la tribu L(R2 ).
Comme corollaire particuli`erement deplaisant de ce contre-exemple, la formule
de d
ecoupage en tranches,
Z
2 [A] =
1 [Ax ] dx,
R

o`
u Ax := {y R; (x, y) A} nest pas valide pour un ensemble Lebesgue-mesurable
quelconque (sauf si lon postule que toutes les parties sont mesurables...) Cette
formule redevient valide si lon definit les tranches apr`es avoir modifie A sur un
ensemble de mesure nulle bien choisi (voir [Rudin, pp.168-169]).

IV-5.10. Quelle tribu utiliser ? La tribu de Lebesgue est obtenue `a partir de


la tribu borelienne simplement par completion. A priori, cette operation devrait
rendre les raisonnements plus simples. Cependant, le paragraphe precedent a bien
montre quelle implique des subtilites importantes. Cest pourquoi je recommande
de travailler uniquement avec la tribu bor
elienne chaque fois que cela est
possible, cest-`a-dire dans la grande majorite des probl`emes danalyse. Louvrage
[LiebLoss] est un exemple de traite danalyse reelle enti`erement basee sur la tribu
borelienne.

CHAPITRE V

Les mesures de Hausdorff


Dans ce chapitre, nous etudions les mesures de Hausdorff, qui generalisent la
mesure de Lebesgue. Il est utile, dans de nombreux domaines des mathematiques,
detre un tant soit peu familier avec ces mesures, meme si elles nont pas la meme
importance pratique que la mesure de Lebesgue.
V-1. Motivations
La theorie des mesures de Hausdorff est nee une quinzaine dannees apr`es celle
de la mesure de Lebesgue, et fut developpee principalement par Besicovich pendant
les quarante annees qui ont suivi. Elle repondait `a plusieurs motivations.
V-1.1. Mesures dobjets de dimension inf
erieures. Placons-nous en dimension 3 pour simplifier la discussion. La mesure de Lebesgue 3 permet dattribuer `a toutes les parties (mesurables) de R3 un volume ; mais dans de nombreux
probl`emes on a besoin de definir laire dune surface, ou la longueur dune courbe
tracee dans R3 . La mesure de Lebesgue de tels objets est bien s
ur nulle, ce qui
sugg`ere lintroduction de nouvelles mesures pour definir les concepts daire ou de
longueur de parties de R3 . Bien s
ur, on sattend `a ce que laire dun objet soit infinie
si son volume est non nul, de sorte que ces nouvelles mesures seraient interessantes
uniquement quand on les appliquerait `a des ensembles Lebesgue-negligeables.
Cest dans cette perspective que Caratheodory construisit, vers 1914, des mesures
de dimension k dans Rn , avec 1 k < n, grace `a la notion de mesure exterieure
quil venait de developper.
V-1.2. Changements de variables. Nous avons vu au chapitre precedent des
formules faisant intervenir un changement de variables T entre sous-ensembles de
Rn , et note lapparition du determinant Jacobien | det T |. Quadvient-il si notre
changement de variables fait intervenir des fonctions Rm Rn , avec, par exemple,
m > n ? Nous avons dej`a rencontre un exemple tr`es simple : le theor`eme de Fubini
peut etre considere comme un changement de variables z Rm+n (x, y) Rm Rn
avec z = (x, y), et on peut ecrire

Z
Z Z
f (z) dm+n (z) =
f (x, y) dn(y) dm (x).
Rm+n

Rm

Rn

Bien s
ur, dans ce cas il ny a aucun probl`eme car le changement de variables correspond `a un produit cartesien ; mais que se passe-t-il quand les choses sont plus
complexes ?
Un exemple familier et tr`es utile est le changement de variables polaire
(aussi appele changement de variables spherique), dans lequel on troque la variable
x Rn \ {0} pour le couple (r, ) R+ S n1 , avec r := |x| et := x/|x|. Comment
ecrire la formule de changement de variables correspondante ? Voici comment pourrait raisonner un physicien ou un ingenieur : Faisons varier r dans un intervalle

180

CHAPITRE V

(13 juin 2010)

infinitesimal [r dr, r + dr] et `a linterieur dun disque infiniment petit trace


sur la sph`ere S n1 , de centre et de surface d. La region ainsi visitee par le point
x est, `a des infiniment petits dordre superieur pr`es, un cylindre centre en r, dont
la hauteur est 2 dr et la section a (par homogeneite) une surface r n1 d. On en
deduit la formule de changement de variable
dx = r n1 dr d.

11111
00000
00000
11111
00000
11111
00000
11111

S n1

Fig. 1. Element de volume autour de x dans les variables spheriques


Quelle est la signification de ce symbole d, que lon peut interpreter comme
une mesure daire infinitesimale sur la sph`ere S n1 ? Il sagit bien de lelement
dintegration par raport `a une mesure sur S n1 , que lon peut introduire comme
la restriction `a S n1 de la mesure de Hausdorff de dimension n 1 dans Rn . Il est
donc parfaitement licite decrire

Z
Z Z
f (r) d r n1 dr.
f (x) dx =
Rn

R+

S n1

Il y a bien dautres facons de definir : par exemple, comme lelement de volume


sur S n1 , vu comme une variete Riemannienne. On peut egalement, en basse dimension la definir au moyen de coordonnees explicites, ce qui est commode pour effectuer
des calculs : ainsi, quand n = 2, on peut identifier `a un angle dans [0, [ et ecrire
dx = r dr d ; quand n = 3 on introduit traditionnellement deux angles solides
[0, ] et [0, 2[, tels que (par exemple) = (sin cos , sin sin , cos ),
et alors la formule correspondante est dx = r n1 dr sin d d... Mais cest linterpretation en termes de restriction de mesure de Hausdorff qui sav`ere conceptuellement la plus naturelle pour generaliser la formule de changement de variables.
V-1.3. Notion de dimension. Nous avons lhabitude de penser quune courbe
reguli`ere est de dimension 1, car on peut localement la deformer contin
ument
en un morceau de droite ; de mani`ere plus generale, il est naturel de penser `a un

LES MESURES DE HAUSDORFF

181

ensemble comme etant de dimension k si on peut le decrire localement au moyen de


k fonctions independantes ; en particulier limage par une application reguli`ere dun
ensemble de dimension k devrait etre de dimension au plus k.
De tels enonces sont effectivement vrais quand on travaille avec des fonctions
reguli`eres ; mais il est possible de construire des courbes continues surjectives de
[0, 1] dans [0, 1]2 , dites courbes de Peano. Limage dune telle courbe est incontestablement de dimension 2... Cet exemple montre bien quil est impossible de definir
une notion de dimension qui soit basee sur les dimensions despaces de depart et
darrivee. Comment determiner si limage dune fonction continue [0, 1] [0, 1]2 ,
non surjective, doit etre consideree comme etant de dimension 0, 1 ou 2 ?
Le point de vue adopte en theorie de la mesure est le suivant : pour definir la
dimension dun objet, on essaie de le mesurer par toute une famille de mesures, qui
sont associes `a des objets de dimension determinee. Ainsi, si un objet a une longueur
positive non nulle, il est naturel de penser quil est de dimension 1 ; sil a une surface
positive non nulle, de dimension 2. Ce sont les mesures de Hausdorff qui vont jouer
ce role en definissant rigoureusement les notions de longueur, surface, etc.
Comme la decouvert Hausdorff vers 1919, il est en fait possible de definir ces
mesures pour des dimensions non enti`eres, et den deduire une notion de dimension
qui peut elle aussi etre non enti`ere. Cest cette contribution, techniquement simple
mais conceptuellement remarquable, qui a valu `a son nom de rester attache aux
mesures de Hausdorff et `a la dimension ainsi definie, dite dimension de Hausdorff.
La dimension de Hausdorff permet de definir un ordre dans la notion de negligeabilite :
plutot que de dire quun objet est de mesure de Lebesgue nulle, on pourra souvent
dire plus precisement quil est de telle ou telle dimension de Hausdorff. Comme on
sy attend, un point sera de dimension 0, un segment de droite de dimension 1, etc.
On note d`es `a present quil existe une autre notion de dimension, anterieure `a
celle de dimension de Hausdorff, qui est souvent plus simple a` manipuler, meme
si son usage est moins courant que celui de la dimension de Hausdorff : cest la
dimension de Minkowski. Cependant, lun des grands avantages du formalisme
de Hausdorff, cest quil fournit `a la fois une notion de dimension et une notion de
mesure.
Dans les derni`eres decennies, letude des objets fractals sest developpee considerablement, motivee par les progr`es de linformatique, les suggestions visionnaires de
Mandelbrot, et la decouverte de formalismes fractals dans des domaines aussi varies
que la mecanique des fluides, les syst`emes dynamiques chaotiques, la theorie du
signal, etc. Les mesures de Hausdorff, dej`a tr`es utilisees par les specialistes de theorie
geometrique de la mesure, en particulier dans le domaine du calcul des variations,
se sont alors imposees comme lun des outils-cles dans letude des objets fractals
[Falconer].
V-1.4. Mesures de r
ef
erences abstraites. Comme nous lavons vu au chapitre precedent, ses proprietes dinvariance font de la mesure de Lebesgue une mesure
de reference naturelle dans Rn . Si maintenant on se donne un espace metrique abstrait (X, d), peut-on y definir une mesure borelienne de reference naturelle ? Les
mesures de Hausdorff sont de bons candidats pour cela. En effet, pour toute dimension N, on peut definir a priori sur (X, d) une mesure de Hausdorff de dimension N
(qui malheureusement sera souvent triviale). Ainsi, si X est une variete de dimension
n, muni de sa distance geodesique, alors la mesure de Hausdorff N-dimensionnelle

182

CHAPITRE V

(13 juin 2010)

sur X concidera avec la mesure de volume quand N = n, et avec la mesure nulle


quand N > n.
V-2. Construction des mesures de Hausdorff
V-2.1. D
efinition. La mesure de Lebesgue, ou longueur, dune partie A de R
est definie comme linfimum des sommes des longueurs des intervalles recouvrant A :
nX
o
|A| := inf
(Ik ); Ik intervalle; A Ik .

Cest cette definition que lon a envie de generaliser. En dimension plus grande que 1,
les candidats naturels pour jouer le role dintervalles sont les boules. Un calcul assez
simple (base sur un changement de variable polaire !) montre que le volume de la
boule de rayon r en dimension d N est
|Br |d = (d)r d,

(d) :=

d/2
,
d2 + 1

R
o`
u (x) := 0 et tx1 ds est la fonction habituelle.
Si lon cherche `a definir des dimensions d non enti`eres, il est naturel (mais non
obligatoire) dutiliser la meme formule pour (d), ce qui revient `a prolonger par
analyticite la fonction volume dune boule de rayon r en dimension d.
Voici maintenant une premi`ere tentative de construction de la mesure d-dimensionnelle,
copiant la definition de la mesure de Lebesgue :
)
(

[
X
d
d
Brk (xk )
?
(d)rk ; A
[A] := inf
k=1

k=1

On se rend compte tout de suite que cette definition est absurde : le volume 1dimensionnel dune boule de R2 serait fini ! Le probl`eme vient de ce que la notion de
dimension doit dependre uniquement de la structure locale dun objet, et que donc
on doit forcer le recouvrement par des boules `a epouser les details de lensemble
A ; autrement dit, il faut definir la mesure d-dimensionnelle en fonction de recouvrements par des petites boules. Avec la mesure de Lebesgue sur R, cette propriete
etait superflue : un gros intervalle de longueur L peut se partager en L/ petits
intervalles de longueur , et les deux recouvrements ainsi obtenus sont equivalents
en termes de mesure.
Nous arrivons ainsi `a une deuxi`eme tentative de definition de mesure d-dimensionnelle :
(
)

X
[
d [A] := lim inf
(d)rkd; A
Brk (xk ); rk .
0

k=1

k=1

La mesure ainsi definie est dite mesure de Hausdorff sph


erique [Falconer1, p. 7].
Elle a le defaut de reposer sur la notion de boule, qui nest pas invariante par
restriction : si A Rn , et B Rn est une boule de rayon r, alors A B nest pas
forcement une boule dans A (il suffit que le centre de la boule nappartienne pas `a
A...). Ce qui est vrai en revanche, cest que le diam`etre de A B est inferieur ou
egal `a 2r.
Pour avoir une notion aussi intrins`eque que possible, et etre s
ur que la mesure
dun objet ne depend pas de la taille de lespace dans lequel on le plonge, on souhaiterait donc definir les mesures de Hausdorff en fonction des diam`etres, sans reference

LES MESURES DE HAUSDORFF

183

`a la notion de boule. Nous arrivons ainsi `a la definition finalement retenue pour les
mesures de Hausdorff :
D
efinition V-1 (mesure de Hausdorff). Soient A Rn , et d R+ . On definit
la mesure de Hausdorff d-dimensionnelle de A par
)
(

[
X
Ck diam (Ck ) ,
(37)
Hd [A] = lim inf
(d) r(Ck )d ; A
0

k=1

k=1

o`
u les Ck sont des parties arbitraires de Rn , r(Ck ) := diam (Ck )/2 est le demidiam`etre de Ck , et
d/2
(d) := d
( 2 + 1)

est le volume de la boule unite de dimension d.


Remarques V-2.

(i) Posons
(
X
Hd [A] = inf
(d)r(Ck )d ;
k=1

Ck

k=1

diam (Ck ) .

Comme Hd [A] est clairement une fonction decroissante de , lexistence de


lim0 Hd [A] est assuree, et cette limite est un supremum.
(ii) Soit A tel que Hd [A] < +, alors pour tout > 0 on a Hd [A] < +, et
pour tout > 0 on peut trouver une famille denombrable (Ck ) densembles de
diam`etre au plus , recouvrant A, telle que

(d)r(Ck )d Hd [A] + .

(d)r(Ck )d Hd [A] + .

k=1

Pour tout k > 0, lensemble Ck des points dont la distance `a Ck est strictement
inferieure `a k est un ouvert contenant AP
; en choisissant
petit,
P k suffisamment
d
d
on peut faire en sorte que les quantites
r(Ck ) et
r(Ck ) ne diff`erent pas
de plus que . On a donc lenonce suivant : Pour tous > 0, > 0 et >
on peut trouver une famille denombrable (Ck ) douverts, de diam`etre au plus
, recouvrant A, telle que

k=1

En remplacant les Ck par les Ck , on voit egalement que le mot ouverts dans
lenonce precedent peut etre remplace par fermes. En faisant ensuite tendre
et vers 0, on verifie facilement que la definition de la mesure de Hausdorff est
inchangee si lon impose au recouvrement detre constitue densembles ouverts
(resp. fermes).
Lenonce suivant justifie la terminologie mesure de Hausdorff.
Proposition V-3 (la mesure de Hausdorff est une mesure de Borel). Pour tout
d 0, la fonction A 7 Hd [A] est une mesure exterieure sur Rn , et definit une
mesure sur la tribu Borelienne B(Rn ).

184

CHAPITRE V

(13 juin 2010)

D
emonstration. Il est clair que Hd [] = 0 et que Hd est une fonction croissante
densembles. On verifie facilement que
X
Hd [Ak ].
Hd [Ak ]
kN

En passant `a la limite 0 dans le terme de gauche, et en utilisant linegalite


Hd Hd dans le terme de droite, on trouve
X
Hd [Ak ].
Hd [Ak ]
kN

La fonction Hd est donc sous-additive : cest bien une mesure exterieure, definie sur
lensemble de toutes les parties de Rn .
Soit M la tribu des ensembles Hd -mesurables, au sens de lenonce du Theor`eme I71 ; on sait que H definit une mesure sur M. Pour verifier que M contient toutes les
parties boreliennes, on utilise le crit`ere de Caratheodory presente au Theor`eme I-79.
Soient donc A et B deux parties de Rn verifiant d(A, B) > 0, on cherche `a montrer
que
Hd [A B] = Hd [A] + Hd [B].
Pour tout < d(A, B)/2, un ensemble de diam`etre ne peut intersecter `a la fois
A et B ; si lon se donne un recouvrement de A B par des ensembles de diam`etre
au plus on pourra donc en extraire des sous-recouvrements disjoints de A et B
en considerant dune part les ensembles qui intersectent A, dautre part ceux qui
intersectent B. On en deduit que Hd [A B] = Hd [A] + Hd [B], et la conclusion en
decoule par passage `a la limite.

Exemples V-4.
(i) Soit A = {x0 } un singleton. Il est clair que lon peut
recouvrir A par une boule de rayon nul, ce qui est de volume d-dimensionnel
nul pour tout d > 0. Il sensuit que H0 [A] = 1, Hd [A] = 0 pour tout d > 0.
Par -additivite, pour tout A denombrable, H0 [A] nest autre que le cardinal
de A ; et cette identite reste valable si A nest pas denombrable. On conclut
que H0 nest autre que la mesure de comptage.
(ii) Il est facile de verifier que la mesure de Hausdorff H1 dans R nest autre que
la mesure de Lebesgue. Le caract`ere intrins`eque de la definition de H1 garantit
que le mesure H1 restreinte `a un segment de droite de R2 est egalement la
mesure de Lebesgue sur ce segment de droite (vu comme sous-ensemble dune
copie de R).

(iii) Soit la mesure definie sur R2 par


Z
Z 1
f d =
f (0, t) dt.
0

Un peu de reflexion montre que = 0 H1 [0,1] , o`


u le symbole signifie
restriction.
(iv) On pourra montrer en exercice que si I = [x, y] est un segment de droite
dans R2 (non reduit `a un point), alors Hd [I] vaut + si d < 1, |x y| si d = 1
et 0 si d > 1.

LES MESURES DE HAUSDORFF

185

V-2.2. Propri
et
es
el
ementaires. Commencons par un crit`ere de negligeabilite,
consequence immediate de la structure de mesure exterieure :
Proposition V-5 (crit`ere pratique de Hausdorff-negligeabilite). Soit A Rn .
Alors Hd [A]P
= 0 si et seulement si on peut inclure A dans une union densembles
d
Bk tels que
k=1 diam (Bk ) est arbitrairement petit.
Cet enonce generalise le crit`ere de negligeabilite habituel pour la mesure de
Lebesgue dans R : un sous-ensemble de R est de mesure nulle si et seulement si on
peut linclure dans une union denombrable dintervalles dont la somme des longueurs
est arbitrairement petite.
Voici maintenant une propriete bien commode des mesures de Hausdorff, qui
explique en partie le role privilegie des fonctions Lipschitziennes dans ce contexte :

Proposition V-6 (borne sous laction des fonctions Lipschitziennes). (i) Soit
f une fonction k-Lipschitzienne definie sur un borelien de Rn , `a valeurs dans Rm ,
alors pour tout ensemble borelien B A et pour tout d [0, n] on a
Hd [f (A)] k d Hd [A].

(ii) Plus generalement, si f et g sont deux fonctions definies sur un borelien de


Rn , a` valeurs dans Rm , telles que pour tous x, y A on ait
|f (x) f (y)| |g(x) g(y)|,

alors pour tout borelien B A et pour tout d [0, n] on a


Hd [f (A)] Hd [g(A)].

D
emonstration. Si f est k-Lipschitzienne, en passant au supremum pour
(x, y) B B dans linegalite |f (x) f (y)| k|x y|, on voit que pour tout
ensemble C A, diam (f (C)) kdiam (C). Lenonce (i) en decoule immediatement.
La demonstration de (ii) est similaire : lhypoth`ese implique diam (f (C))
diam (g(C)).

Passons maintenant `a des proprietes dinvariances, qui elles aussi decoulent directement de la definition :
Proposition V-7 (invariance par isometrie-multiplication). Soit T une application affine de la forme
T (x) = Ax + b,
o`
u A est une isometrie, > 0 et b Rn . Alors
T #Hd = d Hd .

En particulier, pour tout Borelien C, on a Hd [C +b] = Hd [C] et Hd [C] = d Hd [C],


et Hd est 2d -doublante.

Remarque V-8. Lors dun changement de variables dans une integrale faisant
intervenir des mesures de Hausdorff, ce nest donc pas le determinant Jacobien qui
apparat, meme pour des operations de multiplication scalaire.
La propriete V-7 peut sembler etrange si lon se souvient de la caracterisation de
la mesure de Lebesgue par son invariance sous laction des translations : les mesures
de Hausdorff verifient la meme propriete dinvariance ! Il ny a pas de contradiction
car les mesures de Hausdorff, malgre leur propriete de doublement, sont souvent tr`es
singuli`eres (ou triviales), comme le montre la propriete suivante.

186

CHAPITRE V

(13 juin 2010)

Proposition V-9. Soit Cn := [0, 1[n Rn ; alors Hd [Cn ] = + pour tout d < n
et 0 pour tout d > n. En particulier,
- si d < n, alors Hd [O] = + pour tout ouvert (non vide) de Rn ;
- si d > n, alors Hd est la mesure nulle sur Rn .

D
emonstration. Pour tout k 1, on peut partager Cn en 2nk petits cubes
semi-ouverts de cote 2k , qui sont tous de mesure 2dk Hd [Cn ], par la Proposition V7. La -additivite implique donc
Hd [Cn ] = 2nk 2dk Hd [Cn ].

Si Hd [Cn ]
/ {0, +} on a donc forcement n = k.
Dans le cas o`
u d > n, on peut appliquer la Proposition V-5 : les petits cubes
sont de diam`etre n2k , et la somme de leurs diam`etres `a la puissance d vaut donc
2nk nd/2 2dk 0.
k

Il sensuite que H [Cn ] = 0. Comme R est union denombrable de copies de Cn , il


sensuit que Hd [Rn ] = 0.
Dans le cas o`
u d < n, pour montrer que Hd [Cn ] = + il suffit de montrer que
Hd [Cn ] > 0. On peut raisonner comme suit : si Bk est un ensemble de diam`etre 2rk ,
alors on peut linclure dans une boule euclidienne de rayon 2rk , et n [Bk ] 2n (n)rkn .
On a donc, pour tout recouvrement de Cn par des ensembles Bk de demi-diam`etre
rk 1,
X
X
X
1 = n [Cn ]
n [Bk ] 2n (n)
rkn 2n (n)
rkd ,
k

et en passant `a linfimum on voit que Hd [Cn ] 1/(2n (n)). Il sensuit que Hd [Cn ] =
+, et donc Hd [C] = + pour tout cube semi-ouvert de Rn . On conclut en notant
que tout ouvert contient un cube semi-ouvert.

V-2.3. R
egularit
e. Il resulte de la Proposition V-9 que la mesure de Hausdorff
Hd en dimension n > d nest ni -finie, ni reguli`ere au sens de la Definition I-48.
Cependant, la propriete I-49 (que de nombreux auteurs appellent aussi regularite)
reste vraie :

or`
The
eme V-10 (regularite de la mesure de Hausdorff). Soit d 0, et soit
n
A R une partie quelconque. Alors
(i) Il existe G, intersection denombrable douverts contenant A, telle que
Hd [G] = Hd [A];
(ii) Si A est Hd -mesurable et Hd [A] < +, alors il existe F , union denombrable
de fermes contenus dans A, telle que
En particulier,

Hd [F ] = Hd [A].


Hd [A] = sup Hd [K]; K compact; K A .

Remarque V-11. Lenonce (i) peut surprendre, puisque G est lintersection


decroissante des Uk , o`
u chaque Uk est une intersection finie douverts, donc un ouvert ; si Hd [A] < + on a donc
Hd [A] = Hd [G] < lim Hd [Uk ] = +.

LES MESURES DE HAUSDORFF

187

Pourquoi cela nest-il pas en contradiction avec la -additivite de Hd ?


D
emonstration du Th
eor`
eme V-10. (i) Sans perte de generalite, on supd
d
pose que H [A] < +. Pour tout k, on a H1/k
[A] Hd [A] < +, et par la

remarque V-2(ii), on peut trouver un recouvrement de A par des ouverts Ck,j


de
diam`etre au plus 2/k, tel que
X
1

d
(d) r(Ck,j
)d H1/k
[A] + .
k
j
On pose alors

Ok :=

Ck,j
,

G :=

jN

Ok .

k1

Il est clair que G contient A, et dautre part pour tout k on a


X
1
d

d
H2/k
[G]
(d) r(Ck,j
)d H1/k
[A] + .
k
j

Il sensuit que Hd [G] Hd [A], do`


u la conclusion.

(ii) Chacun des ouverts Ok peut secrire comme union denombrable croissante
de fermes Fk,j (j N). Par -additivite,
lim Hd [A Fk,j ] = Hd [A Ok ] = Hd [A].

Pour tout > 0 et k 1 on choisit jk tel que

Hd [A Fk,jk ] Hd [A] 2k .

On pose

F :=

Fk,jk ;

k1

on a alors Hd [A F ] Hd [A] . Attention, rien ne garantit que F soit inclus


dans A ! Cependant, F est inclus dans Ok = G, et Hd [G \ A] = 0, il sensuit que
Hd [F \ A] = 0. Par la partie (i) du theor`eme, il existe un ensemble G , intersection
denombrable douverts, de mesure nulle, tel que F \ A G . Alors F := F \ G est
contenu dans A, cest une intersection denombrable de fermes, et
Hd [F ] Hd [F ] Hd [G ] = Hd [F ] Hd [A] .
T
On conclut en posant F := k1 F1/k .

Les mesures de Hausdorff verifient certaines des proprietes de densite au sens de


Lebesgue. On etablit ainsi le theor`eme suivant [Evans-Gariepy, pp. 72-75]
or`
The
eme V-12 (densite au sens de Hausdorff). Soit A Rn un ensemble
H -mesurable, avec Hd [A] < +, 0 < d < n. Alors pour Hd -presque tout x A,
d

2d lim sup
r0

Hd [Br (x) A]
1
(d)r d

et pour H -presque tout x R \ A,

Hd [Br (x) A]
= 0.
r0
(d)r d
lim

188

CHAPITRE V

(13 juin 2010)

Remarque V-13. Il ne faut pas etre surpris par la dissymetrie des deux enonces :
les ensembles Hd -mesurables de mesure finie sont tr`es petits, en particulier leur
complementaire est toujours de mesure infinie. En tous les cas, il nest pas toujours
vrai que Hd -presque tout point x de A soit regulier, au sens o`
u on aurait
Hd [B(x, r) A]
= 1.
r0
(d)r d
lim

Un travail considerable a ete accompli dans la deuxi`eme moitie du vingti`eme


si`ecle pour preciser lenonce ci-dessus et decrire les ensembles Hd -mesurables de
mani`ere plus precise. De mani`ere generale, on peut decomposer un ensemble Hd mesurable en une partie reguli`ere, dont Hd -presque tous les points sont reguliers, et
une partie totalement irreguli`ere, dont Hd -presque aucun point nest regulier. Les
proprietes de ces ensembles et leur description geometrique (existence de tangentes,
etc.) occupent une bonne partie de [Falconer1], et constituent encore un domaine de
recherche en activite.
V-2.4. G
en
eralisation abstraite. Il est facile de generaliser la notion de mesure de Hausdorff `a un espace metrique X arbitraire : il suffit dutiliser la formule (37)
pour A X, en prenant linfimum sur tous les recouvrements de A par des parties
Bk de X, de diam`etre au plus .
V-3. Identification des mesures de Hausdorff
Quand d nest pas un entier, il est difficile dinterpreter la mesure de Hausdorff Hd
dune mani`ere intuitive ; elle definit une sorte de volume en dimension fractionnaire,
quil vaut sans doute mieux considerer de mani`ere purement formelle. En revanche,
quand d est un entier, la question se pose de savoir si on retrouve des concepts
familiers de longueur, surface, volume, etc.
Juste apr`es avoir defini la notion de mesure de Hausdorff, nous avons remarque
que la mesure de Hausdorff 0-dimensionnelle concide avec la mesure de comptage.
Nous allons maintenant voir quil y a bien identite entre les deux notions naturelles de volume n-dimensionnel dans Rn , donnees respectivement par la mesure
de Lebesgue et par la mesure de Hausdorff n-dimensionnelle. Nous verrons aussi
que la mesure de Hausdorff 1-dimensionnelle prolonge une definition courante de la
longueur.
V-3.1. In
egalit
e isodiam
etrique. Soit A Rn , de demi-diam`etre r. Il est
clair que le volume de A est egal `a (n)r n si A est une boule, mais que peut-on dire
dans le cas general ? On est tente de penser que A est inclus dans une boule de rayon
r, ou r + avec > 0 arbitrairement petit, mais ce nest pas forcement le cas, comme
le montre lexemple dun triangle de cote 1 dans R2 est de diam`etre 1. Cependant,
linegalite isodiametrique assure que le volume dun tel ensemble est inferieur ou
egal `a celui dune boule de meme rayon.
or`
The
eme V-14 (inegalite isodiametrique). Soit A Rn un ensemble Lebesguemesurable, et r son demi-diam`etre. Alors
n [A] (n)r n .
En dautres termes, `a diam`etre fixe, les boules maximisent le volume.

LES MESURES DE HAUSDORFF

189

Remarques V-15.
(i) On pourra comparer cet enonce `a celui de linegalite
isop
erim
etrique, qui stipule qu`a surface fixee, les boules maximisent le volume.
(ii) Linegalite isodiametrique peut paratre evidente `a premi`ere vue, mais elle
ne lest pas, car un ensemble de diam`etre 2r ne peut pas, en general, sinclure
dans une boule de rayon r.

Fig. 2. Le triangle equilateral ne rentre pas dans le disque de meme diam`etre.


Pour demontrer le Theor`eme V-14, nous utiliserons le concept utile de sym
etrisation
de Steiner.
D
efinition V-16 (symetrisation de Steiner). Soit A Rn , et soit a Rn un
vecteur de norme 1. Soit Pa lhyperplan passant par 0, orthogonal `a a. On peut ecrire
A comme lunion disjointe des La,z A, o`
u La,z est la ligne dirigee par a, passant
par z Pa . Pour chaque z Pa , on construit le segment Az centre en z, tel que
H1 [Az ] = H1 [La,z A]. La reunion disjointe des segments Az ainsi obtenus est appele
symetrise de Steiner de A par rapport `a lhyperplan Pa .

Fig. 3. Representation schematique de la symetrisation de Steiner


Nous admettrons le lemme suivant [Evans-Gariepy pp. 67-68], que lon pourra
chercher `a demontrer de mani`ere non rigoureuse en exercice.
Lemme V-17 (proprietes de la symetrisation de Steiner). La symetrisation de
Steiner reduit le diam`etre et preserve la mesure de Lebesgue.

190

CHAPITRE V

(13 juin 2010)

galit
D
emonstration de line
e isodiam
etrique. Soit (e1 , . . . , en ) une base
n
euclidienne de R . On note Sa la symetrisation de Steiner par rapport `a Pa , et
A := Sen Sen1 . . . Se1 A. Le diam`etre de A est alors inferieur ou egal `a celui de A,
tandis que la mesure de Lebesgue de A est egale `a celle de A ; il suffit donc de
montrer le resultat pour A .
Par recurrence, et en utilisant le fait que la reflexion autour de Pek laisse ej invariant pour tout j 6= k, on montre que A est symetrique par rapport `a Pe1 , . . . , Pen ,
et donc symetrique par rapport `a lorigine. Il sensuit que A est contenu dans une
boule de centre 0 et de rayon diam (A )/2. Le resultat en decoule.

V-3.2. Dimension n : le volume. La mesure de Hausdorff n-dimensionnelle
en dimension n concide avec la mesure de Lebesgue n :
Th
eor`
eme V-18 (Hn = n ). Soit A Rn un ensemble Borelien. Alors
Hn [A] = n [A].

En particulier, si Ek est un sous-espace affine de Rn , de dimension k, alors la restriction de Hk `a Ek concide avec la mesure de Lebesgue sur Ek .
Je vais commencer par presenter une demonstration simple dun enonce plus
faible selon lequel Hn est proportionnelle `a n . La demonstration compl`ete du
Theor`eme V-18 est plus subtile et utilisera linegalite isodiametrique.
ore
`me V-18. Il est clair que Hn est inD
emonstration partielle du The
variante par translation (de meme que toutes les mesures de Hausdorff sur Rn ). Pour
montrer que Hn et n sont proportionnelles (il existe c(n) > 0 tel que Hn = c(n) n ),
il suffit donc de montrer que Hb [Cn ] (0, +),
u Cn = [0, 1]n .
o`
k
Soit > 0, et k N tel que 2 / n 2k+1 .On peut recouvrir Cn par
2nk cubes de cote 2k , dont chacun aura un diam`etre n2k . Il sensuit que
Hn [Cn ] C(n) 2nk 2nk = C(n), o`
u C(n) est une constante ne dependant que de n.
En prenant la limite quand 0 on conclut que
Hn [Cn ] < +.

Par ailleurs, si A est un ensemble quelconque, sa mesure de Lebesgue exterieure


est majoree par C (n)diam (A)n , o`
u C (n) est le volume de la boule de rayon 2 dans
n
R . Si lon a un recouvrement de Cn par des ensembles Aj , la somme de toutes
les
exterieures de ces ensembles est au moins egale `a celle du cube, do`
u
P mesures
C (n)(diam (A))n 1. On en deduit que Hn [Cn ] est minore par une constante
positive independante de , et en faisant tendre vers 0 on conclut que
Hn [Cn ] > 0.

D
emonstration compl`
ete du Th
eor`
eme V-18. La deuxi`eme partie de ce
theor`eme se deduit de la premi`ere grace au caract`ere intrins`eque de la definition
de mesure de Hausdorff : la restriction de la mesure de Hausdorff Hk `a Ek est
exactement la mesure de Hausdorff Hk definie sur Ek , qui est une copie de Rk .
Soit (Ck )k1 un recouvrement de A par des ensembles de diam`etre inferieur ou
egal `a . Grace `a linegalite isodiametrique, on a
X
X
n [A]
n [Ck ]
(n)r(Ck )n .
k

LES MESURES DE HAUSDORFF

191

En passant `a linfimum, on voit que n [A] Hn [A], et donc n [A] Hn [A]. Il nous
reste `a montrer linegalite inverse.
Il est facile de montrer, en utilisant des cubes dyadiques, que
)
(
[
X
n [Qk ]; A
Qk , r(Qk ) ,
n [A] = inf
k=1

o`
u les Qk sont des cubes dyadiques de cotes parall`eles aux axes. Pour de tels cubes,
on peut trouver une constante cn , dependant uniquement de n, telle que
(n)r(Qk )n = cn n [Qk ].

On en deduit que Hn cn n .
Pour conclure, on admet le lemme suivant : etant donne un cube Q et > 0, on
peut ecrire
[
Bj N,
Q=
j1

o`
u les Bj sont des boules fermees de rayon au plus , disjointes, et N est un ensemble
Lebesgue-negligeable.
Soit maintenant A un ensemble Lebesgue-mesurable, on choisit une famille (Ck )
de cubes Qk recouvrant A, telle que
X
n [Qk ] n [A] + ,
k

o`
u > 0 est arbitrairement petit. Pour chaque Qk on introduit une famille de boules
(Bk,j )j1 et un ensemble negligeable Nk verifiant les conclusions du lemme admis
ci-dessus ; en particulier, H[Nk ] cn 0 = 0. On donc
X
XX
Hn [A]
Hn [Qk ] =
(
H[Bk,j ] + H(Nk ))

XX

k1

n [Bk,j ] =

k1 j1

Ceci conclut largument.

k1 j1

n [Bk,j ] =

k1

X
k1

n [Qk ] n [A] + .


V-3.3. Dimension 1 : la longueur. On pourrait convenir a priori de choisir


H1 comme definition de la longueur dune partie de Rn . Cependant, il existe une
autre notion simple et populaire de longueur, batie sur le concept de rectifiabilit
e.
Commencons par en rappeler les proprietes principales.
D
efinition V-19 (rectifiabilite). Soient I un intervalle de R et : I Rn une
courbe continue injective. On dit que est rectifiable sur I si pour tout intervalle
compact [a, b] I, la quantite
L[a,b] () :=
( N
X
sup
|(tk+1) (tk )|;
k=0

a = t0 t1 . . . tN tN +1 = b,

N N

< +

o`
u le supremum est pris sur toutes les subdivisions finies (a = t0 , t1 , . . . , tN , tN +1 = b)
de [a, b]. On appelle alors
L() := sup L[a,b] ()
[a,b]I

192

CHAPITRE V

(13 juin 2010)

la longueur de .
En dautres termes, la longueur dune courbe est le supremum de toutes les
longueurs des approximations polygonales de cette courbe.

(t3 )
(t2 )

(t1 )
(t0 )

Fig. 4. Approximation polygonale dune courbe


Remarques V-20.
(i) Par definition, L[a,b] () est toujours superieur ou egal
`a |(b) (a)|, et on peut verifier quil y a egalite quand la courbe est une
fonction affine : la ligne droite est bien le plus court chemin entre deux points !
(ii) On generalise sans difficulte cette notion `a un espace metrique abstrait.
Noter lhypoth`ese dinjectivite faite dans la definition : des maux de tete sensuivraient si on devait prendre en compte la multiplicite ; ou alors il faudrait bien
prendre garde `a definir la longueur de la courbe , et non simplement de son image
([a, b]). Dans cette partie, pour simplifier, nous ne travaillerons quavec des courbes
injectives.
Une courbe etant donnee, on appelle reparam
etrage de toute courbe (injective) e
, dont limage est la meme que celle de . On note que la longueur est
invariante par reparametrage.
Si est une courbe rectifiable definie sur un intervalle I, et x0 est un point arbitraire de I, alors on peut definir un reparametrage privilegie de , dit param
etrage
par longueur darc : on definit la longueur orientee `a partir de x0 par
(
L[x0 ,x] ()
(x x0 )
x0 (x) =
;
L[x,x0 ] ()
(x < x0 )
on verifie que la fonction x0 est continue et strictement croissante, en particulier
inversible sur son image. On definit alors le reparametrage e par
e(x0 + x0 (x)) = (x),

(x) = L[x0 ,x] ().

Les proprietes suivantes decoulent presque immediatement de la definition.

Proposition V-21 (proprietes du parametrage par longueur darc). Soit :


I R une courbe parametree par longueur darc. Alors pour tout [a, b] I,
L[a,b] () = b a;

LES MESURES DE HAUSDORFF

193

En particulier,
|(b) (a)| b a,

(38)
et

L() = |I|.
Le theor`eme suivant montre que la dimension de Hausdorff de dimension 1 est
une generalisation du concept de rectifiabilite.
or`
The
eme V-22 (L = H1 ). Soient I un intervalle de R, et : I R une
courbe injective rectifiable. Alors
H1 [(I)] = L().

D
emonstration. Sans perte de generalite, on supposera que est parametree
par longueur darc. Si (Ak )kN est un recouvrement de (I), on definit un recouvrement (Bk )kN de I en definissant Bk := 1 (Ak ). linegalite (38) implique alors que
diam (Bk ) diam (Ak ). En utilisant les definitions des mesures de Hausdorff, on en
deduit
H1 ((I)) H1 (I) = |I| = L().
Pour etablir linegalite inverse, commencons par remarquer que H1 (([a, b]))
|(b) (a)|. En effet, si est la projection orthogonale de ([a, b]) sur la ligne
droite joignant (a) et (b), alors reduit les distances, donc, par definition des
mesures de Hausdorff, H1 (([a, b])) H1 ((([a, b]))) = H1 ([(a), (b)]). On peut
identifier la droite passant par (a) et (b) `a R ; en utilisant alors lidentie H1 = 1 en
dimension 1, on constate que H1 ([(a), (b)]) nest autre que la longueur du segment
[(a), (b)], i.e. |(b) (a)|.
Enfin, soit [a, b] I et soit a = t0 t1 . . . tN tN +1 = b une subdivision de [a, b] ; cette subdivision decoupe lintervalle I en sous-intervalles ouverts
I0 , I1 , . . . , IN +1 , IN +2 . Les points etant de mesure de Hausdorff H1 nulle, on a
H1 ((I)) =

N
+2
X
k=0

H1 ((Ik ))

N
+1
X
k=1

H1 ((Ik ))

N
X
k=0

|(tk+1 ) (tk )|.

En prenant le supremum sur toutes les subdivisions possibles, puis sur [a, b] I, on
conclut que
H1 ((I)) L(),
ce qui ach`eve la preuve.

V-3.4. Autres dimensions enti`
eres. Nous venons de voir que la mesure de
Hausdorff n-dimensionnelle sidentifie `a la mesure de Lebesgue, i.e. au volume ndimensionnel, et que la mesure de Hausdorff 1-dimensionnelle sidentifie `a une notion
de longueur, au moins dans le cas des courbes rectifiables. Il convient detre plus
prudent en ce qui concerne les autres dimensions enti`eres ! Appliquees `a des objets
suffisamment reguliers, les mesures de Hausdorff donneront les resultats attendus :
par exemple, la mesure H2 definit une notion de surface, etc. Cependant, pour des
objets irreguliers, ces notions peuvent ne pas recouper les autres notions en vigueur...
Cette remarque vaut aussi pour la dimension 1, dans le cas dobjets peu reguliers.
Le cas le plus frappant est celui o`
u d = n 1. Soit A Rn une partie compacte (pour simplifier), comment definir la surface (ou volume n1-dimensionnel)
S(A) de son bord A ? Il existe trois definitions, plus ou moins naturelles selon les

194

CHAPITRE V

(13 juin 2010)

contextes. La premi`ere fait intervenir les mesures de Hausdorff, la deuxi`eme est


une definition possible de ce que lon appelle parfois contenu de Minkowski, et la
troisi`eme est naturelle en theorie des distributions, ou en physique mathematique.
(i) S(A) := Hn1 (A) ;

n [A ] n [A]
(ii) S(A) := lim inf
;
0


Z

n
n
J; J Cc (R ; R ), |J| 1 , o`
u le supremum est pris
(iii) S(A) := sup
A

sur lensemble des fonctions J de Rn dans Rn , de classe C et `a support compact,


bornees par 1 en norme, et on a note
J =

n
X
Jk
k=1

xk

la divergence de J.
Cest probablement la formule (ii) qui est la plus intuitive, et la plus simple `a
se representer visuellement. Dautre part, le lecteur qui se souvient de la formule
de Green-Ostrogradski ne sera pas surpris par lapparition de loperateur divergence
dans la formule (iii) ; en effet, cette formule enonce que, sous des conditions de
regularite suffisante,
Z
Z
J =
J(x) N(x) d(x),
A

o`
u N(x) designe la normale `a A en x et ... la mesure de surface sur A.

Fig. 5. Surface au sens de Minkowski : laccroissement infinitesimal


du volume est donne par le produit de la surface par la largeur
depaississement
Les trois definitions precedentes de la surface de A peuvent donner des resultats
differents pour des ensembles A pathologiques. Il convient donc detre prudent
quand on parle de surface k-dimensionnelle dans un contexte peu regulier, et preciser
le cas echeant de quelle surface il sagit.

LES MESURES DE HAUSDORFF

195

V-4. Dimension
V-4.1. Echelle des mesures de Hausdorff. La proposition suivante etablit
le fait intuitif que si une dimension convient pour evaluer la taille dun objet, les
dimensions superieures sont trop grossi`eres (ainsi, si une courbe a une surface positive, sa longueur doit etre infinie ; si elle a une longueur finie, sa surface doit etre
nulle).
Proposition V-23 (au plus une dimension donne une mesure non triviale). Soit
A Rn ; alors

(i) si Hd [A] < + pour un certain d 0, alors Hd [A] = 0 pour tout d > d ;

(ii) si Hd [A] > 0 pour un certain d > 0, alors Hd [A] = + pour tout d < d ;
(iii) pour tout d > n, on a Hd [A] = 0 ;
D
emonstration de la Proposition V-23. Soient A Rn , d1 < d2 , et soit
(Ck )kN un recouvrement de A par des ensembles de demi-diam`etre respectif rk
/2. Alors
X
X
rkd2 d2 d1
rkd1 .
k

Si maintenant on a H [A] < + pour un certain d > 0, alors pour tout > 0
on a Hd [A] < +, et il existe donc un recouvrement denombrable de A par des
ensembles de demi-diam`etre rk /2, tel que
X
rkd C < +.
k

Pour ce meme recouvrement, on a alors k rkd Cd d 0 d`es que d > d. Cela

prouve que Hd [A] = O(d d ), et en particulier Hd [A] = 0.


Si dautre part on a Hd [A] > 0 pour un certain d > 0, alors pour tout > 0
assez petit on a Hd [A] > 0 ; en particulier, tout recouvrement denombrable de
A par des ensembles de demi-diam`etre rk /2,
X

rkd
> 0,
(d)
k
do`
u, pour tout d < d,

X
k

(d)rkd dd

(d )
+,
(d) 0

et finalement H [A] = +.
Lassertion (iii) a dej`a ete etablie ; nous allons reproduire bri`evement le raisonnement. Comme Rn est union denombrable de paves, il suffit de prouver quun pave de
Rn est de mesure d-dimensionnelle nulle pour d > n. Puisque ce pave est de mesure
de Lebesgue finie donc de mesure d-dimensionnelle finie, (iii) decoule de (i).

V-4.2. Dimension de Hausdorff. Au vu de la Proposition V-23, la fonction
d 7 Hd [A] est tr`es particuli`ere : on se convainc facilement quelle vaut + quand
d est strictement plus petit quun certain d0 , et 0 quand d est strictement superieur
`a d0 .
Ceci m`ene naturellement `a la definition de la dimension de Hausdorff.

196

CHAPITRE V

(13 juin 2010)

H [A]

d0

Fig. 6. Graphe de Hd [A] ; Hd0 [A] peut se situer nimporte o`


u sur la
ligne pointillee.
D
efinition V-24. Soit A Rn . On definit sa dimension de Hausdorff, que lon
note dim(A) ou dimH (A), par
dim(A) := inf{d; iHd[A] = 0} [0, n]

De mani`ere equivalente, dim(A) est lunique d0 tel que Hd [A] = + pour tout
d < d0 , et Hd [A] = 0 pour tout d > d0 .
La dimension de Hausdorff se prete bien `a de nombreux enonces theoriques, car
elle est associee naturellement aux mesures de Hausdorff ; en revanche elle est parfois
difficile `a calculer. Le theor`eme suivant se deduit facilement de la Proposition V-6 :
or`
The
eme V-25 (dimension des graphes et images). Soit f : Rn Rm une
fonction Lipschitzienne. Soit A une partie mesurable de Rn , on note G(f, A) =
{(x, f (x)); ix A} le graphe de f sur A. Alors
(i) dimH (f (A)) dimH (A) n ;
(ii) Si n [A] > 0, alors dimH (G(f, A)) = n.
Remarques V-26.
(i) On se souvient que le graphe dune fonction continue
est de mesure de Lebesgue nulle ; nous voyons ici que le graphe dune application Lipschitzienne a la dimension attendue. De mani`ere generale, la dimension
de Hausdorff dun graphe est sup
erieure ou
egale `a la dimension de lespace
de depart ; elle peut etre strictement superieure pour des applications qui sont
seulement Holderiennes (ou encore moins reguli`eres) et pas Lipschitz.
(ii) Lapplication de Peano montre que limage du segment [0, 1] par une application continue peut etre de dimension 2 (bien s
ur, cette application nest pas
Lipschitzienne !). Une trajectoire typique du mouvement Brownien plan pour
les temps t [0, 1] fournit un autre exemple de courbe dont limage est de dimension 2, cependant la mesure 2-dimensionnelle de cette image est nulle ! Les
trajectoires du mouvement Brownien ne sont bien s
ur pas Lipschitz, mais elles
sont Holder- pour tout < 1/2 (il est naturel dimaginer que lexposant 1/2
est critique pour de tels contre-exemples). En revanche, limage dune courbe

LES MESURES DE HAUSDORFF

197

Lipschitz est toujours de dimension inferieure ou egale a` 1. Si on consid`ere une


fonction Lipschitz definie sur un segment [0, 1], `a valeurs dans Rn , son image
sera soit reduite `a un point, soit de dimension 1.
(iii) En corollaire de ce theor`eme, on voit que les applications bilipschitziennes pr
eservent la dimension de Hausdorff (par bilipschitzienne, on
entend que la fonction f , supposee bijective, et sa reciproque, sont toutes deux
Lipschitz). Cest une des raisons pour lesquelles les applications bilipschitziennes constituent une notion naturelle disomorphisme dans letude des
objets fractals.
V-4.3. Dimension de Minkowski. Expliquons maintenant une autre notion
populaire, souvent plus simple `a calculer et anterieure a` celle de Hausdorff, dite
dimension de Minkowski.
Commencons par nous interroger sur le moyen de faire la difference entre un
objet monodimensionnel et un objet bidimensionnel ? Intuitivement, le second est
beaucoup plus recouvrant ; on peut formaliser cela en considerant lensemble des
points qui leur sont proches. Placons-nous dans le carre [0, 1]2 pour simplifier. On
quadrille ce carre en petits sous-carres de cote = 1/K, K 1. On sattend
`a ce quun objet monodimensionnel X rencontre environ L/ tels sous-carres, o`
u
L designe la longueur de X, tandis quun objet bidimensionnel Y en rencontrera
environ S/2 , o`
u S designe laire de Y . Et si lon consid`ere la reunion de tous les
sous-carres rencontres par ces objets, sa surface est environ L dans le premier cas, S
dans le deuxi`eme. Par extrapolation, on a envie de dire quun objet est de dimension
d si le nombre de petits carres necessaire `a son recouvrement est de lordre de d .
Cette idee conduit `a la dimension de Minkowski dun sous-ensemble A de
Rn : on pose
log N (A)
dimM (A) = lim
,
0 | log |
o`
u N (A) est, au choix : le nombre minimal de boules de diam`etre (resp. de
cubes de cote , resp. de cubes pris parmi un reseau de cote , resp. densembles
de diam`etre ) par lequel on peut recouvrir A ; ou encore le nombre maximal de
points que lon peut placer dans A de telle sorte quils soient tous `a une distance
superieure ou egale `a les uns des autres. Toutes ces equivalences sont passees
en revue dans [Falconer2, Chapitre 3] o`
u la dimension de Minkowski est appelee
dimension de [comptage de] botes (box dimension). Notons que dans le cas o`
u la
limite quand 0 nexiste pas, on peut toujours definir une dimension superieure
(resp. inferieure) en remplacant la limite par une lim sup (resp. lim inf). Enfin, il
existe encore une autre facon equivalente de definir cette dimension :
log n [A ]
dimM (A) := n + lim
0
| log |
o`
u A est le -voisinage de A, i.e.
A := {x Rn ; d(x, A) }.

La definition de la dimension de Minkowski est assez intuitive, et elle est souvent


relativement facile `a calculer ou estimer ; mais elle a quelques defauts troublants. Par
exemple, lensemble ([0, 1] Q)2 est dense dans [0, 1]2 , et la definition precedente lui
attribue une dimension 2 ; pourtant, un point est de dimension 0, et dans un cadre
de mesures -additives, on trouverait naturel quune union denombrable dobjets de

198

CHAPITRE V

(13 juin 2010)

dimension donnee d soit egalement un objet de dimension d. La conclusion est que


la dimension de Minkowski nest pas associee `a une notion naturelle de mesure.
De mani`ere generale, la dimension de Minkowski est toujours superieure ou egale
`a la dimension de Hausdorff ; linegalite peut etre stricte, puisque [0, 1] Q est de
dimension de Hausdorff 0 et de dimension de Minkowski 1... Par ailleurs, la dimension
de Minkowski verifie lidentite
dimM (A B) = dimM (A) + dimM (B),

ce qui nest pas toujours vrai de la dimension de Hausdorff.


On trouvera dans [Falconer2, Chapitre 3] dautres definitions en usage de la
notion de dimension, et une discussion des liens qui existent entre ces notions.
V-4.4. Ensembles de Cantor. Commencons par lexemple utilise par Hausdorff lui-meme pour illustrer sa notion de dimension : lensemble triadique de Cantor,
defini comme la limite des ensembles fermes Ck , o`
u C0 = [0, 1] et Ck est obtenu `a
partir de Ck1 en supprimant le tiers (ouvert) central de chacune des composantes
connexes de Ck1. Lensemble resultant est clairement de mesure de Lebesgue nulle,
on peut se demander quelle est sa dimension.

Fig. 7. Premi`eres etapes de la construction de lensemble triadique de Cantor


Si lon prend = 3k , on voit que lensemble triadique de Cantor C dans [0, 1]
peut se recouvrir par 2k = d segments de longueur (soit des boules de rayon
/2), avec d = log 2/ log 3, et que ce recouvrement est le plus economique que lon
puisse realiser. Il est facile den deduire que
log 2
.
dimM (C) =
log 3
La dimension de Hausdorff est dej`a plus difficile `a calculer. On sait quelle nest
pas plus grande que la dimension de Minkowski, soit log 2/ log 3. Par ailleurs, on peut
faire un calcul heuristique simple en tirant parti de la construction auto-similaire
de lensemble C et de lidentite Hd [A] = d Hd [A], facile `a verifier. Sil existe un
exposant d tel que Hd [C] ]0, +[, alors, comme C est lunion de deux copies de
C/3, on aura
2
Hd [C] = 2Hd [C/3] = d Hd [C],
3
ce qui impose 3d = 2, i.e. d = log 2/ log 3.

LES MESURES DE HAUSDORFF

199

On est donc tente de conclure que la dimension de Hausdorff de C est egale `a


la dimension de Minkowski ! Cest effectivement le cas : le raisonnement esquisse ciapr`es prouve en effet que pour tout recouvrement de C par une famille denombrable
dintervalles ouverts (Ik )kN , on a
X
1
|Ik |d ,
2
k
et il sensuit que Hd [C] > 0. Pour etablir cette inegalite, on remarque dabord que
par compacite on peut se limiter `a une famille finie dintervalles ouverts, dont chacun
a une longueur comprise entre 3(+1) et (strictement) 3 , pour un unique = (k).
Lintervalle Ik peut alors intersecter au plus une des composantes connexes de C , et
donc pour j il ne peut intersecter plus de 2j 2j 3d |Ik |d composantes connexes
de Cj . On choisit j suffisamment grand pour que 3j soit plus petit que toutes les
longueurs |Ik | ; alors toutes les composantes connexes de Cj doivent etre intersectees
par les Ik , il y en a 2j , et on a donc
X
2j
(nombre de composantes connexes intersectees par Ik )
k

X
k

2j 3d |Ik |d ,

do`
u k |Ik |2 3d = 1/2.
Avec un peu plus defforts, on peut montrer que Hd [C] = 21d , qui constitue une
sorte de mesure de la taille de C en dimension d. Notons que lon ne peut utiliser la
-additivite pour cela : pour tout k, on a Hd [Ck ] = +...
Le contenu de Minkowski permet, ici encore, de predire le resultat de mani`ere
tr`es simple : par definition, le contenu de Minkowski dun sous-ensemble de dimension
d de Rn est le produit de (n) par le coefficient dominant de N quand 0, et
fournit une sorte de volume d-dimensionnel qui cadre bien avec lintuition que lon se
fait des notions de longueur, surface, etc. Ici on a (1) = 2 et N 2d d , de sorte
que le contenu de Minkowski concide bien Hd [C]. Malheureusement, cette egalite
nest pas la r`egle...
On note que du point de vue topologique, lensemble triadique de Cantor est
totalement discontinu : bien quil ne soit pas denombrable, il ne contient aucun
segment, et toutes ses composantes connexes sont donc des points. Du point de vue
topologique, il est naturel de lui attribuer une dimension nulle ! On peut montrer
dailleurs que cest le cas de toute partie dont la dimension de Hausdorff est strictement inferieure `a 1 [Falconer2, Proposition 2.5]. On peut mettre cette remarque en
regard de la suggestion de Mandelbrot, selon laquelle on pourrait definir un objet
fractal comme un objet dont la dimension de Hausdorff est strictement superieure `a
la dimension topologique.
De mani`ere generale, on appelle ensemble de Cantor un espace topologique compact totalement discontinu (dont les composantes connexes sont des points) et sans
point isole (un point x0 dun espace X est dit isole sil existe un voisinage V de x0
qui ne rencontre X quen x0 ). Ces ensembles jouent un role important dans diverses
branches des mathematiques ; on peut en construire de nombreux exemples par des
variantes du procede de construction diadique de Cantor. Voici quelques exemples
interessants :

200

CHAPITRE V

(13 juin 2010)

- On coupe le segment [0, 1] en k segments (k 3, supposons k impair pour simplifier), on elimine les k 2 intervalles centraux pour ne garder que les deux segments
extremes. On coupe chacun des segments ainsi obtenus en k parties egales, et sur ces
k parties on elimine les k 2 parties centrales. Et ainsi de suite ! On construit de la
sorte un ensemble de Cantor k-adique fin de dimension log 2/ log k (arbitrairement
petite). Si au contraire `a chaque etape on choisit deliminer seulement le segment
central, lensemble limite C est un ensemble de Cantor k-adique gras de dimension
log 2/ log c(k), o`
u c(k) = (2k + 1)/k est le coefficient de proportionnalite permettant
de passer de lensemble `a sa composante gauche (C = c(k)(C [0, 1/2])) ; comme
c(k) 1 pour k , lensemble ainsi construit est de dimension arbitrairement
proche de 1.
- On coupe le segment [0, 1] en trois tiers, on elimine le tiers central. On coupe
chacun des segments ainsi obtenus en cinq parties egales, et sur ces cinq parties on
elimine les trois parties centrales. On coupe chacun des segments ainsi obtenus en
sept parties egales, et sur ces sept parties on elimine les cinq parties centrales. Et
ainsi de suite ! On construit de la sorte un ensemble de Cantor non denombrable
mais extremement fin, en fait de dimension 0.
- On construit un Cantor triadique sur [0, 1/2], un Cantor 5-adique gras sur
[1/2, 3/4], un Cantor 7-adique gras sur [3/4, 7/8], un Cantor 9-adique gras sur
[7/8, 15/16], etc. Lensemble ainsi obtenu est de mesure de Lebesgue nulle, comme
union denombrable densembles de mesure nulle ; mais il sera de dimension 1, puisque
la mesure d-dimensionnelle dun Cantor k-adique gras est + pour d > log 2/ log c(k).
V-4.5. Autres exemples. Le flocon de von Koch dans R2 est lun des fractals
les plus simples et les plus cel`ebres : partant dun triangle equilateral, on construit
sur chaque cote un triangle equilateral plus petit dun facteur 1/3, pointant vers
lexterieur. Puis on recommence.... La fronti`ere de la figure limite est appelee flocon
de von Koch (voir [Falconer2], p.xv). Il nest pas tr`es difficile de montrer que sa
dimension fractale est log 4/ log 3, ce qui correspond au fait qu`a chaque etape on
remplace chaque segment de longueur par quatre segments de longueur /3 (comparer au Cantor triadique, dans lequel on remplacait chaque segment de longueur
par deux segments de longueur /3).

Fig. 8. Brique elementaire de la construction du flocon de von Koch


Ici encore, la dimension de Hausdorff est strictement superieure `a la dimension
topologique naturelle qui est 1. En particulier, le flocon de von Koch est de longueur infinie, et de surface nulle. Selon une argumentation cel`ebre de Mandelbrot,
avec une bonne approximation on peut considerer quun objet tel que la cote de la
Bretagne presente le meme comportement : sauf `a aller `a des echelles ridiculement
precises (de lordre du rocher), il est impossible de mesurer sa longueur ; des estimations de la dimension de cette cote ont meme ete proposees. Dautres fractals
cel`ebres se trouvent dans [Falconer2], comme les ensembles de Julia, de Mandelbrot,
ainsi que de nombreux fractals aleatoires.

LES MESURES DE HAUSDORFF

201

Le calcul de la dimension des fractals a motive le developpement de methodes de


calcul de la dimension de Hausdorff, passees en revue dans [Falconer2]. On mentionnera en particulier la puissante et elegante technique de la distribution de masse
(pp. 6466) : etant donne une partie A de Rn , si lon peut trouver une mesure de
probabilite sur A telle que
ZZ
d(x) d(y)
< +,
|x y|s
AA

alors dimH (A) s.


Malgre ces methodes, le calcul de la dimension de Hausdorff est parfois un cassetete insoluble. Voici un exemple simple discute en pp. 148153 de ce meme ouvrage : sur le segment [0, 1] definissons, pour > 1 et s ]1, 2[, la fonction

X
(s2)k sin(k t).
fs, : t 7
k=1

Cette fonction, dite fonction de Weierstrass, est continue (elle est donnee par un
developpement en serie absolument convergent) mais differentiable nulle part sur
[0, 1] (noter que la serie des derivees est violemment divergente ; cela ne constitue bien s
ur pas une preuve, mais rend plausible la non-differentiabilite). Il est
prouve dans [Falconer2] que pour assez grand, la dimension de Minkowski du
graphe de fs, est exactement s. On conjecture que la dimension de Hausdorff a la
meme valeur, mais cela nest toujours pas demontre (il est connu cependant que
lim dimH (G(fs, , [0, 1])) = s).
V-5. Utilisation dans les changements de variables
Les mesures de Hausdorff sont particuli`erement utiles pour enoncer des changements de variables de Rm dans Rn de mani`ere unifiee. Ce sont les fameuses formules
de laire et de la co-aire. On les donne ici sans preuve ; le chapitre 3 de [EvansGariepy] leur est enti`erement consacre.
Th
eor`
eme V-27 (formule de laire). Soit T : Rn Rm une application Lipschitzienne, avec m n, et soit A Rn un ensemble Lebesgue-mesurable. Alors
Z
Z
| det T | =
H0 [A T 1 {y}] dHn(y).
Rm

or`
The
eme V-28 (formule de la co-aire). Soit T : Rn Rm une application
Lipschitzienne, avec m n, et soit A Rn un ensemble Lebesgue-mesurable. Alors
Z
Z
| det T | =
Hnm [A T 1 {y}] dy.
Rm

Exemple V-29. Soit f : [0, 1] Rn une courbe Lipschitzienne simple ; alors on


a, par la formule de laire,
Z 1
Z

|f (s)| ds =
1f ([0,1]) dH1 (y) = H1 [f ([0, 1])],
Rm

ce qui identifie encore H avec lune des notions naturelles de longueur dune courbe.

CHAPITRE VI

Espaces de Lebesgue et mesures sign


ees
Jusquici, nous avons considere des fonctions individuellement. Dans ce chapitre et le suivant, nous porterons notre attention sur des familles enti`eres de fonctions : des espaces de fonctions, ou espaces fonctionnels. Nous munirons ces
espaces de structures geometriques (par exemple une norme pour mesurer la taille
des fonctions, ou un produit scalaire pour definir lorthogonalite) et topologiques
(par exemple, la topologie induite par une norme). En caricaturant un peu, on peut
dire que letude des proprietes geometriques et topologiques des espaces fonctionnels
constitue lanalyse fonctionnelle.
Le but premier de lanalyse fonctionnelle est de mettre en place des schemas de
demonstrations intuitifs ou simples, similaires aux arguments geometriques ou topologiques que lon fait dans un espace Euclidien (usage de coordonnees, orthogonalite,
construction de limites, etc.) On peut sans doute faire remonter ce point de vue `a
Fourier lui-meme.
Dans ce chapitre, nous introduirons deux types despaces fonctionnels. Dans un
premier temps, nous fixerons une mesure, et nous construirons des espaces de fonctions mesurables, definis par leur degre dintegrabilite : integrabilite de la puissance p pour les espaces Lp de Lebesgue. Apr`es avoir etudie les relations entre ces
espaces (ce qui nous m`enera `a quelques considerations subtiles telles que linterpolation entre espaces de Lebesgue), nous elargirons le cadre pour considerer lespace
de toutes les fonctions mesurables. Enfin nous generaliserons encore en incluant les
fonctions mesurables dans un espace plus grand, dont les elements ne sont pas `a
proprement parler des fonctions, mais plutot des fonctions densembles : cest lespace des mesures signees ; nous verrons pourquoi on peut les considerer comme des
fonctions generalisees.
Les premi`eres questions que lon se pose sur les espaces fonctionnels concernent
la completude, la separabilite, la reflexivite, luniforme convexite, lexistence de
syst`emes de coordonnees commodes. Nous repondrons `a certaines de ces questions
dans le present chapitre, et poursuivrons cette etude dans le chapitre suivant.
Dans ce chapitre, la section VI-1, qui introduit les espaces de Lebesgue et leurs
proprietes elementaires, est la plus importante. Les autres sections pourront etre
omises en premi`ere lecture, ou consultees en cas de besoin.

VI-1. Espaces Lp de Lebesgue


VI-1.1. D
efinitions.
D
efinition VI-1 (espaces Lp ). Soit (X, ) un espace mesure.
- Pour tout p ]0, +[ on definit lespace de Lebesgue dordre p comme lensemble des fonctions mesurables de X dans R telles que |f |p soit integrable.

204

CHAPITRE VI

(13 juin 2010)

- On definit lespace de Lebesgue dordre comme lensemble des fonctions


mesurables de X dans R telles quil existe C < tel que |f | C en-dehors dun
ensemble de mesure nulle.
- On definit lespace de Lebesgue dordre 0 comme lensemble des fonctions mesurables de X dans R qui sont nulles en-dehors dun ensemble de mesure finie.
Lespace de Lebesgue dordre p sur (X, ) est note Lp (X, ) (ou Lp () ou Lp (X, d)
ou Lp (d) ou Lp (X, ) ou Lp (X, ), etc.). Sil ny a pas de confusion possible sur la
mesure , on pourra le noter Lp (X) (ou Lp (X) ou Lp (X)) ; sil ny a pas de confusion possible sur le couple (X, ) on pourra le noter tout simplement Lp (ou Lp ou
Lp ).
Remarque VI-2. Lespace Lp () depend de ; cest evident pour p < ,
mais on se laisse parfois pieger dans le cas p = . Penser par exemple que kx
x2 kL (1/2 ) = 1/4...
Exemples VI-3.
(i) Si X = N et est la mesure de comptage, lespace
p
L (X, ) pour 0 p < + est lensemble des suites reelles (un )nN telles que
(avec la convention 00 = 0)
X
|un |p < +.
nN

Pour p = cest lensemble des suites reelles bornees.


Dans ce cas, on utilise traditionnellement les notations p ou p (N) pour
lespace de Lebesgue dordre p.
(ii) Soient B1 = B1 (0) Rn , et n la mesure de Lebesgue dans Rn . Alors,
la fonction f : x 7 |x| appartient `a Lp (B1 , n ) si et seulement si p <
n/, et et `a Lp (Rn \ B1 , n ) si et seulement si p > n/. Elle nappartient
`a aucun espace Lp (Rn , n ). En pratique, pour verifier lappartenance dune
fonction `a un espace de Lebesgue, on est souvent amene `a etudier separement
lintegrabilite Lp locale et lintegrabilite Lp `a linfini.

Remarques VI-4.
(i) On rencontre exceptionnellement des espaces de Lebesgue dordre negatif. La definition ne fait pas de myst`ere : f Lp (p < 0) si
et seulement si 1/|f | Lp . Cette notion na gu`ere dinteret que si est finie.
(ii) Les espaces de Lebesgue constituent en general une tr`es bonne echelle pour
quantifier lintegrabilite des fonctions mesurables ; mais parfois cette echelle
nest pas assez precise. On ne peut, par exemple, en termes dappartenance `a
des espaces Lp , faire la difference entre des fonctions de reference telles que
h, : x 7

[log(1/|x|)]
|x|

pour des valeurs differentes de . Dautres espaces fonctionnels plus fins


permettent de distinguer ces fonctions : par exemple, les espaces de Lorentz
Lp,q . Si X = B1 (0) Rn est muni de la mesure de Lebesgue, alors la fonction
h, pour > 0 appartient `a Lp si et seulement si p < n/ ; et `a Lp,q si et
seulement si p < n/ ou p = n/ et q < 1/. Pour = 0, cette fonction
appartient `a Lp, , que lon appelle aussi espace de Marcinkiewicz M p . La


ESPACES DE LEBESGUE ET MESURES SIGNEES

205

definition des espaces de Lorentz est un peu compliquee et nous nen parlerons
quapr`es avoir discute du concept de rearrangement. A ce stade, on donnera
seulement la definition des espaces de Marcinkiewicz, qui est plus simple : Par
definition, f M p (X) (p 1) sil existe une constante C telle que
 p


C
.
t 0, {x; |f (x)| t}
t

On notera alors kf kLp, (X) linfimum des constantes C admissibles (cest un


abus de notation, car il ne sagit pas dune norme).

Exercice VI-5. En utilisant linegalite de Chebyshev, montrer que pour tout


p 1, Lp (X) Lp, (X), avec injection continue au sens o`
u kf kLp, kf kLp .
Montrer, en considerant des puissances inverses, que cette inclusion est stricte dans
Rn . Lespace Lp, est donc un peu plus grand que lespace Lp .
Remarquons enfin que lon peut etendre facilement la definition des espaces Lp
`a des espaces de fonctions `
a valeurs vectorielles, plus precisement `a valeurs dans
un espace muni dune distance invariante par translation.
D
efinition VI-6. Soit E un espace vectoriel ; on dit quune distance sur d est
invariante par translation si pour tous x, y, z E on a
d(x + z, y + z) = d(x, y).
Il est clair quune norme definit une distance invariante par translation. Mais
le concept de distance invariante par translation est beaucoup plus general : par
exemple, si N est une norme, alors N/(1 + N) est une telle distance.
D
efinition VI-7 (espaces Lp `a valeurs vectorielles). Soient (X, ) un espace
mesure, et E un espace vectoriel muni dune distance d invariante par translation.
Pour tout p [0, +], on definit alors lespace Lp (X; E) = Lp (X, ; E) comme
lespace des fonctions mesurables f : X E telles que d(0, f ) Lp (X, ).
VI-1.2. In
egalit
e de Minkowski. Le point de depart de lanalyse fonctionnelle des espaces de Lebesgue est linegalite suivante.
Th
eor`
eme VI-8 (inegalite de Minkowski). Soit (X, ) un espace mesure, et soit
p [1, +[. Alors, pour toutes fonctions f, g mesurables X R,
Z
1/p Z
1/p Z
1/p
p
p
p
|f + g| d

|f | d
+
|g| d
,
o`
u par convention |(+) + ()| = +. De plus, si p > 1 et si les deux integrales
apparaissant au membre de droite sont finies et non nulles, il y a egalite si et seulement si il existe > 0 tel que f = g presque partout.
Il existe diverses demonstrations de linegalite de Minkowski ; on peut par exemple
la deduire de linegalite de Holder [Rudin p. 64 ; Lieb-Loss p. 48]. Nous allons donner
ci-apr`es une preuve leg`erement differente, qui nutilise pas explicitement linegalite
de Holder. Nous allons demontrer en meme temps quelques variantes de linegalite
de Minkowski, selon un point de vue parall`ele `a notre presentation de linegalite de
Holder au paragraphe VI-2.1.

206

CHAPITRE VI

(13 juin 2010)

or`
The
eme VI-9 (variantes de linegalite de Minkowski). Soit p [1, +[.
(i) Soient (X, ) un espace mesure, f et g deux fonctions mesurables sur X, `a
valeurs dans R. Alors, pour tout ]0, 1[,
Z
Z
Z
1
1
p
p
|g|p d.
|f + g| d p1 |f | d +

(1 )p1
(ii) Soient (X, ) un espace mesure, f1 , . . . , fk des fonctions mesurables sur X,
a` valeurs dans R. Alors
!1/p
1/p
Z X
X Z
p
p
|
fi | d

|fi | d
.
i

(iii) Soient (X, ) et (Y, ) deux espaces mesures -finis. Alors, pour toute fonction F mesurable de X Y dans R+ {+}, on a
Z Z
p
1/p Z Z
1/p
p
F (x, y) d(y) d(x)

F (x, y) d(x)
d(y).
X

(iv) Soient X et Y deux ensembles quelconques, et L un operateur lineaire, defini


sur un sous-espace vectoriel de lensemble des fonctions de X dans R, `a valeurs dans
lensemble des fonctions de Y dans R. On suppose que L est positif, i.e. Lf 0 si
f 0. Soient f, g 0 dans le domaine de L. Alors
L((f + g)p )1/p [L(f p )]1/p + [L(g p )]1/p ,

ce qui est une inegalite entre deux fonctions de Y dans R.


(v) Soient (X, ) un espace mesure, (E, k k) un espace vectoriel norme, et f, g :
X E des fonctions mesurables. Alors
Z
1/p Z
1/p Z
1/p
p
p
p
kf + gk d

kf k d
+
kgk d
.
(vi) Soient (X, ) un espace mesure, f, g : X C deux fonctions mesurables `a
valeurs complexes. Alors
Z
1/p Z
1/p Z
1/p
p
p
p
|f + g| d

|f | d
+
|g| d
.
De plus, si p > 1 et si les deux integrales apparaissant au membre de droite sont
finies et non nulles, il y a egalite si et seulement si il existe > 0 tel que f = g
presque partout.
D
emonstration. Nous allons nous contenter de demontrer linegalite dans (i)
et den deduire linegalite de Minkowski du Theor`eme VI-8. Le reste (discussion des
cas degalite dans le Theor`eme VI-8, enonces (ii) `a (vi) du Theor`eme VI-9) est laisse
en exercice.
Pour demontrer (i), on ecrit dabord, par convexite de la fonction t 7 |t|p ,

|f (x)+g(x)|p = |(f (x)/)+(1)(g(x)/(1))|p |f (x)/|p+(1)|g(x)/(1)|p .


ESPACES DE LEBESGUE ET MESURES SIGNEES

207

On int`egre ensuite contre , pour trouver


Z
Z
Z
1
1
p
p
|f + g| d p1 |f | +
|g|p.

(1 )p1

On optimise alors en (on minimise le membre de droite). Linegalite de Minkowski est obtenue en utilisant ldentite elementaire


1
1 p
b
a
= ap + bp .
+
inf
p1
p1
01

(1 )
De mani`ere equivalente, on obtient linegalite souhaitee en posant
R
1
|f |p p
:= R
1 .
1
R
|g|p p
|f |p p +

Remarque VI-10. Cette methode de preuve (demonstration dune inegalite


auxiliaire dependant dun param`etre, puis optimisation sur ce param`etre) est tr`es
repandue en analyse.
VI-1.3. Distances Lp . Jusqu`a present nous avons seulement defini lensemble
des fonctions Lp ; maintenant nous allons munir cet ensemble dune structure qui,
selon les cas, sera soit une semi-distance, soit une semi-norme.
Th
eor`
eme VI-11 (semi-distances Lp ). Soit (X, ) un espace mesure. Pour tout
p [0, +], on definit sur Lp (X, ) une application Np , `a valeurs dans [0, ], par
les formules
min(1,1/p)
Z
p
Np (f ) =
|f |
(0 < p < );
o
n


N (f ) = inf C; {x; |f (x)| > C} = 0 ;


N0 (f ) = {x; f (x) 6= 0} .

La quantite N (f ) est appelee supremum essentiel de |f |, ce que lon note esssup |f |.


Les quantites Np (f ) sont egalement notees kf kLp (X,) ou kf kLp (X) ou kf kLp , etc.,
voire kf kp .
Lapplication Np definit alors sur Lp
(i) pour 1 p : une semi-norme, i.e.
Np (f ) 0;

Np (f + g) Np (f ) + Np (g);

Np (f ) = ||Np (f );

(ii) pour 0 p < 1 : une application positive, homog`ene de degre p, verifiant


linegalite triangulaire, i.e.
Np (f ) 0;

Np (f ) Np (f ) + Np (g);

Np (f ) = ||p Np (f ).

En outre, pour tout p [0, +], une fonction f dans Lp (X) verifie Np (f ) = 0
si et seulement si elle est nulle -presque partout.

208

CHAPITRE VI

(13 juin 2010)

D
emonstration. Les assertions dhomogeneite sont evidentes, ainsi que le traitement des cas degalite. Les inegalites triangulaires sont donc le coeur de cette proposition. Pour p = 1, p = 0 ou p = , on les verifie aisement ; pour 1 < p <
cest linegalite de Minkowski ; pour 0 < p < 1 cest une consequence immediate de
linegalite elementaire
(a + b)p ap + bp .

Nous pouvons maintenant definir les espaces fonctionnels de Lebesgue. Pour ce
faire, on va transformer les semi-distances Lp en distances, en quotientant lespace
par le noyau de Np .
D
efinition VI-12 (espaces de Lebesgue). Soit (X, ) un espace mesure, et soit
p [0, +]. On appelle espace de Lebesgue (quotiente) dordre p, et on note Lp (X, )
ou Lp () ou Lp (X, d) ou Lp (d) ou Lp (X, ) .... ou Lp (X) ou Lp (X), ou simplement Lp ou Lp , lespace vectoriel de toutes les classes dequivalence de fonctions
dans Lp (X), pour la relation dequivalence definie par legalite -presque partout.
Si une classe dequivalence f est donnee, Np attribue la meme valeur `a tous ses
representants ; on note cette quantite Np (f ), ou kf kLp , ou kf kp , etc.
Lespace (Lp (X, ), Np ) ainsi defini est un espace vectoriel qui est
- norme pour 1 p ;
- muni dune distance invariante par translation pour 0 p < 1.

Remarques VI-13.
(i) En clair, il y a deux espaces de Lebesgue Lp . Le premier est lespace vectoriel des fonctions mesurables dont la puissance p est
integrable ; a priori, ce nest pas un espace norme. Le deuxi`eme est obtenu
`a partir du premier en identifiant des fonctions qui concident presque partout ; cest un espace norme. Cette identification nous m`ene dans un univers
peu rassurant o`
u les fonctions ne sont pas definies partout, mais seulement
presque partout, et o`
u la valeur dune fonction en un point donne nest jamais
determinee. Cependant, si on ne proc`ede pas `a cette identification, on ne peut
aller bien loin dans lanalyse fonctionnelle. Nous nessaierons pas de distinguer
les deux espaces par des notations differentes ; dans la suite, la denomination
espace Lp sera reservee au second. Certains auteurs tentent de differencier
les deux espaces en utilisant le symbole Lp pour lespace non quotiente, mais
la confusion est si repandue que nous nessaierons pas den faire autant. Il est
recommande de ne pas utiliser lespace quotiente si ce nest pas necessaire.
(ii) Si une fonction appartient `a Lp , lensemble des points o`
u elle est infinie est de
mesure nulle. Quand on passe aux classes dequivalence par la relation degalite
presque partout, on peut donc supposer que les fonctions considerees sont `a
valeurs dans R plutot que R.
(iii) Pour p [0, 1[ lespace Lp , quotiente par la relation degalite presque partout, est un espace vectoriel muni dune distance invariante, mais ce nest pas
un espace vectoriel norme : linegalite de Minkowski telle que nous lavons
enoncee na plus lieu. Il existe en fait une inegalite de Minkowski dans ce cas,
mais seulement pour des fonctions positives, et elle est renversee par rapport
`a celle que nous avons vue. On peut aller plus loin et montrer que Lp nest pas
normable. Lexistence de la distance Np dans ce cas ne suffit pas `a en faire des
espaces fonctionnels agreables, de sorte quon ne les utilise presque jamais.


ESPACES DE LEBESGUE ET MESURES SIGNEES

209

Pour conclure ce paragraphe, nous allons definir les semi-distances Lp sur les
espaces de Lebesgue `a valeurs vectorielles Lp (X; E).
Proposition VI-14 (espaces de Lebesgue `a valeurs vectorielles). Soit (X, )
un espace mesure, et soit E un espace vectoriel muni dune distance invariante par
translation : pour tout p [0, ] on definit
Np (f ) := Np (d(0, f )).

Lapplication Np est alors une application positive, verifiant linegalite triangulaire.


Si E est un espace vectoriel norme et d la distance associee `a la norme, Np est
homog`ene de degre min(p, 1), et en particulier definit une semi-norme pour p 1.
Si lon quotiente Lp (X; E) par la relation degalite presque partout, on obtient
un espace vectoriel sur lequel Np definit une distance invariante par translation. Si
E est un espace vectoriel norme, et p 1, alors lespace Lp (X; E) ainsi obtenu est
un espace vectoriel norme.
Beaucoup des proprietes que nous verrons par la suite se generalisent sans difficulte `a ce cadre `a valeurs vectorielles ; nous nous contenterons den mentionner
certaines, sans demonstration. Le seul point un tant soit peu delicat dans le maniement des espaces de Lebesgue `a valeurs vectorielles ne concerne pas les operations
dans les espaces Lp , mais la construction de lintegrale.
VI-1.4. Th
eor`
eme de convergence domin
ee Lp . Avant daller plus loin,
nous allons examiner une variante simple et utile du theor`eme de convergence dominee, adaptee aux espaces de Lebesgue.
or`
The
eme VI-15 (convergence dominee dans les Lp ). Soient (X, ) un espace
mesure et p ]0, +[. Soit (fk )kN une suite de fonctions mesurables de X dans R,
convergeant presque partout vers une fonction f . On suppose quil existe une fonction
g Lp (X) telle que |fk | g presque partout, pour tout k. Alors, f Lp (X, ) et
Z
|fk f |p d 0,
k

cest-`
a-dire que fk converge vers f dans L .

D
emonstration. Il est clair que |f (x)| g(x) pour presque tout x, et donc que
f Lp . Pour obtenir le reste de lenonce, on applique le theor`eme de convergence
dominee `a la famille |fk f |p : cette famille est dominee par la fonction integrable
(2g)p, et converge presque partout vers 0, son integrale converge donc vers 0.

VI-1.5. Th
eor`
eme de RieszFischer. Lanalyse etant basee pour une grande
part sur des procedes de limite et dapproximation, on netudie dordinaire les espaces
vectoriels normes que sils sont complets, i.e. toute suite de Cauchy converge. Le
theor`eme suivant assure la completude des espaces de Lebesgue.
Th
eor`
eme VI-16 (theor`eme de completude de RieszFischer). Soit (X, ) un
espace mesure, et soit p [0, +]. Soit (fk )kN une suite de Cauchy dans Lp (X, ).
Alors
(i) il existe f Lp tel que fk f dans Lp ;
(ii) il existe une suite extraite de (fk ), notee (fk ), et une fonction g fixee dans
p
L , telle que
|fk | g -presque partout;

210

CHAPITRE VI

f (x)
fk (x)

(13 juin 2010)

pour -presque tout x.

Corollaire VI-17 (statut des espaces Lp ). Soit (X, ) un espace mesure. Alors,
(i) pour tout p [1, +], lespace Lp (X, ), muni de la norme Lp , est un espace
de Banach, i.e. un espace vectoriel norme complet.
(ii) lespace L2 (X, ), muni de la forme bilineaire symetrique
Z
(f, g) f g d

est en outre un espace de Hilbert, i.e. un espace vectoriel complet muni dune
forme bilineaire symetrique definie positive.
(iii) pour tout p [0, 1[, lespace Lp (X, ), muni de la distance Lp , est un espace
de Fr
echet, i.e. un espace vectoriel muni dune distance invariante par translation,
complet.
Remarque VI-18. La completude eventuelle de lespace X ne joue aucun role ;
ce qui est utilise en revanche de mani`ere cruciale, cest la completude de lespace
darrivee, ici R. Ces resultats se generalisent aux espaces de Lebesgue a` valeurs
vectorielles, Lp (X; E), si E est
- un espace de Banach dans le cas (i) ;
- un espace de Hilbert dans le cas (ii) ;
- un espace de Frechet dans le cas (iii).

Lanalyse de Banach et lanalyse de Hilbert sont les branches les plus developpees
de lanalyse fonctionnelle. On en recensera dans le chapitre suivant les resultats les
plus fondamentaux, et on les appliquera aux espaces de Lebesgue. On ne parlera
pas du tout danalyse dans les espaces de Frechet, qui est plus delicate et dusage
beaucoup moins repandu.
ore
`me de RieszFischer. Soit (fk ) une suite de
D
emonstration du the
Cauchy dans Lp ; sa convergence sera assuree si on demontre lexistence dune soussuite convergente. Par recurrence, on construit une suite extraite, toujours notee
(fk ), telle que
Np (fk+1 fk ) 2k .
Le probl`eme est de construire une limite `a cette suite. Pour cela nous distinguerons
plusieurs cas.
1. Supposons dabord 1 p < . On pose f0 = 0, et
gk (x) :=

k
X
j=1

|fj (x) fj1 (x)|,

Par convergence monotone,

g(x) = lim

et par inegalite de Minkowski,


kgk kLp kf0 kLp +

k
X
j=1

g(x) :=

X
j=1

|fj (x) fj1(x)|

gk (x)p d;

kfj fj1 kLp kf0 kLp + 2,


ESPACES DE LEBESGUE ET MESURES SIGNEES

211

on en deduit que g Lp (X). En particulier, il existe un ensemble


negligeable N tel
P
que g(x) < + pour tout x
/ N. Pour de tels x, la serie (fj (x) fj1(x)) est
absolument convergente (par completude de R), et on pose

X
f (x) :=
(fj (x) fj1 (x)) = lim fn (x).
n

j=1

On definit ensuite f arbitrairement (par exemple f = 0) sur N. la suite (fn ) est


alors dominee par une fonction Lp et converge presque partout vers f , on en deduit
quelle converge vers f dans Lp .
2. Pour p = , on sait quen-dehors dun ensemble de mesure nulle on a

X
kfk fk+1 kL ,
|f (x)| kf0 kL +
k=0

ce qui montre que f L ; en outre,

X
|fn (x) f (x)|
kfk fk+1 kL 0,
n

k=n

ce qui prouve la convergence de fk vers f dans L .

3. Dans le cas o`
u 0 < p < 1, on pose
k
 p1

X
p
|fj (x)fj1 (x)|p ,
gk (x) := |f0 (x)| +

g(x) := |f0 (x)| +

j=1

Par convergence monotone, on a toujours


Z
Z
p
|gk (x)|p d;
|g(x)| = lim

X
j=1

|fj (x)fj1 (x)|p

et cest cette fois linegalite triangulaire qui assure que


Np (gk ) Np (f0 ) +

k
X
j=1

Np (fj fj1) Np (f0 ) + 2,

on en deduit que |g|p L1 (X) et on conclut comme dans le cas 1 p < .


4. Enfin, pour p = 0 on peut ecrire
Z X
XZ
1fk 6=fk1 d < +;
1fk 6=fk1 d =
X k1

k1

en particulier, lensemble N des x X tels que fk (x) 6= fk1 (x) pour une infinite de
k est de mesure nulle. Pour tout x
/ N on sait que la suite (fk (x)) est constante `a
partir dun certain rang, et en particulier converge vers une fonction que lon note
f (x). On redefinit f = 0 sur N. Comme
XZ
lim
1fk 6=fk1 d = 0,
k0

kk0

on voit que pour k0 assez grand la mesure de lensemble des x tels quil existe
un k k0 pour lequel fk (x) 6= fk1(x) est arbitrairement petite. On conclut que
N0 (fk0 f ) est arbitrairement petit pour k0 assez grand. La preuve est donc (cest
le cas de le dire) compl`ete.


 p1

212

CHAPITRE VI

(13 juin 2010)

Remarque VI-19. Dans le cas o`


u p = 1, on a retrouve une variante de la
reciproque du theor`eme de convergence dominee (Theor`eme III-21).
VI-1.6. Produit tensoriel despaces de Lebesgue. Soient (X1 , 1 ) et (X2 , 2 )
des espaces mesures. Nous avons acc`es aux espaces Lp (X1 , 1 ) et Lp (X2 , 2 ), faits
de fonctions p-integrables dans la variable x1 ou dans la variable x2 . Quand on manipule des fonctions Lp integrables dans les deux variables x1 et x2 , elles peuvent
etre
- donnees intrins`equement comme fonctions de x1 et x2 ;
- construites `a partir de fonctions de x1 et de fonctions de x2 , et doperations
elementaires ou de passages `a la limite.
Pour produire une fonction p-integrable dans les deux variables `a partir de fonctions p-integrables dune variable, une operation elementaire particuli`erement simple
et naturelle consiste `a multiplier de telles fonctions. Soient donc f1 Lp (X1 , 1 ) et
f2 Lp (X2 , 2 ), on note
(f1 f2 )(x1 , x2 ) = f1 (x1 ) f2 (x2 ).

Cette fonction est appelee produit tensoriel de f1 par f2 .


Nous avons donc deux espaces a priori interessants :
- lespace Lp (X1 X2 , 1 2 ) ;
- lespace Lp (X1 , 1 )Lp (X2 , 2 ), qui par definition est ladherence dans Lp (X1
X2 , 1 2 ) de lespace vectoriel engendre par les produits tensoriels ; cest donc
lensemble de toutes les limites de combinaisons lineaires finies de produits tensoriels.
Le theor`eme suivant, que nous demontrerons au chapitre suivant, donne des
conditions suffisantes pour quil y ait identite entre ces deux notions, et pour que
toute fonction Lp -integrable dans les deux variables puisse etre approchee par des
combinaisons lineaires de produits tensoriels :
Th
eor`
eme VI-20. Soient (X1 , d1 ) et (X2 , d2 ) des espaces metriques separables,
equipes de mesures de Borel 1 et 2 , reguli`eres et -finies. On munit X1 X2
de la topologie produit ; alors pour tout p [1, +[, Lp (X1 , 1) Lp (X2 , 2 ) =
Lp (X1 X2 , 1 2 ).
On trouvera la demonstration en p. 258.
VI-1.7. Espaces de Lebesgue locaux. Il est souvent utile de travailler avec
des fonctions qui sont integrables, ou Lp -integrables, sur des ensembles bornes (par
exemple) sans etre necessairement integrables sur tout lespace. Dans ce cours, on
adoptera la definition suivante.
D
efinition VI-21 (espaces de Lebesgue locaux). Soit (X, d) un espace metrique.
On note Lploc (X) lensemble des fonctions mesurables X R qui sont Lp -integrables
sur toutes les boules de X.
Bien noter que cette definition depend fortement de la metrique, pas seulement
de la topologie. On pourrait bien s
ur definir les espaces locaux en utilisant des
ensembles compacts ; mais en pratique cest le concept precedent qui nous sera utile.
VI-2. In
egalit
es et relations entre espaces de Lebesgue
Dans cette section on va passer en revue des inegalites precieuses qui lient les
normes de Lebesgue Lp pour des exposants p differents.


ESPACES DE LEBESGUE ET MESURES SIGNEES

213

VI-2.1. In
egalit
e de H
older Lp et dualit
e des normes Lp .
or`
The
eme VI-22 (inegalite de Holder dans les espaces Lp ). Soit (X, ) un espace mesure, et soient f, g deux fonctions mesurables de X dans R, p [1, +],
p := p/(p 1). Alors
Z
Z


f g d
|f g| d kf kLp kgkLp


X

(o`
u le membre de gauche est par convention + si f g nest pas integrable).
Plus generalement, soient f1 ,P
. . . , fk des fonctions mesurables, et p1 , . . . , pk des
exposants dans [1, +], tels que
p1
k 1. Alors
k

Y
j

fj kLr

Y
j

kfj kL ,
pj

1 X 1
=
.
r
p
j=1 j

D
emonstration. Si r = , necessairement p = q = et linegalite est
evidente. Dans le cas contraire, il suffit dappliquer linegalite de Holder habituelle
aux fonctions |f |r et |g|r , avec les exposants conjugues p/r et q/r (en effet, (r/p) +
(r/q) = 1).

Corollaire VI-23 (convergence de produits). Soient (X, ) un espace mesure,
p [1, ] et p := p/(p 1). Soient (fn ) et (gn ) des suites de fonctions mesurables,

telles que fn f dans Lp (X, ) et gn g dans Lp (X, ). Alors fn gn converge


vers f g dans L1 , et en particulier
Z
Z
fn gn d f g d.
Plus generalement, si on se donne k suites de fonctions mesurables (f1,n ), . . . , (fk,n)
telles que
j, fj,n fj
dans Lpj (),
P 1
avec
pj 1. Alors
Y
j

fj,n r
L ()

Y
j

fj ,

1 X 1
=
.
r
p
j=1 j

D
emonstration. Il est clair que le deuxi`eme enonce implique le premier, et que
par recurrence, il suffit de traiter le cas k = 2. On se donne donc deux exposants p et
q, et fn f dans Lp , gn g dans Lq , et on cherche `a montrer que fn gn f g
dans Lr , avec 1/r = (1/p) + (1/q). Pour cela on ecrit
kfn gn f gkLr kfn (gn g)kLr +kg(fn f )kLr kfn kLp kgn gkLq +kgkLp kfn f kLq .

Puisque la suite (fn ) converge dans Lp , elle est bornee dans cet espace ; on en deduit
que lexpression precedente converge vers 0 quand n .


Nous verrons au chapitre suivant que lespace Lp peut etre identifie `a lespace

des formes lineaires continues sur Lp , p := p/(p 1), sous certaines restrictions sur
p (1 < p , X -fini pour p = ) ; on dit quil y a dualite entre les espaces Lp

et Lp . Independamment de ce theor`eme non trivial, on peut demontrer simplement

certains liens tr`es utiles entre norme Lp et norme Lp , valables pour tous p [1, ].

214

CHAPITRE VI

(13 juin 2010)

or`
The
eme VI-24 (representation duale des normes Lp ). Soient (X, ) un espace
mesure, et p [1, [. Alors, pour tout f Lp (),
R

Z
f g d
,
f g d;
kgkLp () = 1 = sup
kf kLp () = sup
kgk p 6=0 kgkLp ()
L

()

o`
u p := p/(p 1) ]1, ]. En outre, le supremum peut etre restreint `a lensembles
des fonctions g qui secrivent comme combinaisons lineaires (finies) de fonctions
indicatrices densembles mesurables de mesure finie.
Si (X, ) est -fini, cet enonce est egalement valable pour p = .
D
emonstration. Si f = 0 (presque partout), lidentite est evidente ; on se
limite donc au cas o`
u f 6= 0. Legalite entre les deux suprema est une consequence
de ce que k kLp est une norme. Linegalite de Holder se reecrit
R
f g d
kf kLp () ,
kgkLp ()

pour tout g Lp (), ce qui implique


R
sup

kgk

Lp ()

f g d
kf kLp () .
6 0 kgkLp ()
=

Il suffit donc de montrer que


(39)

kf kLp ()

sup
kgk

Lp ()

f g d
.
6 0 kgkLp ()
=

Commencons par le cas o`


u p < ; pour montrer (39) il suffit de choisir g :=

|f |p2f Lp ().
Montrons maintenant, toujours dans le cas p < , que le supremum peut etre
restreint `a des fonctions tr`es simples. On sait que la partie positive f+ de f est
limite dune suite croissante de fonctions simples hk ; puisque f+ Lp (X, ), ces
fonctions sont Lp -integrables, et par convergence monotone, hk converge vers f+
dans Lp . En appliquant le meme raisonnement `a f , on voit que f est limite dans Lp
dune suite fk de fonctions simples Lp , qui secrivent forcement comme combinaisons
lineaires de fonctions indicatrices densembles mesurables
de mesure finie. Il en est
R
de meme de gk := |fk |p2 fk . On a alors kfk kLp = fk gk d. On ecrit, en utilisant
linegalite de Holder,
Z
Z
Z
f gk d = fk gk d + (f fk ) gk d kfk kLp kf fk kLp kgk kLp .
Le premier terme du membre de droite tend vers kf kLp , tandis que le second tend
vers 0 puisque fk f dans Lp . On en deduit que
Z
lim inf f gk d kf kLp ,

ce qui conclut la preuve.


Passons maintenant au cas o`
u p = . Par definition de kf kL , pour tout >
0, lensemble Y := {x; |f (x)| > kf kL } est de mesure strictement positive.
Comme X est -fini, on peut trouver dans Y un sous-ensemble Z de mesure finie


ESPACES DE LEBESGUE ET MESURES SIGNEES

215

et strictement positive (il sagit l`a dune mani`ere tr`es faible dutiliser la -finitude).
On pose alors
1Z sign(f )
;
g :=
[Z ]
cest une fonction integrable, kgkL1 = 1 et
Z
Z
Z
1
1
f g d =
|f | d
(kf kL ) d kf kL .
[Z ] Z
[Z ] Z
X
On conclut en faisant tendre vers 0.

VI-2.2. Relations dinclusion. Il est souvent crucial de garder en tete les


relations dinclusion entre espaces de Lebesgue. Nous limiterons la discussion au cas
o`
u p 1. Si lespace X est de mesure finie, alors les espaces de Lebesgue Lp (X) sont
embotes :
or`
The
eme VI-25 (embotement decroissant des espaces de Lebesgue). Soit
(X, ) un espace mesure fini : [X] < +. Alors, d`es que q p 1 on a, pour
tout f mesurable de X dans R,
1

kf kLp kf kLq [X] p q .

En particulier, les espaces de Lebesgue Lp (X, ) (p 1) sont embotes dans le sens


decroissant :
q p 1 = Lq Lp ,

et cette injection est continue.

D
emonstration. Cest une consequence de linegalite de Holder : on ecrit
p/q Z 1p/q
Z
Z
p
p q/p
1
|f | 1
(|f | )
et on el`eve les deux membres de linegalite `a la puissance 1/q.

Dans le cas general, les espaces de Lebesgue ne sont pas embotes, et il ny a pas
de r`egle generale. On peut dailleurs trouver des situations o`
u lembotement a lieu,
mais dans le sens oppose `a celui que nous venons de decrire.
eme VI-26 (embotement croissant des espaces de Lebesgue). Soit (X, )
eor`
Th
un espace mesure tel que
> 0;

x X,

[{x}] .

Alors, d`es que q p 1, pour tout f mesurable de X dans R on a


kf kLq

kf kLp .

En particulier, les espaces de Lebesgue Lp (X, ) (p 1) sont embotes dans le sens


croissant :
q p 1 = Lp (X) Lq (X),
et linjection est continue.

1 1
q
p

216

CHAPITRE VI

(13 juin 2010)

D
emonstration. Sans perte de generalite, supposons f positive. Pour tout
x0 X, on a
Z
f p d [{x0 }] f (x0 )p f (x0 )p .
En passant au supremum essentiel, on obtient

kf kLp 1/p kf kL .
En reportant cette information dans linegalite
Z
Z
qp
q
f p,
f kf kL

on trouve

fq

1
q
1
p

do`
u lon deduit facilement le resultat.

kf kpLp kf kLqp
p ,


Exemple VI-27. Soit X = B1 (0) Rn , muni de la mesure de Lebesgue n :


alors les espaces Lp (B1 ) sont embotes dans le sens decroissant. En revanche, les
espaces p (N) sont embotes dans le sens croissant. Les espaces Lp (R) en revanche
ne sont embotes ni dans le sens croissant, ni dans le sens decroissant.
Cependant, meme sils ne sont pas embotes, les espaces de Lebesgue sont en
interpolation :
Th
eor`
eme VI-28 (interpolation des espaces de Lebesgue). Soit X un espace
mesure. Alors, d`es que 1 p q r , on a, pour toute fonction mesurable
f : X R,
(40)

kf kLq kf kLp kf kL1


r ,

o`
u est choisi de sorte que
1
1
= +
.
q
p
r
En particulier,
Lp Lr Lq ,

et cette injection est continue. En outre, Lp Lr est dense dans Lq .


D
emonstration. La preuve de linegalite (40) consiste `a ecrire f q = f a f b , o`
u
q = a + b, et `a appliquer linegalite de Holder avec des exposants bien choisis ; il
sagit dun excellent exercice, vivement recommande au lecteur. On en deduit bien
s
ur que Lp Lr est inclus dans Lq . Linjection est continue si lon munit Lp Lr
de sa norme naturelle kf kLp + kf kLr . Reste `a prouver la densite : au vu des
relations dinclusion, on a L1 L Lp Lr Lq , il suffit donc de montrer que
L1 L est dense dans Lq . Soit donc f LqR, on pose fk R:= f 1|f |k . Alors fk est
borne par construction, et integrable puisque |f |q k q1 |fk |. En appliquant le

Theor`eme VI-15, on verifie facilement que kfk f kLq 0 quand k .
Remarque VI-29. Nous examinerons en fin de chapitre des theor`emes plus
generaux, dits dinterpolation, qui vont dans la meme direction.
Voici un corollaire simple et utile du theor`eme precedent.


ESPACES DE LEBESGUE ET MESURES SIGNEES

217

Corollaire VI-30 (convergence via interpolation). Soit X un espace mesure, et


soient p, q deux exposants compris entre 1 et . Soit (fn )nN une suite de fonctions
mesurables convergeant vers f dans Lp , et bornee dans Lq . Alors, pour tout exposant
r compris entre p et q (exclus), la suite (fn ) converge vers f dans Lr .
VI-2.3. Continuit
e de la norme en p. Nous avons defini une famille de
p
normes L pour un param`etre p variant contin
ument entre 0 et . Une question
tr`es naturelle est la continuite de cette norme en le param`etre p.
or`
The
eme VI-31 (continuite de la norme Lp en p). Soient (X, ) un espace
mesure, et f : X R une fonction mesurable. Soit
n
o
J := p [0, ]; Np (f ) < + .
Alors J est un intervalle (eventuellement vide) et p 7 Np (f ) est continue sur
ladherence de J (`a valeurs dans [0, +]).

Remarques VI-32.
(i) Remarquons que p 7 Np (f ) nest en general pas
continue sur [0, +] tout entier ; cest pourquoi nous nous restreignons `a
ladherence de J. Par exemple, si lon consid`ere X = R, muni de la mesure
de Lebesgue, alors la fonction identiquement egale `a 1 nappartient `a aucun
autre espace de Lebesgue que L , donc Np (f ) = + pour tout p < + ;
mais N (f ) = 1, il ny a donc pas continuite quand p . En fait, pour
tout p0 > 0 on peut trouver, en jouant sur la decroissance `a linfini et une
singularite en 0, une fonction qui appartienne `a Lp (R) uniquement si p = p0
(exercice).
(ii) Linteret principal de ce theor`eme est sans doute la continuite en +. En
fait, dapr`es la demonstration qui suit, d`es quil existe q 1 tel que f Lq (X),
alors
Np (f ) kf kL .
p

Cet enonce est parfois utile dans des probl`emes de recherche tr`es concrets (par
exemple le schema diteration de Moser en theorie des equations aux derivees
partielles).
(iii) Linegalite (40) entrane que log Np (f ) est une fonction convexe de 1/p,
et on peut montrer que cette fonction est semi-continue inferieurement. Ces
proprietes impliquent que Np (f ) est continue sur J (la convexite implique
seulement la continuite dans linterieur de J). Cependant, nous allons donner
une demonstration qui nutilise pas explicitement cet argument.
D
emonstration. 1. Le fait que lensemble des valeurs de p o`
u Np (f ) < +
est un intervalle decoule facilement du Theor`eme VI-28. En fait on peut montrer
que la fonction log Np (f ) est une fonction convexe de 1/p, ce qui implique aussi le
resultat.
2. Considerons dabord la continuite en p 6= {0, }. Par continuite de lapplication p 7 X min(1,1/p) pour p ]0, +[, il nous suffit de prouver que pour toute suite
pk convergeant vers p, f Lpk ,
Z
Z
pk
|f | d |f |p d.
k

218

CHAPITRE VI

(13 juin 2010)

Notons bien que lhypoth`ese f Lp nest pas faite, de sorte que p pourrait etre
au bord de lintervalle J. On supposera par exemple que pk tend vers p en croissant. Alors on a convergence monotone (lune croissante, lautre decroissante) de
|f |pk 1|f |1 et |f |pk 1|f |<1 vers |f |p 1|f |1 et |f |p 1|f |<1 respectivement. Le passage `a la
limite croissante ne pose pas de probl`eme ; et puisque |f |pk L1 , on peut passer
aussi `a la limite decroissante. On conclut que
Z
Z
Z
Z
pk
p
pk
|f |
|f | ;
|f |
|f |p .
|f |1

|f |1

|f |<1

|f |<1

Le theor`eme en decoule.
3. Un raisonnement du meme type permet de traiter le cas p = 0, en separant
les trois cas |f | = 0, 0 < |f | 1, |f | > 1.
4. Passons maintenant au cas o`
u p = . Soit q 1 tel que f Lq . En utilisant
les identites elementaires
1/q

kf kLq = k|f |q kL1 ;

k|f |q kL = kf kqL ,

on voit que lon peut remplacer le probl`eme sur f par le probl`eme sur |f |q , et que
nous pouvons donc supposer sans perte de generalite
f L1 ;

f 0.

On supposera egalement que f nest pas identiquement nulle, auquel cas la solution
est triviale ; donc kf kL 6= 0.
5. Soit K > 0 tel que K < kf kL . Par definition du supremum essentiel, on a
a(K) := [{f K}] > 0;
il sensuit, par inegalite de Chebyshev,
kf kLp [a(K)M p ]1/p = Ma(K)1/p M.
p

En faisant tendre M vers kf kL , on en deduit (que kf kL soit fini ou non)


lim inf kf kLp kf kL .
p

Si kf kL = +, ceci ach`eve la preuve.

6. Supposons maintenant que kf kL < +. Comme f L1 , nous pouvons


utiliser, pour tout p 1, linegalite dinterpolation
1/p

11/p

kf kLp kf kL1 kf kL

(qui se demontre tr`es simplement, sans meme que lon ait besoin de recourir `a
linegalite de Holder). En faisant tendre p vers linfini dans cette inegalite, on obtient
lim sup kf kLp kf kL ,
p

ce qui conclut la preuve.


ESPACES DE LEBESGUE ET MESURES SIGNEES

219

VI-2.4. Interpolation entre espaces de Lebesgue. Le Theor`eme VI-28


montre comment, `a partir dinformations dans des espaces de Lebesgue Lp et Lq ,
on peut parfois obtenir des informations dans des espaces de Lebesgue Lr pour tout
r compris entre p et q. Nous allons maintenant voir des theor`emes plus generaux
qui rendent ce point de vue systematique. Dans la suite, on note Lp (X) + Lq (X)
lespace vectoriel de toutes les fonctions mesurables de la forme f + g, o`
u f Lp (X)
q
et g L (X). En outre, si T est un operateur lineaire dun espace vectoriel norme
E dans un espace vectoriel norme F , on pose
kT xkF
kT kEF := sup
.
kxkE 6=0 kxkE

Les deux theor`emes qui suivent sont les deux principaux theor`emes dinterpolation entre espaces de Lebesgue. Ils reposent sur des techniques tr`es differentes, et ne
sont pas comparables. Le premier a donne naissance `a la theorie de linterpolation
complexe, et le second `a la theorie de linterpolation r
eelle, techniques dune
grande importance en analyse.

or`
The
eme VI-33 (theor`eme dinterpolation de RieszThorin). Soient X et Y
deux espaces mesures et p0 , p1 , q0 , q1 des exposants compris entre 1 et au sens
large. Soit T un operateur lineaire continu de Lp0 (X) dans Lq0 (X), et de Lp1 (X)
dans Lq1 (Y ). Alors, pour tout ]0, 1[, loperateur T admet un unique prolongement
continu de Lp (X) dans Lq (Y ), o`
u
1
1

1
1

=
+ ,
=
+ .
p
p0
p1
q
q0
q1
En outre, si lon pose M = kT kLp Lq , alors
M M01 M1 .

Cas particulier important : Si 1 p q , et T est un operateur


lineaire, borne de Lp dans Lp et de Lq dans Lq , alors T se prolonge uniquement en
un operateur borne de Lr dans Lr , pour tout r [p, q].
Le Theor`eme de RieszThorin peut se reformuler comme suit : lensemble des
couples (1/p, 1/q) tels que T soit continu de Lp dans Lq est un ensemble convexe,
et log kT kLp Lq est une fonction convexe du couple (1/p, 1/q). Ce theor`eme a pour
avantage de donner des bornes tr`es precises, qui sont optimales dans le cas general
(ce qui nexclut pas quon ne puisse les ameliorer quand on consid`ere un operateur
T particulier). Le Theor`eme qui suit ne donne pas de bornes aussi bonnes, mais
permet dinclure dans la discussion les espaces de Marcinkiewicz, dont nous avons
vu quils sont leg`erement plus gros que les espaces de Lebesgue ; ce raffinement
sav`ere parfois precieux.
or`
The
eme VI-34 (Theor`eme dinterpolation de Marcinkiewicz). Soient (X, )
et (Y, ) des espaces mesures, et soient p0 , q0 , p1 , q1 [1, +] avec q0 6= q1 , p0 q0 ,
p1 q1 . Si T est lineaire continu de Lp0 (X) dans Lq0 , (Y ) et de Lp1 (X) dans
Lq1 , (Y ), alors pour tout ]0, 1[, loperateur T admet un unique prolongement
continu de Lp (X) dans Lq (Y ), o`
u
1
1

1
1

=
+ ,
=
+ .
p
p0
p1
q
q0
q1

220

CHAPITRE VI

(13 juin 2010)

En outre, si lon note M0 = kT kLp0 Lq0 , , M1 = kT kLp1 Lq1 , , M = kT kLp Lq ,


alors il existe une constante C , ne dependant que de , p0 , p1 , q0 , q1 , telle que
M C M01 M1 .
Cas particulier important : Soient (X, ) et (Y, ) des espaces mesures finis, et soit T un operateur lineaire continu de L1 (X) dans L1, (Y ) et de L (X)
dans L (Y ). Alors, pour tout p ]1, +], il existe un unique prolongement de T en
un operateur continu de Lp (X) dans Lp (Y ). Plus precisement, il existe une constante
numerique C (C = e1/e 2 convient) telle que pour tout p [1, +],
kT kLp Lp

Cp
1/p
11/p
kT kL1L1, kT kL L .
p1

Parlons maintenant des demonstrations de ces theor`emes. Cest Riesz qui eut le
premier lidee, vers 1926, de la technique dinterpolation entre espaces de Lebesgue,
et prouva le theor`eme maintenant appele theor`eme de RieszThorin. Vers la fin des
annees 1930, Thorin mit au point la preuve que nous allons esquisser ci-apr`es, basee
sur lanalyse complexe ; `a peu pr`es au meme moment, Marcinkiewicz demontrait le
theor`eme qui porte son nom par des methodes tr`es differentes. Un outil-cle dans le
theor`eme de RieszThorin est le lemme suivant, qui est bien s
ur une variante du
principe du maximum pour les fonctions holomorphes (voir [Rudin] par exemple) :
Lemme VI-35 (Lemme des trois lignes). Soit S := {x+iy; x [0, 1]; y R} C
une bande du plan complexe, et soit f : S C une fonction continue bornee,
holomorphe dans linterieur de S. Alors,
(i) supS |f | = supS |f | ;
(ii) soit M := supyR |f ( + iy)| ; alors
M M1 M01 .
D
emonstration. 1. Supposons dabord que f a pour limite 0 `a linfini, et soit
< kf k ; puisque f tend vers 0 `a linfini, il existe M R tel que |f | (vu comme une
fonction sur R2 ) atteint son maximum sur [0, 1] [M, M]. On conclut la preuve de
(i) en appliquant le principe du maximum pour les fonctions holomorphes definies
sur des ouverts bornes.
2. Dans le cas general o`
u f ne converge pas forcement vers 0, on sy ram`ene en
2
considerant z0 tel que |f (z0 )| (1 )kf k et en posant g(z) = e(zz0 ) f (z),
> 0. En appliquant le resultat precedent, on voit que |g(z)| atteint son maximum
sur le bord ; or ce maximum est au moins |g(z0 )| (1 )kf k . En particulier,
sup |f | (1 )kf k ,
S

et on conclut (i) en faisant tendre vers 0.


3. Lenonce (ii) est obtenu `a partir de (i) en posant h(z) = ez f (z), R.
Alors
M e sup |h| e sup |h| e max(M0 , e M1 ).
S

On choisit de sorte que


M0 = e M1 ,


ESPACES DE LEBESGUE ET MESURES SIGNEES

221

i.e. e = M1 /M0 . Lestimation ci-dessus devient alors


M M1 M01 .

D
emonstration du Th
eor`
eme de RieszThorin. On note p = p , q = q ;
et Mj = kT kLpj Lqj . On va utiliser le Theor`eme VI-24, sous la forme
R
f g d
kf kLq () = sup
,
kgk q 6=0 kgkLq ()
L

o`
u le supremum est pris sur toutes les fonctions g qui sont combinaisons lineaires
de fonctions indicatrices densembles de mesure finie ; nous appellerons fonctions
simples de telles fonctions.
Montrer que T est borne Lp Lq avec norme au plus M1 M01 revient `a prouver
que
kT f kLq M1 M01 kf kLp

(41)

pour toute fonction f Lp , ou, de mani`ere equivalente, pour toute fonction f simple.
Encore une fois, par densite et en traitant `a part le cas p = , on voit quil suffit
detablir (41) dans le cas o`
u f est une fonction simple. Notre but est donc

Z


(T f )g M1 M01 kf kLp kgk q .
(42)
L

Nous allons maintenant introduire un param`etre dinterpolation z S, et faire


varier toutes les quantites ci-dessus en fonction de z. Etant donnees deux fonctions
simples f et g, on pose donc
fz (x) = |f (x)|

1z
+ pz
p0
1

f (x)
,
|f (x)|

g(y)
,
|g(y)|
avec la convention 0/0 = 0. Ces fonctions fz sont simples, en particulier dans tous
les espaces Lr , et il sensuit que T fz Lq0 Lq1 pour tout z ; la fonction
Z
: z 7 (T fz )gz
gz (y) = |g(y)|

1z
+ qz
q
0
1

est donc bien definie. En decomposant fz et gz en combinaison lineaire de fonctions


indicatrices, on voit quen fait on peut ecrire sous la forme
X z+
(z) =
ak k k ,
R, R;
1kK

en particulier est holomorphe et bornee dans S, et on peut appliquer le lemme des


trois lignes :



|()|

sup |(it)|1
tR

sup |(1 + it)|1 .


tR

Mais () nest autre que T f g. Par ailleurs,



Z


q /q0
0
T fit git kT fit kLq0 kgit k q kT kLp0 Lq0 kf kp/p
p kgk q ,
L


0
L
L

222

CHAPITRE VI

(13 juin 2010)

et lon peut faire une majoration similaire pour les z = 1 + it. La conclusion en
decoule facilement.

ore
`me de Marcinkiewicz. Nous nous contenterons
D
emonstration du the
de demontrer le cas particulier, qui est utile dans de nombreuses situations. Le
lecteur pourra essayer de reconstituer la demonstration generale en adaptant la technique utilisee ci-dessous ; ou consulter [Zygmund, tome II, chapitre XII, theor`eme
4.6].
Cette fois nous allons demontrer le theor`eme directement, sans passer par des
fonctions simples. La preuve fait intervenir deux idees principales :
- representer les normes des fonctions en jeu au moyen de la taille de leurs
ensembles de sur-niveau, i.e. le lieu des points o`
u ces fonctions sont plus grandes
quun certain param`etre t,
- decomposer la fonction en jeu en la somme de deux fonctions appartenant aux
espaces que lon interpole, o`
u les deux fonctions sont choisies independamment pour
chaque valeur du param`etre.
Ecrivons donc
kT f kL1, M0 kf kL1 .

kT f kL M1 kf kL ,

La deuxi`eme inegalite se reecrit


t > 0,

t[{|T f | > t}] M0 kf kL1 .

Sans perte de generalite on supposera que M01 M1 = 1 ; on peut toujours se ramener


`a ce cas en multipliant T par une constante convenable.
On se souvient de la formule 17 :
Z
Z +
p
|f | = p
[{|f | > t}]tp1 dt.
0

De meme,

|T f | = p

Pour tout t 0 on ecrit alors


(t)

(t)

f = f1 + f2 ,

[{|T f | > t}]tp1 dt.

0
(t)

f1 = f 1|f |At,

(t)

f2 = f2 1|f |>At .

La borne L L entrane que pour tout t 0,


(t)

|T f1 | M1 At.

En particulier,

(t)

[{|T f | > t}] [{|T f2 | > (1 M1 A)t}].


R
En reportant cette inegalite dans la representation de |T f |p, on trouve
Z
Z +
(t)
p
|T f | p
[{|T f2 > (1 M1 A)t}]tp1 dt
= (1 M1 A)1 p
1

(1M1 A) pM0

+
0

+ 


(t)
(1 M1 A)t[{|T f2 > (1 M1 A)t}] tp2 dt

(t)
kf2 kL1 tp2 dt

= (1M1 A) pM0

|f |1|f |>At tp2 dt.


ESPACES DE LEBESGUE ET MESURES SIGNEES

223

On applique alors Fubini et un changement de variable evident pour reecrire le


dernier terme sous la forme
!
Z |f |/A
Z
(1 M1 A)1 pM0 |f |
tp2 dt
0

pM0
=
(p 1)(1 M1 A)Ap1

|f |p.

On pose M1 A = , la constante apparaissant en facteur de


pour = 1/p , et vaut cp M0 M1p1 , avec
p

pp+1
1/p p
cp =
= p
,
(p 1)p
p1

|f |p est minimale

que lon majore en utilisant p1/p e1/e . La preuve est compl`ete.

Pour conclure cette section, mentionnons une variante interessante du theor`eme


de RieszThorin, o`
u lon sautorise une dependance de loperateur, est la suivante.
Convenons quune famille (Tz ) definit une famille holomorphe doperateurs si la
fonction z 7 Tz f est holomorphe pour tout f simple. On peut alors changer, dans
lenonce du Theor`eme de RieszThorin, loperateur T en une famille holomorphes
doperateurs Tz ; lhypoth`ese de bornes Lp0 Lq0 et Lp1 Lq1 sur T est alors
remplacee par une hypoth`ese similaire sur T0 et T1 respectivement.
Th
eor`
eme VI-36 (theor`eme dinterpolation de Stein). Soient X et Y deux espaces mesures -finis, et p0 , p1 , q0 , q1 des exposants compris entre 1 et au sens
large. Soit (Tz )zD une famille holomorphe doperateurs lineaires definis sur une
partie D du plan complexe incluant la bande S des nombres complexes dont la partie
reelle est comprise entre 0 et 1. On suppose que T0 est borne de Lp0 (X) + Lq0 (Y )
dans Lp1 (X) + Lq1 (Y ), tel que T1 est borne Lp0 (X) Lp1 (Y ), et Lq0 (X) Lq1 (Y ).
Alors,
T est borne Lp (X) Lq (Y ),
En outre, si on pose M = kTz kLp Lq , alors

M M01 M1 .
La demonstration est similaire `a celle du theor`eme de RieszThorin.
Exemple VI-37. Soit une mesure et w une fonction positive ; la famille doperateurs
Tz : f 7 w z f
satisfait aux hypoth`eses du theor`eme. Le theor`eme dinterpolation de Stein devient alors un theor`eme dinterpolation entre espaces de Lebesgue `
a poids.
Par exemple, si v est une fonction positive et si lon definit
kf kLp = kf v kLp ,
alors on a, pour tout operateur lineaire S,

q .
kSkLp Lq kSk1
p
q kSk p1
L L 1
L 0 L 0

224

CHAPITRE VI

(13 juin 2010)

VI-3. Espace des fonctions mesurables


Nous allons maintenant introduire une notion naturelle de convergence des fonctions mesurables, ne presupposant aucune integrabilite, et etudier ses liens avec la
convergence Lp .
VI-3.1. Convergence dans L. Une premi`ere idee qui vient `a lesprit consiste
`a utiliser la convergence presque partout, comme naturellement associee au cadre
de la theorie de la mesure. Cependant, cette notion presente de graves defauts : en
particulier, la convergence Lp (1 p < ) nimplique pas la convergence presque
partout. En outre, la convergence presque partout nest pas associee `a une metrique :
en effet, on demontre facilement que dans un espace metrique, si une suite (fn ) a la
propriete que toute sous-suite extraite admet une sous-sous-suite convergeant vers un
certain f , alors la suite fn enti`ere tend vers f . Or nous avons vu (Exemple III-20(i))
que cet enonce nest pas vrai pour la convergence presque partout.
La notion naturelle de convergence est en fait celle que nous venons dinvoquer
implicitement.
D
efinition VI-38 (convergence au sens des fonctions mesurables). Soient X et
Y deux espace mesures. On dit une famille (fn )n1 de fonctions mesurables de X
dans Y converge vers f si de toute sous-suite extraite (fn ) de (fn ) on peut extraire
une sous-sous-suite extraite (fn ) qui converge presque partout vers f .
Pour abreger, on pourra dire que fn converge presque partout `a extraction
pr`es. Cette notion a en commun avec la notion de convergence presque partout la
propriete de stabilite par composition : si fn : X Y converge vers f et est
nimporte quelle fonction mesurable de Y dans un autre espace mesurable Z, alors
fn converge vers f .
Contrairement `a la convergence presque partout, la convergence presque partout
`a extraction pr`es est en general associee `a une metrique. Pour se souvenir que cette
notion de convergence est plus faible que toutes les convergences Lp , nous lappellerons convergence dans L.
Proposition VI-39 (convergence dans L et convergence en mesure). Soient
(X, ) un espace mesure f ini, (Y, d) un espace metrique, et soit une fonction
strictement positive partout sur X, dintegrale convergente. Alors la formule
Z
d(f (x), g(x))
(f, g) :=
(x) d(x)
X 1 + d(f (x), g(x))

definit une distance sur lespace L(X, ; Y ) des fonctions mesurables de X dans Y ,
quotiente par la relation degalite -presque partout. On note cet espace L(X, ) dans
le cas o`
u Y est R muni de la distance euclidienne. Les trois assertions suivantes sont
equivalentes :
(i) (fn , f ) 0 ;
(ii) de toute suite extraite (fn ) on peut extraire une suite extraite (fn ) qui
converge presque partout vers f ;
(iii) fn converge vers f en mesure sur les parties finies, i.e. pour toute partie A
de mesure finie on a


> 0, {x A; d(fn (x), f (x)) } 0.
n


ESPACES DE LEBESGUE ET MESURES SIGNEES

225

Si Y est complet, lespace L ainsi defini est un espace metrique complet. Si Y =


R, alors L1 L est dense dans L.
Remarques VI-40.
(i) Lexistence dune fonction integrable et strictement positive est garantie par lhypoth`ese de -additivite : soit (Ak )k1 une
famille densembles mesurables disjoints, de mesure finie, dont la reunion est
X, on peut poser
X 1A
k
k =
.
2
k [Ak ]
k1
(ii) En theorie des probabilites ([X] = 1), la convergence en mesuxre est appelee
convergence en probabilite.
D
emonstration. Nous donnerons la preuve uniquement dans le cas o`
u Y = R.
Supposons que lassertion (i) du theor`eme est verifiee, et soit (fn ) une suite extraite
de (fn ). La fonction positive integrable (x)|fn (x) f (x)|/(1 + |fn (x) f (x)|)
converge vers 0 dans L1 (X), on peut donc extraire une sous suite n pour laquelle
cette expression converge vers 0 presque partout. Comme est strictement positive
partout, on en deduit que fn converge presque partout vers f . Lassertion (ii) est
donc vraie.
Pour montrer que (ii) implique (i), on extrait une sous-suite n quelconque, et
de cette sous-suite on extrait une sous-sous-suite pour laquelle la convergence a lieu
presque partout, et on applique le theor`eme de convergence dominee `a la famille
|fn f |/(1 + |fn f |), dominee par . On montre ainsi que (fn , f ) 0.
Comme la sous-suite extraite fn etait arbitraire, et que definit une metrique, on
en deduit que (fn , f ) 0.
Supposons de nouveau que lassertion (i) du theor`eme soit verifiee, et soit Bn,
lensemble des x X tels que |fn (x) f (x)| : alors
Z

(fn , f )
d,
1 + Bn,

et donc

Bn,

d 0.
n

Soit maintenant A une partie de mesure finie. Comme X est la reunion denombrable
croissante des { 1/k, on peut trouver K = K() tel que
[{ 1/K} A] [A] ,

o`
u est arbitrairement petit. On a alors

[Bn, A] [Bn, A { 1/K}] + K()

d + .

Bn,

A et fixes, le premier terme du membre de droite tend vers 0 quand n ;


comme est arbitrairement petit, on conclut que
[Bn, A] 0,
n

ce qui veut dire quil y a bien convergence en mesure sur toutes les parties de mesure
finie.

226

CHAPITRE VI

(13 juin 2010)

Finalement, supposons lassertion (iii) du theor`eme verifiee, et prouvons lassertion (i). Pour tout > 0 on peut ecrire
Z
Z

(fn , f )
d + [Bn, ] d + [Bn, ].
1 + Bn,
c
Le premier terme est arbitrairement petit quand 0, et le deuxi`eme tend vers 0
quand n , etant fixe. On en deduit que (fn , f ) 0.

Montrons maintenant la completude de lespace (L, ). Soit (fn )nN une suite
de Cauchy pour ; Pour tout k N, on pose
Ak := {x; (k + 1)2 (x) < k 2 }.

La famille (1Ak fn )nN est alors une suite de Cauchy. On pose (f, g) := |f g|/(1 +
|f g|). Quitte `a extraire une sous-suite, on peut supposer que
Z X

(fn (x), fn1 (x)) d(x) < +.


Ak =1

P
Pour presque tout x Ak on a donc convergence de la serie
(fn (x), fn1 (x)), et
la suite (fn (x)) converge donc vers un nombre note f (x) (on utilise ici la completude
de (R, )). Par convergence dominee, on montre alors que
Z
Z
(fm (x), fn (x)) d(x)
(fm (x), f (x)) d(x).
n

Ak

Ak

Comme la suite (fn ) est de Cauchy, le membre de gauche est arbitrairement petit
quand m est grand et n m. On conclut finalement que
Z
(fm (x), f (x)) d(x) 0,
Ak

ce qui est bien s


ur equivalent `a
Z
(fm (x), f (x)) d(x) 0.
m

Ak

On a donc, pour tout k0 ,


XZ
kk0

(fm (x), f (x)) d(x) 0;


m

et dautre part, puisque L1 (d),


XZ
XZ
0.
(fm (x), f (x)) d(x)
k>k0

k>k0

On conclut que

k0

(fm (x), f (x)) d(x) 0.


m

Enfin, dans le cas Y = R, montrons que L1 L est dense dans L. Soit f une
fonction mesurable `a valeurs reelles, on pose
Ak := {x X; |f (x)| k et (x) k 1 }.

Puisque f est `a valeurs reelles et strictement positive, les Ak forment une famille
croissante dont lunion est egale `a X tout entier, donc [X \ Ak ] 0. Soit > 0


ESPACES DE LEBESGUE ET MESURES SIGNEES

227

arbitrairement petit, on choisit k tel que [X \ Ak ] < . Alors, pour toute fonction
g L1 (d),
Z
(f, g) d [Ak ] .
X\Ak

En particulier, (f, f 1Ak ) . La fonction f 1Ak est bornee par construction, et elle
est egalement integrable puisque Ak est de mesure finie (`a cause de lintegrabilite de
). Ceci conclut largument.

VI-3.2. Lien avec les autres notions de convergence. La convergence dans
L est une notion plus faible que la convergence au sens Lp , mais elle lui est intimement liee, comme le montre le theor`eme suivant, dans lequel nous nous limiterons
aux fonctions `a valeurs reelles.
or`
The
eme VI-41 (convergence dans L et dans Lp ). Soit (fn )nN une suite de
fonctions mesurables `a valeurs relles sur un espace mesure (X, ) ; soit egalement f
une fonction mesurable `a valeurs reelles. Alors
(i) si fn f dans Lp (X, ) (0 p ), alors fn f dans L(X, ).
(ii) si fn f dans L(X, ) et il existe g Lp () (0 < p < ) tel que |fn | g
pour tout n, alors fn f dans Lp (X, ).
D
emonstration. Lassertion (i) est facile : pour toute sous-suite extraite n ,
on a fn f dans Lp , et on peut donc trouver une sous-sous-suite pour laquelle il
y ait convergence presque partout.
Pour prouver lassertion (ii), il suffit de montrer que pour toute sous-suite arbitraire n , on a convergence dune sous-sous-suite fn vers f dans Lp . On peut
supposer que fn converge presque partout vers f . La conclusion decoule alors du
theor`eme de convergence dominee, applique `a la suite |fn f |p , que lon peut majorer par la fonction integrable max(2, 2p)|g|p .

La condition de domination peut etre remplacee par une condition plus faible
qui suppose seulement certaines bornes en moyenne. On va utiliser ici la notion
dequi-integrabilite, etudiee dans la section III-5.
or`
The
eme VI-42. Soient (X, ) un espace mesure -fini, p ]0, +[, et (fn )nN
une suite de fonctions dans Lp (X, ), convergeant dans L(X, ) vers une fonction
mesurable f . On suppose que (|fn |p ) est equi-integrable et equi-integrable `a linfini.
Alors fn converge vers f dans Lp (X, ).
Remarque VI-43. Dans le chapitre suivant, nous retrouverons le cas particulier
p = 1 de ce theor`eme comme une consequence du theor`eme de Schur.
ore
`me VI-42. Soit > 0 ; on sait par hypoth`ese
D
emonstration du The
quil existe M1 > 0 et un ensemble A1 de mesure finie, tels que pour tout n,
Z
Z
p
|fn |p d .
|fn | d +
|fn |>M1

X\A1

Notons que cela impose bien s


ur
Z
|fn |p d M1 [A1 ] + ;

228

CHAPITRE VI

(13 juin 2010)

et par le lemme de Fatou on en deduit


Z
Z
p
|f | d lim inf |fn |p < +.
n

Lespace X etant -fini, on peut donc trouver M2 > 0 et un ensemble A2 de mesure


finie, tels que
Z
Z
p
|f |p d .
|f | d +
X\A2

|f |>M2

On pose A := A1 A2 , M := max(M1 , M2 ).
On a alors
Z
Z
Z
p
p
p
|fn | d +
|fn f | d max(2, 2 )

X\A2

X\A1

X\A

|f | d

max(2, 2p).

La meme majoration est valable sur lensemble des x pour lesquels |fn (x)| M ou
|f (x)| M ; donc en particulier pour lensembles des x tels que |fn (x)f (x)| 2M.
On conclut que
Z
Z
p
|fn f | d
|fn f |p d + 2 max(2, 2p ).
X

A{|fn f |2M }

On distingue alors deux cas.


Si p 1, on ecrit
Z
Z
p
p1
|fn f | d (2M) (1 + 2M)
A{|fn f |2M }

A{|fn f |2M }

|fn f |
d,
1 + |fn f |

et on conclut que
Z
|fn f |p d (2M)p1 (1 + 2M)(fn , f ) + 2 max(2, 2p );
X

comme par hypoth`ese (fn , f ) 0, on a bien la convergence de fn vers f dans


Lp .
Si en revanche 0 < p < 1, on ecrit
p
Z
Z
p
|fn f | d
|fn f | d [A {|fn f | 2M}]1p
A{|fn f |2M }

A{|fn f |2M }

(1 + 2M)

1/p

Z

A{|fn f |2M }

|fn f |
d
1 + |fn f |

p

[A]1p .

On conclut que
Z
|fn f |p d (2M)p1 (1 + 2M)1/p [A]1p (fn , f ) + 2 max(2, 2p );
X

ce qui entrane encore la convergence de fn vers f dans Lp .

VI-4. Espaces de mesures


Dans cette derni`ere section, nous allons etudier les mesures sign
ees, qui constituent une generalisation des fonctions mesurables, et les mesures sign
ees finies,
qui constituent une generalisation des fonctions sommables.


ESPACES DE LEBESGUE ET MESURES SIGNEES

229

VI-4.1. Mesures sign


ees. Si (X, A, ) est un espace mesure, et f une fonction
positive mesurable sur X, on peut definir sur X une nouvelle mesure, notee f , par
la formule
Z
(f )[A] =
f d.
A

Le theor`eme de convergence monotone montre que f est bien -additive. La mesure


f determine f uniquement, `a un ensemble -negligeable pr`es (en effet, si f > g
sur un ensemble non negligeable A, on a (f )[A] > (g)[A]). On voit donc que,
d`es que lon a fixe une mesure de reference , lensemble des fonctions mesurables
positives (modulo legalite -presque partout) sidentifie `a une partie de lensemble
des mesures ; en ce sens, les mesures constituent une generalisation des fonctions
mesurables positives.
Une fonction mesurable quelconque peut toujours secrire comme difference de
deux fonctions positives : f = f+ f ; en outre, f+ et f sont etrang`eres, au sens
o`
u elles ne sont jamais simultanement non nulles. Il est facile detendre cette notion
`a des mesures :
D
efinition VI-44 (mesures etrang`eres). Soit X un espace mesurable ; on dit que
deux mesures et sur X sont etrang`eres si elles sont concentrees sur des ensembles
mesurables disjoints ; en dautres termes, sil existe deux ensembles mesurables A et
B tels que A B = , [X \ A] = 0, [X \ B] = 0.
Nous pouvons maintenant definir la notion de mesure signee, comme une generalisation du concept de fonction mesurable :
D
efinition VI-45 (mesure signee). Soit X un espace mesurable. On appelle
mesure signee sur X un couple = (+ , ) de mesures etrang`eres sur X, appelees
respectivement partie positive et partie negative de . On notera formellement =
+ . On note alors || = + + .
On dira que est finie (ou bornee) si + et sont finies. On dira que est
-finie si + et le sont. On dira que est de Borel si + et le sont. On dira
que est reguli`ere si + et le sont.
Remarque VI-46. Si A est mesurable et (+ [A], [A]) 6= (+, +), on peut
definir sans ambigute la quantite
[A] := + [A] [A] R;

mais si + [A] = [A] = +, la valeur de [A] nest pas definie a priori. Cest
pourquoi lecriture + doit etre consideree comme formelle.
Exemples VI-47. Sur R, 0 est une mesure qui nest pas une fonction ; 0 1 est
une mesure signee ; 0 0 ne constitue pas une mesure signee P
au sens de laPdefinition
precedente (les deux mesures ne sont pas etrang`eres) ; := k0 2k k0 2k+1
est une mesure signee, mais on ne peut attribuer aucune valeur `a [R].
VI-4.2. D
ecomposition de Hahn. Soit = (+ , ) une mesure signee sur
un ensemble mesurable (X, A). Comme nous lavons remarque, il est en general
impossible de definir comme une fonction A [, +], sauf si + ou est
` partir de maintenant nous allons concentrer notre attention sur les mesures
finie. A
signees finies. Le remarquable theor`eme de decomposition de Hahn montre que de
telles mesures sont caracterisees par la propriete de -additivite.

230

CHAPITRE VI

(13 juin 2010)

D
efinition VI-48 (-additivite `a valeurs reelles). Soit A une -alg`ebre, et :
A R une fonction. On dit que est -additive si, pour toute suite (Ak )kN
delements deux `a deux disjoints de A, on a
X
(43)
[Ak ] =
[Ak ],
kN

o`
u le membre de droite est defini comme la limite des sommes partielles

1k

[Ak ].

Remarque VI-49. Le membre de gauche de (43) est invariant par permutation


P
des Ak , donc le membre de droite aussi, ce qui veut dire que la serie
[Ak ] est
commutativement convergente. Par un reP
sultat classique danalyse reelle, cette serie
est forcement absolument convergente :
|[Ak ]| < +.

Th
eor`
eme VI-50 (theor`eme de decomposition de Hahn). Soit (X, A) un espace
mesurable ; alors on peut identifier
- dune part, les fonctions : A R, -additives ;
- dautre part, les mesures signees finies (+ , ) sur A ;
via la formule [A] = + [A] [A].
En outre, on a alors, pour tout A A,
(44)
(
)
X
||[A] = + [A] + [A] = sup
|[Aj ]|; Aj A, (Aj )jN partition de A .
jN

Remarque VI-51. Tout le travail dans ce theor`eme consiste `a decomposer en


sa partie positive et sa partie negative, do`
u lappellation theor`eme de decomposition.
Il faut bien noter que le resultat contient lunicite de cette decomposition.

Remarque VI-52. La conclusion du Theor`eme VI-50 est bien s


ur en defaut pour
des fonctions -additives A R ou meme A [0, +] (une mesure -additive nest
pas pour autant finie !).
D
emonstration. 1. Il est clair quune mesure signee finie definit une fonction
-additive densembles ; cest bien s
ur la reciproque qui presente un interet.
2. Montrons maintenant lunicite de la decomposition eventuelle. Soient + , , + ,
des mesures finies verifiant, au sens des fonctions -additives,
+ = + ,

et telles que (+ , ) dune part, (+ , ) dautre part, forment des couples etrangers.
Introduisons S(+ ) et S( ) des ensembles mesurables disjoints tels que + [X \
S(+ )] = 0, [X \S( )] = 0, S(+ )S( ) = ; et de meme, des ensembles S(+ )
et S( ) avec des proprietes similaires vis-`a-vis de . Lensemble A := S(+ )S( )
verifie
[A] = + [S( )] = [S(+ )];
la quantite [A] est donc `a la fois positive et negative, et donc nulle. On en deduit
que + [S( )] = 0 = [S(+ )] ; et de meme, [S(+ )] = + [S( )] = 0. Pour
tout A S(+ ) on a donc [A] = + [A], mais aussi [A] = + [A] [A] = + [A] ;
on conclut que + et + concident sur S(+ ), et donc en fait + = + . De meme,
= .
3.
PDefinissons provisoirement || par la formule de droite dans (44) : ||[A] =
sup |[Ai ]|, o`
u le supremum est pris sur toutes les partitions, finies ou denombrable,


ESPACES DE LEBESGUE ET MESURES SIGNEES

231

de A en parties mesurables Ai . Verifions que || ainsi definie est une mesure. Si


(Ak )kN est une famille de parties mesurables disjointes, et si on se donne des partitions (Akj )jN de chaque Ak , on definit automatiquement une partition (Akj )k,jN de
A = Ak . Donc
X
||[A]
||[Ak ].
kN

Soit maintenant (Aj )jN une partition de A, et Akj = Ak Aj , de sorte que (Akj )jN
constitue une partition de Ak . Par -additivite de ,
XX
X
X X
XX
X
k
|[Aj ]| =
[Aj ]
|[Akj ]| =
|[Akj ]|
||[Ak ];

jN

jN kN

jN kN

en passant au supremum on obtient

||[A]

X
kN

kN jN

kN

||[Ak ],

et on a bien la -additivite de ||.


4. Letape suivante consiste `a montrer que || est une mesure finie. Si A est
un ensemble mesurable tel que ||[A] = +, alors on peut trouver une partition
(Aj )jN de A telle que
X
|[Aj ]| 2|[A]| + 3;
jN

et donc on peut trouver J fini tel que


X
|[Aj ]| 2(|[A]| + 1).
1jJ

En distinguant selon le signe des [Aj ], on peut trouver une famille finie J dindices
j tels que

X


[Aj ] |[A]| + 1.

jJ

Soit E = {Aj ; j J } ; on a donc E A et |[E]| |[A]| + 1 Il sensuit


|[A \ E]| = |[A] [E]| |[E]| |[A]| 1.

Par ailleurs, || etant -additive, lune au moins des deux quantites ||[E] et ||[A\E]
vaut +. Conclusion : on peut separer A en deux parties, disons A et B, telles que
||[A1] = + et |[B]| 1.
Supposant par labsurde que ||[X] = +, on peut appliquer ce resultat avec
A = X, et separer X en deux parties disjointes A1 et B1 telles que ||[A1 ] = + et
|[B1 ]| 1 ; puis reappliquer le resultat avec A = A1 , et ainsi de suite. On construit
ainsi une famille de parties disjointes
(Bk )kN telle que |[Bk ]| 1. Ceci contredit la
P
-additivite puisque la serie
[Bk ] ne converge pas. On conclut que ||[X] < +.
La definition de || entrane alors
[B] ||[B] ||[X] < + :

la fonction est bornee.


5. Une fois cette propriete acquise, il est facile de verifier que verifie des proprietes de passage `a la limite similaires `a celles des mesures : pour toute famille

232

CHAPITRE VI

(13 juin 2010)

(Ak ) croissante, en appliquant la relation de -additivite `a la famille (Ak \ Ak1), on


obtient
[
[ Ak ] = lim [Ak ].
k

Enfin, en passant au complementaire et en utilisant |[X]| < +, on voit que pour


toute famille (Ak ) decroissante,
\
[ Ak ] = lim [Ak ].
k

6. Soit maintenant
M := sup [A] 0.
AA

Dapr`es letape 4, M < +. Le but est de montrer que ce supremum est atteint par
un ensemble mesurable A, et de montrer que + est concentree sur A. Si M = 0,
il suffit de poser S+ = ; nous supposerons donc M > 0. Soit (Ak )kN une suite de
parties mesurables verifiant


1
[Ak ] 1 k M.
2
Posons
\[
A := lim sup Ak =
Ak .
N k

La famille C := k Ak etant decroissante, on sait que [A] = lim [C ].


Dautre part, en appliquant de mani`ere repetee linegalite
[Ak B] = [Ak ] + [B] [Ak B] [Ak ] + [B] M [B] 2k M,

on voit que, pour tout m ,

[A . . . Am ] [A ]

m
X
k=

2k M [A ] 2(1) M.

En passant `a la limite quand m , on obtient

[C ] [A ] 2(1) M (1 3 2 )M.

Il ne reste plus qu`a faire tendre vers linfini pour obtenir


[A] M;

do`
u [A] = M.
7. Posons S+ = A, S = X \ A, de sorte que (S+ , S ) realise une partition de
X ; on va montrer que pour tout C S+ on a [C] 0. Dans le cas contraire, on
aurait
[S+ \ C] = [S+ ] [C] > [S+ ] = M,
ce qui contredirait la definition de M. De meme, sil existait C S tel que [C] > 0,
alors on aurait
[S+ C] = [S+ ] + [C] > [S+ ] = M,
ce qui est tout aussi impossible. On conclut que la restriction de aux parties
mesurables de S+ est positive, tandis que la restriction de aux parties mesurables
de S est negative. Il sensuit que (S+ , ) et (S , ) sont deux espaces mesures ;
on peut alors ecrire comme difference de deux mesures :
[A] = [A S+ ] ([A S ]).


ESPACES DE LEBESGUE ET MESURES SIGNEES

233

Les mesures + := [ S+ ] et := [ S ] sont finies et etrang`eres, ce qui


ach`eve la preuve de la decomposition.
8. Il reste seulement `a montrer lequivalence des formules de variation totale ;
pour le moment la notation || designe la formule de droite de (44), le probl`eme est
de montrer que cela concide avec + + . Pour cela on note dabord que pour tout
A A, |[A]| = |[A S+ ] + [A S ]| |[A S+ ]| + |[A S ]| = + [A] + [A] ;
en reportant cette inegalite dans la definition de || on obtient || + + . Pour
prouver linegalite inverse, on note que (A S+ , A S ) realise une partition de A,
de sorte que
+ [A] + [A] = |[A S+ ]| + |[A S ]| ||[A].

Remarque VI-53. La fin de la preuve montre a posteriori que dans le membre


de droite de la formule (44), on peut se limiter aux partitions `a deux elements.
Il sera utile dans la suite de traiter des mesures reguli`eres. Pour faire cela, nous
utiliserons la Proposition suivante :
Proposition VI-54 (Reformulation de la regularite des mesures signees). Soit
(X, A) un espace mesurable et une mesure signee finie sur X ; soit (+ , ) la
decomposition de Hahn de . Alors les trois propositions suivantes sont equivalentes :
(i) + et sont reguli`eres ;
(ii) || est reguli`ere ;
(iii) pour tout A A et pour tout > 0 il existe un compact K et un ouvert O
tels que K A O et
(45)

|[A] [K]| ,

|[O] [A]| .

D
emonstration. Limplication (i) (ii) est (presque) triviale, il suffit donc
de montrer (ii) (iii) (i). On notera S+ et S des parties disjointes sur lesquelles
+ et sont concentrees.
Supposons que (ii) est verifiee, soit A un ensemble mesurable quelconque. Par
regularite de ||, on peut trouver une suite croissante de compacts (Kn )nN inclus
dans A, telle que ||[A \ Kn ] 0 ; et une suite decroissante douverts (On )nN
contenant A, telle que ||[On \ A] 0. Alors


[On ] [A] = |[On \ A]| ||[On \ A] 0,

donc [On ] [A], et de meme [Kn ] [A]. La propriete (iii) est donc verifiee.
Supposons maintenant (iii), et prouvons que (par exemple) + est reguli`ere. Soit
A un ensemble mesurable quelconque, et A = A S+ . Par (45) on peut trouver une
suite de compacts (Kn )nN , inclus dans A et donc dans A, tels que
+ [Kn ] = [Kn ] [A ] = + [A ] = + [A];

la mesure + est donc interieurement reguli`ere.


Pour montrer la regularite exterieure, on applique la regularite interieure `a B =
S+ \ A : on trouve ainsi une famille (Ln )nN de compacts inclus dans B, tels que
[Ln ] = + [Ln ] + [B] = [B]. Louvert On = X \ Ln contient alors A, et on a
+ [On ] = + [X] \ + [Ln ] + [X] \ + [B] = + [X \ B] = + [A S ] = + [A].

234

CHAPITRE VI

(13 juin 2010)

Le corollaire suivant est une consequence immediate du Theor`eme VI-50 et de


la Proposition VI-54 :
Corollaire VI-55 (Theor`eme de Hahn pour les mesures reguli`eres). Soit (X, A)
un espace mesurable ; alors on peut identifier
- dune part, les fonctions : A R, -additives, telles que pour tout A A il
existe des suites de compacts (Kn )nN et douverts (On )nN verifiant Kn A On
et
lim [Kn ] = lim [On ] = [A];
n

- dautre part, les mesures signees finies reguli`eres (+ , ) sur A ;


via la formule [A] = + [A] [A].
En outre, est reguli`ere si et seulement si || est reguli`ere.
VI-4.3. Espace des mesures sign
ees finies. Comme nous lavons vu, le
theor`eme de Hahn identifie les mesures signees finies avec les fonctions -additives
densembles `a valeurs reelles. Il est clair que ce dernier espace est un espace vectoriel, ce qui netait pas evident a priori pour les mesures signees finies. On peut
donc munir les mesures signees finies dune structure naturelle despace vectoriel :
il devient possible dajouter ou de soustraire des mesures signees, ou de les multiplier par des nombres reels. Lecriture = + , qui jusquici etait purement
formelle, peut maintenant sinterpreter, dans le cas o`
u + et sont finies, comme
une soustraction au sens usuel dans un espace vectoriel.
Le Corollaire VI-55 montre de meme que les mesures signees finies reguli`eres
constituent un sous-espace vectoriel de lespace des mesures signees finies.
Ces resultats ouvrent la voie `a un traitement fonctionnel des mesures signees.
La proposition suivante se demontre sans difficulte :
Proposition VI-56 (inegalites elementaires pour les mesures signees). Soient
(X, A) un espace mesurable, et deux mesures signees finies sur X, identifiees `a
des fonctions -additives densembles, `a valeurs reelles ; alors
=

+ + , ;

0, () = ;
()+ = ;
( + ) + ;

< 0, () = || ;
| | = ||;
| + | || + ||.

Pour mesurer la taille dune mesure signee, un concept naturel est fourni par la
variation totale :
D
efinition VI-57 (variation totale). Soient X un espace mesurable, et une
mesure signee sur X ; soient + et les parties positive et negative de . On appelle
variation totale de , et on note kkV T (X) ou simplement kkV T , la quantite positive
||[X] = + [X] + [X].

Si A est une partie mesurable de X, on notera kkV T (A) = ||[A].


Proposition VI-58 (proprietes de la variation totale). Soient X un espace mesurable et une mesure signee sur X. Alors
(i) A 7 kkV T (A) est une fonction -additive densembles (qui concide avec
||) ;


ESPACES DE LEBESGUE ET MESURES SIGNEES

235

(ii) Pour toute partie mesurable A de X,


|[A]| kkV T .
Plus generalement, pour toutes parties disjointes (Ak )kN ,
X
|[Ak ]| kkV T .
(iii) kkV T = sup

|h|1

kN

h d, o`
u le supremum est pris sur toutes les fonctions

mesurables sur X (majorees en valeur absolue par 1) ; on peut egalement restreindre


le supremum aux fonctions mesurables valant 1.
o
n
u linfimum est pris sur
(iv) kkV T = inf + [X] + [X]; = + , o`
tous les couples de mesures ( + , ), non necessairement etrang`eres, telles que =
+ ; en outre il y a egalite si et seulement si = .
D
emonstration. Lenonce (i) est evident. Pour obtenir (ii), il suffit decrire
|[A]| = |+ [A] [A]| + [A] + [A] + [X] + [X].
Pour demontrer (iii), introduisons des ensembles disjoints S+ et S tels que soit
supportee par S . Il est alors clair que, d`es que |h| 1, on a
Z
Z
h d+ + [S+ ] = + [X];
h d =
S+

S+

et de meme

h d [X].

R
On conclut que h d kkV T . Legalite est obtenue pour h = 1S+ 1S , ce qui
ach`eve la preuve de (iii). Enfin, pour demontrer (iv) il suffit de demontrer que
= + = + [S ] + [S ] [S ].

Demontrons par exemple + [S+ ] + [S+ ] + [S+ ]. Puisque + [S+ ] = [S+ ] =


+ [S+ ] [S+ ], cette inegalite se reduit `a [S+ ] [S+ ], ce qui est evident.
Le traitement des cas degalite ne seffectue sans difficute.

Nous allons maintenant decrire de mani`ere un peu plus precise lespace des mesures signees finies :
or`
The
eme VI-59 (espace des mesures signees). Soit X un espace mesurable.
Lensemble des mesures signees finies sur X, muni de la variation totale, constitue
un espace de Banach, que lon note M(X). Pour toute mesure finie sur X, lespace
L1 () sidentifie isometriquement `a un sous-espace de M(X) via linjection f 7
f : en particulier,
kf kL1 () = kf kV T .
Lespace des mesures signees finies reguli`eres sur X, muni de la variation totale,
est un sous-espace de Banach de M(X), que lon notera Mreg (X).

Remarque VI-60. Si X est polonais, Mreg (X) = M(X) en vertu du Theor`eme I54.

236

CHAPITRE VI

(13 juin 2010)

D
emonstration. 1. Il est facile de verifier que la variation totale definit bien
une norme, en utilisant la Proposition VI-56.
2. Montrons maintenant que M(X) est complet : soit (k )kN une famille de
mesures signees finies telles que
kk kV T 0.
k,

Pour toute partie A mesurable, on a, dapr`es la Proposition VI-58(i),


|k [A] [A]| kk kV T 0.
k,

Il sensuit que la suite (k [A])kN est de Cauchy, et elle converge donc (par completude
de R !) vers un nombre reel que nous noterons [A].
Montrons que lapplication ainsi definie est une mesure signee. Par le theor`eme
de Hahn, il suffit de verifier que cest une fonction -additive ; pour cela on se donne
une famille denombrbable densembles Aj disjoints, et on ecrit la relation de additivite pour k :
[
X
k [Aj ].
k [ Aj ] =
j

On peut passer `a la limite quand dans le premier terme ; pour passer `a la


limite dans le deuxi`eme, et donc prouver la -additivite de , il suffit detablir
X
| [Aj ] [Aj ]| 0.

Mais, les Aj etant disjoints, on a, pour tout k , grace `a la Proposition VI-58(ii),


X
| [Aj ] k [Aj ]| k k kV T ,
j

et le membre de droite converge vers 0 quand , uniformement en k. En faisant


tendre dabord k vers linfini, puis , on obtient le resultat souhaite.
` ce stade nous savons quil existe une mesure signee telle que pour tout A
A
mesurable, k [A] converge vers [A] quand k . Pour prouver la completude, il
reste `a montrer que kk kV T tend vers 0. Soit h une fonction mesurable valant
1 sur X, et (k) := supk kk kV T . On a, dapr`es la Proposition VI-58(ii),
Z
Z
h dk h d (k).
La fonction h est de la forme 1A 1B ; on peut donc passer `a la limite dans
quand , et on trouve
Z
Z
h dk h d (k).

h d

En prenant le supremum sur h et en appliquant la Proposition VI-58(ii) encore, on


conclut que kk kV T (k), ce qui conclut largument.
3. Verifions maintenant lidentite

kf kL1 (d) = kf kV T


ESPACES DE LEBESGUE ET MESURES SIGNEES

237

pour toute mesure finie . Pour cela il suffit de noter que f+ et f constituent
la decomposition de Hahn de la mesure signee f ; en utilisant la definition de la
variation totale on trouve donc
Z
Z
Z
Z
kf kV T = f+ [X] + f [X] = f+ d + f d = (f+ + f ) d = |f | d.
4. Comme on la dej`a remarque, le Corollaire VI-55 montre que Mreg (X) soit
un sous-espace vectoriel de M(X). Supposons maintenant que k est une suite de
mesures reguli`eres finies, convergeant vers en variation totale, et montrons que
est reguli`ere. Soit > 0, et soit k tel que kk k /2. Comme k est reguli`ere,
on peut trouver un ouvert O contenant A, et un compact K inclus dans A, tels que
|k [O \ A]| /2, |k [A \ K]| /2. On ecrit alors
|[O \ A]| kk kV T + |k [O \ A]| ,
et de meme
|[A \ K]| kk kV T |k [A \ K]| .
La propriete (iii) de la Proposition VI-54 est donc satisfaite, ce qui prouve la
regularite de .

VI-4.4. Th
eor`
eme de Riesz pour les mesures sign
ees. Comme nous lavons
vu au chapitre II, les mesures peuvent etre introduites soit `a partir du concept de
-additivite, soit comme formes lineaires sur des espaces de fonctions continues, le
theor`eme de Riesz garantissant lequivalence de ces deux points de vue dans le cas
localement compact. Il en va de meme des mesures signees : nous les avons introduites comme difference de deux mesures, mais on aurait aussi pu les introduire `a
partir du point de vue des formes lineaires. Cest le contenu de lenonce suivant.
or`
The
eme VI-61 (theor`eme de Riesz pour des mesures signees). Soit X un
espace topologique separe, localement compact. Alors on peut identifier (mettre en
correspondance bijective et isometrique)
- dune part, les formes lineaires continues sur lespace Cc (X) des fonctions
continues sur X `a support compact, muni de la norme de la convergence uniforme ;
- ou, de mani`ere equivalente, les formes lineaires continues sur lespace C0 (X)
des fonctions continues sur X tendant vers 0 `a linfini, muni de la norme de la
convergence uniforme ;
- dautre part, les mesures de Borel signees, reguli`eres et finies sur X ; cesta`-dire de la forme + , o`
u + et sont des mesures de Borel reguli`eres finies
etrang`eres sur X ;
via la formule
f =

f d :=

f d+

En bref,
C0 (X) = Mreg (X),

f d .

238

CHAPITRE VI

(13 juin 2010)

o`
u C0 (X) est muni de la norme uniforme et Mreg (X) de la norme de la variation
totale. En particulier
Z

kkV T = sup
f d; |f | 1, f Cc (X)
X
Z

= sup
f d; |f | 1, f C0 (X) .
X

Remarque VI-62. Si X est un espace topologique separe compact, alors on


peut bien s
ur remplacer lespace Cc (X) dans lenonce ci-dessus par C(X). En revanche, si X nest pas compact, le theor`eme naffirme rien sur le dual de Cb (X).
Sous certaines hypoth`eses axiomatiques, on peut identifier Cb (X) `a lespace des
fonctions densemble finiment additives, et montrer que cet espace est strictement
plus grand que M(X).

Exemple VI-63. Fixons un espace localement compact non compact, verifiant


aux hypoth`eses du Theor`eme ?? (de sorte que toute mesure borelienne finie sur
les compacts est automatiquement reguli`ere) ; par exemple X = Rn . Notons C (X)
lespace de Banach des fonctions continues admettant une limite `a linfini. La fonctionnelle lim (limite en linfini) est lineaire continue, et (si lon admet laxiome
du choix) se prolonge par HahnBanach en une application L, lineaire continue sur
Cb (X), et non nulle. Lapplication L ne peut etre representee par aucune mesure
de Borel : comme L(f ) = 0 pour tout f Cc (X), cette mesure ne pourrait etre
que la mesure nulle. En fait, L est representee par une fonction (finiment) additive
densembles ; noter que cette fonction viole de mani`ere evidente les hypoth`eses de la
Proposition I-52, en fait L est concentree `a linfini.
D
emonstration. 1. Soit dabord = + une mesure signee finie sur X ;
alors, pour toute fonction f Cc (X),
Z
Z
Z


f d |f | d+ + |f | d Ckf k ,


R
o`
u C = + [X] + [X]. La fonctionnelle f 7 f d est donc bien une forme
lineaire continue sur Cc (X).
2. Reciproquement, soit une forme lineaire continue sur Cc (X) ; pour tout
f Cc (X), f 0 on pose
n
o
(f ) := sup h, hi; h Cc (X); 0 h f .

La fonctionnelle , definie sur lensemble des fonctions continues positives `a support


compact, est positive et croissante (f g = (f ) (g)) ; montrons quelle est
sur-additive. Soient f1 et f2 deux fonctions continues positives `a support compact,
soit > 0 et soient h1 , h2 deux fonctions continues `a support compact telles que
pour i = 1, 2,
0 hi fi ,
hi (fi ) .
Alors h := h1 + h2 est une fonction continue `a support compact telle que 0 h
f1 + f2 , et on a
h = h1 + h2 (f1 ) + (f2 ) 2.
En passant au supremum sur tous les h admissibles, on obtient
(f1 + f2 ) (f1 ) + (f2 ) 2.


ESPACES DE LEBESGUE ET MESURES SIGNEES

239

En faisant finalement tendre vers 0, on conclut `a la sur-additivite de . On peut


alors appliquer la Remarque II-55 (v) suivant lenonce du Theor`eme de Riesz II54 pour conclure que se represente par une mesure (positive) de Borel presque
reguli`ere, que nous noterons + .
3. Montrons maintenant que + est finie. Si 0 h f , alors bien s
ur khk
kf k , et par continuite de il existe C > 0, independant de f et h, tel que h
Ckf k . En passant au supremum, on obtient (f ) Ckf k , soit
Z
f d+ Ckf k .
Pour tout compact K X, on peut trouver une fonction f , continue `a support
compact, qui soit comprise entre 0 et 1, identiquement egale `a 1 sur K ; en appliquant
linegalite precedente `a une telle fonction, on obtient
+ [K] C.
Par ailleurs, X etant ouvert et + etant presque reguli`ere, on a
n
o
+ [X] = sup + [K]; K compact ;

ce qui prouve + [X] C. On conclut que + est finie. Par la Remarque II-55 (iii)
suivant lenonce du Theor`eme II-54 (de Riesz), + est reguli`ere.

4. Il est maintenant facile de conclure la preuve : la mesure + construite


precedemment definit une forme lineaire continue sur Cc (X), et il est clair que
+ .
La forme lineaire + est donc une forme lineaire positive sur Cc (X), et une
nouvelle application du Theor`eme de Riesz nous permet de la representer par une
mesure de Borel presque reguli`ere, que nous noterons . On montre, de meme que
precedemment, que est finie et reguli`ere. La forme lineaire peut donc secrire
sous la forme + , o`
u + et sont des mesures de Borel finies reguli`eres.
5. Il est evident que

kkV T sup
sup

Z

f d;

Z

f d;

|f | 1, f C0 (X)

|f | 1, f Cc (X) .

Pour conclure la demonstration, il suffit donc detablir



Z
f d; |f | 1, f Cc (X) .
kkV T sup
X

Pour cela, on decompose en parties positive et negative, et on utilise la regularite de


+ et pour trouver des ensembles compacts K+ et K avec [K ] [X] .
Les ensembles compacts K+ et K etant disjoints, on peut trouver des ouverts O+
et O tels que K O et O+ O = (Cf. paragraphe I-2.3). Par le lemme
dUrysohn, on peut trouver + continue `a valeurs dans [0, 1], identiquement egale `a
1 sur K+ et `a support compact dans O+ ; et de meme continue `a valeurs dans

240

CHAPITRE VI

(13 juin 2010)

[0, 1], identiquement egale `a 1 sur K et `a support compact dans O . On pose alors
f = + , de sorte que
Z
f d + [K+ ] + [K ] kkV T (X \ (K+ K ))
(+ [X] ) + ( [X] ) 2 = kkV T 4.

On conclut en faisant tendre vers 0.

VI-4.5. Repr
esentation duale de la variation totale. Comme corollaire du
Theor`eme VI-61 (Theor`eme de Riesz pour les mesures signees), nous avons obtenu
une representation duale de la variation totale :
Z

(46)
kkV T = sup
f d; |f | 1, f C0 (X)
X
Z

(47)
= sup
f d; |f | 1, f Cc (X) .
X

Mais cette formule na ete etablie que dans le cas o`


u X est localement compact, et en
fait elle peut facilement etre en defaut dans des espaces non localement compacts.
Pourtant, sous des hypoth`eses tr`es generales elle demeure vraie, pourvu que lon
remplace C0 (X) par C(X) (ou de mani`ere equivalente par Cb (X), puisquon impose
|f | 1 de toute facon).
Proposition VI-64. Soit X un espace metrique et une mesure (de Borel)
signee sur X, reguli`ere. Alors
Z

kkV T = sup
f d; |f | 1, f Cb (X) .
X

En particulier, cette formule est automatiquement verifiee si est finie et X est un


espace polonais.
Remarque VI-65. En depit de cette proposition, le dual de Cb (X) est a priori
plus gros que Mreg (X).
D
emonstration. La premi`ere partie de lenonce implique la deuxi`eme puisque
toute mesure finie
R sur un espace polonais est reguli`ere (Theor`eme I-54). Dautre part
il est clair que d kkV T pour
R tout continu `a valeurs dans [1, 1] ; il suffit
donc de prouver que kkV T sup{ d}, o`
u le supremum est pris sur les fonctions
continues `a valeurs dans [1, 1].
Soient S+ et S des ensembles disjoints tels que kkV T = + [S+ ] + [S ].
Comme est reguli`ere, pour tout > 0 on peut trouver des compacts K+ S+ et
K S (bien s
ur disjoints) tels que
kkV T + [K+ ] + [K ] + ;
en particulier, la variation totale de sur le complementaire de K+ K est au plus
.
Sur chaque compact K , on peut appliquer le theor`eme de Riesz : par exemple
nZ
o
+ [K+ ] = k+ kV T (K+ ) = sup
d+ ; C(K+ ), kk 1 .


ESPACES DE LEBESGUE ET MESURES SIGNEES

241

On peut donc trouver (continue sur K et `a valeurs dans [1, 1]) tels que
Z
d + .
[K ]
K

(Quitte `a remplacer par sa partie positive, on peut supposer que ces fonctions
sont positives, donc `a valeurs dans [0, 1].) Soit definie sur K+ K , qui vaut +
sur K+ et sur K : on a alors
Z
d + 3.
kkV T
K+ K

Par le Theor`eme dextension de TietzeUrysohn (rappele dans la sous-section I-2.3),


on peut prolonger en une fonction continue sur X, toujours notee , `a valeurs dans
[1, 1]. On a alors
Z
Z
Z
d
d + kkV T (X\(K+ K ))
d + .
K+ K

On conclut que
kkV T

d + 4,

et on ach`eve largument en faisant tendre vers 0.

VI-4.6. Espace des mesures de Radon. Auparavant nous avons concentre


notre attention sur les mesures signees finies. Les mesures de Radon constituent une
classe particuli`ere de mesures non signees, dusage courant en analyse, en relation
avec la theorie des distributions. Avant de les introduire, notons que leur definition
meme varie de mani`ere assez importante dun auteur `a lautre.
D
efinition VI-66 (mesures de Radon). Soient X un espace localement compact,
muni de sa tribu borelienne, et un ouvert de X ; on appelle mesure de Radon sur
une mesure signee, localement finie (i.e. finie sur tout compact de ) et reguli`ere.
On notera Mloc () lespace de ces mesures.
Autrement dit, les mesures de Radon sont localement des mesures finies reguli`eres,
mais leur variation totale peut etre infinie. Ces mesures sont assez naturelles en analyse ; si lon munit Cc () dune topologie adequate, dite topologie inductive, qui en
fait un espace complet, il sav`ere que (Cc ()) = Mloc () (cest bien s
ur un avatar
du theor`eme de Riesz). En dautres termes, les mesures de Radon sidentifient donc
alors au dual de lespace des fonctions continues `a support compact. Cest ce que
traduit lenonce suivant (non demontre dans ce cours) :
Th
eor`
eme VI-67 (mesures de Radon comme formes lineaires). Soit X un espace
topologique separe, localement compact, dans lequel tout ouvert est union denombrable
de compacts. Pour tout compact K X, on note CK (X) lespace des fonctions
continues dans X, dont le support est contenu dans K. Alors lespace des mesures
de Radon sidentifie `a lespace des formes lineaires sur Cc (X) dont la restriction `
a
CK (X) est continue, pour tout compact K X.

242

CHAPITRE VI

(13 juin 2010)

VI-4.7. Convergence dans M(X). On reviendra sur ce sujet dans le chapitre


suivant, mais il pourra etre bon de dresser d`es maintenant la liste des trois notions
de convergence dans M(X) couramment utilisees : on distingue
la convergence en variation totale :
k
VT

si

kk kV T 0.
k

Cette notion est tr`es rigide : par exemple, xk converge vers x en variation totale
seulement si xk est egal `a x pour k assez grand !
la convergence faible-
etoile :
Z
Z

k
si
Cc (X),
dk d.
w

La terminologie de convergence faible-etoile nest licite que dans le cas o`


u X est
un espace localement compact et si lon se restreint `a des mesures reguli`eres, de
sorte que lon peut appliquer le Theor`eme de Riesz. Notons que lon peut remplacer
lespace Cc (X) par C0 (X), et que cette notion est en general sans interet dans un
espace non localement compact (il se peut que Cc (X) = {0}, auquel cas la definition
devient vide...).
la convergence faible, ou convergence etroite :
Z
Z

k
si
Cb (X),
dk d.
w

Cette notion, plus faible de la convergence en variation totale mais plus forte que
la convergence faible-etoile, est tr`es populaire parmi les probabilistes (qui lutilisent
dordinaire dans le contexte des mesures de probabilite).

CHAPITRE VII

` COMPLETER

Analyse de Banach - A
Cest vers le debut des annees 1920 que selabore la theorie des espaces vectoriels normes, grace en particulier aux travaux de F. Riesz et de Banach, dont le
cel`ebre ouvrage, Theorie des Operations lineaires (1932) fonde la theorie moderne
des espaces maintenant appeles espaces de Banach :
D
efinition VII-1. On appelle espace de Banach un espace vectoriel norme complet.
Dans tout ce chapitre je me limiterai aux espaces de Banach reels.
Les espaces de Banach les plus elementaires sont les espaces de fonctions continues : Cb (X) et C0 (X), o`
u X est un espace topologique, Cb (X) est lensemble des
fonctions continues bornees X R, C0 (X) lensemble des fonctions continnues
X R tendant vers 0 `a linfini, et tous deux sont munis de la norme de la convergence uniforme. On peut y ajouter les espaces introduits au Chapitre VI :
- les espaces Lp (X, ) de Lebesgue, o`
u (X, ) est un espace mesure ;
- lespace M(X) des mesures (signees) finies, o`
u X est un espace mesurable (la
norme etant la variation totale).
Les proprietes les plus utiles de ces espaces seront passees en revue dans ce
chapitre ; ce sera egalement loccasion de developper les fondements de la theorie
generale des espaces de Banach.
Parmi les th`emes les plus importants que nous rencontrerons, on peut mentionner
- lutilisation de la propriete de completude ;
- letude de la geometrie induite par la norme ;
- lidentification de lespace dual (theor`emes de representations) ;
- les crit`eres de compacite pour differentes topologies.
Dautre part, un recours systematique sera fait `a la propriete de s
eparabilit
e
pour eviter tout usage de laxiome du choix dans sa version la plus forte. Tous les
resultats de ce chapitre reposent donc uniquement sur laxiomatique classique comprenant laxiome du choix dependant, dont lusage ne prete gu`ere `a controverse.
VII-1. La compl
etude et ses cons
equences
Comme on la dej`a rappele `a plusieurs reprises, un espace metrique complet est
un espace dans lequel toute suite de Cauchy est convergente. Cette propriete de
completude a des consequences remarquables, comme nous allons le voir dans cette
section.
VII-1.1. Briques
el
ementaires. La plupart des demonstrations faisant intervenir la completude sont basees sur les trois enonces simples suivants (on note d la
distance et k k la norme) :

244

CHAPITRE VII

(13 juin 2010)

(i) le th
eor`
eme des ferm
es embot
es : Dans un espace metrique complet E,
soit (Fk )kN une suite decroissante de fermes non vides, dont le diam`etre tend
vers 0 ; alors leur intersection est un singleton.
(ii) le th
eor`
eme de Baire : Soit (Ok )kN une suite douverts denses dans un
espace metrique complet E ; alors leur intersection est dense dans E.
(iii) la convergence des s
eries absolument convergentes : si E estP
un espace
vectoriel norme complet, et (uk )kN une
suite
a
`
valeurs
dans
E,
avec
kuk k <
P
P
+, alors on peut definir la somme
uk = limn ( kn uk ) E.
Rappelons bri`evement la demonstration de ces enonces.
Pour prouver (i), on choisit uk Fk pour tout k N ; comme uk+p Fk+p Fk ,
la distance entre uk et uk+p est majoree par le diam`etre de Fk , qui tend vers 0 quand
k ; la suite (uk ) est donc de Cauchy ; par completude, elle admet une limite u
E, qui appartient forcement `a tous les Fk puisque ceux-ci sont fermes. Si maintenant
v est un autre element de lintersection des Fk , alors d(u, v) diam (Fk ) 0 quand
k ; donc d(u, v) = 0, donc u = v, ce qui montre bien que lintersection des Fk
est un singleton.
Soit maintenant (Ok )kN une famille douverts denses dans un espace metrique
complet. Puisque O1 est ouvert, on peut y inclure une boule fermee B1 = B[r1 , x1 ].
Puisque O2 est dense, il intersecte la boule ouverte B(x1 , r1 ) : on peut trouver
x2 B(x1 , r1 ) O2 . Cette intersection de deux ouverts est un ouvert, on peut donc y
inclure une boule fermee B2 = B[r2 , x2 ], et sans perte de generalite on peut supposer
que r2 r1 /2. En repetant la construction, on construit une suite de boules fermees
embotees Bk , dont le diam`etre tend vers 0, telles que Bk O1 O2 . . . Ok . Par le
theor`eme des fermes embotes, lintersection des Bk est non vide ; et par construction
cette intersection est incluse dans tous les Ok . Ceci montre que lintersection des
Ok est non vide. En appliquant cet enonce avec E remplace par une boule fermee
B[x0 , r0 ] on conclut que lintersection des Ok est en fait dense.
Soit (uk )kN une serie absolument
P convergente `a valeurs dans un espace vectoriel
norme complet E ; on definit sn := kn uk . Pour tous n, p 0,
X
ksn+p sn k = kun+1 + . . . + un+p k kun+1 k + . . . + kun+p k
kuk k 0.
kn+1

La suite (sn )nN est donc de Cauchy, et par completude elle converge vers une limite
s E. Ceci conclut la preuve de (iii).

Remarques VII-2.
(i) Attention : dans le theor`eme de Baire, lintersection
des Ok nest pas en general un ouvert.
(ii) Le theor`eme de Baire est souvent utilise sous la forme contraposee que
voici : Si E complet est reunion de fermes, alors au moins lun dentre eux
est dinterieur non vide.
VII-1.2. Construction despaces de Banach. Commencons par un crit`ere
utile permettant de verifier en pratique quun espace donne est un espace de Banach. Il sagit de la reciproque du theor`eme de convergence des series absolument
convergentes.
Proposition VII-3 (crit`ere de completude dun espace vectoriel norme). Un
espace vectoriel norme (E, k k) est complet si et seulement si toute serie absolument
convergente `a valeurs dans E est convergente.

` COMPLETER

ANALYSE DE BANACH - A

245

D
emonstration de la Proposition VII-3. Nous avons
P dej`a vu que si E est
completP
et si (uk )kN est une suite `a valeurs dans E telle que
kuk k < +, alors la
somme
uk existe dans E. Il suffit donc detablir la reciproque : soit E un espace
vectoriel norme dans lequel toute serie absolument convergente est convergente, nous
allons montrer que E est complet.
Soit (uk )kN une suite de Cauchy, et soit 1 = 1/2 ; on sait quil existe n1 tel que
pour tous m, n n1 , kum un k 1 ; on pose u1 = un1 . Soit ensuite 2 = 1/4, on
fixe n2 n1 tel que pour tous m, n n2 , kum un k 2 , et on pose u2 = un2 ; par
construction, on a bien s
ur ku2 u1 k 1 . En continuant de meme, on construit
par recurrence une suite (u )N , extraite de (uk )kN , telle que pour tout 1,
ku+1 u k 2 .
La serie de terme general (u+1 u ) est absolument convergente, donc convergente,
et sa somme partielle u converge vers une limite u E. La suite (un )nN est de
Cauchy et admet une sous-suite convergente, elle converge donc. (En effet, soit > 0
arbitraire, et soit N tel que pour tous m, n N, kum un k . On peut choisir
assez grand pour que ku uk , et pour que u soit egal `a un pour un certain
n N. Il sensuit que kun uk 2.)

Notons que cest la Proposition VII-3 qui a servi `a demontrer la completude des
espaces Lp (Theor`eme VI-16).
Passons maintenant en revue une liste de crit`eres simples permettant de construire
des espaces vectoriels normes complets. La majorite des espaces de Banach usuels
sont obtenus par utilisation combinee de quelques-uns de ces crit`eres.
Proposition VII-4. Soient (E, k k) un espace vectoriel norme complet, et F
un sous-espace vectoriel ferme de E. Alors F , muni de la norme induite par k k,
est un espace vectoriel norme complet.
Proposition VII-5. Soit (Ek , Nk )kN une suite (finie ou infinie)
Q despaces vectoriels normes complets, et soit p [1, ]. Alors lespace produit Ek est un espace
vectoriel norme quand on le munit de la norme produit p definie par



P
p 1/p

N
(x
)
(p < );
k
k
(xk )kN p =
kN

(xk )kN = supkN Nk (xk ).

Exemple VII-6. Si E et F sont des espaces de Banach, alors E F est un


espace de Banach quand on le munit de la norme k(x, y)k = kxk + kyk.
Proposition VII-7. Soient (F, k k) un espace vectoriel norme complet, et X
un espace topologique quelconque. On note Cb (X; F ) lespace des fonctions continues
bornees de X dans F , et C0 (X; F ) lespace des fonctions continues de X dans F , tendant vers 0 `a linfini. Alors Cb (X; F ) et C0 (X; F ) sont des espaces vectoriels normes
complets quand on les munit de la norme du supremum : N(f ) = supxX kf (x)k.
Proposition VII-8. Soit (F, k k) un espace vectoriel norme complet, et (X, )
un espace mesure. Pour tout p [1, ], on note Lp (X; F ) lespace des fonctions mesurables f : X F telles que kf k Lp (X, ), quotiente par la relation dequivalence
concider presque partout. Alors Lp (X; F ) est un espace vectoriel norme complet

246

CHAPITRE VII

quand on le munit de la norme



1/p
R

p = kf k
= X kf (x)kp d(x)
kf
k

Lp (X)

kf kL =
kf k

L (X)

(13 juin 2010)

(1 p < ),

= esssup xX kf (x)k.

Remarque VII-9. Cet enonce contient la Proposition VII-5 comme cas particulier (prendre X = N et = mesure de comptage).
Proposition VII-10. Soient (E, k k) un espace vectoriel norme, et F un sousespace vectoriel norme complet. Alors lespace L(E, F ) des applications lineaires
continues de E dans F est complet quand on le munit de la norme
kT (x)k
= sup kT (x)k = sup kT (x)k.
kxk
xE\{0}
kxk=1
kxk1

kT kL(E,F ) = kT kEF = sup

Corollaire VII-11 (espace dual). Soit E un espace vectoriel norme ; lespace


L(E, R) des formes lineaires continues de E dans R est un espace de Banach, appele
dual de E et note E ; il est muni de la norme
kf k := sup |f (x)| = sup |f (x)|.
kxk1

kxk=1

La dualite est un des ingredients essentiels de la theorie des espaces de Banach.


Si E est un espace vectoriel norme, pour tous x E et E on note
(x) = h, xi = h, xiEE .

Les crochets utilises dans cette notation sont appeles crochets de dualit
e entre E et
E ; ne pas confondre avec un produit scalaire. (Les deux notations sont cependant
compatibles au sens o`
u lapplication produit scalaire par un vecteur x est une
forme lineaire.)
Il peut etre plus ou moins difficile didentifier le dual dun espace de Banach.
Quand on parvient `a trouver une facon simple de decrire les elements dun espace
dual, on dit quon a un th
eor`
eme de repr
esentation. Citons d`es maintenant les
theor`emes de representation les plus cel`ebres :
(i) le dual dun espace de Hilbert H est lespace H lui-meme ;

(ii) le dual de Lp est Lp pour tout p ]1, +[ ;


(iii) sur un espace mesure -fini, le dual de L1 est L ;
(iv) sur un espace localement compact X, le dual de C0 (X) est lespace M(X)
des mesures signees de variation totale finie
Les enonces (i) `a (iii) seront prouves dans la suite de ce chapitre ; quant `a lenonce
(iv), cest exactement le contenu du Theor`eme VI-61).
Reprenons maintenant notre liste de crit`eres de completude :
Proposition VII-12. Soient (E, kk) un espace vectoriel norme complet, et F un
sous-espace vectoriel ferme de E. Alors lespace quotient E/F est un espace vectoriel
norme complet quand on le munit de la norme quotient kXkE/F = inf{kxk; x X},
ou, ce qui revient au meme, en designant par x la classe dequivalence de x,


kxkE/F = inf kx + yk; y F .

` COMPLETER

ANALYSE DE BANACH - A

247

Proposition VII-13. Soit V un espace vectoriel norme et soient (E, k kE ) et


(F, k kF ) deux espaces de Banach sinjectant contin
ument dans V . On definit E + F
comme lensemble de toutes les sommes x + y o`
u x varie dans E et y dans F . On
munit E + F de la norme
n
o
kzkE+F = inf kxkE + kykF ; x E; y F ; x + y = z .
Alors E + F est un espace de Banach.

Proposition VII-14. Soit (E, N) un espace vectoriel norme, non necessairement


complet. On definit C(E) comme lespace des suites de Cauchy `a valeurs dans E.
On injecte E dans C(E) en identifiant x E `a la suite constante egale `a x ; et on
etend N en une seminorme C(E) en definissant N((xk )kN ) = limk N(xk ). On
definit E comme le quotient de C(E) par le noyau de N ; et on le munit de la norme
N. Lespace E est alors un espace vectoriel norme complet qui admet E comme
sous-espace dense. On appelle E le complete (ou la completion) de E pour la norme
N.
Remarque VII-15. Si F est un sous-espace dense de E, alors le complete de
F (pour la distance induite par E) est E, comme on sy attendait. Par exemple,
le complete de Q (muni de la distance usuelle) est R ; en fait cest ainsi que lon
construit traditionnellement R.
Remarque VII-16. De mani`ere imagee, le processus de completion consiste
`a ajouter `a E toutes les limites de suites de Cauchy. En pratique, les normes
auxquelles on applique ce procede sont souvent de la forme N(x) = kT (x)kF , o`
uT
est une application lineaire injective, et (F, k kF ) un espace vectoriel norme. (On
verifie facilement quune telle application N est bien une norme.)
Exemple VII-17. Soit p [1, ] et soit E = Cc1 (Rn ; R) (lespace des fonctions
C 1 `a support compact, de Rn dans R), muni de la norme kT (f )k, o`
u


f
f
T (f ) = f,
.
,...,
x1
xn

Lapplication lineaire T est injective de C 1 (Rn , R) dans Lp (Rn ) . . . Lp (Rn ). On


definit alors lespace de Sobolev W 1,p (Rn ) comme la completion de E. En clair,
W 1,p (Rn ) est lespace complet defini par la norme

n
X
f


kf kW 1,p (Rn ) = kf kLp (Rn ) +
xj p n .
j=1

L (R )

Les espaces W 1,p sont les plus simples representants de la grande famille des espaces
de Sobolev et de leurs generalisations.

D
emonstration de la Proposition VII-4. Soit (xk )kN une suite de Cauchy dans F ; cest alors une suite de Cauchy dans E, elle converge donc vers x E,
qui appartient `a F puisque F est ferme.

D
emonstration de la Proposition VII-5. Cette proposition est un cas particulier de la Proposition VII-8, cependant sa demonstration est plus elementaire.
Notons tout dabord que k kp est bien une norme, linegalite triangulaire etant
une consequence de linegalite de Minkowski (pour lespace Lp associe `a la mesure
de comptage sur N). Si x est une suite, on note x = (xk )kN . Soit alors (x )N

248

CHAPITRE VII

(13 juin 2010)

une suite de Cauchy pour cette norme. (Cest donc une suite de suites.) Comme
kykp Nk (yk ), la suite (xk )N est de Cauchy dans Ek , quel que soit . Elle converge
donc au sens de la norme Nk vers un element xk de Ek . Pour tout > 0 il existe
N N tel que pour tous , m N,
X
p
p
Nk (xk xm
k ) .
kN

En particulier,

kK

p
p
Nk (xk xm
k ) ,

et on peut passer `a la limite dans cette expression quand m :


X
Nk (xk xk )p p .
kK

En faisant tendre K vers linfini, on en deduit que kx xkp . La suite x


converge donc vers x, ce qui conclut la preuve.

D
emonstration de la Proposition VII-7. Soit (fk )kN une suite de Cauchy dans Cb (X; F ). Alors, pour tout x, la suite (fk (x))kN est de Cauchy dans X,
et converge donc vers un element de X que lon note f (x). Pour tout > 0 on peut
trouver N 1 tel que pour tous k, N, et pour tout x X, kfk (x) f (x)k .
En passant `a la limite dans cette inegalite quand , on voit que fk converge
uniformement vers f ; il sensuit en particulier que f est continue. Lespace Cb (X; F )
est donc bien complet. On laisse en exercice ladaptation de cette demonstration `a
lespace C0 (X; F ).

D
emonstration de la Proposition VII-8. Elle est en tout point semblable
`a celle du Theor`eme VI-16 (de Riesz-Fischer), modulo le remplacement de R par
lespace complet F .

D
emonstration de la Proposition VII-10. On verifie aisement que la formule donnee dans lenonce definit bien une norme. La preuve de la completude est
la meme que celle de la completude de Cb (X) : soit (Tn )nN une suite de Cauchy
dans L(E, F ) ; alors, pour tout x E, la suite (Tn (x)) est de Cauchy dans F , et
converge donc vers un vecteur que lon peut noter T (x). En passant `a la limite dans
la definition de la linearite de Tn , on verifie que T est lineaire. Par ailleurs, la suite
(Tn ) etant de Cauchy, elle est bornee en norme par une constante M 0 ; pour tout
x de norme 1 on a |Tn (x)| M, et en passant `a la limite on trouve |T (x)| M,
donc kT k M, ce qui montre que T est continue.


D
emonstration de la Proposition VII-12. Rappelons que E/F est lespace E quotiente par la relation dequivalence x est en relation avec y si et seulement si x y F . On verifie facilement que cette definition permet detendre les
operations daddition et de multiplication scalaire `a E/F , et que lon a defini ainsi
un espace vectoriel. Un element de E/F est de la forme x + F , o`
u x E.
Supposons donc E complet et F ferme. Pour verifier la completude de E/F , on
verifie la convergence de toute serie absolument convergente (Proposition VII-3).
Soit donc (Xk )kN une suite `a valeurs dans E/F , telle que
X
kXk kE/F < +;
kN

` COMPLETER

ANALYSE DE BANACH - A

249

P
nous allons montrer que la suite des sommes partielles kn Xk converge dans E/F .
Pour tout k, on peut choisir xk Xk tel que kxk k 2kXk kE/F (si Xk = F cest
evident,P
et sinon cest une consequence de la definition de la norme quotient). Alors
la serie kxk k converge, et la suite des sommes partielles sk = x1 +. . .+xk converge
vers un certain s E. Linegalite ksk sk implique kSk Sk , o`
u Sk =
X1 + . . . + Xk et S est la classe de s. Il sensuit que Sk converge vers S.
Il semble que nous nayions pas utilise lhypoth`ese de fermeture de F ... ! Elle
intervient en fait pour verifier que N est bien une norme sur E. En effet, si N(x) = 0
cela veut dire quil existe une suite yk delements de F tels que kx + yk k 0 ; on en
deduit que x = lim yk , et pour en deduire que x = 0, cest-`a-dire x F , il nous
faut supposer que F est ferme.
Les autres proprietes de la norme N (homogeneite, inegalite triangulaire) ne
dependent pas de ce que F est ferme :
inf kxk = inf
k x k = || inf
kx k;

xX

inf kzk

zX+Y

inf

xX, yY

x X

kx + yk

x X

inf

xX, yY

(kxk + kyk) = inf kxk + inf kyk.


xX

yY


D
emonstration de la Proposition VII-13. Lespace E + F sidentifie au
quotient de lespace complet E F par le sous-espace ferme = {(x, x); x
E F }. Cest donc un espace complet.

D
emonstration de la Proposition VII-14. La demonstration ne presente
pas de difficulte mais elle est assez lourde `a ecrire et `a lire ; on pourra lomettre en
premi`ere lecture.

Etant
donnee une suite de Cauchy (xk ) dans E, la suite (N(xk ))kN est une suite
de Cauchy dans R, grace `a linegalite |N(x) N(y)| N(x y). Il sensuit que
cette suite converge vers une limite que lon peut noter N((xk )). On verifie sans
probl`eme que N, definie sur C(E), est homog`ene et verifie linegalite triangulaire,
mais ce nest bien s
ur pas une norme : son noyau est exactement lespace vectoriel
Z des suites qui convergent vers 0. On definit E comme le quotient de E par Z. Si
(xk )kN et (xk )kN sont deux representants dune meme classe dequivalence x E,
on verifie facilement que N((xk )) = N((xk )), ce qui permet de definir N(x) sans
ambigute pour x E. Lapplication N reste homog`ene et verifie toujours linegalite
triangulaire, mais maintenant par construction N(x) = 0 si et seulement x est (la
classe dequivalence de) 0. Lespace (E, N) est donc un espace vectoriel norme.
Verifions maintenant que E est complet. Soit (x )N une suite de Cauchy de
suites de Cauchy ( !). Pour tout > 0 il existe N 1 tel que pour , N on ait

limk N(xk xk ) ; en particulier il existe k0 tel que N(xk xk ) pour tout


k k0 . Quitte `a augmenter k0 , on peut supposer k0 N. Alors N(xk xkk )
pour tout k k0 . La suite x converge donc vers la suite y definie par yk = xkk .
Si (xk )kN est une suite de Cauchy, alors la suite limk N(x xk ) tend vers 0
quand , comme consequence de la definition des suites de Cauchy. Il sensuit
que N(x x) 0, si lon note x la suite (xk )kN . Cette propriete subsiste quand on
passe au quotient : la classe dequivalence dune suite de Cauchy est donc limite dans
E de cette meme suite de Cauchy, vue comme suite delements de E ; et lespace E
est donc effectivement dense dans E.


250

CHAPITRE VII

(13 juin 2010)

VII-1.3. Th
eor`
emes de continuit
e automatique. Les theor`emes de continuite automatique constituent une manifestation spectaculaire des proprietes liees `a
la completude. Ces theor`emes garantissent que sous certaines conditions, certaines
applications lineaires entre espaces de Banach sont continues ; ce sont les theor`emes
de BanachSteinhaus et de lapplication ouverte, ainsi que leurs consequences
(theor`eme de Banach, theor`eme du graphe ferme). Tous ces resultats reposent crucialement sur lhypoth`ese de completude. Avant de les exposer, je vais commencer
par rappeler quelques proprietes elementaires des applications lineaires.
Proposition VII-18. Soient E et F deux espaces vectoriels normes.
(i) Une application lineaire T : E F est continue si et seulement si elle est
bornee, au sens o`
u elle est bornee sur la sph`ere unite, cest-`a-dire
kT (x)k
kT kEF := sup kT (x)k = sup
< +.
kxk
x6=0
kxk=1

(ii) Une application lineaire T : E F est ouverte (au sens o`


u elle envoie un
ouvert sur un ouvert) si et seulement si limage reciproque par T de la boule unite
B1 (0) dans E contient une boule Br (0) (r > 0) dans F .
(iii) Si T est une application lineaire bijective E F , sa reciproque T 1 est
continue si et seulement si elle est minoree en norme sur la sph`ere unite de E,
cest-`a-dire
kT (x)k
inf kT (x)k = inf
> 0.
kxk=1
kxk6=0
kxk
monstration. (i) Remarquons tout dabord que T , etant lineaire, est bornee
De
sur la sph`ere unite si et seulement si elle est bornee sur la boule unite, et qualors
on a
!
kT (x)k

sup kT (y)k kxk.

kyk1

Il est evident egalement que si kT kEF est finie, alors T est lipschitzienne, donc
continue. Cest limplication inverse qui est plus subtile : si T est continue, montrer
quelle est bornee sur la boule unite. Comme T (0) = 0 et T est continue en 0, il
existe > 0 tel que
kxk =
kT (x)k 1.
On peut alors ecrire x = (kxk/)y, avec kyk = , do`
u kT (x)k kxk/.
(ii) Si T est ouverte, alors limage de la boule unite B1 (0) est un ouvert contenant 0, et donc une boule Br (0) de rayon non nul. Reciproquement, si limage de
B1 (0) contient une boule Br (0), soit O un ouvert de E, et x O, il existe alors une
boule B (x) = x + B1 (0) O, et T (O) contient T (B (x)) = T (x) + T (B1 (0)), qui
contient donc T (x) + Br (0), cest-`a-dire une boule centree en T (x). Limage de O
par T est donc un ouvert.
(iii) Il suffit decrire x = T (T 1 (x)) et de lire le crit`ere (i) `a lenvers.

Th
eor`
eme VII-19 (Theor`eme de BanachSteinhaus). Soit (T )A une famille
doperateurs lineaires continus de E, espace vectoriel norme complet, dans F , espace
vectoriel norme quelconque. On suppose que pour tout x E, lensemble des kT (x)k
est borne. Alors la famille T est uniformement bornee : il existe une constante C
telle que
A, x E,
kT (x)k Ckxk.

` COMPLETER

ANALYSE DE BANACH - A

251

Remarque VII-20. Ce theor`eme peut se reformuler comme une interversion de


quantificateurs : lenonce
x E, kxk 1,

C > 0;

sup kT (x)k C
A

implique lenonce, `a premi`ere vue plus fort,


C > 0;

x E, kxk 1,

sup kT (x)k C.
A

On peut le resumer par la formule ponctuellement borne implique uniformement


borne, ou encore (selon une terminologie qui deviendra claire quand nous parlerons
plus loin de convergence faible) faiblement borne implique fortement borne.
Corollaire VII-21 (Theor`eme de continuite de BanachSteinhaus). Soit (Tn )nN
une famille doperateurs lineaires continus de E, espace vectoriel norme complet,
dans F , espace vectoriel norme quelconque. On suppose que pour tout x E, la
suite Tn (x) converge dans F . Alors loperateur lineaire T := lim Tn est continu.
Corollaire VII-22 (Continuite des applications bilineaires). Soient E et F
deux espaces vectoriels normes, dont lun au moins est complet, et soit B une
application bilineaire definie sur E F , continue en chaque variable separement.
Alors B est continue au sens des applications bilineaires : il existe C > 0 tel que
kB(x, y)k C kxk kyk pour tout (x, y) E F .
D
emonstration du Th
eor`
eme VII-19. Soit, pour tout n N,
n
o
Fn := x; sup kT (x)k n .
A

Pour chaque , la fonction x 7 kT (x)k est continue E R ; lensemble Fn


est donc une intersection de fermes, donc un ferme. Par hypoth`ese, tout x E
appartient `a lun des Fn , cest-`a-dire que la reunion des Fn est E tout entier. Puisque
E est complet, lun au moins des Fn est dinterieur non vide, par contraposee du
theor`eme de Baire. Il existe donc n0 N, x0 E, r0 > 0 tels que pour tous A,
et y E de norme unite,


T (x0 + r0 y) n0 .
On en deduit kT (y)k n0 + r01 kT (x0 )k n0 (1 + r01 ).

Remarque VII-23. On trouvera dans [LiebLoss, pp.52-53] une preuve leg`erement


plus directe, sans utilisation du theor`eme de Baire (mais pas plus constructive pour
autant).
D
emonstration du Corollaire VII-21. Cest une consequence immediate
du Theor`eme VII-19, puisquune suite convergente est forcement bornee.


emonstration du Corollaire VII-22. Supposons par exemple que F est


D
complet, et soit G lespace darrivee de lapplication B. Pour tout y F , on pose
By (x) = B(x, y). Lapplication By etant continue lineaire E G, il existe Cy > 0 tel
que pour tout x E, de norme au plus 1, kBy (x)k Cy . Linegalite kB(x, y)k Cy
montre que la famille dapplications lineaires y B(x, y) (parametree par x) verifie
les hypoth`eses du Theor`eme VII-19 ; il existe donc C > 0, independante de y, telle
que kB(x, y)k C pour tous x, y de norme au plus 1. Ceci montre que B est continue
au sens des applications bilineaires.


252

CHAPITRE VII

(13 juin 2010)

Apr`es le Theor`eme de BanachSteinhaus, passons maintenant au deuxi`eme resultat


frappant de cette section :
or`
The
eme VII-24 (Theor`eme de lapplication ouverte). Soient E et F deux
espaces de Banach, et T : E F une application surjective continue. Alors T est
ouverte.
Corollaire VII-25 (Theor`eme de Banach). Soient E et F deux espaces de
Banach, et T : E F une application bijective continue. Alors son inverse T 1 est
continu F E.
Le corollaire qui suit, correspondant au choix T = Id, semble peut-etre plus
surprenant encore que le precedent :
Corollaire VII-26. Soit E un espace vectoriel et soient N, N deux normes
qui font de E un espace de Banach. Sil existe C > 0 tel que N C N, alors il
existe C > 0 tel que N C N .
Avant de donner les demonstrations, on va enoncer un lemme simple, dont la
preuve est laissee en exercice.
Lemme VII-27. Si A et B sont deux parties dun espace vectoriel norme E et
un nombre reel, on definit
n
o


A + B = x + y; a A, b B ,
A = a, a A .

Alors A + B A + B, A = A, et, si 6= 0, Int(A) = Int(A). En particulier,


si A et B sont fermes, alors A + B est ferme. En outre, si A est ouvert (et B est
quelconque), alors A + B est ouvert.
D
emonstration du Th
eor`
eme VII-24. Dapr`es la Proposition VII-18, pour
montrer que T est ouverte, il suffit de montrer que T (Br (0)) contient un voisinage
de 0 pour un (ou, de mani`ere equivalente, pour tout) r > 0. On va noter pour abreger
Br = Br (0).
1. Montrons que T (B1 ) contient un voisinage de 0. Cette etape utilise la completude
de F et la surjectivite de T . Par hypoth`ese, F = T (E) = T (Bn ) T (Bn ). Lespace complet F est union des fermes T (Bn ) ; par le theor`eme de Baire (sous forme
contraposee) il existe n0 tel que T (Bn0 ) soit dinterieur non vide. Alors linterieur
de T (B1/2 ), qui est egal `a (1/(2n0 ))T (Bn0 ), est egalement dinterieur non vide, et
contient un ouvert O. Cet ouvert nest pas necessairement voisinage de 0, mais la
difference O O = {x y; x O, y O} est un ouvert contenant 0. Il est clair que
O O T (B1/2 ) T (B1/2 ), et par le Lemme VII-27, O O T (B1/2 ) + T (B1/2 ) =
T (B1/2 + B1/2 ) T (B1 ).
2. Comme consequence de letape 1, pour tout r > 0, T (Br ) contient un voisinage
de 0. On va maintenant montrer que T (B1/2 ) T (B2 ), ce qui conclura largument.
Cette etape utilise la completude de E et la continuite de T . Soit donc y T (B1/2 ).
Puisque T (B1/4 ) est un voisinage de 0, y T (B1/4 ) est un voisinage de y, et doit donc
intersecter T (B1/2 ), puisque y appartient `a son adherence. Il existe donc x1 B1/2
tel que T (x1 ) y T (B1/4 ), cest-`a-dire
y T (x1 ) T (B1/4 ).

` COMPLETER

ANALYSE DE BANACH - A

253

Par le meme argument, on peut trouver x2 B1/4 tel que


(y T (x1 )) T (x2 ) T (B1/8 ).

Par iteration, on construit ainsi une suite (xk )kN telle que xk B1/2k et

(48)
y T (x1 ) + . . . + T (xk ) T (B1/2k+1 ).

Par continuite de T , il existe C > 0 telle que T (B1 ) soit inclus dans la boule fermee
B[0, C], donc dans la boule ouverte B2C . Par consequent, T (B1/2k+1 ) T (B(2C)/2k+1 ),
qui converge
vers {0} quand k . En reportant dans (48), on en deduit que la
P
k
s
e
rie
T
(x
)
erie
k converge et a pour somme y. Daute part, kxk k 2 , donc la s
P
xk est absolument convergente,
et par completude de E, converge vers un certain
P
x E tel que kxk
kxP
k

1. P
On peut alors passer `a la limite grace `a la
k
continuite de T : T (x) = T ( xk ) =
T (xk ). En conclusion, il existe x B2 tel
que y = T (x). Ceci conclut la preuve du Theor`eme VII-24.
3. Supposons maintenant que T est une bijection lineaire continue entre espaces
de Banach. Dapr`es le Theor`eme VII-24, T est ouverte ; on en deduit que limage
reciproque par T 1 de tout ouvert est ouverte, et donc T 1 est continue.

D
emonstration du Corollaire VII-25. Il suffit dappliquer le Theor`eme VII24 apr`es avoir note que la reciproque dune bijection ouverte est continue (pour tout
ouvert O, (T 1 )1 (O) = T (O) est ouvert).

Nous allons maintenant examiner un dernier resultat cel`ebre de continuite automatique :
or`
The
eme VII-28 (Theor`eme du graphe ferme). Soient E et F des espaces
de Banach, et T une application lineaire de E dans F . Alors T est continu si et
seulement si son graphe G(T ) = {(x, T (x)); x E} est ferme dans E F (muni de
la norme k(x, y)k = kxk + kyk).

D
emonstration. Si T est continu, alors : (x, y) 7 y T (x) est continue
de E dans E F , et le graphe G(T ) = 1 (0) est ferme.
Reciproquement, supposons G(T ) ferme. On note que G(T ) est un espace vectoriel par linearite de T ; comme sous-espace vectoriel ferme de lespace de Banach
E F , il est lui-meme un espace de Banach. Considerons les applications de projection E et F definies par E (x, y) = x, F (x, y) = y. Lapplication E est une
bijection continue de E dans G(T ) ; par le Theor`eme VII-25 (de Banach) son inverse
E1 est continu de G(T ) dans E. Lapplication T est alors continue de E dans F
puisque T = F E1 .

Remarque VII-29. Ici on a demontre le Theor`eme du graphe ferme comme
consequence du Theor`eme de Banach ; mais on peut aussi prouver le Theor`eme de
Banach `a laide du Theor`eme du graphe ferme. En effet, si T : E F est une
application lineaire bijective entre espaces de Banach, alors
n
o
n
o
1
(T ) = (x, T (x)); x E ,
(T ) = (T (x), x); x E ,
et il est clair que (T ) est ferme si et seulement si (T 1 ) lest.

Le Theor`eme du graphe ferme sutilise habituellement par lun des deux crit`eres
qui suivent.

254

CHAPITRE VII

(13 juin 2010)

Crit`
ere pratique VII-30. Soit T : E F une application lineaire entre
espaces de Banach. On suppose que pour toute suite (xn )nN telle que xn x dans
E et T (xn ) y dans F , on a y = T (x). Alors T est continue.
e F , Fe des espaces de Banach tels que
Crit`
ere pratique VII-31. Soient E, E,
e F Fe avec injections continues. On se donne T une application lineaire
E E,
e dans Fe, telle que T (E) F . Alors T definit par restriction une
continue de E
application lineaire continue de E dans F .

D
emonstration. Le Crit`ere VII-30 decoule du Theor`eme VII-28 et de la caracterisation sequentielle de la propriete de fermeture du graphe. Nous allons voir
quil implique le Crit`ere VII-31. Supposons en effet que xn x dans E et T (xn )
e et T (xn ) y dans Fe, puisque E E
e et F Fe
y dans F ; alors xn x dans E
e Fe implique y = T (x), do`
avec injections continues. La continuite de T : E
u la
continuite de T vue comme une application E F .


Voici quelques commentaires pour conclure. Les theor`emes de continuite automatique sont puissants et tirent pleinement parti de la completude. Il convient
cependant dy prendre garde : leur grande generalite est fatalement compensee par
leur caract`ere non-constructif. En pratique, il est souvent important dobtenir des
majorations explicites sur les normes des operateurs lineaires que lon rencontre ;
les theor`emes de BanachSteinhaus ou de lapplication ouverte ne peuvent en aucun cas mener `a de telles estimations, ils se contenteront de prouver la finitude de
ces normes. Si lobjet detude est une application lineaire particuli`ere, il est donc
recommande deviter autant que possible le recours `a ces theor`emes de continuite
automatique, et de leur preferer une estimation `a la main, en apparence moins
elegante mais souvent beaucoup plus informative.
En fait, on peut envisager les theor`emes de continuite automatique de la meme
mani`ere que les theor`emes de mesurabilite dans Rn . Les applications que lon peut
construire explicitement sur Rn sont Lebesgue-mesurables ; de meme, les applications lineaires que lon peut definir explicitement entre espaces de Banach sont
toutes continues : si on les definit par des limites de suites, cest une consequence du
theor`eme de BanachSteinhaus ; si on les definit comme des bijections reciproques
cest une consequence du theor`eme de Banach ; si on les definit `a partir dun graphe
cest une consequence du theor`eme du graphe ferme.
Le parall`ele peut etre pousse plus loin : de meme que lon peut construire une
axiomatique pour laquelle toutes les parties de R sont mesurables, il est egalement
possible de construire une axiomatique pour laquelle toutes les applications lineaires
entre espaces de Banach sont continues !
VII-2. R
egularit
e des espaces de Banach
Nous allons maintenant etudier les principales proprietes de regularite (definies
soit en termes analytiques, soit en termes geometriques) utilisees pour decrire les
espaces de Banach. Je me concentrerai sur trois proprietes particuli`erement importantes : la s
eparabilit
e, la diff
erentiabilit
e (de la norme), et la convexit
e uniforme. Les espaces de Hilbert separables, qui sont en quelque sorte les plus reguliers
de tous les espaces de Banach, poss`edent toutes ces qualites et encore bien dautres.

` COMPLETER

ANALYSE DE BANACH - A

255

VII-2.1. S
eparabilit
e.
D
efinition VII-32 (separabilite). On dit quun espace metrique X est separable
sil existe une suite (xn )nN dense dans X.
Autrement dit, un espace metrique est dit separable sil existe une suite (xn )nN
telle que tout x X est limite dune suite extraite (xn(k) )kN .
La separabilite sherite par restriction :
Proposition VII-33. Soient (X, d) un espace metrique separable, et Y une partie quelconque de X ; alors Y , muni de la restriction de d, est un espace metrique
separable.
D
emonstration. Pour tous m, n N, si B1/m (xn ) Y est non vide, on choisit
un element xmn dans cet ensemble. La suite double (xm,n )m,nN ainsi definie est alors
dense dans Y . En effet, si y Y , pour tout m assez grand il existe n N tel que
d(xn , y) 1/m, et alors d(y, xm,n ) 2/m.


Dans le cas o`
u X est un espace vectoriel, il existe une autre formulation equivalente
de la propriete de separabilite :
Proposition VII-34 (crit`ere de separabilite). Soit E un espace vectoriel norme.
Alors E est separable si et seulement si il existe dans E un sous-espace vectoriel
dense de dimension au plus denombrable.
Rappelons quun espace F est de dimension denombrable sil existe une base
algebrique denombrable, i.e. une famille (ek )kN telle que tout x F puisse secrire
de mani`ere unique comme combinaison lineaire finie des ek .
Exemple VII-35. Lespace des polynomes `a coefficients reels est un espace vectoriel de dimension denombrable. (On ne ne parle pas de norme ici.)
emonstration de la Proposition VII-34. Supposons quil existe un sousD
espace F dense dans E et admettant une base denombrable (ek )kN . La famille
P
enombrable car D est en bijection
D = { N
k=1 k ek ; k Q; N N} est d
avec lunion des Qm (m N), qui est denombrable. Dautre part D est dense :
P
chaque k par un rationnel qk avec une erreur
si x = N
k=1 k ek , on peut approcher
P
au plus , de sorte que kx qk ek k (N sup kek k). Lespace E admet donc un
sous-ensemble denombrable dense.
Reciproquement, supposons E separable et soit (xk )kN une suite dense dans
E. Par recurrence, on choisit parmi les xk une famille libre (xk )kI qui engendre le
meme espace vectoriel F que les (xk )kN (si xk nappartient pas `a lespace vectoriel
engendre par les elements dej`a selectionnes parmi x1 , . . . , xk1 , on le retient ; sinon
on lelimine). On verifie facilement que cette famille constitue une base de F , qui
est donc de dimension au plus denombrable. Comme cet espace contient une suite
dense, il est lui-meme dense.


Le theor`eme suivant examine la separabilite des espaces fonctionnels dej`a rencontres.


or`
The
eme VII-36 (separabilite des espaces usuels). Soit X un espace metrique
separable. Alors
(i) Si est une mesure de Borel reguli`ere et -finie sur X, alors Lp (X, ) est
separable pour 1 p < ;

256

CHAPITRE VII

(13 juin 2010)

(ii) Si X est localement compact, alors Cc (X) est dense dans C0 (X) ; si en outre
X est -compact, alors les espaces Cc (X) et C0 (X) sont separables ;
(iii) Les espaces L (X, ), M(X), Cb (X) ne sont en general pas separables.
Ainsi,
- Cb (X) est non separable d`es que X est localement compact, -compact mais
non compact ;
- M(X) est non separable d`es que X est non denombrable ;
- L (X, ) est non separable d`es que X contient une infinite densembles disjoints de mesure positive.
Exemples VII-37. Si est un ouvert de Rn muni de la mesure de Lebesgue, les
espaces Lp (), 1 p < , sont separables, de meme que p = Lp (N). En revanche,
les espaces Cb (Rn ), = L (N), L () ne sont pas pas separables.
Remarque VII-38. Ces exemples despaces non separables ne sont pas si inquietants que lon pourrait le craindre : comme on le verra par la suite, sous certaines
hypoth`eses de regularite sur X ces espaces peuvent etre vus comme duals despaces
separables, ce qui leur conf`ere de bonnes proprietes.
D
emonstration du Th
eor`
eme VII-36. 1. Lespace vectoriel des fonctions
simples (combinaisons lineaires finies de fonctions indicatrices) est dense dans Lp (X)
au vu des Theor`emes II-29 et VI-15. Pour demontrer lenonce (i), il suffit donc
dexhiber un sous-espace denombrable dense dans lespace des fonctions simples, et
pour cela il suffit bien s
ur de trouver une famille dense dans lespace des fonctions
indicatrices densembles mesurables de mesure finie. Lidentite

1/p


1A 1B p = [A \ B] + [B \ A]
L ()

montre quil suffit dexhiber une famille denombrable B qui soit dense dans la tribu
borelienne, au sens o`
u pour tout borelien A on puisse trouver une famille (Bk )kN
delements de B tels que [Bk \ A] + [A \ Bk ] 0.
Une telle famille B est formee par lensemble des unions finies de boules
Br (y), o`
u y varie dans une partie denombrable dense D de X, et r dans lensemble
des nombres rationnels positifs. En effet, soit A un ensemble mesurable, et soit
> 0. Par regularite, on peut trouver un ensemble ouvert O contenant A tel que
[O \ A] . Par le Theor`eme I-32 (i), on peut ecrire O = kN Brk (yk ), o`
u les rk
sont rationnels et les yk appartiennent `a D. Par -additivite, il existe N tel que



O \ 1kN Brk (yk ) .
En particulier, il existe B B tel que [O \ B] . On a alors

[A \ B] + [B \ A] [O \ B] + [O \ A] 2,

ce qui conclut largument.


2. Passons maintenant `a lenonce (ii). Soit f C0 (X) ; pour tout > 0 on peut
trouver un compact K de X telle que


f f 1K
.
L (X)
Par le lemme dUrysohn, il existe une fonction , `a support compact et `a valeurs
dans [0, 1], identiquement egale `a 1 sur K. En particulier, la fonction f , continue

` COMPLETER

ANALYSE DE BANACH - A

et `a support compact, verifie

257



f f
.
L (X)

Lespace Cc (X) est donc bien dense dans C0 (X).


3. Supposons maintenant que X est en outre -compact. Par le Theor`eme I-36,
il existe une suite croissante (Kn )nN de compacts, dont la reunion est egale `a X,
telle que chaque Kn soit inclus dans linterieur de Kn+1 , et telle que tout compact
K de X soit inclus dans lun des Kn . Lespace Cc (X) est donc la reunion croissante
des espaces Cc (Kn ), et pour demontrer le resultat il suffit de traiter le cas o`
u X est
compact.
4. Supposons donc X compact. Soit B definie comme dans la demonstration de
(i). Pour tout B B et tout entier 1 on definit B () comme lensemble des
x X tels quil existe y B avec d(x, y) < 1 . Lensemble B () est ouvert, puisque
cest lunion de toutes les boules ouvertes de rayon 1/ centrees en un element de B.
Lensemble B est ferme dans le compact X, cest donc un compact. Par ailleurs, on
a bien s
ur B B () ; par le lemme dUrysohn on peut donc introduire une fonction
= B, telle que
1B 1B() .
En clair, est une approximation de la fonction indicatrice de B, qui sannule sur
une distance de lordre de 1/. Lensemble de toutes les fonctions B, (B B, N)
est denombrable puisque B lest.
Soit maintenant f C(X) ; on veut montrer quil existe un element de lespace
vectoriel engendre par les B, qui soit tr`es proche de f au sens de la norme du
supremum. En decomposant f en partie positive et partie negative, on se ram`ene
au cas o`
u f est `a valeurs positives.

Soit alors m un entier positif. Etant


continue sur un compact, f est uniformement
continue, et il existe N tel que
(49)

d(x, y)

|f (x) f (y)| 2m .

Pour tout k {0, . . . , M}, soit



Ek := x X; k 2m f (x) .

Lensemble Ek est compact, on peut donc le recouvrir par un nombre fini de boules
de rayon 1/ centrees en des elements de Ek ; soit Bk lunion de ces boules, et
k := Bk , . Tout element de Bk est situe `a une distance au plus 1/ de Ek , et donc
la fonction k sannule en tout point x tel que d(x, Ek ) > 2/.
Soit x Ek , alors x Bk , et donc k (x) = 1. Par ailleurs, soit x tel que
f (x) < (k 1) 2m : alors, pour tout y Ek on a, par (49), d(x, y) > 3/. Il sensuit
que d(x, Ek ) 3/, et donc k (x) = 0. Resumons : k est identiquement egale `a 1
l`a o`
u f k 2m et identiquement nulle l`a o`
u f < (k 1) 2m.
Soient maintenant x X, et kx un entier tel que kx 2m f (x) < (kx + 1) 2m.
Pour tout k kx , on a k (x) = 1, et pour tout k kx + 2 on a k (x) = 0. Il sensuit
P
u
que M
k=0 k (x) est comprise entre kx et kx + 2, do`


M


X


(2m k (x)) 2 2m .
f (x)


k=0

258

CHAPITRE VII

(13 juin 2010)

P
m
k
Cette majoration est independante de x. La conclusion en decoule, puisque M
k=0 2
appartient effectivement `a lespace vectoriel engendre par les B, .
5. Pour montrer quun espace E nest pas separable, il suffit dexhiber une famille
non denombrable delements de E qui sont tous `a distance au moins 1 les uns des
autres. Soit X un espace localement compact, -compact, non compact. En utilisant
le Theor`eme I-36, on montre facilement que X est union croissante denombrable de
compacts Kn tels que Kn+1 soit un voisinage de Kn , distinct de Kn (en effet, la
suite de compacts fournie par ce theor`eme ne peut etre stationnaire que si X est
compact). Pour tout n N, on peut constuire grace au lemme dUrysohn, des
fonctions fn non nulles, `a valeurs dans [0, 1], telles que fn soit `a support compact
dans On = Int(Kn ), et identiquement egale `a 1 sur un compact non vide de On ;
en particulier sup |fn | = 1. Pour tout x X, il existe au plus un n N tel que
fn (x) 6= 0 ; on peut donc definir, pour toute suite (n )nN `a valeurs dans {0, 1}, la
somme

X
n fn .
f :=
n=0

Si et sont deux suites distinctes `a valeurs dans {0, 1}, alors kf f k = 1. On


conclut `a la non-separabilite de Cb (X) en remarquant que lensemble des applications
: N {0, 1} est non denombrable.
6. Les autres cas evoques dans lenonce (iii) se traitent de meme. Si (X, ) est
un espace mesure et (Bk )kN une famille de boules disjointes de mesure positive, on
peut repeter le meme raisonnement que ci-dessus en remplacant la fonction fk par la
fonction indicatrice de Bk . Enfin, si X est non denombrable, la famille des (x )xX
est une famille non denombrable de M(X) ; or kx y kV T = 2 d`es que x 6= y. 

Remarque VII-39. La demonstration du Theor`eme VII-36 fournit des sousespaces denses assez explicites. Ainsi, elle montre que si X est un espace metrique
separable muni dune mesure , reguli`ere et -finie, alors lespace vectoriel engendre
par les fonctions indicatrices de boules ouvertes est dense dans Lp (X, ) ; et lon peut
se limiter aux boules ouvertes de rayon rationnel, dont les centres appartiennent `a
un ensemble dense fixe a priori. A titre dapplication, nous allons utiliser ce resultat
pour demontrer le Theor`eme VI-20.
D
emonstration du Th
eor`
eme VI-20. Il sagit de montrer que lespace vectoriel engendre par les produits tensoriels de fonctions Lp (X1 , 1 ) et Lp (X2 , 2) est
dense dans Lp (X1 X2 , 1 2 ). On munit lespace produit X = X1 X2 de la
distance d((x1 , x2 ), (y1, y2 )) = max(d1 (x1 , y1), d2 (x2 , y2 )), qui induit bien la topologie
produit. Alors une boule ouverte B dans X secrit B = B1 B2 , o`
u B1 est une boule
ouverte dans X1 et B2 une boule ouverte dans X2 . Il sensuit que 1B = 1B1 1B2
est un produit tensoriel. Comme lespace vectoriel engendre par les fonctions indicatrices de boules ouvertes est dense dans Lp (X), il en est de meme de lespace
vectoriel engendre par les produits tensoriels.

Remarque VII-40. Les familles denses construites pour les besoins de la demonstration
du Theor`eme VII-36 sont assez naturelles dans le cadre abstrait de ce theor`eme.
Mais souvent, dautres choix naturels pourront se presenter dans des cas particuliers. Par exemple, si est un ouvert borne de Rn , la famille des polynomes en n
variables, `a coefficients rationnels, restreints `a , est une famille denombrable dense
dans C() (theor`eme de Weierstrass). Cette meme famille est egalement dense dans

` COMPLETER

ANALYSE DE BANACH - A

259

Lp () puisque C() est dense dans Lp (). De meme, la famille des polynomes trigonometriques `a coefficients rationnels est dense dans C(Tn ) au vu du theor`eme de
densite de Fejer (Cf. Chapitre ??).
Terminons cette sous-section avec un enonce sur la separabilite des espaces fonctionnels `a valeurs vectorielles.
Th
eor`
eme VII-41 (Separabilite des espaces usuels `a valeurs vectorielles). Soient
X un espace metrique separable et E un espace vectoriel norme separable. Alors
(i) Si est une mesure de Borel reguli`ere et -finie sur X, alors Lp (X, ; E) est
separable pour 1 p < ;
(ii) Si X est localement compact et -compact, alors les espaces Cc (X; E) et
C0 (X; E) sont separables.
D
emonstration. Ici je vais seulement demontrer lenonce (ii) qui est plus
` PRECISER

facile, et remettre la preuve de lenonce (i) `a plus tard (A


utiliser le theor`eme de desintegration ?). On se ram`ene comme dans la preuve du
Theor`eme VII-36 au cas o`
u X est compact. On note d la distance sur X, k k
la norme de E, et on introduit une famille denombrable dense (ek )kN dans E. Soit
f C(X; E), soit > 0 et soit > 0 tel que


d(x, y) < = f (x) f (y) .

Soit (x )1L une famille finie telle que tout y X se trouve `a une distance au plus
de lun au moins des x . Les boules ouvertes B(x , ) forment donc un recouvrement
ouvert fini de X, et on peut introduire ( )1L une partition continue de lunite
subordonnee `a ce recouvrement. Pour tout on choisit ek() tel que kf (x )ek() k .
On pose alors
X
g=
(x) ek() .
1L

Comme

f g =

on a

sup kf (y) g(y)k

yX

ek()
X

1L


f,

sup kf (y) ek() k.


yB (x )

Si y B (x ) alors kf (y) ek() k kf (y) f (x )k + kf (x ) ek() k 2. Il sensuit


que
X
sup kf (y) g(y)k (2)
= 2.
yX

1L

En conclusion, la famille des sommes finies


f ek , o`
u f C(X; R) et ek appartient `a une famille dense de fixee a priori dans E, est elle-meme dense dans C(X; E).
En combinant ce resultat avec la separabilite de C(X; R) on conclut facilement `a la
separabilite de C(X; E).


Remarque VII-42. Ce que lon a montre par largument precedent, cest que le
produit tensoriel C(X) E (defini comme ladherence des sommes finis de produits
tensoriels dun element de C(X) par un element de E) concide avec C(X; E). On
montrera plus tard que Lp (X) E = Lp (X; E), ce qui permettra de conclure la
preuve de lenonce (i).

260

CHAPITRE VII

(13 juin 2010)

VII-2.2. Diff
erentiabilit
e de la norme. Nous allons maintenant nous interesser
`a la forme de la boule unit
e B1 (0). Cette boule peut etre lisse ou pointue ; elle peut
etre bien convexe ou p
resenter des parties plates. Ces attributs peuvent etre quantifies par les proprietes de la norme. Lexemple `a garder en tete est celui de la boule
unite de (Rn , dp ) (lespace Rn muni de la distance produit p ) : pour p = 2 on a une
boule ronde, `a la fois parfaitement reguli`ere et parfaitement convexe ; pour p = 1
et p = la sph`ere presente des parties plates (defaut de stricte convexite) et des
coins (defaut de differentiabilite) ; quand p est compris strictement entre 1 et ,
mais different de 2, la norme est differentiable et strictement convexe, tout en etant
moins differentiable et moins convexe que dans le cas p = 2.

p=1

1<p<2

p=2

2<p<

p=

Fig. 1. Forme approximative de la boule p en dimension 2, pour


differentes valeurs de p
Dans cette sous-section, on sinteresse `a la differentiabilite de la norme. En dimension infinie, il convient de preciser le concept de differentiabilite.
D
efinition VII-43. Soit une application definie sur un ouvert O dun espace
vectoriel norme E, `a valeurs dans un autre espace vectoriel norme F . On dit que
est
- Frechet-differentiable (ou differentiable) en x O, sil existe une application
lineaire continue de E dans F , notee D(x) (ou Dx ou d(x) ou dx ), telle que


(x + h) (x) D(x) h
F
= 0;
lim
h0 (hE\{0})
khkE
- Gateaux-differentiable en x O, sil existe une application lineaire continue de
E dans F , notee D(x) (ou Dx ou d(x) ou dx ), telle que


(x + te) (x) t D(x) e
e E,
lim
= 0.
t0 (tR\{0})
|t|
Lapplication D(x) est alors appelee Frechet-differentielle ou Gateaux-differentielle
(ou tout simplement differentielle) de en x.
Remarque VII-44. La Gateaux-differentiabilite est la differentiabilite selon
nimporte quelle direction. Pour apprecier la difference entre les deux notions, on
pourra reecrire la propriete de Frechet-differentiabilite comme suit :


(x + te) (x) t D(x) e
F
lim sup
= 0;
t0 kek =1
|t|
E

et la Gateaux-differentiabilite :

(x + te) (x) t D(x) e
F
= 0.
kekE = 1 =
lim
t0
|t|

` COMPLETER

ANALYSE DE BANACH - A

261

Exemple VII-45. Meme en dimension finie, les deux concepts diff`erent, comme
le montre lexemple suivant : soit f : R2 R telle que f (x, y) = y si x = y, et
f (x, y) = 0 si x 6= y. (Peut-on construire un exemple discontinu ?)
Voici quelques proprietes `a garder en tete, que je ne demontrerai pas.
Proposition VII-46. Avec les notations de la Definition VII-43,
La Frechet-differentiabilite en x implique la Gateaux-differentiabilite en x ;
La Gateaux-differentielle D(x), si elle existe, est unique ; en particulier, si
est Frechet-differentiable en x, la Frechet-differentielle et la Gateaux-differentielle
concident ;
Si E est de dimension finie et est Gateaux-differentiable sur un ouvert
O E, de Gateaux-differentielle continue, alors est egalement Frechetdifferentiable.
Soient : O O et O G, o`
u O (resp. O ) est un ouvert dun espace
vectoriel norme E (resp. F ). On suppose que est Frechet-differentiable (resp.
Gateaux-differentiable) en x, et est Frechet-differentiable en (x). Alors
est Frechet-differentiable (resp. Gateaux-differentiable) en x. En abrege :
Frechet Frechet est Frechet ;

Frechet Gateaux est Gateaux.

En revanche, la composition de deux applications Gateaux-differentiables nest


pas a priori Gateaux-differentiable.
Appliquons maintenant ces notions aux espaces de Lebesgue :
or`
The
eme VII-47. Soit (X, ) un espace mesure ; on note Np la norme dans
L (X, ). Alors,
(i) Pour 1 < p < , la norme Np est Frechet-differentiable en tout f Lp (X, )\
{0}, et sa differentielle est definie par la formule
Z
|f |p2f g d
g Lp (X, ), DNp (f ) g = X
;
kf kp1
p
L
p

(ii) Ni la norme N1 , ni la norme N ne sont en general Gateaux-differentiables


hors de lorigine.
Remarque VII-48. Avant de lire la preuve de la Frechet-differentiabilite des
normes Lp (1 < p < ), le lecteur peut essayer de prouver la Gateaux-differentiabilite,
qui est plus simple (noter que lon peut tirer parti de la convexite de t |t|p ).
Le lemme suivant sera utile dans la preuve du Theor`eme VII-47 :
Lemme VII-49. Soit p [1, +[, alors il existe une constante Cp telle que pour
tous nombres reels x et y,
(50)

0 |x + y|p |x|p p |x|p2 xy Cp (|x| + |y|)max(p2,0) |y|min(p,2) .

D
emonstration du Lemme VII-49. Si x = 0 ou y = 0, linegalite est triviale ; on supposera donc x 6= 0, y 6= 0. La fonction fp : x 7 |x|p est convexe sur R
et differentiable en x 6= 0, de derivee p|x|p2 x. Linegalite de convexite
fp (x + y) fp (x) + yfp (x)

est donc precisement linegalite de gauche dans (50).

262

CHAPITRE VII

(13 juin 2010)

On se concentre maintenant sur linegalite de droite. Quitte `a remplacer x par


x et y par y, on peut supposer que x est positif. On a alors |x + y|p (x + |y|)p,
il suffit donc de demontrer linegalite dans le cas o`
u y aussi est positif. En divisant
p
les deux membres de linegalite par y , et en posant t := y/x, on voit que linegalite
est equivalente `a
t > 0,

(51)

(1 + t)p 1 p t Cp (1 + t)max(p2,0) tmin(p,2) .

(Cest un exemple simple dargument dhomog


en
eit
e.)
Le cas p = 1 est trivial, on supposera donc p > 1.
La formule de Taylor avec reste integral, appliquee `a la fonction (t) = (1 + t)p
`a lordre 2, secrit
Z 1
p
2
(1 s)(1 + st)p2 ds.
(1 + t) = 1 + p t + p(p 2) t
0

Il suffit donc de prouver lexistence dune constante Cp > 0 telle que


Z 1
(1 s)(1 + st)p2 ds C(1 + t)max(p2,0) tmin(p2,0) .
0

Si p 2, cest evident : up2 est une fonction croissante de u, donc


Z 1
Z 1
(1 + t)p2
p2
p2
(1 s)(1 + st) ds (1 + t)
(1 s) ds =
.
2
0
0
Si p < 2, au contraire up2 est une fonction decroissante de u, do`
u
Z 1

Z 1
Z 1
p2
p2
p2
(1 s)(1 + st) ds
(1 s)(st) ds =
(1 s)s ds tp2 ,
0

et lintegrale entre parenth`eses est convergente puisque p 2 > 1. La conclusion


en decoule.

D
emonstration du Th
eor`
eme VII-47. Lapplication p : z 7 z 1/p est
differentiable sur ]0, +[ ; pour prouver la Frechet-differentiabilite de Np en f 6= 0,
il suffit donc de prouver la Frechet-differentiabilite de Npp en f ; la formule finale
pour DNp sobtiendra par composition des differentielles de Npp et de p .
Soit g Lp (X, ), de norme 1 ; on doit etablir
Z
Z
Z
p
p
|f + tg| d
|f | d t p
|f |p2f g d = o(t),
X

o`
u le o(t) est uniforme en g (sans cette uniformite on ne prouverait que la Gateauxdifferentiabilite).
Grace au Lemme VII-49, on peut ecrire
Z
Z
Z
p
p
(52)
|f + tg| d
|f | d t p
|f |p2f g d
X
X
Z
Z X

p
p
p2
min(p,2)
(|f |+t|g|)max(p2,0) |g|min(p,2) d.
=
|f +tg| |f | t p|f | f g d Cp t
X

` COMPLETER

ANALYSE DE BANACH - A

263

Quand p 2, on majore lintegrale du membre de droite par inegalite de Holder :


 p2
Z
 p2
Z
Z
p
(|f | + t|g|)p d
(|f | + t|g|)p2|g|2 d
|g|p d
X
X
X

p2


2
= |f | + t|g| kgkLp ,
p
L

(kf kLp + t)p2 . Le membre de


que lon majore par (kf kLp + tkgkLp )
2
droite de (52) est donc en O(t ) quand t 0, et a fortiori cest un o(t). Supposons
maintenant que 1 < p < 2, le membre de droite de (52) se reduit alors `a Cp tp kgkpLp =
Cp tp , qui est egalement un o(t). Ceci ach`eve la preuve de (i).
Pour prouver lenonce (ii), il est facile de construire des contre-exemples : considerons
lespace `a deux points X = {0, 1}, muni de la mesure de comptage. Toute fonction
sur X sidentifie `a un couple x = (x0 , x1 ) de nombres reels, et la norme Np `a la norme
p sur R2 ; en particulier, kxk1 = (|x0 | + |x1|), et kxk = max(|x0 |, |x1 |). La premi`ere
nest pas differentiable en x d`es que x0 = 0 ou x1 = 0, tandis que la seconde nest
pas differentiable en x d`es que x0 = x1 .

p2

kgk2Lp

VII-2.3. Uniforme convexit


e. Si la differentiabilite de la norme quantifie
lidee que la boule unite est lisse, luniforme convexite en revanche quantifiera
lidee quelle est bien ronde.
D
efinition VII-50 (uniforme convexite). Soit (E, k k) un espace vectoriel
norme. On dit que E est uniformement convexe si pour tout > 0 on peut trouver
> 0 tel que


h
i
x + y

(53)
kxk 1, kyk 1, kx yk 2 =
2 1 .

Cette definition merite quelques explications. Tout dabord, la boule unite dun
espace vectoriel norme est toujours convexe : comme consequence de linegalite triangulaire, on a k(x + y)/2k 1 d`es que kxk 1 et kyk 1. Si la sph`ere unite ne
contient pas de partie plate, ou plus precisement pas de segment, cela signifie que
lon ne peut pas avoir simultanement kxk = 1, kyk = 1, x 6= y et k(x + y)/2k = 1 ;
autrement dit,


h
i
x + y

< 1.
kxk 1, kyk 1, x 6= y =
2

Linegalite (53) est une version quantitative de cet enonce : si lon a une borne
inferieure sur lecart entre x et y, alors on peut minorer la distance entre (x + y)/2
et la sph`ere unite.
Exemple VII-51. Il est facile de se convaincre visuellement que p ({0, 1})
(R , dp ) est uniformement convexe pour 1 < p < , mais pas pour p = 1 ou p = .
2

Remarque VII-52. Soient E un espace vectoriel norme et : E R {+}.


On dit que est uniformement convexe sil existe K > 0 telle que pour tous x, y E
et [0, 1],
 K(1 )
(x) + (y) x + (1 )y
kx yk2.
2
Il est tentant de relier luniforme convexite dun espace vectoriel norme `a luniforme
convexite de sa norme. Mais la terminologie est trompeuse : une norme nest jamais

264

CHAPITRE VII

(13 juin 2010)

Fig. 2. Signification de luniforme convexite : le milieu dun segment


(ici un point epais) ne peut jamais sapprocher du bord de la boule.
uniformement convexe, ni meme strictement convexe, comme on peut sen convaincre
en choisissant y = tx (t > 0) dans linegalite ci-dessus.
Si (E, k k) est un espace uniformement convexe, on peut definir son module
de convexit
e par la formule




x + y

() = inf 1
2 ; kxk 1, kyk 1, kx yk 2 .
En dautres termes, est la plus grande fonction croissante verifiant




x + y


kx

yk

kxk 1, kyk 1 =
.
2 1
2
Le comportement de pr`es de 0 indique `a quel point lespace est uniformement
convexe.
or`
The
eme VII-53 (uniforme convexite des espaces de Lebesgue). Soit (X, )
un espace mesure. Alors
(i) Pour tout p ]1, [ lespace Lp (X, ) est uniformement convexe, avec un
module de convexite
p () Kp max(2,p) ,
o`
u Kp > 0 ne depend que de p ;
(ii) En general ni L1 (X, ) ni L (X, ) ne sont uniformement convexes.
Ce theor`eme decoulera des in
egalit
es de Hanner, qui renforcent en quelque
sorte linegalite de Minkowski :
or`
The
eme VII-54 (inegalites de Hanner). Soit (X, )
soient f, g deux fonctions dans Lp (X, ), 1 p < . Alors



p
kf kLp kgkLp p f
kf kLp + kgkLp

p 2 =
+


2
2
p

p

kf kLp kgkLp
kf kLp + kgkLp
f
p 2 =
+


2
2

un espace mesure, et

p

f g p
+ g
+
;
2 Lp 2 Lp

p

f g p
+ g
+
.
2 Lp 2 Lp

La preuve des inegalites de Hanner sappuiera elle-meme sur le lemme suivant.


Lemme VII-55. La fonction
: (x, y) 7 (x1/p + y 1/p )p + |x1/p y 1/p |p ,

definie sur R+ R+ , est homog`ene de degre 1, convexe pour p 2, et concave pour


p 2.

` COMPLETER

ANALYSE DE BANACH - A

265

D
emonstration du Lemme VII-55. Soit, pour x 0,

(x) := (x, 1) = (x1/p + 1)p + |x1/p 1|p .

Par calcul direct, pour tout x > 0,




i
h
1
p1
2

1/p
p2
1/p
p2
p
x
(x) =
.
(x + 1)
|x 1|
p

Comme x est positif, on a toujours (x1/p + 1) |x1/p 1|, donc (x1/p + 1)p2 est
toujours plus grand que |x1/p 1|p2 si p 2, et toujours plus petit si p 2. On en
deduit que est convexe pour p 2, et concave pour p 2. Par la Remarque III-76,
la fonction (x, y) = y (x/y) est homog`ene et convexe (pour p 2) ou concave
(pour p 2) sur R+ R+ .

ore
`me VII-54. On se concentre sur le cas p 2,
D
emonstration du The
la demonstration etant rigoureusement similaire dans le cas p 2. Appliquons
linegalite de Jensen, sous la forme du Theor`eme III-74, avec la mesure , la fonction convexe homog`ene , et la fonction F : X R+ R+ definie par F (x) =
(|f (x)|p , |g(x)|p) : on trouve
Z
 Z
Z
p
p
|f | d,
|g| d
(|f |p , |g|p) d.

X
p

Le membre de gauche vaut alors (kf kLp + kgkLp ) + |kf kLp kgkLp |p , ce qui est bien,
`a un facteur 2p pr`es, le membre de gauche de linegalite de Hanner. Pour calculer le
membre de droite, on remarque que (|f |p , |g|p) = (|f | + |g|)p + ||f | |g||p, et en
considerant separement le cas o`
u f et g ont meme signe et celui o`
u ils ont des signes
opposes, on constate que cest egalement |f + g|p + |f g|p ; en integrant par rapport
`a , on retrouve donc le membre de droite de linegalite de Hanner, toujours `a un
facteur 2p pr`es.

D
emonstration du Th
eor`
eme VII-53. 1. Commencons par le cas o`
u1 <
p 2. En substituant f et g dans linegalite de Hanner par (f + g)/2 et |f g|/2,
et en utilisant la notation k k pour la norme Lp , on obtient







f g p 1 f + g f g p 1 
1
f + g
p
p









(54)
,
+

kf
k
+
kgk
+
2 2 2
2 2 2
2

Si maintenant on suppose kf k 1, kgk 1, et quon note m := (f + g)/2, on trouve


p 

p


kf gk
kf

gk
1
1.
kmk +
+ kmk
(55)

2
2
2

Admettons provisoirement linegalite


(a + b)p + (a b)p
ap + p(p 1) ap2 b2 ;
(56)
a b 0 =
2
en combinant (56) avec (55), on obtient

p(p 1)
kmkp2 kf gk2 1.
4
on trouve kmk2 + (p(p 1)/4)kf gk2 kmk2p 1,

kmkp +

En multipliant par kmk2p


do`
u
r
p(p 1)
p(p 1)
kf gk2 1
kf gk2.
kmk 1
4
8

266

CHAPITRE VII

(13 juin 2010)

(La derni`ere inegalite provient de la concavite de la fonction t 1 t ; on majore


cette fonction par sa tangente en 0.)
Reste `a prouver (56). En appliquant la formule de Taylor avec reste integral `a la
fonction (t) = tp , on trouve
Z 1
2
(a + b) + (a b) = 2(a) + b
(1 t)[ (a + tb) + (a tb)] dt
0
Z 1


p
2
= 2a + p(p 1)b
(1 t) (a + tb)p2 + (a tb)p2 dt.
0

Comme p est plus petit que 2, la fonction z 7 z p2 est convexe sur ]0, +[, et
donc, d`es que a + b a b 0 on a

(a + tb)p2 + (a tb)p2
ap2 .
2
Linegalite (56) en decoule.
2. Considerons maintenant le cas o`
u p 2. Soit la fonction introduite dans
la preuve du Lemme VII-55. Comme p 2, est concave, et donc majoree par sa
tangente en x = 1, ce qui peut se reecrire

 1/p
p 1/p
x 1 p x + 1
x +1

+
.

2
2
2

Par homogeneite, pour tous nombres positifs a et b, on a



p 1/p
 1/p
a b1/p p a + b
a + b1/p


+
.
(57)

2
2
2

Linegalite de Hanner implique donc







f + g p f g p 1 
p
p

+

(58)
.
kf
k
+
kgk
2
2
2

Supposons maintenant kf k 1, kgk 1, en notant toujours m := (f + g)/2 on a




f g p
p
1.

kmk +
2

La fonction t 7 (1t)1/p , etant concave, se majore par sa tangente en 1, la fonction


1 t/p ; on en deduit




p
f g p 1/p
1 kf gk


kmk 1
1
,
2
p
2
ce qui implique bien une minoration du module de convexite en p /p.
3. Terminons en considerant les cas p = 1, p = mentionnes dans lenonce (ii).
En general, on peut trouver deux parties mesurables disjointes A et B de mesure
strictement positive. On consid`ere alors les fonctions f := 1A /[A], g := 1B /[B] :
kf kL1 = kgkL1 = 1 et k(f + g)/2kL1 = 1 ; il sensuit que L1 nest pas uniformement
convexe. Si on consid`ere les fonctions f := 1A , g := 1A + 1B , alors kf kL = kgkL =
1, et k(f + g)/2kL = 1, ce qui montre que L nest pas uniformement convexe non
plus.


` COMPLETER

ANALYSE DE BANACH - A

267

Remarque VII-56. Si lon ne peut pas trouver de parties disjointes A et B de


mesure strictement positive, alors toute fonction mesurable est egale `a une constante
-presque partout (si f prenait deux valeurs distinctes avec des mesures strictement
positives, on pourrait construire, en passant aux images reciproques, deux ensembles
disjoints de mesure strictement positive). Si ne prend pas ses valeurs dans {0, +},
lespace Lp () sidentifie alors `a une droite, et la boule unite de Lp () `a un segment,
qui ne saurait etre uniformement convexe.
Remarque VII-57. Linegalite (58) est lin
egalit
e de Clarkson ; on la obtenue comme consequence de linegalite de Hanner, mais on peut aussi la demontrer
directement [Brezis, p. 60] `a partir de linegalite elementaire
ap + bp (a2 + b2 )p/2 .
Cette inegalite ne couvre que le cas o`
u p 2 ; pour p 2 il existe une deuxi`eme
inegalite de Clarkson, nettement plus delicate :




 pp

f + g p
f g p
1
p
p




(59)
1 < p 2 =
2 p + 2 p 2 kf kLp + kgkLp .
L
L

Cette inegalite peut aussi se deduire de linegalite de Hanner, sous la forme (54) :
pour sen convaincre, il suffit de verifier la validite de linegalite
(a + b)p + |a b|p
,
2
pour tous a, b 0. Si lon introduit x := a + b, y := a b, on peut reecrire (60) sous
la forme
"
#1/p  p
p

p 1/p
x y p
x
+
y
x+y

(61)
+
.
2
2
2
(60)

(ap + bp ) p

Pour verifier (61), on va utiliser un argument elementaire dinterpolation complexe :


soit T : R2 R2 loperateur lineaire


x+y xy
.
T : (x, y) 7
,
2
2

On identifie R2 `a lespace des fonctions mesurables sur lespace `a deux points Z =


{0, 1}. Linegalite (61) exprime le fait que T a pour norme au plus 1 de Lp (Z, )

dans Lp (Z, ), avec = (0 + 1 )/2 et = 0 + 1 . Par le Theor`eme VI-33 (de


RieszThorin), il suffit de verifier que la norme de T est majoree par 1 aussi bien
L2 (Z, ) L2 (Z, ) que L1 (Z, ) L (Z, ) ; autrement dit, que
s
2 
2 r 2
x+y
x + y2
xy
;
+

2
2
2
et
max

|x + y| |x y|
,
2
2

|x| + |y|
.
2

Ces deux inegalites sont evidemment vraies (ce sont des egalites !), ce qui ach`eve la
preuve de (59).

268

CHAPITRE VII

(13 juin 2010)

Remarque VII-58. Les inegalites de Hanner (comme celles de Clarkson) se


reduisent, quand p = 2, `a lidentit
e du parall
elogramme :
kf + gk2L2 + kf gk2L2 = 2 (kf k2L2 + kgk2L2 );
qui est caracteristique des espaces de Hilbert. Par ailleurs, dans le cas p = 1,
linegalite de Hanner se ram`ene `a linegalite triangulaire.
Remarque VII-59. Dans le cas o`
u p 2, on peut obtenir une estimation plus
precise du module de convexite en combinant linegalite de Hanner avec une inegalite
subtile due `a Gross, que nous ne demontrerons pas (voir les references dans [BallCarlen-Lieb]) : pour tous nombres reels a et b,

1/p
1/2
|a + b|p + |a b|p
a2 + (p 1)b2
.
2
On trouve alors que le module de convexite p () pour 1 < p 2, est au moins
(p 1)2 /2, ce qui est optimal. En fait, sauf dans des cas pathologiques, on a
exactement


p

2 si 1 p 2

2
p () =

si p 2.
p
On note que la constante se degrade quand p 1, ce qui est normal puisque L1
nest pas uniformement convexe.

Remarque VII-60. Il existe une notion duale du module de convexite, appelee


module de regularite (uniforme), qui quantifie `a quel degre la boule unite ne
presente pas de pointes. Les inegalites de Hanner permettent encore de calculer ces
modules de regularite ; pour plus dinformations on renvoie `a [Ball-Carlen-Lieb].
VII-2.4. Liens avec la topologie. Il existe de nombreux theor`emes de nature topologique faisant intervenir la separabilite, la differentiabilite de la norme
et luniforme convexite. Voici quelques-uns des plus notables (les trois premiers seront demontres dans la suite du chapitre ; les autre sont mentionnes seulement pour
memoire) :
- Si E est uniformement convexe, alors E = E ; cest le th
eor`
eme de
MilmanPettis.
- Si E est uniformement convexe, alors pour tout convexe ferme C E on
peut definir une projection continue de E dans C.
- Si E est uniformement convexe et que sa norme est Gateaux-differentiable
en dehors de lorigine, alors E = { DN(x); R; x 6= 0}.
- La meme conclusion est vraie si la norme de E est Frechet-differentiable
en-dehors de lorigine, et si E = E.
- Si E est separable, alors il existe une norme N, equivalente `a la norme
k k de E (cest-`a-dire quil existe C > 0 telle que C 1 k k N Ck k), telle que
N soit Frechet-differentiable en-dehors de lorigine.
- Si E est uniformement convexe, alors la norme de E est Frechet-differentiable
en-dehors de lorigine.

` COMPLETER

ANALYSE DE BANACH - A

269

VII-2.5. Espaces de Hilbert s


eparables. Entre tous les espaces de Banach,
on distingue une categorie qui poss`ede `a un degre extreme toutes les qualites : ce
sont les espaces de Hilbert separables (voire lespace de Hilbert separable, car ils
sont tous isometriques entre eux).
D
efinition VII-61. Un espace vectoriel norme complet (H, kk) est appele espace
de Hilbert sil existe une forme bilineaire symetrique b : H H R telle que
x H,

b(x, x) = kxk2 .

La forme bilineaire b est alors uniquement determinee par la formule


1
b(x, y) = (kx + yk2 kx yk2 );
4
on lappelle produit scalaire dans H, et on note souvent b(x, y) = hx, yiH ; ou, sil
ny a pas de confusion possible, hx, yi ou x y.
La preuve de la proposition suivante est immediate :
Proposition VII-62 (identite du parallelogramme). Soit H un espace de Hilbert. Alors, pour tous x, y H on a
kx + yk2 + kx yk2 = 2(kxk2 + kyk2 ).

Remarque VII-63. Il sagit en fait dune caracterisation des espaces de Hilbert.


Nous allons facilement en deduire que les espaces de Hilbert separables poss`edent
toutes les qualites recensees jusquici :
Th
eor`
eme VII-64 (regularite des espaces de Hilbert). Soit H un espace de
Hilbert muni dun produit scalaire h , i. Alors la norme N sur H est Frechetdifferentiable en tout x 6= 0, et
D x
E
DN(x) h =
,h .
kxk
En outre, H est uniformement convexe, de module de convexite () = 2 /2.
D
emonstration du Th
eor`
eme VII-64. De lidentite
N(x + h)2 = N(x)2 + 2 hx, hi + khk2 ,

on deduit que N 2 est Frechet-differentiable en tout x H, et que sa differentielle en


x est lapplication lineaire produit scalaire par 2 x. Lapplication racine carree
est derivable en N(x)2 d`es que N(x) 6= 0, i.e. x 6= 0, et sa derivee vaut alors 1/(2kxk).
Par composition des differentielles, lapplication N est differentiable en tout x 6= 0, et
sa differentielle est lapplication lineaire produit scalaire par (2x)/(2kxk), comme
indique dans lenonce.
Dautre part, la formule du parallelogramme et la concavite de la fonction racine
carree entranent que pour tous x, y de norme au plus 1,


!1/2

2

2
2
x + y
x y 2
1
kxk
+
kyk
x y




.

1

2
2
2
2
2
En choisissant x et y tr`es proches et de normes egales, on verifie facilement que cette
estimation du module de convexite ne peut etre amelioree.


270

CHAPITRE VII

(13 juin 2010)

Le Theor`eme VII-64 garantit que tous les enonces abstraits que nous rencontrerons par la suite sappliquent aux espaces de Hilbert separables. En fait, la plupart
de ces resultats pourront se demontrer de mani`ere tr`es directe dans les espaces de
Hilbert, grace `a loutil puissant que constituent les bases Hilbertiennes. Nous
reprendrons cette discussion dans la section VII-8, apr`es avoir developpe la theorie
generale des espaces de Banach.
VII-3. Projection
La projection dun point x sur un ensemble X est une meilleure approximation
de ce point par un element de X. Plus precisement :
D
efinition VII-65 (projection). Soient (E, k k) un espace vectoriel norme, X
une partie de E, et x E. On dit que y X est une projection de x sur E si
kx yk = inf kx zk.
zX

Il est clair que si x X alors x est lunique projection de x. En revanche si


x
/ X et que X est un ensemble quelconque, on ne peut garantir ni lexistence
ni lunicite dune projection. Nous allons voir cependant que la projection existe de
mani`ere unique si X est convexe ferme et que lespace ambiant E est uniformememnt
convexe.
VII-3.1. Th
eor`
eme de projection dans les espaces uniform
ement convexes.
Th
eor`
eme VII-66 (Theor`eme de projection). Soient E un espace de Banach
uniformement convexe et C un convexe ferme de E. Alors, pour tout x il existe une
unique projection de x sur C, notee C (x). Cette relation definit une application C
continue de E dans C, appelee projection sur C.
Remarque VII-67. Cest lespace ambiant E qui doit etre uniformement convexe ;
le convexe C quant `a lui peut etre plat ; on lautorise meme `a etre un espace vectoriel.
Remarque VII-68. La convexite et la fermeture de C sont essentielles, meme
en dimension finie.

Fig. 3. La projection sur un ferme non convexe nest en general pas unique.

` COMPLETER

ANALYSE DE BANACH - A

271

or`
D
emonstration du The
eme VII-66. Si A est une partie de E et x E,
on note d(x, A) = inf{kx yk; y A} la distance de x `a A. Posons D = d(x, C).
Pour tout n N on peut trouver zn C tel que
1
(62)
kx zn k D + .
n
Verifions que la suite (zn )nN est de Cauchy. On se donne m n ; par convexite
(zm + zn )/2 C, et donc



1
zn + zm
1
D.

kx zn k D + ,
kx zm k D + ,
x
n
n
2
En posant

X=

on obtient
kXk 1,

kY k 1,

x zn
,
D + n1

X + Y

2

Y =

x zm
,
D + n1



n1
1
D

=
1

1
.
D + n1
1
D+n
nD

Soit > 0 arbitraire, et = () comme dans la definition de luniforme convexite.


Si 1/(nD) < , la contraposee de cette definition montre que kX Y k < 2, en
particulier
kzn zm k < 2 (D + n1 ) 2(D + 1).
La suite (zn )nN est donc bien de Cauchy.
Par completude de E, cette suite admet une limite, notee z. En passant `a la
limite dans (62), on obtient kx zk D. Puisque C est ferme, on a z C, et en
particulier kx zk D. On conclut que kx zk = D, et z est donc une projection
de x sur C.
Verifions maintenant lunicite de z. Si D = 0, cest que z = x et il ny a rien `a
prouver. Si D > 0, soit z tel que kxz k = kxzk et z C ; on pose m := (z+z )/2,
par convexite m appartient `a C. Alors les vecteurs u := (z x)/D, u := (z x)/D
sont de norme 1, et leur demi-somme est de norme km xk/D 1. Par uniforme
convexite, on a u = u, soit z = z.
Montrons maintenant la continuite de lapplication C . Le raisonnement est assez
similaire `a celui qui a dej`a ete utilise pour lexistence. Notons d(z, C) = inf{kz
ck; c C}.
Si x, y sont deux elements quelconques de E, on a
kx C (x)k = d(x, C);

ky C (y)k = d(y, C).

Si x, y nappartiennent pas tous deux `a C, on peut definir


u=
Alors

x C (x)
,
max d(x, C), d(y, C)

v=

y C (y)
.
max d(x, C), d(y, C)




u+v
x+y
1
C (x) + C (y)

,
=

2
2
2
max d(x, C), d(y, C)
de sorte que



x+y
u + v
d
,
C
2

kuk 1; kvk 1;
2 max d(x, C), d(y, C) .

272

CHAPITRE VII

(13 juin 2010)

Par convexite uniforme, il sensuit





d x+y
,C
ku vk
2
,

1
2
max d(x, C), d(y, C)

do`
u

ku vk 2 1
et par consequent
(63) kC (x) C (y)k kx yk

!

,
C
d x+y
2
 ,
1
max d(x, C), d(y, C)


+ 2 max d(x, C), d(y, C) 1

!

d x+y
,
C
2
 .
1
max d(x, C), d(y, C)

La continuite de C en resulte. En effet, soit x C, alors


si x C, alors C (x) = x, donc

kC (y)C (x)k = kxC (y)k kxyk+kyC (y)k kxyk+kyxk = 2kxyk,


et C est donc continue en x ;
si x
/ C, alors d(x, C) > 0 et d((x + y)/2, C)/ max(d(x, C), d(y, C)) 1
quand y x, car d( , C) est continue (et meme 1-lipschitzienne) ; donc le membre
de droite de (63) tend vers 0, `a une vitesse qui depend du module de continuite
et de la distance d(x, C).

Remarque VII-69. Dans le cas particulier o`
u E est un espace de Hilbert, on
peut ameliorer considerablement lestimation (63). En effet, dapr`es linegalite (??)
ci-dessous, on a


y C (y), C (x) C (y) 0;

do`
u

x (x), (y) (x) 0;


C
C
C


kC (y) C (x)k2 = C (y) C (x), C (y) C (x)
hx y, C (y) C (x)i

kx yk kC (y) C (x)k.

On conclut que kC (x) C (y)k kx yk, et C est donc 1-lipschitzienne.


VII-3.2. Caract
erisation diff
erentielle. Si la norme de E est differentiable,
les projections satisfont une equation (ou une inegalite) differentielle, qui est le
principal crit`ere pratique permettant didentifier les projections.
or`
The
eme VII-70. Soit E un espace de Banach, et soient C un convexe ferme
de E, x E \ C, une projection de x sur C. On suppose que la norme N de E
est Gateaux-differentiable en x . Alors
(64)

z C,

DN(x ) (z ) 0.

Reciproquement, si (64) est verifiee pour tout z C, alors est la projection de x


sur C.

` COMPLETER

ANALYSE DE BANACH - A

273

Si C est un espace vectoriel F , on peut remplacer (64) par


y F,

(65)

DN(x ) y = 0;

en dautres termes, F ker DN(x ).


Remarque VII-71. Dans cet enonce on peut remplacer DN par D(N 2 ) (ou
D(N 2 /2)), ce qui a lavantage de garder un sens meme quand x = 0 (i.e. z C).
En combinant la remarque precedente avec le calcul de la differentielle de la
norme dans un espace de Hilbert (Cf. le Theor`eme VII-64 et sa preuve), on obtient
le
Corollaire VII-72 (Projection dans les espaces de Hilbert). Soient H un espace de Hilbert, C un convexe ferme de H, et loperateur de projection de H sur
C. Alors, pour tout x H on a


(66)
z C,
x (x), z (x) 0;
cest-`
a-dire que langle forme par les directions x (x) et z (x) est obtus. En
outre, cette inegalite caracterise (x).
Si C est un espace affine F , linegalite (66) peut se remplacer par lidentite
y F,

(67)

hx (x), yi = 0;

en dautres termes, x (x) est orthogonal `a F .


Remarque VII-73. Le Corollaire VII-72 justifie la terminologie de projection
orthogonale pour designer la projection F sur un sous-espace vectoriel ferme F
dans un espace de Hilbert. Comme lequation (67) est lineaire et caracterise F (x),
on voit que F est une application lineaire. Ce nest pas le cas a priori si H nest
pas un espace de Hilbert !

00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
000
111

00000
11111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
z

1
0
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1
0
1

Fig. 4. Image geometrique de la projection dans un espace de Hilbert ; ici est la projection de x sur le convexe C (resp. lespace affine
ferme F ). Langle forme par les vecteurs issus de et aboutissant en x
dune part, en un element du convexe dautre part, est toujours obtus
(et droit dans le cas dun espace affine).

274

CHAPITRE VII

(13 juin 2010)

or`
D
emonstration du The
eme VII-70. Soit z C et soit ]0, 1]. Par
convexite, (1 ) + z C, donc



N x (1 ) + z N(x ) 0

Par differentiabilite de N en x , le membre de gauche vaut DN(x ) (z


) + o(). En divisant par et en faisant tendre vers 0, on obtient linegalite
DN(x ) (z ) 0, ce qui prouve (64).
Reciproquement, supposons (64) verifie. On pose (z) = N(z x) ; cest une
fonction convexe, differentiable en z = (car 6= x par hypoth`ese). Pour tout
z C et pour tout t [0, 1[, on a

(1 t) + tz (1 t)() + t(z),
do`
u, apr`es division par 1 t,


(1 t) + tz ()
(z) ().
t

Quand on fait tendre t vers 0, le membre de gauche tend vers D() (z ), qui
est positif par hypoth`ese. On conclut que (z) (), soit N(z ) N(x ),
ce qui montre bien que est projection de x sur C.
Si maintenant C est un espace affine F , on peut etablir une bijection entre
z C et y = z appartenant `a Fe, lespace vectoriel qui dirige F . On a alors
DN(x)y 0 ; en changeant y en y, on trouve DN(x)y 0, do`
u (65). 
VII-4. Dualit
e
Lespace dual E dun espace vectoriel norme a ete introduit dans le Corollaire VII-11 ; cest un espace de Banach. Dans cette section, on va passer en revue
des outils lies `a la notion de dualite, et certains theor`emes de representation de
lespace dual.
VII-4.1. Th
eor`
eme de HahnBanach. Le theor`eme dextension de Hahn
Banach permet de prolonger (etendre) des formes lineaires definies sur de petits
sous-espaces dun espace vectoriel norme E, en des formes lineaires definies sur E
tout entier. Concu `a lorigine pour demontrer des resultats surprenants ou paradoxaux (par exemple le Theor`eme IV-43, en liaison avec le paradoxe de Banach
Tarski), le theor`eme de HahnBanach a pris au cours du vingti`eme si`ecle une place
fondamentale dans lanalyse fonctionnelle, en rapport avec laxiome du choix. Dans
ce cours, je trahirai lesprit du theor`eme en me contentant de lenoncer dans un
espace s
eparable, ce qui evitera lusage de laxiome du choix. (Plus precisement,
je commencerai par un enonce purement algebrique sous une hypoth`ese de dimension au plus denombrable, et jen deduirai par densite le resultat pour des espaces
separables.)
Th
eor`
eme VII-74 (Theor`eme dextension de HahnBanach). Soient E un espace vectoriel de dimension au plus denombrable, et p : E R+ une application
homog`ene de degre 1, sous-additive :
x, y E,

0,

p(x) = p(x),

p(x + y) p(x) + p(y).

` COMPLETER

ANALYSE DE BANACH - A

275

On se donne F un sous-espace vectoriel de E, et une forme lineaire sur F telle


que
x F,
(x) p(x).

Alors il existe une forme lineaire sur E, qui concide avec sur F , et verifie
x E,

(x) p(x).

Corollaire VII-75. Soient E un espace vectoriel norme separable, et une


forme lineaire continue sur un sous-espace vectoriel F de E. Alors il existe une
forme lineaire continue sur E telle que
|F =

et

kkE = kkF .

D
emonstration du Th
eor`
eme VII-74. On montre par recurrence que F ,
sous-espace dun espace vectoriel de dimension au plus denombrable, est lui-meme
de dimension au plus denombrable (cest un exercice facile dalg`ebre lineaire). Toujours par recurrence, on peut construire une base de F , au plus denombrable, et
la completer en une base de E, de sorte que E sera engendre par F et par une
famille finie ou denombrable de vecteurs (en )n1 , tous independants entre eux, et
independants de F . On va definir sur E tout entier en imposant (en ) pour tout
n, par recurrence finie ou infinie.
Supposons definie sur lespace vectoriel Fk engendre par F et e1 , . . . , ek , et
verifiant sur cet espace linegalite || p. On cherche `a determiner (ek+1 ) pour
que cette inegalite soit encore vraie sur lespace engendre par Fk et ek+1 , autrement
dit :


x Fk , t R,
x + tek+1 p x + tek+1 .
On pose := (ek+1 ), linegalite souhaitee se reecrit

(x) + t p(x + tek+1 ).


Pour t = 0 elle est evidemment verifiee, tandis que pour t 6= 0 elle devient




p(x + tek ) (x)
p(x + tek ) (x)
sup sup
inf inf
.
xFk t<0
t
t
xFk t<0
En changeant t en t dans le membre de gauche et en utilisant la propriete dhomogeneite de p, la double inegalite precedente se transforme en
h
i
h
i
sup (x) p(x ek+1 ) inf p(x + ek+1 ) (x) .
xFk

xFk

Cette equation en a une solution si et seulement si le supremum dans le membre


de gauche est plus petit que linfimum dans le membre de droite, i.e.
x, y Fk ,

(x) p(x ek+1 ) p(y + ek+1 ) (y).

Or pour tous x, y dans Fk on a egalement x + y Fk , donc


(x) + (y) = (x + y) p(x + y) p(x + ek+1 ) + p(y ek+1 ),
o`
u lon a utilise successivement la linearite de , lhypoth`ese de recurrence, et la
sous-additivite de p. Le theor`eme est demontre.


276

CHAPITRE VII

(13 juin 2010)

D
emonstration du Corollaire VII-75. Soit Fe un sous-espace dense dans
e un sous-espace dense dans E, de dimenF , de dimension au plus denombrable, et E
e par lespace engendre
sion au plus denombrable egalement. Quitte `a remplacer E
e et Fe, on peut supposer que E
e contient Fe. La forme lineaire est definie sur
par E
F , a fortiori sur Fe, et elle y est majoree par lapplication sous-lineaire homog`ene p
definie par p(x) = kk kxk. Par le Theor`eme VII-74, elle se prolonge en une forme
e definie sur E,
e verifiant
lineaire
e
x E,

(x) kk kxk.

e
x E,

|(x)| kk kxk.

En changeant x en x, on voit quen fait


(68)

Lapplication etant uniformement continue sur une partie dense de lespace complet E, elle admet un prolongement continu `a E tout entier. En passant `a la limite
dans (68), on voit que cette inegalite est verifiee pour tout x E, ce qui montre
bien que kk kk. Par ailleurs, on a forcement kk kk, puisque E contient F .
Le corollaire est donc demontre.

En pratique, dans la grande majorite des cas on applique le Theor`eme de Hahn
Banach avec une application p donnee
- soit par une norme, comme dans le Corollaire VII-75 ;
- soit par la jauge dun convexe, definie ci-apr`es (ce deuxi`eme cas est plus
general car la norme nest autre que la jauge de la boule unite) :
D
efinition VII-76 (jauge). Soit, dans un espace vectoriel norme E, un convexe
C contenant un voisinage de 0. Pour tout x E on definit
n
o
x
p(x) := inf > 0;
C .

Lapplication p : E R+ , homog`ene de degre 1 et sous-additive, est appelee jauge


du convexe C.

t
D
emonstration des proprie
es de la jauge. Par hypoth`ese, C contient
une boule centree en 0 ; donc, pour tout x, on peut trouver > 0 assez grand
pour que x/ C, et lapplication p est bien `a valeurs dans R+ . Il est evident que
p(x) = p(x) pour tout > 0. Enfin, si x et y sont deux vecteurs de E, pour tout
> 0 on a
x
y
C,
C,
p(x) +
p(y) +
et donc par convexite
x+y
=
p(x) + p(y) + 2

p(x) +
p(x) + p(y) + 2

x
+
p(x) +

p(y) +
p(x) + p(y) + 2

appartient aussi `a C. Il sensuit que p(x + y) p(x) + p(y) + 2, et la sous-additivite


vient en faisant tendre vers 0.


` COMPLETER

ANALYSE DE BANACH - A

277

VII-4.2. Th
eor`
emes de s
eparation. Les formes lineaires sont souvent utilisees pour separer des objets dans un espace de Banach. Les principaux theor`emes
en la mati`ere sont des consequences du theor`eme de prolongement de HahnBanach,
et sont eux-memes souvent appeles theor`emes de HahnBanach.
La definition suivante, peu classique, precise les deux notions-cle relatives `a la
separation des points par des formes lineaires.
D
efinition VII-77 (separabilite lineaire). Soient A une partie dun espace vectoriel norme E, et L une partie de E . On dit que L separe A si, etant donnes deux
points distincts x et y dans A, on peut trouver L tel que (x) 6= (y).
On dit que E est lineairement separable si E separe E ; ou de mani`ere equivalente
si, etant donne x E \ {0} on peut trouver E tel que (x) 6= 0.
Soit x E \ {0} ; on dit que E normalise x si kk = 1 et (x) = kxk. On
dit que x est lineairement normalisable sil existe E normalisant x ; on dit que
E est lineairement normalisable si tout x E \ {0} est lineairement normalisable.
(Cette notion est donc plus forte que celle de separabilite lineaire.)
Remarque VII-78. Laxiome du choix implique que tout espace vectoriel norme
est lineairement normalisable ; les notions introduites dans la Definition VII-77 ne
presentent donc dinteret que si lon ne souhaite pas utiliser laxiome du choix.
La proposition suivante donne plusieurs conditions suffisantes pour quun espace
vectoriel norme soit lineairement separable, ou lineairement normalisable.
Proposition VII-79. Soit E un espace vectoriel muni dune norme N. Si E
remplit lune quelconque des trois conditions suivantes :
(a) E est separable ;
(b) E est le dual dun espace vectoriel norme E ;
(c) la norme de E est Gateaux-differentiable hors de lorigine ;
alors E est lineairement separable. En outre,
- sous lhypoth`ese (a) ou (c), E est lineairement normalisable ;
- sous lhypoth`ese (b), E (vu comme sous-espace de E ) separe E ;
- sous lhypoth`ese (c), tout x 6= 0 est normalise par la forme lineaire DN(x) ;
- sous lhypoth`ese (a), il existe une suite (k )kN de formes lineaires separant E.
Plus generalement, si S est un sous-espace separable de E, on peut trouver une suite
de formes lineaires sur E qui separe S.
Remarque VII-80. On notera que la terminologie est coherente, au sens o`
u un
espace separable est automatiquement lineairement separable.
Exemple VII-81 (espaces Lp ). Soit (X, A, ) un espace mesure ; on note Lp =
Lp (X, ). Pour tout p (1, +), Lp est lineairement normalisable puisquil satisfait
lhypoth`ese (c). (Cette propriete a dailleurs ete utilisee au cours de la demonstration

de ce que le dual de Lp est Lp .) Si X est -fini, alors L1 separe son dual L


grace au crit`ere (b) ; en revanche L1 ne normalise pas L (exercice). Enfin L1 est
lineairement normalisable : pour f L1 , on choisit la forme lineaire representee par
g = (sign f ) L .
Exemple VII-82. Si X est un espace localement compact, alors C0 (X) separe
son dual M(X) grace au crit`ere (b). Plus subtil : si X est un espace polonais, alors
Cb (X) separe lespace M(X) (qui a priori nest le dual de personne). En effet, soit
une mesure finie non nulle sur X ; par le Theor`eme I-54, est automatiquement

278

CHAPITRE VII

(13 juin 2010)

reguli`ere. Soit A un ensemble mesurable A tel que + [A] = > 0, [A] = 0 ;


par regularite il existe un ensemble compact K A tel que + [K] > /2, et bien
s
ur [K] = 0, donc [K] > /2. On pose fk (x) := max(k 1 d(x, K), 0). Pour
tout x
/ K,
R fk (x) = 0 pour k assez
R grand ; par convergence dominee on a donc
[K] = lim fk d. Il sensuit que fk d 6= 0 pour k assez grand.

Exercice VII-83. Montrer quen general C(X) ne normalise pas M(X), meme
si X est compact.
D
emonstration de la Proposition VII-79. 1. Commencons par supposer
E separable. Soit z un vecteur non nul, et F = Rz la droite vectorielle engendree
par z. Sur F on definit lapplication
: t z 7 t kzk.

Cest bien s
ur une forme lineaire, evidemment de norme 1. Par le Corollaire VII-75
(Theor`eme de HahnBanach), on peut etendre en une forme lineaire E , de
norme 1, telle que
(z) = (z) = kzk.

Ceci montre que E est lineairement normalisable (et en particulier lineairement


separable).
2. Toujours sous lhypoth`ese (a), soit ensuite (zk )kN une suite dense dans E.
Pour tout N on note E le sous-espace vectoriel engendre par les (zk )k . Cest
un espace de dimension finie ; soit (j, )j une base de son dual (E ) . Chacune de
ces formes lineaires setend (encore par le Theor`eme de HahnBanach) en un element
de E . Soit L lespace vectoriel engendre par lunion de tous les j, quand j et
varient : cest un espace de dimension au plus denombrable, et cet espace normalise
nimporte quel vecteur non nul de lespace vectoriel engendre (algebriquement) par
les zk .
Soit alors y E \{0}, et soit yk y tel que yk Ek . Pour tout k on peut trouver
k Ek tel que kk k = 1 et k (yk ) = kyk k. Alors, quand k , |k (yk )k (y)k
kk k kyk yk = kyk yk 0 ; donc limk k (y) = limk kyk k = kyk =
6 0. En
particulier, k (y) est non nul pour k assez grand. Ceci montre bien que L separe E.
Pour conclure il suffit de choisir une suite dense dans L.
3. Si maintenant E est le dual dun espace vectoriel norme E, soient 6=
deux formes lineaires distinctes. Par definition, cela veut dire quil existe x0 E
tel que (x0 ) 6= (x0 ) ; donc E, vu comme sous-espace de E , separe bien E.
4. Considerons finalement lhypoth`ese (c). Soit z 6= 0 ; alors pour tout t > 0,
(1 + t)kzk = N((1 + t)z) = N(z) + DN(z) (tz) + o(t) = kzk + t DN(z) z + o(t).
On simplifie par kzk et on divise par t > 0, puis on fait tendre t vers 0, il vient
DN(z) z = kzk.
Pour conclure que DN(z) normalise z, il suffit de verifier que kDN(z)k 1. Pour
cela on utilise le meme argument : on se donne y E et on ecrit, pour > 0,
N(z) + N(y) = N(z + y) = N(x) + DN(z) y + o().

En faisant encore tendre vers 0, on obtient DN(z) y N(y). En appliquant cette


inegalite `a y, on conclut que |DN(z) y| kyk, ce qui ach`eve la preuve.


` COMPLETER

ANALYSE DE BANACH - A

279

Voici maintenant le principal theor`eme de cette sous-section ; il permet de separer


des convexes disjoints par des formes lineaires.
or`
The
eme VII-84. Dans un espace vectoriel norme separable E, soient C et C
deux convexes disjoints.
(i) Si C est ouvert, alors on peut trouver une forme lineaire E non nulle,
telle que
sup inf ;
C

on dit que separe C et C .


(ii) Si C est ferme et C compact, alors on peut trouver une forme lineaire
E , telle que
sup < inf ;
C

on dit que separe strictement C et C .


D
emonstration. (i) On note C C la reunion de tous les C y quand y decrit
C : il est facile de verifier que cest un convexe ouvert (car reunion densembles
ouverts), ne contenant pas 0 (car C C = ). Soit x0 tel que x0 C C , on pose
e := C C + x0 . Alors C
e est un convexe ouvert contenant 0 mais ne contenant pas
C
e
e on a p(x0 ) 1, et
x0 . Soit p la jauge de C, selon la Definition VII-76. Puisque x0
/ C,
par homogeneite p(tx0 ) t pour tout t > 0 (et donc egalement pour t 0, puisque
p 0). Sur F := Rx0 , on definit une forme lineaire par (tx0 ) = t ; il est clair que
est majoree par p. Grace au Corollaire VII-75 (Theor`eme de HahnBanach) on
peut donc letendre en une forme lineaire sur E, majoree par p. Alors (x0 ) = 1,
e Soient maintenant x C et x C , on
mais (e
x) p(e
x) 1 pour tout x C.

peut poser x
e := x x + x0 et on a (x) (x ) + (x0 ) (x0 ), soit (x) (x ).
(ii) Puisque C est compact, la fonction continue x 7 d(x , C) atteint son
minimum en un certain x0 C , et ce minimum est non nul puisque x0
/ C et que
C est ferme. Il existe donc > 0 tel que d(x, x ) 2 pour tous x C, x C . On
pose alors


C := x E; d(x, C) < = C + B (0);
C := C + B (0).
Ces deux ensembles sont convexes et ouverts ; par (i) il existe une forme lineaire
6= 0 et R tels que (x) (x ) pour tous x C, x C . On a donc,
pour tous z, z de norme 1,
(x) + (z) = (x + z) (x + z ) = (x ) + (z ).

En passant au supremum en z et `a linfimum en z , on obtient


(x) + kk (x ) kk,
ce qui entrane bien linegalite stricte puisque kk =
6 0.

Pour conclure cette sous-section, je mentionnerai quelques crit`


eres de densit
e
qui decoulent des theor`emes de separation rencontres precedemment. Pour ajouter
encore `a la confusion, ces crit`eres sont aussi souvent appeles Theor`emes de Hahn
Banach.

280

CHAPITRE VII

(13 juin 2010)

or`
The
eme VII-85. Soient E un espace vectoriel norme separable, C un convexe
de E et x E. Alors x C si et seulement si
E ,

(x) sup (y).


yC

Dans le cas o`
u C est un sous-espace vectoriel F de E, on peut remplacer ce
dernier crit`ere par


y F, (y) = 0 = [(x) = 0].
En particulier, F est dense dans E si et seulement si la forme lineaire nulle est la
seule forme lineaire continue sannulant sur F .
D
emonstration du Th
eor`
eme VII-85. (i) Si x C, alors par continuite on
a |(x)| supyC |(y)|. Au contraire, si x
/ C, alors par le Theor`eme VII-84(ii) on
peut separer le convexe ferme C et le convexe compact {x} par une forme lineaire
non nulle : on a alors
sup (y) < (x).
yC

(ii) Si x F et que sannule identiquement sur F , alors par continuite (x) =


0 : le crit`ere est donc verifie.
` loppose, si x
A
/ F , par le Theor`eme VII-84(ii) on peut separer strictement le
convexe ferme F du convexe compact {x} ; il existe donc E telle que
sup < (x).
F

En particulier supF < +. Mais sil existait y F tel que (y) 6= 0, alors on
pourrait donc trouver t R tel que (ty) soit arbitrairement grand, et supF =
+, ce qui est impossible. La forme lineaire sannule donc identiquement sur F
mais pas en x.

VII-4.3. Th
eor`
eme de repr
esentation par projection. Le theor`eme qui
suit est lun des outils les plus utiles pour identifier lespace dual dun espace de
Banach.
or`
The
eme VII-86. Soit E un espace de Banach muni de sa norme N. Si E est
uniformement convexe et N est Gateaux-differentiable en-dehors de lorigine, alors


E = DN(x); R, x 6= 0 .

D
emonstration. Tout dabord, il est clair que pour tous x 6= 0 et R, on
a bien DN(x) E ; cest la reciproque qui est non triviale : montrer que tout
E secrit sous la forme DN(x).
Soit donc une forme lineaire continue sur E ; on supposera non nulle (sinon
il suffit de prendre = 0). Son noyau ker est un hyperplan ferme, et puisque
E est uniformement convexe on peut definir (Theor`eme VII-66) lapplication de
projection ker de E dans ker . Soit x0 E tel que (x0 ) 6= 0, et 0 := ker (x0 ) ;
en particulier (y0 ) = 0. Bien s
ur x0 6= 0 , puisque (x0 ) 6= 0 = (0 ) ; N est
donc Gateaux- differentiable en x0 0 . Dapr`es le Theor`eme ??(iii) DN(x0 0 )
normalise x0 0 ; en particulier DN(x0 0 ) est une forme lineaire non nulle.
Dautre part, par (65) on a
ker ker DN(x0 0 ).

` COMPLETER

ANALYSE DE BANACH - A

281

En resume : le noyau de la forme lineaire est inclus dans le noyau de la forme


lineaire non nulle DN(x0 0 ). Par un resultat elementaire dalg`ebre lineaire, il
existe R tel que = DN(x0 0 ).


VII-4.4. Dualit
e des espaces Lp . Je vais maintenant utiliser les resultats
de la sous-section precedente pour identifier les duals des espaces de Lebesgue. La
formule `a retenir est
1
1

(Lp ) = Lp ,
+ = 1,
p p
du moins d`es que p > 1. Voici un enonce plus precis :

or`
The
eme VII-87 (dual de Lp ). Soit (X, ) un espace mesure ; on note Lp
lespace de Lebesgue Lp (X, ), quotiente par la relation degalite presque partout.
Alors,
(i) Pour tout p ]1, [ on peut identifier isometriquement le dual de Lp (X, )

`a lespace Lp (X, ), o`
u p = p/(p 1). Plus precisement, pour tout forme lineaire

continue sur Lp (X, ) il existe un unique g Lp (X, ) tel que


Z
p
f L (X, ),
(f ) = f g d.
(ii) Si X est -fini, on peut de meme identifier isometriquement le dual de
L (X, ) `a L (X, ).
1

Remarque VII-88. Quand on dit que (Lp ) sidentifie `a Lp , cela veut dire que

lapplication qui `a g Lp associe la forme lineaire g definie par


Z
hg , f i = f g d

est une isometrie de Lp sur (Lp ) .

Remarque VII-89. Comme cas particulier du Theor`eme VII-87, on retrouve le


theor`eme de Riesz selon lequel le dual de L2 (espace de Hilbert) sidentifie `a L2 .
Remarque VII-90. Meme dans des situations concr`etes (par exemple si X est
un ouvert de Rn muni de la mesure de Lebesgue), lidentification du dual de L (X)
est un probl`eme insoluble.
- Si lon admet laxiome du choix on peut montrer que L (Rn ) est strictement
plus grand que L1 (Rn ). Cest une construction facile : on introduit la forme lineaire
limite `a linfini (definie sur le sous-espace ferme de L (Rn ) forme des applications
qui convergent `a linfini vers une limite reelle) ; puis on utilise le theor`eme de Hahn
Banach en une forme lineaire definie sur L (Rn ) tout entier. Cette forme lineaire
attribue une limite `a toute fonction bornee, et il est facile de verifier quelle ne peut
etre representee par aucune fonction integrable. Si X est, disons, un ouvert borne,
on peut effectuer une construction similaire avec lapplication limite en x0 , o`
u x0
est un point de X.
- Si lon exclut laxiome du choix, le probl`eme de savoir si (L ) est plus grand
que L1 devient indecidable !
Conclusion : Mieux vaut ne pas se poser de questions sur le dual de L , et
sinterdire dutiliser cet espace...
Remarque VII-91. Si X nest pas -fini, la nature du dual de L1 (X) nest pas
claire non plus.

282

CHAPITRE VII

(13 juin 2010)

Remarque VII-92. Meme si L1 nest (peut-etre) pas le dual de L , la formule



Z
f g d; kgkLp 1
kf kLp = sup
X

reste vraie pour toutes les valeurs de p [1, ], comme on la vu dans lenonce du
Theor`eme VI-24 (pour p = 1 il suffit de choisir g = 1f >0 1f <0 ).
ore
`me VII-87. Commencons par le cas 1 < p <
D
emonstration du The
. Par le Theor`eme VII-53, Lp est uniformement convexe. Par le Theor`eme VII47, sa norme Np est Frechet-differentiable (a fortiori Gateaux-differentiable) hors
de lorigine. Par le Theor`eme VII-86 (Lp ) concide avec le cone engendre par les
DNp (f ), f Lp \ {0}, cest-`a-dire par les fonctions |f |p2f . Si f Lp , alors g =

|f |p2f Lp/(p1) = Lp ; on a donc (Lp ) Lp . Linclusion reciproque est dej`a


connue par le Theor`eme VI-22 (inegalite de Holder). Le Theor`eme VI-24 montre en

outre que pour tout g Lp on a kgk(Lp ) = kgkLp , ce qui ach`eve la demonstration


dans le cas 1 < p < .
Passons maintenant au cas p = 1. On sait que toute fonction essentiellement
bornee definit une forme lineaire continue sur L1 ; il reste `a verifier la reciproque. Soit
donc une forme lineaire continue sur L1 . Pour tout ensemble mesurable Y X, de
mesure finie, on a L2 (Y, ) L1 (A, ) L1 (X, ) (ici on aurait pu choisir nimporte
quel indice p > 1 `a la place de 2) ; donc induit une forme lineaire continue sur
L2 (Y, ) ; et il existe g L2 (A, ) = L2 (A, ) tel que pour tout f L2 (Y, ),
Z
(f ) =
f g d.
Y

Soit > 0, et


A := x Y ;


|g| kk + .

u
On pose f := 1A sign(g) ; alors f L1 (X) L2 (Y ), et kf kL1 = [A ] ; do`
Z
f g d kk [A ].
Y

Mais par definition de f ,


Z
Z
f g d =
Y

|g|kk+

|g| (kk + )[A ].

On en deduit que [A ] = 0. En considerant = 1/k et en faisant tendre k vers


linfini, on trouve que
h
i
{x Y ; |g(x)| > kk} = 0.

Donc |g| kk presque partout sur Y . Soit maintenant f L1 (Y, ), on peut


trouver une famille de fonctions simples (fk )kN , en particulier dans L1 L2 (Y, ),
convergeant vers f dans L1 (Y, ), et on peut alors passer `a la limite :
Z
Z
fk g d = f g d.
f = lim fk = lim
k

Par hypoth`ese X est union denombrable de parties Yk de mesure finie, que lon
peut supposer disjointes. Par le resultat precedent, pour chaque Yk on peut trouver
1
gk tel que
R pour tout fk L (Y
Pk , ), on ait |gk | kk presque partout sur Yk , et
fk = f gk d. Posons g :=
gk ; on a bien s
ur |g| kk presque partout. Soit

` COMPLETER

ANALYSE DE BANACH - A

283

1
f LP
(), et fk = f 1Yk . Par convergence dominee, f = lim fm dans L1 (), o`
u
fm = km fk . Alors

f = lim fm = lim
m

= lim

XZ

km

fk

km

fk gk d = lim

XZ

km

fk g d = lim

fm g d =

f g d.

La forme lineaire sidentifie donc bien `a la fonction bornee g, et en particulier


kkL kgkL . Or on sait dej`a que kgkL kk ; on a donc bien egalite des
normes.

Pour conclure cette sous-section je vais mentionner une generalisation simple au
cas des espaces Lp `a valeurs vectorielles.
Th
eor`
eme VII-93. Soient (X, ) un espace mesure, p (1, ) et E un es
pace vectoriel norme separable. Alors Lp ((X, ); E) = Lp ((X, ); E ). La meme
conclusion reste valable pour p = 1 si X est -fini.
Remarque VII-94. Dans le cas particulier o`
u E = Lp (Y, ) (Y -fini si p = 1),
p
p
cet enonce est facile car L ((X, ); L (Y, )) sidentifie alors `a Lp (X Y ; )
(exercice).
` REVOIR. JadmetD
emonstration du Th
eor`
eme VII-93. PREUVE A
trai ici la Remarque VII-42. Si est une forme lineaire continue sur Lp (X; E), elle
definit en particulier une forme lineaire sur lensemble des produits tensoriels f e,
f Lp (X; R), e E. Fixons e E, on pose e (f ) = (f e) ; e est alors une
forme lineaire continue sur Lp (X; R) puisque
|e (f )| kk kf kLp kekE . Il existe
R
p
donc g = ge L (X; R) tel que e (f ) = f ge d.
R
Si e et e sont deux vecteurs
de E, etR , R, alors ge+ e f = (f (e +
R
e )) = (f e) + (f e ) = (ge )f + (ge )f . Cette identite etant valable pour
tout f Lp (X), on en deduit que ge+ e = ge + ge , -presque partout. Quitte
`a ecarter un ensemble X0 X de mesure nulle, on peut donc supposer que cette
identite est vraie pour tous , Q et pour tous e, e variant dans un ensemble
dense D = {ek ; k N} fixe a priori.
Pour tous e, e D on a kge ge kLp Cke e k. On en deduit que la fonction
e ge se prolonge uniquement en une fonction continue E Lp , lineaire continue
en E, bien definie `a un ensemble de mesure nulle pr`eRs. On pose alors (x)(e) = ge (x).

On verifie que Lp (X; E ) et que (f e) = f ge = (f e) ; sidentifie donc


bien `a .

VII-4.5. Bidualit
e et r
eflexivit
e.
D
efinition VII-95. Soit E un espace vectoriel norme. On appelle bidual de E
et on note E (ou parfois E ) lespace (de Banach) des formes lineaires continues
sur E .
Il sav`ere que le bidual E contient toujours automatiquement lespace E, et
ce de mani`ere canonique :

284

CHAPITRE VII

(13 juin 2010)

or`
The
eme VII-96. Soit E un espace vectoriel norme lineairement normalisable
au sens de la Definition VII-77. Alors E est isometrique `a un sous-espace de E ,
egalement note E, via lidentification x x
b, o`
u
x
b() = (x).

D
emonstration. Il faut verifier que pour tout x E, kb
xkE = kxkE . Il est
clair que
E , |b
x()| = |(x)| kkE kxkE ,

ce qui montre que kb


xk kxk. Si x = 0, alors x
b = 0. Sinon, on peut normaliser x :

il existe E tel que kk = 1 et |(x)| = kxk. En particulier, |b


x()| = kxk, do`
u
kb
xk kxk, ce qui conclut largument.

Dans la suite, on notera en abrege x
b() = hx, i, de sorte que hx, i = h, xi.
Quand on envisagera E comme sous-espace de E , cest toujours au moyen de
lapplication x 7 x
b.
Lenonce qui suit montre que tout element de E peut etre approche, en un
certain sens, par des elements de E.
or`
The
eme VII-97 (Lemme de Goldstine). Soient E , N N, 1 , . . . , N
des formes lineaires continues sur E, et 1 , . . . , N > 0. Alors il existe x E tel que
kxk kk;

j {1, . . . , N},

|h, j i hx, j i| j .

D
emonstration. Sans perte de generalite on peut supposer kk = 1. Soit
: E RN et z RN definis par
(x) := (1 (x), . . . , N (x)),

z := (h, j i, . . . , h, N i).

La conclusion `a prouver est : z (B1 (0)). Comme C := (B1 (0)) est un convexe
de RN , la conclusion pourra etre obtenue grace au Theor`eme VII-85.
Soit une forme lineaire sur RN : elle secrit comme le produit scalaire par un
vecteur (1 , . . . , N ). Do`
u
X
X
X
(z) =
j h, j i = h,
j j i k
j j k.
Dautre part,

sup (y) = sup


yC

kxk<1

X
j

j j (x) = sup (
kxk1

X
j

j j )(x) = k

j j k.

Donc (z) supC ; comme est arbitraire on deduit du Theor`eme VII-85 que
z C.

Remarque VII-98. Cette preuve ne necessite ni la separabilite, ni laxiome du
choix.
Remarque VII-99. On pourra plus tard interpreter le lemme de Goldstine en
disant que E est dense dans E au sens de la topologie faible- de E .
Cest le moment dintroduire la propriete de r
eflexivit
e:
D
efinition VII-100. Un espace de Banach E est dit reflexif si E = E.

` COMPLETER

ANALYSE DE BANACH - A

285

Exemple VII-101. Tout espace de dimension finie est reflexif. Le Theor`eme VII87 montre que les espaces Lp sont reflexifs pour 1 < p < (car (p ) = p), mais
ne dit rien de tel sur les espaces L1 et L . Lespace c0 = C0 (N) des suites qui
tendent vers 0 `a linfini nest pas reflexif : son dual est lespace 1 = L1 (N) des suites
sommables (cest un cas particulier du theor`eme de Riesz, en effet une mesure finie
sur N sidentifie `a une fonction integrable) ; lespace (c0 ) = (1 ) contient donc
toutes les suites bornees, et pas seulement celles qui tendent vers 0.
Le crit`ere le plus utilise pour demontrer la reflexivite est le remarquable theor`eme
de MilmanPettis :
Th
eor`
eme VII-102 (Theor`eme de MilmanPettis). Tout espace de Banach uniformement convexe est reflexif.
Exemple VII-103. En appliquant ce theor`eme aux espaces de Lebesgue et en
utilisant le Theor`eme VII-53, on retrouve la reflexivite des espaces de Lebesgue Lp
pour 1 < p < , sans avoir eu besoin dappliquer le Theor`eme de representation
(Theor`eme VII-87).
D
emonstration. Soient E ; il sagit de montrer quil existe x E tel
que = x
b (on notera simplement = x). Sans perte de generalite, on peut supposer
kk = 1. Lespace E etant ferme, il suffit de montrer que E, cest-`a-dire que
pour tout > 0 il existe x E avec k xk .
Soit donc > 0, et := (/4), o`
u est le module de convexite de E, comme
defini dans la sous-section VII-2.3. Puisque kk = 1, on peut trouver E tel que
kk = 1 et

(69)
h, i 1 .
2
Dapr`es le Lemme VII-97 (de Goldstine), il existe x E tel que kxk kk = 1 et

(70)
|hx, i h, i| < .
2
Si kx k , la demonstration est terminee.
Sinon, cest que kx k > ; par definition de la norme dans E on peut donc
trouver une forme lineaire de norme 1 telle que
(71)

|hx, i h, i| > .

En appliquant le Lemme de Goldstine de nouveau, on peut trouver y E tel que


kyk 1 et

(72)
|hy, i h, i| < ,
|hy, i h, i| < .
2
2
En combinant cela avec (70) on en deduit




x + y
1


2 , h, i 2 |hx, i h, i| + |hy, i h, i| < 2 .

Par (69) il resulte




x + y
x+y



2 h 2 , i h, i 2 > 1 = 1 (/4).

286

CHAPITRE VII

(13 juin 2010)

Par definition du module duniforme convexite, on en deduit que kx yk /2. En


particulier, grace `a (72),

|h, i hx, i| |h, i hy, i| + |hx y, i| < + = .
2 2
On obtient une contradiction avec (71), ce qui montre que lhypoth`ese kx k >
etait absurde.

VII-5. Convergence et compacit
e
VII-5.1. Convergences faibles et fortes : D
efinitions et propri
et
es fondamentales. Soit E un espace vectoriel norme ; la norme definit naturellement une
structure metrique sur E, donc une topologie. Par convention, on lappelle topologie forte, et on dit quune suite xn `a valeurs dans E converge fortement vers
x E si elle converge vers E au sens de la norme (kxn xk 0).
Soit alors E une forme lineaire continue sur E ; par continuite de , il est
clair que xn x. Cest cette derni`ere propriete qui est utilisee pour definir les
convergences faibles : on consid`ere les proprietes de convergence `a travers certaines
formes lineaires continues. Pour que cette notion de convergence soit acceptable, et
en particulier quil y ait unicite de la limite eventuelle, il est important que lon puisse
distinguer les points au moyen de ces formes lineaires. La notion de separabilite
lineaire, introduite dans la Definition VII-77 est alors naturelle.
D
efinition VII-104. Soient E un espace vectoriel norme, et F un sous-espace

de E qui separe E. On dit quune suite (xn ) `a valeurs dans E converge vers x E
au sens faible (E, F ) si
F,

h, xn i h, xi.
n

Remarque VII-105. Il est clair que la convergence forte implique la convergence


faible.
Remarque VII-106. Soit Fe une partie de F qui engendre un espace vectoriel
dense (dense dans F au sens de la norme duale sur E ), et soit (xn )nN une suite
`a valeurs dans E, bornee. Alors il est equivalent de dire que xn converge vers x au
sens (E, F ) ou que
e Fe,
e n x.
e

x
n

e dans lespace vectoriel


En effet, si F et > 0 est donne, on peut trouver
e
e
engendre par F avec k k , et alors, par linearite,
e n x|
e + kxn xk.
|xn x| |x

e appartient `a lespace
Le premier terme du membre de droite tend alors vers 0 car
vectoriel engendre par les elements de Fe, tandis que le deuxi`eme est majore par 2C,
o`
u C est un majorant de kxn k et kxk. Il sensuit que xn tend vers x.

Comme consequence immediate de la definition, une limite au sens faible (E, F )


est unique. Sous une hypoth`ese additionnelle de separabilite sur F , il va saverer que
les convergences faibles sont en fait metriques.

` COMPLETER

ANALYSE DE BANACH - A

287

Proposition VII-107. Soient E un espace vectoriel norme, et F un sous-espace


separable de E qui separe les points. Soit (k )k1 une suite dense dans la boule unite
de F , et soit
X |hk , y xi|
d(E,F ) (x, y) :=
.
k2
k1

Alors d(E,F ) est une distance, qui metrise la convergence faible (E, F ) sur toute
boule BR (0) E.

D
emonstration. Notons d := d(E,F ) . Tout dabord, puisque les k sont tous
de norme au plus 1, on a |hk , y xi| kxyk, et donc la serie definissant d(x, y) est
convergente. Il est clair que d(x, y) = d(y, x) et que d verifie linegalite triangulaire.
Verifions maintenant que si xn est une suite `a valeurs dans BR (0), alors
0

d(xn , x)
si et seulement si xn x pour tout F .

Il en resultera bien lequivalence entre les deux notions de convergence, et cela montrera par la meme occasion que d(x, y) = 0 implique x = y.
Dune part, si k N est fixe, on a |k (xn x)| k 2 d(xn , x), qui tend vers 0
quand n si d(xn , x) 0. Par densite, xn x pour tout dans la boule
unite de F . Si F est non nul, on peut appliquer ce resultat `a /kk, et on en
deduit que xn x, comme on le souhaitait.
Reciproquement, P
supposons que k (y x) 0 quand n . Soit > 0, et
soit K tel que (2R) kK k 2 ; pour tout k K on peut trouver Nk tel que
kk (xn x)k . On choisit alors N := sup{Nk ; k K}, et on a, pour n N,
X
d(xn , x)
+ .
k2
kK
La suite xn converge donc vers x au sens de la distance d.

Par convention, la convergence (E, E ) est appelee convergence faible sur


E, et la convergence (E , E) est appelee convergence faible-
etoile (faible-) sur

E . On distingue donc trois notions classiques de convergence :


- la convergence forte, ou normique : xn x fortement si kxn xk 0 ;
cette convergence est donc associee `a la norme ;
- la convergence faible sur E : xn x faiblement (ce que lon note parfois
xn x) si pour tout E , xn x ; d`es que E est separable, cette convergence
est associee `a une distance sur les parties bornees de E ;
- la convergence faible- sur un dual E : n au sens faible- (ce que
lon note parfois xn x) si pour tout x E, n x x ; d`es que E est separable,
cette convergence est associee `a une distance sur les parties bornees de E .
Cette restriction `a des parties bornees nest pas genante ; il existe deux bonnes
raisons pour ne pas considerer lespace tout entier. La premi`ere est que, sous une
hypoth`ese de completude, les suites faiblement convergentes sont automatiquement
bornees ; la seconde est quil ny a pas, en general, de distance associee `a la convergence faible sur lespace E tout entier. Cest le contenu de la proposition suivante.
Proposition VII-108. Soit E un espace vectoriel norme.
(i) Si E est complet, toute suite de E convergeant au sens faible- est automatiquement bornee ;

288

CHAPITRE VII

(13 juin 2010)

(ii) Si E est separable, toute suite de E convergeant au sens faible est automatiquement bornee ;
(iii) Dans ce cas, soit la convergence faible- (resp. faible) equivaut `a la convergence forte, soit elle nest associee `a aucune distance.
Remarque VII-109. La convergence faible est equivalente `a la convergence
forte en dimension finie (pour le voir, il suffit de considerer les formes lineaires
coordonnees), mais egalement dans un espace tel que 1 (N) (cest une consequence
du Theor`eme de Schur ci-dessous). Mais dans la grande majorite des cas, cest la
deuxi`eme possibilite qui prevaut dans lenonce (ii) : la convergence faible nest associee `a aucune distance.
D
emonstration. 1. Considerons dabord une suite (n )nN dans E , convergeant au sens faible- vers . On suppose E complet. Alors, par le Theor`eme de
BanachSteinhaus, la famille des n est bornee.
2. Soit maintenant (xn ) une suite convergeant au sens faible dans E. Pour tout
E , lensemble {xn }nN est donc borne. En identifiant les xn `a des elements de
E , on peut appliquer le theor`eme de BanachSteinhaus dans E (qui est toujours
complet) pour conclure `a lexistence dune constante C telle que
sup sup |xn | Ckk.
nN E

Si xn est non nul, on peut le normaliser par une forme lineaire n de norme 1 (cest
ici quintervient lhypoth`ese de separabilite, via le Theor`eme ??), do`
u
kxn k = kn xn k Ckn k = C.
La suite (xn ) est donc bien bornee.
3. Dans la suite on consid`ere par exemple la convergence faible ; le meme raisonnement fonctionnerait avec la convergence faible-. Supposons que la convergence faible
nequivaut pas `a la convergence forte ; on peut donc trouver une suite xn qui converge
faiblement vers x, avec lim sup kxn xk > 0. Quitte `a extraire une sous-suite, on
peut donc supposer que kxn xk > 0 ; on pose alors yn := (xn x)/kxn xk,
de sorte que kyn k = 1, et pour tout E ,
|yn | 1 |xn x| 0.
n

La suite yn est donc une suite normee qui converge faiblement vers 0.
Soit maintenant, pour m, n entiers non nuls, um,n := xm +mxn , et A := {um,n ; m, n
1}. Bien s
ur kum,n k m1 ; si um,n converge vers un element v, on a donc forcement
m borne, et quitte `a extraire une sous-suite on peut supposer que m est constant.
Alors, soit n est borne, et quitte `a extraire une sous-suite on peut supposer que n est
constant ; soit n est non borne, et quitte `a extraire une sous-suite on peut supposer
que n . Dans le premier cas, v = um,n , dans le deuxi`eme cas v = xm . Lensemble
lim A de toutes les limites de suites delements de A est donc exactement constitue
de A et des xm . Si la convergence faible etait associee `a une distance, lensemble
lim A serait ladherence A de A pour cette distance, et en particulier il serait ferme
au sens faible ; mais ce nest pas le cas puisque la suite xm converge faiblement vers 0,
qui nappartient pas `a lim A.

Voici une consequence simple des resultats precedents :

` COMPLETER

ANALYSE DE BANACH - A

289

Proposition VII-110. Soit E un espace complet, on suppose que n au


sens faible- dans E et xn x dans E ; alors
n xn x.

La meme conclusion reste vraie si E est separable, n au sens fort dans E


et xn x au sens faible dans E.
D
emonstration. Traitons le premier cas, le deuxi`eme se demontrant de meme.
Comme E est complet, on sait que n est bornee : il existe C tel que sup kn k C.
On a alors
|n xn x| = |n (xn x)+(n )x| |n (xn x)|+|(n )x| Ckxn xk+|(n xx)|.
On conclut en notant que, par hypoth`ese, kxn xk 0, et n x x.

Remarque VII-111 (topologies). Les convergences faibles ne sont pas toujours


associees `a des distances, mais elles sont toujours associees `a des topologies. Si E est
un espace vectoriel norme, et F un sous-espace de E , on definit la topologie faible
(E, F ) comme la topologie la plus grossi`ere qui rende continus tous les elements de
F . Les ouverts de (E, F ) peuvent se decrire ainsi : ce sont les unions (quelconques)
dintersections finies densembles de la forme 1 (], +[) ( F , R). La
topologie (E, E ) est aussi appelee topologie faible et parfois notee w E [le w
signifiant weak] ; alors que la topologie (E , E) est appelee topologie faible-, et
parfois notee w E.
Si E est de dimension finie, la topologie faible concide avec la topologie forte.
En revanche, si E est de dimension infinie, elle est strictement plus grossi`ere que la
topologie forte : en effet, on peut montrer [Brezis, p.37] que ladherence de la sph`ere
unite (kxk = 1) est la boule unite fermee enti`ere (kxk 1), et que la boule unite
ouverte (kxk < 1) nest jamais ouverte. Cela traduit le fait que les voisinages de la
topologie faible sont extremement grossiers : ils ne tiennent compte que dun nombre
fini de formes lineaires (un nombre fini de coordonnees). Cela nest pas contradictoire
avec le fait que la convergence faible concide parfois avec la topologie forte : cela
montre seulement que les topologies faibles et faible- ne sont jamais metrisables en
dimension infinie.
Lapproche topologique est developpee dans de nombreux ouvrages tels que
[Brezis] ; cependant, cest bien la notion de convergence faible qui sert en pratique.
Dans le meme ordre didees, cest la notion de compacite faible sequentielle qui est
utile, bien plus que la notion de compacite faible abstraite.
VII-5.2. Convergence faible et forte dans les espaces classiques. Apr`es
avoir defini des concepts generaux, nous allons les mettre en oeuvre sur les espaces
de Lebesgue et les espaces de mesures.
Soit (X, ) un espace mesure -fini.
- Dire que fn converge
faiblementR vers f dans L1 (X, ), cest dire que pour tout
R
g L (X, ), on a fn g d f g d. Cette notion de convergence nest en
general associee `a aucune metrique, comme le montre lExercice VII-135 ci-dessous.
- Pour 1 < p < , dire que fn converge f au sens faible, ou
R au sens faible-
R etoile,
p
p
dans L (X, ), cest dire que pour tout g L (X, ) on a fn g d f g d.
Si X est un espace metrique separable et une mesure de Borel, cette notion de

290

CHAPITRE VII

(13 juin 2010)

convergence est associee `a une famille de metriques definies sur les boules de Lp . (En
effet, la separabilite de E = Lp garantit que les suites convergentes sont bornees ;

et la separabilite de E = Lp garantit que la convergence faible est metrisable sur les


parties bornees.)
- Dire que fn converge au sens
faible-etoile
vers f dans L (X, ), cest dire que
R
R
pour tout g L1 (X, ) on a fn g d f g d. Si X est un espace metrique
separable et une mesure de Borel, cette notion de convergence est associee `a une
metrique. (En effet, la completude de L1 garantit que les suites convergeant au sens
faible- dans L sont bornees ; et la separabilite de L1 garantit que la convergence
faible- est metrisable sur les parties bornees.)
- Nous navons rencontre aucun espace dont L1 soit le dual (en fait il est impossible de demontrer lexistence dun tel espace, qui dailleurs serait necessairement
non separable) ; il ny a donc pas lieu de parler de convergence faible-etoile dans L1 .
Quant `a la convergence faible dans L , en pratique elle nest jamais utilisee.
- Supposons maintenant que X est localement compact ; alors, par le Theor`eme
de Riesz on sait que lespace M(X) des mesures de Radon finies sidentifie au dual
de C0 (X). Alors, dire quune famille de mesures n converge au sens faible- vers ,
cest dire que pour tout f C0 (X) on a
Z
Z
f dn f d.

Si X est en outre -compact, on sait par le Theor`eme VII-36(ii) que C0 (X) est
separable, et la convergence faible- est une convergence metrique.
- En theorie des probabilites, on utilise couramment une autre notion de convergence faible, qui ne rentre pas dans la liste precedente : Soit (X, ) un espace
meRtrique, on dit
R que n converge faiblement vers si pour tout f Cb (X) on
a f dn f d. Il sagit donc de la convergence (M(X), Cb (X)), quen pratique on applique `a des suites de mesures de probabilites. Malgre la similitude des
notations, il ne faut pas sy meprendre : ce nest pas une convergence faible au sens
o`
u lespace Cb (X) nest pas en general le dual de M(X) (toute fonction bornee, non
necessairement continue, appartient `a cet espace dual). Cette notion est acceptable
au sens o`
u lespace Cb (X) separe M(X) dapr`es lExemple VII-82. Comme lespace
Cb (X) nest en general pas separable, il nest pas clair a priori que cette notion
de convergence soit metrique ; cest pourtant le cas, et dailleurs il existe quantite
de distances naturelles sur lespace des mesures de probabilite, qui metrisent la
convergence faible des mesures. Nous en reparlerons dans le paragraphe VII-5.7.
Il y a certaines implications entre ces differentes notions :
Proposition VII-112. (i) Soit (X, ) un espace de mesure finie. Alors la convergence faible dans Lp (faible-etoile pour p = ) implique la convergence faible dans
Lq d`es que p q.
(ii) Soit (X, ) un espace denombrable tel que [{x}] > 0 pour tout x. Alors
la convergence faible dans Lp implique la convergence faible dans Lq (faible-etoile
pour q = ) d`es que p q.
(iii) Soit (X, ) un espace mesure. Si fn converge faiblement dans L1 vers f ,
alors fn converge vers f faiblement, o`
u cette convergence est `a comprendre au
sens faible-etoile si X est localement compact, ou au sens faible si X est metrique.

` COMPLETER

ANALYSE DE BANACH - A

291

Si X est une espace metrique localement compact, la convergence faible au sens des
mesures implique la convergence faible-etoile au sens des mesures.
D
emonstration. Les parties (i) et (ii) de ce theor`eme sont des consequences
directes des relations dembotement entre espaces de Lebesgue, decrites dans les
Theor`emes VI-25 et VI-26. La partie (iii) decoule des inclusions C0 (X) Cb (X)
L (X).

Exemples VII-113. On se place maintenant en dimension 1, avec la mesure de
Lebesgue comme mesure de reference. Il est assez facile de se representer des suites
convergeant fortement dans Lp : par exemple, si p [1, +[ et (fn ) est une suite
de fonctions convergeant presque partout vers f , dominee par une fonction fixee
dans Lp , alors fn converge fortement vers f . Quels sont les exemples typiques de
convergence faible non forte ?
- On consid`ere les fonctions fn (x) = sin(2nx) sur [0, 1]. Cette suite de fonctions
est bien s
ur bornee uniformement,R donc dans tous les espaces Lp . Pour tout intervalle
b
[a, b], il est facile de verifier que a fn (x) dx 0 quand n . Comme lespace

vectoriel engendre par les fonctions indicatrices est dense dans Lp pour tout p
[1, +[, i.e. p ]1, +], on en deduit en appliquant la Remarque VII-106 que fn
converge faiblement vers 0 dans Lp faible pour 1 < p < , et dans L faible-etoile.
Comme lespace [0, 1] est de mesure finie, la convergence Lp faible (p 1) implique
quil y a egalement convergence dans L1 faible. Si designe la mesure de Lebesgue
sur R, on a donc egalement convergence de fn vers 0 aux sens faible et faible-etoile
des mesures sur [0, 1].
- On consid`ere les fonctions fn (x) = 1[n,n+1]. Cette suite est encore bornee dans
tous les espaces Lp . Un raisonnement similaire `a largument precedent montre que
fn converge vers 0 dans Lp faible pour 1 p < ,R et dans L faible-
R etoile. En
1
revanche, elle ne converge pas dans L faible, puisque fn = 1 6= 0 = 0. La famille
fn converge vers 0 au sens faible-etoile des mesures, mais pas au sens faible (comme
on le voit encore en integrant la fonction constante 1, qui nappartient pas `a C0 (R)
mais appartient `a Cb (R)).
- On consid`ere la suite de fonctions fn (x) = 2n1[n1,n1 ] (n 1). Alors la
famille fn est bornee dans L1 ([0, 1]), mais dans aucun autre espace de Lebesgue.
Son integrale contre la fonction indicatrice 1[a,b] tend vers 0 si 0
/ [a, b]. Une limite
1
eventuelle dans L faible devrait donc etre nulle presque partout
en-dehors de 0,
R
donc nulle presque partout. Mais cela est impossible puisque fn = 1. On en deduit
que fn ne converge pas dans L1 faible. En revanche, fn converge aux sens faible et
faible-etoile des mesures vers la masse de Dirac .
- On consid`ere la suite de fonctions fn (x) = 2n1 1[n,n] sur R (n 1). La famille
fn est bornee dans tous les espaces Lp pour p 1, et son integrale sur tout intervalle
[a, b] tend vers 0. On en deduit, comme plus haut, que fn converge vers 0 dans Lp
faible pour tout p > 1 (faible-etoile pour p = ). Il est egalement facile de verifier
que fn converge au sens faible-etoile, mais pas au sens faible dans lespace des
mesures.
- La famille de fonctions fn (x) = 1[n,n] converge dans L au sens faible-etoile
vers la fonction constante 1.
- Soit, dans R, une suite xn convergeant vers x. Alors la famille xn converge vers
x au sens faible (et donc faible-etoile).

292

CHAPITRE VII

(13 juin 2010)

P
- La famille de mesures 1kn k/n converge au sens faible vers la mesure de
Lebesgue sur [0, 1]. En fait, nimporte quelle mesure de probabilite sur B(R) peut
etre approchee au sens faible par une combinaison convexe de masses de Dirac :
on peut le voir comme une consequence du Theor`eme de KreinMilman, que nous
rencontrerons plus tard.
- Tous ces exemples admettent des generalisations faciles aux dimensions superieures.
On peut dailleurs construire de nombreux exemples par tensorisation : en utilisant,

pour 1 < p , lidentite Lp (Rn+m ) = Lp (Rn ) Lp (Rm ) (Cf. Theor`eme VI-20)


on verifie que si les suites fk et gk convergent faiblement vers f et g respectivement
dans Lp (Rn ) et Lp (Rm ), alors fk gk converge faiblement dans Lp (Rn+m ) vers f g.
Il sagit l`a dun cas particulier de theor`emes plus generaux que nous mentionnerons
apr`es avoir etudie quelques crit`eres de compacite faible.
Remarque VII-114. Lespace Rn est muni dune structure differentiable, et on
peut considerer dautres classes de fonctions-test (cest-`a-dire les fonctions contre
lesquelles on int`egre pour definir la convergence faible) que les classes de fonctions Lp
ou les fonctions continues : par exemples, les fonctions contin
ument differentiable, ou
k fois contin
ument differentiables, etc. En th
eorie des distributions, on consid`ere
la classe test tr`es restreinte des fonctions infiniment derivables `a support compact
pour definir la convergence au sens des distributions. Toutes les convergences que
nous avons rencontre jusqu`a present sont plus fortes que la convergence au sens des
distributions.
VII-5.3. Compacit
e faible et forte.
D
efinition VII-115. Soit E un espace vectoriel norme, et F une partie de E
qui separe E. On dit que C E est sequentiellement (E, F )-compact si de toute
suite `a valeurs dans C on peut extraire une sous-suite qui converge dans C au sens
faible (E, F ).
On dit que C E est relativement sequentiellement (E, F )-compact si de toute
suite `a valeurs dans C on peut extraire une sous-suite qui converge dans E au sens
faible (E, F ).
Convention VII-116. Pour alleger les notations, on remplacera, en sinspirant
de la terminologie anglo-saxonne, relativement sequentiellement compact par pr
ecompact ; et on precisera pr
ecompact faible (ou w-precompact) si la topologie
consideree est la topologie faible, et pr
ecompact faible-
etoile (ou w-precompact)
si cest la topologie faible-etoile.
Remarque VII-117. Pour une topologie non metrique, les notions de compacite
sequentielle et de compacite ne concident pas forcement. Cependant, en pratique
cest (quasiment toujours) la compacite sequentielle qui est utile, et cest donc la
seule notion qui sera developpee ici.
Nous avons rencontre de nombreux exemples o`
u une suite bornee xn converge
faiblement vers une limite x sans converger fortement ; et meme sans quaucune suite

extraite ne converge fortement. Etre


borne nest donc pas en general une condition
suffisante pour la compacite relative. Le th
eor`
eme de non-compacit
e de Riesz
assure que cest la r`egle en dimension infinie.
Th
eor`
eme VII-118 (non-compacite en dimension infinie). Dans un espace vectoriel norme de dimension infinie, les boules fermees ne sont pas compactes.

` COMPLETER

ANALYSE DE BANACH - A

293

D
emonstration. Soit E un espace vectoriel norme de dimension infinie (cest`a-dire qui nest pas de dimension finie). Nous allons construire par recurrence une
suite (xn )nN de vecteurs de norme 1, tels que kxn xm k 1/2 pour tous m 6= n ;
il sensuivra que (xn ) nadmet aucune sous-suite extraite convergente.
Supposons donc x1 , . . . , xn construits ; on note Fn lespace vectoriel engendre par
ces vecteurs. Puisque E nest pas de dimension finie, il existe y
/ Fn . Comme Fn est
ferme, la distance de y `a Fn est atteinte : il existe ye Fn tel que ky yek ky zk
pour tout z Fn ; ye est bien s
ur distinct de y. On pose alors xn+1 := (y ye)/ky yek.
Alors, pour tout x Fn on a ye + ky yekx Fn , donc


y ye ky yekx
kxn+1 xk =
1.
ky yek


En fait, en dimension infinie, il ny a pas vraiment de crit`eres generaux pour


garantir la precompacite, que ce soit pour la topologie forte ou pour la topologie
faible ; `a lexception notable de la precompacite faible-etoile dans le dual dun espace
separable. Dans les deux sous-sections suivantes, on recensera les quelques crit`eres
qui sont utilises en pratique.
Un concept souvent utilise par commodite est celui dinjection compacte. Rape N)
e sinjecte contin
pelons quun espace vectoriel norme (E,
ument dans un espace
e ; les parties
vectoriel norme (E, N) sil existe une constante C telle que N C N
e sont alors bornees dans E. On dit que linjection est compacte si les
bornees de E
e sont non seulement bornees, mais en outre precompactes dans
parties bornees de E
E. On notera bien quun espace peut sinjecter `a la fois compactement et densement
dans un autre.
Pour obtenir des resultats de precompacite, on utilise souvent le crit`ere qui suit,
dont la demonstration est laissee en exercice :
Proposition VII-119. Soit A un sous-ensemble dun espace metrique (E, d).
On suppose que pour tout x A il existe une famille Rn (x) (n N) `a valeurs dans
E, telle que
(i) sup d(x, Rn (x)) [n ]0 ;
xA

(ii) pour tout n N, An := {Rn (x), x A} est precompact dans E.


Alors A est precompact.
VII-5.4. Crit`
eres de pr
ecompacit
e forte. Le plus cel`ebre des crit`eres de
precompacite forte est le th
eor`
eme dAscoli, qui sapplique aux espaces de fonctions continues. Il sera naturel pour nous de lenoncer pour lespace C0 (X), o`
uX
est localement compact.
or`
The
eme VII-120 (theor`eme de compacite dAscoli). Soit (X, d) un espace
metrique localement compact, -compact. Alors, une partie A de C0 (X) est precompacte
si et seulement si
(i) Pour tout x X, lensemble {f (x); f A} est borne ;
(ii) A tend vers 0 uniformement `a linfini : pour tout > 0 il existe un compact
K tel que pour tous f A, x X,
x
/ K =

|f (x)| .

294

CHAPITRE VII

(13 juin 2010)

(iii) A est localement equicontinu : pour tout compact K et pour tout > 0 il
existe > 0 tel que pour tous f A, x, y K,
d(x, y) =

|f (x) f (y)| .

En outre, dans cet enonce on peut remplacer les hypoth`eses (i) et (iii) par les
hypoth`eses apparemment plus fortes
(i) supf A kf k < + ;
(iii) A est (globalement) equicontinu :pour tout > 0 il existe > 0 tel que pour
tous f A, x, y K,
d(x, y) =

|f (x) f (y)| .

Remarques VII-121. Lhypoth`ese (ii) est bien s


ur vide si X est compact. Quant
`a lhypoth`ese (iii), on peut la reformuler en disant que A admet un module de
continuit
e uniforme : il existe une fonction m : R+ R+ , croissante, m() 0
quand 0, telle que pour tout f A,
d(x, y) =

|f (x) f (y)| .

Toute fonction continue admet un module de continuite, limportant est quil existe
un module commun pour tous les elements de A. Notons enfin quil existe des versions
plus generales o`
u lespace darrivee est par exemple un espace metrique localement
compact.
D
emonstration du Th
eor`
eme VII-120. 1. Il est clair que la condition (i)
(et donc la condition (i) aussi) est necessaire : un ensemble precompact dans C(X)
est dadherence compacte, donc borne.
3. Supposons A precompact et montrons par labsurde que (ii) est verifie. Si ce
nest pas le cas, il existe > 0 fixe, tel que pour tout compact K on puisse trouver
f A et x
/ K avec |f (x)| . Soit (Kn ) une suite exhaustive de compacts ;
par recurrence on peut construire une suite (fn )nN `a valeur dans A, et une suite
(xn )nN , `a valeurs dans X, telle que xn
/ Kn et |fn (xn )| . Supposons que (fn )
admette une suite extraite convergeant vers f C0 (X). Il existe un compact K
tel que |f (x)| /2 pour tout x en-dehors de K. Comme K est compact et quil
est recouvert par lunion des ensembles ouverts croissants Int(Kn ), il existe un rang
fini N tel que K KN . Pour tout n N, lelement xn nappartient donc pas `a
K, do`
u |f (xn )| /2, et par consequent |fn (xn ) f (xn )| /2. Cela contredit
la convergence uniforme dune sous-suite de (fn ) vers f . La condition (ii) est donc
necessaire.
4. Supposons maintenant que la condition (iii) nest pas verifiee. Il existe donc
> 0 fixe tel que pour tout k N on puisse trouver une fonction fk et des elements
xk , yk avec d(xk , yk ) 1/k et |fk (xk ) fk (yk )| . Grace `a la condition (ii), il existe
un compact K tel que |f (x)| /2 pour tout x
/ K ; en particulier, xk et yk ne
peuvent appartenir tous deux `a K, et on pourra sans perte de generalite supposer
que xk K. Quitte `a extraire une sous-suite, on peut supposer que xk converge vers
un certain x K ; alors yk converge aussi vers x. Soit f une valeur dadherence de la
suite fk ; quitte `a extraire encore, on peut supposer que fk converge uniformement
vers f ; en outre, f est continue, donc f (xk ) et f (yk ) convergent vers la meme limite

` COMPLETER

ANALYSE DE BANACH - A

295

f (x). Pour k assez grand on a donc |fk (xk ) f (xk )| < /3, |fk (yk ) f (yk )| < /3
et |f (xk ) f (yk )| < /3 ; ce qui est en contradiction avec |fk (xk ) fk (yk )| .
5. Montrons finalement que les conditions (i) `a (iii) impliquent la precompacite.
Soit (fn )nN une suite `a valeurs dans A. Puisque X est union denombrable de compacts, il est separable ; soit donc (xk )kN une suite dense dans X. La suite fn (x1 ) est
bornee ; donc, quitte `a extraire une sous-suite de (fn ), on peut supposer que fn (x1 )
converge dans X. Quitte `a extraire `a nouveau, on peut supposer que fn (x2 ) converge
aussi, etc. Par un procede dextraction diagonale, on peut supposer que pour tout
k, la suite fn (xk ) converge vers un certain yk . On pose f (xk ) = yk , ce qui definit une
fonction f sur Z = {xk }kN . En passant `a la limite dans la condition (iii), on voit
que f est localement uniformement continue sur Z ; comme Z est dense, f admet un
unique prolongement par continuite `a toute partie K de X ; en utilisant une suite
exhaustive de compacts on peut donc prolonger f `a X tout entier en une fonction
continue, que lon note encore f . En passant `a la limite dans la condition (ii), on
voit que f tend vers 0 `a linfini. Il reste `a montrer que la convergence est uniforme.
Pour tout > 0, il existe un compact K tel que |f (x)| /2 et |fn (x)| /2 pour
tout x
/ K et pour tout n. Pour prouver que la convergence est uniforme, il suffit
donc de prouver quelle est uniforme sur tout compact.
6. Soient donc K un compact, et > 0. Il existe > 0 tel que |fn (x) fn (y)|
et |f (x) f (y)| d`es que d(x, y) . On recouvre K par un nombre fini de boules
B (xk ). Comme fn converge simplement vers f et que les xk sont en nombre fini, il
existe N tel que pour tout n N, |fn (xk ) f (xk )| . Pour tout x X, on peut
trouver k tel que d(xk , x) , et alors on a |fn (xk ) f (xk )| , |fn (xk ) fn (x)|
et |f (xk ) f (x)| , do`
u |fn (x) f (x)| 3, ce qui prouve la convergence
uniforme.

Exemples VII-122.
(i) Soient K un espace metrique compact, L > 0 et
x0 K, et soit A := LipL;x0 (K) lensemble des fonctions L-Lipschitziennes
f sur K, telles que f (x0 ) = 0. Alors cet ensemble est compact dans C(K).
En effet, il est facile de verifier quil est ferme ; pour tous x K et f A
on a |f (x)| Ld(x, x0 ), de sorte que la condition (i) du crit`ere dAscoli est
satisfaite ; et le module de continuite m() = L convient `a tous les elements de
A. En fait, si lon definit Lipx0 (K) comme lespace des fonctions Lipschitziennes
sannulant en x0 , on peut en faire un espace vectoriel norme en le munissant
de la norme
|f (y) f (x)|
kf kLip := sup
,
d(x, y)
x6=y
et le resultat precedent sinterpr`ete en disant que linjection de Lipx0 (K) dans
C(K) est compacte. De meme, si lon munit lespace des fonctions Lipschitziennes Lip(K) de la norme
kf kBL := kf k + kf kLip,
alors linjection de Lip(K) dans C(K) est compacte.
(ii) Pour tout ]0, 1[, lespace C (K) des fonctions -Holderiennes, muni de
la norme
|f (y) f (x)|
kf kC (K) := kf k + sup
d(x, y)
x6=y

296

CHAPITRE VII

(13 juin 2010)

sinjecte compactement dans C(K). Plus generalement, si on se donne une


fonction m continue de R+ dans R+ , strictement croissante pr`es de 0, la norme
|f (y) f (x)|
kf kCm (K) := kf k + sup
x6=y m(d(x, y))
definit un sous-espace vectoriel norme complet, qui sinjecte compactement
dans C(K).
(iii) Terminons avec un exemple non compact. Soient ]0, 1[ et > 0. Dans
C0 (Rn ), la norme
|f (y) f (x)|
sup |f (x)|(1 + |x| ) + sup
|y x|
x6=y
xRn
definit un sous-espace vectoriel norme complet, qui sinjecte compactement
dans C0 (Rn ).

Il nexiste pas danalogue naturel du theor`eme dAscoli pour des espaces Lp .


La condition suffisante qui suit couvre cependant de nombreux cas interessants.
Comme le crit`ere dAscoli, elle contient trois conditions : une borne globale, une
condition de decroissance `a linfini, et une condition de regularite locale. En
fait, sa demonstration se ram`ene au crit`ere dAscoli.
or`
The
eme VII-123 (condition suffisante de precompacite dans Lp ). Soient (X, d)
un espace metrique localement compact, -compact, et une mesure borelienne doublante, finie sur les compacts de X, et soit p [1, +[. Soit F un sous-ensemble de
Lp (X, ) tel que
(i) F est borne dans Lp ;
(ii) Pour tout > 0 il existe un compact K de X telle que
Z
|f |p d .
sup
f F

que

(iii) Pour tout compact K X il existe une fonction positive croissante, telle

(73)
et

X\K

lim

Z Z

()
inf xK [B (x)]

= 0,

|f (x) f (y)|p
d(x) d(y) < +.
(d(x, y))
f F K K
Alors F est precompact dans Lp (X, ).
sup

D
emonstration. 1. Supposons lenonce demontre dans le cas o`
u X est compact. Soit alors (fn ) une suite `a valeurs dans F . On introduit une suite exhaustive
(Kj )jN de compacts dans X, et on definit j = 1Kj , la restriction de `a Kj .
Quitte `a extraire une sous-suite, on peut supposer que fn converge dans Lp (j ) vers
une fonction f j Lp (j ), et quitte `a extraire encore on peut supposer que cette
convergence a lieu presque partout. Par une extraction diagonale, on peut supposer
que fn converge presque partout vers une fonction mesurable f , qui appartient `a
dans tous les Lp (j ). Par le lemme de Fatou et lhypoth`ese (i),
Z
Z
p
|f | d lim inf |fn |p d;
n

` COMPLETER

ANALYSE DE BANACH - A

297

il sensuit que f Lp (X, ). En particulier, si > 0 est donne, pour j assez grand
on a
Z
|f |p d .
X\Kj

Lensemble K de lhypoth`ese (ii) est recouvert par lunion croissante des ouverts
Oj := Int(Kj ) ; il est donc inclus dans Kj pour j assez grand. On a alors
Z
|fn |p d .
sup
nN

X\Kj

Il sensuit que, pour j assez grand,


Z
sup
nN

X\Kj

|fn f |p d 2;

j etant maintenant fixe, on sait que pour n assez grand on a


Z
|fn f |p d .
Kj

On conclut que fn converge bien vers f dans Lp . Il suffit donc de prouver lenonce
dans le cas o`
u X est compact.
2. On suppose maintenant X compact ; est alors finie par hypoth`ese ; en particulier C(X) sinjecte contin
ument dans Lp (X).
Nous allons r
egulariser les elements de F comme suit. Soit : R+ R+
definie par (r) = 1 pour r 1/2, (r) = 0 pour r 1, affine entre 1/2 et 1 (les
details de importent peu, tout ce qui compte cest quelle soit `a support compact
et identiquement egale `a 1 pr`es de 0). Pour ]0, 1[ ( petit) et f dans F , on definit
Z

f (x) :=
f (y) dx(y),
X

o`
u

est la probabilite definie par

d(x,y)

(dy)

.
d(x,y )
)
(dy

x (dy) = R

La valeur de f (x) a donc ete obtenue par une moyenne des valeurs f (y) dans laquelle
seuls comptent les y qui sont proches de x (au sens o`
u la distance est au plus ).
On pose alors F := {f }0<<1 . Nous allons voir que (a) kf f kLp 0 quand
0, uniformement en f F ; et (b) pour tout > 0, F est precompact dans
C0 (X), et donc dans Lp (X). La conclusion en decoulera grace `a la Proposition VII119.
3. Montrons maintenant la propriete (a). On fixe > 0 ; on va montrer que
lensemble F est borne et uniformement Lipschitz, et donc precompact dans C(X)
grace au theor`eme dAscoli. On supposera bien s
ur que [X] > 0, sans quoi il ny a
rien `a demontrer.
Puisque (r) est uniformement egale `a 1 pour r 1/2, on a


Z
Z
d(x, y)
(x) :=

d(y)
1d(x,y)/2 d(y) = [B/2 (x)].

X
X

298

CHAPITRE VII

(13 juin 2010)

Etant
compact, X est borne ; soit D son diam`etre. Pour tout x X, on peut inclure
X dans BD (x). Soit N tel que 2N (/2) D, et C tel que soit C-doublante. On a
alors
0 < [X] = [BD (x)] C N [B/2(x) ],

ce qui montre que [B/2(x) ] est minore par une constante positive independante de
x, et donc il en est de meme de la fonction . On ecrit alors, en utilisant linegalite
de Holder,
R
11/p
|f (y)| d(y) kf k1/p

Lp [X]
|f (x)|

,
(x)
inf

ce qui est uniformement borne grace `a lhypoth`ese (i). Lensemble F est donc bien
uniformement borne.
4. Montrons maintenant que la fonction est Lipschitzienne. Pour cela on note
que la fonction elle-meme est 2-Lipschitzienne, do`
u
Z  






d(x, y)
d(x , y)

|(x) (x )| =

d(y)




Z 


d(x, y)
d(x , y)

d(y)

Z
2
|d(x, y) d(x , y)| d(y)



Z
2[X]
2

d(x, x ) d(y) =
d(x, x ).

Par le meme raisonnement, et linegalite de Holder, on montre que


!
Z





Z
1/p

11/p


d(x,
y)
d(x
,
y)
2kf
k
[X]
Lp

f (y) d(y)

f (y) d(y)
d(x, x ).

Il sensuit que f est le quotient de deux fonctions Lipschitziennes, le denominateur


etant minore par une constante strictement positive ; elle est donc Lipschitzienne.
Toutes ces bornes sont uniformes en f F , lensemble F est donc uniformement
Lipschitz. (Bien s
ur, la constante de Lipschitz tend vers linfini quand 0, ce qui
etait previsible car lensemble F lui-meme nest pas a priori Lipschitz.

5. Etablissons
finalement la propriete (b). Dapr`es (iii), il existe une constante C
telle que pour tout f F ,
Z Z
|f (x) f (y)|p
d(x) d(y) C.
(d(x, y))
X X
En particulier, puisque 0 1,


Z Z
|f (x) f (y)|p
d(x, y)
C.
d(x) d(y)
(d(x, y))

X X

Puisque (r) est nul pour r 1, seuls comptent dans lintegrale precedente les (x, y)
tels que d(x, y) , ce qui implique (d(x, y)) (). On a donc


Z Z
d(x, y)
1
p
|f (x) f (y)|
d(y) d(x) C;
() X X

` COMPLETER

ANALYSE DE BANACH - A

299

R
en divisant par (d(x, y )/) d(y ) on en deduit
Z Z
C
1


|f (x) f (y)|p dx (y) d(x) sup R
.
)
d(x,y
() X X
)
xX
d(y

Comme (r) est identiquement egale `a 1 pour r 1/2, et que est doublante, il
existe K > 0 tel que


Z
d(x, y )

d(y ) [B/2 (x)] K[B (x)].

En combinant cela `a linegalite de Jensen (appliquee `a la fonction convexe | |p et `a


la mesure de probabilite x , pour x fixe, on trouve
Z
Z Z

p
|f (x) f (x)| d(x)
|f (x) f (y)|p dx (y) d(x)
X

sup
x

Ceci conclut la preuve du theor`eme.

C()
0.
K[B (x)] 0

Exemples VII-124.
(i) Soient O un ouvert Lipschitz de Rn , p [1, +[
et s ]0, 1[ ; on definit lespace de Sobolev fractionnaire W s,p (O) comme
lespace des fonctions Lp (O) telles que
Z Z
1/p
|f (x) f (y)|p
kf kW s,p (O) := kf kLp (O) +
dx dy
< +.
|x y|n+sp
O O

La fonction k kW s,p (O) est alors une norme sur W s,p(O), et lespace ainsi defini
sinjecte compactement dans Lp (O) d`es que O est borne. Pour le voir, on
applique le Theor`eme VII-123 avec lespace compact X = O et la fonction
() = n+sp . On note que lhypoth`ese de regularite Lipschitzienne sur O implique lexistence dune constante K telle que le volume de la boule de rayon
dans O soit minore par K n ; si cet ouvert comportait une pointe tr`es fine, les boules de rayon centrees en la pointe pourraient avoir un volume
beaucoup trop petit.
Les espaces de Sobolev fractionnaires jouent un role important en analyse
moderne ; leur definition peut sembler compliquee, mais elle est en fait assez
naturelle.
(ii) Si M est une variete Riemannienne compacte reguli`ere, on definit lespace
de Sobolev fractionnaire W s,p (M) par la meme formule, en remplacant simplement |x y| par d(x, y), o`
u d est la distance geodesique. Cet espace sinjecte
p
compactement dans L (M).
(iii) Voici finalement un exemple dans le cas o`
u X est non compact : le sousespace de L1 (Rn ) defini par la norme
Z
Z Z
|f (x) f (y)|

 dx dy
|f (x)|(1 + log(1 + |x|)) dx +
Rn
Rn Rn |x y|n log 1 + 1
|xy|
sinjecte compactement dans L1 (Rn ). En effet, si cette norme est bornee par C,
linegalite de Chebyshev garantit que lintegrale de |f | sur le complementaire
de la boule de rayon R est majoree par C/ log(1 + R), qui tend vers 0 quand
R .

300

CHAPITRE VII

(13 juin 2010)

On conclut ce paragraphe avec une variante du crit`ere precedent : le crit`ere de


Riesz-Fr
echet-Kolmogorov, qui est une condition necessaire et suffisante dans le
cas o`
u X est un ouvert de Rn , muni de la mesure de Lebesgue. Ce crit`ere est base
sur linvariance de la mesure de Lebesgue par translation ; en fait il reste valable
dans un cadre plus general que nous etudierons au Chapitre ??, celui des groupes
topologiques localement compacts munis dune mesure finie sur les compacts et
invariante par translation, i.e. une mesure de Haar. Par exemple, on peut remplacer
dans lenonce qui suit lespace Rn par le tore Tn (muni de la mesure de Lebesgue
sur le tore).
Th
eor`
eme VII-125 (Theor`eme de Riesz-Frechet-Kolmogorov). Soient Rn
un ouvert, muni de la mesure de Lebesgue, et F une partie de Lp (), 1 p < .
Alors F est precompact dans Lp () si et seulement si
(i) F est borne dans Lp ;
(ii) Pour tout > 0 il existe un compact K tel que
sup kf kLp (\K ) ;
f F

(iii) Pour tout compact K de et pour tout > 0 il existe > 0 tel que
|h| =

sup kf f ( + h)kLp (K) .


f F

Remarque VII-126. Lhypoth`ese (iii) exprime le fait que les elements de F


varient peu, en norme Lp , quand on les translate dun vecteur h de petite norme.
(Par translater on entend ici remplacer f par h f , o`
u h f (x) = f (x + h).) Notons
que f ( + h) est bien defini d`es que |h| d(K, c ).
D
emonstration du Th
eor`
eme VII-125. Il est clair que la condition (i) est
necessaire ; pour montrer que la condition (ii) est necessaire, on peut utiliser un
raisonnement analogue `a celui qui a ete effectue dans la preuve du Theor`eme dAscoli.
Montrons maintenant que la condition (iii) est necessaire ; on va commencer par
letablir dans le cas o`
u F est reduit `a un singleton. Soit donc f Lp (Rn ) ; on sait
quil existe g Cc (Rn ) tel que kf gkLp . Par invariance de la mesure de
Lebesgue par translation, on a aussi
kf ( + h) g( + h)kLp = kf gkLp .

Comme g est uniformement continue et `a support compact, on a bien s


ur
lim kg g( + h)kLp = 0,

h0

et par suite
lim sup kf f ( + h)kLp lim sup kf gkLp + lim sup kg( + h) f (h )k 2.
|h|0

|h|0

|h|0

En faisant tendre vers 0, on conclut que kf f ( + h)kLp 0.


Verifions maintenant (iii) dans le cas general. Supposons que F soit precompact
et que (iii) ne soit pas verifie ; il existe alors > 0 fixe, tel que lon puisse construire
des suites hk (`a valeurs dans Rn ) et fk (`a valeurs dans F ) avec hk 0 et kfk
fk ( + hk )kLp > 0. Par precompacite, on peut supposer (quitte `a extraire une
sous-suite) que fk converge dans Lp vers f Lp . Alors, pour k assez grand on a
kfk fk ( + hk )kLp = kfk f kLp < /3 et kf f ( + hk )k < /3, ce qui contredit

` COMPLETER

ANALYSE DE BANACH - A

301

kfk fk ( + hk )kLp . On conclut que (iii) est egalement une condition necessaire.
Montrons maintenant que les conditions (i) `a (iii) sont suffisantes. La demonstration
est exactement la meme que celle du Theor`eme VII-119 : on se ram`ene `a etablir la
precompacite sur un compact K de , on effectue une r
egularisation par convolution en posant, pour x K, et f F ,
Z

f (x) =
f (y) dx (y),

|xy|

dy

;
|xy |

dy

x (y) = R

ce qui est bien defini pour suffisamment petit. On reprend alors le raisonnement
du Theor`eme VII-119, avec une difference dans lestimation de
Z Z
|f (x) f (y)|p dx (y) dx.
K

x (dy)

En effet, la mesure
secrit maintenant sous la forme (|x y|) dy, et on peut
profiter de linvariance de la mesure de Lebesgue sous leffet des translations, pour
effectuer un changement de variable h = y x (`a x fixe) ; alors dy = dh, ce qui
revient `a dire que x (dy) = (|h|) dh (dh), o`
u la mesure est fixee, et son
support est contenu dans (|h| ). Alors

Z Z
Z Z
p
p

|f (x) f (x + h)| dx (dh)


|f (x) f (y)| dx (y) dx =
K
Kh
K K

Z Z
p

|f (x) f (x + h)| dx (dh)


K
ZO
|f (x) f (x + h)|p dx,
sup
|h|

et par hypoth`ese, cette quantite tend vers 0 quand 0.

Exemple VII-127. Soit K L1 (Rn ) fixe ; on sait en particulier que kh K


KkL1 0 quand h 0. Pour tout g dans Lp (Rn ), on definit la convolution de K
et g par la formule
Z
(K g)(x) =

Rn

g(y)K(x y) dy.

Il decoule des proprietes elementaires de la convolution (que nous etudierons au


chapitre suivant, mais que le lecteur peut etablir en guise dexercice) que kK gkLp
kKkL1 kgkLp
kh (K g) K gkLp = k(h K K) gkLp kh K KkL1 kgkLp .

Il sensuit que si g varie dans un ensemble borne de Lp et B est une partie bornee
de Rn , la famille des (K g)1B satisfait au crit`ere de Riesz-Frechet-Kolmogorov,
et est donc precompacte dans Lp (B). On dit que lapplication lineaire g 7 K g,
definie de Lp (Rn ) dans Lp (B), est un op
erateur compact : il transforme les parties
bornees en parties precompactes.

302

CHAPITRE VII

(13 juin 2010)

VII-5.5. Crit`
eres de compacit
e faible. La notion de convergence faible etant
a priori beaucoup moins forte que celle de convergence en norme, on peut esperer que
la precompacite au sens faible est beaucoup moins contraignante que la precompacite
au sens fort. Cest effectivement le cas, au moins pour la topologie faible-etoile,
comme le montre le Th
eor`
eme de Banach-Alaoglu, principal resultat de compacite faible.
Th
eor`
eme VII-128 (Theor`eme de Banach-Alaoglu). Soit E un espace de Banach separable. Alors, une partie B de E est precompacte faible-etoile si et seulement si elle est bornee pour la norme de E . En particulier, les parties compactes
sont les parties bornees pour la norme, fermees pour la topologie faible-etoile.
Remarques VII-129.
(i) Si lon accepte laxiome du choix dans sa version
forte, on peut utiliser le Theor`eme de Tychonov pour eliminer lhypoth`ese de
separabilite dans le Theor`eme de Banach-Alaoglu.
(ii) Lhypoth`ese de completude sur E sert uniquement `a etablir limplication
directe : i.e. la precompacite entrane la bornitude.
En combinant le Theor`eme VII-128 avec le Theor`eme VII-36, on obtient :
Corollaire VII-130. Soit X un espace metrique separable. Alors
(i) Si est une mesure -finie reguli`ere, alors pour 1 < p , les parties

bornees de Lp (X) sont precompactes pour la topologie faible (Lp , Lp ) (faible-etoile


pour p = ) ;
(ii) Si X est en outre localement compact et -compact, alors les parties bornees
de M(X) sont precompactes pour la topologie faible-etoile (M(X), Cc (X)).
ore
`me VII-128. Tout dabord, si B nest pas bornee,
D
emonstration du The
on peut construire une suite (xn ) `a valeurs dans B, telle que kxn k n. Toute
sous-suite extraite de xn est alors non bornee, et donc non convergente dapr`es la
Proposition VII-108(i), ce qui montre que B nest pas precompact.
Reciproquement, supposont que B est borne en norme par une constante M.
Pour tout x E, la famille des h, xiB est une famille de nombres reels bornee
par Mkxk, elle admet donc une sous-suite convergente. Soit maintenant (xk )kN une
suite dense dans E. La famille h, x1 iB est bornee, elle admet donc une sous-suite
hn , x1 i qui converge vers un nombre, que lon note (x1 ). La famille des hn , x2 i
est bornee, on peut donc extraire de la suite (n ) une sous-suite, toujours notee
n , telle que hn , x2 i. qui converge vers un nombre note (x2 ). Grace `a un procede
dextraction diagonale, on construit par recurrence une sous-suite n telle que pour
tout k N, n (xk ) converge vers (xk ). La fonction est alors definie sur lensemble
S des xk , qui forme une partie dense dans E. Comme tous les n sont uniformement
Lipschitziens, la fonction est egalement Lipschitzienne sur S, et admet donc un
unique prolongement Lipschitzien `a E, toujours note ; alors, pour tout x E on
a n (x) (x). En passant `a la limite dans les relations de linearite de n , on
verifie que est bien une forme lineaire continue, qui est donc la limite faible-etoile
des n .

Le theor`eme de Banach-Alaoglu laisse en suspens les cas de deux espaces dusage
courant : lespace L1 (X), et lespace M(X) quand X nest pas localement compact.
Le premier est lobjet du Th
eor`
eme de Dunford-Pettis, base sur le concept
d
equi-int
egrabilit
e ; le second est aborde dans le Th
eor`
eme de Prokhorov, qui

` COMPLETER

ANALYSE DE BANACH - A

303

repose sur le concept de tension. de tension ; rappelons que nous avons etudie ces
notions dans la section III-5.
Th
eor`
eme VII-131 (Theor`eme de compacite faible de Dunford-Pettis). Soit
(X, d) un espace metrique separable, muni dune mesure . Alors, une partie F de
L1 (X, ) est precompacte pour la topologie (L1 , L ) si et seulement si
(i) F est bornee dans L1 ;

(ii) Pour tout > 0 il existe un ensemble Y X, de mesure finie, tel que
Z
|f | d ;
sup
f F

X\Y

(iii) F est equi-integrable sur toute partie Y X de mesure finie.


En outre, on peut remplacer lenonce (iii) par

(iii) F est equi-integrable (sur X tout entier) ;


Remarques VII-132.
(i) Si (X, ) est -fini, alors la topologie (L1 , L ) est
la topologie faible dans L1 . Notons que meme si X nest pas -fini, lhypoth`ese
(ii) implique quil existe une partie -finie Y X telle que tous les f F sont
presque partout nuls en-dehors de Y (pour le voir, poser Y = Y1/n ).

(ii) La separabilite ne sert que dans la demonstration de limplication reciproque :


si un ensemble F verifie les conditions indiquees, alors il est precompact.
Exemples VII-133. Soit (X, ) un espace mesure fini, alors tout ensemble borne
en norme Lp (p > 1) est faiblement precompact dans L1 . Dans Rn , pour tout C
lensemble des fonctions f verifiant
Z
Z
|f |(1 + | log(1 + |f |)) d + |f (x)|(1 + log(1 + |x|))(x) dx C

est faiblement precompact dans L1 .

La demonstration de limplication directe dans le Theor`eme VII-131 est elementaire


mais assez subtile ; on pourra lomettre en premi`ere lecture, avec dautant moins de
remords que cest limplication reciproque qui sert en pratique. Cette preuve utilise
le lemme elementaire suivant :
Lemme VII-134. Soit (X, ) un espace mesurable et f L1 (X, ). Alors il existe
A X, de mesure finie, tel que

Z
Z


f d 1
|f | d
4

A
X

(on peut remplacer le 1/4 par un 1/2 si X est de mesure finie).


R
R
R
D
emonstration. On a |f | = | X+ f | + | X f |, o`
u X+ = {x; f (x) > 0} et
R
R
X = {x; f (x) < 0}. En posant B = X+ ou X , on a donc | B f d| ( X |f | d)/2.
Sans perte de generalite, on peut supposer que B = X+ . Soit maintenant
Xn lenR
semble des x X tels que 0 f (x) n. Par convergence dominee, Xn f converge
R
vers B f ; et Xn est de mesure finie par inegalite de Chebyshev. On en deduit que
linegalite est vraie si lon choisit A = Bn pour n assez grand.


304

CHAPITRE VII

(13 juin 2010)

D
emonstration du Th
eor`
eme VII-131, implication directe. Soit F une
1
partie precompacte de L , nous allons verifier les enonces (i) `a (iii).
1. Si F nest pas bornee dans L1 , on peut construire une suite (fk ) `a valeurs dans
F , avec kfk kL1 k. Puisque L est complet, le Theor`eme de BanachSteinhaus
sapplique pour dire que toute suite de formes lineaires convergeant simplement est
bornee en norme duale. On sait (Remarque VII-92) que la norme de fk dans (L )
est kfk kL1 , qui nest pas borne ; donc aucune sous-suite extraite de (fk ) ne peut
converger simplement, et F ne peut etre precompact.
2. Supposons maintenant que F est precompacte mais (ii) nest pas verifie. Il
existe donc R > 0 fixe, tel que pour tout ensemble Y de mesure finie, on puisse trouver
f F avec X\Y |f | d , ce qui entrane, par le Lemme VII-134, lexistence de A
R

mesurable avec A Y = et A f d /2.
On construit par recurrence une suite `a valeurs dans F comme suit. On choisit
f1 dans F et A1 de mesure finie tel que

Z


.

f
d
1
4

A1

On choisit alors f2 et A2 de mesure finie tel que A1 A2 = et



Z



f2 d .

4
A2

Par recurrence, on construit ainsi une suite croissante de fonctions fk et densembles


Ak de mesure finie, disjoints, tels que pour tout k,
Z




fk d .

4
Ak

On extrait de (fn ) une sous-suite convergeant au sens faible vers un certain


f L1 (X, ) ; on renumerote cette sous-suite par 1, 2, . . ., et on pose A := Ak . Par
convergence dominee, il existe N tel que pour tout k N,
Z

|f | d .
8
A\(A1 ...Ak )
On ne garde que les indices k qui sont superieurs `a N, et on pose alors gk := fk f .
La suite (gk ) ainsi construite
R verifie les proprietes suivantes : gk converge au sens
faible vers 0 (de sorte que A gk tend vers 0 pour toute partie mesurable A), et pour
tout k on a
Z




gk d =: .

8
Ak

Sans perte de generalite, on continue `a noter k = 1, 2, . . ..


On va maintenant extraire `a nouveau ! On pose n0 = 1. Il existe n1 tel que pour
tout n n1 ,

Z




gn d .

4
An0

On choisit alors n2 n1 tel que pour tout n n2 ,



Z
Z



gn d ,
|gn1 | d ,

8
An1
8
A\(A1 ...An )

` COMPLETER

ANALYSE DE BANACH - A

et ainsi de suite.
On a alors, pour tout k 1,

305

Z





gnk d ,

An

k



pour j < k;
gnk d

4 2kj
An
j
Z
Z



|gnk | d
gnk d
pour j > k.


An
4 2jk
X\Zj
j
S
Si lon pose B := k1 Ank , on a alors

Z


gn d ,
k
2

B

ce qui contredit la convergence faible de (gn ) vers 0.

3. Montrons maintenant la necessite de la condition (iii). Rappelons dabord que


dapr`es la Proposition III-87, elle est verifiee quand F est un singleton.
On applique encore le meme schema de demonstration : supposons par labsurde
que F est precompact, et quil existe > 0 tel que pour tout on puisse
trouver
R
un ensemble mesurable A et une fonction f F tels que [A] et A |f | d .
En
R particulier, par le Lemme VII-134, on peut trouver A tels que [A] et
| A f d| /2.
On construit alors une suite de fonctions fn et de parties An telles que

Z


1

fn d .
[An ] ,

n
2
An

On extrait une sous-suiteR convergeant vers f au sens (L1 , L ). Il existe > 0


tel que pour [B] , B |f | d| /4. On pose gn = fn f , et on ne garde
que les indices n superieurs `a 1/. Apr`es renumerotation, nous avons donc une
suite de fonctions integrables gn et une suite de parties mesurables An , satisfaisant
1

Rles proprietes suivantes : (a) gn converge vers 0 au sens (L , L ), en particulier


g d
A n
R 0 pour tout A fixe ; (b) [An ] R 0, et donc en particulier pour tout k
fixe on a An |gk | d 0 pour n ; (c) | An gn d| /4 =: .
On extrait `a nouveau ! On pose n1 = 1, et on choisit n2 tel que pour tout n n2 ,

Z
Z



|gn1 | ,
gn ,

An1
8
8
An
puis n3 tel que pour tout n n3 ,
Z

|gn1 | ,
16
An

Z



g
,

n
An1 16

An

|gn2 |


Z




g
,

n
An2
8

,
8
etc.

306

CHAPITRE VII

(13 juin 2010)

On construit ainsi par recurrence une suite dindices tels que


Z





gnk d ,

An

k

Z



pour j < k;
gnk d

4 2kj
Anj
Z
Z



|gnk | d
g
d
pour j > k.


nk

Anj
4 2jk
X\Zj
S
Si lon pose B := k1 Ank , on a alors

Z


gn d ,
k


2
B
ce qui contredit la convergence faible de (gn ) vers 0.

or`
D
emonstration du The
eme VII-131, implication r
eciproque. Montrons
maintenant que les conditions (i)-(iii) suffisent `a assurer la precompacite.
1. Quitte `a ecrire f = f+ f et `a traiter separement les parties positives et
negatives, on peut supposer que chaque f F est `a valeurs positives.
2. On pose Ak = Y1 Y1/2 . . . Y1/k . Pour f F , k N et M > 0, soit
f k,M = f 1Ak 1f M ;

on note que f k,M est croissante en k et M. On a


Z
Z
Z
k,M
|f f | d
f d +
X

X\Ak

f d,
{f M }Ak

et on majore separement les deux termes du membre de droite. Dabord, par (ii),
on a
Z
1
f d .
k
X\Ak

Ensuite, par (i) et linegalite de Chebyshev,

C
,
M
o`
u C = sup{kf kL1 ; f F } ; en appliquant (iii) on en deduit que
Z
f d 0.
sup
[{f M}]

f F

{f M }Ak

On conclut que lon peut trouver M = M(k) tel que


Z
2
sup
|f f k,M | d .
k
f F X
Sans perte de generalite, M(k) est une fonction croissante de k.
3. Si lon fixe k et M, la famille {f k,M ; f F } est uniformement bornee sur Ak ,
donc precompacte pour la topologie (L (Ak ), L1 (Ak )) par le Corollaire VII-130.
Comme Ak est de mesure finie, on a L (Ak ) L1 (Ak ), donc la precompacite a aussi
lieu au sens (L1 (Ak ), L (Ak )).

` COMPLETER

ANALYSE DE BANACH - A

307

` ce stade on ne peut conclure par la Proposition VII-119, car la topologie


4. A
1
(L , L ) nest pas metrique ! (voir lExercice VII-135) Nous allons cependant reprendre le raisonnement qui sous-tend cette proposition, en remplacant largument
de convergence metrique par un argument de monotonie.
k,M (k)
Soit donc (fn )nN une suite delements de F , on pose fnk = fn
. Pour tout
k, on peut trouver une suite extraite (fnk ) qui converge vers une fonction g k dans
la topologie faible de L1 (Ak ). Quitte `a effectuer une extraction diagonale, on peut
supposer que pour tout k, fnk converge vers g k dans L1 (Ak ) faible.
On etend gk en-dehors de Ak par la fonction nulle ; on pose en outre fn0 = 0,
0
g = 0. Comme fnk Rest croissante en k, on a, pour tout 0 mesurable,
et pour
R k
k

tous indices k , (fn fn ) 0, do`


u par passage `a la limite (g g ) 0.
k
Le choix = 1gk g montre que g g , -presque partout. La suite (g kR)kN est
donc positive et croissante, `a un ensemble -negligeable pr`es ; en outre g k est
majoree par le supremum des integrales des fn . Posons g = supk g k ; on a alors par
convergence monotone
Z
|g k g| d 0.
X

5. On conclut aisement : si L (X), alors



Z
Z
Z
Z
Z




k
k
k


fn d g d
f

d
|f

f
|
||
d
+
n
n
n




X
X
X
Z
+
|g k g| || d

Z
 Z X
Z
Z


k
k
k
k

kkL
|fn fn | d + |g g| d +
fn d
g d .
Ak

Ak

Le premier terme du membre de droite converge vers 0 quand k , uniformement


en
vers 0 quand n , pour tout k fixe ; on conclut que
R n ; et le second converge
R
fn d converge vers g d, ce qui montre que fn converge faiblement vers g. 

Exercice VII-135. On consid`ere, dans L1 ([, ]), la famille des fm,n (m


n 1) definies par
fm,n (x) = sin(nx) + n1[n1 ,n1 ] .
Montrer que fm,n est bornee dans L1 . En utilisant le Theor`eme de Dunford-Pettis,
identifier toutes les limites de suites extraites convergeant faiblement dans L1 . Montrer que la fonction identiquement nulle nest limite daucune suite extraite, mais
que cest une limite de limites de suites extraites. En deduire que la convergence
dans (L1 , L ) nest pas metrisable, meme si on se restreint aux parties bornees de
L1 .
Passons maintenant, pour terminer ce paragraphe, au Theor`eme de Prokhorov.
Sa demonstration a des points communs avec celle du Theor`eme de Dunford-Pettis,
mais aussi dimportantes differences. Alors que le Theor`eme de Dunford-Pettis relevait purement de la theorie de la mesure, le Theor`eme de Prokhorov melange theorie
de la mesure et topologie.
or`
The
eme VII-136 (Theor`eme de Prokhorov). Soient (X, d) un espace Polonais
et M un ensemble de mesures positives. Alors M est precompact pour la topologie
faible (M(X), Cb (X)) si et seulement si

308

CHAPITRE VII

(13 juin 2010)

(i) M est borne en variation totale ;


(ii) M est tendu, i.e.
> 0

K compact;

sup [X \ K ] .

Exemples VII-137. Lespace des mesures de probabilite sur un espace compact


est lui-meme compact (ce que nous savions dej`a grace au Theor`eme de BanachAlaoglu). Lespace des mesures de probabilite sur Rn verifiant
Z
|x| d(x) C

est compact pour tous C < + et > 0.

Remarque VII-138. Une subtilite importante est `a noter : le Theor`eme de Prokhorov sapplique `a des mesures positives. Si lon dispose dun ensemble de mesures
signees , telles que les mesures || verifient les conditions (i) et (ii), alors on peut obtenir la precompacite en appliquant le Theor`eme de Prokhorov aux parties positives
et aux parties negatives separement. En revanche, pour prouver que la precompacite
implique la condition (ii), on va utiliser la positivite de mani`ere importante. Je ne
sais pas si le resultat reste vrai pour des ensembles de mesures signees !
D
emonstration du Th
eor`
eme de Prokhorov. Montrons dabord que la
precompacite entrane les conditions (i) et (ii). On rappelle que dapr`es le Theor`eme I54, une mesure finie sur un espace Polonais est automatiquement reguli`ere.
1. Si F nest pas bornee dans M, on peut construire une suite (k ) `a valeurs dans
M, avec kk kV T k. Puisque Cb (X) est complet, le Theor`eme de BanachSteinhaus
sapplique pour dire que toute suite de formes lineaires convergeant simplement est
bornee en norme duale. On sait (Theor`eme VI-64) que la norme de k dans (Cb )
est kk kV T , qui nest pas borne ; donc aucune sous-suite extraite de (k ) ne peut
converger simplement, et M ne peut etre precompact. Cet argument reste dailleurs
vrai pour des mesures signees.
2. Supposons maintenant que M est precompact, et montrons quelle est tendue.
Soit (xj )jN une suite dense dans X, on consid`ere la famille des boules Bj = B (xj )
o`
u > 0 est arbitrairement petit. Montrons que pour tout > 0 il existe N tel que
pour tout M, [X \ (B1 . . . BN )] . En effet, si ce netait pas le cas,
on pourrait construire par recurrence une suite n `a valeurs dans M, telle que pour
tout n, n [X \ (B1 . . . Bn )] > . En particulier, pour tout n k on a n [Fk ] > ,
o`
u Fk = X \ (B1 . . . Bk ) est un ferme.
On va en deduire que [Fk ] ; il sagit dun argument general qui repose
uniquement sur le caract`ere ferme de Fk . Soit Fkt lensemble des x X qui sont `a
distance au moins t de Fk . Comme Fk et Fkt sont des fermes disjoints dans un espace
metrique, on peut construire une fonction t `a valeurs dans [0, 1], identiquement
egale `a 1 sur Fk et `a 0 sur Fkt (se rappeler le paragraphe I-2.3). On a alors
Z
Z
t
t
[X \ Fk ] d = lim
t dn lim sup n [Fkt ] .
n

En passant `a la limite quand t = 1/m 0 par -additivite, on obtient


[Fk ] .

` COMPLETER

ANALYSE DE BANACH - A

309

Autrement dit, [X \ (B1 . . . Bk )] , et ce pour tout k. On obtient une


contradiction puisque lunion des Bk est lespace X tout entier.
3. Pour tout > 0 et pour tout > 0 nous avons demontre lexistence de boules
ouvertes B1 , . . . , BN de rayon , telles que pour tout M, [X \(B1 . . .BN )
. Pour deduire que M est tendue, on rep`ete mot `a mot le raisonnement de la fin
de la demonstration du Theor`eme I-54 (le Theor`eme dUlam, qui est exactement le
resultat que nous voulons montrer dans le cas o`
u la famille M est un singleton).

4. Montrons maintenant que si la famille M est tendu, alors elle est precompact.
Il suffit de prouver que toute suite tendue admet une sous-suite convergente.
Pour tout m 1 on peut trouver un compact Km tel que [X \ Km ] 1/m pour
tout M, et on peut supposer que les Km forment une suite croissante. Pour
chaque m, la suite (n ) definit une suite bornee dans M(Km ), donc dans le dual
de C(Km ). Par le Theor`eme de Banach-Alaoglu, on peut extraire de n une soussuite qui converge au sens faible vers un certain m M(Km ). Par une extraction
diagonale, on peut extraire de n une sous-suite telle que pour tout m, et pour tout
C(Km ),
Z
Z
dm.
dn
Km

Km

La mesure est bien s


ur positive, car limite de mesures positives. Elle definit une
mesure sur X tout entier, par restriction : m [A] = m [A Km ].
Soit C(Km ), positive. Pour m m on peut ecrire
Z
Z
dn
dn .
Km

Km

(La fonction induit bien s


ur une fonction continue positive sur Km .) En passant
`a la limite quand n , on obtient
Z
Z

m
d
dm .
Km

Km

Si A est une partie fermee (donc compacte) de Km , on peut introduire grace au


lemme dUrysohn une suite k C(Km ), identiquement egale `a 1 sur A, convergeant
en decroissant vers la fonction indicatrice de A. En passant `a la limite quand k ,
on obtient

m [A] m [Km A].


On en conclut que la suite de mesures m [Km ] est croissante en m.
Soit A une partie mesurable de X, on definit
[A] := lim m [Km A].
m

Par la Remarque III-3, est une mesure. Cest une mesure finie puisque la suite
km kV T est bornee, et elle est bien s
ur concentree sur lunion croissante des Km ;
donc [X \ Km ] 0 quand m .
Montrons finalement que n converge vers au sens faible. On se donne
Cb (X). Alors
Z
Z
Z
dn ,
dn +
dn =
X

Km

X\Km

310

CHAPITRE VII

(13 juin 2010)

et le deuxi`eme terme est majore en valeur absolue par kk n [X \ Km ] = O(1/m),


uniformement en n. De meme,
Z
Z
Z
d,
d +
d =
X

X\Km

Km

et le deuxi`eme terme tend vers 0 quand m . Puisque dautre part


R
converge vers Km d, on conclut que
Z
Z
dn
d.
n

Km

dn

Si la convergence dans L1 faible nest pas metrisable, la convergence au sens


faible des mesures est en revanche metrisable (sur les parties bornees de lespace des
mesures positives). Soit d une distance bornee sur X (on peut toujours construire
une telle distance, par exemple en remplacant la distance d0 initialement donnee par
d = d0 /(1 + d0 ) ; alors la distance qui suit metrise la convergence faible :
Z

Z
dBL (, ) = sup
f d f d;
|f | 1, kf kLip 1 ,
o`
u lon a note

|f (y) f (x)|
.
d(x, y)
x6=y
On pourra penser aux lettres B et L comme aux initiales de borne et Lipschitz.
`me VII-139. Soit X un espace metrique Polonais, et soient (n )nN et
Th
eore
des mesures positives. Alors, les deux enonces suivants sont equivalents :
(i) dBL (n , ) 0 ;
(ii) n converge vers au sens faible (M(X), Cb (X)).
kf kLip = sup

Remarques VII-140.
(i) Le meme enonce resterait vrai si lon remplacait
la condition de 1-Lipschitzianite par une condition de module de continuite
uniforme.
(ii) Ici encore, la positivite joue un role important. Par exemple, dans M(R), la
suite de mesures signees n := n n+1/n verifie dBL (mun , ) 0, mais ne
converge pas faiblement vers 0 (exercice).
monstration du The
ore
`meR VII-139. Supposons
De
que d(n , ) 0. Alors,
R
pour toute fonction Lipschitz on a dn d.
Soit maintenant une fonction continue, on pose
fk (x) = inf {(y) + kd(x, y)} ,
yX

gk (x) = sup {(y) kd(x, y)} .


yX

Il est clair que fk et gk sont Lipschitz, et que


gk fk ,

en particulier
Z
Z
Z
gk d = lim
gk dn lim inf dn
n
n
Z
Z
Z
fk dn = fk d.
lim sup dn lim
n

` COMPLETER

ANALYSE DE BANACH - A

311

Dautre part, on verifie facilement que fk converge en croissant vers quand k ,


alors que la suite gk converge en decroissant vers . Il est facile den deduire que
Z
Z
Z
gk d.
fk d = d = lim
lim
k

On conclut donc que

lim

dn =

d.

Reciproquement, supposons que n converge vers au sens faible. On introduit


une suite (Km ) de compacts, choisis de telle sorte que n [X \ Km ] 1/m pour tout
n, [X \ Km ] 1/m.
Soit maintenant k une suite de fonctions bornees par 1, 1-Lipschitziennes, telles
que
Z
1
dBL (k , ) k d(k ) + .
k
Pour tout compact Km , la suite (k ) definit par restriction une suite bornee et 1Lipschitzienne dans C(Km ) ; grace au Theor`eme dAscoli on peut en extraire une
sous-suite qui converge uniformement dans C(Km ). Par un procede dextraction
diagonale, on peut extraire de la suite (k ) une sous-suite qui converge uniformement
sur chaque compact Km , vers une fonction , 1-Lipschitz, definie sur lunion des
Km . On prolonge cette fonction en une fonction 1-Lipschitz bornee definie sur X
tout
entier (Cf.
R
R les rappels du paragraphe I-2.3), toujours notee . En particulier,
dk d.
R
Pour montrer
que dBL(k ,) tend vers 0, il suffit de montrer que k dk est tr`es
R
proche de k d. Pour cela on ecrit

Z
Z
Z
Z








k dk
(k ) d(k )
(k ) d(k ) +
k d

X\Km
Km
X
X
Z
+
d(k ).
X

Pour chaque m, le premier terme tend vers 0 puisque k converge uniformement vers
sur Km ; le second terme tend vers 0 quand m , uniformement en k, grace `a
la tension des k et de ; enfin le dernier terme tend vers 0 quand k grace `a
lhypoth`ese de convergence faible.


VII-5.6. De la convergence faible `


a la convergence forte. La convergence
faible est (comme son nom lindique !) plus faible que la convergence forte, neanmoins
dans certaines situations on peut combiner linformation de convergence faible avec
une autre information, pour obtenir la convergence forte. Voici le plus simple de ces
resultats :
or`
The
eme VII-141. Soit (E, kk) un espace de Banach separable, uniformement
convexe, tel que xn converge au sens faible (E, E ) vers x, et kxn k kxk. Alors
kxn xk 0.
D
emonstration. Si kxn k tend vers 0, alors il ny a rien `a demontrer ; dans
le cas contraire, on pose yn = xn /kxn k, de sorte que yn converge au sens faible

312

CHAPITRE VII

(13 juin 2010)

vers y = x/kxk ; il suffit de montrer que kyn yk 0. Soit une forme lineaire
normalisant y. On a alors



yn + y
, yn + y h, yi = kyk = 1.

2
2

Donc lim sup k(yn +y)/2k 1, ce qui montre que k(yn +y)/2k tend vers 1. Luniforme
convexite de E implique alors kyn yk 0.


Comme nous le verrons dans la section suivante, ce crit`ere admet dans les espaces
de Lebesgue une generalisation en termes de fonctionnelles strictement convexes.
Lautre crit`ere utile de passage de la convergence faible a` la convergence forte est le
Theor`eme de Schur :
or`
The
eme VII-142 (Theor`eme de Schur). Dans (X, ) un espace mesure, soit
(fn ) une suite de fonctions convergeant presque partout vers f , precompacte dans
(L1 , L ). Alors fn converge vers f dans L1 (X, ).
D
emonstration. Quitte `a remplacer fn par fn f , on peut supposer que f = 0.
Soit > 0. La suite (fn ) etant precompacte, elle est uniformement equi-integrable
`a linfini par le Theor`eme de Dunford-Pettis ; il existe donc un ensemble de mesure
finie, Y , tel que pour tout n on ait
Z
|fn | d .
X\Y

R
De meme, il existe > 0 tel que pour tout A de mesure au plus on ait A |fn | d
pour tout n.
Sur lensemble Y , la suite fn converge presque partout vers 0, donc par le
Theor`eme dEgorov il existe un ensemble A , de mesure au plus , en-dehors duquel
fn converge uniformement vers 0, et donc dans L1 (Y \ A ) puisque Y est de mesure
finie.
Pour conclure, on ecrit
Z
Z
Z
Z
|fn | d +
|fn | d =
|fn | d +
|fn | d,
X

X\Y

Y \A

ou les deux premiers morceaux sont majores par et le dernier tend vers 0 quand
n
R . Pour n assez grand, cette quantite est donc majoree par 3. On conclut que
|fn | tend vers 0.


Le Theor`eme de Schur peut se reformuler ainsi : la convergence dans L et la


compacite dans L1 faible entrane la convergence dans L1 . On comparera avec le
Theor`eme VI-42. Voici un corollaire simple et surprenante du Theor`eme de Schur :
Corollaire VII-143 (equivalence des convergences faible et forte). Soit (X, )
un espace mesure dans lequel tous les points sont de mesure strictement positive.
Alors, dans L1 (X, ), il est equivalent de dire quune suite (fn ) converge au sens de
la topologie faible (L1 , L ), ou quelle converge au sens de la norme L1 .
Exemple VII-144. La convergence faible dans 1 (N) concide avec la convergence
forte (cela nempeche que la topologie faible dans 1 (N) soit distincte de la topologie
forte !).

` COMPLETER

ANALYSE DE BANACH - A

313

VII-5.7. Compl
ements sur la convergence faible des mesures de probabilit
e. Dans ce paragraphe on revient sur la convergence de mesures de probabilite.
On commence par un crit`ere de convergence.
Proposition VII-145. Soit X un espace Polonais, et (n ) une famille de mesures de probabilite. Alors, les quatre enonces suivants sont equivalents :
(i) n converge vers au sens (M(X), Cb (X)) ;
(ii) Pour tout ferme F X, [F ] lim sup n [F ] ;
(iii) Pour tout ouvert O X, [O] lim sup n [O] ;
(iv) Pour tout A X, [A] = 0 = [A] = lim n [A].
D
emonstration. Preuve `
a compl
eter. Voir [Billingsley 2, Theorem 2.1] 

Un cas particulier de ce theor`eme concerne la convergence de mesures de probabilite sur R. Une telle mesure de probabilite est enti`erement definie par sa fonction
de r
epartition : F (x) = mu[] , x]], qui est croissante et continue `a droite,
tendant vers 0 en et 1 en +. La Proposition precedente implique :
Proposition VII-146. Soit (n )nN et des mesures de probabilite sur R, de
fonctions de repartitions respectives (Fn )nN etF . Alors n converge faiblement vers
si et seulement si Fn (x) F (x) en tout point x o`
u F est continue.
D
emonstration. Preuve `
a compl
eter. Voir [Billingsley 2, Theorem 2.3] 

Un autre point sur lequel on pourrait dire plus est la metrisabilite de lespace
P (X) des mesures de probabilite sur un espace metrique (typiquement Polonais) X.
Nous avons dej`a rencontre une distance interessante, la distance dBL ; des dizaines
dautres sont utilisees, soit sur lespace P (X) tout entier, soit sur des sous-espaces
tels que


Z
p
Pp (X) := P (X); x0 X;
d(x0 , x) d(x) < +.
X

(cet ensemble depend bien s


ur du choix de la distance d). Mentionnons par exemple
- la distance de Kantorovich-Rubinstein sur P1 (X) :
Z
dKR (, ) = sup
d( );
kkLip 1

- les distances de Wasserstein Wp sur Pp (X) :



min(1,1/p)
p
Wp (, ) =
inf d(x, y) d(x, y)
,
(,)

o`
u (, ) designe lensemble des mesures de probabilite sur X Y dont les marginales sont et ;
- la distance de Levy-Prokhorov sur P (X) :
n
o
(, ) = inf > 0; [A] [A ] + pour tout ensemble Borelien A X ,

o`
u A designe lensemble {y X; d(y, A) < }.
Il sav`ere que la distance de Kantorovich-Rubinstein concide (si X est un espace Polonais) avec la distance W1 ; on en saura plus en consultant louvrage de
lauteur, Topics in Optimal Transportation (American Mathematical Society, Providence, 2003). Pour la distance de Levy-Prokhorov on pourra consulter par exemple

314

CHAPITRE VII

(13 juin 2010)

[Dudley, Chapitre 11]. Comme nous lavons dej`a mentionne, il en existe des dizaines
dautres....
Pour conclure, evoquons bri`evement le principe de compacit
e-concentration,
qui est dune grande importance dans certains domaines du calcul des variations.
Soit (n )nN une suite de mesures de probabilite sur un espace metrique Polonais
X. Alors il y a trois comportements possibles :
- levanescence : la masse de n ne reste pas contenue dans une boule de rayon
R:
R > 0
lim sup n [BR (x)] = 0;
n xX

- la concentration : la masse de n reste concentree sur un ensemble de diam`etre


borne, autour dun point xn qui peut bouger avec n : il existe une suite (xn )nN telle
que
> 0 R > 0 n N
n [BR (xn )] 1 ;
- la dichotomie : la masse de n se separe en au moins deux morceaux non
negligeables :
]0, 1[ > 0 R > 0, Rn , xn X;




n [BR (xn )] , n [BRn (xn ) \ B f (xn )] .
R

(Faire des dessins !)


Pour une demonstration de ce resultat, et de nombreuses applications `a des
probl`emes variationnels faisant intervenir des energies variees, on pourra consulter
une serie darticles de reference de P.L. Lions : The concentration-compactness
principle in the Calculus of Variations (Ann. Inst. H. Poincare Anal. Non Lineaire
1 (1984), no.2, 109145, no.4, 223283, et Rev. Mat. Iberoamericana 1 (1985), no.1,
145201 et no.2, 45121).
VII-6. Int
egration au sens faible
Dans le Chapitre II nous avons
R appris `a integrer des fonctions mesurables f `a
valeurs reelles, sous la condition |f | < +. Si f est `a valeurs dans un R-espace
vectoriel de dimension finie (tel que C ou Rn ), on peut facilement definir lintegrale
de f composante par composante. En revanche, si f est `a valeurs dans un R-espace
vectoriel de dimension infinie, lintegration de f peut saverer beaucoup plus delicate.
La notion dint
egrale faible permet de surmonter cette difficulte de mani`ere tr`es
simple, par dualite, sans avoir `a recourir `a la theorie generale dintegration `a valeurs
vectorielles.
or`
The
eme VII-147 (integrale faible-). Soient (X, A, ) un espace mesure, E
un espace vectoriel norme, et E le dual de E.R Soit f : X E , mesurable quand
E est muni de la topologie faible-, telle que kf (x)k d(x) < +. Alors il existe
un unique element de E tel que
Z
z E,
hz, iEE = hz, f (x)iEE d(x).
On dit que est lintegrale faible- de f et on note
Z
=
f (x) d(x).
X

` COMPLETER

ANALYSE DE BANACH - A

315

D
emonstration. On note dabord que la fonction kf k est mesurable puisque
la norme est semi-continue inferieurement pour la topologie faible. R
Pour tout z E on a |hz, f (x)i| kzkE kf (x)kE L1 () ; donc hz, f (x)i d(x)
est bien defini. On peut alors poser, pour tout z E,
Z
(z) = hz, f (x)i d(x).
Par bilinearite du crochet de dualite, et linearite de lintegrale, la fonction : E R
est en fait une forme lineaire continue ; ceci conclut la preuve du theor`eme.

Remarque VII-148. Comme on pourra le verifier facilement en utilisant la caracterisation donnee dans la definition, les r`egles de calcul habituelles sappliquent
`a cette notion : avec des notations evidentes,
Z
Z
Z
Z
Z
f d = 1A f d;
(f + g) d = f d + g d;
A


Z


f d

kf kE d.

En particulier, le theor`eme de convergence dominee et le theor`eme dEgorov sappliquent (on se ram`ene `a R+ en utilisant la norme). Le theor`eme de Fubini sapplique
egalement (on se ram`ene `a R en utilisant la dualite).
Remarque VII-149. Il existe une notion similaire dint
R egrale faible
R (au lieu
de faible-) pour f : X E, definie par les relations h f d, i = hf, i d.
Cependant, en general lelement ainsi construit appartient `a E . Dans le cas o`
uE
est reflexif, il est bien s
ur equivalent dutiliser cette notion ou dutiliser lintegrale
faible-.
Remarque VII-150. Dans les cas o`
u le Theor`eme VII-147 ne sapplique pas, il
est parfois possible de definir simplement lintegrale `a la main.
Exemple VII-151. Soient (X, A, ) et (Y, B, ) deux espaces mesures, p [1, ],
1
p
et
f
R L (X; Lp (Y )) (cest-`a-dire que kf (x)kLp d(x) < +. On cherche `a definir
f d dans L (Y ). Si 1 < p < , on peut appliquer le Theor`eme VII-147 en

utilisant le fait que Lp est le dual de Lp (p = p/(p 1)). Si p = et Y est -fini,


il en est de meme.
Si p = 1, on ne peut appliquer le Theor`eme VII-147, cependant, en supposant
X
R et Y -finis, on peut utiliser tout simplement le theor`
Reme de Fubini pour definir
f d. En effet, si lon note f (x, y) = f (x)(y), et (y) = f (x, y) d(x), le theor`eme
de Fubini garantit que L1 (), et que pour tout g L (),

Z
Z Z
(y) g(y) d(y) =
f (x, y) g(y) d(y) d(x).
Exemple VII-152. Soient (X, A, ) un espace mesure, (Y,
R B) un espace mesu1
rable, et f L (X; M(Y )). On cherche `a donner un sens `a f d. Si X est localement compact, alors M(Y ) = C0 (Y ) et on peut appliquer le Theor`eme VII-147.
Dans le cas general o`
u X nest pas forcement localement compact,
on ne peut plus
R
appliquer ce theor`eme ; cependant, on peut toujours definir f (x, dy) (dx) par le

316

CHAPITRE VII

(13 juin 2010)

meme procede que dans la sous-section III-2.4 : avec la notation f (x, dy) = f (x)(dy),
on peut poser, pour tout ensemble mesurable A,

Z
Z
f (x, dy) (dx) [A] = f (x, A) (dx).
VII-7. Convexit
e
D
efinition VII-153. Soit E un R-espace vectoriel. Un ensemble C E est dit
convexe si
x, y C, [0, 1],
(1 )x + y C.

Une fonction definie sur un ensemble convexe C de E, `a valeurs dans R {+},


est dite convexe si

x, y C, [0, 1],
(1 )x + y (1 ) (x) + (y).

Remarque VII-154. Quitte `a etendre par + en-dehors de C, on peut tou


jours considerer que la fonction est definie
sur E tout entier.
Exemples VII-155. Si C est convexe, la fonction indicatrice convexe de C est
la fonction convexe IC definie par : IC (x) = 0 si x C, + sinon. Toute norme est
convexe.

efinition VII-156. Si : E R {+} est une fonction convexe, on definit


D
le domaine de comme etant 1 (R) ; cest un ensemble convexe.
La notion de convexite a dej`a joue un role important `a plusieurs reprises dans ce
cours, en liaison avec la regularite des espaces de Banach ou le theor`eme de projection. Dans cette section je vais passer en revue quelques resultats plus specifiquement
associes aux ensembles et fonctions convexes ; on parle danalyse convexe. Comme
dans le reste du cours, jutiliserai la separabilite pour eviter le recours `a la version
la plus generale de laxiome du choix.
On rappelle `a toutes fins utiles une propriete utile de regularite automatique des
fonctions convexes en dimension finie :
Proposition VII-157. Soit : Rn R {+} une fonction convexe. Alors
est continue et localement lipschitzienne dans linterieur de son domaine.
D
emonstration `
a r
ediger.
VII-7.1. Convexit
e et topologie faible. Il est clair quun ensemble ferme
pour la topologie faible est toujours ferme pour la topologie forte, la reciproque
etant fausse en general. (Attention `a la terminologie, la propriete de fermeture faible
est donc plus forte que celle de fermeture forte !) Cependant, pour les ensembles
convexes, il ny a pas de difference :
Th
eor`
eme VII-158. Soient E un espace vectoriel norme separable, et C E
un convexe fortement ferme. Alors C est egalement ferme pour la topologie faible.
Exemple VII-159. Soit H un espace de Hilbert separable de dimension infinie.
La sph`ere unite S = {x H; kxk = 1}, non convexe, est fermee au sens fort mais
pas au sens faible. Son adherence faible est la boule unite B = {x H; kxk 1},
fermee `a la fois au sens fort et au sens faible.

` COMPLETER

ANALYSE DE BANACH - A

317

or`
Preuve du The
eme VII-158. Soient C un convexe ferme et x
/ C. Par
le Theor`eme VII-84(ii) (de HahnBanach), il existe une forme lineaire continue
separant C et {x} au sens fort :
(x) > sup (z).
zC

Puisque est continue pour la topologie faible, cette inegalite stricte empeche x
dappartenir `a ladherence de C. On conclut que C est ferme pour la topologie
faible.

Le corollaire suivant est tr`es utile :
Corollaire VII-160. Soit E un espace vectoriel norme separable, et : E
R{+} une fonction convexe, semicontinue inferieurement pour la topologie forte.
Alors est egalement semicontinue inferieurement pour la topologie faible.
D
emonstration. Pour tout R, 1 ([, +]) est convexe et ferme pour la
topologie forte, donc egalement pour la topologie faible par le Theor`eme VII-158.
Ceci veut dire que est semicontinue inferieurement pour la topologie faible.

Exemple VII-161. Soient (X, ) un espace mesure, : R [0, +] une fonction convexe, et soit : Lp (X) [0, +] definie par
Z
(f ) = (f (x)) d(x).
Il est clair que est convexe. Si fk f dans Lp , on peut extraire une sous-suite
(fk() )N telle que
(fk() ) lim inf (fk ).

Quitte `a extraire une nouvelle sous-suite, on peut supposer que fk f -presque


partout. On a alors, par le Theor`eme III-9 (Lemme de Fatou),
Z
Z
(fk ) d = lim inf (fk ).
(f ) =
lim (fk ) d lim
k

On conclut que est semicontinue inferieurement pour la topologie forte, et le


Corollaire VII-160 garantit que est aussi semicontinue inferieurement pour la
topologie faible.
Remarque VII-162. Ce resultat peut aussi se demontrer au moyen de la dualite
de Legendre, que nous etudierons bri`evement plus tard.

Remarque VII-163. Le cas particulier (f ) = |f |p redonne la semicontinuite


inferieure de la norme Lp pour la topologie faible mais lExemple VII-161 prouve
egalement la semicontinuite inferieure de la norme Lq pour la topologie faible Lp .
En conclusion, si est une fonction convexe semicontinue sur un espace vectoriel
norme et xk x, alors (x) lim inf (xk ). Pour (x) = kxk, dans un espace
uniformement convexe, on sait bien que les cas degalite caracterisent la convergence
forte : si xk x et kxk k kxk, alors xk x (Theor`eme VII-141). On peut
naturellement se demander si ce resultat se generalise ; et en effet on a par exemple
lenonce suivant :

318

CHAPITRE VII

(13 juin 2010)

or`
The
eme VII-164. Soit E un espace vectoriel norme separable V
erifier que
cest utile et : E R une fonction continue vraie continuit
e n
ecessaire ? et
strictement convexe, au sens suivant : pour tous x, y E il existe = (x, y) > 0
tel que

(1 )x + y (1 )(x) (y) (1 ) .
Si xk x et (xk ) (x), alors xk x.

Ce theor`eme sera demontre plus tard, comme application de la dualite de Legendre (voir p. ??).
VII-7.2. Points extr
emaux.
D
efinition VII-165 (points extremaux). Soient E un espace vectoriel norme et
C un convexe de E. On dit que x C est extremal (dans C) si x ne peut secrire
comme combinaison convexe stricte de deux autres points de C. Plus explicitement :
6 (x0 , x1 , ) C C [0, 1];

x0 6= x1 ,

/ {0, 1},

x = (1 )x0 + x1 .

De mani`ere equivalente, x est un point extremal sil nest milieu daucun segment
non trivial contenu dans C.
Notation VII-166. Si C est un convexe on notera E(C) lensemble des points
extremaux de C.
Exemple VII-167. La figure VII-7.2 represente lensemble des points extremaux
de quelques convexes fermes dans R2 ou R3 .

00
11
111111111
000000000
00
11
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
000000000
111111111
00
11
000000000
111111111
00
11
00
11
000000000
111111111
00
11

0
1
1111111
0000000
0
1
0000000
1111111
0000000
1111111
0000000
1111111
0000000
1111111
0
00000001
1111111
0
1
0000000
1111111
00
11
0000000
1111111
00
11
0000000
1111111
0000000
1111111
0000000
1111111
0000000
1111111
0000000
1111111
00000
11111
0000000
1111111
00000
11111
0000000
1111111
00000
11111
00000
11111

111111
000000
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111

11111
00000
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111

11111
00000
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111
00000
11111

Fig. 5. En traits epais, les ensembles de points extremaux de quelques


convexes simples.
Le dernier exemple montre que E(C) nest en general pas ferme, meme en dimension finie. Pour autant, cela reste un ensemble raisonnable, comme le montre la
proposition suivante :
Proposition VII-168. Soit C un convexe compact dans un espace vectoriel
norme E. Alors E(C) est un borelien non vide, et plus precisement une intersection denombrable douverts.

` COMPLETER

ANALYSE DE BANACH - A

319

D
emonstration de la Proposition VII-168. Soit m : (x, y) 7 (x + y)/2
(evidemment continue) ; et soit = {(x, x); x C} la diagonale de C. Lensemble
C C \ est lunion denombrable des compacts
n
o
K = (x, y) C C; d(x, y) 1/
pour N. Lensemble C \ E(C) concide avec m(C C \ ) = N m(K ), qui
est une union de compacts. Lensemble E(C) est donc une intersection denombrable
douverts.
Il reste `a montrer que E(C) est non vide. Quitte `a travailler dans lespace de
Banach engendre par C, on peut supposer que E est separable. (En effet C est
compact donc separable.) Par la Proposition VII-79 il existe une suite (k )kN de
formes lineaires continues separant C. On definit une suite (Ck )kN de compacts par
C0 = C;
n
o
C1 = x C; 1 (x) = max 1 (y) = ArgmaxC0 1 ;
yC0

o
n
. . . Ck = x Ck1 ; k (x) = max k (y) = ArgmaxCk1 k .
yCk1

La suite (Ck )kN est une famille decroissante de compacts non vides, son intersection
S est donc non vide. Soit z S ; on va verifier que z est extremal. Supposons que
z = (x + y)/2, le but est de montrer que x = y.
Pour commencer on a maxC0 1 = 1 (z) = (1 (x) + 1 (y))/2 maxC0 1 ; do`
u
1 (x) = 1 (y) = 1 (z), en particulier x, y C1 . En continuant ce raisonnement, on
montre par recurrence que pour tout k on a x, y Ck et k (x) = k (y) = k (z).
Puisque les k separent C, on a forcement x = y = z, ce qui conclut la preuve. 
Exemple VII-169. Soit X un espace topologique separe, et P (X) lespace des
mesures de probabilites (de Borel) sur X. Alors les points extremaux de P (X) sont
les masses de Dirac (exercice).
Exemple VII-170. Soit Bn lespace des matrices n n bistochastiques, cest`P
a-dire les matrices
M = (aij ) telles que tous les coefficients aij sont positifs, et
P
eor`eme cel`ebre d
u `a Birkhoff enonce que les points
i aij = 1,
j aij = 1. Un th
extremaux de Bn sont les matrices de permutation, cest-`a-dire telles que aij {0, 1}.
Limportance cruciale des points extremaux vient de ce que, sous des hypoth`eses
adequates, ils suffisent `a engendrer le convexe tout entier, via des combinaisons
lineaires finies ou infinies. Le theor`eme suivant peut etre considere comme le plus
simple de ces resultats ; on notera co(A) lenveloppe convexe fermee de A, cest-`adire le plus petit convexe ferme contenant A, ou encore ladherence de lenveloppe
convexe de A.
or`
The
eme VII-171 (Theor`eme de KreinMilman). Soit C un convexe compact
dun espace vectoriel norme E. Alors C est lenveloppe convexe fermee de ses points
extremaux :
co(E(C)) = C.
D
emonstration. Quitte `a travailler dans le sous-espace vectoriel engendre par
C, on peut supposer que E est separable.

320

CHAPITRE VII

(13 juin 2010)

Soit C = co(E(C)). Bien s


ur C C, et C est egalement un convexe compact.
Si C 6= C, soit x C \ C ; par HahnBanach (Theor`eme VII-84(ii)) il existe E
tel que (x) > supC .
Soit alors = maxC et C = C { = } : C est un convexe non vide, nintersectant pas C . Soit z un point extremal de C , il est facile de voir que cest aussi un
point extremal de C. Il doit donc appartenir `a C , ce qui est une contradiction. 
En dimension finie, le Theor`eme VII-171 peut etre precise : il suffit de considerer
lenveloppe convexe, on na pas besoin de passer `a ladherence :
or`
The
eme VII-172 (Theor`eme de KreinMilman en dimension finie). Soit C
un convexe compact de Rn . Alors C est lenveloppe convexe de ses points extremaux :
co(E(C)) = C.
D
emonstration. On va raisonner par recurrence sur la dimension n. En dimension 1, le resultat est evident : un intervalle est lenveloppe convexe de ses extremites.
Supposons donc le resultat demontre jusqu`a la dimension n 1, et etablissons-le en
dimension n.
Soit C un convexe compact de Rn , et soit k le plus grand entier tel quil existe
k + 1 points affinement libres dans E(C). Si k < n, cela veut dire que E(C) est inclus
dans un espace affine V de dimension k, et il en est donc de meme de C = co(E(C)).
Quitte `a translater, le probl`eme se repose donc dans Rn , et lhypoth`ese de recurrence
assure le resultat. On peut donc supposer que k = n.
Soient z0 , . . . , zn des points extremaux affinement libres ; C = co(E(C)) contient
lensemble convexe engendre par z0 , . . . , zn ; en particulier, C est un convexe dinterieur
non vide. Il sensuit facilement que Int(C ) = C , qui nest autre que C.
Le but est de montrer que C = C. Supposons par labsurde que ce soit faux,
et soit x C \ C . On ne sait pas a priori que C est ferme, mais on peut toujours
separer (au sens large) x de Int(C ) (Theor`eme VII-84(i)) : il existe Rn tel que
h, xi

sup h, xi.

xInt(C )

En passant `a ladherence, on obtient


h, xi suph, xi.
xC

b est extremal dans C, alors il est


b = C {x; h, xi = h, xi} x. Si x
bC
Soit C
extremal aussi dans C (en effet sil etait combinaison stricte de deux points dont un
b alors on aurait h, xi < maxC , do`
nappartient pas `a C,
u contradiction).
Or, par definition, x nest pas combinaison convexe de points extremaux de C ; il
b Mais ceci contredit
nest donc pas combinaison convexe de points extremaux de C.
b
lhypoth`ese de recurrence car C est de dimension au plus n 1.


VII-7.3. Repr
esentation barycentrique. Si on se donne des vecteurs x1 , . . . , xk
dans un espace vectoriel E, et des coefficients 1 , . . . , k positifs, de somme egale `a
1, on definit le barycentre des xi , avec poids i , par
X
=
i xi ;
ce vecteur est aussi appele combinaison convexe des xi , avec coefficients i . La
proposition suivante constitue un exercice facile :

` COMPLETER

ANALYSE DE BANACH - A

321

Proposition VII-173. Soient E un espace vectoriel et A une partie quelconque


de E ; alors
co(A) =

N
nX
i=1

i ai ; ai A; i 0;

N
X
i=1

o
i = 1; N N :

en dautres termes, lenveloppe convexe de A concide avec lensemble de toutes les


combinaisons convexes dun nombre fini delements de A.
Dans un contexte analytique, il est naturel de chercher `a generaliser cette notion
`a un continuum de vecteurs xi . Pour ce faire, on peut noter que, si E est un espace
de dimension finie,
Z
X
i xi = x d(x),
P
o`
u =
i xi , et on donne un sens `a lintegrale vectorielle en la considerant
composante par composante. Il suffit alors de remplacer la mesure atomique par
une mesure continue.
La definition suivante generalise cette construction en dimension infinie :
D
efinition VII-174 (barycentre). Soient E un espace vectoriel norme, F un
sous-espace vectoriel de E , et une mesure de probabilite sur E (muni de la tribu
borelienne). On dit que E est barycentre de relativement `a la famille F si
Z
(74)
F,
h, i = h, xi d(x).
Proposition VII-175. Soient E un espace vectoriel norme, et F un sous-espace
vectoriel separable de E , qui separe les points de E au sens de la Definition VII-77.
Soit une mesure de probabilite sur E, supportee par un convexe compact C. Alors
il existe un unique barycentre de relativement `a la famille F , et il appartient `
a
C. On note
Z
= F () =

x d(x).

Lapplication est alors continue de P (C), muni de la topologie faible, dans E,


muni de la topologie faible induite par F .

Remarque VII-176. Lexistence de F est garantie par la Proposition VII-79,


par exemple d`es que E est separable, ou le dual dun espace separable.
Remarque VII-177. Si E est separable et separe les points de E, alors largument utilise pour prouver lunicite dans la Proposition VII-175 montre que F () =
E () ; en particulier F () devient independant du choix de F . On peut alors noter
() = F () sans ambigute.
Remarque VII-178. Si lon admet laxiome du choix, les hypoth`eses de separabilite
dans la Proposition VII-175 deviennent superflues, et le meme raisonnement que
dans la Remarque VII-177 montre que le barycentre est independant du choix de
lespace vectoriel F separant les points de E. Cest pourquoi la plupart des ouvrages
abordant le sujet des barycentres ne font aucune mention dun choix de sous-espace
vectoriel F dans E .

322

CHAPITRE VII

(13 juin 2010)

Preuve de la Proposition VII-175. 1. On montre dabord lunicite : si


et sont deux barycentres relativement `a F , on a h, i = h, i pour tout F .
Comme F separe E, on en deduit = .
2. Passons `a lexistence. Soit (k )kN engendrant un espace vectoriel dense dans
F . Pour tout N on pose
Z

Z
a =
h1 , xi d(x), . . . , h , xi d(x)
R ,
et on definit : E R par = (1 , . . . , ). Bien s
ur (C) est un convexe
compact de R .
Si a
/ (C) on peut separer strictement a et (C) (Theor`eme VII-84(ii)) :

R ;

k ak > sup
zC

k=1

X
k=1

k hk , zi.

En utilisant la definition de ak et la linearite de lintegrale, on obtient


Z X

X
k hk , xi d(x) > sup
k hk , zi,
zC

k=1

k=1

ce qui est bien s


ur impossible. Il sensuit que C = 1
(a ) est non vide ; est cest un
convexe ferme de C, en particulier un compact. Lintersection des C est donc non
vide, et tout z appartenant `a cette intersection verifie
Z
k N,
hk , zi = hk , xi d(x).
Soit maintenant F , on peut trouver une sous-suite (k(n) )nN convergeant
vers dans E . Alors
Z
Z
h, zi = lim hk(n), zi = lim hk(n) , xi d(x) = h, xi d(x),
k

o`
u linegalite de droite decoule par exemple du theor`eme de convergence dominee
(noter que k(n) et x apparaissant sous lintegrale sont bornes en norme). On conclut
que z est un barycentre de .
3. Si (k )kN est une suite de mesures de probabilite sur C convergeant faiblement
vers , alors pour tout F on a
Z
Z
h, xi dk (x) h, xi d(x),
k

do`
u h, F (k )i h, F ()i, et ce pour tout F . Ceci montre bien la continuite
de .


Les enonces demontres dans la sous-section precedente peuvent se traduire en


termes de barycentres :
Proposition VII-179 (Reformulation du theor`eme de KreinMilman). Soit C
un convexe compact dun espace vectoriel norme E. Alors
(i) Si C est de dimension finie, alors C est lensemble des combinaisons convexes
finies delements de E(C).

` COMPLETER

ANALYSE DE BANACH - A

(ii) Dans tous les cas,

n
C = F ();

323

P (E(C)),

o`
u F est un sous-espace vectoriel separable de E , separant les points de E, choisi
arbitrairement.
D
emonstration. Lenonce (i) est une consequence immediate du Theor`eme VII172 et de la Proposition VII-173.
Pour demontrer lenonce (ii), on note que dapr`es le Theor`eme VII-171 tout
x C est limite dune suite delements de co(E(C)) :
x = lim

Nk
X

j,k xj,k ,

j=1

j,k 0,

X
j

j,k = 1, xj,k E(C).

la topologie faible ;
Lensemble E(C) est compact, donc P (E(C)) est compact pourP
quitte `a extraire une sous-suite, on peut donc supposer que k = j j,k xj,k converge
faiblement vers une mesure de probabilite sur E(C). En utilisant la continuite faible
de , on obtient
x = lim F (k ) = F (),
k

ce qui conclut la preuve.

Dans la suite de cette sous-section, nous allons demontrer les remarquables


theor`emes de Caratheodory et de Choquet, qui renforcent les conclusions de la Proposition VII-179 ; le premier en fournissant une borne explicite et optimale sur le
nombre de points impliques dans la combinaison convexe en dimension finie ; le second en remplacant lintegrale sur E(C) par une integrale sur E(C) (ce qui est parfois
un gain considerable).
or`
The
eme VII-180 (Theor`eme de combinaison convexe de Caratheodory). Soit
n
A R , alors
n+1
nX
o
co(A) =
i ai ; ai A .
i=1

Corollaire VII-181. Si C est un convexe compact de Rn , alors tout x C est


combinaison convexe de n + 1 points extremaux de C.
Corollaire VII-182. Si K est un compact de Rn , alors
(
co(K) = co(K);
E(co(K)) K.

Preuve du Th
eor`
eme VII-180. Soit x co(A) ; par la Proposition VII-173
il existe k N, des coefficients positifs i (1 i k) de somme egale `a 1, et des
vecteurs ai A, tels que
k
X
x=
i ai .
i=1

Pk1
On va montrer que si k n + 2, alors x peut se reecrire i=1
i ai , o`
u les i sont
des coefficients positifs de somme egale `a 1, et les ai appartiennent `a A. Le resultat
en decoulera immediatement par recurrence.

324

CHAPITRE VII

(13 juin 2010)

P
Soit donc x = ki=1 i ai avec k n + 2. Si lun des i est nul, le resultat est
evident ; on peut donc supposer i > 0 pour tout i. Les k vecteurs (1, ai ) sont lies
dans Rn+1 = R Rn ; on peut donc trouver des coefficients i non tous nuls tels que
X
X
i = 0,
iai = 0.
Pour t > 0 assez petit on a alors
i ti > 0;

k
X
i=1

(i ti ) = 0;

k
X
(i ti )ai = x.
i=1

En revanche quand t , lun au moins des i ti devient negatif.


Quand on fait varier t de 0 a +, il existe donc un premier temps t0 tel que
tous les i t0 i sont positifs, et lun au moins de ces nombres est nul ; disons
j t0 j = 0. Alors x est combinaison convexe des ai pour i 6= j, avec coefficients
i t0 i .


Preuve du Corollaire VII-181. Lenonce decoule instantanement des Theor`emes VII172 et VII-180.

Preuve du Corollaire VII-182. Soit K un convexe compact de Rn . Par le
Theor`eme VII-180 (de Caratheodory),
n+1
nX
o
co(K) =
i xi ; xi K ,
i=1

qui est compact comme image continue dun compact ; do`


u co(K) = co(K).
Par suite, tout x co(K) secrit comme combinaison convexe delements de K.
Si cette combinaison nest pas triviale (i.e. reduite `a un element de K), x nest bien
s
ur pas extremal. Donc E(co(K)) K.


On termine avec le point culminant de cette sous-section : le theor`eme de representation


barycentrique de Choquet.
or`
The
eme VII-183 (Theor`eme de Choquet). Soit C un convexe compact dun
espace vectoriel norme E, et soit F un sous-espace vectoriel separable de E , separant
C. Alors pout tout x C il existe x P (E(C)) tel que x = F (x ) ; soit
Z
x=
x (z) dz.
E(C)

Remarque VII-184. La Remarque VII-177 sapplique ici aussi : si E est separable


et separe C, ou si lon admet laxiome du choix, alors F () ne depend plus du choix
de F et lenonce devient : Soit C un convexe compact dun espace vectoriel norme
E, alors pout tout x C il existe x P (E(C)) tel que x = (x ).
Pour demontrer le Theor`eme VII-183, on utilisera le lemme suivant :
Lemme VII-185. Sous les hypoth`eses du Theor`eme VII-183, il existe une fonction
continue : C R+ , strictement convexe.
Preuve du Lemme VII-185. Soit (k )kN une suite de formes lineaires sur E
de norme 1, separant C. On pose
X
(x) =
2k hk , xi2 .
kN

` COMPLETER

ANALYSE DE BANACH - A

325

Cette fonction est bien s


ur convexe. Si maintenant ((1 )x + y) = (1 )(x) +
(y) pour un triplet (x, y, ) C C (0, 1), alors on a, pour tout k N,
((1 ) hk , xi + hk , yi)2 = hk ((1 )x + y)i2 = (1 ) hk , xi2 + hk , yi2,
ce qui impose hk , xi = hk , yi, do`
u x = y. La convexite de est donc stricte. 
Preuve du Th
eor`
eme VII-183. Tous les barycentres seront implicitement
pris par rapport `a la famille F , qui ne sera pas explicitement rappelee dans la suite.
Pour tout x C on note
Z
x
1
P (C) = (x) = { P (C);
z (dz) = x};
et pour tout P (C) on note

F () =

(x) (dx).

Puisque C est un compact metrique, P (C) est compact pour la topologie faible
(Theor`eme VII-136) ; et il est clair que P x (C) est compact pour cette meme topologie, pour tout x C. De meme F est continue pour la topologie faible.
Fixons x C ; le probl`eme de maximisation
n
o
max F (); P x (C)

admet une solution . On sait que x = (), nous allons maintenant verifier que
est concentree sur E(C), ce qui ach`evera la preuve.
S Comme dans la demonstration de la Proposition VII-168, on sait que C \ E(C) =
m(K ), o`
u m est lapplication milieu C C C, et (K )N une famille croissante
de compacts inclus dans (C C) \ , etant la diagonale de C. Par Theor`eme de
` INCLURE DANS LES NOTES QUELQUES PART
selection mesurable A
(CHAPITRE 1 ? ?) on peut definir une application mesurable g : m(K )
K , telle que m g = IdK . On definit g sur C \ E(C) en posant g(z) = g (z) si
z K \ K1 (o`
u K0 = par convention). Enfin, pour tout z E(C) on pose
g(z) = z. On a ainsi construit une application mesurable g : z 7 (z0 , z1 ) telle que
x = (z0 + z1 )/2, avec z0 6= z1 si (et seulement si) z
/ E(C).
Pour tout z C on pose alors (z) = (1/2)(z0 + z1 ), o`
u (z0 , z1 ) = g(z). La
stricte convexite de implique
F (z ) = (z) ((z0 + z1 )/2) = F ((z) ),

(75)

avec inegalite stricte d`es queRz


/ E(C).
On definit alors (ds) = C (z) (ds) (dz). On note que P x (C) puisque (par
Fubini)

Z
Z Z
Z
(z)
s (ds) =
s (ds) (dz) =
z (dz) = x.
C

En appliquant encore Fubini et linegalite (75), on obtient



Z Z
Z
Z
Z
(z)
(z)
(s) (ds) (dz) =
F ((z) ) (dz)
F () =
(s) (ds) (dz) =
C
C
C
C
Z

(z) (dz) = F ().


C

326

CHAPITRE VII

(13 juin 2010)

Puisque appartient `a P x (C) et que maximise F sur cet ensemble, linegalite


ci-dessus est necessairement une egalite. Ceci, et la caracterisation des cas degalite
dans (75), impose que z E(C), (dz)-presque partout. Ceci conclut la preuve. 
VII-7.4. Dualit
e des fonctions convexes. Un des concepts les plus importants de lanalyse convexe est celui de dualite.
D
efinition VII-186. Soit E un espace vectoriel et : E R {+}, non
identiquement +. On appelle transformee de LegendreFenchel de la fonction
convexe : E R {+} definie par


() = sup h, xi (x) .
xE

Comme consequence directe de la definition, on a limportante inegalite de Young :


pour toute fonction convexe E R {+}, non identiquement +,

(76)

x E,

E ,

h, xi (x) + ().

Les cas degalite ont une importance considerable en analyse convexe :


D
efinition VII-187 (sous-differentiabilite). Soit E un espace vectoriel, : E
R{+} une fonction convexe, et x E. Le sous-differentiel de en x, note (x),
est lensemble des formes lineaires continues E verifiant les deux conditions
equivalentes suivantes :
z E,

(z) (x) + h, z xi;

(x) + () = hx, i.

Le theor`eme suivant est `a la base des principaux resultats de dualite des fonctions
convexes :
or`
The
eme VII-188. Soient E un espace vectoriel norme separable, et , deux
fonctions convexes E R {+}. Si
(i) x0 E; (x0 ) + (x0 ) < + ;
(ii) les ensembles convexes disjoints




C = (x, ) E R; > (x) ,
C = (y, ) E R; m (y)
sont separables (au sens large) par un hyperplan affine ;
alors



(77)
inf + = max () () .
xE

Corollaire VII-189 (dualite de FenchelRockafellar). Si , sont convexes


E R {+} et sil existe x0 E tel que (x0 ) + (x0 ) < + et soit continue
en x0 , alors lidentite (77) a lieu.
Corollaire VII-190 (sous-differentiabilite). Soit E un espace vectoriel norme
separable, et : E R {+} une fonction convexe semicontinue inferieurement.
Si est continue en x alors (x) 6= .
Corollaire VII-191 (dualite de LegendreFenchelMoreau). Soit E un espace
vectoriel norme separable, et : E R {+} une fonction convexe semicontinue
inferieurement. Alors
= .

` COMPLETER

ANALYSE DE BANACH - A

327

Remarque VII-192. Lhypoth`ese de semicontinuite inferieure est cruciale dans


le Corollaire VII-191. Dans Rn , une fonction convexe est automatiquement continue dans linterieur de son domaine (Propriete VII-157), mais rien ne garantit la
semicontinuite au bord du domaine (trouver des exemples).
Preuve du Th
eor`
eme VII-188. Soit m = inf( + ) ; par hypoth`ese m <
+. On cherche `a prouver que sous les hypoth`eses de lenonce,




sup inf (x) + (y) + h, x yi = inf (x) + (x) = m.
xE

E x,yE

En choisissant x = y, on voit que le membre de gauche est toujours plus petit que
celui de droitel il suffit donc de montrer que
E ,

x, y E,

(x) + (y) + h, x yi m.

Si les convexes C et C peuvent se separer, il existe E et R, (, ) 6=


(0, 0), tels que
h, xi + h, yi +

d`es que > (x) et m (y). Ceci implique facilement > 0. On pose alors
= /, de sorte que
h, xi + h, yi + .

En passant `a la limite on trouve h, xi + (x) h, yi + m (y), et le theor`eme


est demontre.

Les preuves des Corollaires sont `
a r
ediger, ainsi que la preuve du
Th
eor`
eme VII-164.
Terminons cette section avec une generalisation en dimension infinie du Theor`eme III69 (inegalite de Jensen) : R
ediger, bien penser aux cas d
egalit
e.
Th
eor`
eme VII-193. ........................
VII-8. Retour sur les espaces de Hilbert
ca vaut le coup de recapituler les prop. des hilberts ;
et de montrer ceux des thm precedents qui sont triviaux via base
on commence par rappeler un concept fondamental dont tout va decouler : lorthogonalite. Def : deux vecteurs sont orthogonaux si ... Un sous-ensemble A de H
etant donne, on definit son orthogonal par...
pour les projections, mentionner que cest toujours Lipschitz et le montrer. En
outre la proj sur un sous-espace est lineaire.
egalement on peut identifier H/F et F
VII-8.1. Baess hilbertiennes. Attention, ce ne sont pas des bases algebriques
(quand on parle de base alg., il sagit de combinaisons lineaires finies).
Def : une base hilb est un systeme orthonorme (h, i = , ) engendrant un
sous-espace vectoriel dense.
Le thm fondamental est le suivant, mq proprietes familieres des espaces Euclidiens se generalisent bien :

328

CHAPITRE VII

(13 juin 2010)

or`
eme VII-194. Soit (ek ) une base hilb, x H, xj := hej , xi, alors la serie
P The
xj ej est absolument convergente dans H, et sa somme vaut x :
x=

xj ej .

j=1

En outre,
kxk2 =

x2j ;

hx, yi =

xj yj .

Remarque
P VII-195. Variante quand les coordonnees sont complexes. Plus joli.
mettre des
xj yj .
D
emonstration. Grace `a la definition, pour tout j,
hx
On en deduit
x
avec Ek = vect(ej )j . Donc
k
X
j=1

Par la formule de Pythagore,


k

k
X
j=1

k
X
j=0

xj ej , e i = 0.

k
X
j=0

xj ej Ek ,

k
X

xj ej x

xj ej k + kx

xj ej .

j=0

k
X
j=1

xj ej k2 = kxk2 .

Le terme de gauche est


|xj |2 . En passant `a la limite pour k , on obtient
lin
egalit
e de Bessel (vraie pour toute famille orthonormee, meme si elle nengendre pas un sous-espace dense) :
k
X
j=1

|xj |2 kxk2 .

... la serie converge dans H. Notons y :=


x

k
X
j=1

xj ej . On a

xj ej e

do`
u, en passant `a la limite, x ye pour tout . Le vecteur x y, etant orthogonal
`a tous les elements de la base, est aussi orthogonal au sous-espace vectoriel engendre
par cette base, et par consequence `a ladherence de ce sous-espace vectoriel, i.e. H. Il
est donc orthogonal `a lui-meme, et donc nul. On conclut que x = y. Pour conclure la
preuve du theor`eme, il suffit de passer `a la limite dans ...... et on obtient lin
egalit
e
de Parseval :
....


` COMPLETER

ANALYSE DE BANACH - A

329

Le theor`eme suivant est fondamental, mais presque evident apr`es le theor`eme


precedent :
Th
eor`
eme VII-196. Soit H un Hilbert separable, alors
(i) A partir de nimporte quelle famille denombrable libre (xk )kN engendrant un
sous-espace vectoriel dense, on peut construire une base hilbertienne (ek )kN telle que
vect(xk )k = vect(ek )k , par orthonormalisation de Gram-Schmidt. En particulier,
il existe une base hilbertienne (et en fait, il en existe bien s
ur une infinite).
(ii) Un espace de Hilbert admet une base hilbertienne si et seulement si il est
separable.
(iii) Toute base hilbertienne fixee fournit un isomorphisme entre H et 2 (N), i.e.
une application lineaire bijective preservant la norme et le produit scalaire.
Remarque VII-197. Dans lenonce (i) : si on a une famille generatrice non
libre, on peut toujours se ramener par recurrence `a une famille libre. Pour (ii) :
une implication est (i), lautre est obtenue en prenant des combinaisons lineaires `a
coefficients rationnels. Les espaces de Hilbert non-separables sont dhabitudes fuis
avec horreur. Lenonce (iii) est souvent paraphrase par le slogan il nexiste quun
espace de Hilbert separable.
Terminons cette section par des exemples de bases hilbertiennes :
H = 2 , ej = (jk )kN ;
H = L2 (T), ek = eikx (variables complexes) ou ek = cos(kx), sin(kx).....
H = L2 (Tn ), ek = eikx
H = L2 (R), syst`eme de Haar : 1[0,1/2[ 1]1/2,1] et toutes ses translatees (par Z)
et dilatees faire un dessin !
H = L2 (d), polynomes orthogonaux, obtenus par Gram-Schmidt `a partir de
la base canonique des polynomes. Parfois cest total : p. ex. Legendre pour
2 /2
x/2
dx sur [1, 1] ; Hermite pour ex
dx sur R+ ;
dx sur R, Laguerre pour e
|x|
parfois ca ne lest pas : p.ex. e
. Cette alternative est liee `a des proprietes
de decroissance et de regularite de la mesure de reference.
Nous reparlerons plus tard de certains de ces resultats : par exemple, la totalite
(definir ce mot) des series de Fourier (definir). Un resultat danalyse derri`ere : toute
fonction continue est limite uniforme de series de Fourier.
Expliquons juste ici que Rle syst`eme de Haar est total : la seule chose `a comprendre
cest pourquoi la condition f = 0 ne gene pas dans L2 (R). En effet, soit f donnee
dans L2 , on peut trouver g dintegrale nulle, tel que kf gkL2 . Pour cela on
choisit


Z
1[0,B]
g = f ( f)
B
et on fait tendre B vers linfini (exercice).
Remarque VII-198. (a mettre plus haut ?) Les polynomes orthogonaux sont
tr`es etudies dans de nombreux contextes ; en particulier, ils satisfont des relations de
recurrence que lon peut obtenir par certains procedes systematiques, et sexplirment
souvent en termes de valeurs propres doperateurs differentiels.
Exemples :
Legendre
q
n+

Pn (x) =

1
2

dn
[(1 x2 )n ]
2n n! dxn

330

CHAPITRE VII

Hermite
Hn (x) = (1)n ex
Laguerre

(13 juin 2010)

dn x2
(e )
dxn

ex dn x n
Ln (x) =
(e x )
n! dxn
Reference : Nikiforov-Ouvarov (rajouter cette reference dans la biblio)
Remarque : verifier quon a defini la notation .

VII-8.2. Propri
et
es g
eom
etriques dans les espaces de Hilbert. Beaucoup des prop. vues avant sont vraies, et peuvent se montrer tres facilement.
- la norme est Frechet-diff. DN(x) = x/kxk.
- lespace est uniformement convexe, et en fait on a lidentite du parallelogramme
- le theor`eme de projection sur un convexe ferme est vrai : on peut donc definir
C
- le theor`eme de Riesz : H = H et cest canonique
- caracterisation differentielle de la projection : x F (x) F pour tout s.ev.
F
- lop de projection est Lipschitzien (dailleurs cette prop. nest vraie que dans
un Hilbert !)
- Id = F + F . En particulier, F admet un supplementaire (topologique !). Un
cas particulier est la decomposition obtenue en choisissant F = Ej , i.e. on ne garde
que les j premi`eres composantes, on a vu ca dans la preuve plus haut...
- HB est maintenant trivial : le thm dextension : on etend `a F par continuite
uniforme, puis `a E en utilisant la decomposition F + F .
Lexistence dune flc normalisante : on choisit le produit scalaire par x/|x|.
Les flc nulles sur F sidentifient `a F , donc vect(F ) = H F = 0.
- BS se voit facilement sur une base, et BA aussi.
- thm de classification : un seul Hilbert separable

CHAPITRE VIII

` REDIGER

Analyse sur les groupes ab


eliens - A

CHAPITRE IX

` REDIGER

Fonction maximale de HardyLittlewood - A

CHAPITRE X

D
esint
egration
Soit f une application mesurable positive sur un espace mesure (X, A, ), alors
la formule
Z
[A] =
f d
A

definit une mesure = f sur X. Cette construction setend aux fonctions mesurables de signe arbitraire si lon definit comme une mesure signee : = (f+ )
(f ) (difference formelle dans le cas general, vraie difference si f+ ou f est integrable).
Reciproquement, etant donnee une mesure (signee ou pas) , peut-on trouver
une fonction f telle que = f ? Cette question est le point de depart de la theorie
de la d
esint
egration (pour passer de f `a on int`egre ; il est naturel de parler de
desintegration pour le probl`eme inverse).
Dans ce chapitre de nombreux resultats necessiteront de mettre de cote des
ensembles negligeables ; ces ensembles seront toujours implicitement choisis mesurables.
X-1. Th
eor`
eme de LebesgueRadonNikodym
Commencons par introduire deux notions naturelles, et en quelque sorte opposees.
D
efinition X-1. Soit (X, A, ) un espace mesure, et une mesure signee sur
(X, A). On dit que est mesurable par (ou -mesurable) sil existe une fonction
mesurable f : X R telle que = f . On dit que est etrang`ere `a si et sont
concentrees sur des ensembles mesurables disjoints ; dans ce cas on note .
Exemple X-2. Soient (X, A, ) un espace mesure, et f, g deux fonctions mesurables positives sur X, telles que g > 0 presque partout. Si lon pose = f , = g,
alors = h, o`
u h = f /g.
Le theor`eme suivant est lun des resultats les plus importants de la theorie de la
mesure :
or`
The
eme X-3 (decomposition de Lebesgue). Soient (X, A, ) un espace mesure -fini, et une mesure signee -finie sur (X, A). Alors il existe une fonction
mesurable f : X R et une mesure signee s , telle que
= f + s ,

s .

La mesure s est unique, et la fonction f est unique `a modification pr`es sur un


ensemble de -mesure nulle ; en particulier, la mesure f est unique.

336

CHAPITRE X

(13 juin 2010)

Notation X-4. La mesure s apparaissant dans le Theor`eme X-3 est dite partie
singuli`ere de par rapport `a . La fonction f apparaissant dans ce meme enonce
est appelee densite de RadonNikodym de par rapport `a , et notee
d
;
d
cette fonction nest bien definie qu`a un ensemble -negligeable pr`es.
f=

Intuitivement, f (x) est le quotient de deux elements infinitesimaux de mesure :


en termes informels,
(dx)
f (x) =
.
(dx)
La notation est justifiee en un certain sens par lobservation selon laquelle si , et
sont trois mesures telles que est -mesurable et est -mesurable, alors
d d
d
=
d
d d

-presque partout.

(Cest une variation sur lExemple X-2.)


Avant de prouver le Theor`eme X-3 nous allons discuter quelques remarques et
consequences.
Corollaire X-5 (Theor`eme de Radon Nikodym). Soient (X, A, ) un espace
mesure -fini, et une mesure signee -finie. Alors les deux enonces suivants sont
equivalents :
(i) ne charge aucun ensemble -negligeable ; cest-`a dire
h
i
(78)
N A,
[N] = 0 = [N] = 0 .
(ii) est -mesurable ; cest-`a-dire

(79)

f L(X, );

= f .

Exemple X-6. Soient = L[0,1] + 1 (mesure de Lebesgue sur R, restreinte `a


lintervalle [0, 1], `a laquelle on ajoute une masse de Dirac en 1) ; et = L[0,2] +0 +21 .
On a alors
d
= 1[0,1[ + 2{1} ;
s = L]1,2] + 0 .
d
Preuve du Corollaire X-5. Par le Theor`eme VI-50 (de decomposition de
Hahn) il existe des parties mesurables disjointes S+ et S telles que + et sont
concentrees sur S+ et S respectivement. Si N est un ensemble -negligeable, il
en est de meme de S+ N et S N, et lhypoth`ese implique donc [S+ N] =
[S N] = 0 ; il suffit donc de demontrer le corollaire dans le cas o`
u est une
mesure non signee, ce que nous allons supposer.
Soit maintenant N un ensemble -negligeable sur lequel s est concentree. Pour
tout A N on a [A] = 0, do`
u [A] = 0 par hypoth`ese, et bien s
ur (f )[A] = 0 ;
on en deduit s [A] = 0 ; s est donc la mesure nulle, et la conclusion suit.

Remarque X-7. Une terminologie quelque peu malheureuse mais tr`es bien implantee consiste `a dire que verifiant (78) est absolument continue par rapport `a ,

DESINT
EGRATION

337

ce que lon note (de mani`ere non moins malheureuse) . La terminologie absolue continuite sexplique comme suit : si est finie, la propriete (78) est equivalente
`a la propriete en apparence plus forte
> 0 > 0;

[A] = |[A]| ,

qui est analogue `a la notion dabsolue continuite dune fonction (voir la section X-4).
Cet enonce peut se demontrer de mani`ere elementaire ; on peut aussi le voir comme
consequence immediate du Corollaire X-5 et dun cas particulier du Theor`eme VII131 (theor`eme de compacite faible de DunfordPettis, que lon applique ici dans le
sens le plus facile, et avec lensemble {f } qui est trivialement compact).
Remarque X-8. Le Theor`eme de RadonNikodym se generalise pour des mesures `a valeurs dans un espace vectoriel de dimension finie, mais pas pour des mesures
`a valeurs dans un espace de Banach quelconque. On dit precisement quun espace
E verifie la PRN (Propriete de RadonNikodym !) si le Theor`eme X-5 sapplique
pour des mesures `a valeurs dans E.
Contre-exemple X-9. Soient la mesure de comptage sur R et la mesure
de Lebesgue. Alors ne charge aucun ensemble -negligeable (seul lensemble vide
verifie cette condition !), pour autant nest pas -mesurable. Ceci ne contredit pas
le Theor`eme de RadonNikodym puisque nest pas -finie.
Preuve du Th
eor`
eme X-3. 1. Si la conclusion du theor`eme est vraie, alors,
puisque et s sont etrang`eres on a
+ = (f + s )+ = f+ + (s )+ ;

= (f + s ) = f + (s ) .

Il suffit donc de demontrer le resultat en supposant que et s sont des mesures


non signees, et que f est une fonction positive ; cet argument fonctionne aussi bien
pour lexistence que pour lunicite. Dans la suite on fera cette hypoth`ese.
2. Supposons que la mesure se decompose de deux mani`eres differentes :
= f + s = f + s ;
alors
E = (f 1E ) + s E = (f 1E ) + s E .
Lunicite de la decomposition de E entranera donc f 1E = f 1E , -presque partout, et s E = s E . En introduisant une partition denombrable (Ek )kN de parties
mesurables de X, telles que [Ek ] et [Ek ] soient finis, on en deduira que f = f
-presque partout, et s = s .
De meme, si lon a lexistence de la decomposition de |E
de mesure
Ppour tout EP
finie, sous la forme E = fE + s,E , alors on posera f =
fEk , s =
s,Ek , et
ceci montrera lexistence de la decomposition. Il suffit donc de traiter le cas o`
uX
est de -mesure finie, et de -mesure finie, ce que lon supposera par la suite.
Recapitulons : il reste `a demontrer le Theor`eme X-3 pour des mesures finies
et . Pour cela plusieurs voies sont possibles. Limportance du resultat justifie que
lon presente deux arguments differents.
Premi`
ere preuve : Cette demonstration, due `a Von Neumann, utilise des arguments danalyse fonctionnelle. Soit la forme lineaire definie sur L2 ( + ) par
Z
h, i = d.

338

CHAPITRE X

(13 juin 2010)

Lestimation
sZ
sZ
sZ
sZ
d(x)
2 d(x)
d(x)
2 d( + )(x) = [X]1/2 kkL2 (+)
|h, i|
montre que est bien definie (et `a valeurs dans R), et quen outre elle est continue.
Par le Theor`eme de Riesz (cest-`a-dire le Theor`eme VII-87 dans le cas facile p = 2),
il existe h L2 ( + ) tel que
Z
2
L ( + ),
h, i = h d( + ).
Le choix = 1A , o`
u A est un ensemble mesurable arbitraire, montre que
(80)

h( + ) = .

On deduit de (80) (par unicite de la decomposition de Hahn, ou en appliquant


cette identite `a lensemble {h < 0}) que h 0, ( + )-presque partout.
Soit maintenant > 0, et B = {h 1+} ; en appliquant encore (80) on obtient
[B ] (1 + ) ( + )[B ] [B ] + ( + )[B ];

do`
u ( + )[B ] = 0. Soit B = {h > 1} ; comme B = kN B1/k on a ( + )[B] = 0.
Recapitulons : en-dehors dun ensemble ( + )-negligeable, on a
0 h 1.

En outre, lidentite [B] = ( + )[B] implique [B] = 0.


Posons m = 1X\B , s = 1B ; il est evident que = m + s , et s est
etrang`ere `a . Il reste `a demontrer que m = 1{h<1} est -mesurable. Pour cela on
ecrit
m = 1X\B h( + ) = 1X\B h + h = h m + h
(la premi`ere egalite decoule de (80), la deuxi`eme de ce que B est -negligeable, et
la derni`ere de la definition de m ). On a donc (1 h) m = h , ou de mani`ere
equivalente (puisque m est concentree sur h < 1)
(1 h)1h<1 m = h .

En divisant les deux membres par la fonction strictement positive (1 h) 1h<1, on


trouve


h
m =
1h<1 ;
1h
ce qui donne le resultat avec f = (h/(1 h))1h<1 .
Deuxi`
eme preuve : Cette demonstration plus elementaire (mais un peu plus
delicate) utilise des arguments de monotonie ; elle a ete perfectionnee par divers
auteurs, la version finale etant due `a Loomis (voir [Folland] pour plus de details).
Soit
n
o
F = f mesurable X [0, +]; f .

Bien s
ur F =
6 (0 F ). En outre, si f, g F , soit A = {f > g} et h = max(f, g),
alors
h = f 1A + g1X\A = 1A (f ) + 1X\A (g) 1A + 1X\A = ;
donc h F . Plus generalement, le maximum dun nombre fini delements de F est
lui-meme element de F .

DESINT
EGRATION

Pour tout f F on a

339
R

f d [X] ; do`
u
Z

a := sup
f d; f F [X] < +.

R
Soit maintenant (fn )nN une suite `a valeurs dans F telle que fn d a quand
n . En remplacant fn par max(f1 , . . . , fn ) F on peut supposer que la suite
(fn ) est croissante ; on pose alors f = sup fn . Par convergence monotone, pour tout
A mesurable on a
Z
f d = lim

fn d [A],

doncRf F . Une nouvelle application du theor`eme de convergence monotone montre


que f d = a.
Pour conclure la demonstration, il suffit de montrer que
e := f est etrang`ere
`a ; alors on aura la decomposition recherchee sous la forme = f + ( f ).
Pour tout k N, le Theor`eme VI-50 (de decomposition de Hahn) fournit un
ensemble mesurable Ak tel que (e
k 1 )+ est concentree sur Ak et (e
k 1 )
sur X \ Ak . On pose alors A = kN Ak et B = X \ A. Pour tout k N, la mesure
(e
k 1 )+ est concentree sur A, donc (e
k 1 )[B] 0, i.e.
e[B] k 1 [B]. En
faisant tendre k vers linfini on conclut que
e[B] = 0.
Si [A] > 0, alors il existe k N tel que [Ak ] > 0. En outre,
eAk k 1 Ak ;
en utilisant la definition de
e on en deduit
do`
u

Ak (f + k 1 ) Ak ,

f + k 1 1Ak .

En particulier g := f + k 1 1Ak appartient `a F ; mais ceci contredit


Z
Z
Z
1
g d = f d + k [Ak ] > f d.

On conclut que [A] = 0, donc


e, ce qui ach`eve la demonstration.

X-2. D
esint
egration

Le Theor`eme de RadonNikodym est le plus simple representant dune famille


denonces traitant du probl`eme de la desintegration. Il existe plusieurs notions de
desintegration ; dans cette section on en consid`erera deux : dabord la plus naturelle,
la desintegration fibre `a fibre, qui generalise le theor`eme de RadonNikodym ; puis
une notion plus faible qui necessite moins dhypoth`eses.
X-2.1. D
esint
egration fibre `
a fibre.
D
efinition X-10 (desintegration fibre `a fibre). Soient (X, A, ) et (Y, B, )
deux espaces mesures, et p : X Y une application mesurable. On appelle desintegration fibre `a fibre de par lapplication p une famille de mesures ( |y)
sur (X, A), indexees par y Y , telles que
(i) pour tout y Y , ( |y) est concentree sur p1 (y) ;
(ii) pour tout A A, [A|y] est une fonction B-mesurable de y, et
Z
(81)
[A] =
[A|y] (dy).
Y

340

CHAPITRE X

(13 juin 2010)

La mesure (dx|y) est appelee mesures conditionnelles (portee par la fibre p1 (y)) ;
on notera
Z
(dx) =
(dx|y) (dy).
Y

Remarque X-11. Quand on parle de de desintegration par p, lapplication p


ne doit pas etre consideree comme une application entre deux ensembles, mais bien
comme une application entre deux espaces mesurables. Prenons par exemple le cas
o`
u Y = X, B est une sous-tribu de A, et p est lapplication Id : X X ; la notion
de desintegration dependra alors crucialement du choix de B (via lhypoth`ese de
B-mesurabilite.

Remarque X-12. Dans la Definition X-10 les ensembles p1 (y) ne sont pas a
priori mesurables (sauf bien s
ur si les singletons sont B-mesurables) ; la propriete (i)
veut donc dire que pour tout ensemble mesurable A contenant p1 (y), [X \A|y] = 0
(Cf. Definition I-42). Cette generalite nest pas fondamentale, mais permettra de
faire le lien entre la notion de desintegration et le theor`eme de RadonNikodym
(Cas Particulier X-18).
Remarque X-13. Les conditions (i) et (ii) de la Definition X-10 sont un moyen
de traduire rigoureusement la definition informelle
(dx|y) =

(dx) p(x)=y
.
(dy)

En langage imprecis, il sagit de conditionner par levenement p(x) = y.


Remarque X-14. On peut generaliser cette definition pour inclure le cas o`
u
est une mesure signee, de sorte que les mesures (dx|y) sont aussi signees ; on peut
` v
egalement imposer que (dx|y) ait le meme signe que d(p# )/d en y. A
erifier.
Remarque X-15. La Definition X-10 est tr`es utilisee en probabilites, dans le cas
o`
u est une mesure de probabilites, = p# ; on a alors coutume dimposer que les
mesures (dx|y) soient des mesures de probabilites, que lon appelle probabilit
es
conditionnelles r
eguli`
eres. Intuitivement, si (dx) est la repartition attendue des
valeurs dune variable aleatoire X, (dx|y) est la repartition attendue des valeurs
de X sachant que p(X) vaut y.
Cas Particulier X-16. Soient (Y, B) et (Z, C) deux -alg`ebres ; soit X = Y Z,
muni de la tribu produit BC, et soit p : X Y la projection definie par p(y, z) = y.
Soit une mesure de probabilites sur X, et = p# sa marginale sur X ; desintegrer par p revient `a ecrire comme une superposition de mesures (de
probabilites) y = ( |y), de sorte que chaque y est concentree sur la fibre {y} Z
(et sidentifie donc `a une probabilite sur Z). On peut noter
(82)

(dy dz) = y (dz) (dy) = (dz|y) (dy).

La desintegration peut ainsi se voir comme une operation inverse de celle decrite `a
la sous-section III-2.4.
Exemple X-17. Avec les notations precedentes, soient et des mesures finies sur Y et Z respectivement, soit f (y, z) une fonction mesurable positive de
(y, z), et
(dy dz) = f (y, z) (dy) (dz).

DESINT
EGRATION

341

Alors on peut desintegrer sous la forme (82) en posant


Z

f (y, z) (dz)
Z
(dz|y) =
,
(dy) =
f (y, z) (dz) (dy).

Z
f (y, z ) (dz )
Z

Cas Particulier X-18. Soient et deux mesures -finies sur un espace


mesurable (X, A), telles que ne charge aucun ensemble -mesurable ; et soit f =
d/d la densite de RadonNikodym de par rapport `a . On obtient une desintegration de par lapplication p = Id en posant (dx|y) = f (y)y (dx). En
effet, cette mesure est evidemment concentree sur y, et
Z
Z
Z
Z
[A|y] (dy) = f (y) y [A] (dy) = f (y) 1yA (dy) =
f (y) (dy) = [A].
A

Ceci est un cas particulier de lExemple X-16, dans lequel Z est reduit `a un point.
Lenonce suivant presente quelques proprietes tr`es utiles des desintegrations :
Proposition X-19. Soient (X, A, ) et (Y, B, ) deux espaces mesures, p : X
Y une application mesurable, et ( |y) une -desintegration de par p. Alors
Z
1
(i) A A, B B,
[A p (B)] =
[A|y] (dy).
B

(ii) p# est -mesurable, et y 7 [X|y] est la densite de RadonNikodym de


p# par rapport `a :
(p# )(dy)
,
[X|y] =
(dy)
lidentite ayant lieu pour -presque tout y. En particulier, si p# = , alors ( |y)
est une mesure de probabilites, pour -presque tout y.
(iii) Pour tout F : X [0, +], mesurable pour la tribu produit A B,
Z
Z Z
F (x, p(x)) (dx) =
F (x, y) (dx|y) (dy).
X

Cette formule
reste vraie si F est mesurable X R et x 7 F (x, p(x)) L1 ()
R
(alors X F (x, y) (dx|y) est bien defini pour -presque tout y).
(iv) Pour toute fonction mesurable f : Y [0, +], la formule
Z
(83)
fY (y) =
f (x) (dx|y)
Y

definit une fonction mesurable de y ; en outre, pour toute fonction mesurable g :


X [0, +] on a
Z
Z
(84)
f (x) g(p(x)) (dx) =
fY (y) g(y) (dy).
X

Si f L1 (), lintegrale (83) est bien definie pour -presque tout y, et (quitte
`a redefinir fY sur un ensemble negligeable) cest une fonction mesurable de y. La

formule (84) reste en outre valable d`es que f Lq (w ) et g Lq (), o`


u q [1, ],
q = q/(q 1) w(x) = h(p(x))q1 , h = d(p# )/d.

342

CHAPITRE X

(13 juin 2010)

Remarque X-20. Si (X, A, ) est un espace de probabilite, B est une soustribu de A, p est lidentite (X, A) (X, B) et = p# , la fonction fY definie
par (83) est appelee esp
erance conditionnelle de f par rapport `a la sous-tribu
B. La formule (84) caracterise alors fY , et on lutilise souvent comme definition de
lesperance conditionnelle (typiquement dans le cas o`
u f L2 (), g L2 ()) sans
faire reference `a une quelconque desintegration. En fait lesperance conditionnelle,
ainsi definie, est une notion plus generale que la probabilite conditionnelle, et se
construit par un argument fonctionnel simple qui ressemble `a celui que lon a utilise
dans la premi`ere demonstration du Theor`eme de RadonNikodym (projeter f
L2 (X, A, ) sur lespace vectoriel L2 (X, B, )).
Remarque X-21. La formule apparaissant dans la Proposition X-19(i) est souvent prise comme definition de la desintegration dune mesure, `a la place des conditions (i) et (ii) de la Definition X-10. On obtient ainsi une notion plus generale de
mesures conditionnelles, qui verifie encore toutes les conclusions de la Proposition X19. Nous etudierons cette notion dans la section suivante.
Preuve de la Proposition X-19. Soient B B et y Y . Si y B, alors
( |y) est concentree sur lensemble mesurable p1 (B), donc [A p1 (B)|y] =
[A|y]. En revanche, si y
/ B, ( |y) est concentree sur Y \ p1 (B), donc [A
1
p (B)] = 0 ; on conclut que


A p1 (B)|y = 1yB [A|y],
pour tout y Y . Lidentite (81) implique alors
Z
Z
1
[A p (B)] =
1yB [A|y] (dy) =
[A|y] (dy),
Y

ce qui prouve (i).


En particulier, pour tout B B, on a
1

p# [B] = [p (B)] =

[X|y] (dy),

ce qui implique (ii).


Notons (dx dy) = (dx|y) (dy) (soit y dans les notations de la soussection III-2.4). La formule (i) montre que
Z
Z
F (x, p(x)) (dx) =
Y F (x, y) (dx dy)
(85)
X

dans le cas particulier o`


u F (x, y) = 1xA 1yB , A A, B B. Les deux membres
de (85) sont stables par limite croissante et difference, et la classe monotone engendree par les paves A B est la tribu produit enti`ere (Theor`eme I-68) ; on en
deduit que (85) est vrai d`es que F est lindicatrice dun ensemble mesurable pour la
tribu produit. Par un nouvel argument de limite monotone, cela est vrai pour toute
fonction F mesurable positive. La generalisation `a F L1 se fait selon les memes
lignes que le Theor`eme de Fubini (Theor`eme III-50).
Enfin, pour
R obtenir (iv), il suffit
R de poser F (x, y) = f (x) g(y) dans (iii), et
de noter que F (x, y) (dx dy) = fY (y) g(y) (dy). Dans le cas o`
u f et g sont
positives, cela ne demande aucune justification particuli`ere ; dans le cas general, il

DESINT
EGRATION

343

convient de verifier que les integrales sont bien definies sous les conditions enoncees.
Pour cela on remarque dabord que
Z Z
Z
q
q1
|f (x)| (dx|y) h(y) (dy) =
|f (x)|q h(p(x))q1 (dx) < +;
Y

lintegrale X |f (x)|q (dx|y) est donc finie pour -presque tout y (a priori seulement
en-dehors de lensemble Z o`
u h sannule ; mais cet ensemble est (p# )-negligeable,
donc ( |y) = 0 pour -presque
tout y Z). Comme [X|y] est fini pour R
presque tout y, on a bien X |f (x)| (dx|y) < + presque partout. Ensuite on utilise
linegalite de Holder et la definition de la mesure image pour obtenir lestimation
 q1 Z
Z
 1
Z
q
1/q q
1/q q
|f (x)| |g(p(x))| (dx)
|f (x) w(x) | d(x)
|g(p(x)) w(x)
| d(x)
=
=
=

Z

Z
Z

|f (x)| w(x) d(x)


q

|f (x)| w(x) d(x)


q

|f (x)| w(x) d(x)

 q1 Z
 q1 Z
 q1 Z

Ceci conclut la preuve de la Proposition X-19.

|g(p(x))| h(p(x))
q

|g(y)| h(y)
q

|g(y)| d(y)

 1
q

d(x)

 1
q

d(p# )(y)

 1
q

< +.


Pour linstant nous navons pas repondu `a la question de savoir si lon peut effectivement desintegrer des mesures sous des hypoth`eses assez generales. Ce probl`eme
est delicat, en contraste avec le Theor`eme de RadonNikodym pour lequel nous
avions une solution compl`ete sous lhypoth`ese de -additivite. Il est dailleurs bien
connu en probabilites que lexistence des probabilites conditionnelles est un probl`eme
beaucoup plus difficile que celui de lexistence des esperances conditionnelles.
Le theor`eme suivant, dont on peut trouver diverses variantes dans la litterature,
apporte une solution suffisamment generale pour couvrir les besoins courants. On
rappelle quun espace polonais est un espace metrique separable complet. On dira
quun espace mesurable (Y, B) est denombrablement engendre sil existe une sousfamille B denombrable incluse dans B telle que (B ) = B.
Th
eor`
eme X-22 (Theor`eme de desintegration). Soit X un espace polonais,
muni de sa tribu borelienne A, et dune mesure de Borel -finie . Soit (Y, B) un
espace mesurable denombrablement engendre, dans lequel les singletons sont mesurables, et soit une mesure -finie sur Y . Soit p une application mesurable X Y ;
on suppose que p# ne charge pas les ensembles -negligeables. Alors il existe une
-desintegration de par p :
(dx) = (dx|y) (dy),
satisfaisant les conditions de la Definition X-10.
En outre, cette desintegration est unique `a modification sur un ensemble negligeable pr`es ; de mani`ere explicite, si (dx|y) et (dx|y) sont deux -desintegrations
de par p, alors il existe un ensemble negligeable N tel que pour tout y Y \ N on
ait ( |y) = ( |y ).

344

CHAPITRE X

(13 juin 2010)

Exemple X-23. Lespace (Y, B) verifie bien s


ur les hypoth`eses requises si cest
la tribu borelienne dun espace metrique separable, puisque cette tribu est engendree
par une famille denombrable (voir le Theor`eme I-32).
Remarque X-24. Autant lhypoth`ese selon laquelle B contient les singletons est
dordinaire facile `a verifier ou infirmer en pratique, autant lhypoth`ese selon laquelle
B est denombrablement engendree peut saverer tratresse. Il est important de noter
`a cet egard que cette propriete ne sherite pas : ce nest pas parce quune tribu A
est denombrablement engendree que ses sous-tribus le sont aussi.
Exemple X-25. Soit A la tribu borelienne de R, et B la tribu engendree par les
points : B est constituee des parties qui sont denombrables ou de complementaire
denombrable. On pourra montrer en exercice que B nest pas denombrablement
engendree.
Remarque X-26. Si B ne verifie pas les hypoth`eses demandees dans lenonce du
Theor`eme X-22, on peut toujours prouver lexistence de mesures ( |y) verifiant (86) ;
ce que de nombreux auteurs appellent mesures conditionnelles. Cest lobjet de la
section suivante.
Lidee de la preuve du Theor`eme X-22 est naturelle : dapr`es la Proposition X19(i) les quantites [A|y] recherchees doivent verifier
Z
(86)
A A, B B,
[A|y] (dy) = [A p1 (B)] = (p# A )[B],
B

o`
u A est la mesure definie par A [C] = [A C]. Il sensuit que y 7 [A|y]
est la densite de RadonNikodym de A par rapport `a (bien definie grace au
Corollaire X-5). Le probl`eme est que cette densite est seulement definie `a un ensemble
negligeable pr`es, qui depend de A. Comme A nest pas a priori denombrable, on ne
peut se permettre dexclure lunion de tous ces ensembles negligeables ; `a la place on
va utiliser les hypoth`eses topologiques pour se ramener `a une famille denombrable
densembles mesurables A.
Preuve du Th
eor`
eme X-22. 1. On commence par se ramener au cas o`
u est
finie, de la meme facon que dans la preuve du Theor`eme X-3. Pour cela on peut noter
que X est union croissante de compacts (K )N de -mesure finie (Theor`eme I-54) et
que chaque K est un espace polonais ; de meme, Y est union croissante densembles
mesurables Yk de mesure finie, et chaque Yk peut etre vu comme un espace mesurable
engendre par une partie denombrable.
2. Soit D un ensemble dense denombrable dans X, et soit C la collection de toutes
les unions finies de boules B(x, r), o`
u x D et r est un nombre rationnel positif.
La famille C est (au plus) denombrable, et on lordonne de mani`ere arbitraire :
C = {Ck ; k N}. Par le Theor`eme I-32, C engendre la tribu borelienne enti`ere.
Lalg`ebre A engendree par C est denombrable, comme union croissante des alg`ebres
finies engendrees par {C1 , . . . , Ck } (k N). On ordonne A = {A ; N}.
` ce stade on peut dej`a montrer lunicite de la desintegration. Si (dx|y) est
3. A
une desintegration admissible, alors, comme on la dej`a remarque, la Proposition X19(i) implique
Z
(87)
[A|y] (dy) = [A p1 (B)] = (p# A )[B]
B

DESINT
EGRATION

345

pour tous A A, C B, o`
u A [C] = [A C] ; et donc y 7 [A|y] est la densite
de RadonNikodym de p# A . Si (dx|y) est (dx|y) sont deux desintegrations admissibles, pour tout A A les fonctions [A|y] et [A|y] concident pour -presque
tout y, cest-`a-dire pour tout y Y \ N(A), o`
u N(A) est un ensemble -negligeable.
Soit N lunion des N(A) pour A A : N est -negligeable et
y Y \ N, A A ,

[A|y] = [A|y].

Si lon fixe y Y \ N, les mesures ( |y) et ( |y) concident sur A , donc sur la
classe monotone engendree par A , qui dapr`es le Theor`eme I-68 nest autre que la
tribu A tout enti`ere.
4. Lexistence nous donnera plus de fil `a retordre, et tout particuli`erement la
propriete de -additivite, pour laquelle nous allons utiliser la regularite via la Proposition I-52.
Par le Theor`eme I-54, est reguli`ere, donc pour tout N on peut trouver une
suite croissante de compacts (Km )mN telle que Km A et
[Km ] [A ].

(88)

Soit A lalg`ebre engendree par les A et les Km (, m N) ; cette alg`ebre est


encore denombrable. Pour tout A A on definit une mesure A sur B par la
formule A = p# (A ), soit
A [B] = [A p1 (B)].

Bien s
ur A p# ; en particulier A ne charge aucun ensemble -negligeable, et
par le Theor`eme de RadonNikodym (Corollaire X-5) A admet une densite fA par
rapport `a : A = fA , soit encore
Z
1
[A p (B)] =
fA (y) (dy).
B

Pour chaque A A , fA est positive en-dehors dun ensemble -negligeable


N(A).
Soient A1 , . . . , Ak des elements disjoints de A (k N, k 2) ; et soit A = Aj .
Bien s
ur A = A1 + . . . + Ak , donc fA = (fA1 + . . . + fAk ) . Il existe donc un
ensemble negligeable N(A1 , . . . , Ak ) Y tel que [N(A1 , . . . , Ak )] = 0 et
(89)

y Y \ N(A1 , . . . , Ak ),

fA (y) = fA1 (y) + . . . + fAk (y).

Pour tous , m N linclusion Km A implique Km A , do`


u fKm fA
en-dehors dun ensemble -negligeable N(, m). La relation (88) se reecrit
Z
Z
fKm (y) (dy) fA (y) (dy),
m

soit encore


fA (y) fKm (y) (dy) 0.

Quitte `a restreindre lintegrale au complementaire de lunion des N(, m) (m N),


on peut supposer que lintegrande est partout positif, et cette limite implique la
convergence presque partout de fA fKm vers 0. Il existe donc un ensemble negligeable N() tel que
(90)

y Y \ N(),

fKm (y) fA (y).


m

346

CHAPITRE X

(13 juin 2010)

Soit N lunion de tous les N(A) (A A ), de tous les N(A1 , . . . , Ak ) (Aj

A , k 2), et de tous les N() ( N). Etant


une union denombrable densembles
negligeables, N est lui-meme negligeable. Pour tout y Y \ N, on a donc par
construction
(i) Pour tout A A , fA (y) 0 ;
(ii) Pour tout k N et toutes parties disjointes A1 , . . . , Ak A , fA1 ...Ak (y) =
Pk
j=1 fAj (y).
(iii) Pour tout A A il existe une suite (Km )mN de compacts inclus dans A
tels que fKm (y) fA (y).
Pour tout y Y \ N on definit y : A R+ par la formule
y [A] = fA (y);

les relations (i)(iii) montrent que y est une fonction additive densembles. En
outre, pour tout A A on a
o
n

y [A] = sup y [K]; K compact, K A, K A .

Par la Proposition I-52, on deduit que y est -additive sur A . Le Theor`eme de


prolongement de Caratheodory (Theor`eme I-69) permet detendre y en une mesure
definie sur A tout entier.
On deduit du theor`eme de convergence monotone que
n
o
A A; y 7 y [A] est mesurable sur Y \ N
est une classe monotone ; comme cet ensemble contient A, il doit contenir A tout
entier.
On pose y = 0 pour y Y \ N ; comme N est mesurable, lapplication y reste
mesurable en y. En outre on a, pour tou A A et pour tout B B,
Z
1
(91)
[A p (B)] =
y [A] (dy).
B

Si lon fixe B, cette relation reste vraie (par -additivite et convergence monotone) sur la classe monotone engendree par A , qui dapr`es le Theor`eme I-68
est A tout entier ; on conclut que la relation (91) est vraie pour tout A A et
pour tout B B. (Rappelons que ceci est une definition souvent adoptee pour la
desintegration.)
5. Le choix B = Y dans (91) donne
[A] =Y y [A] (dy),
de sorte que la condition (i) dans la Definition X-10 est satisfaite.
La condition (ii) va demander plus de travail. La preuve de la Proposition X19(iii) sapplique pour montrer que
Z
Z
(92)
F (x, p(x)) (dx) =
F (x, y) y (dx) (dy)
X

XY

pour toute fonction F mesurable X Y R+ .


Admettons provisoirement que la diagonale = {(y, y); y Y } est mesurable
dans Y Y ; alors
F : (x, y) 7 1p(x)6=y

DESINT
EGRATION

347

est mesurable X Y R+ comme composee des fonctions mesurables (x, y) 7


(p(x), y) et (z, y) 7 1z6=y . En appliquant la formule (92) `a F on trouve
Z
Z
1
y [X \ p (y)] (dy) = 1p(x)6=y y (dx) (dy)
Y
Z
= 1p(x)6=p(x) (dx) = 0.

On en deduit que pour tout y en-dehors dun ensemble negligeable N on a y [X \


p1 (y)] = 0. En posant
(
y si y
/ N
( |y) =
0 si y N
on obtient une famille ( |y) verifiant toutes les conditions souhaitees.
Il reste seulement `a montrer que est mesurable dans B B. Par hypoth`ese
B est engendree par une famille denombrable B = (Bk )kN . Pour tout k N,
lalg`ebre finie B (k) engendree par {B1 , . . . , Bk } est associee `a une partition finie
k
(Y1k , . . . , Y(k)
) de Y (Exercice I-4(i)). Soient
\
[
e =
Yik Yik ;

k .
k =
i(k)

kN

e . Sil existe y 6= x tel que (x, y) ,


e
Bien s
ur k pour tout k, donc

cela veut dire que pour tout k N, aucun element de B (k) ne separe x de y ;
plus explicitement, pour tout B B (k) on a soit {x, y} B, soit {x, y} B = .
Mais lensemble des B B verifiant cette propriete est une -alg`ebre, et comme
elle contient tous les Bk , elle concide avec B tout enti`ere. Ceci est en contradiction
e ce qui ach`eve
avec lhypoth`ese de mesurabilite de {x}. On conclut que = ,
largument.


X-2.2. D
esint
egration g
en
eralis
ee. Cette sous-section peut etre omise en
premi`ere lecture. Le Theor`eme X-22 a beau sembler tr`es general, il nest pas assez
puissant pour traiter toutes les situations dinteret. On ressent en effet le besoin,
dans de nombreux probl`emes (non academiques !), de desintegrer par rapport `a un
espace mesurable pathologique dans lequel les points ne sont pas mesurables, ou
la tribu nest pas denombrablement engendree.
Pour traiter de telles situations, le rem`ede consiste `a affaiblir la definition de la
desintegration en utilisant la Propriete (i) dans la Proposition X-19 comme definition
generalisee.
D
efinition X-27 (desintegration generalisee). Soient (X, A, ), (Y, B, ) deux
espaces mesurables, et (Z, C) un espace mesure. Soient p : X Z et q : Y Z deux
applications mesurables. On appelle -desintegration de par (p, q) une famille de
mesures (dx|z) sur X, indexees par z Z, telles que pour tout A A, z 7 [A|z]
est mesurable, et
Z
1
A A, C C,
[A p (C)] =
[A|q(y)] (dy).
q 1 (C)

Remarque X-28. Lapplication q est incluse par commodite et ne joue pas un


role crucial : en munissant Z de la mesure q# , on peut toujours se ramener au cas
o`
u q = Id.

348

CHAPITRE X

(13 juin 2010)

Voici maintenant une variante du Theor`eme X-22 :


or`
The
eme X-29 (desintegration generalisee). Soient (X, A, ) un espace polonais -fini, (Y, B, ) un espace mesure -fini, et (Z, C) un espace mesurable. Soient
p : X Z une application mesurable, et q : Y Z une application mesurable
surjective. On suppose que pour tout N C, tel que q(N) est mesurable,
[N] = 0 =

[p1 (q(N))] = 0.

Alors il existe une -desintegration de par (p, q), cest-`a dire une famille de mesures
(dx|z) dependant mesurablement de z, telles que
Z
1
(93)
A A, C C,
[A p (C)] =
[A|q(y)] (dy).
q 1 (C)

Toutes les proprietes enoncees dans la Proposition X-19 sont alors vraies.
En outre, si (dx|z) et (dx|z) sont deux desintegrations admissibles, alors il
existe un ensemble -negligeable N tel que
y Y \ N,

( |q(y)) = ( |q(y)).

De plus, si C C est fixe, alors pour (dy)-presque tout y on a


[p1 (C)|q(y)] = 1q(y)C h(q(y)),
o`
u h = d(p# )/d(q# ).
Si en outre C est engendre par une famille denombrable, alors pour -presque
tout y Y la mesure ( |q(y)) est concentree sur p1 (a(q(y))), o`
u
\
a(z) =
C
cCC

est latome engendre par z.


Remarque X-30. On ne peut en general esperer que les mesures z = ( |z)
soient portees par les fibres p1 (y) ; lobstacle technique etant la non-mesurabilite a
priori de la diagonale = {(z, z)} Z Z (pour la tribu produit).
Remarque X-31. Si (Z, C) est un ensemble mesurable quelconque, latome engendre dans Z par un point z nest pas en general un ensemble mesurable ; mais cela
devient vrai si C est engendre par une famille denombrable.
Remarque X-32. Dans le cas o`
u (X, A, ) est un espace de probabilites, (Z, C) =
(Y, B), q = Id et = p# , les mesures (dx|y) sont appelees probabilit
es conditionnelles de par rapport aux valeurs de p. Dans le cas o`
u (presque) toute mesure ( |y) est concentree sur latome a(y) on parle de probabilites conditionnelles
reguli`eres.
Preuve du Th
eor`
eme X-29. La preuve est en grande partie semblable `a celle
du Theor`eme X-22, et je nindiquerai donc que les differences. On commence par se
ramener au cas o`
u et sont finies, et on introduit A une alg`ebre denombrable
engendrant A. Si lon dispose dune desintegration admissible, alors pour tous C C

DESINT
EGRATION

et A A,

349

[A|z] (q# )(dz) =

1C (z) [A|z] (q# )(dz)

1C (q(y)) [A|q(y)] (dy)

[A|q(y)] (dy)

q 1 (C)

= [A p1 (C)] = A [C],
o`
u A = p# (A ). Par consequent, pour tout A A fixe, z 7 [A|z] est la densite
de RadonNikodym de A par rapport `a q# .
Si ( |z) et ( |z) sont deux decompositions admissibles, pour tout A on peut
trouver un ensemble mesurable NA C tel que pour q# [NA ] = 0 et
[A|z] = [A|z].

z Z \ NA ,

Soit N la reunion de tous les NA quand A varie dans la famille denombrable A : N


est toujours negligeable, et
z Z \ N, A A ,

[A|z] = [A|z].

Comme A engendre A, on conclut que ( |z) = ( |z), pour (q# )-presque tout
z ; de mani`ere equivalente, ( |q(y)) = ( |q(y)) pour -presque tout y.
On note ensuite que pour tout A A, A = p# (A ) ne charge pas les ensembles
(q# )-negligeables. En effet, si q# [N] = 0, i.e. [q 1 (N)] = 0, alors par hypoth`ese
p1 (N) = p1 (q(q 1 (N))) est -negligeable, donc A [N] = [A p1 (N)] = 0. (Ici
on a utilise la surjectivite de q via lidentite N = q(q 1 (N)).)
On peut donc definir fA comme la densite de RadonNikodym de A par rapport
`a q# , et on pose
[A|z] = fA (z).
On demontre exactement comme dans la preuve du Theor`eme X-22 que pour tout z
en dehors dun ensemble de q# -mesure nulle, fA (z) est -additive en A et mesurable
en z. On arrive ainsi `a lanalogue de la formule (91) :
Z
1
[A p (C)] =
y [A] (q# )(dy)
C
Z
=
[A|q(y)] (dy).
q 1 (C)

Ensuite, pour tous C et C dans C, on peut ecrire


Z
Z
1C (z) (p# )(dz) =
1C (z) 1C (z) (p# )(dz)
C

= p# [C C ]

= [p1 (C C )]

= [p1 (C) p1 (C )]
Z
=
[p1 (C)|z] (q# )(dz).
C

350

CHAPITRE X

(13 juin 2010)

Il sensuit que z 7 [p1 (C)|z] est la densite de RadonNikodym de 1C p# par


rapport `a q# ; il existe donc un ensemble q# -negligeable NC tel que
z Z \ NC ,

[p1 (C)|z] = 1C (z) h(z),

o`
u h = d(p# )/d(q# ).
Supposons maintenant que C est denombrablement engendree ; on veut montrer
que z = ( |z) est concentree sur latome a(z), pour q# -presque tout z.
Montrons dabord que a(z) est mesurable. Soit C une alg`ebre denombrable engendrant C, et soit a (z) lintersection de tous les elements de C contenant z. Bien
s
ur a(z) a (z), et a (z) est mesurable. Le probl`eme est de montrer que a(z) = a (z).
Soit
n
o

e
C = C C; z C = a (z) C .

e On verifie facilement que C est une classe monotone, et


Par construction C C.
le Lemme de Classe Monotone (Theor`eme I-68) entrane lidentite Ce = C, ce qui
prouve le resultat.
Soient ensuite C une alg`ebre denombrable engendrant C, et N la reunion de tous
les NC . On a alors
(94)

z Z \ N, C C

[p1 (C)|z] = 1C (z) h(z).

` z fixe, les deux membres de cette identite (considerees comme fonctions de C C)


A
definissent des mesures finies, qui concident sur C . Une nouvelle application du
Lemme de Classe Monotone montre que ces deux mesures concident sur C tout
entier. On conclut que
z Z \ N, C C

p# z [C] = 1C (z) h(z),

et le resultat final sobtient en choisissant C = Z \ a(z).

Le Theor`eme X-29 rend de grands services. Il en existe diverses variantes montrant que si , verifient certaines hypoth`eses (invariances, symetries, ...) alors on
peut imposer aux mesures conditionnelles de verifier des hypoth`eses en rapport. Le
schema de ces demonstrations est en general le meme que celui que lon a utilise
pour montrer la concentration atomique :
- en appliquant la formule (93) `a des ensembles bien choisis, on montre que
[A|z] est densite de RadonNikodym dune certaine mesure, pour tout A dans un
ensemble bien choisi ;
- par unicite de cette densite, on tire des conclusions sur [A|z] hors dun ensemble negligeable de points z ; cet ensemble peut etre choisi independant de A si A
varie dans une famille denombrable ;
` z fixe, on montre que si la propriete est vraie pour A dans une famille
- A
denombrable fixee a priori, elle reste vraie pour tout A dans la classe souhaitee.
` titre dexemple, esLa mise en oeuvre de cette strategie peut saverer subtile. A
sayons de demontrer lenonce suivant, fort utile en theorie des syst`emes dynamiques :
or`
The
eme X-33. Soit X un espace polonais muni de sa tribu borelienne A et
dune mesure -finie . Soit T : X X une bijection bimesurable ; pour toute partie
A de X, on note S(A) le sature de A pour laction de T : S(A) = kZ T k (A). On

DESINT
EGRATION

351

suppose que est quasi-invariante, cest-`a-dire que pour tout ensemble -negligeable
N, on a [T (N)] = 0. Alors on peut desintegrer sous la forme
Z
(dx) =
y (dx) (dy),
X

o`
u les mesures conditionnelles y verifient (a) y = y si yRy ; (b) y est ergodique,
cest-`
a dire que pour tout ensemble mesurable sature S on a y [S] {0, 1}.

Tentative de preuve. Pour faire entrer cet enonce dans le cadre du Theor`eme X29, posons (Y, B, ) = (X, A, ) ; definissons Z comme lespace quotient X/R, p = q
comme lapplication qui `a un point associe sa classe dequivalence, et munissons Z
de la tribu image C = p# A.
Le Theor`eme X-29 nous fournit une desintegration en mesures conditionnelles
y = ( |q(y)) indexees par y X, et la condition (a) est evidemment verifiee.
Soit maintenant A un ensemble sature ; de mani`ere equivalente A = p1 (C)
pour un certain C C. Comme dans la preuve du Theor`eme X-29 on montre que
z 7 [p1 (C)|z] est la densite de RadonNikodym de 1C p# par rapport `a p# ;
autrement dit, pour tout z en-dehors dun ensemble negligeable NA ,
z [A] = 1C (z).
En particulier, z [A] {0, 1}. Si lon savait montrer que cette propriete est vraie
pour tout z en-dehors dun ensemble negligeable independant de A, on aurait la
propriete (b).... mais comme p# A nest pas a priori denombrablement engendree (et
cela est faux en general), le raisonnement secroule.
En fait la preuve est plus subtile. Indiquer une r
ef
erence ou terminer la
preuve.

Remarque X-34. Pour certains exemples simples, Z, muni de la mesure image
p# , est un espace mesure fortement pathologique : typiquement, tout ensemble
mesurable est soit de mesure nulle soit de mesure pleine ! La situation rappelle
dailleurs celle de lExemple X-25.
X-3. D
esint
egration constructive
(seulement dans des espaces loc cpt....)
` REDIGER

A
X-4. D
erivation des fonctions absolument continues
` REDIGER

A
X-5. D
ecomposition des mesures dune infinit
e de variables
` REDIGER

CHAPITRE XI

` COMPLETER

Analyse de Fourier A
Lanalyse de Fourier est un ensemble doutils ayant pour denominateur commun
la decomposition frequentielle des fonctions. Sa naissance remonte `a un traite cel`ebre
de Fourier (Theorie analytique de la chaleur, 1822).
Initialement concue pour lanalyse mathematique des phenom`enes physiques,
lanalyse de Fourier sest revelee dune utilite prodigieuse dans `a peu pr`es toutes les
branches des mathematiques, voire de toutes les sciences.
Dans ce chapitre nous allons passer en revue quelques aspects marquants de
lanalyse de Fourier. Le style sera assez different de celui des autres chapitres : on y
sacrifiera la generalite `a la simplicite et `a la variete des applications ; on admettra
en outre de nombreuses digressions, et un certain recouvrement avec le chapitre
precedent. (Analyse sur les groupes ab
eliens)
Le sujet peut etre complete par la lecture de [Korner] ou de [DymMcKean] pour
les applications (la premi`ere source est plus simple, et remarquable de pedagogie) ; de
[DhombresRobert] et [Kahane] pour les aspects historiques ; de [Duoandikoetxea]
et [Folland] pour les aspects analytiques plus avances.
NdCV : Folland serait peut-
etre mieux `
a sa place dans les cmtr du
chapitre pr
ec
edent ;
egalement v
erifier que la TF de la gaussienne est
quelque part

XI-1. Th
eorie de Fourier
XI-1.1. Contexte et motivations. En depit des railleries de Hugo et Stendhal `a son encontre, Fourier (Joseph de son prenom) laissera son nom `a la posterite
`a plus dun titre : en tant quegyptologue, une specialite quil bouleverse `a la suite de
sa participation `a lexpedition napoleonienne ; en tant quhomme politique puisquil
est prefet dIs`ere sous Napoleon Bonaparte et sous la Restauration ; en tant quadministrateur, comme reorganisateur des statistiques francaises ; et enfin en tant que
scientifique, la consecration de sa carri`ere etant son election au poste de secretaire
perpetuel de lAcademie des Sciences. Pour tous les mathematiciens, il reste le fondateur de lanalyse de Fourier, quil cree au debut du dix-neuvi`eme si`ecle pour etudier
mathematiquement la repartition de chaleur dans un corps conducteur.
Quelques rep`eres chronologiques :
1807 : Fourier ecrit lequation de la chaleur
1808 : Le memoire de Fourier est accepte par lAcademie des Sciences en depit de
serieuses critiques concernant la rigueur des demonstrations (Fourier a en particulier
une controverse avec Poisson)
1822 : Publication du Traite analytique de la chaleur, version remaniee et augmentee du memoire de Fourier, qui simposera comme lun des ouvrages scientifiques
majeurs du dix-neuvi`eme si`ecle.

354

CHAPITRE XI

(13 juin 2010)

La lecture du Traite analytique est toujours profitable ; la premi`ere phrase sonne


comme une profession de foi : Les causes primordiales ne nous sont point connus ;
mais elles sont assujetties `a des lois simples et constantes, que lon peut decouvrir par
lobservation, et dont letude est lobjet de la philosophie naturelle. Fourier confesse
donc son ambition de decrire des phenom`enes physiques jusque l`a juges inaccessibles,
par le moyen des mathematiques ; il le confirme dans le choix dune devise en latin
(attribuee par Fourier `a Aristote, mais probablement inventee par lui-meme) : Et
ignem regunt numeri (Meme le feu est regi par les nombres).
Lidee matresse de Fourier, celle que lon lui attribue le plus naturellement,
consiste `a decomposer une fonction periodique arbitraire sous forme de serie trigonometrique :
X
f (x) =
an cos nx + bn sin nx.

Des decompositions de ce style ne sont pas `a proprement parler nouvelles : elles


faisaient partie du repertoire des analystes de la fin du dix-huiti`eme si`ecle, `a commencer par le plus impressionnant dentre eux, le Suisse Euler. Mais Fourier est le
premier `a avoir lintuition du caract`ere universel et particuli`erement commode de
cette decomposition trigonometrique. (Dans la suite, on utilisera souvent la notation
complexe, et la formule ei = cos + i sin .)
Fourier donne quelques exemples frappants pour montrer que nimporte quelle
fonction est decomposable en serie trigonometrique : ainsi, les deux fonctions dont
le graphe est represente ci-dessous : une fonction en dents de scie et une autre en
creneaux.

Fig. 1. Deux exemples de fonctions periodiques decomposables en


series trigonometriques

Pour la premi`ere, nous avons en effet la formule


sin x sin 3x sin 5x sin 7x

x= 2
+

+ ...
4
1
32
52
72
X
sin(2k + 1)x
,
=
(1)2k+1
2
(2k
+
1)
k0

` COMPLETER

ANALYSE DE FOURIER A

355

pour tout x [, ]. Pour la seconde fonction (qui nest autre que la derivee de la
premi`ere),
cos x cos 3x cos 5x cos 7x

+ ...
4
1
3
5
7
X
cos(2k + 1)x
(1)2k+1
=
,
2k + 1
k0
`a nouveau pour tout x [, ].
On voit ainsi que meme des fonctions discontinues peuvent etre exprimees en
series de Fourier, pourvu que lon definisse
(95)

f (x) =


1
f (x+ ) + f (x )
2

aux points de discontinuite (condition de demi-somme). Cela pouvait paratre surprenant `a lepoque de Fourier, mais bien s
ur ce nest pas contradictoire avec les
theor`emes connus : une serie de fonctions continues nest pas en general continue.
Lacte de foi suivant consiste `a admettre que des decompositions similaires sappliquent `a des fonctions non periodiques (definies sur R tout entier). Pour deviner
la forme que doit prendre cette decomposition, considerons une fonction f un peu
quelconque, et fT sa periodisee de periode T > 0 (on restreint f `a [0, T ] et on etend
le resultat par periodicite). Decomposant fT en serie de Fourier, on a
X
x
cn,T e2in T .
x [0, T ]
f (x) =
nZ

Le coefficient e2inx/T depend de n et T uniquement via le quotient n/T ; il nest


donc pas absurde de parier que les coefficients cn,T dependront asymptotiquement
de ce meme quotient dans la limite T . Au cours de ce processus, les coefficients
n/T appartenant `a un intervalle donne seront de plus en plus nombreux, et il est
egalement naturel de remplacer la somme par sa version continue, lintegrale. On
arrive donc `a deviner la forme suivante :
Z
X n
n
2ix T
f (x)
c
e
c()e2ix .
T

n
Cest la forme des integrales de Fourier, ou transform
ees de Fourier. Voici un
exemple simple : soit h la fonction definie par

0 si |x| > 1
h(x) = 1 x si 1 < x < 0 ;

1 x si 0 < x < 1
alors

h(x) =

(2i)

1 sin
2

eix dx.

Bien s
ur, ces formules appellent instantanement quelques questions : comment
trouver les coefficients ? (probl`eme de lanalyse) En quel sens faut-il comprendre la
convergence de ces series ?

356

CHAPITRE XI

(13 juin 2010)

XI-1.2. Formules danalyse. Soit f une fonction 1-periodique, consideree


comme fonction sur le tore T = R/Z, et decomposee en serie de Fourier : f (x) =
P
cn e2inx . Si lon est autorise `a echanger somme et integration, on a

Z
X Z
2ikx
2i(n+k)x
f (x)e
dx =
cn
e
dx = ck .
T

(En effet, le coefficient entre parenth`eses vaut toujours 0, sauf si n = k, auquel cas
il vaut 1.)
On en deduit la formule dinversion des series de Fourier (dej`a connue dEuler) :
Z
cn = e2inx f (x) dx.
Par passage au continu, on devine egalement la formule
pour des
R dinversion
2ix
fonctions definies sur R entier (non periodiques) : si f (x) = e
g() d, alors
Z
g() = e2ix f (x) dx.

Ces formules sont les formules de la transform


ee de Fourier.
Pour recapituler :
La transformee de Fourier dune fonction f : T C, Lebesgue-integrable, est
la suite de coefficients (ck (f ))kZ, definie par
Z
ck (f ) = e2ikx f (x) dx.

La transformee de Fourier dune fonction f : R C, Lebesgue-integrable, est


la fonction fb : R C definie par
Z
fb() = e2ix f (x) dx.

Remarque XI-1. Comme on la vu au Chapitre ??, ces formules se generalisent


considerablement, le cadre naturel etant celui des groupes abeliens, (T ou R dans les
exemples precedents). Ainsi on a une formule dinversion de Fourier pour les fonctions definies sur le groupe (fini) des racines n-`emes de lunite. Mettre formules.
Remarque XI-2. Les formules de la synth`ese (ou inversion) sont tr`es semblables
`a celles de lanalyse :
Z
X
2ikx
f (x) =
ck (f ) e
;
f (x) = e2ix fb() d.
kZ

Cependant le signe dans lexponentielle est different !

Remarque XI-3. Cest un probl`eme un peu subtil que de savoir quand les
formules de synth`ese sont valides. Mais on peut dej`a noter que dans le processus
danalyse de Fourier, sous des hypoth`eses assez generales, il ny a pas de perte dinformation. Pour les fonctions periodiques cest un theor`eme d
u `a Fejer : si f est
periodique, continue par morceaux et verifiant la condition de demi-somme (95),
alors f est uniquement determinee par les coefficients ck (f ). De meme, si f : R C
est Lebesgue-integrable, continue par morceaux et satisfait la condition de demib
somme, alors f est uniquement determinee par f.

` COMPLETER

ANALYSE DE FOURIER A

357

Remarque XI-4. Il faut prendre bien garde `a lexistence de differentes conventions, dont chacune a ses partisans acharnes. On peut mettre ou pas un coefficient 2
dans lexponentielle complexe ; changer
le signe dans cette meme exponentielle ; ou
encore mettre un facteur 1/(2) ou 1/ 2 devant lexponentielle soit douze possibilites, dont au moins la moitie sont effectivement utilisees. Quand les conventions
changent, les formules changent aussi, et il ne faut pas se laisser pieger ! Jutiliserai moi-meme dans la suite du cours plusieurs conventions differentes, selon les
occasions.
XI-1.3. Th
eorie ponctuelle. La convergence des series de Fourier est reconnue d`es le debut comme un probl`eme important et delicat, sur lequel Fourier luimeme avait ete attaque. Le resultat qui fait reference en la mati`ere est le th
eor`
eme
de Dirichlet (1829) :
Th
eor`
eme XI-5. Soit f : T C, continue par morceaux, satisfaisant la condition de demi-somme, C 1 de part et dautre de chaque point de discontinuite. Alors
X
ck (f ) ei2kx = f (x).
x T
kZ

Faire la preuve. Une bonne r


ef
erence est [Duoand.] p. 4-6
Jusquen 1876 les specialistes pensaient que lhypoth`ese de continuite C 1 de part
et dautre etait superflue ; mais un contre-exemple de DuBois-Reymond prouva le
contraire. Si lon veut avoir la propriete de reconstruction ponctuelle, on doit supposer une certaine regularite ; tout au mieux on peut relaxer lhypoth`ese C 1 . Ainsi,
le crit`ere de Jordan enonce que si f est `a variation bornee au voisinage dun point
x, alors les sommes de Fourier partielles convergent vers f (x).
Cependant, un resultat cel`ebre de Carleson (1966) enonce que la convergence des
series de Fourier dune fonction continue T C a lieu partout en-dehors dun ensemble de mesure nulle. Cet enonce est est vrai aussi pour f Lp (T) d`es que p > 1 ;
et si f est Riemann-integrable. Et il est optimal au vu de resultats de Kahane et
Katznelson, selon lesquels etant donne nimporte quel ensemble E de longueur nulle
dans T, on peut construire une fonction continue divergeant en tout point de E.
Quant aux series de Fourier des fonctions discontinues, elles peuvent tr`es bien diverger en tout point de T, comme le montre un autre contre-exemple d
u `a Kolmogorov
(1926). On pourra consulter [Korner] ou [Kahane] pour plus dinformation sur ces
probl`emes qui `a une epoque etaient au coeur des preoccupations des analystes.
Pour les integrales de Fourier, on a un resultat simple et pratique :
Th
eor`
eme XI-6. Soit f Cb L1 (R), alors
Z
x R
e2ix fb() d = f (x).

Faire la preuve, ou renvoyer au bon passage dans le chapitre pr


ec
edent ?

XI-1.4. Identit
es remarquables. La theorie de Fourier est basee sur trois
identites remarquables :
Formule de convolution :
f\
g = fbb
g

358

CHAPITRE XI

Formule de conjugaison :

Formule de d
erivation :

fbg =

(13 juin 2010)

g
fb

c = 2i fb
f

Ces formules necessitent quelques precautions, et sont a` reinterpreter eventuellement.


Par exemple pour une fonction 1-periodique, la derni`ere formule deviendra ck (f /xj ) =
2ikj ck (f ).
Pour enoncer ces identites, le plus simple est, pour les deux premi`eres, de se
placer dans le cadre des mesures ; et pour la troisi`eme, des fonctions C 1 , de derivee
integrable. Voici des enonces precis :
...................................
Que faire de l
echantillonnage ? fml de Poisson, fml de Shannon
Voici un corollaire de la formule de conjugaison :
or`
The
eme XI-7. Soit (k )kN une famille de mesures signees sur Rd , de variation totale bornee, et soit une autre mesure signee, telles que
bk
b simplement.
Alors k converge au sens faible- vers .
R
R
D
emonstration. Pour Rd , on pose n () = eix k (dx), () = eix (dx) ;
lhypoth`ese de variation totale sur les k entrane que k est uniformement bornee.
En outre, par hypoth`ese n () converge vers () pour tout quand n .
b = . (Etre

Soit Cc (R) ; on a alors la formule dinversion ()


plus clair sur

les notations pour linversion ?) De plus est elle-meme une fonction continue
bornee et integrable.
En appliquant la formule de conjugaison, on obtient
Z
Z

dk = ()
k () d.
est integrable et k bornee, on peut appliquer le theor`eme de convergence
Comme
dominee :
Z
Z
Z

()
k () d = ()
() d = d,
lim
n

la derni`ere egalite resultant dune nouvelle application du theor`eme de conjugaison.


Ceci conclut la preuve.

Remarque XI-8. Conditions suffisantes pour avoir la tension, exprimees en
termes de la fonction caracteristique de probabilites.................

XI-1.5. Th
eorie L2 . Meme quand elle est vraie, la convergence ponctuelle des
series de Fourier peut etre mediocre. Un exemple bien connu est le ph
enom`
ene de
Gibbs, qui pose des probl`emes pratiques : la serie de Fourier dune fonction creneau
presente des oscillations pr`es des points de discontinuite, dont lampleur ne sattenue
pas quand le nombre de frequences tend vers linfini.
DESSIN
Au debut du vingti`eme si`ecle, on aborde le probl`eme sous un angle different, plus
abstrait et plus fonctionnel. Les theor`emes de RieszFischer (1907) et de Plancherel
(1910) montrent que lanalyse et la synth`ese sont toujours possibles dans le cadre

` COMPLETER

ANALYSE DE FOURIER A

359

hilbertien des espaces L2 ; en outre ils aboutissent `a la decouverte fondamentale selon


laquelle la transformee de Fourier est une isom
etrie L2 L2 :
b L2
kf kL2 = kfk

cest lidentit
e de BesselParsevalPlancherel, qui explique en partie la popularite extreme de lanalyse de Fourier dans un cadre hilbertien.
`
eme XI-9 (Theor`eme de RieszFischer). Soit f L2 (T), alors f (x) =
P Theor
2ikx
ck (f ) e
dans L2 (T), au sens o`
u
Z
2
X

2ikx
ck (f ) e
f (x)
dx 0.
T

|k|N

En particulier, la serie de Fourier de f converge presque partout vers f . En outre,


pour toutes fonctions f, g L2 (T) on a
Z
Z
X
X
2
2
|f (x)| dx =
|ck (f )| ;
f (x) g(x) dx =
ck (f ) ck (g).
T

kZ

kZ

Ces enonces se generalisent en plusieurs variables (x Tn ), avec devidentes


modifications.
R

Th
eor`
eme XI-10 (Theor`eme de Plancherel). Soit f L2 (R), alors f (x) =
2ix
fb()e
d dans L2 (R), au sens o`
u
Z A
Z
2


2ix
b
f () e
d dx 0.
f (x)
A

RA
En particulier, lintegrale de Fourier tronquee, A fb()e2ix , converge vers f presque
partout. En outre, pour tous f, g L2 (Rn ),
Z
Z
Z
Z
2
2
b
|f ()| d;
f (x) g(x) dx =
|f (x)| dx =
g() d.
fb() b
R

Ces enonces se generalisent en plusieurs variables (pour des fonctions de L2 (Rn )),
avec devidentes modifications.
Faire les preuves

Remarque XI-11. Au cours de la preuve de lidentite de Parseval, on a obtenu


un autre resultat fondamental : la somme partielle SN f est la meilleure approximation de f dans lespace vectoriel engendre par les (e2ikx )|k|N , au sens L2 (approximation aux moindres carres). De meme, lintegrale de Fourier de f tronquee aux
frequences || A est la meilleure approximation de f dans le sous-espace de L2 (R)
engendre par les fonctions (e2ix )||A (`
a expliquer car ces fonctions ne sont
2
pas dans L ).
Remarque XI-12. On retrouve ici le concept, developpe au Chapitre VII, des
bases hilbertiennes.
Remarque XI-13. Parler de la convergence en norme Lp , 1 < p < ,
voir [Duoand. p.8] (Sur le tore seulement ?)
XI-1.6. Premi`
eres applications. Pour terminer cette section, nous allons
considerer quelques applications simples et classiques des formules vues precedemment.

360

CHAPITRE XI

(13 juin 2010)

XI-1.6.1. Solution formelle de lequation de convolution. Les operations de convolution sont innombrables en ingenierie et traitement du signal :
g = K f,

o`
u f modelise le signal dentree, le noyau de convolution K represente leffet dune
machine, et g est le signal de sortie. Le probl`eme est de reconstituer le signal dentree,
connaissant K. La solution pratique de ce probl`eme peut souvent se faire au moyen
de la transformee de Fourier :
g
b
b fb
gb = K
= fb = ,
b
K

b
donc f est donne par la transformee de Fourier inverse du quotient b
g /K.

XI-1.6.2. Linegalite isoperimetrique selon Hurwitz. Linegalite isoperimetrique


traduit le fait que la boule minimise la surface, `a volume fixe. Il en existe de nombreuses preuves, qui sappliquent en plus ou moins grande generalite. En dimension
2, lune des plus connues, due `a Hurwitz (1901), est basee sur les series de Fourier.
Th
eor`
eme XI-14 (Une version de linegalite isoperimetrique). Soit une courbe
fermee du plan, de classe C 1 , sans auto-intersection, de longueur L, et soit A laire
enserree par . Alors
L2 4A,
avec egalite si et seulement si est un cercle.
D
emonstration. On param`etre par longueur darc ; cette courbe est donc
representee par une fonction f : T R2 , disons f (t) = (x(t), y(t)), de classe C 1 ,
avec
p
|x|
2 + |y|
2=L
(le point designe la derivee par rapport au param`etre t) ; en particulier
Z

2
|x(t)|

+ |y(t)|
2 dt = L2 .
Les coefficients de Fourier de x sont ck (x)
= 2ikck (x) ; en appliquant lidentite de
BesselParsevalPlancherel, et en notant x
b(k) = ck (x) pour simplifier, on obtient
donc
X

4 2
|k|2 |b
x(k)|2 + |b
y (k)|2 = L2 .
kZ

Par ailleurs, laire enserree par la courbe vaut, selon un avatar de la formule
de Stokes,
Z


1
A = xy
+ xy dt
2
X

=
|k| x
b(k)b
y (k) + x
b(k)b
y (k)
kZ

= 2

X
kZ

X
kZ



x(k) yb(k))
|k| (b

|k|

 |b
x(k)|2 + |b
y (k)|2 
2

` COMPLETER

ANALYSE DE FOURIER A

361

o`
u la derni`ere inegalite resulte de CauchySchwarz, sous la forme
X 1/2 X 1/2 1 X
X
1X 2
k2 +
k ;
k k
k2
k2

2
2
k

ceci donne le resultat souhaite. On voit en outre quil y a egalite si et seulement si (a)
x
b(k) = yb(k) pour tout k, et (b) |k| = k 2 dans la somme, ce qui impose k {1, 0, 1},
ce qui correspond `a




L
L
x(t) = a cos
t ,
y(t) = a sin
t ,
2
2
soit lequation dun cercle.

Exercice XI-15. Soit une courbe convexe lisse tracee dans le plan, de diam`etre
D et de longueur L, montrer que L 2D, avec egalite pour le cercle... mais pas
seulement ! (Cf. [Kahane, p.237]).
XI-1.6.3. Le theor`eme dequirepartition de Weyl. Le theor`eme dequirepartition
de Weyl (1916) est un des premiers exemples de theor`eme ergodique. Plus que la
theorie des series de Fourier, il illustre linteret dapprocher de lapproximation par
des polynomes trigonometriques (second theor`eme dapproximation de Weierstrass).
(Remarque : faut-il les caser quelque part : th
eor`
eme de F
ejer ; thm dapproximation de Weierstrass ?)
Exemple `
a r
ediger
XI-2. Fourier calculateur : deux lois fondamentales des probabilit
es
Dans cette section on va voir la theorie de Fourier briller pour ses vertus calculatoires. On va lutiliser en effet pour traiter par le calcul deux lois fondamentales des
probabilites : le theor`eme de Polya sur la recurrence de la marche aleatoire simple ;
et le theor`eme central limite de Gauss. Un autre exemple interessant, non aborde
ici, est la multiplication rapide [Korner].
XI-2.1. La r
ecurrence de la marche al
eatoire. Un ivrogne se deplacant
au hasard va-t-il retrouver sa maison ? La version idealisee de ce probl`eme est un
classique des probabilites. On consid`ere donc une particule visitant les mailles dun
reseau regulier, disons Zd , o`
u d N.
Soient e1 , . . . , ed les directions de la base (ej est le vecteur dont toutes les composantes sont nulles, sauf la j-`eme qui vaut 1) ; les directions autorisees sont les (2d) vecteurs ej On a donc des variables aleatoires X1 , X2 , . . . , Xt , . . ., toutes independantes
et prenant la valeur ej avec probabilite 1/(2d) :


1
t N,
P Xt = ej = .
2d
La particule part de lorigine, sa position au temps t est donnee par
St = X1 + . . . + Xt .
La question est de savoir si St va revenir `a lorigine, ou bien seloigner pour ne jamais
revenir. (Il nest pas difficile de montrer que si St revient une infinite de fois pr`es de
lorigine, elle finira bien par retourner en lorigine exactement.)
Cest Polya qui pose et resout ce probl`eme, en 1921 : la solution depend crucialement de la dimension.

362

CHAPITRE XI

(13 juin 2010)

or`
The
eme XI-16 (Theor`eme de recurrence/transience de Polya). Avec les notations precedentes,
- Si d {1, 2}, alors avec probabilite 1, il existe une infinite de t tels que St = 0 ;
- Si d 3, alors il y a une probabilite non nulle pour que St ne revienne jamais
en 0 ; en outre, avec probabilite 1, |St | quand t .
D
emonstration. Pour eviter toutes confusions dans les calculs, je rappelle que
dans mes conventions, N = {1, 2, 3, . . .}.
Soient p la probabilite de retour en 0, et T le temps de premier retour :


p = P t > 0; St = 0 ;
T = inf{t > 0; St = 0}.
Clairement,

p = P[T < ] =

P[T = k].

kN

Calculons la probabilite P2 de revenir au moins deux fois en 0. Revenir au moins


deux fois veut dire revenir au moins une fois, en un temps T = k, puis revenir en 0
en un temps t > k, sachant quon part de 0 au temps k. On a donc
X


P[T = k] P t > k; St = 0|T = k
P2 =
kN

X
kN

X
kN



P[T = k] P t > 0; XT +1 + . . . + Xt = 0|T = k

P[T = k] P t > k; Xk+1 + . . . + Xt = 0]

P[T = k] P[s > 0; X1 + . . . + Xs = 0]

kN

P[T = k] p = p2 .

kN

(On a utilise le fait que levenement T = k est independant des variables Xk+1 , Xk+2, . . ..)
Un calcul similaire montrerait que la probabilite Pm de revenir au moins m fois en
0 est egale `a pm , pour nimporte quelle valeur de m N.
Il devient alors facile de calculer la probabilite de revenir exactement k fois
(k N) en 0 :
pk = pk pk+1 = pk (1 p).
En sommant ces probabilites, on obtient la probabilite de revenir un nombre fini de
fois :
(

 X k
0 si p = 1
P nombre fini de retours en 0 =
p (1 p) =
1 si p = 0.
kN

En particulier, dans le cas o`


u p = 1, on voit que presque s
urement (avec probabilite
1), on revient une infinite de fois en 0 ; alors que si p < 1 cet evenement est de
probabilite nulle.
Dans ce dernier cas, on peut aller plus loin dans les conclusions : soit x un point
fixe ; si on visite x un jour, la probabilite dy revenir k fois est evidemment egale `a
pk , et la probabilite dy revenir une infinite de fois est egalement nulle. On en deduit
que pour tout R fixe, la probabilite de revenir une infinite de fois dans la boule de

` COMPLETER

ANALYSE DE FOURIER A

363

centre 0 et de centre R est nulle. Ceci revient `a dire que St sechappe `a linfini avec
probabilite 1.
On peut egalement calculer lesperance (la valeur moyenne) du nombre de retours
N en 0 : si p < 1, cest
X
EN =
k pk (1 p)
kN

X
k1

=p+

k pk
X

X
k2

pk =

k2

(k 1) pk

p
;
1p

et cette formule reste valable pour p = 1 puisque dans ce cas, EN = .


Conclusion : tous les principaux param`etres du probl`eme sexpriment en fonction
de la probabilite p, et on a une dichotomie nette :
- si p = 1, alors presque s
urement on revient une infinite de fois au point de
depart (comportement r
ecurrent) ;
- si p < 1, alors presque s
urement on senfuit `a linfini (comportement transient).
Plutot que de calculer p, on va calculer
X 

P X1 + . . . + Xt = 0 .
EN =
tN

Pour tout x Zd on pose

si x {ej ; 1 j d}

2d
f (x) = P[X1 = x] =

0 sinon.

En dautres termes, f est la distribution de probabilite (la loi) de X1 (ou de nimporte quel Xt , t N).
On definit alors
X 

f2 (x) = P[X1 + X2 = x] =
P X1 = y et X2 = x y
yZd

yZd

P[X1 = y] P[X2 = y x] = (f f )(x).

(Noter lusage de lindependance de X1 et X2 !)


Un calcul similaire et un argument de recurrence montrent que
ft (x) = P[X1 + X2 + . . . + Xt = x] = (ft1 f )(x) = f t (x)

(produit de convolution applique t fois).


Ce que nous venons de redecouvrir est en fait un outil fondamental des probabilites : la loi de la somme de variables aleatoires independantes est donnee par la
convolution des lois. Comme on sait que convolution et transformee de Fourier se
marient bien, la suite est facile `a deviner. Posons
X
() =
f (x) e2ix
xZd

364

CHAPITRE XI

(13 juin 2010)

(au signe pr`es de i, cest la transformee de Fourier de la loi f , que les probabilistes
appellent souvent fonction caract
eristique de la variable X1 ). Ici Td et x
d
est un produit scalaire dans R . On peut calculer explicitement :
 1 X
1 X 2ij
e
+ e2ij =
cos(2j ),
() =
2d 1jd
d 1jd

o`
u j est la j-`eme composante du vecteur . Noter que est `a valeurs dans [1, 1],
et (0) = 1.
Si lon remplace f par ft dans la definition de , on obtient alors
X
t () =
ft (x) e2ix
xZd

f (x1 ) . . . f (xt ) e2i1 x . . . e2it x

xZd x1 +...+t =x

f (x) e2ix

xZd

!t

= ()t ,

o`
u chaque xj est une variable `a valeurs dans Rd . (On aurait pu sy attendre : la
transformee de Fourier transforme la convolution en produit, donc la convolution
iteree en puissance.)
Pour obtenir ft (0), il suffit dappliquer la formule dinversion de Fourier :
Z
Z
ft (0) =
t () d =
()t d.
Td

On en deduit

EN =

X
tN

ft (0) =

Td

XZ
tN

= lim
1

= lim
1

= lim
1

()t d

Td

X
tN

XZ
tN

Td

()t d
Td

( ())t d
Td

X
tN

(())t

d,

o`
u linterversion serie-integrale est justifi
P et par le theor`eme de convergence dominee
(domination par la serie convergence
, < 1). Do`
u
Z
Z
()
()
EN = lim
d =
d,
1
Td 1 ()
Td 1 ()
o`
u cette fois lechange limite-integrale se justifie par convergence monotone, appliquee separement sur les ensembles { < 0} et { 0}.
Pour savoir si on Rest dans le cas transient ou dans le cas recurrent, il suffit de
verifier si lintegrale /(1 ) converge ou diverge. Pour ce faire, on utilise le
developpement limite cos t = 1 t2 /2 + O(t4 ), ou encore linegalite elementaire


2 2 2
1 2 2 2
|| 1 ()
|| ,
2
d
d

` COMPLETER

ANALYSE DE FOURIER A

365

R
qui montre que la convergence ou la divergence de /(1 ) est equivalente `a la
convergence ou `a la divergence de
(
Z
d
= + si d {1, 2}
2
< + si d 3.
[0,1]d ||
Ceci conclut la preuve du theor`eme. Dans le cas transient, on peut meme calculer
explicitement la probabilite p : sachant que
Z

p
= EN =
,
1p
Td 1
et remplacant par son expression, on obtient
1
1
! .
=1 Z
p=1 Z
1
1
d
P
Td 1
1 d1 dj=1 cos(2j )
[0,1]d

Remarque XI-17. En dimension 1, il est assez simple de calculer la probabilite


de retour en 0 au temps 2n :
P[S2n = 0] =

1 n
n (2n)!
C
=
4
2n
22n
(n!)2

(noter quil sagit de choisir n pas vers la gauche et n pas vers la droite). Un calcul
un peu plus raffine montre que la probabilite de revenir en 0 pour la premi`ere fois
au temps 2n est exactement
1 n n
4 C2n .
n
Par la formule de Stirling, la probabilite de premier retour en 2n vaut environ
1
3/2 .
n
P
En particulier, lesperance du temps de premier retour diverge comme
1/ n.
Conclusion : meme en dimension 1 o`
u la marche aleatoire est tr`es recurrente,
lesperance du temps de premier retour est infinie !
Remarque XI-18. En dimension 2, on peut encore calculer simplement la probabilite de retour en 0 au temps 2n : cest
P[S2n = (0, 0)] =

8n [(2n)!]2
;
(n!)4

en appliquant Stirling, on voit que cette somme est logarithmiquement divergente,


ce qui est une facon de retrouver le resultat de Polya par des moyens combinatoires.
En dimension 3, le calcul exact ne semble plus possible, mais on peut encore majorer
!
1 n
1
n!
P[S2n = (0, 0, 0)] 2n C2n
  ,
2
3n n ! 3
3
P 3/2
et cette serie converge comme
n
, ce qui redonne la transience. On pourra
consulter [DoyleSnell] pour plus dinformations. Cette reference contient egalement
dautres methodes plus robustes, basees sur des analogies avec les circuits electriques !

366

CHAPITRE XI

(13 juin 2010)

On peut ainsi montrer que la marche aleatoire sur un sous-reseau de Zd (d 3) est


encore transiente (ce qui est intuitif mais non trivial).
XI-2.2. Le th
eor`
eme central limite. Le theor`eme central limite est (avec
peut-etre la loi des grands nombres) le theor`eme le plus cel`ebre des probabilites :
il enonce que les fluctuations dune moyenne de variables aleatoires independantes
de variance finie sont gaussiennes. Leffet magique de ce theor`eme magnifique a ete
quelque peu gache par son succ`es phenomenal en statistiques et en sciences naturelles, o`
u il est employe `a tous propos, et parfois hors de son domaine dapplication.
Notons que la signification de theor`eme central limite est sujette `a caution, certains auteurs preferant parler de limite centrale ou limite centree.
On notera = N (0, 1) la loi normale (i.e. gaussienne) centree (i.e. desperance
nulle) reduite (i.e. de variance unite) ; en dautres termes la densite de probabilite
definie par
t2

e 2
(t) = .
2
Th
eor`
eme XI-19. Soit (Xk )kN une suite de variables aleatoires reelles, independantes
et identiquement distributees, telles que
EX12 < +;
on pose
2 := E[X12 (EX1 )2 ].

Alors
ZN :=

N
2

au sens o`
u, pour tous a, b R,

N
1 X
Xj EXj
N j=1

P[a ZN b]
N

,
N

(t) dt.
a

Remarque XI-20. En utilisant le fait que est une mesure de probabilite, on


peut renforcer la convergence ci-dessus en convergence faible : pour toute fonction
continue bornee on a
E(ZN ) E(Z).
N

D
emontrer cette propri
et
e quelque part ? ?
Remarque XI-21. Il existe une version multidimensionnelle de ce theor`eme,
dans laquelle on remplace le nombre reel 2 par la matrice de covariance
ij = E[X1i X1j (EX1 )i (EX1 )j ],

X1j designant la j-`eme composante du vecteur X1 Rd ; et la loi normale par

(d)

|t|2

e 2
(t) =
.
(2)d/2

La preuve est tr`es similaire `a celle du cas monodimensionnel.

` COMPLETER

ANALYSE DE FOURIER A

367

Remarque XI-22. La preuve qui suit est la preuve qui sest imposee comme
la plus simple et la plus elegante. On peut cependant la trouver insatisfaisante au
sens o`
u la loi gaussienne y apparat comme par miracle, sans quon y comprenne
rien. Dautres preuves sans doute plus profondes, mais nettement plus delicates, font
intervenir par exemple linformation de Kullback [Cover-Thomas]. Un resultat de recherche assez recent, d
u `a Ball, Barthe et Naor, montre que lentropie de Boltzmann
de la variable aleatoire ZN est croissante en N ; lapparition de la gaussienne devient
alors toute naturelle, comme la densite centree reduite dentropie maximale.
Preuve du Th
eor`
eme XI-19. Quitte `a remplacer Xj par (Xj EXj )/, on
peut supposer que les Xj sont centrees reduites, i.e. EXj = 0 et = 1.
Soit la fonction caracteristique (transformee de Fourier) de la variable X (ou
plutot de sa loi) :
Z
() = EeiX1 =

eit (dt),

o`
u est la loi commune des Xj (cest la mesure image par Xj de la mesure de
probabilite P ; cette derni`ere est une mesure sur lespace de probabilites, alors que
est une mesure sur R, qui contient toute linformation sur la distribution des valeurs
Xj ).
De meme, on definit n comme la fonction caracteristique de Zn :

n

 X1 n
X1 +...+Xn

i
i n
n
n () = Ee
= Ee
=
n

(ici encore, linteret de la transformee de Fourier est de changer magiquement les


convolutions en produits).
En utilisant le theor`eme de convergence dominee, on verifie facilement que
2
C (R), et
Z
Z
() = i

t eit (dt); () =

t2 eit (dt);

en particulier

(0) = 1,

(0) = 0,

(v
erifier les signes) do`
u
() = 1

(1) = 1;

2
+ o( 2),
2

2
quand 0. En particulier, log (/ n) = / (2n) + o( 2/n) quand n ; en
multipliant par n et en prenant lexponentielle, on obtient

n
2

(n ).

= e 2 + o(1)
n
Conclusion :

R,

n () e 2 .
n

On rappelle que le membre de droite est la transformee de Fourier de :


Z
2
eit (t) dt = e 2 ;

Cf. Theor`eme......... Faire un tel th


eor`
eme, et insister sur les conventions.

368

CHAPITRE XI

(13 juin 2010)

Le Theor`eme XI-7 montre que pour toute fonction Cc (R),


Z
Z
dn d,
n

o`
u n est la loi de Zn et designe la mesure gaussienne par abus de notation.
Soit f = 1[a,b] ; pour tout > 0 on peut trouver (exercice) des fonctions g+ , g
continues `a support compact, telles que
g f g+ ,
et g concide avec f sauf sur un ensemble de longueur 2. On a alors
Z
Z
Z

g d = lim
g dn lim inf f dn
n
n
Z
Z
Z
+
lim sup f dn lim sup g dn = g+ d.
n

On conclut en faisant tendre vers 0, et en notant que, la probabilite nayant pas


datome,
Z
Z b
Z

(t) dt.
lim g d = f d =
0

Remarque XI-23. Le theor`eme central limite conclut `a la convergence faible


des lois. La question de la convergence forte des densites de ces lois est beaucoup
plus subtile ; une reponse est apportee par le th
eor`
eme central limite local, qui
suppose ............... Voir [Feller].
Remarque XI-24. Le theor`eme central limite est un theor`eme asymptotique, qui
ne donne aucune information quantitative sur la convergence vers la loi gaussienne.
La question dobtenir de telles estimations est un probl`eme cel`ebre en probabilites,
auquel le th
eor`
eme de BerryEss
een apporte une reponse partielle : ...................
Voir [Feller].
Pour montrer la puissance heuristique du theor`eme central limite, nous allons
maintenant voir comment lutiliser pour deviner le Theor`eme XI-16 (transience/recurrence
de la marche aleatoire). Reprenons les notations de la Sous-section XI-2.1 ; comme
St est une somme de variables aleatoires independantes de variance finie, on sattend
`a ce que
1
P[St = 0] d/2 ,
t
le membre de droite etant la valeur de la gaussienne en lorigine. (Exercice : Pourquoi
nest-ce pas rigoureux ? ?) On sattend donc `a ce que lesperance du nombre de
retours en 0 soit
X
X
X
X 1
,
E
1St =0 =
E1St =0 =
P[St = 0]
d/2
t
tN
tN
tN
tN
et cette somme diverge si d {1, 2}, converge si d 3.

` COMPLETER

ANALYSE DE FOURIER A

369

XI-3. Fourier physicien : lAge


de la Terre
Le but premier de Fourier etait de mettre au point des methodes permettant
detudier levolution de la chaleur dans les corps conducteurs, via certaines equations
aux derivees partielles. Dans cette section, nous allons presenter cette problematique
`a travers un exemple historiquement cel`ebre : lestimation de lage de la Terre, une
donnee vitale pour la geologie et la biologie.
Fourier nest pas le premier `a etudier lage de la Terre ; il avait au moins deux
predecesseurs cel`ebres. Tout dabord, dans les annees 1650, Usher, apr`es des annees `a
etudier la Bible, avait fixe `a 4004 av J-C la date de la Creation (Annales de lAncien
Testament, retracees depuis lorigine du Monde). Ensuite, `a la fin du dix-huiti`eme
si`ecle, Buffon (Des epoques de la Nature, 1779) avait tente de repondre `a la meme
question en reprenant la conception de Descartes et Leibniz selon laquelle la Terre
a un centre en fusion et est nee comme un Soleil (ces croyances etaient basees
en partie sur des principes philosophiques, en partie sur lexperience qui montre que
la temperature augmente quand on senfonce profondement dans le sol, en moyenne
3 degres par 100 m`etres). Buffon fait des experiences dans les forges de Montbard
sur le temps de refroidissement de globes de fer portes `a temperature de fusion ;
apr`es avoir applique des r`egles de proportionnalite, pris en compte lechauffement
parasite du Soleil, les variations de densite et bien dautres param`etres, il aboutit `a
une estimation denviron 75000 ans.
XI-3.1. La formule de Fourier. En 1820 Fourier modelise le probl`eme au
moyen de lequation aux derivees partielles quil a mise au point recemment, lequation
de la chaleur,

= ,
t
o`
u (t, x) est la temperature au temps t et au point x, est une constante determinee
par les param`etres physiques, et est le Laplacien par rapport `a la variable x, qui
varie `a linterieur dune boule de rayon R (le rayon terrestre). Fourier suppose lui
aussi que la Terre etait initialement en fusion et de temperature uniforme :
x B(0, R),

(0, x) = 0 .

Il suppose en outre que la temperature `a la surface est constante (fixee par les
conditions exterieures) :
|x| = R = (t, x) = e .

Des raisonnements bases sur les ordres de grandeur montrent que le refroidissement en profondeur est relativement faible, de sorte que lessentiel du phenom`ene
se produit pr`es de la surface. On decide alors de negliger la courbure de la Terre,
et de la modeliser non plus comme une boule, mais comme un demi-espace. Par
symetrie, on peut se limiter `a deux variables : t 0 (temps), y 0 (profondeur).
Les equations deviennent

t
y 2

(0, y) = 0 , y > 0

(t, 0) = e , t > 0.

370

CHAPITRE XI

(13 juin 2010)

Le programme est de resoudre cette equation, et den deduire le gradient de en


surface, qui est accessible `a lexperience (on mesure laugmentation de temperature
avec la profondeur).
Th
eor`
eme XI-25. Soient 0 , e 0 et > 0 ; alors il existe une unique fonction
= (t, y) definie sur R+ R+ telle que
(a) sur ]0, +[]0, +[, est contin
ument derivable en t, deux fois contin
ument
derivable en x, et satisfait lequation

2
= 2;
t
x
(b) est bornee, limt0 (t, y) = 0 pour tout y > 0, limy0 (t, y) = e pour tout
t > 0.
Pour t > 0, cette solution est donnee par la formule
Z +
Z
2
2(0 e ) + (y+x)2
0
|yx|
e 4t dx +
e 4t dx;
(t, y) =
4t 0
4t 0
et en particulier,
0 e

.
lim (t, y) =
y0 y
t
La preuve compl`ete du Theor`eme XI-25 necessite un minimum de familiarite
avec les equations aux derivees partielles, et depasse le cadre de ce cours. Je me
limiterai donc `a une esquisse de preuve. Faire une preuve compl`
ete ?
or`
Esquisse de preuve du The
eme XI-25. On va utiliser un argument de
symetrie pour ramener le probl`eme pose dans le quadrant (t > 0, y > 0) `a un
probl`eme pose dans le demi-espace entier (t > 0, y R). Considerons en effet le
probl`eme auxiliaire

t
y 2
(96)

(0, y) = 0 , y > 0

(0, y) = 1 , y < 0,
o`
u 1 est choisi de telle sorte que

0 + 1
= e ,
2

cest-`a-dire
1 = 2(0 e ).
La donnee initiale verifie bien evidemment
(0, y) + (0, y)
= e
2
(pour tous y si on pose (0, 0) = e ), et par symetrie ceci sera preserve pour les temps
positifs. (En effet, la fonction ((t, y) + (t, y))/2 est solution de lequation de la
chaleur avec donnee initiale constante egale `a e , et elle reste donc constante pour
tous temps ; pour rendre cet argument rigoureux il faudrait un theor`eme adequat
dunicite.) La figure ci-dessous precise lallure qualitative de pour differentes valeurs
de t.

` COMPLETER

ANALYSE DE FOURIER A

371

0
e
1

Fig. 2. Allure qualitative du graphe de (t, ) pour trois valeurs successives de t (t = 0 `a gauche, t = t1 > 0 au milieu, t = t2 > t1 `a
droite)
La solution ainsi construite verifiera donc, si on la restreint au quadrant (t >
0, y > 0), les solutions aux limites requises.
Pour resoudre (96), on applique la transformee de Fourier dans la variable y, que
lon notera avec un chapeau : cette operation commute avec la derivation en temps,
et transforme le laplacien en multiplication par 4 2 2 . Lequation /t =
devient donc
b
b )
(t, ) = 4 2 2 (t,
(t > 0, R).
t
Il sagit dune equation differentielle ordinaire lineaire, frequence par frequence, que
lon peut integrer exactement :
b ) = (0,
b ) e42t2 .
(t,

On resout cette equation en appliquant la transformee de Fourier inverse, qui change


la multiplication en produit de convolution. Se souvenant que la transformee de
Fourier inverse dune gaussienne est une gaussienne, on obtient, tous calculs faits,
||2

e 4t
;
(t, ) = (0, )
4t
ou, plus explicitement,
(t, y) =

e
(0, x)

(xy)2
4t

4t

dx
(xy)2

 e 4t
=
dx
0 1x>0 + 1 1x<0
4t

Z +
Z +
(yx)2
(y+x)2
0
1
4t
=
e
e 4t dx,
dx +
4t 0
4t 0
o`
u la derni`ere identite resulte du changement de variable x x dans la seconde
integrale. Compte tenu de lexpression de 1 , ceci est le resultat annonce dans le
theor`eme.
Pour obtenir la derivee partielle par rapport `a y, on derive lexpression sous le
signe integrale, ce qui est assez facile `a justifier par convergence dominee : pour tout
t > 0,
Z +
Z +
0
(y x) (yx)2
(y + x) (y+x)2
1

(t, y) =
e 4t dx
e 4t dx;
y
2t
2t
4t 0
4t 0

372

CHAPITRE XI

(13 juin 2010)

en prenant la limite y 0 on obtient



 Z +
Z +
x x2

1
x x2
4t
4t
dx 1
dx
(t, 0) =
e
e
0
y
2t
2t
4t
0
0
Z
0 1 + x x2
=
e 4t dx
2t
4t 0
0 1
=
;
4t
ce qui est bien lexpression souhaitee.

XI-3.2. Controverse et
epilogue. Resumons : Au moyen de son mod`ele, Fourier a obtenu la formule
0 e
=
,
t
o`
u designe le gradient de temperature en surface au temps t, t est le temps ecoule
depuis les conditions initiales (que nous esperons etre une bonne approximation de
lage de la Terre), 0 est la temperature initiale (disons la temperature de fusion du
fer, qui constitue une bonne part de la Terre), e la temperature `a la surface de la
terre, et une constante physique (disons la conductivite du fer). On en deduit lage
de la Terre, T , en fonction de 0 , e , et :
(0 e )2
.
(97)
T =
2
Lelegance de cette formule, qui int`egre harmonieusement tous les param`etres du
probl`eme, est peut-etre lune des raisons du grand credit qui lui a ete accordee.
Cest `a peine croyable, mais Fourier neffectue pas lapplication numerique. Peutetre navait-il pas assez confiance dans les donnees fournies par la physique de son
epoque. Quarante ans apr`es Fourier, Thomson, Lord Kelvin, considere comme le
meilleur physicien de son temps, reprend les calculs de Fourier, ameliore largumentation et realise lapplication numerique. Le probl`eme de lage de la Terre allait
obseder Kelvin pendant plusieurs decennies, et le mettre au centre dune controverse
transcendant les disciplines au point de faire oublier la contribution de Fourier,
tout le monde ou presque etant maintenant persuade que la formule (97) est due `a
Kelvin.
Utilisant les meilleurs valeurs connues `a son epoque, Kelvin obtient pour la Terre
un age de lordre de 100 millions dannees. Meme en tenant compte des marges
dincertitude, il estime tr`es improbable que la Terre soit agee de plus de 400 millions
dannees ; et il compl`ete son calcul par dautres arguments independants, mettant en
jeu le bilan thermodynamique du Soleil, le ralentissement de la rotation terrestre d
u
aux marees, le temps dagregation des galaxies, etc. On pourra consulter [Thomson
Tait] pour certains de ces calculs ; noter le ton polemique de lauteur.
Polemique car, et cest l`a que le bat blesse, dans les annees 1860 ces valeurs sont
incompatibles avec les theories geologiques dites gradualistes (Lyell, Hutton) qui ont
le vent en poupe ; et bien s
ur avec la theorie de la selection naturelle de Darwin et
Wallace. Darwin estime que sa theorie ne peut tenir debout dans une echelle de
temps aussi reduite ; entre la premi`ere edition de son Origine des esp`eces (1859) et
la derni`ere edition (1872), il ins`erera des modifications prudentes, demandant une
suspension de jugement jusqu`a ce que les connaissances en la mati`ere soient plus
s
ures. Kelvin quant `a lui semble avoir pense etre en possession dune preuve de

` COMPLETER

ANALYSE DE FOURIER A

373

lexistence de Dieu, ou peu sen faut (si les echelles de temps sont trop courtes, cest
que la selection naturelle ne peut pas etre la seule responsable de levolution).
Les geologues essay`erent de revoir leurs chronologies pour les adapter au nouveau
cadre que leur proposait Kelvin ; mais les choses empir`erent au cours des annees,
quand ce dernier revisa ses estimations `a la baisse, jusquau chiffre incroyable de 24
millions dannee ! ! En 1893, lensemble du monde physicien accepte ces estimations,
mais les geologues et evolutionnistes ne peuvent sy resoudre, provoquant une crise
interscientifique majeure.
Bien entendu, les calculs de Kelvin dependaient de la validite du mod`ele ; en
particulier de lhypoth`ese de labsence dun mecanisme interne de production de la
chaleur. En 1904, Rutherford annonce la decouverte dun tel mecanisme, la radioactivite ! En meme temps, il remettait en question les conclusions de Kelvin. Le recit
plaisant, fait par Rutherford lui-meme, de la seance de lAcademie des Sciences `a
laquelle il a mene Kelvin `a admettre son point de vue avec le sourire, est reste `a
la posterite... engendrant une nouvelle idee fausse particuli`erement tenace ! Dans la
culture scientifique collective, tout le monde ou presque sait maintenant que la
radioactivite explique les estimations trop serrees de Kelvin ; et du reste, la datation
par radioactivite donne des valeurs beaucoup plus fiables, et beaucoup plus grandes
(de lordre de 4,6 milliards dannees, bien plus que les geologues et evolutionnistes
nen demandaient...). Pourtant, un examen soigneux montre que cette source de
chaleur additionnelle ne modifie presque rien au calcul. La veritable erreur de Kelvin est davoir neglige la convection du manteau, qui du fait des echelles de temps
colossales joue un role important malgre les viscosites enormes (penser `a la viscosite de lacier solide...) La convection entrane une homogeneisation rapide de la
temperature dans le manteau, augmentant le gradient de temperature `a travers la
cro
ute terrestre, gradient qui nous apparat beaucoup plus grand quil ne devrait
letre. Ce phenom`ene est bien explique dans mettre des r
ef
erences pour la conf
de Le Mo
el et larticle de Pour la Science ; il avait dailleurs ete devine par un
contemporain et el`eve de Kelvin, Perry, qui pourtant nosa pas crier ses objections
trop fort.
Ceci conclut une histoire riche denseignements, dont le monde scientifique ne
ressort gu`ere `a son avantage : de belles formules ruinees par un mod`ele trop grossier ;
de grands scientifiques pechant par exc`es dorgueil ; des idees fausses ancrees pendant
des decennies sans remise en question serieuse.
XI-4. Fourier analyste : r
egularit
e
espaces de Sobolev
bebe injections de Sobolev
approximation par convolution

Vous aimerez peut-être aussi