Académique Documents
Professionnel Documents
Culture Documents
Chapitre V. Espaces Lp 26
V.1 - Relations d’équivalence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
V.2 - Construction de l’e.v.n. Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
V.3 - Propriétés de l’e.v.n. Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
V.4 - L’espace L2C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1
Chapitre I. Topologie, Convergence
Section I.1 - Espaces métriques
Définition
Exemples : Sur n’importe quel ensemble E, on peut définir une distance : la distance triviale, pour laquelle d(x, y) = 0
si x = y et d(x, y) = 1 sinon.
Pn 1
Sur Rn , on note dp (X, Y ) = ( i=1 |yi − xi |p ) p .
Sur C([0, 1], R), d(f, g) = sup |g(x) − f (x)| définit une distance.
x∈[0,1]
Définition
Remarque : R peut être muni de distances différentes, qui peuvent mener à des convergences différentes. La suite
un = n1 tend vers 0 avec les distances dp , mais pas avec la distance triviale.
Définition
Proposition
Définition
Soit E un ensemble, da et db deux distances sur E.
On dit que da est plus fine que db si ∃C > 0, db ≤ Cda .
Si da est plus fine que db et db est plus fine que da , alors on dit que da et db sont équivalentes.
Définition
Soit E un ensemble, A ⊂ E non vide et x ∈ E. La distance du point x à A est :
2
Définition
Remarque : Si (un ) converge, limite, limite supérieure et limite inférieure sont des quantités égales.
Définition
Proposition
Définition
Soit E un ensemble. On dit que E est complet si toute suite de Cauchy de E converge.
Théorème
R est complet.
R1
Exemple : C([0, 1], R) muni de la distance d(f, g) = 0 |g(x) − f (x)|dx n’est pas complet. En effet, la suite de fonctions
définies par :
si x < 21 − n1
0
n
fn (x) = x + 2 − 4 si 21 − n1 ≤ x ≤ 12 + n1
1 n
2
1 si x > 12 + n1
1 1
vérifie, pour q > p, d(fq , fp ) = 2p − 2q , et est donc de Cauchy, mais ne converge pas dans C([0, 1], R).
Définition
3
Proposition
Remarque : Toute distance n’est pas forcément induite par une norme ; par exemple, la distance triviale ne l’est jamais.
Définition
Soit E un espace vectoriel, Na et Nb deux normes sur E.
On dit que Na est plus fine que Nb si ∃C > 0, Nb ≤ CNa .
Si Na est plus fine que Nb et Nb est plus fine que Na , alors on dit que Na et Nb sont équivalentes.
Proposition
La relation ”être plus fine que” est réflexive et transitive. On dit que c’est un pré-ordre et on note Nb 4 Na .
Théorème
Définition
Proposition
Deux normes sont équivalentes si et seulement si leurs boules unité peuvent être incluses l’une dans l’autre
après application d’une homothétie.
Définition
Définition
On appelle espace de Banach tout espace vectoriel normé complet.
Exemples : C([0, 1], R) muni de Np est un espace vectoriel normé, mais pas un espace de Banach.
R3 est un espace de Banach (peu importe la norme choisie : cf. proposition suivante)
Proposition
Remarque : En dimension infinie, il faut toujours préciser la norme lorsque l’on parle de convergence. Par exemple
dans C([0, 1], R), la suite de fonctions définies par :
1 − nx si 0 ≤ x ≤ n1
fn (x) =
0 si n1 ≤ x ≤ 1
1
converge vers 0 pour N1 (car N1 (fn ) = n) mais converge vers 1 pour N∞ (car N∞ (fn ) = 1).
4
Section I.3 - Espaces topologiques
Définition
Soit E un ensemble. T est une topologie sur E ssi :
1. ∅ ∈ T et E ∈ T .
2. Toute union d’éléments de T est dans T .
3. Toute intersection finie d’élements de T est dans T .
(E, T ) est alors un espace topologique et les éléments de T sont appelés les ouverts.
Exemples : Pour E = {1, 2, 3, 4, 5}, T = {∅, {1, 2}, {3, 4}, {1, 2, 3, 4}, E} est une topologie.
Pour E un ensemble quelconque, les topologies T = {∅, E} et T = P(E) sont toujours des topologies sur E, qu’on
appelle respectivement topologie grossière et topologie discrète.
Définition
Soit Ta et Tb deux topologies sur E. On dit que Tb est plus fine que Ta si Ta ⊂ Tb .
On dit alors que Ta est plus grossière que Tb .
Définition
Définition
Soit (E, T ) un espace topologique et x ∈ E. On dit que V ⊂ E est un voisinage de x si ∃U ∈ T tel que x ∈ U
et U ⊂ V .
On note V(x) l’ensemble des voisinages de x.
On appelle base de voisinages de x toute partie B ⊂ V(x) telle que ∀V ∈ V(x), ∃B ∈ B, B ⊂ V .
Remarque : Si Ta et Tb sont deux topologies sur E telles que Tb est plus fine que Ta , alors tout voisinage de x pour Ta
sera un voisinage de x pour Tb .
Proposition
Démonstration : Si U est un ouvert, alors pour chaque point x de U , on a x ∈ U ⊂ U et donc U est voisinage de
chacun de ses points.
Réciproquement, si U est voisinage de chacun de ses points, alors pour tout x de U , on choisit un ouvert Ax qui
contient x inclus dans U . Alors, A = ∪x∈U Ax est un ouvert (union d’ouverts), tel que U ⊂ A car tous les éléments de
x sont dans A et A ⊂ U car chaque Ax est inclus dans U . On a donc U = A ouvert.
Proposition
5
Remarque : Si da et db sont deux distances sur E telles que db est plus fine que da , alors la topologie induite par db
est plus fine que la topologique induite par da .
Définition
Définition
Remarque : Dans les espaces métriques, on peut prendre V = B(l, ), ce qui nous ramène à la définition de la conver-
gence dans un espace métrique.
Définition
Proposition
Démonstration : Soit (un )n∈N une suite d’un espace de Hausdorff et l sa limite. Supposons par l’absurde que l0 6= l
soit une autre limite de (un )n∈N . Alors il existe U ∈ V(l) et V ∈ V(l0 ) tel que U ∩ V = ∅. Or par définition de la
limite, il existe N ∈ N tel que uN ∈ U et uN ∈ V , d’où la contradiction.
Proposition
Proposition
Soit (E, TE ) et (F, TF ) deux espaces topologiques, f : E → F une fonction continue et (un )n∈N une suite
d’éléments de E convergente vers l.
Alors lim f (un ) = f (l).
n→+∞
Démonstration : Soit W un voisinage de f (l). Il existe un ouvert U tel que f (l) ∈ U et U ⊂ W . On a alors l ∈ f −1 (U ),
f −1 (U ) ⊂ f −1 (W ) et f −1 (U ) ouvert car f est continue et U ouvert. Ainsi, f −1 (W ) est un voisinage de l. Or (un )n∈N
converge vers l, donc ∃N ∈ N, n ≥ N ⇒ un ∈ f −1 (W ) ⇒ f (un ) ∈ W . Ceci vaut quelque soit le voisinage de f (l)
considéré, et donc on conclut que f (un ) tend vers f (l).
Définition
1 1
Exemple : Pour E = R avec la topologie usuelle, N n’est pas compact : en considérant Ui =]i − 10 , i + 10 [, on a bien
N ⊂ ∪i∈N Ui mais on ne peut pas trouver de sous-recouvrement fini de N. (enlever un des Ui ne recouvre plus N)
6
Théorème (Borel-Lebesgue)
Lorsque E = Rn est muni de la topologie usuelle, les compacts sont les fermés bornés.
Théorème (Bolzano-Weierstrass)
Soit E un espace topologique métrisable (dont la topologie est induite par une distance).
K ⊂ E est compact ssi toute suite d’éléments de K admet une sous-suite convergente (dans K).
Définition
Définition
Définition
Définition
Définition
Remarque : Dans le cas réel, la définition donnée ci-dessus coincide bien avec celle donnée au début du chapitre.
Définition
Définition
Proposition
Définition
7
Chapitre II. Espaces de Hilbert, Séries de Fourier
Section II.1 - Produit scalaire
Définition
Soit E un espace vectoriel sur C.
On dit que φ : E × E → C est une forme sesquilinéaire si :
φ(x + λz, y) = φ(x, y) + λφ(z, y)
∀(x, y, z) ∈ E × E × E, ∀λ ∈ C,
φ(x, y + λz) = φ(x, y) + λφ(x, z)
Définition
Soit E un espace vectoriel sur C.
On appelle produit scalaire sur E toute forme sesquilinéaire φ hermitienne définie positive.
On dit alors que (E, φ) est un espace préhilbertien.
Lorsque E est de dimension finie, on dit que (E, φ) est un espace hermitien.
Proposition (Pythagore)
Définition
On appelle espace de Hilbert tout espace préhilbertien complet.
P+∞
Exemples : l2 = {(un )n∈N | u2n converge} muni de h(un )n∈N , (vn )n∈N i = n=0 un vn est un espace de Hilbert.
P
R n≥0
1
C([0, 1], C) muni de hf, gi = 0 f (x)g(x)dx n’est pas un espace de Hilbert (car non complet)
8
Définition
Soit H un espace de Hilbert.
On dit que {ei }i∈I est une base hilbertienne de H ssi :
• ∀(i, j) ∈ I × I, hei , ej i = δij
• Vect{ei , i ∈ I} = H
Remarque : Une base hilbertienne est donc une base orthonormale totale.
Définition
On dit qu’un espace de Hilbert H est séparable s’il existe E ⊂ H dénombrable et dense dans H.
Proposition
Tout espace de Hilbert séparable admet une base hilbertienne au plus dénombrable.
Démonstration : Soit (vn )n∈N une suite d’éléments de H telle que {vn , n ∈ N} = H. Pour N ∈ N , on note FN =
Vect({vn , n ∈ [[1, n]]}) ; la suite (FN )N ∈N est une suite croissante d’espaces vectoriels de dimension finie. On construit
alors une base orthonormée pour F1 , qu’on complète pour F2 ... etc, ce qui conclut puisque ∪N ∈N FN est dense dans
H.
Exemple : Une base hilbertienne de l2 est {(uin )n∈N , i ∈ N} où uin = δi,n .
Démonstration : On a défini d(x, A) = inf a∈A d(x, a). Soit (un )n∈N une suite de A telle que (dn )n∈N définie par
dn = d(x, un ) soit décroissante et tende vers d(x, A) (on dit que (dn )n∈N est une suite minimisante). On va montrer
que (un )n∈N est de Cauchy.
Soit > 0 et q > p deux entiers. On applique l’inégalité du parallélogramme avec x − up et x − uq :
9
Lorsque t → 0, on obtient alors hx − x0 , u − x0 i ≤ 0.
Réciproquement, on suppose que ∀u ∈ A, hx − x0 , u − x0 i ≤ 0. On a alors 2hx − x0 , u − x0 i − ||x0 − u||2 ≤ 0. Or,
2hu−x0 , x−x0 i−||x0 −u||2 = h2x−2x0 , u−x0 i+hx0 −u, u−x0 i = h2x−x0 −u, u−x0 i = 2hx, ui−2hx, x0 i+||x0 ||2 −||u||2 =
(||x0 ||2 − 2hx, x0 i + ||x||2 ) − (||u||2 − 2hx, ui + ||x||2 ) = ||x0 − x||2 − ||x − u||2 . Ainsi, on a ||x0 − x||2 ≤ ||u − x||2 soit
d(x0 , x) ≤ d(u, x) : x0 est donc bien égal à PA (x), puisqu’il minimise la distance de x à A.
On termine par vérifier l’unicité de x0 : si il existe x1 ∈ A tel que ∀u ∈ A, hx−x1 , u−x1 i ≤ 0, alors hx−x1 , x0 −x1 i ≤ 0
et hx − x0 , x1 − x0 i ≤ 0 implique hx1 − x + x − x0 , x1 − x0 i = ||x1 − x0 ||2 ≤ 0, d’où x0 = x1 .
Proposition
Démonstration : ∀u ∈ A, hx−x0 , u−x0 i ≤ 0 et hy −y0 , u−y0 i ≤ 0. On a donc hx−x0 , y0 −x0 i ≤ 0 et hy −y0 , x0 −y0 i ≤
0 ⇒ hx − y + y0 − x0 , y0 − x0 i ≤ 0 ⇒ ||y0 − x0 ||2 ≤ hx − y, x0 − y0 i ≤ ||x − y||||x0 − y0 || ⇒ ||x0 − y0 || ≤ ||x − y||.
Proposition
Proposition
Théorème (Parseval)
Démonstration : Soit N ∈ N et EN = Vect({en , n ∈ [[0, N ]]}). EN est un sev fermé de H, donc PEN est un opérateur
linéaire de H dans H. Soit x ∈ H, alors :
XN
PEN (x) = hx, en ien
n=0
N
X N
X
⇒ ||PEN (x)||2 = || hx, en ien ||2 = |hx, en i|2
n=0 n=0
PN
On remarque par ailleurs que hx, en ien i = |hx, en i|2 , et donc que hx, PEN (x)i = 2
n=0 |hx, en i| . On a alors
2
||PEN (x)|| = hx, PEN (x)i ≤ ||PEN (x)|| ||x||. Ainsi, pour tout x ∈ H, ||PEN (x)|| ≤ ||x||. On note désormais
F = ∪N ∈N EN , et on considère y ∈ H et > 0. F est dense dans H, donc il existe y 0 ∈ F tel que ||y − y 0 || < . Comme
y 0 ∈ F , on sait qu’il existe n0 tel que y 0 ∈ En0 ⇒ PEn0 (y 0 ) = y 0 . Alors : ||PEn0 (y)−y|| = ||PEn0 (y)−PEn0 (y 0 )−y+y 0 || ≤
||PEn0 (y − y 0 )|| + ||y − y 0 || ≤ 2||y − y 0 || ≤ 2. On conclut alors que y = lim PEN (y). En passant à la limite dans les
N →+∞
PN PN
égalités PEN (x) = n=0 hx, en ien et ||PEN (x)||2 = n=0 |hx, en i|2 , on obtient donc le résultat recherché.
10
Définition
Soit E un espace vectoriel.
On appelle dual algébrique de E l’ensemble des formes linéaires. On le note E ∗ .
Si de plus E est muni d’une topologie, on appelle dual topologique de E l’ensemble des formes linéaires
continues. On le note E 0 .
Définition
Soit E un espace vectoriel normé.
On appelle bidual de E le dual de son dual, c’est-à-dire E 00 .
Lorsque E = E 00 (au sens de l’identification), on dit que E est réflexif.
11
Section II.3 - Séries de Fourier
Définition
Soit f : R → C continue par morceaux et 2π-périodique.
On appelle coefficient de Fourier de f les coordonnées de f dans la base hilbertienne {en : x 7→ einx , n ∈ Z}
avec le produit scalaire : Z π
1
hf, gi = f (x)g(x)dx
2π −π
inx
P
On appelle série de Fourier la série n∈Z cn e .
Définition
Soit f : R → C continue par morceaux et 2π-périodique.
On appelle coefficients de Fourier trigonométriques les coefficients an = cn + c−n et bn = i(cn − c−n ).
On a alors :
1 π 1 π
Z Z
an = f (x) cos(nx)dx et bn = f (x) sin(nx)dx
π −π π −π
P+∞
La série de Fourier s’écrit a20 + n=1 (an cos(nx) + bn sin(nx)).
Remarque : Cette écriture permet, lorsque f est à valeurs dans R, de ne travailler qu’avec des nombres réels.
Définition
Soit f une fonction continue par morceaux. On note f˜ la fonction définie pour tout x du domaine de f par :
(
f (x) si f est continue en x
f˜(x) = 1
(lim f + lim f ) sinon
2 − +
x x
Théorème (Dirichlet)
12
Chapitre III. Mesurabilité
Section III.1 - Tribus
Définition
Soit E un ensemble.
On dit que E ⊂ P(E) est une tribu ssi :
1. ∅ ∈ E
2. E est stable par complémentarité (A ∈ E ⇒ E\A ∈ E)
3. E est stable par union dénombrable (∀n ∈ N, An ∈ E ⇒ ∪n∈N An ∈ E)
(E, E) est alors un espace mesurable, et les ensembles de E sont les ensembles mesurables.
Exemples : Pour E = {1, 2, 3, 4}, E = {∅, {1, 2}, {3, 4}, E} est une tribu.
Pour E = R, E = {∅, R−∗ , R+ , R} est une tribu. Par contre, l’ensemble des ouverts de R pour la topologie usuelle n’en
est pas une, car il n’est pas stable par complémentarité.
Pour E un ensemble quelconque, E = {∅, E} et E = P(E) sont toujours des tribus sur E, qu’on appelle respectivement
tribu grossière et tribu discrète.
Proposition
Proposition
Démonstration : 1. ∀i ∈ I, ∅ ∈ Ei ⇒ ∅ ∈ ∩i∈I Ei
2. Soit A ∈ ∩i∈I Ei . Alors ∀i ∈ I, A ∈ Ei ⇒ ∀i ∈ I, E\AEi ⇒ E\A ∈ ∩i∈I Ei .
3. Soit (An )n∈N des éléments de ∩i∈I Ei , alors ∀n ∈ N, ∀i ∈ I, An ∈ Ei ⇒ ∀i ∈ I, ∪n∈N An ∈ Ei ⇒ ∪n∈N An ∈ ∩i∈I Ei .
Définition
Exemple : Si E = {1, 2, 3, 4}, alors σ({1}) = {∅, {1}, {2, 3, 4}, E}.
Définition
Exemples : B(R) est la tribu engendrée par les intervalles ouverts. Elle contient les ouverts, les fermés donc les single-
tons, tous les ensembles dénombrables...
B(N) = P(N), la topologie usuelle sur N étant P(N).
13
Définition
Définition
Définition
Proposition
Proposition
Soit (E, E) et (F, F) deux espaces mesurables avec F = σ(C) pour C ∈ P(F ).
f : E → F est mesurable ssi f −1 (C) ∈ E
Définition
Soit (E, T ) et (F, U) deux espaces topologiques, qu’on équipe de leurs tribus de Borel E = σ(T ) et F = σ(U).
On appelle fonction borélienne toute fonction mesurable f : (E, E) → (F, F).
Proposition
Démonstration : Les ouverts engendrent la tribu, et l’image réciproque des ouverts sont des ouverts.
14
Proposition
Proposition
Définition
Remarque : Une fonction est étagée si et seulement si elle est combinaison linéaire de fonctions indicatrices.
Théorème
Définition
Exemples : Pour E = N, E = P(N), on définit la mesure µ : E → [0, +∞] telle que pour A ⊂ N, on a :
Card(A) si A est fini
µ(A) =
+∞ sinon.
Proposition
15
Définition
Exemple : La mesure de Dirac est une mesure de probabilité. La mesure de comptage de N n’est pas une mesure finie.
Définition
Définition
Soit (E, E, µ) un espace mesuré. On dit que µ est discrète s’il existe une suite (ai )i∈I dans E, avec I au plus
dénombrable, telle que µ(E\ ∪i∈I {ai }) = 0.
Remarque : Si les singletons appartiennent à la tribu, alors µ se décompose comme une combinaison linéaire de mesures
de Dirac.
Définition
Définition
Remarque : Si µ n’est pas une mesure complète, on peut toujours ”compléter” E afin qu’elle le devienne : en con-
sidérant l’ensemble N = {S ⊂ E, ∃A ∈ E, µ(A) = 0, S ⊂ A}, la tribu complétée est E = σ(E ∪ N ). µ s’étend de
manière unique de E à E, et cette extension est une mesure complète.
Nous n’y parviendrons pas sur la tribu P(R), et nous allons donc devoir accepter une tribu (légèrement) plus petite.
Définition
16
Proposition
Proposition
Proposition
Démonstration : Soit A ∈ B(R). Clairement λ(A) ≤ inf{λ(U ), A ⊂ U, U ouvert}. Supposons λ(A) P < +∞ (le cas
échéant, c’est trivial). Pour tout > 0, il existe un recouvrement de A par des ]ai , bi [ tels que λ(A) ≥ i∈N (bi −ai )−.
En notant U = ∪i∈N ]ai , bi [, on a donc λ(A) ≥ λ(U ) − . Ainsi λ(A) ≥ inf{λ(U ), A ⊂ U, U ouvert}, puis λ(A) =
inf{λ(U ), A ⊂ U, U ouvert}.
Montrons la seconde proposition ; clairement λ(A) ≥ sup{λ(K), K ⊂ A, K compact}. On suppose d’abord qu’il existe
un compact C tel que A ⊂ C. Pour tout > 0, il existe U ouvert contenant C\A tel que λ(C\A) ≥ λ(U ) − . Or
C\U = (A ∪ (C\A))\U ⊂ (A ∪ (C\A))\(C\A) = A. On note donc K = C\U tel que K soit compact et inclus dans
A ; on a alors λ(K) = λ(C\U ) ≥ λ(C) − λ(U ) ≥ λ(C) − λ(C\A) − ≥ λ(A) − . En conclusion, pour tout > 0, il
existe un compact K tel que λ(K) ≥ λ(A) + , ce qui montre que λ(A) ≤ sup{λ(K), K ⊂ A, K compact} ⇒ λ(A) =
sup{λ(K), K ⊂ A, K compact}.
Supposons maintenant qu’il n’existe pas de compact C tel que A ⊂ C. On se ramène au cas précédent en faisant
entrer A ∩ [−n, n] dans un compact ; on a alors ∀n ∈ N∗ , λ(A ∩ [−n, n]) ≤ sup{λ(K), K ⊂ A ∩ [−n, n], K compact},
d’où le résultat en passant à la limite lorsque n → +∞.
Proposition
Soit µ une mesure sur Rd invariante par translations, et telle que 0 < µ(]0, 1[d ) < +∞.
Alors, µ est proportionnelle à la mesure de Lebesgue λ.
Remarque : La mesure de Lebesgue est elle-même invariante par translations, et telle que 0 < λ(]0, 1[d ) = 1 < +∞.
17
Chapitre IV. Intégration
Section IV.1 - Intégrale par rapport à une mesure
Définition
Soit (E, E) un espace mesurable, µ une mesure sur (E, E) et f : E → R+ une fonction étagée.
−1
On note
P αi les n valeurs distinctes prises par f qu’on ordonne (α1 < ... < αn ), et Ai = f (αi ). On a alors
f = i∈I αi 1Ai
L’intégrale de la fonction étagée positive f par rapport à µ est :
Z n
X
f (x)µ(dx) = αi µ(Ai )
E i=1
R
On la note également f dµ.
P
Remarque
P : Si f est exprimée
R sous forme
Pn d’une autre combinaison linéaire de fonction indicatrices f = i∈I βi 1Bi ,
alors i∈I βi µ(Bi ) = E f (x)µ(dx) = i=1 αi µ(Ai ). En effet, pour tout i ∈ I, on peut définir un ensemble fini Ji tel
que ∀j ∈ Ji , βj = αi et Ai = ∪j∈Ji Bj .
Proposition
Soit (E, E, µ) un espace mesuré, f, g deux fonctions étagées à valeurs dans R+ et λ ∈ R+ . Alors :
Z Z Z
(f + λg)dµ = f dµ + λ gdµ
Pn Pm
Démonstration : On écrit f = i=1 αi 1Ai et g = j=1 βj 1Bj . On a Ai = ∪m (A ∩ Bj ) et Bj = ∪ni=1 (Ai ∩ Bj ) donc
Pn Pm Pn Pm Pn Pm j=1 i R
f = i=1 j=1 αi 1Ai ∩Bj , g = i=1 j=1 βj 1Ai ∩Bj et f + λg = i=1 j=1 (αi + λβj )1Ai ∩Bj . Ainsi (f + λg)dµ =
Pn Pm Pn Pm Pn Pm R R
i=1 j=1 (αi + λβj )µ(1Ai ∩Bj ) = i=1 j=1 αi µ(1Ai ∩Bj ) + λ i=1 j=1 βi µ(1Ai ∩Bj ) = f dµ + λ gdµ.
Proposition
Soit (E, E, µ) un espace mesuré et f, g deux fonctions étagées à valeurs dans R+ telles que f ≤ g. Alors :
Z Z
f dµ ≤ gdµ
R R R R
Démonstration : g − f ≥ 0, donc gdµ = f dµ + (g − f )dµ ≥ f dµ.
Proposition
Soit (E, E, µ) un espace mesuré et f une fonction étagée à valeurs dans R+ nulle presque partout. Alors :
Z
f dµ = 0
Pn
Démonstration : On écrit f = i=1 αi 1Ai avec α1 < ...αn et Ai = f −1 (αi ). Si α1 = 0, alors ∀i ∈ [[2, n]], Ai = {x ∈
E; f (x) = αiR} ⊂ {x ∈PE; f (x) > 0}. Siα1 > 0, alors ∀i ∈ [[1, n]], Ai = {x ∈ E; f (x) = αi } ⊂ {x ∈ E; f (x) > 0}. Dans
n
tous les cas f dµ = i=1 αi µ(Ai ) = 0.
Définition
18
Définition
Proposition
Soit (E, E, µ) un espace mesuré et f, g deux fonctions mesurables de (E, E, µ) à valeurs dans ([0, +∞], B([0, +∞])
telles que f ≤ g. Alors : Z Z
f dµ ≤ gdµ
Proposition
Soit (E, E, µ) un espace mesuré et f une fonction mesurable de (E, E, µ) à valeurs dans ([0, +∞], B([0, +∞])
nulle presque partout. Alors : Z
f dµ = 0
Remarque : L’intégrale de f peut être nulle sans que f ne soit nulle (elle ne le sera seulement que presque partout).
Soit (fn )n∈N une suite croissante de fonctions mesurables fn : E → R+ convergeant simplement vers f : E →
R+ . Alors : Z Z
f dµ = lim fn dµ
n→+∞
R R R R
Démonstration : f est mesurable donc f dµ = suph∈S + (E),h≤f hdµ. ∀n ∈ N, fn ≤ fn+1 donc fn dµ ≤ fn+1 dµ.
R R R R
R ailleurs,R fn ≤ f donc fn dµ ≤ f dµ. La suite ( fn dµ)n∈N est également
La suite ( fn dµ)n∈N est croissante. Par
majorée ; ainsi, elle converge et lim fn dµ ≤ f dµ.
n→+∞ Pm
Soit h ∈ S (E) telle que h ≤ f . On écrit h = i=1 αi 1Ai . Soit a ∈]0, 1[. Pour tout n ∈ N, on définit Ena = {x ∈
+
Z m
X Z
lim fn dµ ≥ a αi µ(Ai ) = a hdµ
n→+∞
i=1
R R R R
Ceci vaut pour tout a < 1 ; on a donc lim fn dµ ≥ f dµ, et en conclusion, f dµ = lim fn dµ.
n→+∞ n→+∞
19
Proposition
Soit (E, E, µ) un espace mesuré, f, g deux fonctions mesurables de (E, E, µ) à valeurs dans ([0, +∞], B([0, +∞])
et λ ∈ [0, +∞]. Alors : Z Z Z
(f + λg)dµ = f dµ + λ gdµ
Démonstration : Il existe une suite de fonctions étagées positives (fn )n∈N qui converge simplement vers f , et il existe
une suite de fonctions
R étagées positives
R (gnR)n∈N qui converge simplement vers g (cf. théorème du chapitre précédent).
Alors
R ∀n ∈ N, (fRn + λg n )dµR = f n dµ + λ gdµ, soit en passant à la limite par le théorème de convergence monotone
: (f + λg)dµ = f dµ + λ gdµ.
Proposition
Soit (E, E, µ) un espace mesuré, (fn )n∈N une suite de fonctions mesurables de (E, E, µ) à valeurs dans
([0, +∞], B([0, +∞]). Alors : !
Z X +∞ +∞ Z
X
fn dµ = fn dµ
n=0 n=0
PN
Démonstration : On applique le théorème de convergence monotone à la suite des sommes partielles SN = n=0 fn :
Z +∞
! Z N Z +∞ Z
X X X
fn dµ = lim SN dµ = lim fn dµ = fn dµ
N →+∞ N →+∞
n=0 n=0 n=0
Soit (E, E, µ) un espace mesuré, f une fonction mesurable de (E, E, µ) à valeurs dans ([0, +∞], B([0, +∞]).
Alors : Z
1
∀a > 0, µ({x ∈ E; f (x) ≥ a}) ≤ f dµ
a
R R
Démonstration : Soit A = {x ∈ E; f (x) ≥ a}. Alors f ≥ a1A ⇒ f dµ ≥ a1A dµ = aµ(A).
Proposition
Soit (E, E, µ) un espace mesuré, f une fonction mesurable de (E, E, µ) à valeurs dans ([0, +∞], B([0, +∞]).
Alors : Z
f = 0 p.p. ⇔ f dµ = 0
Démonstration : On a déjà traité le sens direct ; pour la réciproque, on pose Bn = {x ∈ E; f (x) ≥ n1 }. Alors µ(Bn ) ≤
1
R
n f dµ = 0. Or Bn ⊂ Bn+1 et ∪n∈N∗ Bn = {x ∈ E; f (x) > 0} donc µ({x ∈ E; f (x) > 0}) = lim µ(Bn ) = 0. Ainsi
n→+∞
f = 0 presque partout.
Proposition
Soit (E, E, µ) un espace mesuré, f, g deux fonctions mesurables de (E, E, µ) à valeurs dans ([0, +∞], B([0, +∞]).
Alors : Z Z
f = g p.p. ⇔ f dµ = gdµ
R
Démonstration : f − min(f,
R R 0 p.p. et f − min(f, g) ≥ 0. Par la propositionR précédente,
g) = R on a donc (f −
min(f,
R g))dµ
R = 0, soit f dµ = min(f, g)dµ. De la même manière, on montre que gdµ = min(f, g)dµ, et donc
f dµ = gdµ.
20
Proposition
Soit (E, E, µ) un espace mesuré, f une fonction mesurable de (E, E, µ) à valeurs dans ([0, +∞], B([0, +∞]).
Alors : Z
f dµ < +∞ ⇒ f < +∞ p.p.
1
R
Démonstration : Soit An = {x ∈ E; f (x) ≥ n} et A∞ = {x ∈ E; f (x) = +∞}. µ(An ) ≤ n f dµ donc lim µ(An ) =
n→+∞
0. Comme An+1 ⊂ An , µ(A0 ) < ∞ et ∩n∈N∗ An = A∞ , on a µ(A∞ ) = µ(∩n∈N An ) = lim µ(An ) = 0. AInsi f < +∞
n→+∞
p.p.
Soit (E, E, µ) un espace mesuré, (fn )n∈N une suite de fonctions mesurables de (E, E, µ) à valeurs dans
([0, +∞], B([0, +∞]). Alors : Z Z
(lim inf fn )dµ ≤ lim inf fn dµ
R
Démonstration : On applique le théorème de la convergence monotone à (inf m≥n fm )n∈N : on a donc lim (inf m≥n fm )dµ =
R R R R n→+∞ R
( lim (inf m≥n fm )dµ. Or p ≥ n ⇒ (inf m≥n fm )dµ ≤ fp dµ. On en déduit que (inf m≥n fm )dµ ≤ inf p≥n fp dµ.
n→+∞ R R R
En passant à la limite quand n → +∞, on obtient donc (lim inf fn )dµ = lim (inf m≥n fm )dµ ≤ lim inf p≥n fp dµ.
n→+∞ n→+∞ n→+∞
Définition
Soit (E, E, µ) un espace mesuré, f : (E, E, µ) → (R, B(R)) une fonction mesurable.
On dit que f est intégrable par rapport à la mesure µ ssi :
Z
|f |dµ < +∞
Proposition
Démonstration : Puisque |f | = f + + f − , on a :
Z Z Z Z Z Z Z
f dµ = f + dµ − f − dµ ≤ f + dµ + f − dµ = f + + f − dµ = |f |dµ
Proposition
Démonstration : Soit f, g ∈ L1 (E, E, µ). 0 ≤ |f + g| ≤ |f | + |g| donc |f + g|dµ ≤ |f |dµ + |g|dµ < +∞ et
R R R
− − − − −
donc f + g ∈ L1 (E, E,Rµ). Par ailleurs,
R f + g− = (f R+ g)
+
− (f + +
R +−g) =R f+ + g R −−f g ⇒ R (f + g) +
+
R f + gR =
− + + + +
(f + g) + f + g ⇒ (f + g) dµR − (f + g) dµR = f dµ − f dµ + g dµ − g dµ ⇒ f + gdµ = f dµ + dµ.
Soit f ∈ LR1 (E, E, µ) et
R λ−∈ R. |λf
R |dµ ≤ |λ|
R −|f |dµ < +∞
1
R donc λf ∈ L (E, E,Rµ). Par ailleurs, si Rλ ≥ 0, alors
+ + +
− (λf )− dµ =
R R
λfRdµ = λf Rdµ − λf dµ = λ( f dµ + f dµ) = λ f dµ et si λ < 0, alors λf dµ = (λf )
−λ f dµ + λ f dµ = λ( f dµ + f dµ) = λ f dµ (en utilisant le fait que pour a > 0, (−af )+ = −af − et
− +
R + R − R
(−af )− = −af + ).
21
Proposition
1
Soit (E, E, µ) R mesuré, f, g ∈ L (E, E, µ). Alors :
R un espace
• f ≤ g ⇒ f dµR ≤ gdµR
• f = g p.p. ⇒ f dµ = gdµ
Soit (fn )n∈N une suite de fonctions mesurables de L1 (E, E, µ). On suppose que :
• Il existe une fonction mesurable f tel que lim fn (x) = f (x) pour presque tout x dans E
n→+∞
• Il existe une fonction mesurable
R
g à valeurs positivesRtel que ∀n ∈ N, |fn | ≤ g p.p. et gdµ < +∞
Alors f ∈ L1 (E, E, µ), lim
R R
fn dµ = f dµ et lim |fn − f |dµ = 0.
n→+∞ n→+∞
Démonstration : On commence par supposer les hypothèses partout (et pas seulement presque partout). En faisant
tendre n vers +∞ dans |fn | ≤ g, on a |f | ≤ g donc f ∈ LR1 (E, E, µ). On a aussi
R |fn − f | ≤ 2g, soit 2g − |fn − f | ≥ 0 ;
en appliquant le lemme de Fatou, on trouve alors lim inf (2g − |fn − f |)dµ ≥ 2gdµ. Or lim inf(−un ) = − lim sup un
R n→+∞ R
; ceci est donc équivalent à 2gdµ − lim sup|fn − f |dµ ≥ 2gdµ ⇔ lim sup|fn − f |dµ ≤ 0. Par positivité de l’intégrale,
R n→+∞ R n→+∞
R
on a donc lim |fn − f |dµ = 0. Ceci implique aussi lim fn dµ = f dµ.
n→+∞ n→+∞
On suppose désormais les hypothèses telles quelles. Soit Ẽ = {x ∈ E; lim fn (x) = f (x) et supn∈N fn (x) ≤ g(x)}.
n→+∞
Les fonctions f˜ = f 1Ẽ et f˜n = fn 1Ẽ satisfont les hypothèses partout ; par ailleurs, µ(E\Ẽ) = 0 donc f = f˜ et fn = f˜n
p.p. soit |fn − f |dµ = |f˜n − f˜|dµ, ce qui conclut.
R R
Définition
Remarque : Lorsque µ est une mesure finie, alors p < q ⇒ Lp (E, E, µ) ⊂ Lq (E, E, µ). Attention, cela est faux dans le
cas général.
Définition
Définition
Définition
22
Remarque : L1loc (Rd , B(Rd ), λ(d) ) ⊂ L1 (Rd , B(Rd ), λ(d) ), mais l’inclusion est stricte (on peut par exemple considérer la
fonction de R dans R constante égale à 1, qui est intégrable sur tout compact mais pas sur R).
Définition
Soit a et b deux réels tels que a < b.
On dit que f : [a, b] → R est une fonction en escalier s’il existe une subdivision de [a, b] : a = x0 < x1 <
... < xJ = b et des réels y1 , ..., yJ tels que ∀i ∈ [[1, J]], ∀x ∈]xi−1 , xi [, f (x) = yi .
L’ensemble de ces fonctions se note R([a, b]).
PJ
Pour h ∈ R([a, b]), on note I(h) = i=1 (xi − xi−1 )yi .
Définition
Rb
On note alors a
f (x)dx cette valeur.
Proposition
R
Soit h ∈ R([a, b]). Alors I(h) = [a,b]
hdλ.
R PJ
Démonstration : [a,b]
hdλ = i=1 yi λ(]xi−1 , xi [) = I(h)
Théorème
−
Démonstration : Il existe deux fonctions en escalier (h+
n )n∈N et (hn )n∈N deux suites de fonctions en escalier telles que
hn ≤ f ≤ hn et lim I(hn ) = lim I(hn ). On peut extraire une sous-suite croissante de (h−
− + + −
n )n∈N et une sous-suite
n→+∞ n→+∞
− −
décroissante de (h+ + +
n )n∈N . Elles sont bornées. On pose par ailleurs h∞ et h∞ les limites simples de (hn )n∈N et (hn )n∈N .
Elles sont mesurables.
−
On applique le théorème de convergence dominée à h+ n et à hn :
Z Z Z b
+ + +
h∞ dλ = lim hn dλ = lim I(hn ) = f (x)dx
[a,b] n→+∞ [a,b] n→+∞ a
Z Z Z b
h−
∞ dλ = lim h− −
n dλ = lim I(hn ) = f (x)dx
[a,b] n→+∞ [a,b] n→+∞ a
− − − −
On a donc [a,b] h+ + + +
R R R
∞ dλ = [a,b] h∞ dλ, soit [a,b] h∞ −h∞ dλ = 0 ou encore h∞ = h∞ presque partout (car h∞ −h∞ ≥ 0).
Puisque h− + +
∞ ≤ f ≤ h∞ , on a donc f = h∞ presque partout soit :
Z Z Z b
f dλ = h+
∞ dλ = f (x)dx
[a,b] [a,b] a
Remarque : Certaines fonctions peuvent être Lebesgue-intégrables sans être Riemann-intégrables, par exemple f = 1Q
Définition
23
Théorème
Toute fonction localement Riemann-intégrable est Lebesgue-intégrable si et seulement si elle est Riemann-
Rb
absolument convergente (i.e. a |f (x)|dx existe et est finie).
Dans ce cas les deux intégrales coı̈ncident.
Conséquence : Les intégrales impropres absolument convergentes sont dans L1 , mais les intégrales impropres semi-
convergentes ne sont pas dans L1 .
Théorème
Théorème
Soit F : R → R une fonction dérivable en tout point de R.
Supposons f = F 0 ∈ L1loc . Alors pour tous réels a et b tels que a < b :
Z
f dλ = F (b) − F (a)
[a,b]
Proposition
P
Considérons E = N, E = P(N) et µ = n∈N δn .
Soit u : E → N ; on note un = u(n). Si la série de terme général (un )n∈N est absolument convergente, alors :
Z +∞
X
u(x)µ(dx) = un
n=0
Définition
On note : !
X
`p = Lp N, P(N), δn
n∈N
!
X
∞ ∞
` =L N, P(N), δn
n∈N
Proposition
Définition
On dit que ν est la mesure de densité f par rapport à µ.
Exemple : Considérons E = R équipé de la tribu de Lebesgue et de la mesure de Lebesgue λ. Soit f définie sur R par
:
0 si x < 0
f (x) =
e−x si x ≥ 0
24
On a alors, par exemple, ν([0, 1]) = 1 − 1e , ν([−69, 420]) = 1 − e−420 et ν(R) = 1, ce qui fait par ailleurs de ν une
mesure de probabilité.
Remarque : Si A est de mesure nulle pour µ alors ν(A) = 0 donc A est de mesure nulle pour ν.
On dit que ν est absolument continue par rapport à µ et on note ν µ.
Théorème
Soit (E, E, µ) un espace mesuré, (U, d) un espace métrique, fu : E → R une fonction dépendant d’un paramètre
u ∈ U et u0 ∈ U .
On suppose que :
• Pour presque tout u ∈ U , la fonction x 7→ fu (x) est mesurable.
• Pour presque tout x ∈ E, la fonction u 7→ fu (x) est continue en u0 .
• Il existe une 1
R fonction positive g ∈ L (E, E, µ telle que ∀u ∈ U, |fu (x)| ≤ g(x) pour presque tout x.
Alors u 7→ E fu (x)µ(dx) est définie pour presque tout u ∈ U et continue en u0 .
25
Chapitre V. Espaces Lp
Section V.1 - Relations d’équivalence
Définition
Soit E un ensemble. On dit qu’une relation ∼ est une relation d’équivalence ssi :
• Elle est réflexive (∀x ∈ E, x ∼ x)
• Elle est symétrique (∀x, y ∈ E, x ∼ y ⇒ y ∼ x)
• Elle est transitive (∀x, y, z ∈ E, x ∼ y ∧ y ∼ z ⇒ x ∼ z)
Définition
Soit ∼ une relation d’équivalence sur un ensemble E et x ∈ E.
On appelle classe d’équivalence de x l’ensemble {y ∈ E, y ∼ x}.
On le note ẋ ou [x].
Définition
Soit ∼ une relation d’équivalence sur un ensemble E et x ∈ E.
On appele l’ensemble quotient de E par ∼ l’ensemble des classes d’équivalences des éléments de E, qu’on
note E/ ∼.
Proposition
Définition
Soit ∼ une relation d’équivalence sur un ensemble E.
Une application f : E → E est compatible avec ∼ ssi
∀x ∈ E, ∀y ∈ E, x ∼ y ⇒ f (x) ∼ f (y)
On peut alors définir une fonction f / ∼ sur l’ensemble quotient E/ ∼. Pour C ∈ E/ ∼, on considère un
représentant x ∈ C et on pose :
˙
f / ∼ (C) = f (x). On notera souvent f au lieu de f / ∼.
Définition
Soit ∼ une relation d’équivalence sur un ensemble E.
Une loi interne ∗ est compatible avec ∼ ssi
∀x1 , x2 , y1 , y2 ∈ E, x1 ∼ x2 et y1 ∼ y2 ⇒ x1 ∗ y1 ∼ x2 ∗ y2
On définit alors la loi quotient ∗/ ∼ sur E/ ∼ en associant aux classes d’équivalences de x et y la classe
d’équivalence de x ∗ y. On notera souvent ∗ au lieu de f / ∼.
26
Section V.2 - Construction de l’e.v.n. Lp
Définition
Soit p ∈ [1, +∞]. On note Lp (E, E, µ) le quotient de l’espace Lp (E, E, µ) par la relation d’égalité µ−presque
partout. On note Lp (Rd ) = Lp (Rd , B(Rd ), λ(d) ).
: Lp (N, P(N ), n∈N δn ) = Lp (N, P(N ), n∈N δn ) = `p , puisque l’égalité presque partout pour la mesure
P P
Remarque
l’égalité (chaque classe d’équivalence contient un unique élément, donc les ensembles Lp (N, P(N ), n∈N δn )
P P
n∈N δn sur N est
et Lp (N, P(N ), n∈N δn ) sont en bijection ; on les identifie).
P
Proposition
Proposition
Remarque : Soit x0 ∈ E. La fonction d’évaluation en x0 (appelée également trace sur {x0 }) de Lp (E, E, µ) → R qui
à f associe f (x0 ) n’est pas compatible avec la relation d’équivalence égalité µ-pp. En d’autres termes, la valeur des
éléments de Lp (E, E, µ) en un point n’a pas de sens.
Proposition
Proposition
Dans Lp (E, E, µ) : Z
|f |p dµ = 0 ⇔ f = 0
E
Définition
Définition
Soit f : E → R. Si f admet un ou plusieurs presque majorants, on appelle borne supérieure essentielle le
plus petit d’entre eux et on le note sup ess f
Définition
27
Théorème (Inégalité de Young)
ap bq
∀(a, b) ∈ R+ × R+ , ab ≤ +
p q
Démonstration : Par concavité de x 7→ ln(x) sur ]0, +∞[, on a ∀t ∈ [0, 1], ln(tap + (1 − t)bq ) ≥ t ln(ap ) + (1 − t) ln(bq ).
En posant t = p1 , alors 1 − t = 1q et :
ap bq 1 1
ln( + ) ≥ ln(ap ) + ln(bq ) = ln(ab)
p q p q
d’où le résultat en passant à l’exponentielle strictement croissante.
Définition
Soit p et q dans ]1, +∞[ conjugués. Soit f ∈ Lp (E, E, µ) et g ∈ Lq (E, E, µ). Alors :
Démonstration : Si p = 1 ou q = 1 alors le résultat est trivial, si f = 0 ou g = 0 aussi. On élimine donc ces cas, et on
suppose p ∈]1, +∞[. L’inégalité de Young donne :
|f (x)|p |f (x)|q
|f (x)||g(x)| ≤ +
p q
λp−1 1
||f g||1 ≤ ||f ||pp + ||g||qq
p λq
q
||g||qp
On pose alors λ = ||f ||p , ce qui nous permet d’obtenir :
q !p−1
1 ||g||qp 1 ||f ||p 1 q(p−1)
1 q(p−1)
q(p−1) 1 1
Or p = 1 et p + q = 1, d’où :
||f g||1 ≤ ||f ||p ||f ||q
28
⇔ |f + g|p ≤ 2p−1 |f |p + 2p−1 |g|p
On a donc f + g ∈ Lp (E, E, µ). Alors :
Z Z Z
p p−1 p−1
||f + g||p = |f + g| |f + g|dµ ≤ |f + g| |f | + |f + g|p−1 |g|
E E E
Z 1 !p−1
p
= (|f + g|p )dµ ||f ||p = (||f + g||p )p−1 ||f ||p
E
Ainsi :
||f + g||pp ≤ (||f + g||p )p−1 (||f ||p + ||g||p ) ⇔ ||f + g||p ≤ ||f ||p + ||g||p
Proposition
Démonstration : Clairement ||f ||p = 0 ⇔ f = 0 et ||λf ||p = λ||f ||p . L’inégalité triangulaire n’est autre que l’inégalité
de Minkowski démontrée ci-dessus.
Remarque : Il ne faut pas confondre ”f une fonction continue presque partout” et ”f est égale presque partout à une
fonction continue”.
Définition
Soit f : E → R une classe de fonctions.
S’il y a une fonction continue dans cette classe, on dira que f est continue.
Dans ce cas, pour x0 ∈ E on donnera à f (x0 ) la valeur de son représentant continu en x0 .
Théorème (Fischer-Riesz)
Démonstration : On commence par traiter le cas p = +∞. Soit (fn )n∈N une suite de Cauchy d’éléments de L∞ (E, E, µ).
∀k ∈ N∗ , ∃N ∈ N, ∀(m, n) ∈ N2 , m > n > N ⇒ ||fm − fn ||∞ < k1 . Il existe Zk de mesure nulle tel que ∀k ∈ N∗ , ∃N ∈
N, ∀(m, n) ∈ N2 , ∀x ∈ E\Zk , m > n > N ⇒ |fm − fn | < k1 . Z = ∪k∈N∗ Zk est de mesure nulle, alors ∀k ∈ N∗ , ∃N ∈
N, ∀(m, n) ∈ N2 , ∀x ∈ E\Z, m > n > N ⇒ |fm (x) − fn (x)| < k1 . On en déduit que ∀x ∈ E\Z, (fn (x))n∈N est
une suite de Cauchy d’éléments de R, qui converge car R est complet. Notons f (x) sa limite ; (fn )n∈N converge
simplement vers f sur E\Z. Ainsi ∀x ∈ E\Z, ∀k ∈ N∗ , ∃N ∈ N, ∀n ∈ N, |fn (x) − f (x)| < k1 . Ainsi f ∈ L∞ (E, E, µ) et
lim ||fn − f ||∞ = 0, donc (fn )n∈N converge dans L∞ (E, E, µ).
n→+∞
p
Désormais, soit p ∈ [1, +∞[, et (fn )P
n∈N une suite de Cauchy d’éléments de L (E, E, µ). On extrait (fnk ) telle que
1 n
||fnk+1 − fnk ||p < 2k . On note gn = k=1 |fnk+1 − fnk |. Alors :
n n
X X 1
||gn ||p = || |fnk+1 − fnk | ||p ≤ ||fnk+1 − fnk ||p ≤ 1 − ≤1
2m
k=1 k=1
Ainsi (gn (x)) converge vers g(x) presque partout. Soit s et t deux entiers avec s > t. Par téléscopage, |fns − fnt | ≤
g − gt−1 donc (fnk (x)) est de Cauchy pour presque tout x. Ainsi, elle converge, et on note f (x) sa limite. Lorsque
29
s → +∞, on |f − fnt | ≤ g − gt−1 ≤ g, ce qu’on réecrit |fnk − f (x)|p < g p (x), soit |fnk (x) − f (x)|p → 0 lorsque
nk → +∞. D’après le théorème de convergence dominée, f ∈ Lp (E, E, µ) et lim ||fnk (x) − f (x)||p = 0.
k→+∞
Proposition
Démonstration : hf, gi = E f gdµ est un produit scalaire sur L2 (E, E, µ). C’est un espace préhilbertien, et il est
R
complet pour la norme induite par le produit scalaire par la proposition précédente.
Théorème (Riesz)
Définition
Théorème
Définition
30
Définition
L∞
C (E, E, µ) = {f : E → C mesurable ; ∃C > 0, |f | ≤ C p.p.}
Proposition
Proposition
1
On considère l’espace de Hilbert HR = L2C ([0, 2π], B([0, 2π]), 2π λ).
1
Le produit scalaire est hf, gi = 2π [0,2π] f g dλ.
Alors, H admet la base hilbertienne {en , n ∈ Z}, où en est défini par en (x) = einx = cos(nx) + i sin(nx)
1
Soit f ∈ H, et > 0. Cc ([0, 2π], C) est dense dans H = L2C ([0, 2π], B([0, 2π]), 2π λ). Ainsi il existe u ∈ Cc ([0, 2π], C)
tel que ||u − f ||2 < 2 . On pose :
k
X sin((k + 12 )x)
Dk (x) = einx =
sin x2
n=−k
On a alors : Z
1
||uK − u||2 = ||x 7→ [u(x − t) − u(x)]FK (t)dλ(t)||2
2π [0,2π]
h
Soit h > 0 tel que |y2 − y1 | < 2⇒ |u(y1 ) − u(y2 )| ≤ 4 . Sur [0, h2 ] ∪ [2π − h2 , 2π], on a (u(x − t) − u(x)) < 4 . Donc :
Z
1
||x 7→ [u(x − t) − u(x)]FK (t)dλ(t)||2 <
2π [0, h2 ]∪[2π− h2 ,2π] 4
Z
1
et∃K ∈ N∗ , ||x 7→ [u(x − t) − u(x)]FK (t)dλ(t)||2 ≤ M ZK <
2π [h h
2 ,2π− 2 ]
4
Z
1
⇒ ||uK − u||2 = ||x 7→ [u(x − t) − u(x)]FK (t)dλ(t)||2 <
2π [0,2π] 2
31
Or, on a : !
K−1 k Z
X X 1 1
uK (x) = u(x − t)dλ(t) eint
2π K [0,2π]
k=0 n=−k
PN
Donc uK est une combinaison linéaire de en . Il existe un N ∈ N et des cn tels que ||u − n=−N cn en ||2 < 2 . Alors :
N
X N
X
||f − cn en ||2 ≤ ||f − u||2 + ||u − cn en ||2 <
n=−N n=−N
32
Chapitre VI. Introduction aux probabilités
Section VI.1 - Mesure de probabilité
Définition
On appelle espace probabilisé un espace mesuré pour lequel la mesure P est une mesure de probabilité. (P(Ω) =
1)
Définition
Définition
Les singletons de F sont appelés évènements élémentaires.
Définition
Card(A)
P : P(Ω) → [0, 1], P(A) =
Card(Ω)
1
Les évènements élémentaires sont dits équiprobables. Ils ont tous la même probabilité Card(Ω) .
On dit également que P est la mesure uniforme discrète sur l’ensemble Ω.
Théorème
Démonstration : Soit Ω = {ωi ; i ∈ I} un ensemble fini ou dénombrable. Supposons connaı̂tre pi = P(ωi ) pour tout
i ∈ I. P
Soit A ∈ F = P(Ω). A = ∪i∈I,ωi ∈A donc P(A) =P i∈I,ωi ∈A pi est définie de manière unique.
Pque i∈I pi = 1. On suppose P(ωi ) = pi . Soit A = ∪i∈I,ωi ∈A {ωi } ∈ F.
Soit (pi )i∈I une suite de réels positifs tels
Alors on définit la mesure P par P(A) = i∈I,ωi ∈A pi .
Définition
Définition
Soit (Ω, F, P) un espace probabilisé, et A et B deux évènements avec P(B) > 0. La probabilité conditionnelle
de A sachant B est définie par
P(A ∩ B)
P(A|B) =
P(B)
33
Remarque : A 7→ P(A|B) définit une mesure de probabilité sur (Ω, F ).
Soit (Ω, F, P) un espace probabilisé. Soit (Ei )i∈I une partition des évènements de mesure non nulle, avec I fini
ou dénombrable.
Pour tout évènement A, on a : X
P(A) = P(A|Ei )P(Ei )
i∈I
Théorème (Bayes)
Soit (Ω, F, P) un espace probabilisé. Soit (Ei )i∈I une partition des évènements de mesure non nulle, avec I fini
ou dénombrable.
Soit A un évènement et n ∈ I. Alors :
P(A|En )P(En )
P(En |A) = P
i∈I P(A|Ei )P(Ei )
Définition
P(A ∩ B) = P(A)P(B)
Définition
Remarque : L’indépendance mutuelle entraı̂ne l’indépendance deux-à-deux, mais la réciproque est fausse. Prenons
Ω = [[1, 6]]2 , F = P(Ω) et P la mesure d’équiprobabilité. Alors les évènements A1 = {6} × [[1, 6]], A2 = [[1, 6]] × {6} et
A3 = {(x, x); x ∈ [[1, 6]]} sont deux-à-deux indépendants, mais pas mutuellement indépendants.
Définition
Définition
Soit (Ω, F, P) un espace probabilisé, (E, E) un espace mesuré et X une variable aléatoire.
L’application PX définie de E dans [0, 1] par PX (A) = P(X −1 (A)) est une mesure de probabilité sur (E, E),
que l’on appelle loi de X.
On ne peut que recommander d’aller voir la vidéo de John Cagnol, qui introduit les variables aléatoires par
l’exemple du jeu de l’oie.
34
P(X = Y ) signifie P({ω ∈ Ω; X(ω) = Y (ω)}).
Remarque : Supposons E au plus dénombrable et prenons E = P(E). Puisqu’une variable aléatoire X est une fonction
mesurable de (Ω, F ) dans (E, E), il y a équivalence entre ”X est une variable aléatoire” et ”∀e ∈ E, X −1 ({E}) ∈ F ”.
Définition
Soit X une variable aléatoire.
On appelle tribu engendrée par la variable aléatoire, et on note σ(X), la tribu σ(X −1 (E)).
Définition
Soit X une variable aléatoire sur un espace probabilisé (Ω, F, P) à valeurs dans R.
On dit que X admet un moment d’ordre n ∈ N∗ si X ∈ Ln (Ω, F, P). Dans ce cas, on note :
Z
mn = X n dP
Ω
Proposition
Soit X une variable aléatoire sur un espace probabilisé (Ω, F, P) à valeurs dans (E, E) et h : E → R une fonction
mesurable.
Alors h(X) est une variable aléatoire sur (Ω, F, P) à valeurs dans R.
Soit X une variable aléatoire sur un espace probabilisé (Ω, F, P) à valeurs dans (E, E). Alors pour toute fonction
mesurable bornée h : E → R : Z
E(h(X)) = hdPX
E
Démonstration : Soit A ∈ E et h = 1A .
Z Z Z
−1
E(h(X)) = 1A (X)dP = P(X (A)) = PX (A) = 1A dPX = hdPX
Ω E E
On a donc l’égalité pour toute fonction indicatrice, et par linéarité de l’intégrale, cela s’étend pour toute fonction
étagée h : E → R+ .
Soit h : E → [0, +∞] une fonction mesurable. Il existe une suite croissante (hn )n∈N de fonctions étagées positives
convergeant simplement vers h. Le théorème de transfert s’applique aux (hn ), et le théorème de convergence monotone
permet d’obtenir le théorème pour h.
Soit h : E → R une fonction mesurable. Le théorème de transfert s’applique à |h| :
Z
E(|h(X)|) = |h|dPX
E
35
Théorème
Soit X une variable aléatoire sur un espace probabilisé (Ω, F, P) à valeurs dans E dont la loi PX admet une
densité fX et soit h : E → R une fonction mesurable telle que :
Z
|h(x)|fX (x)λ(dx) < +∞
R
Proposition
Soit (Xn )n∈N une suite de variables aléatoires sur un espace probabilisé (Ω, F, P) à valeurs dans R.
• Si (Xn ) est une suite croissante et positive, alors lim E(Xn ) = E( lim Xn ) (théorème de la convergence
n→+∞ n→+∞
monotone)
• Si (Xn )n∈N est une suite positive alors E(lim inf Xn ) ≤ lim inf E(Xn ) (lemme de Fatou)
• Si ∀n ∈ N, Xn ≤ Z avec Z ∈ L1 alors lim E(Xn ) = E( lim Xn ) (théorème de la convergence dominée)
n→+∞ n→+∞
Proposition
Remarque : Cela nous permet d’en déduire par exemple que pour tout réel a, E(a) = a ou encore que E(X −E(X)) = 0.
Définition
Soit X une variable aléatoire sur un espace probabilisé (Ω, F, P) à valeurs dans R.
On dit que X admet un moment centré d’ordre n ∈ N∗ si X − E(X) ∈ Ln (Ω, F, P). Dans ce cas, on note :
Z
µn = (X − E(X))n dP
Ω
Le moment centré d’ordre 2 est appelé variance de la variable aléatoire et noté Var(X).
Proposition
Définition
Soit X une variable aléatoire sur un espace probabilisé (Ω, F, P) à valeurs dans R admettant un moment d’ordre
2. p
On appelle écart-type le réel positif σ(X) = Var(X).
Soit X une variable aléatoire sur un espace probabilisé (Ω, F, P) à valeurs dans R admettant un moment d’ordre
2. Alors :
1
P(|X − E(X)| ≥ aσ) ≤ 2
a
36
Démonstration : On utilise l’inégalité de Markov :
E(|X − E(X)|2 1
P(|X − E(X)| ≥ aσ) = P(|X − E(X)|2 ≥ a2 Var(X)) ≤ = 2
a2 Var(x) a
Définition
Le moment d’ordre 3 donne une indication sur la symétrie. On utilise souvent le coefficient d’asymétrie
µ3
3/2 .
µ2
µ4
Le moment d’ordre 4 donne une indication sur les queues de distribution. On utilise souvent le kurtosis µ22
(et l’excès de kurtosis : µµ24 − 3)
2
Définition
Considérons R muni d’une tribu contenant la tribu de Borel, et muni d’une mesure de probabilité P.
On appelle fonction de répartition l’application F : R → [0, 1] définie par F (x) = P(] − ∞, x]).
P6 1
Exemple : Pour la modélistion du lancé d’un dé, P = i=1 6 δi . La fonction de répartition est alors f (x) =
P6
i=1 1[i,+∞[ (x).
Proposition
Soit F une fonction de répartition. Alors, F est croissante et continue à droite, et vérifie lim F (x) = 0 et
x→−∞
lim F (x) = 1
x→+∞
Théorème
Soit F une fonction de R dans R croissante, continue à droite et vérifiant lim F (x) = 0 et lim F (x) = 1.
x→−∞ x→+∞
Alors il existe une mesure de probabilité dont elle est la fonction de répartition.
Définition
On appelle π-système sur Ω toute collection J de parties de Ω stable par intersection finie.
Deux mesures de probabilité qui coı̈ncident sur un π-système J coı̈ncident également sur σ(J ), la tribu en-
gendrée par J .
Théorème
Considérons R muni de la tribu de Borel. Soit P1 et P2 deux mesures, F1 et F2 leurs fonctions de répartition
respectives. Alors :
F1 = F2 ⇔ P1 = P2
Démonstration : Le sens ⇐ est immédiat. Pour le sens ⇒, on suppose que ∀x ∈ R, P1 (] − ∞, x]) = P2 (] − ∞, x]). On
a σ({] − ∞, x]; x ∈ R}) ⊂ B(R) car les fermés sont dans B(R), et B(R) ⊂ σ({] − ∞, x]; x ∈ R}) car les ]a, b[ sont une
37
base de la topologie de R et ]a, b[= (∪n∈N∗ ] − ∞, b − n1 ])∩] − ∞, a]. Ainsi σ({] − ∞, x]; x ∈ R}) = B(R) ce qui conclut
que P1 = P2 par le lemme de classe monotone.
Proposition
Proposition
La fonction de répartition est continue si et seulement si la msure de probabilité associée est diffuse (i.e. sans
atomes)
Proposition
Définition
Cette loi permet de modéliser des situations où il y a un nombre fini de résultats équiprobables.
Définition
PX = pδe1 + (1 − p)δe2
Cette loi permet de modéliser des expériences aléatoires dont l’issue est le succès ou l’échec.
Définition
Cette loi permet de modéliser le nombre de succès lors de la répétition de n expériences aléatoires identiques
et indépendantes dont la probabilité de succès est p. On note X ∼ B(n, p).
38
Proposition
Définition
Cette loi permet de modéliser le nombre de fois où un évènement se produit dans un intervalle, lorsque l’on
sait que le nombre moyen d’occurrences et habituellement de λ dans cet intervalle. On note X ∼ Pois(λ).
Proposition
Définition
Soit p ∈]0, 1[ et E = N∗ .
X suit une loi géométrique de paramètre p signifie
+∞
X
PX = pk (1 − p)δk
k=1
Cette loi est utile pour modéliser le nombre de succès consécutifs avant un échec lorsque l’on répète des
expériences identiques et indépendantes de probabilité de succès p. On note X ∼ G(p).
Proposition
Définition
Soit a, b ∈ R tels que a < b. On considère E = R.
X suit une loi uniforme continue de paramètres a et b signifie PX a pour densité
1
fX (x) = 1[a,b]
b−a
Cette loi est utile pour modéliser le nombre de succès consécutifs avant un échec lorsque l’on répète des
expériences identiques et indépendantes de probabilité de succès p. On note X ∼ U(a, b).
Proposition
39
Définition
fX (x) = λe−λx
Cette loi permet de modéliser la durée entre les occurrences d’un évènement.
Proposition
Définition
Proposition
Définition
(x − m)2
1
fX (x) = √ exp −
2πσ 2σ 2
On note X ∼ N (m, σ 2 ).
Proposition
40
Chapitre VII. Mesure produit, Convolution
Section VII.1 - Espace produit
Définition
Exemple : Si E = F = R, E = F = B(R), alors E × F n’est pas directement une tribu (la réunion de deux rectangles
n’est pas un rectangle). E ⊗ F est la plus petite tribu contenant E × F ; on part de E × F, et on espère s’arrêter avant
P(E × F).
Proposition
Proposition
et l’ensemble R des produits cartésiens mesurables de (B(R))⊗n . C ⊂ R donc B(Rn ) = σ(C) ⊂ σ(R) = (B(R))⊗n , car
les ouverts s’expriment comme réunion dénombrable de pavés. D’où le résultat.
Définition
Soit E et F deux ensembles et A ⊂ E × F .
Pour e ∈ E, on appelle la x-section de A l’ensemble
Ae = {y ∈ F ; (e, y) ∈ A}
Af = {x ∈ E; (x, f ) ∈ A}
Proposition
41
Proposition
Proposition
Définition
On dit qu’une collection J de parties de E est un λ-système ssi :
1. E ∈ J
2. A ∈ J ⇒ E\A ∈ J
3. Pour toute suite (An )n∈N d’éléments disjoints de J , ∪n∈N An ∈ J .
Théorème (Dynkin)
Tout λ-système qui contient un π-système contient également la tribu engendrée par ce π-système.
Théorème
∀A ∈ E, ∀B ∈ F, m(A × B) = µ(A)ν(B)
m=µ⊗ν
• Pour tout C ∈ E ⊗ F : Z Z
(µ ⊗ ν)(C) = ν(Cx )µ(dx) = µ(C y )ν(dy)
E F
Démonstration : On se place dans le cas où µ et ν sont finies. On définit la fonction m de E ⊗ F dans [0, +∞] par :
Z
∀C ∈ E ⊗ F, m(C) = ν(Cx )µ(dx)
E
ν(Cx ) est bien défini puisque Cx est la x-section d’un ensemble mesurable. On pose
G = {C ∈ E ⊗ F; hC est borélienne}
G contient tous les produits cartésiens A × B où A ∈ E et B ∈ F. En effet, soit A ∈ E et B ∈ F. (A × B)x = B
si x ∈ A, (A × B)x = ∅ sinon. Ainsi ν((A × B)x ) = 1A (x)ν(B), donc hA×B est borélienne (A est mesurable). Par
42
ailleurs, c’est un λ-système ; ∅ ∈ G car h∅ est la fonction nulle, donc mesurable. Soit C ∈ G. Alors h(E×F )\C =
ν(((E × F )\C)x ) = ν(F \Cx ) = ν(F ) − ν(Cx ). Ainsi h(E×F )\C = ν(F ) − hC est borélienne, et (E × F )\C ∈ G. Si
C1 et C2 sont deux ensembles disjoints de G alors hC1 ∪C2 = hC1 + hC2 est borélienne donc C1 ∪ C2 ∈ G. G est stable
+∞
par union disjointe finie. Soit (Cn )n∈N une suite d’ensembles disjoints de G. On pose YN = ∪N n=0 Cn et Z = ∪n=0 Cn .
hYN est borélienne et croissante. Elle converge vers hZ , qui est donc borélienne. Ainsi Z ∈ G. En conséquence, G est
un λ-système, qui contient le π-système de l’ensemble des produits cartésiens A × B où A ∈ E et B ∈ F. D’après
le théorème de Dynkin, G contient la tribu engendrée par ce π-système, donc contient E ⊗ F, soit G = E ⊗ F. Ainsi
hC : x 7→ ν(Cx ) est bien borélienne, et m est bien définie, et
Z Z
m(A × B) = ν((A × B)x )µ(dx) = 1A (x)ν(B)µ(dx)
E E
Z
= ν(B) 1A (x)µ(dx) = µ(A)ν(B)
R
Vérifions maintenant que m est une mesure. On a m(∅) = E ν(∅x )µ(dx) = 0, et pour toute suite (Cn )n∈N d’éléments
deux-à-deux disjoints de E ⊗ F :
Z Z
m(∪n∈N Cn ) = ν((∪n∈N Cn )x )µ(dx) = ν(∪n∈N ((Cn )x )µ(dx)
E E
Z +∞
! +∞ Z +∞
X X X
= ν((Cn )x ) µ(dx) = ν((Cn )x )µ(dx) = m(Cn )
E n=0 n=0 E n=0
m est donc bien une mesure. Celle-ci est par ailleurs unique, car si m et m0 sont deux mesures telles que ∀A ∈ E, ∀B ∈
F, m(A × B) = µ(A)ν(B) = m0 (A × B), alors m et m0 coı̈ncident sur un π-système et donc d’après le lemme de classe
monotone, m et m0 coı̈ncident sur la tribu engendrée par les produits cartésiens d’ensembles de E et F, c’est-à-dire
E ⊗ F ; donc m = m0 .
Exemple : Considérons la mesure de Lebesgue λ sur R muni de la tribu de Lebesgue. Soit a1 , a2 , b1 , b2 quatre réels
avec a1 < b1 et a2 < b2 . Alors (λ ⊗ λ)(]a1 , b1 [×]a2 , b2 [) = λ(]a1 , b1 [)λ(]a2 , b2 [) = (b1 − a1 )(b2 − a2 ). On a donc bien
généralisé le fait que l’aire d’un rectangle est le produit du longueur par la largeur. De façon analogue, λ(n) = λ⊗n .
Théorème (Fubini-Tonelli)
Soit (E, E, µ) et (F, F, ν) deux espaces mesurés, avec µ et ν σ-finies. Soit f : E × F → [0, +∞] mesurable.
Alors : Z
• x 7→ f (x, y)ν(dy) est µ-mesurable
F
Z
• y 7→ f (x, y)µ(dx) est ν-mesurable
E
Z Z Z Z
• f (x, y)ν(dy) µ(dx) = f (x, y)µ(dx) ν(dy)
E F F E
Z
= f (x, y)(µ ⊗ ν)(dx, dy)
E×F
R R
Démonstration : Soit RC ∈ E ⊗ F. Pour f = 1C , on a x 7→ F 1C (x, y)ν(dy) = F 1Cx (y)ν(dy) = ν(Cx ) qui est
µ-mesurable, et y 7→ E 1C (x, y)µ(dx) = µ(C y ) est ν-mesurable. Par linéarité, on obtient la mesurabilité pour toute
fonction étagée positive, puis par limite croissante, pour tout f positive.
Soit C ∈ E ⊗F. Pour f = 1C , l’égalité demandée est (E ⊗F)(C) = E ν(Cx )µ(dx) = F µ(C y )ν(dy) que l’on sait vraie.
R R
On l’obtient ensuite par linéarité pour toute f étagée positive, puis, par limite croissante, pour toute fonction f positive.
43
Théorème (Fubini-Lebesgue)
Soit (E, E, µ) et (F, F, ν) deux espaces mesurés, avec µ et ν σ-finies. Soit f ∈ L1 (E × F, E ⊗ F, µ ⊗ ν). Alors :
• x 7→ f (x, y) est dans L1 (E, E, µ) pour ν-presque tout y, y 7→ f (x, y) est dans L1 (F, F, ν) pour µ-presque tout
x.
• y 7→ E f (x, y)µ(dx) est ν-mesurable, définie presque partout et dans L1 (F, F, ν), et x 7→ F f (x, y)ν(dy) est
R R
R R
Démonstration
R : |f | est mesurable est positive, donc d’aprèsR le théorème de Fubini-Tonelli, E ( F |f (x, y)|µ(dx))ν(dy) =
E×F
|f (x, y)|(µ ⊗ ν)(dx, dy) < +∞ par hypothèse, donc F |f (x, y)|µ(dx) < +∞ presque partout. Ainsi y 7→ f (x, y)
1 1
est dans R L (F, F, ν) presque partout. De même, on montre que x 7→ f (x, y) est dans L (E, R E,
R µ) presque partout.
x →
7
R R F f (x, y)ν(dy) est bien définie sauf sur un ensemble négligeable. On a alors E
f (x, y)ν(dy) µ(dx) ≤
F
( |f (x, y)|ν(dy)|µ(dx) ≤ E×F |f |d(µ ⊗ ν). Ainsi x 7→ F f (x, y)ν(dy) est dans L1 (E, E, µ) et de la même manière,
R R
E F
y 7→ E f (x, y)µ(dx) est dans L1 (F, F, ν).
R
Exemples : Pour calculer [2,3]×[0,1] xyλ(2) (dx, dy), on peut remarquer que la mesure de Lebesgue est σ-finie et que
R
(y12 + y22 )λ(2) (dy1 , dy2 ) = ((2x1 )2 + (2x2 )2 )4λ(2) (dx1 , dx2 ).
R R
Exemple : B(0,1) B(0, 12 )
Définition
44
Proposition (Changement de variable linéaire)
Définition
Soit (Ω, A, P) un espace probabilisé et X : Ω → (E, E), Y : Ω → (F, F) deux variables aléatoires.
La construction de la tribu produit et de la mesure produit permet de définir une variable aléatoire Z : Ω →
(E × F, E ⊗ F) telle que Z(ω) = (X(ω), Y (ω)). Z sera notée (X, Y ).
La loi P(X,Y ) de (X, Y ) est la mesure définie sur E ⊗ F par ∀C ∈ E ⊗ F, P(X,Y ) (C) = P((X, Y ) ∈ C).
Définition
Soit (Ω, A, P) un espace probabilisé et X : Ω → (E, E), Y : Ω → (F, F) deux variables aléatoires.
On note PX la loi de X, PY la loi de Y et P(X,Y ) la loi jointe de (X, Y ). On dit alors que X et Y sont
indépendantes ssi P(X,Y ) = PX ⊗ PY . Les lois PX et PY sont appelées lois marginales de (X, Y ).
Proposition
Soit (Ω, A, P) un espace probabilisé et X : Ω → (E, E), Y : Ω → (F, F) deux variables aléatoires. X et Y sont
indépendantes ssi :
∀A ∈ E, ∀B ∈ F, P(X ∈ A, Y ∈ B) = P(X ∈ A)P(X ∈ B)
Démonstration : Le sens ⇒ découle directement de la définition de l’indépendance, et le sens ⇐ repose sur le fait que
P(X,Y ) et PX ⊗ PY sont finies et coı̈ncident sur un π-système, donc sont égales par le lemme de classe monotone.
Proposition
Démonstration : Le sens direct se démontre en remarquant qu’on a l’égalité pour les fonctions indicatrices, puis on
procède comme habituellement : on étend l’égalité aux fonctions étagées positives, puis aux fonctions positives, puis
à toute fonction bornée mesurable. Le sens indirect se montre en choisissant, pour A ∈ E et B ∈ F, les fonctions
f = 1A et g = 1B .
Définition
Soit (Ω, A, P) un espace probabilisé et (Xi )i∈I une famille de variables aléatoires.
On dit que (Xi )i∈I est une famille indépendante ssi :
45
Définition
Proposition
Proposition
Une famille de variables aléatoires (Xi )i∈J est indépendantes ssi les tribus σ(Xi ) le sont.
Définition
Soit (E, +) un groupe commutatif, et T une topologie rendant l’application (x, y) 7→ x − y continue. On munit
E de sa tribu borélienne B(T ). Soit λ et µ deux mesures σ-finies sur (E, B(T )). On appelle produit de
convolution de la mesure µ par la mesure ν la mesure µ ∗ ν définie par :
Z
∀A ∈ B(T ), (µ ∗ ν)(A) = 1A (x + y)(µ ⊗ ν)(dx, dy)
E×E
Remarque : µ ∗ ν est bien définie puisque (x, y) 7→ x + y est borélienne. µ ∗ ν est la mesure image de µ ⊗ ν par
(x, y) 7→ x + y.
Proposition
Proposition
Proposition
Proposition
Démonstration : µ ∗ ν est la mesure image de µ ⊗ ν par (x, y) 7→ x + y. L’addition étant commutative, on a donc
µ ∗ ν = ν ∗ µ.
46
Définition
Remarque : Si f et g sont positives et si µ et ν sont des mesures de densité f et g par rapport à la mesure de Lebesgue,
alors µ ∗ ν est une mesure de densité f ∗ g par rapport à la mesure de Lebesgue.
Proposition
• f ∗g =g∗f
• (f ∗ g) ∗ h = f ∗ (g ∗ h)
∀a ∈ R, f ∗ (g + ah) = f ∗ g + a(f ∗ h)
Théorème
Théorème
Soit p et q dans [1, +∞] conjugués, soit f ∈ Lp (Rd , B(Rd ), λ(d) ) et g ∈ Lq (Rd , B(Rd ), λ(d) .
Alors f ∗ g est bien définie, uniformément continue et bornée.
Ainsi f ∗ g est bien définie. On ne démontrera pas ici les autres propriétés.
Théorème
1
Soit f ∈ CC (Rd ) et g ∈ L1 (Rd , B(Rd ), λ(d) ).
Alors f ∗ g est bien définie, de classe C 1 et ∀i ∈ [[1, d]], ∂i (f ∗ g) = (∂i f ) ∗ g.
47
f (z + h) − f (z)
Z
⇒ − f 0 (z) = (f 0 (z + hv) − f 0 (z))λ(dv)
h [0,1]
f 0 est continue sur un compact, donc uniformément continue (Heine), donc il existe η > 0 tel que |z1 − z2 | < η ⇒
|f 0 (z1 ) − f 0 (z2 )| < ||g||
1
. Pour h < η, on a donc |f 0 (z + hv) − f 0 (z)| < ||g||
1
d’où | f (z+h)−f
h
(z)
− f 0 (z)| < ||g||
1
. On a
alors, en multipliant par g(y) et en intégrant :
Z
f (x − y + h) − f (x − y) 0
− f (x − y) g(y)λ(dy) <
R h
(f ∗ g)(x + h) − (f ∗ g)(x)
⇒ − (f 0 ∗ g)(x) <
h
D’où le résultat.
Proposition
k
Soit f ∈ CC (Rd ) et g ∈ L1 (Rd , B(Rd ), λ(d) ).
Alors f ∗ g est bien définie, de classe C k et :
où n1 + ... + nd ≤ k.
Définition
Remarques : On prendra gare au fait que n et k sont des multi-indices : n = (n1 , ..., nd ) et k = (k1 , ...kd ).
Si u et v sont positives et si µ et ν sont des mesures de densité u et v par rapport à la mesure de comptage alors µ ∗ ν
est une mesure de densité u ∗ v par rapport à la mesure de comptage.
Si u et v sont absolument convergentes alors u ∗ v est bien défini.
La mesure de Dirac δ en 0 est une mesure de densité u = (un )n∈Z par rapport à la mesure de comptage pour u0 = 1
et ∀n ∈ Zd \{0, }, un = 0. Cette suite (un )n∈Zd est donc élément neutre pour la convolution des suites.
n β n −β
Exemple : Soit un = αn! e−α et vn = n! e , où α et β sont des réels strictement positifs. Soit la suite (wn )n∈N =
(un )n∈N ∗ (vn )n∈N . Alors :
n n
X X αn−k −α β k −β
wn = un−k vk = e e
(n − k)! k!
k=0 k=0
−(α+β) n
e X n (α + β)n −(α+β)
= αn−k β k = e
n! k n!
k=0
On vient ici de montrer que la somme de deux variables indépendantes suivant des lois de Poisson de paramètre α et
β est une loi de Poisson de paramètre α + β.
Définition
OnRappelle noyau de sommabilité toute suite (kn )n∈N de fonctions intégrables vérifiant :
1. E kn dµR = 1
2. supn∈N |kn |dµ < +∞ R
3. Pour tout F ⊂ E\{0} fermé, lim F kn dµ = 0
n→+∞
48
Proposition
Pk 1
PK−1
Exemple : On considère Dk (x) = n=−k einx et FK (x) = K k=0 Dk (x). On rappelle que nous avons déjà vu dans
le chapitre V que :
!2
1 sin Kx2
FK (x) = prolongé par K en 0[2π]
K sin x2
(FK )K∈N∗ est un noyau de sommabilité pour E = [0, 2π]. Dans le chapitre V, la démonstration effectuée pour
1
démontrer que {x 7→ einx , n ∈ Z} est une base hilbertienne de L2C ([0, 2π], B([0, 2π]), 2π λ) revient fondamentalement à
appliquer cette proposition.
On se place désormais dans Rd avec d ∈ N∗ . Pour tout n ∈ N∗ , on définit :
Définition
OnRappelle suite régularisante toute suite (ρn )n∈N satisfaisant pour tout n :
1. E ρn dµ = 1
2. ρn ≥ 0
3. Supp ρn ⊂ B(0, n ) avec lim n = 0
n→+∞
4. ρn ∈ C +∞ (Rd )
Exemple : On pose :
(
−1
exp 1−||x||2 si ||x|| < 1
Ψ(x) =
0 sinon
R
et on note c = Rd
Ψdλ. Un exemple de suite régularisante est alors :
( d
nd n
c exp −1
1−n2 ||x||2 si ||x|| < 1
n
ρn (x) = Ψ(nx) =
c 0 sinon
Proposition
Soit (ρn )n∈N une suite régularisante, p ∈ [1, +∞[ et f ∈ Lp (Rd ). Alors ρn ∗ f → f dans Lp et ρn ∗ f → f
uniformément sur tout compact.
Théorème
∞
Pour tout ouvert connexe Ω de Rd et pour tout p ∈ [1, +∞[, D(Ω) = CC (Ω) est dense dans Lp (Ω, B(Ω), λ).
49
Chapitre VIII. Vecteurs aléatoires
Section VIII.1 - Fonctions de répartition, Copules
Définition
Soit (Ω, A, P) un espace probabilisé, X1 , ..., Xd des variables aléatoires définies sur (R, B(R)). On dit que
X : Ω 7→ Rd telle que
X1 (ω)
∀ω ∈ Ω, X(ω) = ...
Xd (ω)
est un vecteur aléatoire.
On parle aussi de variable aléatoire multidimensionnelle.
Définition
Proposition
Proposition
Soit X = (X1 , ..., Xd ) : Ω → Rd un vecteur aléatoire dont la fonction de répartition est F : Rd → R, alors :
X Pd
P(X ∈ [xi1 , xi2 ], i ∈ [[1, d]]) = (−1)( j=1 ij ) F (x1i1 , ..., xdid )
(i1 ,...,id )∈{1,2}d
Proposition
50
Définition
FXi1 ,...,Xik (xi1 , ..., xik ) = P(Xi1 ≤ xi1 , ..., Xik ≤ xik )
Proposition
Si les Xi admettent une densité fXi , alors elles sont indépendantes ssi :
Définition
Exemples : C(x, y) = xy pour (x, y) ∈ [0, 1]2 est une copule. On l’appelle la copule d’indépendance.
C(x, y) = min(x, y) pour (x, y) ∈ [0, 1]2 est une copule. On l’appelle la copule de comonotonicité.
θ 1
+(− ln y)θ ) θ
C(x, y) = e−((− ln x) pour (x, y) ∈ [0, 1]2 est une copule. On l’appelle la copule de Gumbel de paramètre
θ ∈ [1, +∞[.
Théorème (Sklar)
51
Définition
Définition
Soit (Ω, A, P) un espace probabilisé, et X : Ω → Rd un vecteur aléatoire tel que ∀i ∈ [[1, d]], Xi ∈ L1 (Ω, F, P).
On appelle espérance de X le vecteur
E(X1 )
E(X) = ...
E(Xd )
Définition
Soit (Ω, A, P) un espace probabilisé, X : Ω → R et Y : Ω → R deux variables aléatoires dans L2 (Ω, F, P).
On appelle covariance de X et Y le réel
Proposition
Démonstration : | Cov(X, Y )| = |E((X−E(X)(Y −E(Y ))| = |hX−E(X), Y −E(Y )iL2 (Ω,F ,P) | ≤ ||X−E(X)||L2 (Ω,F ,P) ||Y −
p p
E(Y )||L2 (Ω,F ,P) = Var(X) Var(Y ) par l’inégalité de Cauchy-Schwarz classique.
Définition
Soit X et Y deux variables aléatoires réelles dans L2 (Ω, F, P) de variance non nulle.
On appelle coefficient de corrélation linéaire le réel de [−1, 1]
Cov(X, Y )
ρX,Y =
σX σY
52
Proposition
Soit X et Y deux variables aléatoires réelles dans L2 (Ω, F, P) de variance non nulle. Alors :
∃(a, b) ∈ R2 , Y = aX + b ⇔ |ρX,Y | = 1
Proposition
Définition
Remarques : Deux variables aléatoires indépendantes sont linéairement indépendantes, mais la réciproque est fausse.
Par exemple, X ∼ U([−1, 1]) et Y = X 2 ne sont pas indépendantes, mais Cov(X, Y ) = E(X 3 ) − E(X 2 )E(X) =
0 − 1 × 0 = 0.
Cov : L2 (Ω, F, P) × L2 (Ω, F, P) → R est bilinéaire, symétrique et positive, mais pas définie : en effect Cov(X, X) =
Var(X) = 0 n’implique pas que X = 0 (seulement X constante). On peut remédier à cela en considérant la relation
d’équivalence ≡ définie par X ≡ Y ssi X et Y diffèrent d’une constante (∃a ∈ R, Y = X + a). Cov est alors un
produit scalaire sur L2 (Ω, F, P)/ ≡. On a par ailleurs la complétude de L2 (Ω, F, P)/ ≡, ce qui nous permet d’affirmer
que (L2 (Ω, F, P)/ ≡, Cov) est un espace de Hilbert pour lequel la norme induite est l’écart-type, et l’orthogonalité est
l’indépendance linéaire.
Définition
Soit (Ω, F, P) un espace probabilisé, X : Ω → Rd un vecteur aléatoire tel que ∀i ∈ [[1, d]], Xi ∈ L2 (Ω, F, P).
On appelle matrice de covariances de X la matrice
Cov(X1 , X1 ) . . . Cov(X1 , Xd )
Σ=
.. .. ..
. . .
Cov(Xd , X1 ) . . . Cov(Xd , Xd )
Proposition
∀V ∈ Rd , q(V ) = Var(hX, V i)
Xd d
X
= Cov( Vi Xi , Vj Xj ) = Cov(hX, V i, hX, V i) = Var(hX, V i)
i=1 i=1
Proposition
53
Proposition
Soit X : Ω → Rd un vecteur aléatoire admettant une densité fX dont le support est A. Soit φ : A → B un
difféomorphisme C 1 et Y = φ(X).
Alors Y admet une densité fY définie par
1
fY = fX ◦ φ−1 1B
|Jφ ◦ φ−1 |
54
Chapitre IX. Transformée de Fourier, Fonction caractéristique
Section IX.1 - Transformée de Fourier d’une mesure
Définition
Soit µ une mesure finie sur (Rd , B(Rd )). On appelle transformée de Fourier de µ la fonction µ̂ : Rd → C
définie par Z
µ̂(y) = eihx,yi µ(dx)
Rd
Remarque : Le fait que l’on ait choisi une mesure finie rend eihx,yi intégrable. On ne peut pas définir la transformée
de Fourier de λ(d) .
Proposition
Démonstration : Soit y ∈ Rd . Alors |µ̂(y)| = | Rd eihx,yi µ(dx)| ≤ Rd |eihx,yi |µ(dx) = Rd µ(dx) = µ(Rd ). Ainsi µ̂
R R R
est bornée. Pour la continuité, on peut appliquer le théorème de continuité sous le signe somme avec domination de
|eihx,yi | par 1.
Théorème
∗ ν = µ̂ν̂
µ[
Démonstration : Soit x ∈ Rd . Z
∗ ν(x) =
µ[ eihx,yi (µ ∗ ν)(dy)
Rd
µ ∗ ν est la mesure image de la somme pour la mesure produit donc :
Z
µ[∗ ν(x) = eihx,u+vi (µ ⊗ ν)(du, dv)
Rd ×Rd
Z Z
= eihx,ui µ(du) ˆ ν(x)
eihx,vi ν(dv) = µ(x) ˆ
Rd Rd
D’où le résultat.
Théorème
µ̂ = ν̂ ⇔ µ = ν
Définition
55
Remarque : La fonction Ff est bien définie puisque |e−ixy f (x)| = |f (x)| et f ∈ L1 (R).
Proposition
1
f λ. Alors λˆf ≤ λf (R), donc λˆf est borné par √12π R f dλ =
R
Démonstration : Si f est à valeurs positives, on pose λf = 2π
√1 ||f ||1 . On a aussi la continuité par le résultat de la section précédente. Dans le cas général, on peut refaire un
2π
raisonnement analogue sur la fonction et non la mesure.
Les limites en +∞ et −∞ s’obtiennent en établissant le résultat sur les fonctions f en escalier puis en raisonnant par
densité des fonctions en escalier dans L1 (R).
Proposition
Démonstration : La première proposition découle de la linéarité de l’intégrale, les deux suivantes des changements de
variables x 7→ cx et x 7→ x − x0 et la dernière en utilisant les mesures de densité f et g.
Proposition
Proposition
Démonstration : F(f 0 ) est bien définie puisque f 0 existe et f 0 ∈ L1 (R). Soit A > 0, alors :
Z Z A
1 1
√ f 0 (x)e−ixy λ(dx) = √ f 0 (x)e−ixy dx
2π [−A,A] 2π −A
Z A
iy 1 A
=√ f (x)e−ixy dx + √ f (x)e−ixy −A
2π −A 2π
En faisant tendre A vers +∞, on obtient le résultat.
Définition
Remarque : La fonction Ff est bien définie puisque |eixy F (x)| = |F (x)| et F ∈ L1 (R).
56
Proposition
Démonstration : Z Z
1 ixu 1 −iuy
(FFf )(x) = √ e √ e f (y)λ(dy) λ(du)
2π R 2π R
A ce stade, on pourrait être tenté d’appliquer Fubini, mais ce n’est pas possible ici car (u, y) 7→ eiu(x−y) f (y) 6∈ L1 (R2 ).
1 − |u|
Cependant, pour n ∈ N∗ , posons an (u) = 2π e n et notons kn = Fan .
Z
1 |u|
kn (x) = e−ixu− n λ(du)
2π R
Z Z
1 u
−ixu+ n 1 u
= e λ(du) + e−ixu− n λ(du)
2π R− 2π R+
1 1 1 n 1
= 1 + 1 =
2π −ix + n ix + n π 1 + (nx)2
On remarque que R kn dλ = 1, supn∈N R |kn |dλ < +∞ et pour tout F ⊂ R∗ fermé, lim F kn dλ = 0. Ainsi, kn est
R R R
n→+∞
un noyau de sommabilité. Ainsi kn ∗ f → f lorsque n tend vers +∞ dans Lp . Or :
Z Z
1
(kn ∗ f )(x) = √ an (u)e−u(x−y) λ(du) f (y)λdy
R 2π R
et (u, y) 7→ ei(y−u)x an (u)f (y) ∈ L1 (R2 ), ce qui nous permet d’utiliser le théorème de Fubini :
Z Z
−iux 1 iuy
(kn ∗ f )(x) = an (u)e √ e f (y)λ(dy) λ(du)
R 2π R
Z Z
iux 1 −iuy
= an (−u)e √ e f (y)λ(dy) λ(du) = an (u)eiux (Ff )(u)λ(du)
2π R R
Puisque |an (u)eiux (Ff )(u) ≤ |(Ff )(u)| avec Ff ∈ L1 (R), le théorème de convergence dominée s’applique. Puisque
l’on a la convergence Lp du membre de gauche, on peut trouver une extractrice φ telle que la sous-suite (kφ(n) ∗ f )
converge simplement vers f . Ainsi en passant à la limite lorsque n → +∞ :
Z
(kφ(n) ∗ f )(x) = aφ(n) (u)eiux (Ff )(u)λ(du)
R
⇒ f (x) = FF(x)
Ce qui nous donne le résultat attendu.
Remarque : Si f ∈ L1 (R), on a pas forcément Ff ∈ L1 (R). Par exemple, avec f = 1[−1,1] ∈ L1 (R), le calcul fournit
q
Ff = π2 sinc 6∈ L1 (R).
Définition
On appelle espace de Schwartz l’ensemble des fonctions φ ∈ C ∞ (R) à décroissance rapide, c’est-à-dire
vérifiant
∀(p, q) ∈ N2 , ∃M > 0, ∀x ∈ R, (1 + x2 )p |φ(q) (x)| ≤ M
On le note S(R).
Proposition
57
2
Exemple : La fonction φ définie par φ(x) = e−x est dans l’espace de Schwartz.
Définition
+∞
On dit que φ ∈ C ∞ (R) est dans CC (R) = C0+∞ (R) = D(R) si elle est à support compact, i.e. {x ∈ R, φ(x) 6= 0}
compact.
Proposition
Démonstration : La première inclusion se déduit du fait qu’une fonction continue sur un compact est bornée. La
M p
seconde se déduit du fait que pour tout p ∈ [1, +∞[, x 7→ ( 1+x2) est intégrable.
Définition
Soit φ ∈ S(R). Pour α et β dans N, on note |φ|α,β = ||x(a) φ(b) ||∞ et on considère la topologie initiale associée
aux fonctions φ 7→ |φ|α,β , c’est-à-dire la topologie la plus fine rendant ces fonctions continues. On l’appelle la
topologie de S(R).
Proposition
Théorème
Démonstration : Soit φ ∈ S(R) ⊂ L1 (R). On a aussi x 7→ xφ(x) ∈ S(R) ⊂ L1 (R). Donc Fφ ∈ C 1 (R) et (Fφ)0 =
F(x 7→ −ixφ(x). Par récurrence, on vérifie que ∀β ∈ N∗ , (Fφ)(β) = (−1)β F(x 7→ xβ φ(x)). Par ailleurs, φ ∈ S(R)
donc φ0 ∈ L1 (R). Ainsi, F(φ0 ) = y 7→ iy(Fφ)(y). Par récurrence, ∀α ∈ N∗ , F(φ(a) ) = y 7→ (iy)α (Fφ)(y). On a alors :
58
(x, y) 7→ Fφ(y)ψ(x) ∈ L1 (R) donc Fubini s’applique.
Z Z
1
hφ, ψiL2 (R) = (Fφ)(y) ψ(x)e−ixy λ(dx)λ(dy)
R 2π R
Z
= Fφ(y)(Fψ)(y)λ(dy) = hFφ, FψiL2 (R)
R
Définition
On définit F de L2 (R) dans L2 (R) par densité. Si f ∈ L2 (R), on peut construire une suite fn d’éléments de
S(R) qui converge vers f . F étant une isométrie de S(R) et par complétude de L2 (R), Ffn admet une limite
dans L2 (R), qu’on note Ff . Si f ∈ L1 (R) ∩ L2 (R), F coı̈ncide bien avec la définition donnée sur L1 (R).
Proposition
Proposition
Démonstration : On pose φn = f 1[−n,n] ∈ L1 (R) ∩ L2 (R). Soit y ∈ R+ . lim h1[0,y] , Fφn i = h1[0,y] , Ff i. En
n→+∞
−ixt 1
appliquant Fubini à (x, t) 7→ f (x)e ∈ L ([−n, n] × [0, y] :
Z Z Z
1 −ixt
lim √ f (x)e λ(dx)λ(dt) = Ff (x)λ(dx)
n→+∞ [0,y] 2π [−n,n] [0,y]
Z Z Z
1 −ixt
⇒√ lim f (x)e λ(dt)λ(dx) = Ff (x)λ(dx)
2π n→+∞ [−n,n] [0,y] [0,y]
−ixy
1−e
Z Z
1
⇒√ lim f (x) λ(dx) = Ff (x)λ(dx)
2π n→+∞ [−n,n] ix [0,y]
1−e−ixy −ixy
Comme f ∈ L2 (R) et x 7→ ix ∈ L2 (R), on a y 7→ f (x) 1−eix ∈ L2 (R) et on peut alors appliquer le théorème de
convergence dominée :
1 − e−ixy
Z Z
f (x) λ(dx) = Ff (x)λ(dx)
R ix [0,y]
Théorème (Plancherel)
Démonstration : C’est une conséquence directe du fait que F est un automorphisme isométrique dans S(R). (cf.
formule de Plancherel)
59
Proposition
F(f 0 ) = (y 7→ iy)Ff
Définition
Soit X une variable aléatoire et PX sa loi.
PˆX s’appelle la fonction caractéristique de X, et se note ΦX :
Z
ΦX (t) = eiht,xi PX (dx) = E(eiht,Xi )
Rd
Proposition
Proposition
Soit X une variable aléatoire dont la loi a une densité fX par rapport à la mesure de Lebesgue. Alors :
• lim ΦX (t) = lim ΦX (t) = 0.
t→−∞
Rt→+∞
• fX (x) = (2π)
1
d Rd
e−iht,xi ΦX (t)λ(d) (dt)
Proposition
60
Démonstration : Deux mesures ayant la même transformée de Fourier sont égales.
Théorème
Les variables aléatoires réelles X1 , ..., Xn sont indépendantes ssi :
n
Y
∀(t1 , ..., tn ) ∈ RN , Φ(X1 ,...,Xn ) (t1 , ..., tn ) = ΦXk (tk )
k=1
Le résultat équivaut donc à P(X1 ,...,Xn ) = PX1 ⊗ ... ⊗ PXk , c’est-à-dire à l’indépendance des variables aléatoires.
Proposition
Démonstration : On sait que PX1 +...+Xn = PX1 ∗ ... ∗ PXn . On a alors PX\
1 +...+Xn
= Pd
X1 ...PXN , d’où le résultat.
d
Proposition
Proposition
61
Chapitre X. Vecteurs Gaussiens
Section X.1 - Définition d’un vecteur gaussien
Définition
Soit (Ω, A, P) un espace probabilisé, et X1 , ..., Xd des variables aléatoires sur (R, B(R)).
On dit que le vecteur X = (X1 , ..., Xd ) est gaussien si ∀(a1 , ..., ad ) ∈ Rd , a1 X1 +...+ad Xd suit une loi normale.
Exemples : Soit X1 ∼ N (m1 , σ12 ) et X2 ∼ N (m2 , σ22 deux variables aléatoires indépendantes. Alors X = (X1 , X2 )
est un vecteur aléatoire gaussien. En effet, ∀(a1 , a2 ) ∈ R2 , a1 X1 + a2 X2 ∼ N (a1 m1 + a2 m2 , a21 σ12 + a22 σ22 ). (pour le
montrer, utiliser le fait que la fonction caractéristique d’une somme de deux variables aléatoires indépendantes est le
produit des fonctions caractéristiques de chaque variable)
X1 ∼ N (m1 , σ12 ), suivant la loi de Bernoulli 21 δ−1 + 12 δ1 indépendante de X1 et X2 = X1 . On a ΦX2 (t) =
RSoit itux
R2
e (PX1 ⊗ P )(dx, du) par indépendance des variables aléatoires, ce qui ce simplifie par application du théorème
1 2 1 2
de Fubini en ΦX2 (t) = R cos(tx) √12π e− 2 x λ(dx) = e− 2 t . Ainsi X2 ∼ N (0, 1). Or, X1 + X2 = (1 + )X1 donc
R
P(X1 + X2 = 0) = 21 : X1 + X2 ne peut pas suivre de loi normale, et donc (X1 , X2 ) n’est pas gaussien puisque l’on a
trouvé une combinaison linéaire de X1 et X2 qui ne suit pas une loi normale.
On retiendra que si X = (X1 , ..., Xn ) est gaussien, alors les Xi suivent une loi normale, mais que la réciproque est fausse.
Proposition
où m = (mj )1≤j≤d est le vecteur d’espérance de X et D = (Dj,k )1≤j,k≤d est la matrice de covariances de X.
Démonstration : Soit t = (t1 , ..., td ) ∈ Rd et Y = ht, Xi = t1 X1 + ... + td Xd . X étant gaussien, Y suit une loi
Pd P
normale. E(Y ) = k=1 tk mk = ht, mi et Var(Y ) = Cov(Y, Y ) = 1≤k,j≤d tj Dj,k tk = ht, Dti. On en déduit que
ΦY (u) = exp(iht, miu − 21 ht, Dtiu2 ). Or ΦX (t) = E(exp(iht, Xi)) = E(exp(iY )) = ΦY (1), d’où le résultat.
Proposition
La loi d’un vecteur gaussien est entièrement caractérisée par son vecteur d’espérance m ∈ Rd et sa matrice de
covariances D ∈ Md (R).
On notera alors N (m, D) cette loi.
Théorème
Soit X = (X1 , ..., Xd ) un vecteur gaussien. Les Xi sont indépendants si et seulement si la matrice D de
covariance de X est diagonale.
Démonstration : Pour le sens direct, cela vient simplement du fait que l’indépendance
Qd entraı̂ne la non-corrélation.
Pour le sens indirect, si D est diagonale alors on a l’égalité ΦX (t1 , ..., td ) = k=1 ΦXk (tk ).
Proposition
Soit m ∈ Rd et D ∈ Md (R) symétrique et positive. Alors, il existe un vecteur gaussien à valeurs dans Rd
d’espérance m et de matrice de covariance D.
62
Démonstration : D étant symétrique et positive, elle admet une décomposition de Cholesky : D = C t C. Soit d variables
aléatoires Yi ∼ N (0, 1) indépendantes. Le vecteur Y = (Y1 , ..., Yd )P
est gaussien, tout comme XP = CY + m. Alors,
E(X) = E(CY ) + m = m, et Cov(Xi , Xj ) = E((CY )i (CY )j ) = 1≤k,l≤d Cik Cjl E(Yk Yl ) = 1≤k,l≤d Cik Cjl δkl =
Pd
k=1 Cik Cjk = (D)ij . On a donc construit le vecteur gaussien recherché.
Proposition
63
Chapitre XI. Convergence de variables aléatoires
Section XI.1 - Les différents modes de convergence d’une v.a.
Définition
P
On note alors Xn → X.
Définition
La suite de v.a. (Xn )n∈N converge presque sûrement vers la v.a. X ssi :
p.s.
On note alors Xn → X.
Soit (Xn )n∈N une suite de variables aléatoires convergeant presque sûrement vers X.
Alors, (Xn )n∈N converge en probabilité vers X.
Démonstration : Soit (Xn )n∈N une suite de variables aléatoires convergeant presque sûrement vers X. Alors, Ω∗ = {ω ∈
Ω; lim Xn (ω) = X(ω)} a pour mesure 1. Pour > 0, on pose Ω = {ω ∈ Ω; ∃N ∈ N, ∀n ≥ N, |Xn (ω) − X(ω)| < }.
n→+∞
On remarque que Ω = ∪N ∈N∗ ∩n≥N {ω ∈ Ω, |Xn (ω)−X(ω)| < } est une union d’intersections d’ensembles mesurables,
donc est mesurable, et que Ω∗ ⊂ Ω . Ainsi, P(Ω ) = 1. Posons AN = ∩n≥N {ω ∈ Ω, |Xn (ω) − X(ω)| < }. Alors,
(AN )N ∈N∗ est croissante et ∪N ∈N∗ AN = Ω . Donc, lim P(AN ) = 1. Dit autrement, ∀δ > 0, ∃N ∈ N∗ , P(An ) > 1−δ,
N →+∞
avec pour n ≥ N, AN ⊂ {ω ∈ Ω; |Xn (ω)−X(ω)| < }. Donc P(|Xn −X| < ) > 1−δ. Ainsi, lim P(|Xn −X| < ) = 1,
n→+∞
p.s.
d’où lim P(|Xn − X| > ) = 0 et donc Xn → X.
n→+∞
Proposition
Soit (Xn )n∈N une suite de variables aléatoires convergeant en probabilité vers X.
Alors, on peut extraire une sous-suite (Xφ(n) )n∈N qui converge presque sûrement vers X.
64
1
alors on a ∀n ∈ N, E(Xn ) = 2 mais E(X) = 0, donc lim E(Xn ) 6= E(X).
n→+∞
Définition
Soit p ≥ 1. La suite de variables aléatoires (Xn )n∈N converge dans Lp vers la v.a. X ssi toutes les variables
aléatoires Xn et X sont dans Lp et :
lim E(|Xn − X|p ) = 0
n→+∞
p
L
On note alors Xn → X.
Exemple : Soit p ∈ [1, +∞[. On reprend la définition de (Xn )n∈N du premier exemple :
0 si ω < 0
Xn = ω 7→ 1 − nω si ω ∈ [0, n1 ]
0 si ω > n1
et X = ω 7→ 0. Alors :
1 n1
1 −1
Z
p
n
p 1
E(|Xn − X| ) = (1 − nω) dω = (1 − nω)p+1 = → 0
0 p+1 n 0 n(p + 1) n→+∞
Proposition
Soit (Xn )n∈N une suite de variables aléatoires convergeant dans Lp vers X.
Alors, (Xn )n∈N converge en probabilité vers X.
1
Démonstration : Cela résulte de l’inégalité de Markov : P(|Xn − X| > ) < p E(|Xn − X|p ) → 0.
n→+∞
Théorème
P
Soit p ∈ [1, +∞[ et (Xn )n∈N une suite de variables aléatoires vérifiant Xn → X et ∃Y ∈ Lp , ∀n ∈ N, |Xn | ≤ Y .
p
L
Alors, X ∈ Lp et Xn → X.
Proposition
Les limites ainsi définies par les convergences en probabilité, presque sûre et dans Lp vérifient l’unicité de la
limite, la linéarité et le passage à la limite dans les inégalités.
De plus, pour toute fonction f continue, on a Xn → X ⇒ f (Xn ) → f (X).
Soit (Xn )n∈N∗ une suite de variables aléatoires de L2 (Ω, F, P) indépendantes et identiquement distribuées.
PN P
On note m = E(Xn ) et MN = N1 n=1 Xn . Alors, MN → m, c’est-à-dire ∀ > 0, lim P(|MN − m| > ) = 0.
N →+∞
PN
Démonstration : On note m = E(Xn ) et σ 2 = Var(Xn ). Alors, E(MN ) = N1 n=1 E(Xn ) = Nm
m = m et Var(MN ) =
N σ2 σ2
1
PN
N2 n=1 Var(Xn ) = N 2 = N . Pour tout > 0, on applique l’inégalité de Chebyshev :
σ2
P(|Mn − m| > ) ≤ → 0
N 2 N →+∞
P
d’où MN → m.
65
Théorème (Loi forte des grands nombres)
Soit (Xn )n∈N∗ une suite de variables aléatoires de L2 (Ω, F, P) indépendantes et identiquement distribuées.
PN p.s. Lp
On note m = E(Xn ) et MN = N1 n=1 Xn . Alors, MN → m et MN → m.
Remarque : Cela nous permet d’effectuer des approximations numériques, par exemple la méthode de Monte Carlo.
On prend Xn ∼ U([0, 1]) une suite de variables aléatoires indépendantes, et alors on a :
N Z
1 X
lim f (Xn ) = E(f (Xn )) = f (x)λ(dx)
N →+∞ N [0,1]
n=1
Définition
Soit (Xn )n∈N une suite de variables aléatoires réelles, (FXn )n∈N leurs fonctions de répartition respectives, et
soit X une variable aléatoire de fonction de répartition FX .
On dit que la suite des variables aléatoires (Xn )n∈N converge en loi vers la variable aléatoire X ssi (FXn )n∈N
L
converge simplement vers FX , sauf éventuellement aux points de discontinuité de FX . On note Xn → X.
L
Alors, (FXn )n∈N converge simplement vers FX = 1[0,+∞[ . Ainsi Xn → 0.
Définition
Soit (µn )n∈N une suite de mesures de probabilité sur E. On dit que (µn )n∈N converge faiblement (ou
étroitement) vers µ ssi Z Z
∀f ∈ Cb (E), lim f dµn = f dµ
n→+∞ E E
Proposition
Lorsque E = R, la suite de variables (Xn )n∈N converge en loi vers X ssi la suite des lois de Xn converge vers
la loi de X.
Définition
Lorsque E 6= R, on dit que la suite de variables (Xn )n∈N converge en loi vers X ssi la suite des lois de Xn
L
converge vers la loi de X. On note Xn → X.
66
Théorème (Portmanteau pour les mesures)
Soit (µn )n∈N une suite de mesures de probabilité sur E. Toutes les propositions suivantes sont équivalentes :
• (µn )n∈N converge faiblement vers µ.
• Pour toute fonction f de E uniformément continue et bornée, lim E f dµn = E f dµ.
R R
n→+∞
• Pour toute fonction f de E continue et à support compact, lim E f dµn = E f dµ.
R R
n→+∞
• Pour tout A ⊂ E fermé, lim sup µn (A) ≤ µ(A).
n→+∞
• Pour tout A ⊂ E ouvert, lim inf µn (A) ≥ µ(A).
n→+∞
• Pour tout A ∈ B(E) tel que µ(∂A) = 0, lim µn (A) = µ(A).
n→+∞
Soit (Xn )n∈N une suite de variables aléatoires sur E. Toutes les propositions suivantes sont équivalentes :
L
• Xn → X.
• Pour toute fonction f de E uniformément continue et bornée, lim E(f (Xn )) = E(f (X)).
n→+∞
• Pour toute fonction f de E continue et à support compact, lim E(f (Xn )) = E(f (X)).
n→+∞
• Pour tout A ⊂ E fermé, lim sup P(Xn ∈ A) ≤ P(X ∈ A).
n→+∞
• Pour tout A ⊂ E ouvert, lim inf P(Xn ∈ A) ≥ P(X ∈ A).
n→+∞
• Pour tout A ∈ B(E) tel que P(X ∈ ∂A) = 0, lim P(Xn ∈ A) = P(X ∈ A).
n→+∞
Proposition
Soit (Xn )n∈N une suite de variables aléatoires à valeurs dans un ensemble discret. Alors :
L
Xn → X ⇔ ∀k ∈ E, lim P(Xn = k) = P(X = k)
n→+∞
Proposition
Soit (Xn )n∈N une suite de variables aléatoires de fonction caractéristiques respectives Φn = ΦXn et X une
variable aléatoire de fonction caractéristique Φ = ΦX . Alors :
L
Xn → X ⇔ Φn → Φ simplement
Proposition
Soit (Xn )n∈N une suite de variables aléatoires convergeant en probabilité vers X.
Alors, (Xn )n∈N converge en loi vers X.
P P
Démonstration : Supposons que Xn → X. Soit f une fonction continue et bornée. Alors, f (Xn ) → f (X) et puisque
1
L
f est bornée, |f (Xn )| ≤ C ∈ L1 donc f (Xn ) → f (X). Dit autrement, lim E(f (Xn )) = E(f (X)), ce qui donne la
n→+∞
convergence en loi par le théorème Portmanteau.
Proposition
Soit (Xn )n∈N une suite de variables aléatoires définies sur (Ω, F, P) à valeurs dans E = Rd . On suppose que
L P
Xn → X et X = c presque sûrement, où c ∈ E est une constante. Alors, Xn → X.
67
Section XI.4 - Théorème Central Limite (TCL)
Soit (Xn )n∈N une suite de variables aléatoires de L2 (Ω, F, P) indépendantes et identiquement distribuées. On
PN
note SN = n=1 Xn , m = E(Xn ) et σ 2 = Var(Xn ). On suppose que σ 6= 0. Alors :
SN − N m L
√ −→ Y
σ N N →+∞
Les Xn sont dans L2 , donc ΦX ∈ C 2 . On a alors ΦX (0) = 1, Φ0X (t) = iE(XeitX ) donc Φ0X (0) = im = 0 et
Φ00X (t) = −E(X 2 eitX ) donc Φ00X (0) = −σ = −1. On en déduit que :
t2
2
t t
ΦX (t) = 1 − t2 + o(t2 ) ⇒ ΦX √ =1− +o √
0 N 0 2N N
t2
2
t2
t t t
⇒ ln ΦX √ =− +o √ ⇒ N ln ΦX √ = − + o(t2 )
N 0 2N N N 0 2
On obtient ainsi un équivalent à t fixé lorsque N → +∞. On en déduit que
N
t2
t
∀t ∈ R, ΦYN (t) = ΦX √ −→ exp
N N →+∞ 2
L
On a établi que (ΦYN )N ∈N converge simplement vers la fonction caractéristique de Y ∼ N (0, 1), d’où YN → Y .
68
Chapitre XII. Introduction aux processus stochastiques
Section XII.1 - Espérance conditionnelle
Proposition
Soit (Ω, F, P) un espace probabilisé et X : Ω → R une variable aléatoire. Soit G ⊂ F une sous-tribu.
Alors, il existe une unique variable aléatoire Y ∈ L2 (Ω, G, P) vérifiant ∀U ∈ L2 (Ω, G, P), E(XU ) = E(Y U ).
A = L2 (Ω, G, P) est un sous-espace vectoriel fermé de H, on peut donc définir la projection orthogonale sur A.
Ainsi, il existe un unique Y ∈ A tel que ∀U ∈ A, hX − Y, U i = 0 ⇒ ∀U ∈ A, E(XU ) = E(Y U ).
Définition
La variable aléatoire Y définie précédemment est appelée espérance conditionnelle de X sachant G.
Elle est notée E(X|G).
Proposition
Définition
Soit (Ω, F, P) un espace probabilisé et X : Ω → R une variable aléatoire. Soit G ⊂ F une sous-tribu.
La variable aléatoire Y ∈ L1 (Ω, G, P) vérifiant pour toute variable aléatoire U G-mesurable et bornée, E(XU ) =
E(Y U ) est appelée espérance conditionnelle de X sachant G. Elle est notée E(X|G).
R R
Remarque : Cela équivaut à vérifier ∀A ∈ G, A
XdP = A
Y dP.
Proposition
Proposition
Soit X et Y des variables aléatoires réelles sur (Ω, F, P), et G ⊂ F une sous-tribu. On suppose que X est
G-mesurable. Si X, Y et XY sont intégrables (ou positives), alors E(XY |G) = XE(Y |G).
Soit (Ω, F, P) un espace probabilisé, G ⊂ F une sous-tribu et φ : R → R convexe. Si X et φ(X) sont intégrables,
alors φ(E(X|G)) ≤ E(φ(X)|G)
69
On pose G = σ({[ 2i , i+12 ], i ∈ Z}). On remarque R X n’est pas G-mesurable. On cherche à déterminer E(X|G), qui
que
doit être L1 (Ω, G, P) et vérifier ∀A ∈ G, A XdP = A E(X|G)dP). Puisque E(X|G) doit être G-mesurable, elle doit être
R
Théorème
Soit (Ω, F, P) un espace probabilisé et X : Ω → R une variable aléatoire intégrable (ou positive). Alors :
Proposition
Soit X : (Ω, F, P) → (E, E) une variable aléatoire et B ∈ F tel que P(B) > 0 et P(Ω\B) > 0. Alors, E(X|σ(B))
est la variable aléatoire
E(X1B ) E(X1Ω\B )
1B + 1Ω\B
P(B) 1 − P(B)
Démonstration : σ(B) = {∅, B, Ω\B, Ω}. Soit ω1 ∈ B et x1 = E(X|G)(ω1 ). Puisque E(X|G) est mesurable, alors
E(X|G)−1 (x1 ) ∈ σ(B) soit, puisque cet ensemble est non vide, différent de Ω (la mesure de Ω\B est non nulle) et
contient ω1 ∈ B, E(X|G)−1 (x1 ) = B. De même, si ω2 ∈ Ω\B et x2 = E(X|G)(ω2 ), alors E(X|G)−1 (x2 ) = Ω\B. Donc,
B)
E(X|G) = x1 1B + x2 1Ω\B . Or, E(X1B ) = E((x1 1B + x2 1Ω\B )1B ) = x1 E(1B ) = x1 P(B) soit x1 = E(X1
P(B) et de même,
E(X1Ω\B )
x2 = P(Ω\B) , ce qui donne le résultat attendu.
Définition
E(X1B )
E(X|B) =
P(B)
Définition
Théorème
Proposition
Soit (Ω, F, P) un espace probabilisé et (X, Y ) : Ω R→ R2 un vecteur aléatoire admettant une densité f(X,Y ) . On
suppose que X ∈ L1 (Ω, F, P) et ∀y ∈ R, fY (y) = R f(X,Y ) (x, y)λ(dx) > 0. On pose :
Z
fX,Y (x, y)
fX|Y =y (x) = et h(y) = xfX|Y =y (x)λ(dx)
fY (y) R
70
Proposition
Soit (Ω, F, P) un espace probabilisé et (Xn )n∈N une suite de variables aléatoires. Alors :
p.s. p.s.
Xn −→ X et ∀n ∈ N, Xn ≥ 0 ⇒ E(Xn |G) −→ E(X|G) (convergence monotone)
p.s.
Xn −→ X ⇒ E(lim inf Xn |G) ≤ lim inf E(X|G) p.s. (lemme de Fatou)
p.s. p.s.
Xn −→ X et ∃Z ∈ L1 (Ω, F, P), ∀n ∈ N, |Xn | ≤ Z ⇒ E(Xn |G) −→ E(X|G) (convergence dominée)
Définition
Définition
Soit (Ω, F, P) un espace probabilisé et (E, E) un espace mesuré. On appelle processus stochastique (ou
processus aléatoire) toute collection de variables aléatoires (Xt )t∈T sur (Ω, F, P) à valeurs dans E.
On le note X = {Xt , t ∈ T }. Lorsque T = N, le processus est dit discret.
Définition
Un processus stochastique discret (Sn )n∈N est appelé marche aléatoire à un paramètre si ses accroissements
Xn = Sn − Sn−1 pour n ≥ 1 sont indépendants et identiquement distribués.
Définition
Soit (Ω, F, P) un espace probabilisé. On appelle filtration toute suite croissante (Fn )n∈N de sous-tribus de F.
Définition
On dit qu’un processus stochastique discret X = {Xn , n ∈ N} est adapté à la filtration F si pour tout
n ∈ N, Xn est Fn -mesurable.
Exemple : Soit X = {Xn , n ∈ N}. La filtration (Fn )n∈N définie par Fn = σ(Xk , k ∈ [[1, n]]) est adaptée au processus
X. On l’appelle filtration naturelle de X.
Définition
Un processus discret X est appelé une martingale par rapport à la filtration (Fn )n∈N ssi le processus est
adapté à la filtration, pour tout n ∈ N, Xn ∈ L1 (Ω, F, P) et pour tout n ∈ N, Xn = E(Xn+1 |Fn ) p.s. (∗)
En remplaçant (∗) par Xn ≤ E(Xn+1 |Fn ) p.s., on l’appelle une sous-martingale.
En remplaçant (∗) par Xn ≥ E(Xn+1 |Fn ) p.s., on l’appelle une sur-martingale.
Proposition
71
Définition
Un processus X adapté à une filtration (Fn )n∈N est prévisible si ∀n ∈ N, Xn est Fn+1 -mesurable.
Proposition
Soit S une martingale et C un processus prévisible et borné. Alors, le processus stochastique ((C · S)n )n∈N
défini par :
(C · S)0 = 0 Pn
∀n ∈ N∗ , (C · S)n = k=1 Ck (Sn − Sn−1 )
est une martingale.
Définition
On appelle C · S la transformée de la martingale S par le processus C.
72