Académique Documents
Professionnel Documents
Culture Documents
1
Définition 1.2. On dit que T préserve la mesure µ si µT = µ. On dit aussi dans ce
cas que µ est T -invariante. Cela se traduit par :
∀A ∈ A µ(T −1 A) = µ(A) (1.1)
On dit alors que (X, A , µ, T ) est un système préservant la mesure (abrégé MPT, Me-
sure Preserving Transformation). Si µ(X) = 1 on dit qu’il s’agit d’un système préservant
la probabilité (abrégé PPT, Probability Preserving Transformation)
Dans un MPT, on a 4
Z Z
1
∀f ∈ L (A , µ), f ◦ T dµ = f dµ.
X X
Preuve : Exercice.
Définition 1.3. Convergence des mesures : on note M (X) l’espace des mesures de masse
finie. La suite (µn )n∈N converge étroitement vers µ ∈ M (X) si
∀f ∈ Cb (X), µn (f ) −−−−→ µ(f ).
n→+∞
Lorsque X n’est pas compact, on dit que la suite converge vaguement si la convergence
ci-dessus est restreinte aux fonctions de C0 (X) 8
4. savoir pourquoi
5. un sous-ensemble de A stable par intersection
6. fonctions réelles de X continues et bornées
7. s’étend aux mesures σ-finies, en se restreignant aux fonctions à support compact.
8. fonctions nulles à l’infini : pour tout ε > 0, il existe K compact tel que kf 1K c k∞ < ε.
2
Proposition 1.2. Compacité de la boule unité de M (X) : l’ensemble des mesures de
masse inférieure à 1,M1 (X), est compact pour la topologie vague. En particulier, toute
suite de probabilités admet un point d’accumulation dans M (X). 9
Remarque 1.1. On peut aussi interpréter ce système comme une translation de 1 sur
X = Z/dZ.
3
Remarque 1.2. Plus généralement si X = G est une groupe topologique localement
compact et Tg (x) = gx alors µ est la mesure de Haar à gauche de G, et l’action par
translation est donc un MPT.
Si A = [ω0 ∈ E0 , . . . ωk ∈ Ek ] on a alors :
Y
S −1 A = {x : Sx ∈ A} = [ω1 ∈ E0 , . . . ωk+1 ∈ Ek ] = Ω × E0 · · · × Ek × Ω
i>k+1
Propriété 1.3. Soit (Ω, B) est un espace mesurable et (X, A , S) le décalage associé.
Alors une mesure µ sur X est S-invariante si elle vérifie pour tout A cylindre de X,
µ(A) = µ(S −1 A) . 11
10. c’est le théorème d’extension de Carathéodory
11. On pourrait faire mieux : supposons qu’il existe une suite de mesures (µn )n compatibles sur les
cylindres (c’est à dire que si n < m alors les marginales de µm sur les cylindres de taille inférieure à n
coïncident avec µn ) qui vérifie pour tout n ∈ N∗ et pour tout cylindre A de taille inférieure à n − 1,
µn (S −1 A) = µn (A). Dans ce cas, il existe une mesure µ sur X qui est S-invariante et dont les marginales
sur les cylindres de taille inférieure à n coïncident avec µn .
4
Preuve : Savoir pourquoi
Preuve : Exercice
Définition 1.6. Lorsque Ω est fini, le système (ΩN , B N , ρ⊗N , S) est appelé décalage de
Bernoulli, ou shift de Bernoulli de loi ρ.
Remarque 1.3. De manière générale, si (Xn )n∈N est une suite de variables aléatoires à
valeurs dans (Ω, B, ρ), alors on peut lui associer un PPT selon les règles précédentes, en
choisissant pour ρ la loi commune de Xn .
Remarquez que dans ce cas, des mesures invariantes, il y en a plein ! On va voir dans le
paragraphe suivant comment construire d’autres mesures invariantes.
Définition 1.7. Une chaîne de Markov est définie par une loi initiale ν et une matrice
(ou noyau) de transition p : Ω2 → [0, 1] vérifiant :
P
. Pour tout n ∈ N, pour tout i ∈ Ω, j∈Ω p(i, j) = 1.
. ν ∈ [0, 1]Ω est une probabilité sur Ω : i∈Ω ν(i) = 1.
P
Remarque 1.4. De manière équivalente, on aurait pu dire que Pν était l’unique proba-
bilité sur ΩN vérifiant
. Pν ([ω0 ]) = ν(ω0 ) : autrement dit la loi initiale est ν.
5
. Pour tout (i, j) ∈ Ω, p(i, j) = Pν (ωn+1 = j|ωn = i) : c’est la probabilité de transition
de l’état i à l’état j.
Pν (S −1 [b]) = Pν (ω1 = b0 , . . . ωM +1 = bM )
X
= Pν (ω0 = k, ω1 = b0 , · · · ωM +1 = bM )
k∈Ω
X
= ν(k)p(k, b0 )p(b0 , b1 ) · · · p(bM +1 , bM )
k∈Ω
= ν(b0 )p(b0 , b1 ) · · · p(bM +1 , bM )
= Pν ([ω0 = b0 , . . . ωM = bM ] = Pν ([b])
Exemple 1.2.
. Si Ω = {0, 1} alors
p(1, 0) p(0, 1)
ν(0) = ν(1) =
p(1, 0) + p(0, 1) p(1, 0) + p(0, 1)
12. Cette égalité est vue comme une égalité matricielle : autrement dit, ν est un vecteur invariant à
gauche pour la matrice p.
6
Proposition 1.6. 13 Soit Ω = {1, · · · , d} où d ∈ N. On considère une matrice stochas-
tique P ∈ M (d × d).
nl −1
n−1
!
1X n 1 X
Alors la suite P est bornée et tout point d’accumulation Q = lim P nl
n k=0 l→+∞ nl k=0
n≥0
est une matrice stochastique telle que P Q = QP = Q.
En particulier chaque ligne de Q définit une probabilité stationnaire pour P .
Preuve :
13. La preuve de cette propriété est non exigible dans mon cours, ceci dit, elle ne me semble pas très
difficile et elle est instructive.
7
8
9
1.4 Propriétés élémentaires sur les ensembles et les me-
sures des MPT.
L’idée de l’étude des systèmes dynamiques mesurés consiste à se détacher du point de
vue ponctuel pour ne garder que l’information statistique sur la dynamique du système.
L’intérêt des mesures invariantes est de conserver l’information au cours du temps dans
la déformer.. On perd, comme en statistique, l’information ponctuelle, mais on conserve
alors l’information globale.
Si d(A, B), on notera alors A = B mod 0 lorsqu’il n’y a pas d’ambiguïté sur µ.
Propriété 1.7. On considère A ∈ A . Alors les deux ensembles suivants sont T -invariants :
\ [
A = lim sup T −n A = T −k A = {x ∈ X, pour une infinité de n, T n x ∈ A}
n→+∞
n≥0
[ k≥n
\
−n
A = lim inf T A = T −k A = {x ∈ X, pour tout n assez grand, T n x ∈ A}
n→+∞
n≥0 k≥n
Remarque 1.6. Lorsque T est inversible, l’ensemble des éléments qui "vivent" dans A
est T -invariant : ∩n∈Z T n A.
10
Exercice 4. Soit A ∈ A un ensemble T -invariant mod 0. Montrer qu’il existe B ∈ A
T -invariant tel que µ(A∆B) = 0.
Définition 1.11. Points récurrents dans un ensemble, ensembles récurrents.
. Un point x ∈ X est un point récurrent dans A (resp. infiniment récurrent dans
A) s’il existe n ∈ N∗ (resp. une infinité de n ∈ N∗ ) tel que T n x ∈ A .
. Un ensemble A est récurrent (resp. infiniment récurrent) si µ-presque tout point de
A est récurrent (resp. infiniment récurrent) dans A.
Remarque 1.7.
. A ∩ A est la partie infiniment récurrente de A.
. A est en quelque sorte "le bassin d’attraction" de A.
Lorsqu’un point n’est pas infiniment récurrent dans A, son orbite "s’échappe" de A au
bout d’un certain temps : Notons EA l’ensemble des points de A qui ne reviennent jamais
dans A, alors x ∈ T −n EA signifie que x visite A pour la dernière fois au temps n. Par
conséquent EA est disjoint toutes ses images réciproques : on dit que c’est un ensemble
errant.
Définition 1.12. Ensembles errants et transients.
. Un ensemble E ∈ A est dit errant si µ(T −n E ∩ E) = 0 pour tout n ≥ 1.
. Un ensemble A est dit transient s’il existe un ensemble errant E ∈ A tel que
µ(A \ ∪n∈N T −n E) = 0.
Propriété 1.8. On considère A ∈ A .
[
EA = A \ T −n A est une partie errante de A.
n≥1
Preuve : Exercice
11
. On dira qu’il est transient s’il existe un ensemble errant E ∈ A tel que µ(X \
∪n∈Z T −n E) = 0.
Exercice 5. Montrer que tous les PPT sont conservatifs, puis donner un exemple de
systèmes non conservatif.
La décomposition en partie transiente et partie récurrente d’un ensemble permet d’ob-
tenir immédiatement l’un des premiers théorèmes classiques de la théorie des systèmes
dynamiques mesurés :
Pour µ − pp x ∈ A, ∀N ∈ N ∃n ≥ N, T n x ∈ A
Le théorème de récurrence dit que τA (x) < ∞ pour µ-presque tout x dans A. Il indique
plus précisément qu’on peut définir une suite de temps retours dans A pour presque tout
point de A :
Définition 1.15. La suite des temps de retours dans A est définie pour tout x ∈ X
par : τA0 := 0 et si k ∈ N, τAk+1 (x) = inf{n > τAk (x), T n x ∈ A} si l’ensemble est non vide,
et τAk+1 (x) = +∞ sinon.
On a pour tout k ≥ 0,
k
τAk+1 (x) = τAk (x) + τ (T τA (x) x).
14. habituellement, le cadre du théorème concerne les mesures finies, mais la généralisation est une
conséquence immédiate du paragraphe précédent
12
Preuve : Savoir interpréter la dernière égalité.
.
Propriété 1.10. Avec les notations précédentes, on a
x∈A ⇐⇒ la suite (τAk (x))k≥0 est strictement croissante et à valeurs finies.
x ∈ n≥1 T −n EA ⇐⇒ Il existe k > 0, τAk (x) = +∞.
S
13
. Il reste à recomposer la somme :
X X Z
µ(τA < ∞) = µ(τ = n) = µ(A ∩ (τ ≥ n)) = τ dµ.
n≥1 n≥1 A
Exercice 7. Montrer que dans un système ergodique et conservatif, alors pour tout A ∈ A
tel que µ(A) > 0, presque tout point de X est infiniment récurrent dans A.
Preuve : A faire pour la semaine prochaine, preuve rédigée.
Exercice 8. *(pour ceux qui veulent) Montrer qu’une chaîne de Markov irréductible est
ergodique.
15. Cette définition est encore valable pour les mesures σ-finies.
14
Cette propriété d’ergodicité rend compte de l’indécomposabilité du système, elle sera
fondamentale dans l’étude des systèmes dynamique mesurés. En particulier, on a vu dans
le paragraphe précédent qu’on pouvait choisir une multitude de mesures invariantes par
décalage : en fait, les mesures ergodiques occupent une place particulière dans l’ensemble
des mesures invariantes associée à une transformation donnée.
Théorème 1.14. Soit (X, A , µ, T ) un PPT. Alors l’ensemble des mesures T -invariantes
est convexe dans P(X) 16 et ses points extrémaux sont exactement les probabilités T -
ergodiques.
Corollaire 1.15. Unique ergodicité : lorsqu’il existe une unique mesure invariante,
alors elle est ergodique : on dit que le système (X, A , µ, T ) est uniquement ergodique.
Exercice 9. Déterminer dans les exemples précédents les systèmes uniquement ergo-
diques.
Propriété 1.16. Soit T une transformation mesurable sur (X, A ) et µ et ν deux proba-
bilités T -invariantes. Alors on a :
. Si ν << µ 17 et µ est T -ergodique, alors ν = µ.
16. l’ensemble des probabilités de X
17. Cela signifie que pour tout A ∈ A , µ(A) = 0 =⇒ ν(A) = 0. Dans notre cadre, on peut donc définir
une dérivée de Radon-Nikodym, f ∈ L1 (µ) qui vérifie ν = f µ
15
. Si µ et ν sont T -ergodiques, alors elles sont égales ou étrangères. 18
La question de l’existence de mesures invariantes pour un système donné est une question
clé dans l’étude des systèmes dynamiques. Elle sera abordée en seconde partie du cours,
et en cours de systèmes dynamiques.
Nous terminons ce chapitre par l’un des théorèmes star de la théorie ergodique. Il motive
en quelque sorte la terminologie de l’"ergodicité" : comme le théorème des temps de
retours, il permet de mettre en lien la fréquence moyenne des passages dans un ensemble
donné avec la mesure de cet ensemble.
18. On peut trouver A ∈ A tel que µ(A) = 0 et ν(X \ A) = 0
16
1.6 Théorème ergodique ponctuel de Birkhoff
Soit A ∈ A avec µ(A) > 0. Le théorème de récurrence nous dit que T n x revient infiniment
souvent dans A. On s’intéresse maintenant à l’estimation des fréquences des retours dans
A, ce qui revient à s’intéresser au comportement asymptotique pour n grand de
n−1
1X 1
1A (T k x) = Card{k ≤ n − 1; T k x ∈ A}.
n k=0 n
Cette question est intimement liée aux questions de répartition d’une suite dans un en-
semble donné, et permet d’interpréter certaines propriétés d’équidistribution 19 comme
des propriétés dynamiques : c’est l’objet du principe de correspondance de Furstenberg.
Ce point de vue est largement développé et a permis des avancées récentes dans le do-
maine de la théorie analytique des nombres (l’exemple des progressions arithmétiques de
longueur arbitraire dans la suite des nombres premiers en est l’un des plus importants :
ce résultat est dû à B. Green et T. Tao).
Nous commençons par présenter quelques exemples simples :
Si X = [0, 1] et α ∈
/ Q, alors pour tout intervalle I de X on a
n−1
1X 1
1I (T k x) = Card{k < n, {nα} ∈ I − x} −−−−→ Leb(I − x) = µ(I),
n k=0 n n→+∞
n−1 n−1
1X 1X µ−ps x, L1
1A (T k x) = 1A0 (ωk ) −−−−−−→ ρ(A0 ) = µ(A)
n k=0 n k=0 n→+∞
17
Exercice 10. Montrer que la convergence ci-dessus reste valable pour tous les cylindres
pour les systèmes de Bernoulli.
Preuve : Nous verrons dans un premier temps la preuve dans le cas d’une fonction
indicatrice d’un intervalle, pour la convergence presque sûre. Le schéma de preuve suit
celui proposé par M. Keane dans "Ergodic Theory, Symbolic Dynamics, and Hyperbolic
Spaces" (Oxford Science Publications).
18