Académique Documents
Professionnel Documents
Culture Documents
Pour information
Notations
Pour des variables aléatoires (v.a.) discrètes X et Y à valeurs dans X et Y resp., on
utilisera les notations suivantes pour x ∈ X et y ∈ Y :
p(x) = P(X = x)
p(y) = P(Y = y)
p(x, y) = P(X = x, Y = y)
p(x|y) = P(X = x|Y = y) = p(x, y)/p(y).
Lorsque ces notations sont ambigues, on pourra écrire pX (x), pY (y), pX,Y (x, y), pX|Y (x|y).
Définition 1.1.1 Soit U une variable aléatoire à valeurs dans un ensemble fini U, de distribution
de probabilité :
p(u) = P(U = u), u ∈ U .
Son entropie est, par définition, la quantité
X
H(U) = −E log(p(U)) = − p(u) log p(u) ,
u∈U
1-1
Cours 1 — 8 février 2011 2010/2011
n(k, ǫ) X
lim = H(U) = − p(u) log p(u).
k→∞ k u∈U
Montrons tout d’abord que limk→∞ P(B(k, δ) = 1 pour tout δ > 0. Soit la v.a. réelle
Yi = − log p(Ui ),
qui est bien définie avec probabilité 1 même s’il existe u ∈ U avec p(u) = 0. Les Yi sont
i.i.d. de moyenne H(U). Par la loi faible des grands nombres, on a
k
1 X
lim P Yi − H(U) ≤ δ = 1 pour tout δ > 0.
k→∞ k i=1
1-2
Cours 1 — 8 février 2011 2010/2011
P
Comme U(k) ∈ B(k, δ) ssi 1k ki=1 Yi − H(U) ≤ δ, on a bien
La définition de B(k, δ) implique que |B(k, δ)| ≤ 2k(H(U)+δ) . Par (1.2), on a donc pour tout
δ>0
1 1
lim sup log s(k, ǫ) ≤ lim sup log |B(k, δ)| ≤ H(U) + δ. (1.3)
k→∞ k k→∞ k
Dans l’autre sens, pour tout A ⊂ U k avec P(A) ≥ 1−ǫ, (1.2) implique pour k suffisament
grand,
1−ǫ
P(A ∩ B(k, δ)) ≥ .
2
On a donc par définition de B(k, δ),
X 1 − ǫ k(H(U)−δ)
|A| ≥ |A ∩ B(k, δ)| ≥ p(u(k) )2k(H(U)−δ) ≥ 2 ,
2
u(k) ∈A∩B(k,δ)
1
lim inf log s(k, ǫ) ≥ H(U) − δ.
k→∞ k
Ceci, avec (1.3), implique (1.1).
Corollaire 1.1.1
1-3
Cours 1 — 8 février 2011 2010/2011
Théorème 1.1.2 Si les Ui sont indépendants de loi pi et maxi∈[k],u∈U | log Mi (u)| ≤ c alors pour
tout ǫ ∈ (0, 1),
1
lim log s(k, ǫ) − Ek = 0,
k→∞ k
avec
k
1 XX Mi (u)
Ek := pi (u) log .
k i=1 pi (u)
u∈U
M (U )
h Pk i
1
Démonstration. Soit Yi = log pii(Uii) . Les Yi sont indépendants tels que E k i=1 Yi = Ek
donc l’inégalité de Chebyshev donne pour tout δ > 0
k k
1 X 1 X 1
P
Yi − Ek ≥ δ ≤ 2 2
Var (Yi ) ≤ 2 max Var (Yi )
k i=1 k δ i=1 kδ i
≤ 2k(Ek +δ) .
≥ (1 − ǫ − ηk )2k(Ek −δ) .
1-4
Cours 1 — 8 février 2011 2010/2011
On a donc
XX p(u, v) X
H(V|U) = − p(u, v) log = p(u)H(V|U = u),
p(u)
u∈U v∈V u∈U
P
avec H(V|U = u) = − v∈V p(v|u) log p(v|u).
Lemme 1.1.1 On a
H(V|U) ≤ H(V)
1-5
Cours 1 — 8 février 2011 2010/2011
Démonstration.
1-6