Académique Documents
Professionnel Documents
Culture Documents
Mathieu Ribatet
2. Notions de base
3. Loi a priori
4. Inférence
Bayésienne
1. Introduction
Exemple 1. La famille
2
1 (x − µ) 2
f (x; θ) = √ exp − 2
: x ∈ R, θ = (µ, σ ) ∈ R × (0, ∞)
2πσ 2 2σ
(X1 , . . . , Xn ) ∼ g(·; θ∗ ).
(X1 , . . . , Xn ) ∼ g(·; θ∗ ).
En bref, θ̂ est une variable aléatoire pour laquelle bien souvent seule la loi
asymptotique est connue. . .
2. Notions de base
3. Loi a priori
4. Inférence
Bayésienne
2. Notions de base
π(x, θ) = f (x | θ)π(θ)
Définition 3. On appelle loi a posteriori la loi dont la densité est donnée par
f (x | θ)π(θ)
π(θ | x) = R .
Θ f (x | θ)π(θ)dθ
π(x, θ) = f (x | θ)π(θ)
Définition 3. On appelle loi a posteriori la loi dont la densité est donnée par
f (x | θ)π(θ)
π(θ | x) = R .
Θ f (x | θ)π(θ)dθ
f (x | θ)π(θ)
π(θ | x) = R .
Θ f (x | θ)π(θ)dθ
f (x | θ)π(θ)
π(θ | x) = R .
Θ f (x | θ)π(θ)dθ
Pr(X ∈ B | Y ∈ A) Pr(Y ∈ A)
Pr(Y ∈ A | X ∈ B) = .
Pr(X ∈ B)
Pr(X ∈ B | Y ∈ A) Pr(Y ∈ A)
Pr(Y ∈ A | X ∈ B) = .
Pr(X ∈ B)
Mais puisque l’on considère θ comme une v.a., cela nous autorise à écrire
Pr(X ∈ B | θ ∈ A) Pr(θ ∈ A)
Pr(θ ∈ A | X ∈ B) = .
Pr(X ∈ B)
Pr(X ∈ B | Y ∈ A) Pr(Y ∈ A)
Pr(Y ∈ A | X ∈ B) = .
Pr(X ∈ B)
Mais puisque l’on considère θ comme une v.a., cela nous autorise à écrire
Pr(X ∈ B | θ ∈ A) Pr(θ ∈ A)
Pr(θ ∈ A | X ∈ B) = .
Pr(X ∈ B)
f (x | θ)π(θ)
π(θ | x) = R .
Θ f (x | θ)π(θ)dθ
X= 0 X = 11 X = 17 X = 33
35
35
5
30
30
4
4
25
25
3
15 20
15 20
3
π(p x)
π(p x)
π(p x)
π(p x)
2
2
10
10
1
1
5
5
0
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
p p p p
2. Notions de base
3. Loi a priori
4. Inférence
Bayésienne
3. Loi a priori
xα−1 (1 − x)β−1
f (x) = 1{0≤x≤1} ,
B(α, β)
xα−1 (1 − x)β−1 α αβ
f (x) = , E[X] = , Var[X] = 2
.
B(α, β) α+β (α + β) (α + β + 1)
α = 0.5, β = 2 α = 1, β = 1 α = 2, β = 0.5
1.4
15
15
3
1.2
10
10
π(p x)
π(p)
π(p)
π(p)
1.0
2
5
5
0.8
1
0.6
0
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
p p p p
n = 10 n = 50 n = 5000
60
7
15
50
6
3
40
10
π(p x)
π(p x)
π(p x)
4
π(p)
30
2
20
5
2
1
10
1
0
0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
p p p p
Définition 5. Une mesure µ sur E est dite impropre si c’est une mesure
σ-finie mais non finie, i.e.,
µ(E) = ∞,
mais pour autant il existe un recouvrement au plus dénombrable {En : n ∈ I},
I ⊆ N, de E tel que
µ(En ) < ∞, ∀n ∈ I.
f (x | θ)π(θ)
π(θ | x) =
m(x)
π1 (λ) ∝ 1{λ>0} ,
et dans le 2ème
Définition 8. La loi a priori de Jeffreys est donnée par π(θ) ∝ |I(θ)|1/2 , où
|A| correspond au déterminant de A.
2. Notions de base
3. Loi a priori
4. Inférence
Bayésienne
4. Inférence Bayésienne
Nous verrons dans le cours Bayésien avancé (ou pas !) que ces choix
peuvent être justifiés via la théorie de la décision.
Prπ (θ ∈ Cx | x) ≥ 1 − α.
Prπ (θ ∈ Cx | x) ≥ 1 − α.
Prπ (θ ∈ Cx | x) = . . .?
Prπ (θ ∈ Cx | x) ≥ 1 − α.
Prπ (θ ∈ Cx | x) ≥ 1 − α.
Prπ (θ ∈ Ix | x) = 1 − α.
Prπ (θ ∈ Ix | x) = 1 − α.
2
ou alors on se restreint à θj , j ∈ {1, . . . , p} lorsque dim Θ = p.
3.0
3.0
2.5
2.5
2.5
2.0
2.0
2.0
π(p x)
π(p x)
π(p x)
1.5
1.5
1.5
1.0
1.0
1.0
0.5
0.5
0.5
0.0
0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
p p p
Figure 4: Trois différents intervalles de crédibilité (segments rouges) tous de niveau 95%.
Définition 12. Une région α–crédible Cx est une région HPD α–crédible si
elle est de la forme Cx = {θ ∈ Θ : π(θ | x) ≥ uα }.
3.0
3.0
3.0
2.5
2.5
2.5
2.0
2.0
2.0
π ( p x)
π ( p x)
π ( p x)
1.5
1.5
1.5
1.0
1.0
1.0
u0.9
0.5
0.5
0.5
u0.95
u0.99
0.0
0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
p p p
Figure 5: Illustration des régions α–crédibles HPD de niveau 90%, 95% et 99%.
Définition 12. Une région α–crédible Cx est une région HPD α–crédible si
elle est de la forme Cx = {θ ∈ Θ : π(θ | x) ≥ uα }.
3.0
3.0
3.0
2.5
2.5
2.5
2.0
2.0
2.0
π ( p x)
π ( p x)
π ( p x)
1.5
1.5
1.5
1.0
1.0
1.0
0.5
0.5
0.5
u0.9 u0.95 u0.99
0.0
0.0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
p p p
Figure 5: Illustration des régions α–crédibles HPD de niveau 90%, 95% et 99%.
Pr(θ0 ∈ I) = 1 − α Prπ (θ ∈ I | x) = 1 − α.