Vous êtes sur la page 1sur 36

Bayes

M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Estimation Bayesienne

p
: paramtre alatoire inconnu. La connaissance
a priori sur est exprime par une loi de probabitlit p().
Critres Bayesiens
R(

) = E
r ,
_
C(,

(r ))
_
Usuellement
C(,

(r )) = C(

(r )) (fonction uniquement de
lerreur destimation)
C(,

(r )) =
_

(r )
_
2
: erreur quadratique noyenne
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
MMSE: la moyenne a posteriori
Pour C(,

(r )) =
_

(r )
_
2

MSE
(r ) = arg min

E
r ,
_
_

(r )
_
2
_
= E[|r ]
Dmonstration
R(

) = E
r ,
_
_

(r )
_
2
_
=
_ _
_

(r )
_
2
p(r , ) dr d
=
_ _
p(r )
_
_

(r )
_
2
p(|r ) d
_
dr
p(r ) 0 max

R max

_
_

(r )
_
2
p(|r ) d
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
/

= 0
2
_
_

(r )
_
p(|r ) d = 0
_

(r )p(|r ) d =
_
p(|r ) d

(r ) =
_
p(|r ) d = E[|r ]
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Estimation rcursive
Intgration progrssive des observations
p()

r
1


(r
1
)

r
2


(r
1
, r
2
)

r
3

Condition : observations sans mmoire.
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Estimation de signal
Processus de Markov
X
1
, X
2
, . . . est un processus de Markov si
p(X
n
|X
n1
1
) = p(X
n
|X
n1
) X
n
1
= X
1
, . . . X
n
Sachant le prsent, le futur est statistiquement indpendent
du pass
La probabilit dune squence X
0
, X
1
, . . . , X
n
est factorise
p(X
0
, X
1
, . . . , X
n
) = p(X
0
)
n

i =1
p(X
i
|X
i 1
)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Estimation de signal
Observations sans mmoire
Observations sans mmoire
p(r
n
|X
n
, r
n1
1
) = p(r
n
|X
n
)
Problme de ltrage
Dterminer

X
n
sachant les observations r
n
1
.
Lestimateur derreur quadratique minimal est

X
n
(r
n
1
) = E[X
n
|r
n
1
]
Il faut donc dterminer p(X
n
|r
n
1
).
Pour des processus X
n
de Markov, et des observations r
n
sans mmoire, p(X
n
|r
n
1
) peut tre dtermine rcursivement
p(X
0
) p(X
1
)

r
1
p(X
1
|r
1
) p(X
2
|r
1
)

r
2
p(X
2
|r
1
, r
2
)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Dcomposition Prdiction/Filtrage
p(X
0
)
(prdiction)
p(X
1
|X
0
)

r
1

(ltrage)
p(X
1
|r
1
)
p(X
1
|r
1
)
(prdiction)
p(X
2
|r
1
)

r
2

(ltrage)
p(X
2
|r
1
, r
2
)
p(X
2
|r
1
, r
2
)
(prdiction)
p(X
3
|r
1
, r
2
)

r
3

(ltrage)

Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Prdiction
p(X
n+1
|r
n
1
) =
_
p(X
n+1
, X
n
|r
n
1
) dX
n
=
_
p(X
n+1
|X
n
, r
n
1
) p(X
n
|r
n
1
)dX
n
=
_
p(X
n+1
|X
n
)p(X
n
|r
n
1
) dX
n
Intgration dans lespace de X
n
: opration de convolution.
Transporte lincertitude propos de X
n
sur la valeur
suivante (X
n+1
) du signal. Utilise le modle de Markov du
signal (son noyau de transition p(X
n
|X
n1
))
p(X
n
|r
n
1
) p(X
n+1
|r
n
1
)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Filtrage
p(x
n+1
|r
n+1
1
) = p(X
n+1
|r
n+1
, r
n
1
)
=
p(X
n+1
, r
n+1
|r
n
1
)
p(r
n+1
|r
n
1
)
=
p(r
n+1
|X
n+1
, r
n
1
)p(X
n+1
|r
n
1
)
p(r
n+1
|r
n
1
)
=
p(r
n+1
|X
n+1
)p(X
n+1
|r
n
1
)
p(r
n+1
|r
n
1
)
p(r
n+1
|X
n+1
)p(X
n+1
|r
n
1
)
Multiplication point point de fonctions de X
n+1
.
p(X
n+1
|r
n
1
) p(X
n+1
|r
n+1
1
)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Ralisation
Ralisation exacte des pas de prdiction et de ltrage pour
Chanes de Markov (espace dtat ni)
Processus de Gauss-Markov (toutes les densits sont
Gaussiennes, les observations sont linaires et sans
mmoire) Filtre de Kalman
Dans le cas gnral, besoin dapproximer les quations de
prdiction et ltrage.
Approximation fonctionnelle : le ltre de Kalman tendu
Approximation numrique : les ltres particulaires
(utilisent des techniques de Monte-Carlo)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Estimation en prsence de paramtres de
nuisance
p(r |, Y) modle statistique connu
r : observations.
: paramtres estimer
Y : paramtres inconnus
But
Maximiser la probabilit a posterior marginale
p(|r ) =
_
p(, Y|r )dy .
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Bayes
p(|r ) =
p(r , )
p(r )
p(r |)p() = p(r , )
Si p() = C,

maximiser p(|r ) maximiser p(r , )

= arg max

p(|r )
= arg max

logp(r , ) = arg max

log
_
Y
p(r , y, ) dy
Difcult: logarithme dun integral (somme)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Prsentation intuitive
Alterner entre
dterminer des estims des paramtres dsirs,

k
, et
dterminer les estims

y
k
(

k
) des paramtres cachs
Y

0


y
0
(

0
)

1
(

y
0
)

y
1
(

1
)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Algorithme E-M (Expectation-Maximization)
E-M : propage une distribution de probabilit sur Y :

0
p
0
(y)

1
p
1
(y)

2

Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
E-M
tape de Expectation : borne infrieure (fonctionelle)
B
k
() pour la densit a posteriori marginale p(|r )
B
k
() = B(,

k
) logp(|r )
tape de Maximization : maximise B
k
() :

k+1
= arg max

B
k
()
Nous allons voir que, k
p(r ,

k+1
) p(r ,

k
)
convergence vers un maximum local de p(r , ).
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
logp(r , ) = log
_
Y
p(r , y, ) dy
= log
_
Y
p
k
(y)
p(r , y, )
p
k
(y)
, p
k
(y) > 0
= log E
p
k
(y)
_
p(r , y, )
p
k
(y)
_
Ingalit de Jensen (fonctions concaves)
E{f (X)} f (E{X}) ,
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Dnition de la borne Infrieure
B(,

k
) = E
p
k
(y)
_
log
p(r , y, )
p
k
(y)
_
=
_
Y
p
k
(y) log
p(r , y, )
p
k
(y)
log E
p
k
(y)
_
p(r , y, )
p
k
(y)
_
= logp(r , )
Note : p
k
(y) est fonction de

k
.
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Expectation: calcul de B(,

n
)
E-M : choisir p
k
(y) de faon que
B(

k
,

k
) = B(,

k
)

k
=
_
Y
p
k
(y) log
p(r , y,

k
)
p
k
(y)
= logp(r ,

k
)
sous la contrainte
_
Y
p
k
(y) dy = 1
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Choix de p
k
(y)
Multiplicateurs de Lagrange
G
_
p
k
(y)
_
=
_
1
_
Y
p
k
(y) dy
_
+
_
Y
p
k
(y) logp(r , y,

k
) dy
_
Y
p
k
(y) logp
k
(y) dy
G/p
k
(y) = 0
+logp(r , y,

k
) logp
k
(y) 1 = 0
p
k
(y) = c()p(r , y,

k
)
p
k
(y) =
p(r ,y,

k
)

Y
p(r ,y,

k
)
= p(y|r ,

k
)
densit a posteriori des paramtres de nuisance, sachant
les observations, et pour =

k
,
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Exercice
Vrier que pour ce choix de p
k
(y) nous avons
effectivement
B(,

k
)

k
= logp(r ,

k
)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Maximization (1)
Dterminer qui maximise B(,

k
) :
B(,

k
) = E
p
k
(y)
{logp(r , y, )} +H
= E
p
k
(y)
{logp(r , y|)} +logp() +H
= Q
k
() +logp() +H
o
H = E
p
k
(y)
_
logp
k
(y)
_
entropie de Shanon
Q
k
() = E
p
k
(y)
{logp(r , y|)} esprance de la vraisemblance
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Maximization (2)

k+1
= arg max

B(,

k
) = arg max

Q
k
() +logp()
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Algorithme E-M
Initialiser

0
Pour k = 0, 1, . . .
(pas E): calculer : p
k
(y) = p(y|r ,

k
)
Q
k
() = E
p
k
(y)
{logp(r , y|)}
(pas M): actualiser

k+1
= arg max

Q
k
() +logp()
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
illustration graphique
Mhode locale : convergence vers un maximum local.
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
estimation des paramtres cachs

0
p
0
(y)

y
0

1
p
1
(y)

y
1

y
k
= arg max
y
p
k
(y) = arg max
y
p(y|r ,

k
) .

y
k
: estimateur MAP (Maximum a Posterior) des paramtres
cachs, sachant les observations, et admettant que =

k
.
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Estimation dun modle de mlange
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Modle de mlange
r = r
1
, . . . , r
i
(iid)
p(r |) =
N

i =1
p
_
r
i
| = {
k
,
k
}
K
k=1
_
=
N

i =1
K

k=1

k
p(r
i
|
k
)
K : nombre de termes du mlange (connu)

k
[0, 1],

k

k
= 1 : coefcients de mlange (poids)

k
: paramtres de forme
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Vraisemblance
logp(r |) =
N

i =1
log

k
p(r
i
|
k
)
= (
1

K
) = (
1

1

K

K
) ,

k
= (
k
,
k
)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Variables caches : les tiquettes des donnes

i
{1, . . . , L}, i = 1, . . . , N
i
= k r
i
p
k
= p(r |
k
)
logp(r , |) =
N

i =1
logp(r
i
|,
i
)p(
i
|) =
N

i =1
p(r
i
|

i
)p(
i
|)
p(
i
= k|) =
k
: probabilit de choisir le terme (la loi de
probabilit) k
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Expectation
(1)

k

p
k
() = p(|r ,

k
) =
N

i =1
p(
i
|r
i
,

k
) ,
Loi de Bayes
p(
i
|r
i
, ) =
p(r
i
|
i
, )p(
i
|)
p(r
i
|)
=

i
p(r
i
|

i
)

K
k=1

k
p(r
i
|
k
)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Expectation
(2)
Q
n
() = E
p
n
()
{logp(r , |)}
=
_
L
N
N

i =1
log(

i
p(r
i
|

i
))
N

j =1
p(
j
|r
j
,

n
) d
1
d
N
=
N

i =1
_
L
K

k=1

k,
i
log(
k
p(r
i
|
k
)) p(
i
|r
i
,

n
) d
i
=
N

i =1
K

k=1
log(
k
p(r
i
|
k
))
_
L

k,
i
p(
i
|r
i
,

n
) d
i
comme
_
L

k,
i
p(
i
|r
i
,

n
) d
i
= p(k|r
i
,

n
)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Expectation
(3)

Q
n
() =
K

k=1
N

i =1
log(
k
p(r
i
|
k
)) p(k|r
i
,

n
)
=
K

k=1
N

i =1
log
k
p(k|r
i
,

n
)
+
K

k=1
N

i =1
logp(r
i
|
k
)p(k|r
i
,

n
)
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Remarque
Le calcul de Q
n
() dans les deux derniers slides est
simpli si nous utilisons le fait que
i
est une variable
alatoire discrte,

i
{1, . . . , K}, p
n
(
i
= k) = p(
i
= k|r
i
,

m
)
et que, par dnition
Q
n
() = E
p
n
()
_
N

i =1
log(

i
p(r
i
|

i
))
_
=
N

i =1
E
p
n
(
i
)
[log(

i
p(r
i
|

i
))]
=
N

i =1
K

i
=1
log(

i
p(r
i
|

i
)) p(
i
|r
i
,

n
)
qui est lexpression trouve si nous faisons
i
k.
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Maximisation sur
k
Rsultat gnral
Avec la contrainte de somme unitaire
K

k=1
N

i =1
log
k
p(k|r
i
,

n
) +
_
1

k
_
/
j

N

i =1
1

j
p(
i
= j |r
i
,

n
) = 0

= N

j ,n+1
=
1
N
N

i =1
p(
i
= j |r
i
,

n
) ,
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Maximisation sur
k
Densits gaussiennes
Pour des densits Gaussiennes
p
k
= N (
k
,
k
)
=
1
(2)
d/2
|
k
|
1/2
exp
_

1
2
(r
k
)
T

1
k
(r
k
)
_
la solution est

k,(n+1)
=

i
r
i
p(
i
= k|r
i
,

n
)

i
p(
i
= k|r
i
,

n
)
moyenne pondre des donnes
et

k,(n+1)
=

i
(r
i

k,(n+1)
)(r
i

k,(n+1)
)
T
p(
i
= k|r
i
,

n
)

i
p(
i
= k|r
i
,

n
)
variance empirique
Bayes
M. J. Rendas
Approche
Bayesienne
lestimation
paramtrique
Paramtres
de nuisance
Mlanges
Segmentation dimages
Trouver les rgions homognes (les pixels lintrieur sont
des ralizations de la mme loi de probabilit).

Vous aimerez peut-être aussi