Vous êtes sur la page 1sur 14

Plan du cours de probabilités

Semaine 3
I Probabilités discrètes
Probabilités I Variables et vecteurs aléatoires discrets
I Espérance, espérance conditionnelle
Vecteurs aléatoires
continus
Cadre multivarié, densité jointe, densités Semaine 4
marginales
Conditionnement : loi et espérance
I Indépendance, variance, covariance
conditionnelle
Indépendance
I Variables aléatoires continues
Vecteurs Gaussiens I Vecteurs aléatoires continus

Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 1/14
Cadre continu multivarié

I X : Ω → Rd une fonction
I (Ω, A, P) espace probabilisé.
I Ensembles d’intérêt :
Probabilités
{X ∈ R} où R = [a1 , b1 ] × · · · × [ad , bd ] ("rectangle")
Vecteurs aléatoires
continus
Cadre multivarié, densité jointe, densités déf : X est un vecteur aléatoire (tout court) si
marginales
Conditionnement : loi et espérance
conditionnelle {X ∈ R} est un événement (i.e.,{X ∈ R} ∈ A),
Indépendance
Vecteurs Gaussiens pour tout R = [a1 , b1 ] × . . . × [ad , bd ], ai , bi ∈ R.

I Comme en 1D : les fonctions X → Rd seront « toujours »


des vecteurs aléatoires.

Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 2/14
Vecteur aléatoire continu
déf : Un vecteur aléatoire X = (X1 , . . . , Xd ) est continu si
∃ f : Rd → R+ , Rd f (x1 , . . . , xd ) dx1 · · · dxd = 1 (densité),
R

telle que pour tout rectangle R = [a1 , b1 ] × · · · × [ad , bd ],


Z Z
Probabilités P(X ∈ R) = ··· f (x1 , . . . , xd ) dx1 · · · dxd
[a1 ,b1 ] [ad ,bd ]

Vecteurs aléatoires
continus
Cadre multivarié, densité jointe, densités
marginales
Conditionnement : loi et espérance
conditionnelle
Indépendance
Vecteurs Gaussiens

Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 3/14
Densités marginales (couple (X , Y ) continu)
P(X ∈ [a, b]) = P(X ∈ [a, b], Y ∈ R)
Z Z 
= f(X,Y) (x, y) dy dx
x∈[a,b] y∈R
| {z }
Probabilités fonction de x

Vecteurs aléatoires
continus
Cadre multivarié, densité jointe, densités
marginales
Conditionnement : loi et espérance
conditionnelle
Indépendance
Vecteurs Gaussiens

Z Z
fX (x) = f(X ,Y ) (x, y ) dy ; fY (y ) = f(X ,Y ) (x, y ) dx .
y ∈R x∈R

Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 4/14
Densité conditionnelle
Soit (X , Y ) un couple continu, de densité jointe f(X ,Y ) .
I Si on observe {X = x}, que sait-on sur Y ?
I Problème : P({X = x}) = 0 : proba conditionnelle
« sachant {X = x} » n’existe pas.
Probabilités I Mais si fX (x) 6= 0 on peut définir :

Densité conditionnelle
Vecteurs aléatoires
continus Soit x tel que fX (x) 6= 0. La fonction :
Cadre multivarié, densité jointe, densités
marginales f(X ,Y ) (x, y )
Conditionnement : loi et espérance y 7→ fY |X (y |x) =
conditionnelle fX (x)
Indépendance
Vecteurs Gaussiens est appelée « densité conditionnelle de Y sachant {X = x} ».

Remarque importante
La fonction y 7→ fY |X (y |x) est une densité de probabilité sur R.

Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 5/14
Loi conditionnelle
déf : La loi conditionnelle de Y sachant {X = x} est
La loi sur R dont la densité est fY |X ( · | x).
Z
PY |X ([a, b]|x) = fY |X ( y | x) dy
Probabilités y ∈[a,b]

Vecteurs aléatoires
continus
Cadre multivarié, densité jointe, densités
marginales
Conditionnement : loi et espérance
conditionnelle
Indépendance
Vecteurs Gaussiens

Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 6/14
Loi conditionnelle : preuve de
l’interprétation géométrique

Probabilités

Vecteurs aléatoires Rapport entre les aires foncées /claires :


continus R
Cadre multivarié, densité jointe, densités
y ∈[a,b] f (x, y ) dy
marginales ∆= R
y ∈R f (x, y ) dy
Conditionnement : loi et espérance
conditionnelle
Indépendance
f(X ,Y ) (x, y )
Z Z
Vecteurs Gaussiens déf déf
PY |X ([a, b]|x) = fY |X (y |x) dy = dy
y ∈[a,b] y ∈[a,b] fX (x)
R
f (x, y ) y ∈[a,b] f(X ,Y ) (x, y )
Z
déf
= R (X ,Y ) dy = R
y ∈[a,b] R f (x, y ) dy Rf (x, y ) dy
=∆
Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 7/14
Utilisation de la loi conditionnelle

(X , Y ) : Ω → X × Y couple aléatoire. On donne PX et PY |X .


Loi de Y ?
X
(cas discret) P (Y ∈ A) = P (X = x, Y ∈ A)
Probabilités x∈X
X
= P(Y ∈ A|X = x) P(X = x)
Vecteurs aléatoires x∈X
continus X X 
Cadre multivarié, densité jointe, densités
= PY |X (y |x) P(X = x)
marginales x∈X y ∈A
Conditionnement : loi et espérance
conditionnelle
Indépendance Z Z
Vecteurs Gaussiens (cas continu) P (Y ∈ A) = f(X ,Y ) (x, y ) dy dx
x∈R y ∈A
Z Z 
= fY |X (y |x) dy fX (x) dx
x∈R y ∈A

Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 8/14
Espérance conditionnelle

(X , Y ) un couple aléatoire continu, de densité jointe f(X ,Y ) .

On observe {X = x}. Que peut-on attendre de Y en moyenne ?


Probabilités

déf : l’espérance conditionnelle de Y sachant X = x est


Vecteurs aléatoires Z
continus E(Y |X = x) = y fY |X (y |x) dy
Cadre multivarié, densité jointe, densités x∈R
marginales
Conditionnement : loi et espérance
conditionnelle déf
I remarque importante : g (x) = E(Y |X = x) est une
Indépendance
déf
Vecteurs Gaussiens fonction de x. Donc E(Y |X ) = g (X ) est une variable
aléatoire

Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 9/14
Espérance et espérance conditionnelle
déf
On définit E(Y |X ) = g (X ), où g (x) = E(Y |X = x).

prop : Espérance et espérance conditionnelle


Si Y est intégrable, alors E (Y |X ) aussi et
Probabilités  
E (Y ) = EX E (Y |X )
Vecteurs aléatoires
continus preuve c.f. cas discret. Remarquer que fY |X fX = f(X ,Y ) .
Cadre multivarié, densité jointe, densités
marginales intérêt : calculer E (Y ) si on connaît fX et fY |X .
Conditionnement : loi et espérance
conditionnelle
I ex : (X , Y ) couple aléatoire défini par :
Indépendance
Vecteurs Gaussiens
I X ∼ U[0,1]
I Loi conditle de Y : Y |{X = x} ∼ N (x, σ 2 ).
I Espérance de Y ?
1
E (Y |X = x) = x donc E (Y ) = EX [E (Y |X )] = EX [X ] = 2

Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 10/14
Indépendance
Soit X = (X1 , . . . , Xd ) un vecteur aléatoire

déf : Les variables aléatoires X1 . . . , Xd sont indépendantes si


Pour tout « rectangle » R = A1 × . . . × Ad ⊂ Rd ( les Ai sont
des intervalles), les événements
Probabilités
{X1 ∈ A1 }, . . . , {Xd ∈ Ad }
Vecteurs aléatoires sont indépendants.
continus
Cadre multivarié, densité jointe, densités
marginales (comparer avec le cas discret . . . )
Conditionnement : loi et espérance
conditionnelle Caractérisation (cas où X est continu) :
Indépendance
Vecteurs Gaussiens Les Xi sont indépendantes si et seulement si la densité jointe du
vecteur X est le produit des densités marginales :
d
Y
fX (x1 , . . . , xd ) = fXj (xj )
i=1
Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 11/14
Vecteurs Gaussiens
X = (X1 , . . . , Xd ) est appelé « Vecteur Gaussien »si toutes les
combinaisons linéaires des Xi sont des gaussiennes.

prop : Construction (admis)


Probabilités
X est Gaussien ⇔
Vecteurs aléatoires ∃A ∈ Rd×d , µ ∈ Rd , N = (N1 , . . . , Nd ) : X = µ + AN
continus
Cadre multivarié, densité jointe, densités où (N1 , . . . , Nd ) sont Gaussiennes standard, indépendantes.
marginales
Conditionnement : loi et espérance
conditionnelle I La loi de X est alors caractérisée entièrement par
Indépendance
Vecteurs Gaussiens
I Son espérance, E (X) = µ
I Sa matrice de covariance,

Σ = AA>

preuve : pour Σ, vérifiez que E (NN > ) = Id et écrivez la


définition matricielle de Cov(X ).
Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 12/14
Indépendance dans les vecteurs Gaussiens
Soit X ∼ N (µ, Σ) un vecteur Gaussien.
Alors la réciproque : dé-corrélation ⇒ indépendance devient
vraie :
Si la matrice de covariance Σ d’un vecteur Gaussien X est
Probabilités diagonale, alors ses composantes X1 , . . . , Xd sont indépendantes.

pourquoi ?
Vecteurs aléatoires
continus I Densité en x = (x1 , . . . , xd ) (Si Σ inversible)
Cadre multivarié, densité jointe, densités
marginales 1 −1 > −1
Conditionnement : loi et espérance fµ,Σ (x) = p e 2 (x−µ) Σ (x−µ)
conditionnelle d
(2π) | det Σ|
Indépendance
Vecteurs Gaussiens I Si Σ est diagonale,
densité jointe = produit de densités uni-variées
donc variables indépendantes
Attention : vérifier que le vecteur X est Gaussien, pas seulement
ses composantes Xi !
Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 13/14
Densité Gaussienne : Exemple
θ = π/6, µ = 0, Σ = PDP > , où
 
− sin(θ)
P = cos(θ)
sin(θ cos(θ) (vecteurs propres) D = ( 20 01 ) (valeurs propres)

Lignes de niveau de la densité :


Probabilités

2
Vecteurs aléatoires
continus

1
Cadre multivarié, densité jointe, densités
marginales

0
Conditionnement : loi et espérance
conditionnelle
Indépendance

−1
Vecteurs Gaussiens

−2

−2 −1 0 1 2

Anne Sabourin
Fondamentaux pour le Big Data c Télécom ParisTech 14/14

Vous aimerez peut-être aussi