Académique Documents
Professionnel Documents
Culture Documents
SR7 LoisProbabilite
SR7 LoisProbabilite
Stéphane Robin
© Équipe enseignante LU1INMA1
Cours #7 : Variables aléatoires réelles, vraisemblance
Plan du cours
2 Vraisemblance
Échantillon de variables aléatoires
Fonction de vraisemblance
3 Démonstrations
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 1/26
Cours #7 : Variables aléatoires réelles, vraisemblance
Plan du cours
2 Vraisemblance
Échantillon de variables aléatoires
Fonction de vraisemblance
3 Démonstrations
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 2/26
Variable aléatoire réelle
On s’intéresse maintenant à une variable aléatoire X prenant ses valeurs dans un ensemble X
infini, non dénombrable, par exemple
X = [a, b], X = R+ , X = R.
Exemples. X =
Temps d’attente avant le prochain autobus (X = R+ )
Plus basse température observée l’an prochain en un lieu donné (X = R)
Nombre réel tiré uniformément entre 0 et 1 (X = [0, 1])
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 3/26
Fonction de répartition
Fonction de répartition
La fonction de répartition F d’une variable aléatoire réelle X est la fonction
F : X 7→ [0, 1]
x → F (x) = P{X ≤ x}
De plus
F (y ) − F (x) = P{x < X ≤ y }.
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 4/26
Fonction de répartition : exemple
Les régions de X dans lesquelles il est le plus probable d’observer une réalisation de X
correspondent aux régions dans lesquelles F augmente le plus vite.
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 5/26
Densité de probabilité
Remarques.
1 Par définition de la dérivée, F constitue une primitive de la fonction f : pour a ≤ b,
Z b
F (b) − F (a) = f (x) dx.
a
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 6/26
Densité : exemple
Exemple de densité : X = R+
Les intervalles [1, 3] et [6, 8] sont de même largeur, mais la probabilité de l’événement
{X ∈ [1, 3]} est plus de 10 fois supérieure à celle de l’événement {X ∈ [6, 8]}.
→ La ’densité de probabilité’ est plus grande dans l’intervalle [1, 3] que dans l’intervalle [6, 8] .
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 7/26
Loi exponentielle (1/2)
Loi exponentielle
La loi exponentielle (de paramètre λ) est la loi de la variable aléatoire X réelle positive
(X = R+ ) telle que
F (x) = P{X ≤ x} = 1 − exp(−λx).
On note alors X ∼ E(λ).
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 8/26
Loi exponentielle (2/2)
La loi exponentielle est, par exemple, utilisée pour décrire la distribution d’un temps d’attente.
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 9/26
Loi uniforme (1/2)
Loi uniforme
La loi uniforme sur l’intervalle [0, 1] est la loi de la variable aléatoire X réelle à valeur dans
[0, 1] telle que
f (x) = 1 si x ∈ [0, 1] et 0 sinon.
On note alors X ∼ U ([0, 1]).
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 10/26
Loi uniforme (2/2)
La loi uniforme est la loi élémentaire en matière de simulation numérique : la plupart des
langages et systèmes proposent une fonction permettant de la simuler.
La simulation selon d’autres lois de probabilités repose le plus souvent sur la simulation d’une
ou plusieurs variables uniformes.
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 11/26
Loi normale (1/2)
Loi normale
La loi normale (de paramètre µ et σ 2 ) est la loi de la variable aléatoire X réelle (X = R) telle
que
(x − µ)2
1
f (x) = √ exp − .
σ 2π 2σ 2
On note alors
X ∼ N (µ, σ 2 ).
Remarques.
1 Il n’existe pas de forme explicite pour la fonction de répartition de la loi normale :
Z x
(u − µ)2
1
F (x) = √ exp − d u.
σ 2π −∞ 2σ 2
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 12/26
Loi normale (2/2)
La loi normale apparaît dans presque tous les domaines scientifiques et techniques.
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 13/26
Espérance et variance
Remarques.
1 Là encore, il faut s’assurer que les intégrales existent (hors programme du cours).
2 Sous la même condition, on peut définir l’espérance d’une fonction de X , par exemple :
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 14/26
Loi uniforme
1 1
E(X ) = , V(X ) = . (3)
2 12
E(X ) = µ, V(X ) = σ 2 .
La démonstration de cette propriété n’est pas donnée ici : il suffit d’effectuer une intégration
par partie.
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 15/26
Quantile d’une distribution
La distribution d’une variable continue nous renseigne sur les intervalles dans lesquels elle est
le plus susceptible d’être observée.
Quantile
Le quantile d’ordre u, noté q(u) d’une variable X est la valeur q(u) telle que
P{X ≤ q(u)} = u
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 16/26
Quantile : exemple
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 17/26
Quantile et loi exponentielle
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 18/26
Quantiles de la loi normale
q(1 − u) = −q(u).
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 19/26
Cours #7 : Variables aléatoires réelles, vraisemblance
Plan du cours
2 Vraisemblance
Échantillon de variables aléatoires
Fonction de vraisemblance
3 Démonstrations
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 20/26
Vers l’inférence
Exemple :
Variables entières Variables réelles
Loi F θ Loi F θ
Bernoulli B π exponentielle E λ
binomiale B (n, π) normale N (µ, σ 2 )
On note de même :
p(x; θ), f (x; θ) F (x; θ).
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 21/26
Échantillon de variables aléatoires
Échantillon i.i.d.
Un ensemble de variables aléatoires X1 , X2 , . . . , Xn constitue un (n-)échantillon i.i.d. de la loi
F (θ) si et seulement si
les variables X1 , X2 , . . . , Xn sont toutes indépendantes et
chacune d’elles est distribuée selon la loi F (θ) :
∀1 ≤ i ≤ n : Xi ∼ F (θ).
x1 x2 x3 x4 x5
Bernoulli B(1/2) 0 0 1 1 0
Exponentielle E(1) 0.458 0.2582 2.895 1.23 0.5397
Normale N (0, 1) -0.005767 2.405 0.7636 -0.799 -1.148
V (x1 , . . . xn ; θ) = Pθ {X1 = x1 , X2 = x2 , . . . Xn = xn }.
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 23/26
Vraisemblance d’un échantillon de Bernoulli
On a θ = π et p(x; π) = π x (1 − π)1−x , donc
n
Y n
X
V (x1 , . . . xn ; π) = π xi (1 − π)1−xi = π y (1 − π)n−y avec y = xi .
i=1 i=1
Échantillon de Bernoulli
Pour la réalisation
x1 x2 x3 x4 x5
0 0 1 1 0
on a y = 2, donc
V (x1 , . . . xn ; π) = π 2 (1 − π)3
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 24/26
Vraisemblance d’un échantillon de loi exponentielle
On a θ = λ et f (x; λ) = λ exp(−λx), donc
n
Y n
X
V (x1 , . . . xn ; λ) = λ exp(−λxi ) = λn exp(−λy ) avec y = xi .
i=1 i=1
Pour la réalisation
x1 x2 x3 x4 x5
0.458 0.2582 2.895 1.23 0.5397
on a y = 5.38, soit
V (x1 , . . . xn ; λ) = λ5 exp(−5.38 λ)
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 25/26
Vraisemblance d’un échantillon gaussien
√
On a θ = (µ, σ 2 ) et f (x; µ, σ 2 ) = exp(−(x − µ)2 /2σ 2 )/(σ 2π), donc
n n
!
Y 1 x 2 − 2µxi + µ2 X
V (x1 , . . . xn ; µ, σ 2 ) = √ exp − i 2
avec y = xi
i=1
σ 2π 2σ i=1
n n
z − 2µy + nµ2
1 X
= √ exp − 2
et z = xi2 .
σ 2π 2σ i=1
Pour la réalisation
x1 x2 x3 x4 x5
-0.00577 2.405 0.7636 -0.799 -1.148
V (x1 , . . . xn ; µ, σ 2 ) =
5
8.321 − 2.432 µ + 5µ2
1
√ exp − 2
σ 2π 2σ
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 26/26
Cours #7 : Variables aléatoires réelles, vraisemblance
Plan du cours
2 Vraisemblance
Échantillon de variables aléatoires
Fonction de vraisemblance
3 Démonstrations
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 27/26
Démonstrations
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 28/26
Variable aléatoire réelle continue : fonction de répartition
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 29/26
Variable aléatoire réelle continue : loi uniforme I
x >1: Z x Z 1 Z x
F (x) = f (u) du = f (u) du + f (u) du = F (1) = 1
−∞ −∞ b
| {z } | {z }
F (1) 0
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 30/26
Variable aléatoire réelle continue : loi uniforme II
1 1 1
x2
Z Z
1
E(X ) = xf (x) dx = x dx = = .
0 0 2 0 2
De plus
1 1 1
x3
Z Z
1
E(X 2 ) = x 2 f (x) dx = x 2 dx = = ,
0 0 3 0 3
donc
1 1 1
V(X ) = E(X 2 ) − (E(X ))2 = − = .
3 4 12
□
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 31/26
Quantile I
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 32/26
Quantile II
P{X ≤ x} = u ⇔ F (x) = u
⇔ 1 − exp(−λx) = u
⇔ −λx = log(1 − u)
⇔ x = − log(1 − u)/λ.
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 33/26
Quantile III
FX (x) = P{X ≤ x}
= P{− log(1 − U)/λ ≤ x}
= P{U ≤ 1 − exp(−λx)}
= FU (1 − exp(−λx))
= 1 − exp(−λx)
Stéphane Robin — Cours #7 : Variables aléatoires réelles, vraisemblance — Sciences des données — 2023–2024 34/26