Chapitre 0 Rappels

Module CI 27 − 1
A.U. 2023 − 2024
Rappels de probabilités et statistiques
Abdessamad OUSAADANE
ENSAM
04 Mars 2024
Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 1 / 47

Plan de cours
1 Rappel des lois de probabilités

Généralités
Principales lois discrètes
Principales lois continues
Relations entre les principales lois
2 Convergence et approximations
Théorème Central Limite
Approximations
Utilisation des tables statistiques
3 Échantillonnage et estimation
Distribution d’échantillonnage
Estimation

Généralités

Généralités
Fonction de répartition
Loi discrète : Si X une variable aléatoire discrète telle que
X (Ω) = {x1 , ..., xn }, sa fonction de répartition est définie par
X
FX (x) = P(X ≤ x) = P(X = xi ).
xi ∈X (Ω), xi ≤x
Loi continue : Si X une variable aléatoire continue de densité f , sa

fonction de répartition est définie par
Z x
FX (x) = P(X ≤ x) = f (t)dt.
−∞
On a alors P(X > x) = 1 − FX (x) et sa densité vaut f (x) = FX′ (x).

Espérance et variance
Le cas discret : Si X une variable aléatoire, on a :
k
X k
X
E (X ) = xi p(xi ), E (X 2 ) = xi2 p(xi ),
i=1 i=1
V (X ) = E (X 2 ) − E (X )2 .
Le cas continu :
Z +∞ Z +∞
E (X ) = xf (x), E (X ) = x 2 f (x),
−∞ −∞
V (X ) = E (X 2 ) − E (X )2 .

Propriétés de l’espérance et de la variance
Si X et Y sont deux variables aléatoires et a, b ∈ R, on a :
E (a) = a et V (a) = 0.
E (aX + b) = aE (X ) + b.
E (X + Y ) = E (X ) + E (Y ) et E (X − Y ) = E (X ) − E (Y ).
V (aX + b) = a2 V (X ).
V (X + Y ) = V (X ) + V (Y ) + 2cov(X , Y ) et
V (X − Y ) = V (X ) + V (Y ) − 2cov(X , Y ), avec
cov(X , Y ) = E (X · Y ) − E (X ) · E (Y ).
Si X et Y sont indépendantes (cov(X , Y ) = 0), on a
V (X + Y ) = V (X ) + V (Y ) et V (X − Y ) = V (X ) + V (Y ).

Loi de Bernoulli B(p)

X (Ω) = {0, 1} de paramètre p.
P(X = 1) = p, P(X = 0) = 1 − p.
E (X ) = p, V (X ) = p(1 − p).
Loi Binomiale B(n, p)

X (Ω) = {0, ..., n} de paramètres n et p.
P(X = k) = Cnk p k (1 − p)n−k .
E (X ) = np, V (X ) = np(1 − p).

Loi de Poisson P(λ)
X (Ω) = N de paramètre λ.
λk e −λ
P(X = k) = .
k!
E (X ) = V (X ) = λ.
Loi géométrique
X (Ω) = N∗ de paramètre p.
P(X = k) = (1 − p)k−1 p.
1 (1 − p)
E (X ) = , V (X ) = .
p p2

Loi uniforme U([a, b])

X (Ω) = [a, b] de paramètres a et b. 
 0x −
si , x < a,

 1 
a
si x ∈ [a, b],
f (x) = b−a et F (x) = si x ∈ [a, b],
 0 sinon.  b−a

1 si x > b.
a+b (b − a)2
E (X ) = , V (X ) = .
2 12
Loi exponentielle E(λ)

X (Ω) =R+ de paramètre λ.
λe −λx si x > 0, 1 − e −λx si x > 0,

f (x) = et F (x) =
0 sinon. 1 sinon.
1 1
E (X ) = , V (X ) = 2 .
λ λ

Loi normale N (m, σ)
X (Ω) = R de paramètres m (moyenne) et σ (écart-type).
(x − m)2 Z x (x − m)2
1 − 1 −
f (x) = √ e 2σ 2 et F (x) = √ e 2σ 2 dx.
σ 2π σ 2π −∞
E (X ) = m, V (X ) = σ 2 .
Loi normale N (0, 1)

X (Ω) = R de paramètres m = 0 et σ = 1.
−x 2 Z x −x 2
1 1
f (x) = √ e 2 et F (x) = √ e 2 dx.
2π 2π −∞
E (X ) = 0, V (X ) = 1.

Loi de χ2n
X (Ω) = R+ de paramètres n (degré de liberté).
E (X ) = n, V (X ) = 2n.
Loi de Student Tn
X (Ω) = R de paramètres n (degré de liberté).
n
E (X ) = 0 pour n > 1, V (X ) = pour n > 2.
n−2

Si les variables Xi suivent une loi B(p) et sont indépendantes, alors la

Xn
variable Y = Xi suit une loi B(n, p).
i=1
Si les variables Xi suivent une loi P(λi ) et sont indépendantes, alors la
Xn
P
variable Y = Xi suit une loi P( λi ).
i=1
X −m
Si la variable X suit une loi N (m, σ), alors la variable Y = suit
σ
une loi N (0, 1).
Si X1 , ..., Xn sont indépendantes et Xi ∼ N (0, 1) pour tout
i ∈ {1, ..., n}, alors Z = X12 + ... + Xn2 ∼ χ2n .
Si X ∼ N (0, 1), Y ∼ χ2n (à n degrés de liberté) et X et Y sont
√ X
indépendantes, alors Z = n √ ∼ Tn .
Y

Approximations

Convergence et approximation
Définition
Une suite de variables aléatoires (Xn )n≥1 converge en loi vers la loi de
probabilité de fonction de répartition F si et seulement si
limn→+∞ FXn (x) = F (x) en tout point x où F est continue.

Soit (Xn )n≥1 une suite de variables aléatoires réelles indépendantes
identiquement
p distribuées (iid), d’espérance E (X ) et d’écart-type
σ(X ) = V (X ) fini. Pour tout n ≥ 1, on pose :
Pn
X − nE (X ) X̄ − E (X )
Zn = pi
i=1
= √ .
nV (X ) σ(X )/ n
Alors la suite (Zn )n≥1 converge en loi vers la loi normale centrée réduite
N (0, 1).

Approximations
Si n ≥ 30 et np < 5, on peut approcher une loi B(n, p) par une loi
P(λ), avec λ = np.
Si n ≥ 30, np ≥ 5 et n(1 −pp) ≥ 5, alors on peut approcher une loi
B(n, p) par une loi N (np, np(1 − p)).
√ assez grand, on peut approcher une loi P(λ) par une loi
Si λ est
N (λ, λ).
Si n est 2
√ assez grand, on peut approcher une loi χn par une loi
N (n, 2n).
Si n est assez grand, on peut approcher une loi Tn par une loi N (0, 1).

Loi normale centrée réduite

• La table de la fonction de répartition de la loi normale centrée réduite
donne les valeurs de P(X ≤ u) pour u positif donné, tel que :
P(X ≤ u) = π(u),
avec π est la fonction de répartition de la loi normale centrée réduite.

• Pour u négatif, on utilise la relation suivante :
P(X ≤ u) = P(X > −u) = 1 − P(X ≤ −u) = 1 − π(−u).
P(X > u) = 1 − P(X ≤ u) = 1 − π(u).

P(u < X < v ) = P(X < v ) − P(X ≤ u) = π(v ) − π(u).
P(|X | ≤ u) = P(−u ≤ X ≤ u) = 2π(u) − 1.

Exemple
Calcul de P(X ≤ 1, 24) :

Le nombre situé à l’intersection de la ligne 1, 2 et de la colonne 0, 04
est la valeur de la fonction de répartition de X pour
x = 1, 2 + 0, 04 = 1, 24.
Ainsi, P(X ≤ 1, 24) = π(1, 24) = 0, 8925.

Calcul de P(X ≥ 1, 25) :
P(X ≥ 1, 25) = 1 − π(1, 25) = 1 − 0, 8944 = 0, 1056.
Calcul de P(X ≤ −1, 17) :
P(X ≤ −1, 17) = 1 − π(1, 17) = 1 − 0, 8790 = 0, 121.
Calcul de P(1, 15 ≤ X ≤ 1, 37) :
P(1, 15 ≤ X ≤ 1, 37) = π(1, 37) − π(1, 15) = 0, 9147 − 0, 8749 =
0, 0398.
Lecture inverse dans la table de N (0, 1)

Trouver u pour que P(X ≤ u) = 0, 9664 :
0, 9664 est à l’intersection de la ligne 1, 8 et de la colonne 0, 03, donc
u = 1, 83.
0, 77 n’est pas dans la table, donc on cherche les valeurs les plus
proches.
D’après la table, on a 0, 7673 < 0, 77 < 0, 7704, donc la valeur u
cherchée vérifie 0, 73 < u < 0, 74.

Lecture inverse dans la table de N (0, 1)
0, 1271 n’est pas dans la table et vérifie 0, 1271 < 0, 5, donc la valeur
de u est négative.
Donc P(X ≤ u) = 1 − P(X ≤ −u) = 0, 1271, donc
P(X ≤ −u) = 0, 8729, ce qui donne u = −1, 14.
En générale, pour une loi normale centrée réduite, si π(u) < 0, 5, alors
u < 0.
Lien avec la loi normale

Soit X une v.a continue qui suit une loi normale N (m, σ), avec σ > 0 et
X −m
m ∈ R. On pose Z = , alors Z suit une loi normale centrée réduite
σ
N (0, 1). Réciproquement, si Y une v.a continue qui suit une loi normale
centrée réduite, alors Y = σY + m suit une loi normale N (m, σ).

Exemple
Soit X une v.a qui suit N (m, σ) avec m = 12 et σ = 3. On pose
X −m X − 12
Y = = .
σ 3
Calcul de P(X ≤ 16) :
4
X ≤ 16 ⇔ Y ≤ .
3
Donc P(X ≤ 16) = P(Y ≤ 1, 33) = π(1, 33) = 0, 9082.
Calcul de P(9 ≤ X ≤ 15) :
P(9 ≤ X ≤ 15) = P(−1 ≤ Y ≤ 1) = 2π(1) − 1 =
(2 × 0, 8413) − 1 = 0, 6828.

Loi de χ2n
Si la variable aléatoire X suit χ2n à n degrés de liberté (ddl), la table
donne, pour un risque α choisi, le nombre χ21−α tel que :
P(X ≥ χ21−α ) = α ou P(X ≤ χ21−α ) = 1 − α.
L’intersection de la ligne qui correspond à n ddl et la colonne qui

correspond à un risque α donné, donne la valeur χ21−α , le quantile
d’ordre 1 − α de la loi χ2 à n degrés de liberté.
Pour déterminer χ21−α telle que P(X ≤ χ21−α ) = α, pour α donné, on
utilise la formule
P(X > χ21−α ) = 1 − P(X ≤ χ21−α ) = 1 − α
et on cherche dans la table la valeur χ21−α correspondant à 1 − α.

Exemple
Pour ddl = 3 et α = 0, 05, la table indique χ21−α = 7, 81. Cela signifie que
P(χ23 > 7, 81) = 0, 05.

Loi de Student
Si T est une variable aléatoire qui suit la loi de Student à n ddl et pour une
proportion α donné, la table de la loi de Student donne la valeur t1−α/2 tel
que P(|T | > t1−α/2 ) = α.
Le nombre situé à l’intersection de la ligne correspondant à un ddl et la
colonne correspondant à α est la valeur de t1−α/2 tel que
P(|T | > t1−α/2 ) = α.

Exemple
Pour ddl = 5 et une proportion α = 0, 05, cherchons t1−α/2 tel que

P(|T | > t1−α/2 ) = α.
D’après la table de la loi de Student, on trouve t1−α/2 = 2, 571.

Distribution d’échantillonnage
Estimation

Pour résoudre les problèmes d’estimation de paramètres inconnus, il faut
tout d’abord étudier les distributions d’échantillonnage, c’est à dire la loi de
probabilité suivie par l’estimateur.
Soit X une variable aléatoire étudiée sur une population et soit
(X1 , X2 , ..., Xn ) un échantillon aléatoire non exhaustif (les v.a. sont iid) et
(x1 , x2 , ..., xn ) un échantillon aléatoire empirique.
Distribution d’échantillonnage de la moyenne

On construit la variable aléatoire X̄ , telle que
n
X1 + X2 + ... + Xn 1X
X̄ = = Xi .
n n
i=1
X̄ est la distribution d’échantillonnage de la moyenne.

n
1X
x̄ = xi est une réalisation de la v.a. X̄ .
n
i=1

Distribution d’échantillonnage d’une variance
La variable aléatoire S 2 telle que
n
1X
S2 = (Xi − X̄ )2
n
i=1
est la distribution d’échantillonnage de la variance.

n
1X
s2 = (xi − x̄)2 est une réalisation de la v.a. S 2 .
n
i=1

On considère le cas particulier d’une population dans laquelle une proportion
p des individus présente une certaine propriété A.
On effectue un sondage sur un échantillon de n-individus. Pour i = 1, 2, ..., n,
soit Xi la v.a.r prenant la valeur 1 si le k-ième individu répond qu’il possède
le caractère A et la valeur 0 sinon.
Les v.a.r. Xi suivent une loi de Bernoulli B(p).
Si k le nombre d’individu présentant la P propriété A dans un échantillon de
taille n, alors la variable aléatoire K = ni=1 Xi résultant de différents
échantillonnages suit une loi binomiale B(n, p) avec E (K ) = np et
V (K ) = npq (avec q = 1 − p).
Distribution d’échantillonnage d’une proportion

K
On construit la variable aléatoire F = = X̄ avec E (F ) = p et V (F ) = pq.
n
La v.a. F est la distribution d’échantillonnage de la proportion p.
k
f = est une réalisation de la v.a. F .
n

Exemple : Distribution d’échantillonnage d’une moyenne
Les statistiques des notes obtenues en probabilités au 2ème année à l’ENSAM
pour l’année 2023 sont : Moyenne = 10.44, Écart-type= 1.46. Une classe de
3ème comporte 35 étudiants en 2023/2024 issus de 2ème année 2023.
Calculer la probabilité que la moyenne de cette classe soit supérieure à 10.
Solution :
2 X̄ −10.44
On a n = 35 > 30 ⇒ X̄ ∼ N (10.44, 1.46 n )⇒Z = 1.46
√
∼ N (0, 1).
35
Par conséquent,
X̄ − 10.44 10 − 10.44
P(X̄ > 10) = 1 − P(X̄ ≤ 10) = 1 − P 1.46
≤ 1.46
√ √
35 35
= 1 − P(Z ≤ −1.78) = 1 − π(−1.78) = π(1.78) = 0.9625.

La probabilité que la moyenne de cette classe soit supérieure à 10 est
≃ 96.25 %.

Estimation
Définition (Estimateur)
Soient X1 , X2 , . . . , Xn , n réalisations indépendantes de la variable aléatoire
X (discrète ou continue) et θ un paramètre inconnu associé à la loi de
probabilité suivi par X .
Un estimateur du paramètre θ est une variable aléatoire Θ fonction
des Xi :
Θ = f (X1 , X2 , . . . , Xn )
Si on considère n observations x1 , x2 , . . . , xn , l’estimateur Θ fournira
une estimation de θ notée également θ̂ :
θ̂ = f (x1 , x2 , . . . , xn )

Remarques
L’estimateur de θ est une variable aléatoire Θ dont la distribution de
probabilité s’appelle la distribution d’échantillonnage du paramètre θ.
Il admet alors une espérance E (Θ) et une variance V (Θ).
L’estimation a pour objectif de déterminer les valeurs inconnues des
paramètres de la population p, m, σ 2 (proportion, moyenne,

variance) à partir des données de l’échantillon f , x̄, s 2 .


Types d’estimation
L’estimation d’un paramètre quelconque θ est ponctuelle si l’on
associe une seule valeur à θ̂ à partir des données observables sur un
échantillon aléatoire.
L’estimation
h pariintervalle associe à un échantillon aléatoire, un
intervalle θ̂1 , θ̂2 qui recouvre θ̂ avec une certaine probabilité.
Choix de l’estimateur
Si la distribution de la variable aléatoire X est connue, on utilise la
méthode du maximum de vraisemblance pour estimer les
paramètres de la loi de probabilité.
Si la distribution n’est pas connue, on utilise la méthode des
moindres carrés.

Estimation ponctuelle de l’espérance
Soit X une variable aléatoire continue suivant une loi normale
N (m, σ) dont la valeur des paramètres n’est pas connue et pour
laquelle on souhaite estimer l’espérance m.
La moyenne arithmétique ou la moyenne empirique X̄ constitue le
meilleur estimateur de m = E (X) :
n
1X
X̄ = Xi
n
i=1
Pour une réalisation donnée (x1 , . . . , xn ) d’un échantillon aléatoire,

une estimation m̂ de l’espérance m est donnée par :
n
1X
m̂ = x̄ = xi
n
i=1

Estimation ponctuelle de la variance
Soit X une variable aléatoire continue suivant une loi normale N (m, σ)
pour laquelle on souhaite estimer la variance σ 2 .
Cas où l’espérance m est connu :
La variance observée T 2 constitue le meilleur estimateur de
σ 2 = V (X), lorsque l’espérance m est connue :
n
21X 2
T = (Xi − m) .
n
i=1
Pour une réalisation donnée (x1 , . . . , xn ) d’un échantillon aléatoire, une

estimation σ̂ 2 de la variance σ 2 est donné par :
n
1X 2
σ̂ 2 = (xi − m) .
n
i=1

Cas où l’espérance m n’est pas connu :
La variance empirique corrigée S ∗2 , constitue le meilleur estimateur de
σ 2 lorsque l’espérance m est inconnu :
n
n 1 X 2
S ∗2 = S2 = Xi − X̄ ,
n−1 n−1
i=1
n
1X 2
avec S 2 = Xi − X̄ est la variance empirique.
n
i=1
Pour une réalisation donnée (x1 , . . . , xn ) d’un échantillon aléatoire, une
estimation σ̂ 2 de la variance σ 2 lorsque l’espérance est inconnue est
donnée par :
n
n 2 1 X 2
σ̂ 2 = s ∗2 = s = (xi − x̄) .
n−1 n−1
i=1

Estimation ponctuelle de la proportion
La distribution d’échantillonnage de la proportion, notée F , constitue
le meilleur estimateur de p, proportion de la population :
K
F = .
n
k
La fréquence observée f = dans un échantillon de taille n est une
n
estimation de p, proportion de la population :
p̂ = f .

Lois et lois limites de distributions d’échantillonnage
En fonction de la nature de la variable aléatoire continue X , de la taille de
l’échantillon n et de la connaissance que nous avons sur le paramètre σ 2 , les
distributions d’échantillonnage X̄ , S 2 et F peuvent suivre ou converger vers
différentes lois.
1 Si X de loi inconnue et la taille de l’échantillon n est assez grande

(n ≥ 30), on se trouve dans les conditions du théorème Central Limite et
on a :
X̄ − m
Si σ est connu, √ suit la loi normale centrée réduite N (0, 1).
σ/ n
X̄ − m
Si σ est inconnu, √ suit la loi normale centrée réduite N (0, 1).
S/ n − 1
F −p
p suit la loi normale centrée réduite N (0, 1).
pq/n
S 2 − σ2
p suit la loi normale centrée réduite, avec
(m4 − σ 4 )/n
m4 = E (X − m)4 .


2 Si X ∼ N (m, σ), on a :

X̄ − m σ
Si σ 2 connue, √ suit la loi N (0, 1) X̄ ∼ N (m, √ ) .
σ/ n n
X̄ − m
Si σ 2 inconnue, S
suit la loi Tn−1 .
√
n−1
2
nT
Si m connue, 2 suit la loi χ2n .
σ
nS 2
Si m inconnue, 2 suit la loi χ2n−1 .
σ
Lorsque n ≥ 30, la loi de Student tend vers une loi normale centrée
réduite N (0, 1).

Estimation par intervalle de confiance
L’estimation
h par iintervalle associe à un échantillon aléatoire, un
intervalle θ̂1 , θ̂2 qui recouvre θ̂ avec une certaine probabilité.
Cet intervalle est appelé l’intervalle de confiance du paramètre θ car la
probabilité que θ dont la valeur est inconnue se trouve compris entre
θ1 et θ2 est égale à 1 − α, le coefficient de confiance
P (θ1 ≤ θ ≤ θ2 ) = 1 − α.
Son complément α correspond au coefficient de risque qui vérifie
P (θ ∈
/ [θ1 , θ2 ]) = α.

Intervalle de confiance d’une moyenne m = E (X)
X ∼ N (m, σ) et σ connu :
L’intervalle de confiance de la moyenne m pour un coefficient de risque α
est
σ σ
I (m) = X̄ − z1−α/2 √ , X̄ + z1−α/2 √
n n
X ∼ N (m, σ) et σ inconnu :
L’intervalle de confiance de la moyenne m pour un coefficient de risque α
est
S S
I (m) = X̄ − t1−α/2 √ , X̄ + t1−α/2 √
n−1 n−1
Avec z1−α/2 = π −1 (1 − α/2) et t1−α/2 = FT−1 n−1
(1 − α/2) sont les
quantiles d’ordre 1 − α/2 de la loi N (0, 1) et la loi de Student Tn−1 ,
respectivement.
Lorsque n ≥ 30, la loi de Student converge vers une loi normale centrée
réduite. Ainsi t1−α/2 ≃ z1−α/2 .

Intervalle de confiance d’une moyenne
Si X de loi inconnue et n ≥ 30 :
L’intervalle de confiance de l’espérance m pour un coefficient de risque
α est

S S
I (m) = X̄ − z1−α/2 √ , X̄ + z1−α/2 √ , (σ inconnu)
n−1 n−1
et
σ σ
I (m) = X̄ − z1−α/2 √ , X̄ + z1−α/2 √ , (σ connu).
n n
Si X suit une loi inconnue et n < 30 :
X̄ − m X̄ − m
La loi de probabilité suivie par √ et √ ne sont pas
S/ n − 1 σ/ n
connues et l’on a recours aux statistiques non paramétriques.

Intervalle de confiance d’une variance
Si X ∼ N (m, σ) et m est connu :
" #
2
nT 2 nT 2
I σ = ,
χ21−α/2 χ2α/2
avec χ21−α/2 et χ2α/2 sont les quantiles d’ordre 1 − α/2 et α/2,

respectivement de la loi χ2n .
Si X ∼ N (m, σ) et m est inconnu :
" #
nS 2 nS 2
I σ2 =

,
χ21−α/2 χ2α/2
où χ21−α/2 et χ2α/2 sont les quantiles d’ordre 1 − α/2 et α/2,

respectivement de la loi χ2n−1 .

Intervalle de confiance d’une proportion
Si n est grand et np, nq ≥ 5, on a :
L’intervalle de confiance de la proportion p pour un coefficient de
risque α est
" r r #
F (1 − F ) F (1 − F )
F − z1−α/2 , F + z1−α/2 ,
n n
avec z1−α/2 est le quantile d’ordre 1 − α/2 de la loi N (0, 1).

Exemple 1 : Estimation par IC de la moyenne m de la population
On a observé la taille de n = 200 hommes marocains adultes. Après calcul,
on a obtenu une moyenne de x̄ = 168 cm. Si on suppose que la variance
connue vaut σ = 1. Donnez un intervalle de confiance à 95% de la vraie
moyenne de la population.
Solution :
On a n = 200 ≥ 30 et σ connu, donc l’intervalle de confiance de la
moyenne m pour un coefficient de risque α est

σ σ
I (m) = X̄ − z1−α/2 √ , X̄ + z1−α/2 √ .
n n
Puisque α = 0.05 (5%), alors 1 − 0.05

2 = 0.975, par suite z1−α/2 = 1.96.
Finalement IC95% = [167.86; 168.14], i.e., P(m ∈ [167.86; 168.14]) = 0.95.

Exemple 2
Un reporter pour un journal étudiant est en train de rédiger un article sur le
coût du logement près du campus. Un échantillon de 10 appartements dans
un rayon de 1 km de l’université a permis d’estimer le coût moyen du loyer
mensuel à 350 par mois et un écart type de 30. Quel est l’intervalle de
confiance de 95% pour la moyenne des loyers mensuels ? Supposons que les
loyers suivent une loi normale.
Solution :
Pour un coefficient de confiance de 0, 95, on a α = 0, 05, et α2 = 0, 025.
On a n − 1 = 10 − 1 = 9 degrés de liberté, alors la table de la distribution
Student nous donne tα = 2, 262.
Finalement IC95% = [328.54; 371.46]. i.e., nous sommes confiants à 95%
que la moyenne des loyers mensuels (le vrai paramètre de la population m),
se trouve entre 328.54 et 371.46.

Exemple : Estimation par IC de la proportion p de la population
Analytica est une compagnie qui se spécialise dans les sondages politiques. À
l’aide de sondages téléphoniques, les interviewers demandent aux citoyens pour
qui ils voteraient si les élections avaient lieu aujourd’hui.
Récemment, Analytica a trouvé que 220 votants sur 500 voterait pour un
candidat particulier. Analytica veut estimer l’intervalle de confiance à 95%
pour la proportion des votants qui sont en faveur de ce candidat.
Solution :
On a n = 500 est grand, donc l’intervalle de confiance de la proportion p pour
un coefficient de risque α est
" r r #
F (1 − F ) F (1 − F )
F − z1−α/2 , F + z1−α/2 .
n n
De plus, p̄ = 220/500 = 0.44 et z1−α/2 = 1.96 donc IC95% = [0.3965; 0.4835],

i.e., Analytica est confiant à 95% que la proportion des votants qui
favoriseront ce candidat est entre 0.3965 et 0.4835.

Détermination de la taille de l’échantillon :
Quelle est la taille n de l’échantillon qui permettrait d’affirmer qu’en utilisant
un estimateur ponctuel, l’erreur commise pour un coefficient de confiance
(1 − α) serait moindre que la marge d’erreur E ?
Si par exemple on fixe
σ
E = z1−α/2 √ ,
n
l’erreur maximale commise pour un coefficient de confiance (1 − α).
σ 2
h i
z
Alors la taille de l’échantillon sera : n = 1−α/2
E .
Exemple
Si on fixe une marge d’erreur E = 500, un écart type de σ = 5000 et pour
z1−α/2 = 1.96. Déterminer la taille de l’échantillon pour arriver à une
précision de ±500 à un seuil de confiance de 95%.
On a z1−α/2 = 1.96, donc on trouve n = 384. i.e., on a besoin d’un
échantillon de taille n = 384 pour arriver à une précision de ±500 à un seuil
de confiance de 95%.

Chapitre 0 Rappels

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre 0 Rappels

Transféré par

Droits d'auteur :

Formats disponibles

Module CI 27 − 1

A.U. 2023 − 2024

Rappels de probabilités et statistiques

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 1 / 47

1 Rappel des lois de probabilités

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 2 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 3 / 47

Loi continue : Si X une variable aléatoire continue de densité f , sa

On a alors P(X > x) = 1 − FX (x) et sa densité vaut f (x) = FX′ (x).

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 4 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 5 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 6 / 47

Loi de Bernoulli B(p)

Loi Binomiale B(n, p)

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 7 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 8 / 47

Loi uniforme U([a, b])

Loi exponentielle E(λ)

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 9 / 47

Loi normale N (0, 1)

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 10 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 11 / 47

Si les variables Xi suivent une loi B(p) et sont indépendantes, alors la

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 12 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 13 / 47

Théorème Central Limite

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 14 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 15 / 47

Loi normale centrée réduite

avec π est la fonction de répartition de la loi normale centrée réduite.

P(X ≤ u) = P(X > −u) = 1 − P(X ≤ −u) = 1 − π(−u).

P(X > u) = 1 − P(X ≤ u) = 1 − π(u).

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 16 / 47

Calcul de P(X ≤ 1, 24) :

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 17 / 47

Lecture inverse dans la table de N (0, 1)

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 18 / 47

Lien avec la loi normale

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 19 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 20 / 47

P(X ≥ χ21−α ) = α ou P(X ≤ χ21−α ) = 1 − α.

L’intersection de la ligne qui correspond à n ddl et la colonne qui

P(X > χ21−α ) = 1 − P(X ≤ χ21−α ) = 1 − α

et on cherche dans la table la valeur χ21−α correspondant à 1 − α.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 21 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 22 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 23 / 47

Pour ddl = 5 et une proportion α = 0, 05, cherchons t1−α/2 tel que

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 24 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 25 / 47

Distribution d’échantillonnage de la moyenne

X̄ est la distribution d’échantillonnage de la moyenne.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 26 / 47

est la distribution d’échantillonnage de la variance.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 27 / 47

Distribution d’échantillonnage d’une proportion

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 28 / 47

= 1 − P(Z ≤ −1.78) = 1 − π(−1.78) = π(1.78) = 0.9625.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 29 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 30 / 47

variance) à partir des données de l’échantillon f , x̄, s 2 .

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 31 / 47

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 32 / 47

Pour une réalisation donnée (x1 , . . . , xn ) d’un échantillon aléatoire,