Vous êtes sur la page 1sur 47

Module CI 27 − 1

A.U. 2023 − 2024

Rappels de probabilités et statistiques

Abdessamad OUSAADANE

ENSAM

04 Mars 2024

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 1 / 47


Plan de cours

1 Rappel des lois de probabilités


Généralités
Principales lois discrètes
Principales lois continues
Relations entre les principales lois

2 Convergence et approximations
Théorème Central Limite
Approximations
Utilisation des tables statistiques

3 Échantillonnage et estimation
Distribution d’échantillonnage
Estimation

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 2 / 47


1 Rappel des lois de probabilités
Généralités
Principales lois discrètes
Principales lois continues
Relations entre les principales lois

2 Convergence et approximations

3 Échantillonnage et estimation

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 3 / 47


Généralités

Fonction de répartition
Loi discrète : Si X une variable aléatoire discrète telle que
X (Ω) = {x1 , ..., xn }, sa fonction de répartition est définie par
X
FX (x) = P(X ≤ x) = P(X = xi ).
xi ∈X (Ω), xi ≤x

Loi continue : Si X une variable aléatoire continue de densité f , sa


fonction de répartition est définie par
Z x
FX (x) = P(X ≤ x) = f (t)dt.
−∞

On a alors P(X > x) = 1 − FX (x) et sa densité vaut f (x) = FX′ (x).

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 4 / 47


Espérance et variance
Le cas discret : Si X une variable aléatoire, on a :
k
X k
X
E (X ) = xi p(xi ), E (X 2 ) = xi2 p(xi ),
i=1 i=1

V (X ) = E (X 2 ) − E (X )2 .
Le cas continu :
Z +∞ Z +∞
E (X ) = xf (x), E (X ) = x 2 f (x),
−∞ −∞

V (X ) = E (X 2 ) − E (X )2 .

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 5 / 47


Propriétés de l’espérance et de la variance
Si X et Y sont deux variables aléatoires et a, b ∈ R, on a :
E (a) = a et V (a) = 0.
E (aX + b) = aE (X ) + b.
E (X + Y ) = E (X ) + E (Y ) et E (X − Y ) = E (X ) − E (Y ).
V (aX + b) = a2 V (X ).
V (X + Y ) = V (X ) + V (Y ) + 2cov(X , Y ) et
V (X − Y ) = V (X ) + V (Y ) − 2cov(X , Y ), avec
cov(X , Y ) = E (X · Y ) − E (X ) · E (Y ).
Si X et Y sont indépendantes (cov(X , Y ) = 0), on a
V (X + Y ) = V (X ) + V (Y ) et V (X − Y ) = V (X ) + V (Y ).

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 6 / 47


Principales lois discrètes

Loi de Bernoulli B(p)


X (Ω) = {0, 1} de paramètre p.
P(X = 1) = p, P(X = 0) = 1 − p.
E (X ) = p, V (X ) = p(1 − p).

Loi Binomiale B(n, p)


X (Ω) = {0, ..., n} de paramètres n et p.
P(X = k) = Cnk p k (1 − p)n−k .
E (X ) = np, V (X ) = np(1 − p).

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 7 / 47


Loi de Poisson P(λ)
X (Ω) = N de paramètre λ.
λk e −λ
P(X = k) = .
k!
E (X ) = V (X ) = λ.

Loi géométrique
X (Ω) = N∗ de paramètre p.
P(X = k) = (1 − p)k−1 p.
1 (1 − p)
E (X ) = , V (X ) = .
p p2

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 8 / 47


Principales lois continues

Loi uniforme U([a, b])


X (Ω) = [a, b] de paramètres a et b. 
 0x −
si , x < a,

 1 
a
si x ∈ [a, b],
f (x) = b−a et F (x) = si x ∈ [a, b],
 0 sinon.  b−a

1 si x > b.
a+b (b − a)2
E (X ) = , V (X ) = .
2 12

Loi exponentielle E(λ)


X (Ω) =R+ de paramètre λ.
λe −λx si x > 0, 1 − e −λx si x > 0,

f (x) = et F (x) =
0 sinon. 1 sinon.
1 1
E (X ) = , V (X ) = 2 .
λ λ

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 9 / 47


Loi normale N (m, σ)
X (Ω) = R de paramètres m (moyenne) et σ (écart-type).
(x − m)2 Z x (x − m)2
1 − 1 −
f (x) = √ e 2σ 2 et F (x) = √ e 2σ 2 dx.
σ 2π σ 2π −∞
E (X ) = m, V (X ) = σ 2 .

Loi normale N (0, 1)


X (Ω) = R de paramètres m = 0 et σ = 1.
−x 2 Z x −x 2
1 1
f (x) = √ e 2 et F (x) = √ e 2 dx.
2π 2π −∞
E (X ) = 0, V (X ) = 1.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 10 / 47


Loi de χ2n
X (Ω) = R+ de paramètres n (degré de liberté).
E (X ) = n, V (X ) = 2n.

Loi de Student Tn
X (Ω) = R de paramètres n (degré de liberté).
n
E (X ) = 0 pour n > 1, V (X ) = pour n > 2.
n−2

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 11 / 47


Relations entre les principales lois

Si les variables Xi suivent une loi B(p) et sont indépendantes, alors la


Xn
variable Y = Xi suit une loi B(n, p).
i=1
Si les variables Xi suivent une loi P(λi ) et sont indépendantes, alors la
Xn
P
variable Y = Xi suit une loi P( λi ).
i=1
X −m
Si la variable X suit une loi N (m, σ), alors la variable Y = suit
σ
une loi N (0, 1).
Si X1 , ..., Xn sont indépendantes et Xi ∼ N (0, 1) pour tout
i ∈ {1, ..., n}, alors Z = X12 + ... + Xn2 ∼ χ2n .
Si X ∼ N (0, 1), Y ∼ χ2n (à n degrés de liberté) et X et Y sont
√ X
indépendantes, alors Z = n √ ∼ Tn .
Y

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 12 / 47


1 Rappel des lois de probabilités

2 Convergence et approximations
Théorème Central Limite
Approximations
Utilisation des tables statistiques

3 Échantillonnage et estimation

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 13 / 47


Convergence et approximation

Définition
Une suite de variables aléatoires (Xn )n≥1 converge en loi vers la loi de
probabilité de fonction de répartition F si et seulement si
limn→+∞ FXn (x) = F (x) en tout point x où F est continue.

Théorème Central Limite


Soit (Xn )n≥1 une suite de variables aléatoires réelles indépendantes
identiquement
p distribuées (iid), d’espérance E (X ) et d’écart-type
σ(X ) = V (X ) fini. Pour tout n ≥ 1, on pose :
Pn
X − nE (X ) X̄ − E (X )
Zn = pi
i=1
= √ .
nV (X ) σ(X )/ n

Alors la suite (Zn )n≥1 converge en loi vers la loi normale centrée réduite
N (0, 1).

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 14 / 47


Approximations
Si n ≥ 30 et np < 5, on peut approcher une loi B(n, p) par une loi
P(λ), avec λ = np.
Si n ≥ 30, np ≥ 5 et n(1 −pp) ≥ 5, alors on peut approcher une loi
B(n, p) par une loi N (np, np(1 − p)).
√ assez grand, on peut approcher une loi P(λ) par une loi
Si λ est
N (λ, λ).
Si n est 2
√ assez grand, on peut approcher une loi χn par une loi
N (n, 2n).
Si n est assez grand, on peut approcher une loi Tn par une loi N (0, 1).

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 15 / 47


Utilisation des tables statistiques

Loi normale centrée réduite


• La table de la fonction de répartition de la loi normale centrée réduite
donne les valeurs de P(X ≤ u) pour u positif donné, tel que :

P(X ≤ u) = π(u),

avec π est la fonction de répartition de la loi normale centrée réduite.


• Pour u négatif, on utilise la relation suivante :

P(X ≤ u) = P(X > −u) = 1 − P(X ≤ −u) = 1 − π(−u).

P(X > u) = 1 − P(X ≤ u) = 1 − π(u).


P(u < X < v ) = P(X < v ) − P(X ≤ u) = π(v ) − π(u).
P(|X | ≤ u) = P(−u ≤ X ≤ u) = 2π(u) − 1.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 16 / 47


Exemple

Calcul de P(X ≤ 1, 24) :


Le nombre situé à l’intersection de la ligne 1, 2 et de la colonne 0, 04
est la valeur de la fonction de répartition de X pour
x = 1, 2 + 0, 04 = 1, 24.
Ainsi, P(X ≤ 1, 24) = π(1, 24) = 0, 8925.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 17 / 47


Calcul de P(X ≥ 1, 25) :
P(X ≥ 1, 25) = 1 − π(1, 25) = 1 − 0, 8944 = 0, 1056.
Calcul de P(X ≤ −1, 17) :
P(X ≤ −1, 17) = 1 − π(1, 17) = 1 − 0, 8790 = 0, 121.
Calcul de P(1, 15 ≤ X ≤ 1, 37) :
P(1, 15 ≤ X ≤ 1, 37) = π(1, 37) − π(1, 15) = 0, 9147 − 0, 8749 =
0, 0398.

Lecture inverse dans la table de N (0, 1)


Trouver u pour que P(X ≤ u) = 0, 9664 :
0, 9664 est à l’intersection de la ligne 1, 8 et de la colonne 0, 03, donc
u = 1, 83.
Trouver u pour que P(X ≤ u) = 0, 77 :
0, 77 n’est pas dans la table, donc on cherche les valeurs les plus
proches.
D’après la table, on a 0, 7673 < 0, 77 < 0, 7704, donc la valeur u
cherchée vérifie 0, 73 < u < 0, 74.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 18 / 47


Lecture inverse dans la table de N (0, 1)
Trouver u pour que P(X ≤ u) = 0, 1271 :
0, 1271 n’est pas dans la table et vérifie 0, 1271 < 0, 5, donc la valeur
de u est négative.
Donc P(X ≤ u) = 1 − P(X ≤ −u) = 0, 1271, donc
P(X ≤ −u) = 0, 8729, ce qui donne u = −1, 14.
En générale, pour une loi normale centrée réduite, si π(u) < 0, 5, alors
u < 0.

Lien avec la loi normale


Soit X une v.a continue qui suit une loi normale N (m, σ), avec σ > 0 et
X −m
m ∈ R. On pose Z = , alors Z suit une loi normale centrée réduite
σ
N (0, 1). Réciproquement, si Y une v.a continue qui suit une loi normale
centrée réduite, alors Y = σY + m suit une loi normale N (m, σ).

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 19 / 47


Exemple
Soit X une v.a qui suit N (m, σ) avec m = 12 et σ = 3. On pose
X −m X − 12
Y = = .
σ 3
Calcul de P(X ≤ 16) :
4
X ≤ 16 ⇔ Y ≤ .
3
Donc P(X ≤ 16) = P(Y ≤ 1, 33) = π(1, 33) = 0, 9082.
Calcul de P(9 ≤ X ≤ 15) :
P(9 ≤ X ≤ 15) = P(−1 ≤ Y ≤ 1) = 2π(1) − 1 =
(2 × 0, 8413) − 1 = 0, 6828.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 20 / 47


Loi de χ2n
Si la variable aléatoire X suit χ2n à n degrés de liberté (ddl), la table
donne, pour un risque α choisi, le nombre χ21−α tel que :

P(X ≥ χ21−α ) = α ou P(X ≤ χ21−α ) = 1 − α.

L’intersection de la ligne qui correspond à n ddl et la colonne qui


correspond à un risque α donné, donne la valeur χ21−α , le quantile
d’ordre 1 − α de la loi χ2 à n degrés de liberté.
Pour déterminer χ21−α telle que P(X ≤ χ21−α ) = α, pour α donné, on
utilise la formule

P(X > χ21−α ) = 1 − P(X ≤ χ21−α ) = 1 − α

et on cherche dans la table la valeur χ21−α correspondant à 1 − α.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 21 / 47


Exemple

Pour ddl = 3 et α = 0, 05, la table indique χ21−α = 7, 81. Cela signifie que
P(χ23 > 7, 81) = 0, 05.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 22 / 47


Loi de Student
Si T est une variable aléatoire qui suit la loi de Student à n ddl et pour une
proportion α donné, la table de la loi de Student donne la valeur t1−α/2 tel
que P(|T | > t1−α/2 ) = α.
Le nombre situé à l’intersection de la ligne correspondant à un ddl et la
colonne correspondant à α est la valeur de t1−α/2 tel que
P(|T | > t1−α/2 ) = α.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 23 / 47


Exemple

Pour ddl = 5 et une proportion α = 0, 05, cherchons t1−α/2 tel que


P(|T | > t1−α/2 ) = α.
D’après la table de la loi de Student, on trouve t1−α/2 = 2, 571.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 24 / 47


1 Rappel des lois de probabilités

2 Convergence et approximations

3 Échantillonnage et estimation
Distribution d’échantillonnage
Estimation

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 25 / 47


Pour résoudre les problèmes d’estimation de paramètres inconnus, il faut
tout d’abord étudier les distributions d’échantillonnage, c’est à dire la loi de
probabilité suivie par l’estimateur.
Soit X une variable aléatoire étudiée sur une population et soit
(X1 , X2 , ..., Xn ) un échantillon aléatoire non exhaustif (les v.a. sont iid) et
(x1 , x2 , ..., xn ) un échantillon aléatoire empirique.

Distribution d’échantillonnage de la moyenne


On construit la variable aléatoire X̄ , telle que
n
X1 + X2 + ... + Xn 1X
X̄ = = Xi .
n n
i=1

X̄ est la distribution d’échantillonnage de la moyenne.


n
1X
x̄ = xi est une réalisation de la v.a. X̄ .
n
i=1

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 26 / 47


Distribution d’échantillonnage d’une variance
La variable aléatoire S 2 telle que
n
1X
S2 = (Xi − X̄ )2
n
i=1

est la distribution d’échantillonnage de la variance.


n
1X
s2 = (xi − x̄)2 est une réalisation de la v.a. S 2 .
n
i=1

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 27 / 47


On considère le cas particulier d’une population dans laquelle une proportion
p des individus présente une certaine propriété A.
On effectue un sondage sur un échantillon de n-individus. Pour i = 1, 2, ..., n,
soit Xi la v.a.r prenant la valeur 1 si le k-ième individu répond qu’il possède
le caractère A et la valeur 0 sinon.
Les v.a.r. Xi suivent une loi de Bernoulli B(p).
Si k le nombre d’individu présentant la P propriété A dans un échantillon de
taille n, alors la variable aléatoire K = ni=1 Xi résultant de différents
échantillonnages suit une loi binomiale B(n, p) avec E (K ) = np et
V (K ) = npq (avec q = 1 − p).

Distribution d’échantillonnage d’une proportion


K
On construit la variable aléatoire F = = X̄ avec E (F ) = p et V (F ) = pq.
n
La v.a. F est la distribution d’échantillonnage de la proportion p.
k
f = est une réalisation de la v.a. F .
n

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 28 / 47


Exemple : Distribution d’échantillonnage d’une moyenne
Les statistiques des notes obtenues en probabilités au 2ème année à l’ENSAM
pour l’année 2023 sont : Moyenne = 10.44, Écart-type= 1.46. Une classe de
3ème comporte 35 étudiants en 2023/2024 issus de 2ème année 2023.
Calculer la probabilité que la moyenne de cette classe soit supérieure à 10.
Solution :
2 X̄ −10.44
On a n = 35 > 30 ⇒ X̄ ∼ N (10.44, 1.46 n )⇒Z = 1.46

∼ N (0, 1).
35
Par conséquent,
 X̄ − 10.44 10 − 10.44 
P(X̄ > 10) = 1 − P(X̄ ≤ 10) = 1 − P 1.46
≤ 1.46
√ √
35 35

= 1 − P(Z ≤ −1.78) = 1 − π(−1.78) = π(1.78) = 0.9625.


La probabilité que la moyenne de cette classe soit supérieure à 10 est
≃ 96.25 %.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 29 / 47


Estimation

Définition (Estimateur)
Soient X1 , X2 , . . . , Xn , n réalisations indépendantes de la variable aléatoire
X (discrète ou continue) et θ un paramètre inconnu associé à la loi de
probabilité suivi par X .
Un estimateur du paramètre θ est une variable aléatoire Θ fonction
des Xi :
Θ = f (X1 , X2 , . . . , Xn )
Si on considère n observations x1 , x2 , . . . , xn , l’estimateur Θ fournira
une estimation de θ notée également θ̂ :

θ̂ = f (x1 , x2 , . . . , xn )

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 30 / 47


Remarques
L’estimateur de θ est une variable aléatoire Θ dont la distribution de
probabilité s’appelle la distribution d’échantillonnage du paramètre θ.
Il admet alors une espérance E (Θ) et une variance V (Θ).
L’estimation a pour objectif de déterminer les valeurs inconnues des
paramètres de la population p, m, σ 2 (proportion, moyenne,


variance) à partir des données de l’échantillon f , x̄, s 2 .




Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 31 / 47


Types d’estimation
L’estimation d’un paramètre quelconque θ est ponctuelle si l’on
associe une seule valeur à θ̂ à partir des données observables sur un
échantillon aléatoire.
L’estimation
h pariintervalle associe à un échantillon aléatoire, un
intervalle θ̂1 , θ̂2 qui recouvre θ̂ avec une certaine probabilité.

Choix de l’estimateur
Si la distribution de la variable aléatoire X est connue, on utilise la
méthode du maximum de vraisemblance pour estimer les
paramètres de la loi de probabilité.
Si la distribution n’est pas connue, on utilise la méthode des
moindres carrés.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 32 / 47


Estimation ponctuelle de l’espérance
Soit X une variable aléatoire continue suivant une loi normale
N (m, σ) dont la valeur des paramètres n’est pas connue et pour
laquelle on souhaite estimer l’espérance m.
La moyenne arithmétique ou la moyenne empirique X̄ constitue le
meilleur estimateur de m = E (X) :
n
1X
X̄ = Xi
n
i=1

Pour une réalisation donnée (x1 , . . . , xn ) d’un échantillon aléatoire,


une estimation m̂ de l’espérance m est donnée par :
n
1X
m̂ = x̄ = xi
n
i=1

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 33 / 47


Estimation ponctuelle de la variance
Soit X une variable aléatoire continue suivant une loi normale N (m, σ)
pour laquelle on souhaite estimer la variance σ 2 .
Cas où l’espérance m est connu :
La variance observée T 2 constitue le meilleur estimateur de
σ 2 = V (X), lorsque l’espérance m est connue :
n
21X 2
T = (Xi − m) .
n
i=1

Pour une réalisation donnée (x1 , . . . , xn ) d’un échantillon aléatoire, une


estimation σ̂ 2 de la variance σ 2 est donné par :
n
1X 2
σ̂ 2 = (xi − m) .
n
i=1

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 34 / 47


Cas où l’espérance m n’est pas connu :
La variance empirique corrigée S ∗2 , constitue le meilleur estimateur de
σ 2 lorsque l’espérance m est inconnu :
n
n 1 X 2
S ∗2 = S2 = Xi − X̄ ,
n−1 n−1
i=1

n
1X 2
avec S 2 = Xi − X̄ est la variance empirique.
n
i=1
Pour une réalisation donnée (x1 , . . . , xn ) d’un échantillon aléatoire, une
estimation σ̂ 2 de la variance σ 2 lorsque l’espérance est inconnue est
donnée par :
n
n 2 1 X 2
σ̂ 2 = s ∗2 = s = (xi − x̄) .
n−1 n−1
i=1

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 35 / 47


Estimation ponctuelle de la proportion
La distribution d’échantillonnage de la proportion, notée F , constitue
le meilleur estimateur de p, proportion de la population :
K
F = .
n
k
La fréquence observée f = dans un échantillon de taille n est une
n
estimation de p, proportion de la population :

p̂ = f .

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 36 / 47


Lois et lois limites de distributions d’échantillonnage
En fonction de la nature de la variable aléatoire continue X , de la taille de
l’échantillon n et de la connaissance que nous avons sur le paramètre σ 2 , les
distributions d’échantillonnage X̄ , S 2 et F peuvent suivre ou converger vers
différentes lois.

1 Si X de loi inconnue et la taille de l’échantillon n est assez grande


(n ≥ 30), on se trouve dans les conditions du théorème Central Limite et
on a :
X̄ − m
Si σ est connu, √ suit la loi normale centrée réduite N (0, 1).
σ/ n
X̄ − m
Si σ est inconnu, √ suit la loi normale centrée réduite N (0, 1).
S/ n − 1
F −p
p suit la loi normale centrée réduite N (0, 1).
pq/n
S 2 − σ2
p suit la loi normale centrée réduite, avec
(m4 − σ 4 )/n
m4 = E (X − m)4 .


Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 37 / 47


2 Si X ∼ N (m, σ), on a :
 
X̄ − m σ
Si σ 2 connue, √ suit la loi N (0, 1) X̄ ∼ N (m, √ ) .
σ/ n n
X̄ − m
Si σ 2 inconnue, S
suit la loi Tn−1 .

n−1
2
nT
Si m connue, 2 suit la loi χ2n .
σ
nS 2
Si m inconnue, 2 suit la loi χ2n−1 .
σ
Lorsque n ≥ 30, la loi de Student tend vers une loi normale centrée
réduite N (0, 1).

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 38 / 47


Estimation par intervalle de confiance
L’estimation
h par iintervalle associe à un échantillon aléatoire, un
intervalle θ̂1 , θ̂2 qui recouvre θ̂ avec une certaine probabilité.
Cet intervalle est appelé l’intervalle de confiance du paramètre θ car la
probabilité que θ dont la valeur est inconnue se trouve compris entre
θ1 et θ2 est égale à 1 − α, le coefficient de confiance

P (θ1 ≤ θ ≤ θ2 ) = 1 − α.

Son complément α correspond au coefficient de risque qui vérifie

P (θ ∈
/ [θ1 , θ2 ]) = α.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 39 / 47


Intervalle de confiance d’une moyenne m = E (X)
X ∼ N (m, σ) et σ connu :
L’intervalle de confiance de la moyenne m pour un coefficient de risque α
est  
σ σ
I (m) = X̄ − z1−α/2 √ , X̄ + z1−α/2 √
n n
X ∼ N (m, σ) et σ inconnu :
L’intervalle de confiance de la moyenne m pour un coefficient de risque α
est  
S S
I (m) = X̄ − t1−α/2 √ , X̄ + t1−α/2 √
n−1 n−1
Avec z1−α/2 = π −1 (1 − α/2) et t1−α/2 = FT−1 n−1
(1 − α/2) sont les
quantiles d’ordre 1 − α/2 de la loi N (0, 1) et la loi de Student Tn−1 ,
respectivement.
Lorsque n ≥ 30, la loi de Student converge vers une loi normale centrée
réduite. Ainsi t1−α/2 ≃ z1−α/2 .

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 40 / 47


Intervalle de confiance d’une moyenne
Si X de loi inconnue et n ≥ 30 :
L’intervalle de confiance de l’espérance m pour un coefficient de risque
α est
 
S S
I (m) = X̄ − z1−α/2 √ , X̄ + z1−α/2 √ , (σ inconnu)
n−1 n−1
et  
σ σ
I (m) = X̄ − z1−α/2 √ , X̄ + z1−α/2 √ , (σ connu).
n n
Si X suit une loi inconnue et n < 30 :
X̄ − m X̄ − m
La loi de probabilité suivie par √ et √ ne sont pas
S/ n − 1 σ/ n
connues et l’on a recours aux statistiques non paramétriques.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 41 / 47


Intervalle de confiance d’une variance
Si X ∼ N (m, σ) et m est connu :
" #
2
 nT 2 nT 2
I σ = ,
χ21−α/2 χ2α/2

avec χ21−α/2 et χ2α/2 sont les quantiles d’ordre 1 − α/2 et α/2,


respectivement de la loi χ2n .
Si X ∼ N (m, σ) et m est inconnu :
" #
nS 2 nS 2
I σ2 =

,
χ21−α/2 χ2α/2

où χ21−α/2 et χ2α/2 sont les quantiles d’ordre 1 − α/2 et α/2,


respectivement de la loi χ2n−1 .

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 42 / 47


Intervalle de confiance d’une proportion
Si n est grand et np, nq ≥ 5, on a :
L’intervalle de confiance de la proportion p pour un coefficient de
risque α est
" r r #
F (1 − F ) F (1 − F )
F − z1−α/2 , F + z1−α/2 ,
n n

avec z1−α/2 est le quantile d’ordre 1 − α/2 de la loi N (0, 1).

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 43 / 47


Exemple 1 : Estimation par IC de la moyenne m de la population
On a observé la taille de n = 200 hommes marocains adultes. Après calcul,
on a obtenu une moyenne de x̄ = 168 cm. Si on suppose que la variance
connue vaut σ = 1. Donnez un intervalle de confiance à 95% de la vraie
moyenne de la population.
Solution :
On a n = 200 ≥ 30 et σ connu, donc l’intervalle de confiance de la
moyenne m pour un coefficient de risque α est
 
σ σ
I (m) = X̄ − z1−α/2 √ , X̄ + z1−α/2 √ .
n n

Puisque α = 0.05 (5%), alors 1 − 0.05


2 = 0.975, par suite z1−α/2 = 1.96.
Finalement IC95% = [167.86; 168.14], i.e., P(m ∈ [167.86; 168.14]) = 0.95.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 44 / 47


Exemple 2
Un reporter pour un journal étudiant est en train de rédiger un article sur le
coût du logement près du campus. Un échantillon de 10 appartements dans
un rayon de 1 km de l’université a permis d’estimer le coût moyen du loyer
mensuel à 350 par mois et un écart type de 30. Quel est l’intervalle de
confiance de 95% pour la moyenne des loyers mensuels ? Supposons que les
loyers suivent une loi normale.
Solution :
Pour un coefficient de confiance de 0, 95, on a α = 0, 05, et α2 = 0, 025.
On a n − 1 = 10 − 1 = 9 degrés de liberté, alors la table de la distribution
Student nous donne tα = 2, 262.
Finalement IC95% = [328.54; 371.46]. i.e., nous sommes confiants à 95%
que la moyenne des loyers mensuels (le vrai paramètre de la population m),
se trouve entre 328.54 et 371.46.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 45 / 47


Exemple : Estimation par IC de la proportion p de la population
Analytica est une compagnie qui se spécialise dans les sondages politiques. À
l’aide de sondages téléphoniques, les interviewers demandent aux citoyens pour
qui ils voteraient si les élections avaient lieu aujourd’hui.
Récemment, Analytica a trouvé que 220 votants sur 500 voterait pour un
candidat particulier. Analytica veut estimer l’intervalle de confiance à 95%
pour la proportion des votants qui sont en faveur de ce candidat.
Solution :
On a n = 500 est grand, donc l’intervalle de confiance de la proportion p pour
un coefficient de risque α est
" r r #
F (1 − F ) F (1 − F )
F − z1−α/2 , F + z1−α/2 .
n n

De plus, p̄ = 220/500 = 0.44 et z1−α/2 = 1.96 donc IC95% = [0.3965; 0.4835],


i.e., Analytica est confiant à 95% que la proportion des votants qui
favoriseront ce candidat est entre 0.3965 et 0.4835.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 46 / 47


Détermination de la taille de l’échantillon :
Quelle est la taille n de l’échantillon qui permettrait d’affirmer qu’en utilisant
un estimateur ponctuel, l’erreur commise pour un coefficient de confiance
(1 − α) serait moindre que la marge d’erreur E ?
Si par exemple on fixe
σ
E = z1−α/2 √ ,
n
l’erreur maximale commise pour un coefficient de confiance (1 − α).
σ 2
h i
z
Alors la taille de l’échantillon sera : n = 1−α/2
E .

Exemple
Si on fixe une marge d’erreur E = 500, un écart type de σ = 5000 et pour
z1−α/2 = 1.96. Déterminer la taille de l’échantillon pour arriver à une
précision de ±500 à un seuil de confiance de 95%.
On a z1−α/2 = 1.96, donc on trouve n = 384. i.e., on a besoin d’un
échantillon de taille n = 384 pour arriver à une précision de ±500 à un seuil
de confiance de 95%.

Abdessamad OUSAADANE (ENSAM) Rappels de probabilités et statistiques 04 Mars 2024 47 / 47

Vous aimerez peut-être aussi