Académique Documents
Professionnel Documents
Culture Documents
Loi Normale
Théorie de l’échantillonnage
Estimation - Intervalle de confiance de la
moyenne
1
Plan du cours
1. La loi Normale N(µ, σ)
• Présentation générale
• Table de la fonction de répartition de la loi N (0,1)
• Vérification de la normalité – méthode graphique
2. La loi de Student
• Présentation générale, Table
4. Estimation
• Estimation ponctuelle
• Estimation par intervalle de confiance de l’espérance
• Cas des grands échantillons
• Cas des petits échantillons
1. La loi Normale
Un exemple de loi de distribution d’une
variable aléatoire
3
La loi Normale (ou de Gauss)
Elle permet de décrire la distribution théorique de variables aléatoires
quantitatives continues
Elle est symbolisée par la lettre N et définie par son espérance (ou moyenne) µ
et son écart-type σ
La variable aléatoire (VA) X (par exemple la
taille en m) suit une loi Normale d’espérance
Notation X → N(μ,σ) µ et d’écart-type σ
approximation de la fonction de
densité de probabilités d’une
variable aléatoire continue
Density
10 20 30 40 50
LRo
A partir de la variable X :
si on soustrait µ : on centre la variable (moyenne =0)
si on divise par σ : on réduit la variable (écart-type =1)
𝑋−𝜇
𝑈=
𝜎
On dit que la variable U suit une
loi Normale d’espérance = 0 et
d’écart-type = 1
- +
La loi Normale centrée réduite
𝑋−𝜇
𝑈=
𝜎
N (µ, σ) N (0, 1)
X → N(μ,σ) U → N(0,1)
x1 X u1
µ
𝑥1 − 𝜇
𝑢1=
𝜎
Calcul de probabilités
On utilise la loi Normale pour calculer des probabilités
Une probabilité est comprise entre 0 et 1
X → N(μ,σ)
N (µ, σ)
P(X< x1) = probabilité que la VA X (ex. taille) soit
inférieure à la valeur particulière x1 (ex. 1,2m)
= toute l’aire sous la courbe jusqu’à la valeur x1
(aire hachurée en rouge)
N (0, 1)
U → N(0,1)
P(U< u1) = probabilité que la VA U soit inférieure
à la valeur particulière u1
= toute l’aire sous la courbe jusqu’à la valeur u1
u1
Calcul de probabilités
Pour une variable X → N(μ,σ), le calcul de probabilités se fait par changement
de variables
La variable X est centrée réduite
N (µ, σ) N (0, 1)
X → N(μ,σ) U → N(0,1)
x1 X u1
µ
f
f f
Calcul de probabilités
-u1 u1
Si u1 = 0,92
P (U<0,92)= 0,8212 directement donnée dans la table
P(U<?) = 0,975, donc si la probabilité est 0,975, on peut trouver u 1= 1,96 dans la table
P(U<0) = 0,5
Calcul de probabilités – Exercice 1
P(U<u)=0,7673 u= 0,73
12
Calcul de probabilités – Exercice 2
Au sein d’une livraison d’œufs en grande surface, on considère que la variable « teneur en
matière grasse d’un jaune d’œuf » est distribuée selon une loi Normale de moyenne 308
g/kg et d’écart-type 3,17 g.
Quelle est la probabilité de trouver un œuf de teneur en matière grasse inférieure à 300
g/kg et inférieure à 308 g/kg ?
P(X<308) = 0,5
15
Présentation générale
Loi de probabilités pour une variable aléatoire continue utilisée pour la calcul
d’intervalle de confiance et la réalisation de tests de comparaison de moyennes
16
La table donne
tα/2 pour une valeur de ddl et α
Si α=0,05 et 10 ddl
La table donne
tα/2 = 2,228
17
Applications sous R
18
Loi Normale centrée réduite
U → N(0,1)
u1
Calculer la valeur de U telle que 50% des valeurs de X sont inférieures à cette valeur
qnorm(0.5) 0
Calculer la valeur de U telle que 20% des valeurs de X sont inférieures à cette valeur
qnorm(0.2) -0.8416212
Calculer la valeur de U telle que 97,5% des valeurs de U sont inférieures à cette valeur
qnorm(0.975) 1.959964
19
Loi Normale quelconque
Au sein d’une livraison d’œufs en grande surface, on considère que la variable « teneur en
matière grasse d’un jaune d’œuf » est distribuée selon une loi Normale de moyenne 308
g/kg et d’écart-type 3,17 g.
Quelle est la probabilité de trouver un individu de teneur en matière grasse inférieure à
300 g/kg et inférieure à 308 g/kg ?
U = (X – 308)/3,17 → N(0,1)
P(X < 300) = P(U < (300-308)/3,17) = P(U < -2,523) = P(U > 2,523) = 1- P(U < 2,523)
pnorm(-2.523) 0.00581792
1-pnorm(2.523) 0.00581792
80
233 32.2 13.8
50
60
234 30.4 13.6
40
Frequency
Frequency
30
40
20
20
par(mfrow=c(1,2))
10
hist(LRo);hist(HRo)
0
0
10 20 30 40 50 0 10 20 30 40 50
LRo HRo
21
Vérification de la normalité
Utilisation de la fonction qqnorm()
qqnorm(LRo)
qqnorm(HRo)
50
50
40
Sample Quantiles
Sample Quantiles
40
30
30
20
20
10
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
A commenter
Ajustement d’une loi normale à
un histogramme
On considère que X→N(μ, σ) avec μ = 35,48 et σ = 7,31 (calculés précédemment)
hist(LRo,freq=F)
lines(density(rnorm(1000000,35.48,7.31)))
Histogram of LRo
0.00 0.01 0.02 0.03 0.04 0.05
Density
10 20 30 40 50
LRo
23
3. La théorie de
l’échantillonnage
24
Principe de l’échantillonnage
n,
µ n,
moyenne d’un échantillon
n, de taille n
Population de taille N
Une VA mesurée : X
n,
Si X → N(μ,σ)
Si on centre et on réduit X X
U
on obtient U → N(0,1) n
4. L’estimation
26
Principe
Estimer les paramètres inconnus d’une population (µ, ) à partir des n observations
d’un échantillon
Estimation ponctuelle : chaque paramètre inconnu est estimé à l’aide d’une valeur
qui est une fonction des n observations
L’espérance µ est estimée par la moyenne arithmétique de l’échantillon
L’écart-type est estimé par son estimateur
27
Estimation par intervalle de confiance de
l’espérance – Cas d’un grand échantillon
N (0, 1)
α = 0,05
1- α = 0,95 1- α
α/2 = 0,025 X
U
α/2 α/2
n
- uα/2 uα/2 U
𝑃 ( − 𝑢𝛼 /2 <𝑈 <𝑢 𝛼/ 2 )=1 −𝛼
( )
¯ −𝜇 Intervalle de confiance de
𝑋
𝑃 −𝑢 𝛼/ 2< <𝑢 𝛼/ 2 =1− 𝛼 l’espérance à 95% pour grands
𝜎 échantillons (n ≥ 30)
(( )
¯√−𝜇
𝑋 𝑛 Si α = 0,05 uα/2= 1,96
𝑃 −𝑢 𝛼/ 2< <𝑢 𝛼/ 2 =1− 𝛼
^
𝜎
^√ 𝑛
𝜎
𝑃 ¯𝑥 −𝑢 𝛼/ 2 . <𝜇<¯𝑥 +𝑢 𝛼/ 2 .
^
𝜎
)
=1 −𝛼
Estimation par intervalle de confiance de
l’espérance – Cas d’un grand échantillon
Pour α=0,05
L’intervalle de confiance est centré sur et à une probabilité de 0,95 (95%) de
recouvrir l’espérance µ de la population
(
𝑃 308 −1,96.
3,17
√ 35
<𝜇< 308+1,96.
3,17
√ 35
=0,95
)
𝑃 ( 306,94 <𝜇<309,05 )=0,95
L’intervalle [306,94; 309,05] a 95% de chance d’englober la valeur de l’espérance µ,
Estimation par intervalle de confiance de
l’espérance – Cas d’un petit échantillon
( )
¯ −𝜇
𝑋
𝑃 −𝑢 𝛼/ 2< <𝑢 𝛼/ 2 =1− 𝛼
𝜎
√𝑛
( )
¯
𝑋 −𝜇
𝑃 −𝑡 𝛼/ 2 < <𝑡 𝛼 /2 =1 −𝛼
^
𝜎
√𝑛
( )
^
𝜎 𝜎^
𝑃 ¯𝑥 −𝑡 𝛼/ 2 . < 𝜇<¯𝑥 +𝑡 𝛼 /2 . =1− 𝛼
√𝑛 √𝑛
L’intervalle de confiance se calcule à l’aide d’une loi de Student à n-1 degrés de liberté,
Exercice
1,49 1,49
𝑃 (247,3 −2,262 <𝜇<247,3+2,262 )=0,95
√10 √ 10
IC : 247,3 1,07
Applications sous R
33
Echantillonnage de la moyenne d’une
variable normale
On constitue, de manière aléatoire, 10 échantillons de 10 individus de la variable X
suivant une loi normale
mu=mean(LRo)
sigma=sqrt(var(Lro)) On tire aléatoirement 10
individus dans une loi
ech1=rnorm(10,mu,sigma)
normale (fonction
ech2=rnorm(10,mu,sigma) rnorm=random normal)
…
ech10=rnorm(10,mu,sigma)
ech11=rnorm(30,mu,sigma)
…
ech20=rnorm(30,mu,sigma)
Tracer les histogrammes des moyennes des 10 échantillons obtenus avec n=10 d’une part
et avec n=30 d’autre part
par(mfrow=c(1,2))
hist(Lmoy10);hist(Lmoy30)
hist(Lmoy10,seq(28,40,1)); hist(Lmoy30,seq(28,40,1))
( 𝜎^
𝑃 ¯𝑥 −𝑢 𝛼/ 2 . <𝜇<¯𝑥 +𝑢 𝛼/ 2 .
√𝑛
𝜎^
√𝑛 )
=1 −𝛼
moyenne
mean(ech11) 34.7829 NB: valeurs différentes pour chacun
erreur type
sd(ech11)/sqrt(length(ech11)) 1.275647
erreur type
sd(ech1)/sqrt(length(ech1)) 3.011974
IC : 33,61 ± 6,81
Le calcul de l’intervalle de confiance peut se faire directement sous R en utilisant la
fonction t.test
Par défaut, R fournit l’intervalle de confiance à 95%
X=c(245,248,250,247,249,247,247,246,246,248)
length(X) 10
mean(X) 247.3
sd(x) 1.494434
39