Académique Documents
Professionnel Documents
Culture Documents
Hammadi Achour
ISPT
17 février 2020
Plan
1. Représentation graphique de la distribution d’une variable
continue
2. Densité de probabilité
3. La distribution normale
4. Propriétés d’une distribution normale
5. La loi normale centrée réduite
Prérequis
Variable quantitative continue
Graphique de représentation de données
Paramètres descriptifs d’une série (position, dispersion etc.)
34.0 32.7 31.4 31.9 30.2 34.4 30.2 31.6 33.7 31.5
32.1 35.8 31.4 30.3 35.4 30.9 34.8 34.7 35.1 34.7
29.4 34.6 34.7 30.7 29.1 32.8 34.9 34.9 36.7 32.4
0.25
6
0.20
Fréquence (f )
0.10
p(x)=0.17
2
0.05
0
0.00
26 28 30 32 34
0.25
26 28 30 32 34
x
x
densité de probabilité f(x)=p(x)/a
Densité de fréque,ce relative (f(x)
0.20
la surface C
f(x)=0.17
A
B
0.05
P(a<X<b)
P(X<a) P(X>b)
a
0.00
26
a 28 30 32
b 34
densité de probabilité de X
densité de probabilité de X
2.5% 2.5%
-2 sigma u 2 sigma X
95% des valeurs sont comprises entre
-2 sigma et +2 sigma
2.5% des valeurs sont >u +2sigma
50% 50% 2.5% des valeurs sint <u-2 sigma
u=moyenne X
Exemple
Soit la série statistique X suivante : (14.1, 15.8, 17.5, 8.1, 16,2, 17.3). Le
centrage réduction de cette série consiste à calculer :
Xi − µ
Z=
σ
ce qui donne la série X’ suivante : (-0.87, 1.0, -0.3, 0.05, 1.3, -1.2) avec
ν = 0 et σ = 1
2.5%
2.5%
-2 -1.96 -1 0 1 1.96 2
Commandes R
pnorm(1.5, mean = 0, sd = 1, lower.tail = TRUE)
La probabilité que Z soit < à 1.5 = 0.9331928
pnorm(1.5, mean = 0, sd = 1, lower.tail = FALSE) La probabilité que
Z soit > à 1.5 = 0.0668072
2 * pnorm(1.5, lower.tail = FALSE)
La probabilité que la |Z| soit > à 1.65 = 0.1336144
Hammadi Achour (ISPT) Statistique 17 février 2020 10 / 30
Les tests statistiques
Plan
1. Principe des tests statistiques
Exemples introductifs
Étapes de formulation d’un test d’hypothèse
2. Comparaison de 2 moyennes (grands échantillons n ≥ 30)
Comparaison d’une moyenne observée à une moyenne théorique
Comparaison de deux moyennes / Échantillons indépendants
Comparaison de deux moyennes / Échantillons appariés
Les tests d’hypothèse, quels que soient leurs types, se formulent de la même
façon :
On se pose une question
Le nouveau traitement est-il plus efficace que le traitement
classique ?
On pose l’hypothèse nulle H0 et l’hypothèse alternative H1
H0 : Le traitement classique et le nouveau traitement ont la même
efficacité.
H1 : Les deux traitements ont des efficacités différentes.
On fixe un seuil de signification α à ne pas dépasser pour rejeter
l’hypothèse nulle (le risque standard est égal à 5%).
Apha = 5%
2.5% 2.5%
X
-1.96 0 1.96
Pour savoir si la différence est significative, il faut tout d’abord lire dans la
table t, la valeur critique correspondant au risque alpha = 5% pour un degré
de liberté : d.d.l = n − 1.
Si la valeur absolue de t (|t|) est > à la valeur critique W , alors la différence est
significative. Dans le cas contraire, elle ne l’est pas.
debout 20.4 25.4 25.6 25.6 26.6 28.6 28.7 29.0 29.8 30.5 30.9
abattu 21.7 26.3 26.8 28.1 26.2 27.3 29.5 32.0 30.9 32.3 32.3
Solution
debout <- c(20.4,25.4,25.6,25.6,26.6,28.6,28.7,29.0,29.8,30.5,30.9)
abattu <- c(21.7,26.3,26.8,28.1,26.2,27.3,29.5,32.0,30.9,32.3,32.3)
shapiro.test(debout)# vérification de la normalité
W = 0.89693, p-value = 0.169 # p-value>0.05 ; distribution normale
shapiro.test(abattu)# vérification de la normalité
W = 0.91728, p-value = 0.2966 # p-value>0.05 ; distribution normale
Hammadi Achour (ISPT) Statistique 17 février 2020 24 / 30
Test de Student pour séries appariées
28
24
debout
20
Theoretical Quantiles
30
26
abattu
22
S 2 est la variance commune des 2 groupes. Elle est calculée par la formule
suivante :
(x − mA )2 + (x − mB )2
P P
2
S =
nA + nB − 2
Solution
mâle <- c(120, 107, 110, 116, 114, 111, 113, 117, 114, 112)
femelle <- c(110, 111, 107, 108, 110, 105, 107, 106, 111, 111)
On range les données dans le tableau chac et on ajoute une variable qualitative
binaire pour noter le sexe des individus.
mâch <- c(mâle, femelle)
chac <- data.frame(mâch)
chac$plan <- gl(n = 2, k = 10, lab = c(”mâle”, ”femelle”))
head(chac)
moy <- with(chac, tapply(mâch, plan, mean))
par(mfrow = c(1, 2))
Hammadi Achour (ISPT) Statistique 17 février 2020 28 / 30
Test de Student pour échantillons indépendants
with(chac, dotchart(mâch, groups = plan, gdata = moy, gpch = 19, xlab = ”Mâchoire
[mm]”))
boxplot(mâch∼plan, chac,col = c(”lightblue”, ”pink”), notch = TRUE, las = 1,ylab
= ”Mâchoire [mm]”)
mâle 120
115
Mâchoire [mm]
femelle
110
105
Mâchoire [mm]
On constate que la mâchoire des mâles est en moyenne plus longue que celle des
femelles. Les encoches des boites à moustaches nous indiquent que l’on est à la limite
de la significativité. Un test d’hypothèse serait le bienvenu.
Hammadi Achour (ISPT) Statistique 17 février 2020 29 / 30
Test de Student pour échantillons indépendants