Académique Documents
Professionnel Documents
Culture Documents
Première partie
Chapitre 3 : Les caracteristiques de
tendance centrale de dispersion et de
forme
Les caracteristiques de tendance centrale (de position)
Ces caractéristiques permettent d’indiquer la nature globale des données étudiées. Voici
quelques unes
Exemple 0.2. Soient les notes de 5 étudiants : 10, 11, 11, 15, 16
xi ni n i xi fi f i xi
10 1 10 1/5 10/5 = 2
11 2 22 2/5 22/5 = 4, 4
15 1 15 1/5 15/5 = 3
16 1 16 1/5 16/5 = 3, 2
Pk Pk
5 i=1 ni .xi = 63 1 i=1 fi .xi = 63/5 = 12, 6
On a,
4
1X 1
X= ni .xi = × 63 = 12, 6.
5 i=1 5
Ou bien
4
X
X= fi .xi = 12, 6.
i=1
La moyenne des notes est de 12, 6. Les notes tournent autour de 12, 6.
Cas continu :
La variable X peut prendre n’importe quelle valeur, les observations sont groupées en classes.
On utilise les centres des classes comme valeurs de la variable définie :
xi + xi+1
ci = , i = 1, 2, ..., k.
2
La moyenne arithmétique devient,
k k
1X X
X= ni .ci = fi .ci .
n i=1 i=1
Le mode
Définition 0.1. Le mode d’une distribution statistique, noté Mo, est la valeur de la variable
qui correspond au plus grand effectif ou à la plus grande fréquence.
Pour le cas discret, il suffit de repérer la modalité qui correspond à la plus grande fréquence
ou au plus grand effectif. La valeur du mode dans l’exemple des notes du chapitre 2 est
M o = 10.
Pour le cas continu, il suffit de repérer la classe qui correspond à la plus grande fréquence
ou au plus grand effectif.
Il s’agira de la classe modale. En suite, on détermine le mode en utilisant la méthode des
diagonales donnée par :
fi − fi−1
M o = x i + ai × ,
(fi − fi−1 ) + (fi − fi+1 )
avec
— xi représente la borne inférieure de la classe modale et ai son amplitude.
— fi représente la fréquence de la classe modale.
— fi+1 représente la fréquence de la classe qui suit la classe modale.
— fi−1 représente la fréquence de la classe qui précède la classe modale.
Dans l’exemple des poids de moins de 10 ans. La classe modale est [18; 24[ et le mode est :
0, 4 − 0, 1
M o = 18 + 6 × = 22, 5.
(0, 4 − 0, 1) + (0, 4 − 0, 3)
Ainsi, le poids le plus souvent observé est de 22,5 Kg.
Remarque 0.1. Lorsque les classes n’ont pas les mêmes amplitudes, l’histogramme est
construit à partir des fréquences corrigées (ou effectifs corrigés ou densités). Le calcul du
mode par la méthode des diagonales reste toujours applicable pour la densité ou bien en
remplaçant fi par fic ou ni par nci .
(D2)
0.3
Fréquences
(D1)
0.2
0.1
Mo=22.5
0
0 6 12 18 24 30 36
La médiane
Définition 0.2. La médiane, notée Mé, est la valeur observée de la variable statistique dans
la série d’observation ordonnée (en ordre croissant ou décroissant) qui partage cette série en
deux parties, chacune comporte le même nombre d’observations.
Exemple 0.4. La repartition de 400 familles dans une ville A selon le nombre d’enfants de
moins de 15 ans :
%α − Fi−1
Qα = xi + ai × .
fi
Exemple 0.7. On considère la distribution des tailles, mesurées en cm, de 1000 personnes :
Classes ni fi Fi % Ni %
[150; 154[ 10 0,01 0,01 10
[154; 158[ 30 0,03 0,04 40
[158; 162[ 100 0,1 0,14 140
[162; 166[ 230 0,23 0,37 370
[166, 170[ 250 0,25 0,62 620
[170; 174[ 220 0,22 0,84 840
[174, 178[ 120 0,12 0,96 960
[178, 182[ 40 0,04 1 1000
Le premier quartile : Q1 ∈ [162, 166[ : Q1 = 162 + 4 × 0,25−0,14
0,23
= 163, 913
=⇒ 25% des individus ont une taille inférieure à 163,913 cm
Le deuxième quartile : Q2 ∈ [166, 170[ : Q1 = 166 + 4 × 0,5−0,370,25
= 168, 08
=⇒ 50% des individus ont une taille inférieure
à 168,08 cm
Le troisième quartile : Q1 = 170 + 4 × 0,75−0,62
0,22
= 172, 364
=⇒ 75% des individus ont une taille inférieure à 172,364
cm
0,1−0,04
Le premier décile : D1 ∈ [158, 162[ : Q1 = 158 + 4 × 0,1
= 160, 4
=⇒ 10% des individus ont une taille inférieure à 160,4 cm
Le neuvième décile : D9 ∈ [174, 178[ : D1 = 174 + 4 × 0,9−0,84
0,12
= 176
=⇒ 90% des individus ont une taille inférieure à 176 cm (ou encore 10% des individus ont
une taille supérieure ou égale à 176 cm)
La phi-moyenne
— La phi-moyenne d’une variable statistique X, que l’on note Mϕ . La quantité suivante :
k
X
ϕ(Mϕ ) = fi ϕ(xi )
i=1
i=1
v
u k
uX
2
Mϕ = Q = t f i xi .
i=1
Remarque 0.3. La moyenne quadratique individualisée est :
v
n
1 uX
u
Q = t x2i
n i=1
L’étendue
E = xmax − xmin
L’intervalle interquartile
IIQ = Q3 − Q1
50% des observations sont considérées.
L’intervalle interdécile
IID = D9 − D1
80% des observations sont considérées.
L’intervalle intercentile
IIC = C99 − C1
98% des observations sont considérées.
La variance
La variance d’une variable statistique X, notée V (X), est la moyenne arithmétique des carrés
des écarts à la moyenne arithmétique :
k k
1X 2 X 2
V (X) = n i xi − X = f i xi − X .
n i=1 i=1
L’écart type
q
σ(X) = V (X)
k k
1X 2 X 2
V (X) = n i xi − X = f i xi − X
n i=1 i=1
k k k k
2 2
fi x2i − 2xi X + X fi x2i − 2
X X X X
= = f i xi + fi X
i=1 i=1 i=1 i=1
k k k k
2X 2
fi x2i − 2X fi x2i − 2X × X + X
X X X
= f i xi + X fi =
i=1 i=1 i=1 i=1
k
2
fi x2i − X
X
=
i=1
Le coefficient de variation
σ(X)
CV (X) =
X
5
X
eM = fi xi − X = 100, 265
i=1
k
X
eM é = fi |xi − M é|
i=1
La variance est :
5
X 2
V (X) = f i xi − X = 16706, 122.
i=1
On a aussi :
µ3 (X) = m3 (X) − 3m1 (X)m2 (X) + 2m31 (X).
— Pour r = 4, le moment centré d’ordre 4 est :
k
fi (xi − X)4 .
X
µ4 (X) =
i=1
µ4 (X) = m4 (X) − 4m1 (X)m3 (X) + 6m21 (X)m2 (X) − 2m41 (X).
La mesure de l’asymétrie
Définition 0.3. Une distribution est symétrique si les valeurs de la variable statistique sont
également dispersées de part et d’autre de la moyenne. Dans une distribution parfaitement
symétrique, la moyenne, le mode et la médiane sont confondus :
M o = M é = X
Définition 0.4. Une distribution est asymétrique à gauche si les valeurs de la variable
statistique sont étalées à droite
Définition 0.5. Une distribution est asymétrique à droite si les valeurs de la variable sta-
tistique sont étalées à gauche
(Q3 − Q2 ) − (Q2 − Q1 )
s=
(Q3 − Q1 )
— Si s = 0, les quartiles sont équidistants et la distribution est symétrique.
— Si s > 0, la distribution est asymétrique à gauche étalée vers la droite.
— Si s < 0, la distribution est asymétrique à droite étalée vers la gauche.
Asymétrique à gauche
µ3 (X)
γ1 (X) = 3/2
avec µ2 (X) 6= 0
µ2 (X)
— Si µ3 (X) = 0, alors γ1 (X) = 0 → la distribution est symétrique.
— Si µ3 (X) > 0, alors γ1 (X) > 0 →la distribution est asymétrique à gauche étalée vers
la droite.
— Si µ3 (X) < 0, alors γ1 (X) < 0 →la distribution est asymétrique à droite étalée vers
la gauche.
La mesure de l’aplatissement
Définition 0.6. Une distribution est plus au moins aplatie selon que les fréquences des
valeurs voisines, des valeurs centrales diffèrent peu ou beaucoup les unes par rapport aux
autres
La logique est de comparer si la distribution est plus ou moins aplatie par rapport à la courbe
de Gauss-Laplace de même moyenne et de même écart-type.
0 5 10 15 20
Définition 0.8. La courbe d’une distribution est une courbe Platikurtique lorsqu’elle est plus
aplatie (moins aiguë, plus plate) qu’une courbe normale. Dans ce cas, les observations sont
plutôt éloignées de la moyenne.
µ4 (X)
γ2 (X) = − 3 avec µ2 (X) 6= 0
µ22 (X)
— Si γ1 (X) = 0 → la distribution est normale.
— Si γ1 (X) < 0 → la distribution est Platikurtique.
— Si γ1 (X) > 0 → la distribution est Leptokurtique.
Figure 5 – Leptokurtik