Vous êtes sur la page 1sur 16

Table des matières

I Chapitre 3 : Les caracteristiques de tendance centrale de dis-


persion et de forme 1
Les caracteristiques de tendance centrale (de position) 1
La moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Le mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
La médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Les quantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
La phi-moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Les caractéristiques de dispersion 8


L’étendue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
L’intervalle interquartile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
L’intervalle interdécile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
L’intervalle intercentile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
La variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
L’écart type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
La seconde écriture de la variance (Formule de Koenig) . . . . . . . . . . . . . . . 9
Le coefficient de variation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
L’écart absolu moyen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
L’écart absolu médian . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Les moments d’une variable statistique . . . . . . . . . . . . . . . . . . . . . . . . 10

Les caractéristiques de forme 11


La mesure de l’asymétrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Le coefficient d’asymétrie de Yule . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Le coefficient d’asymétrie de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . 11
La mesure de l’aplatissement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Première partie
Chapitre 3 : Les caracteristiques de
tendance centrale de dispersion et de
forme
Les caracteristiques de tendance centrale (de position)
Ces caractéristiques permettent d’indiquer la nature globale des données étudiées. Voici
quelques unes

1 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


La moyenne
Soit un échantillons x1 , ..., xn de taille n, la moyenne arithmétique, notée X, pour une série
individualisée, est donnée comme suit :
n
1X
X= xi
n i=1
Exemple 0.1. Soit la série : 10, 11, 15, 16
10 + 11 + 15 + 16
X= = 13
4
Pour une série non individualisée (série groupée), deux cas sont à étudier : le cas discret et
le cas continu.
Cas discret :
La variable X prend des valeurs entières : x1 , x2 , ..., xk ou k est le nombre de modalités et
n1 , n2 , ..., nk les effectifs correspondants.
La moyenne arithmétique X devient,
k k
1X X
X= ni .xi = fi .xi
n i=1 i=1

Exemple 0.2. Soient les notes de 5 étudiants : 10, 11, 11, 15, 16
xi ni n i xi fi f i xi
10 1 10 1/5 10/5 = 2
11 2 22 2/5 22/5 = 4, 4
15 1 15 1/5 15/5 = 3
16 1 16 1/5 16/5 = 3, 2
Pk Pk
5 i=1 ni .xi = 63 1 i=1 fi .xi = 63/5 = 12, 6
On a,
4
1X 1
X= ni .xi = × 63 = 12, 6.
5 i=1 5
Ou bien
4
X
X= fi .xi = 12, 6.
i=1

La moyenne des notes est de 12, 6. Les notes tournent autour de 12, 6.

Cas continu :
La variable X peut prendre n’importe quelle valeur, les observations sont groupées en classes.
On utilise les centres des classes comme valeurs de la variable définie :
xi + xi+1
ci = , i = 1, 2, ..., k.
2
La moyenne arithmétique devient,
k k
1X X
X= ni .ci = fi .ci .
n i=1 i=1

2 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


Exemple 0.3. Soient les notes de 10 étudiants
xi ni ci ci ni fi fi xi
[0, 10[ 6 5 30 0,6 3
[10, 20[ 4 15 60 0,4 6
10 90 1 9
2
1 X 1
X= ni .ci = × 90 = 9.
10 i=1 10
Ou
2
X
X= fi .ci = 9.
i=1

La moyenne des notes est de 9. Les notes tournent autour de 9.

Le mode
Définition 0.1. Le mode d’une distribution statistique, noté Mo, est la valeur de la variable
qui correspond au plus grand effectif ou à la plus grande fréquence.

Pour le cas discret, il suffit de repérer la modalité qui correspond à la plus grande fréquence
ou au plus grand effectif. La valeur du mode dans l’exemple des notes du chapitre 2 est
M o = 10.
Pour le cas continu, il suffit de repérer la classe qui correspond à la plus grande fréquence
ou au plus grand effectif.
Il s’agira de la classe modale. En suite, on détermine le mode en utilisant la méthode des
diagonales donnée par :
fi − fi−1
M o = x i + ai × ,
(fi − fi−1 ) + (fi − fi+1 )
avec
— xi représente la borne inférieure de la classe modale et ai son amplitude.
— fi représente la fréquence de la classe modale.
— fi+1 représente la fréquence de la classe qui suit la classe modale.
— fi−1 représente la fréquence de la classe qui précède la classe modale.
Dans l’exemple des poids de moins de 10 ans. La classe modale est [18; 24[ et le mode est :
0, 4 − 0, 1
M o = 18 + 6 × = 22, 5.
(0, 4 − 0, 1) + (0, 4 − 0, 3)
Ainsi, le poids le plus souvent observé est de 22,5 Kg.

Remarque 0.1. Lorsque les classes n’ont pas les mêmes amplitudes, l’histogramme est
construit à partir des fréquences corrigées (ou effectifs corrigés ou densités). Le calcul du
mode par la méthode des diagonales reste toujours applicable pour la densité ou bien en
remplaçant fi par fic ou ni par nci .

3 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


Figure 1 –

Histogramme des fréquences


0.4

(D2)
0.3
Fréquences

(D1)
0.2
0.1

Mo=22.5
0

0 6 12 18 24 30 36

La médiane
Définition 0.2. La médiane, notée Mé, est la valeur observée de la variable statistique dans
la série d’observation ordonnée (en ordre croissant ou décroissant) qui partage cette série en
deux parties, chacune comporte le même nombre d’observations.

Cas d’une série individualisée :


— Si le nombre d’observation est impair (n = 2m + 1), la médiane est alors parfaitement
déterminée et correspond à l’observation de rang (m + 1) dans la série ordonnée.
— Les notes de statistique de 9 étudiants sont les suivantes : 10, 9, 13, 7, 18, 16, 11, 14,
6. Après ordre croissant on obtient : 6, 7, 9, 10, 11, 13, 14, 16, 18.→ M é = 11.
— Si le nombre d’observations est pair (n = 2m), on choisit par convention la première
valeur centrale (m). Reprenons l’exemple précédent, et supposons qu’on dispose les
notes de 10 étudiant : 10, 9, 13, 7, 18, 16, 11, 14, 6, 19. Après ordre on obtient 6, 7,
9, 10, 11, 13, 14, 16, 18, 19.→ M é = 11 (on choisit la plus petite par convention)
Cas d’une série non individualisée :
La médiane se calcule en utilisant les fréquences cumulées ou les effectifs cumulés pour
déterminer la classe médiane et ensuite la médiane.
Cas discret :

Exemple 0.4. La repartition de 400 familles dans une ville A selon le nombre d’enfants de
moins de 15 ans :

4 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


xi ni fi Fi % Ni %
0 50 0,125 0,125 50
1 30 0,075 0,2 80
2 120 0,3 0,5 200
3 80 0,2 0,7 280
4 70 0,175 0,875 350
5 50 0,125 1 400
Somme 400 1
La médiane est égale à 2, ce qui veut dire que 50 % des familles (ou bien 200 familles) ont
un nombre d’enfants inférieur ou égale à 2.
Exemple 0.5. Considérons maintenant la repartition de 400 familles dans une deuxième
ville B selon le même caractère X : "nombre d’enfant de moins de 15 ans" :
xi ni fi Fi % Ni %
0 60 0,15 0,15 60
1 20 0,05 0,20 80
2 100 0,25 0,45 180
3 120 0,30 0,75 300
4 80 0,20 0,95 380
5 20 0,05 1 400
Somme 400 1
Les valeurs 0,5 et (200 = n2 ) apparaît entre la troisième et la quatrième ligne. La médiane
est égale 3.
Cas continu :
Elle est parfaitement déterminé par :
n
F (M é) = 0, 5 ou bien N (M é) = .
2
— On détermine d’abord la classe médiane.
— Ensuite, on détermine la médiane par la méthode des triangles semblables :
— Si la classe médiane est la classe [xi , xi+1 [ ,
0, 5 − Fi−1
M é = xi + ai × .
fi
Exemple 0.6. Reprenons l’exemple des poids des enfants de moins de 10 ans :
Classes ni fi F i %
[6, 12[ 30 0,2 0,2
[12, 18[ 15 0,1 0,3
[18, 24[ 60 0,4 0,7
[24, 30[ 45 0,3 1
150 1
— La valeur 0,5 apparait entre la deuxième et la troisième).
— La classe médiane est : [18; 24[.
0, 5 − 0, 3
M é = 18 + 6 × = 21
0, 4
— 50% des enfants ont un poids inférieur à 21 kg.

5 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


Les quantiles
Les quantiles sont les valeurs de la variable qui partage la série ordonnée en q parties égales.
— Si q = 4, les quantiles sont appelés quartiles. On a 3 quartiles : Q1 , Q2 , et Q3 .
— Si q = 10, les quantiles sont appelés déciles. On a 9 déciles : D1 , D2 , ..., D9 .
— Si q = 100 =⇒ C1 , C2 , ..., C99 .(centiles)
— La formule pour le cas continu une fois la classe du quantile déterminer est

%α − Fi−1
Qα = xi + ai × .
fi
Exemple 0.7. On considère la distribution des tailles, mesurées en cm, de 1000 personnes :
Classes ni fi Fi % Ni %
[150; 154[ 10 0,01 0,01 10
[154; 158[ 30 0,03 0,04 40
[158; 162[ 100 0,1 0,14 140
[162; 166[ 230 0,23 0,37 370
[166, 170[ 250 0,25 0,62 620
[170; 174[ 220 0,22 0,84 840
[174, 178[ 120 0,12 0,96 960
[178, 182[ 40 0,04 1 1000
 
Le premier quartile : Q1 ∈ [162, 166[ : Q1 = 162 + 4 × 0,25−0,14
0,23
= 163, 913
=⇒ 25% des individus ont une taille inférieure à 163,913  cm 
Le deuxième quartile : Q2 ∈ [166, 170[ : Q1 = 166 + 4 × 0,5−0,370,25
= 168, 08
=⇒ 50% des individus ont une taille inférieure
 à 168,08 cm
Le troisième quartile : Q1 = 170 + 4 × 0,75−0,62
0,22
= 172, 364
=⇒ 75% des individus ont une taille inférieure à 172,364
 cm
0,1−0,04
Le premier décile : D1 ∈ [158, 162[ : Q1 = 158 + 4 × 0,1
= 160, 4
=⇒ 10% des individus ont une taille inférieure à 160,4 cm 
Le neuvième décile : D9 ∈ [174, 178[ : D1 = 174 + 4 × 0,9−0,84
0,12
= 176
=⇒ 90% des individus ont une taille inférieure à 176 cm (ou encore 10% des individus ont
une taille supérieure ou égale à 176 cm)

La phi-moyenne
— La phi-moyenne d’une variable statistique X, que l’on note Mϕ . La quantité suivante :
k
X
ϕ(Mϕ ) = fi ϕ(xi )
i=1

où ϕ est une fonction monotone, et k représente le nombre de modalités de la variable


statistique. Lorsque la fonction ϕ est la fonction identité : ϕ (x) = x, Mϕ représente la
moyenne arithmétique X.

ϕ (xi ) = xi ; ∀i = 1, 2, ..., k
k
X
ϕ(Mϕ ) = Mϕ = fi xi = X.
i=1

6 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


Remarque 0.2. La moyenne arithmétique individualisée est :
n
1X
X= xi .
n i=1
— Lorsque la fonction ϕ est la fonction : ϕ (x) = x2 , Mϕ représente la moyenne quadra-
tique, notée Q.

ϕ (xi ) = x2i ; ∀i = 1, 2, ..., k


=⇒
k
ϕ(Mϕ ) = Mϕ2 = fi x2i
X

i=1
v
u k
uX
2
Mϕ = Q = t f i xi .
i=1
Remarque 0.3. La moyenne quadratique individualisée est :
v
n
1 uX
u
Q = t x2i
n i=1

— Lorsque la fonction ϕ est la fonction : ϕ (x) = log(x), Mϕ représente la moyenne


géométrique, notée G.

ϕ (xi ) = log(xi ); ∀i = 1, 2, ..., k


On peut démontrer que,
k
fi
xi = xf11 × ... × xfkk .
Y
Mϕ = G =
i=1

Remarque 0.4. La moyenne quadratique individualisée est :


v
u n
uY
G= n
t x i.
i=1

— Lorsque la fonction ϕ est la fonction : ϕ (x) = 1/x, Mϕ représente la moyenne har-


monique, notée H.
1
ϕ (xi ) = ; ∀i = 1, 2, ..., k
xi
On peut démontrer que,
1
Mϕ = H = k
.
P fi
xi
i=1
Remarque 0.5. La moyenne harmonique individualisée est :
1
H= P
n .
1
xi
i=1

7 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


Les caractéristiques de dispersion
Ces caractéristiques permettent d’indiquer le degres de dispersion ou d’éparpillement des
données étudiées. Voici quelques unes :

L’étendue

E = xmax − xmin

L’intervalle interquartile

IIQ = Q3 − Q1
50% des observations sont considérées.

L’intervalle interdécile

IID = D9 − D1
80% des observations sont considérées.

L’intervalle intercentile

IIC = C99 − C1
98% des observations sont considérées.

La variance
La variance d’une variable statistique X, notée V (X), est la moyenne arithmétique des carrés
des écarts à la moyenne arithmétique :
k k
1X  2 X  2
V (X) = n i xi − X = f i xi − X .
n i=1 i=1

La variance simple (non pondérée) est donnée par


n 
1X 2
V (X) = xi − X .
n i=1

L’écart type
q
σ(X) = V (X)

8 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


La seconde écriture de la variance (Formule de Koenig)

k k
1X  2 X  2
V (X) = n i xi − X = f i xi − X
n i=1 i=1

k k k k
2 2
 
fi x2i − 2xi X + X fi x2i − 2
X X X X
= = f i xi + fi X
i=1 i=1 i=1 i=1
k k k k
2X 2
fi x2i − 2X fi x2i − 2X × X + X
X X X
= f i xi + X fi =
i=1 i=1 i=1 i=1
k
2
fi x2i − X
X
=
i=1

Le coefficient de variation

σ(X)
CV (X) =
X

L’écart absolu moyen

5
X
eM = fi xi − X = 100, 265
i=1

L’écart absolu médian

k
X
eM é = fi |xi − M é|
i=1

Exemple 0.8. Taux de Glycémie dans un groupe de 140 personnes


   2
Classe mg/l xi = ci ni fi f i xi xi − X fi x i − X
[800, 1000[ 900 26 0,186 167,143 -202,857 7642,332
[1000, 1100[ 1050 33 0,236 247,500 -52,857 658,557
[1100, 1200[ 1150 64 0,457 525,714 47,143 1015,977
[1200, 1300[ 1250 7 0,050 62,500 147,143 1082,551
[1300, 1500[ 1400 10 0,071 100,000 297,143 6306,706
Somme 140 1 1102,857 16706,122
La moyenne arithmétique est :
5
X
X= fi xi = 1102, 857.
i=1

La variance est :
5
X  2
V (X) = f i xi − X = 16706, 122.
i=1

9 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


L’écart type est : q
σ(X) = V (X) = 129, 252.

Les moments d’une variable statistique


Le moment d’ordre r d’une variable statistique X, noté Mr (X), par rapport à une valeur
quelconque a, est définit par l’expression suivante :
k
fi (xi − a)r , r = 0, 1, 2, 3, ..., n.
X
Mr (X) =
i=1
— Lorsque a = 0, on obtient ce qu’on appelle les moments simples d’ordre r, notés
mr (X) :
k
fi xri , r = 0, 1, 2, 3, ..., n.
X
mr (X) =
i=1
Dans ce cas, le moment simple d’ordre 1 correspond à la moyenne arithmétique :
k
X
m1 (X) = f i xi .
i=1

— Lorsque a = X, on obtient ce qu’on appelle les moments centrés d’ordre r, notés


µr (X) :
k
fi (xi − X)r , r = 0, 1, 2, 3, ..., n.
X
µr (X) =
i=1
— Pour r = 2, le moment centré d’ordre 2 s’écrit :
k
fi (xi − X)2 = V (X).
X
µ2 (X) =
i=1

On peut l’exprimer en fonction des moments simples comme suit :


k
2
fi xi − X = m2 (X) − m21 (X).
X
µ2 (X) =
i=1

— Pour r = 3, le moment centré d’ordre 3 est :


k
fi (xi − X)3 .
X
µ3 (X) =
i=1

On a aussi :
µ3 (X) = m3 (X) − 3m1 (X)m2 (X) + 2m31 (X).
— Pour r = 4, le moment centré d’ordre 4 est :
k
fi (xi − X)4 .
X
µ4 (X) =
i=1

µ4 (X) = m4 (X) − 4m1 (X)m3 (X) + 6m21 (X)m2 (X) − 2m41 (X).

10 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


Les caractéristiques de forme
Les caractéristiques de forme permettent d’indiquer l’allure globale de la distribution des
données étudiée.

La mesure de l’asymétrie
Définition 0.3. Une distribution est symétrique si les valeurs de la variable statistique sont
également dispersées de part et d’autre de la moyenne. Dans une distribution parfaitement
symétrique, la moyenne, le mode et la médiane sont confondus :

M o = M é = X

Définition 0.4. Une distribution est asymétrique à gauche si les valeurs de la variable
statistique sont étalées à droite
Définition 0.5. Une distribution est asymétrique à droite si les valeurs de la variable sta-
tistique sont étalées à gauche

Le coefficient d’asymétrie de Yule

(Q3 − Q2 ) − (Q2 − Q1 )
s=
(Q3 − Q1 )
— Si s = 0, les quartiles sont équidistants et la distribution est symétrique.
— Si s > 0, la distribution est asymétrique à gauche étalée vers la droite.
— Si s < 0, la distribution est asymétrique à droite étalée vers la gauche.
Asymétrique à gauche

Le coefficient d’asymétrie de Fisher

µ3 (X)
γ1 (X) = 3/2
avec µ2 (X) 6= 0
µ2 (X)
— Si µ3 (X) = 0, alors γ1 (X) = 0 → la distribution est symétrique.
— Si µ3 (X) > 0, alors γ1 (X) > 0 →la distribution est asymétrique à gauche étalée vers
la droite.
— Si µ3 (X) < 0, alors γ1 (X) < 0 →la distribution est asymétrique à droite étalée vers
la gauche.

La mesure de l’aplatissement
Définition 0.6. Une distribution est plus au moins aplatie selon que les fréquences des
valeurs voisines, des valeurs centrales diffèrent peu ou beaucoup les unes par rapport aux
autres
La logique est de comparer si la distribution est plus ou moins aplatie par rapport à la courbe
de Gauss-Laplace de même moyenne et de même écart-type.

11 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


x

Figure 2 – Asymétrique à droite

12 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


Figure 3 – Asymétrique à gauche

13 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


Figure 4 – Asymétrique à gauche
0.15
0.10
0.05
0.00

0 5 10 15 20

14 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


Définition 0.7. La courbe d’une distribution est une courbe Leptokurtique lorqu’elle est
moins aplatie (plus ainguë, moins plate) que celle de la loi normale. Dans ce cas, les obser-
vations sont plutôt concentrées autour de la moyenne.

Définition 0.8. La courbe d’une distribution est une courbe Platikurtique lorsqu’elle est plus
aplatie (moins aiguë, plus plate) qu’une courbe normale. Dans ce cas, les observations sont
plutôt éloignées de la moyenne.

Le coefficient d’aplatissement de Fisher

µ4 (X)
γ2 (X) = − 3 avec µ2 (X) 6= 0
µ22 (X)
— Si γ1 (X) = 0 → la distribution est normale.
— Si γ1 (X) < 0 → la distribution est Platikurtique.
— Si γ1 (X) > 0 → la distribution est Leptokurtique.

Figure 5 – Leptokurtik

15 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA


Figure 6 – Platikurtik

16 Faculté de Médecine (UCAD) : Pr Ag B.NDONG, Dr M.C.HAIDARA

Vous aimerez peut-être aussi