Vous êtes sur la page 1sur 20

Chapitre 3:

Les caractéristiques d’une distribution statistique

Partie I : Calcul des Moyennes ; Mode, Médiane, quantiles

3.1 Les caractéristiques de position ou de tendance centrale :


3.1.1. Généralités :
Synthétiser l’information contenue dans un tableau par un graphique est la première étape réalisée en
statistique. Par la suite, on cherche à synthétiser encore plus l’information en la réduisant à une seule valeur
numérique. Les caractéristiques de tendance centrale essayent de donner la plus représentative d’un ensemble
de valeurs numériques.
Remarque : Les paramètres définis par la suite n’ont de sens que pour les variables quantitatives.
3.1.2. Les moyennes :
La moyenne arithmétique simple :
Elle se note : X (se lit X barre).

1
Cas d’une série statistique de n observations.
Soit x1 ; x2 ; x3 ; … ; xN
La moyenne arithmétique simple :
N
1
x
1
X = i = ( x1  x2  x3  ...  x N )
N i 1 N

Exemple : Etant donné les observations suivantes :


2 – 7 – 3 – 8 – 4 – 12 .
2  7  3  8  4  12 36
La moyenne arithmétique simple est : X = = =6
6 6

Cas d’une variable statistique discrète :


La moyenne arithmétique simple est :
N

 n .x i i
n1 . x1  n2 . x2  n3 . x3 ... N
X = i 1
= =  f i . xi
N N i 1

Cas d’une variable continue groupée par classe :


La moyenne arithmétique simple est :
X =  n .c
i i
  f i .ci
N
ci : centre de la classe i
ni : effectif correspondant à la classe i.

2
Exemple : Soit la série statistique suivante :
Classes Effectifs
[10 – 20[ 20
[20 – 30[ 30
[30 – 40[ 40
[40 – 50[ 10
Total 100
Calculer la moyenne de cette distribution
Solution :
Classes Effectifs (ni) Fréquences (fi) Centres (ci) fi*ci
[10 – 20[ 20 0,2 15 3
[20 – 30[ 30 0,3 25 7,5
[30 – 40[ 40 0,4 35 14
[40 – 50[ 10 0,1 45 4,5
Total 100 1 X =  f .c
i i  29

3.1.3. Le mode:
Le mode est la valeur particulière de la variable pour laquelle l’effectif est le plus élevé.

3
Cas d’une variable discrète :
Exemple : Lors d’un sondage d’un échantillon de 1000 ménages sur le nombre de pièces de leurs logements la
répartition a été comme suit :
Nombre Effectifs
de pièces (xi) (ni)
1 127
2 273
3 296
4 166
5 et plus 138

La variable qui correspond à l’effectif le plus élevé 296 est x = 3 pièces.


On dit que les 3 pièces est le mode ou la valeur dominante.On dit aussi que ce type de logement est le plus
fréquent.
3.1.3.1 Cas d’une variable continue
3.1.3.1.1. Classes de même amplitude.
On parle de classe modale qui est la classe qui correspond à l’effectif le plus élevé. Il est fortement conseillé
d'utiliser l'histogramme pour déterminer le mode. Comme pour le cas discret, on peut avoir deux classes
modales. Toutes les valeurs de la classe pouvant à priori se réaliser, on ne se contentera pas de déterminer la
classe modale. Une des valeurs de cette classe sera le mode

4
Certains auteurs préconisent par simplicité de prendre pour valeur du mode le centre de la classe modale.
Cependant il préférable de tenir compte des classes voisines de la classe modale de la manière suivante : Le
mode est alors l’abscisse qui correspond à l’intersection des segments AB et CD.
a) Détermination graphique du mode
ni

A D
B d2
d1
C

L1 Mo L2 Xi

On démontre que l’expression analytique du mode est la suivante :


d1
Mo = L1 + (L2 – L1)
d1  d 2

L1 : borne inférieure de la classe modale .


L2 : borne supérieure de la classe modale .
d1 : la différence des effectifs de la classe modale et la classe précédente .
d2 : la différence des effectifs de la classe modale et la classe suivante .

5
Exemple : Soit la série statistique suivante :
Classes Effectifs
[10 – 20[ 20
[20 – 30[ 30
[30 – 40[ 40
[40 – 50[ 10
Total 100
b) Déterminons graphiquement le mode Mo :
Traçons l’histogramme de cette série :
45
40
35 d1
30
25 O d2
20
15
10
5
0
[10 – 20[ [20 – 30[ [30 – 40[ [40 – 50[
L1 L2
Classes Mo=32,5

6
a) Appliquons la formule théorique du mode Mo :
d1
Mo = L1 + (L2 – L1)
d1  d 2

La classe qui correspond à l’effectif le plus élevé est [30 – 40[ .


C’est la classe modale. Donc L1 = 30 ; L2 = 40 et L2 – L1 = 10
d1 = 40 – 30 = 10 ; d2 = 40 – 10 = 30
10
Soit Mo = 30 +  10 = 32,5
10  30

3.1.3.1.2. Classes d’amplitudes différentes.


Même démarche que précédemment à condition de rectifier les effectifs pour le traçage de
l’histogramme correspondant.

Conclusions : La détermination du mode est immédiate .Sa signification est évidente car il est
intéressant de connaître la valeur de la variable qui revient le plus souvent au cours des observations.
Lorsque la série statistique présente plusieurs modes, le mode perd alors toute signification. Il est rejeté
comme mesure de tendance centrale.

3.1.4. La médiane:
C'est la valeur de la variable qui sépare les observations en deux groupes d'effectifs égaux.

7
3.1.4.1 Cas d’une variable discrète
3.1.4.1.1 Détermination graphique de la médiane :
Il est encore plus facile de lire sur les graphiques cumulatifs les abscisses des points d'ordonnée n/2 (effectif
cumulé) ou ½ (fréquence cumulée). Si tout un intervalle a pour image n/2 (½ pour la fréquence), on parlera
d'intervalle médian (on peut prendre le milieu de l'intervalle comme médiane)
1 1

0.5
0.5

Médiane Intervalle médian


3.1.4.1.2. Détermination de la médiane par le calcul :
Pour déterminer la médiane Me il faut :
1) Ranger en ordre croissant ou décroissant les variables de la série statistique.
2) Examiner la parité de la série :

8
- Si le nombre n d’observations est impair (n = 2p + 1), alors la médiane correspond à la (p + 1) ème
observation.
Me = xp+1
- Si le nombre n d’observations est pair (n = 2p), il existe un intervalle médian [x p – xp+1[ .On prend
généralement la moyenne arithmétique de la pème et la (p+1)ème observation .
x p  x p 1
Me =
2

Exemples : Les données suivantes représentent les notes de 11 élèves lors d’un examen :
7 – 9 – 8 – 14 – 16 – 8 –14 – 16 – 13 – 7 – 12.
Pour déterminer la médiane de cette série on doit d’abord la ranger en ordre.
Classons ces notes par ordre croissant :
7 – 7 – 8 – 8 – 9 – 12 – 13 – 14 – 14 – 16 – 16 .
Le nombre d’observations étant égal à 11 donc impair : 11 = 2p + 1  p = 5
et la médiane correspond à la (5 + 1)ème soit la 6ème observation .
Sur la série Me = 12.
Cela veut dire que 5 élèves ont une note inférieure à la médiane Me = 12 et 5 élèves ont une note supérieure à la
médiane à Me = 12.
Si l’effectif des élèves était pair et égal à 12 par exemple, soit :
7 – 9 – 8 – 14 – 16 – 8 – 14 – 16 – 13 – 7 – 12 – 10.

9
On classe ces notes par ordre croissant :
7 – 7 – 8 – 8 – 9 – 10 – 12 – 13 – 14 – 14 – 16 – 16 .
Le nombre d’observations étant pair : n = 2p  p = 6, donc la médiane correspond à la moyenne arithmétique de
la 6e et la 7e observation.
10  11
Soit Me = = 10,5.
2

On conclut que le nombre d’élèves ayant une note inférieure à la médiane est égal au nombre d’élèves ayant une
note supérieure à la médiane Me = 10,5 .
Remarque : Si les notes se présentaient après classement comme suit :
6 – 7 – 7 – 8 – 9 – 10 – 10 – 10 – 10 – 10 – 13 – 14 .
Ici pas de médiane ; en effet l’équipartition de la série n’est pas plus réalisée du fait que 5 notes sont inférieures
à 10 et 2 notes seulement lui sont supérieures.
On peut conclure que, lorsque la variable statistique est discrète, il n’y a pas en général de valeur médiane.

3.1.4.2. Cas d’une variable continue


Lorsque les données sont groupées par classes, deux manières pour déterminer la médiane sont possibles.
- Détermination graphique
- Détermination par le calcul

10
3.1.4.2.1. Détermination graphique de la médiane :
A partir du tableau statistique élaboré on trace la courbe des effectifs cumulés croissants (ECC) qui est
obtenue en joignant par des segments de droites les coordonnées des points ayant pour abscisses les bornes
supérieures des classes et pour ordonnées les effectifs cumulés correspondants.
Sur cette courbe on peut déterminer graphiquement la médiane Me qui a pour valeur l’abscisse du point
d’ordonnée la moitié de l’effectif total (n/2).

Exemple : Un sondage a été effectué auprès de 68 personnes sur le temps qu’ils ont passé devant la télévision
un soir. Les résultats sont groupés comme suit :

11
Classes Effectifs
(mn) (ni)
[0 – 15[ 14
[15 – 30[ 10
[30 – 60[ 16
[60 – 120[ 20
[120 – 180[ 8
Total 68
On dresse un tableau sur lequel sont représentées les colonnes des fréquences cumulées croissantes et
décroissantes.
Classes xi Effectifs Fréquences Fréquences cumulés Fréquences cumulés
(mn) (ni) relatives (fi) croissants (Fi ) croissants (Fi )
[0 – 15[ 14 0,206 0,206 1
[15 – 30[ 10 0,147 0,353 0,794
[30 – 60[ 16 0,236 0,589 0,558
[60 – 120[ 20 0,294 0,883 0,264
[120 – 180[ 8 0,118 1 0,146
Total 68 - -
On trace la courbe des effectifs cumulés croissants (Fi )
Remarque : On peut déterminer graphiquement la médiane aussi à partir de la courbe des (Fi ) de la même
manière que ci dessus.
Conséquence : L’intersection des deux courbes des (Fi ) et (Fi ) a pour abscisse la valeur de la médiane Me
de la série.

12
3.1.4.2.2. Détermination de la médiane par le calcul :
Après avoir identifié la classe médiane de la série statistique qui correspond à la première fréquence cumulée
croissante (Fi ) supérieur à 0,5.
C’est cette classe médiane qui contiendra la valeur de la médiane qui peut être donnée par une interpolation
linéaire.
Si la classe médiane est la ieme classe, c’est à dire de rang i, alors ses bornes seront [Li-1 – Li[. On observe en
parallèle [F(Li-1) – F(Li)[ qui contiendra F(Me)=0,5.

On utilisera l’interpolation linéaire (ou le concept de Triangles semblables).


Li-1 Me Li
F(Li-1) F(Me)=0,5 F(Li)

Me  Li 1 F ( Me )  F ( Li 1 )

La formule sera comme suite
Li  Li 1: F ( Li )  F ( Li 1 )

Avec : 0,5  F ( Li 1 )
Me  Li 1  ( Li  Li 1 )
F ( Li )  F ( Li 1 )
- N : Effectif total.
- i : le rang de la classe médiane 1 ≤ 𝑖 ≤ 𝑁.
- Li-1 : Borne inférieure de la classe médiane de rang i.
- Li : Borne supérieure de la classe médiane de rang i.

13
- F (L )
i
: Fréquence cumulé croissante correspondant à la classe médiane.

- F (Li1
) : Fréquence cumulée croissante précédant F (L ) .
i

Remarque : On peut remarquer que F ( Li )  F ( Li 1 )  f i , avec f i est la fréquence relative au rang de la classe

médiane i. On aura la formule suivante :

0,5  F ( Li 1 )
Me  Li 1  ( Li  Li 1 )
fi

Application : Reprenons l’exemple précédent.


Classes xi Effectifs Fréquences Fréquences cumulés
(mn) (ni) relatives (fi) croissants (Fi )
[0 – 15[ 14 0,206 0,206
[15 – 30[ 10 0,147 0,353
[30 – 60[ 16 0,236 0,589
[60 – 120[ 20 0,294 0,883
[120 – 180[ 8 0,118 1
Total 68 - -
Identification de la classe médiane.
Dans la colonne des fréquences cumulées croissantes, on cherche le premier (Fi) supérieur à 0,5.C’est 0,589.
Il correspond à la classe [30 – 60[ qui est la classe médiane.
Cette classe médiane est de rang i = 3.

14
AN :
Donc L3 = 60 ; L2 = 30 ; F(L3=60) = 0,589 ; F(L2=30) = 0,353 ; f3=0,246
. 0,5  F ( L2 ) 0,5  F ( L2 )
Me  L2  ( L3  L2 )  L2  ( L3  L2 )
F ( L3 )  F ( L2 ) f3

0,5  0,353 0,147


Me  30  (60  30)  30  30( )  30  30(0,597)  47,93  48.
0,589  0,353 0,246

On peut vérifier que cette valeur de la médiane est presque la même que celle du graphique (Me = 49).
3.1.5. Les quantiles :
Ce sont des caractéristiques de position.
Pour une série statistique de N observations :
La médiane Me sépare les observations en deux groupes d’effectifs égaux.
Il y a trois quartiles Q1 ,Q2 et Q3 qui séparent les observations en quatre groupes d’effectifs égaux .
Il y a neuf déciles D1, D2, D3…D9 qui séparent les observations en dix groupes d’effectifs égaux.
Il y a 99 centiles C1, C2, C3 …C99 qui séparent les observations en cent groupes d’effectifs égaux.
La détermination de ces caractéristiques est identique à celle de la médiane graphiquement ou par le calcul.
Les quartiles Q1, Q2, Q3 sont obtenus lorsqu’on a cumulé n/4 ; 2n/4 ; 3n/4.
Les déciles D1, D2 … D9 sont obtenus lorsqu’on a cumulé n/10; 2n/10 … 9n/10.
Les centiles C1, C2…C99 sont obtenus lorsqu’on a cumulé n/100, 2n/100 …

15
On appelle :

 Intervalle inter quartile : IIQ = Q3 – Q1


Il contient 50% des observations.
 Intervalle inter décile : IID = D9 – D1
Il contient 80% des observations.
 Intervalle inter centile : IIC = C99 – C1
Il contient 98% des observations.

Remarques :
1) Les intervalles inter quartiles, inter déciles, inter centiles présentent un grand intérêt et sont les plus utilisés
dans les analyses de la statistique descriptive.
2) La notion de déciles et de centiles n’a de sens que s’il y a beaucoup d’observations et donc essentiellement
pour une variable classée.

3.1.5.1. Détermination graphique des quantiles :


On procède de la même manière que pour la détermination graphique de la médiane.

16
Exemple : Le relevé des retards cumulés en minutes de 120 employés d’une entreprise pour un mois de travail a
donné les résultats suivants :
Classes Effectifs
(mn) (ni)

[100 – 120[ 24
[120 – 140[ 48
[140 – 160[ 30
[160 – 180[ 12
[180 – 200[ 6
Total 120

On dresse un tableau sur lequel est représentée la colonne des fréquences cumulées croissantes (F i ).
Classes Effectifs Fréquences Fréquences
(mn) (ni) (ni) cululées(Fi ).

[100 – 120[ 24 0,2 0,2


[120 – 140[ 48 0,4 0,6
[140 – 160[ 30 0,25 0,85
[160 – 180[ 12 0,1 0,95
[180 – 200[ 6 0,05 1
Total 120 1 -----

Traçons la courbe des effectifs cumulés croissants.


17
Remarque :
De la même manière on détermine les déciles et les centiles graphiquement.
3.1.5.2. Détermination des quantiles par le calcul :
Par analogie à la médiane, On détermine les quantiles ainsi :
- Les quartiles :
La formule sera comme suite :
Le 1er quartile Q1 / F(Q1)=0,25 :
Li-1 Q1 Li
F(Li-1) F(Q1)=0,25 F(Li)

0,25  F ( Li 1 )
Q1  Li 1  ( Li  Li 1 )
F ( Li )  F ( Li 1 )

L’intervalle [Li-1 – Li[ contient le quartile Q1.


Le 2ème quartile Q2=Me / F(Q2)=0,5 :
Li-1 Q2=Me Li
F(Li-1) F(Q2)=0,5 F(Li)
0,5  F ( Li 1 )
Q 2  Me  Li 1  ( Li  Li 1 )
F ( Li )  F ( Li 1 )
L’intervalle [Li-1 – Li[ contient le quartile Q2 qui est confondu avec Me.

18
Le 3ème quartile Q1 / F(Q1)=0,25 :
Li-1 Q1 Li
F(Li-1) F(Q1)=0,25 F(Li)

0,75  F ( Li 1 )
Q 2  Me  Li 1  ( Li  Li 1 ) L’intervalle [Li-1 – Li[ contient le quartile Q3 .
F ( Li )  F ( Li 1 )

- Les déciles
Le 1er décile D1 / F(D1)=0,10 :
Li-1 D1 Li
F(Li-1) F(D1)=0,1 F(Li)
L’intervalle [Li-1 – Li[ contient le quartile D1.
0,1  F ( L )
Le 9ème décile D(9L/i F(D
D1  Li 1  Li 1 )9)=0,90 : i 1
F ( Li )  F ( Li 1 )
Li-1 D1 Li
F(Li-1) F(D1)=0,9 F(Li)

0,9  F ( Li 1 )
D 9  Li 1  ( Li  Li 1 ) L’intervalle [Li-1 – Li[ contient le quartile D9.
F ( Li )  F ( Li 1 )

19
- Les centiles
Le 1er centile C1 / F(D1)=0,010 :
Li-1 C1 Li
F(Li-1) F(D1)=0,1 F(Li)
L’intervalle [Li-1 – Li[ contient le quartile C1.
0,01  F ( Li 1 )
C1  Li 1  ( Li  Li 1 )
Le 99ème centile C99 / F(D1)=0,99: F ( Li )  F ( Li 1 )

Li-1 C99 Li
F(Li-1) F(D1)=0,1 F(Li)

0,99  F ( Li 1 )
C1  Li 1  ( Li  Li 1 ) L’intervalle [Li-1 – Li[ contient le quartile C99.
F ( Li )  F ( Li 1 )

20

Vous aimerez peut-être aussi