Vous êtes sur la page 1sur 7

Université A- mira de Bejaia

Faculté des sciences économiques, commerciales et sciences de gestion


Département SEGC( LMD)
Module stat I,
Enseignant Mr : Mousli

CHAPITRE 4 : LES CARACTEISTIQUES DE DISPERSION


)‫)مقاييس التشتت‬
4-1 Position du problème et définition
Deux distributions de fréquence peuvent avoir la même valeur concernant les
paramètres de tendance centrale et être assez différentes l’une de l’autre.
Exemple 1 : Distribution de l’âge x de deux ensembles d’étudiants A et B. l’âge
moyen peut être identique ou peu différent dans les deux cas, mais le polygone de
fréquences de la distribution B par exemple peut s’avérer plus évasé.
Exemple 2 : supposons que 10 élèves aient obtenu les résultats suivant lors d’un
examen (données classées selon l’ordre croissant) :
0 7 7 7 7 7 7 7 10 11
Nous vérifions aisément que :
X  Me  Mo  7
Dans un deuxième examen, les résultats sont les suivants :
3 4 5 6 7 7 8 9 10 11
Encore ici, nous avons :
X  Me  Mo  7
L’examen attentif des deux séries fait ressortir une dissemblance entre les deux
distributions. Comment cette dissemblance peut-elle être traduite numériquement ?
La connaissance de la valeur centrale ne nous donne pas l’information complète. Il
convient donc de se donner des mesures pour rendre compte de cet aspect important
que constitue la variabilité ou la dispersion dans une série de données. Ceci nous
permettra de faire des comparaisons concluantes entre diverses séries
Définition : une caractéristique de dispersion est un nombre qui permet d’estimer
dans quelle mesure des observations s’écartent les unes des autres (ou s’écartent
de leur valeur centrale).

Nous étudierons ici les caractéristiques de dispersion couramment utilisées dans la


pratique, en proposant le classement suivant :
-Différences entre deux valeurs d’une série
-Valeurs centrales de variables centrées.
4-2 Différences entre deux valeurs d’une série
4-2-1-L’étendue (range ou intervalle de variation) ( ‫(المد‬
a- Définition
L’étendue notée R est égale à la différence entre la plus grande et la plus petite des
valeurs prises par la variable statistique, classées préalablement dans l’ordre croissant
ou décroissant.
b- Détermination pratique
b1- variable discontinue
Dans le cas d’une série discontinue, l’étendue ne pose pas de problèmes de calcul.
Nous avons : R=Xmax - Xmin

1
Exemple 1 : Reprenons les 2 séries de notes obtenues par 10 étudiants lors de deux
examens (séries proposées précédemment).
0 7 7 7 7 7 7 7 10 11
3 4 5 6 7 7 8 9 10 11
 Dans la première distribution, l’étendue est égale à :
R= (11-0)=11
 Dans la deuxième distribution, l’étendue est égale à :
R= (11-3)=8.
Exemple 2 : Reprenons les données de l’exemple 4 du 2ème chapitre (T.13)
T.23 : Distribution des 500 familles selon le nombre d’enfants
Xi ni ni  ni 
0 50 50 500
1 120 170 450
2 130 300 330
3 110 410 200
4 90 500 90
total 500 - -
Dans ce cas, l’étendue est égale à :
R= (4-0)=4 enfants par famille.
b2- variable continue
Dans le cas d’une distribution continue, deux cas se présentent :
1er cas : les classes extrêmes sont bornées
R  ek  e1
Exemple : reprenons l'exemple de la répartition de 51 branches d’arbre selon leur
longueur :
T-24 Répartition des 51 branches selon leur longueur
classe ni ni  ni 
[2,3 - 4,7[ 7 7 51
[4,7 - 7,1[ 15 22 44
[7,1 - 9,5[ 9 31 29
[9,5 - 11,9[ 12 43 20
[11,9- 14,3[ 5 48 8
[14,3- 16,7[ 2 50 3
[16,7- 19,1[ 1 51 1
Dans ce cas, l’étendue est égale à :
R= (19,1-2,3)=16,8 cm.
2er cas : les classes extrêmes ne sont pas bornées
La détermination de l’étendue pose problème. En pratique, nous bornons les classes
extrêmes selon la règle étudiée au chapitre 1 et nous calculons l’étendue comme ci-
dessus.
Exemple2 : Reprenons les données l’exemple 2 du chapitre 1 (T.12) correspondant à
la répartition des salariés selon leur salaire mensuel
Classes de salaires
Mensuels en ( 103 DA) -5 5-6 6-7 7-9 9-11 11-15 15-23 +23

Nombre d’ouvriers 12 23 42 56 34 32 16 4
Bornons le 2 classes en tenant compte des classes adjacentes. La classe « moins de 5 »
a donc une amplitude de 1 car la classe adjacente est la classe « 5-6 » d’amplitude
égale à « 1 ».

2
De même, la classe « plus de 23 » a une amplitude égale à « 8 » car la classe
adjacente est la classe « 15-23 » d’amplitude égale à 8
Dans ce cas, l’étendue est égale : R=(31-4)=27. 103 DA.
4-2-2 l’intervalle interquartile (‫(المد الربيعي‬
a- Définition
L’intervalle interquartile est l’intervalle qui contient 50% des observations, en
laissant 25% des observations de part et d’autre de l’intervalle.
b- Détermination pratique
L’intervalle interquartile noté Q est égale à :
Q  Q3  Q1
4-2-3 L’intervalle interdécile (‫(المد العشيري‬
Avec le même principe que pour l’intervalle interquartile, on peut également
s’intéresser à l’intervalle interdécile noté D, dont la formule est la suivante :
D  D9  D1
Cet intervalle contient 80% des observations en laissant respectivement 10% des
observations à droite et à gauche de l’intervalle. Cela signifie que l’on élimine 10% des
valeurs se trouvant aux extrémités des distributions.
4-3 Valeurs centrale de variables centrées
L’opération consiste, ici, à s’appuyer sur des variables centrées (différences des
valeurs à leur moyenne ou, très rarement, à leur médiane). Nous retenons ici :
 L’écart absolu moyen
 L’écart-type (ou standard–déviation)
 Le coefficient de dispersion relative (coefficient de variation)
4-3-1 Ecart absolu moyen )‫(اانحراف المت سط المطلق‬
a –Définition
L’écart moyen absolu que l’on note ea(x) est la moyenne arithmétique des valeurs
absolues des écarts entre la valeur prise par la variable statistique X et une valeur type
choisie qui est généralement la moyenne.
b- Détermination pratique
b1- variable discontinue
 Dans le cas d’une distribution discontinue de N observation, l’écart moyen des
valeurs à la moyenne est :

ea ( x) 
 xi  x
N
Il s’agit d’une moyenne des valeurs absolues des variables centrées.
Exemple1 : la série suivante représente le nombre d’absences d’un échantillon de 6
étudiants, à un cours de mathématique.
4 5 6 2 1 0
Calculons d’abord la moyenne :

X 
 X i  18  3 absences
N 6

D’où : ea ( x) 
 X i  X  X 1  X  X 2  X  .... X 6  X
N N
12
ea ( X )   2 absences
6

3
 Dans le cas d’une variable discontinue pondérée par les effectifs, la formule
est :
n

n i Xi  X
ea ( X )  i 1
n

n
i 1
i

Exemple2 : la série suivante représente le nombre d’absences, d’un échantillon de


10 étudiants, à un cours de statistique.
9 2 1 1 7 7 7 4 6 7
T.25 : Répartition des 10étudiants selon le nombre d’absences
Xi ni Xi ni ni X i  X
1 2 2 8
2 1 2 3
4 1 4 1
6 1 6 1
7 4 28 8
9 1 9 4
10 51 25
n

n X i i
51
X  i 1
n
  5,1  5
n
10
i
i 1
n

n i Xi  X
25
ea ( X )  i 1
n
  2,5  3 absences
n
10
i
i 1
b2- variable continue
 Dans le cas d’observation groupées par classe, l’écart absolu moyen s’exprime

n
n Xi  X
i 1 i
par : ea ( X ) 
i1 ni
n

Avec Xi : centre de la classe d’une variable continue


Et ni : effectif de la classe i
Exemple : Reprenons à nouveau l’exemple2 qui donne la répartition des salariés
selon leur salaire brut mensuel.
ei ( 103 DA) ni Xi Xi  X ni X i  X
4-5 12 4,5 4,95 59,40
5-6 23 5,5 3,95 90,85
6-7 42 6,5 2,95 123,90
7-9 56 8 1,45 81,20
9-11 34 10 0,55 18,70
11-15 32 13 3,55 113,60
15-23 16 19 9,55 152,80
23-31 4 27 17,55 70,20
Total 219 710,65

4
Rappelons que la moyenne arithmétique est égale à 9,45  103 DA.
D’où :

n
i 1
ni X i  X 710,65
ea (X )    3,24  103 DA

n
ni 219
i 1
L’écart absolu moyen et donc de 3,24 ou 3240 DA
4-3-2-Ecart-type ou standard-déviation)‫(اانحراف المعياري‬
a -Définition
Dans le calcul de l’écart absolu moyen, intervenaient les valeurs absolues des écarts des
observations à la moyenne. L’écart-type noté S ( X ) sera défini à partir des valeurs de ces
écarts élevés au carré. on déterminera ainsi une sorte de distance moyenne des
observations à la moyenne, qui constitue une mesure de dispersion.
b- Détermination pratique
b1-cas d’une variable discontinue
 Dans le cas d’une série de N observations, l’écart type est la moyenne
quadratique des écarts entre la valeur prise par la variable statistique Xi et la
moyenne arithmétique X . D’où :
n

(X i  X )2
S( X )  i 1

N
On appelle variance le carré de l’écart type. La variance est notée V(x) ou S 2 ( x)
Exemple1 : Reprenons la série représentant le nombre d’absences des 6 étudiants
avec une moyenne égale à 3 absences.
4 5 6 2 1 0
n

(X i  X )2
( X 1  X ) 2  ( X 2  X ) 2  ...  ( X 6  X ) 2
S( X )  i 1

N N
28
S(X )   4,66  2,16  2 absences
6
S ( X )  2 absences.
 Dans le cas d’une variable discontinue pondérée par les effectifs, la formule
devient :
n

 n (X
i 1
i i  X )2
S(X )  n

n i
i

On peut également obtenir l’écart-type en rendant les calculs moins fastidieux à


l’aide de la formule suivante :
n

n X
i 1
i i
2

S(X )  n
X2
n i
i

n
En effet, n (X
i 1
i i  X ) 2   ni X i2  2 ni X i X   ni X 2

5
D’où :
n n n

n X
i 1
i i
2
n X i i n i
S(X )  n
 2X i
n
X2 i
n

 ni i
n i
i n
i
i

n X
i 1
i i
2

S(X )  n
 2X 2  X 2
n
i
i

n X
i 1
i i
2

S(X )  n
X2
n i
i

Exemple2 : Si nous reprenons l’exemple des données représentant le nombre


d’absences d’un échantillon de 10 étudiants (T.25)
9 2 1 1 7 7 7 4 6 7
T.27 : Répartition des 10 étudiants selon le nombre d’absences
Xi ni ni ( X i  X ) 2 n i X i2
1 2 32 2
2 1 9 4
4 1 1 16
6 1 1 36
7 4 16 196
9 1 16 81
10 75 335
D’où :
75
S(X )   2,74  3
10
S ( X )  3 absences
ou bien :
n

n X
i 1
i i
2

S(X )  n
X2
n i
i

335
S(X )   (5,1) 2  2,73  3 donc S ( X )  3 absences.
10
b2- cas d’une variable continue
Dans ce cas, l’écart-type est donné par la formule suivante :
n

n X
i 1
i i
2

S(X )  n
X2
n i
i

avec : Xi= centre de la classe


et ni= effectif de la classe i.

6
Exemple : Reprenons le tableau de la répartition des salariés selon leur salaire
mensuel brut.
T.28 : Répartition des salariés selon leur salaire mensuel brut.
Classe ( 103 DA) ni n i X i2
4-5 12 243
5-6 23 695,75
6-7 42 1774,50
7-9 56 3584
9-11 34 3400
11-15 32 5408
15-23 16 5776
23-31 4 2916
Total 219 23797,25
D’où :
23797 ,25
S(X )   (9,45 ) 2  19 ,3651
219
S( X )  4,40  103 DAou4400DA
Remarque : Cette deuxième méthode (formule développée) permet de simplifier
les calculs, car il n’est plus nécessaire de calculer les écarts par rapport à la
moyenne.
4-3-3- Coefficient de dispersion relative : coefficient de variation)‫(معامل ااختاف‬
L’écart-type s’exprimant dans la même unité que les modalités du caractère, peut
rendre difficiles les comparaisons de dispersion si les variables sont exprimées en
unités différentes.
Pour obtenir un nombre abstrait, indépendant des unités de mesure et permettre de
comparer les dispersions dans différentes séries, nous utilisons la formule
S( X )
suivante : CV  .100
X
un autre paramètre permet aussi d’écarter dans son calcul l’unité de mesure. Il
s’agit du coefficient interquartile noté C Q , dont la formule est la suivante :
Q3 Q1
CQ  .100
Me

Vous aimerez peut-être aussi