Académique Documents
Professionnel Documents
Culture Documents
VARIANCE, ÉCART-TYPE ET
COEFFICIENT DE VARIATION
STATISTIQUE INFERENTIELLE
La variance, l’écart-type et le coefficient de variation sont les indicateurs les plus fréquemment
utilisés pour mesurer la dispersion d’une série. Ces indicateurs renseignent sur la dispersion
des données autour de la moyenne.
Plus les données sont concentrées autour de la moyenne, plus les valeurs de ces trois
indicateurs sont faibles. Inversement, plus les données sont dispersées autour de la
moyenne, plus ces trois indicateurs sont élevés.
A – La variance
1) Définition
Soit une série de valeurs d’une variable X : {x1 ,x2,…..,xk}. Soit les effectifs associés :
{n1,n2,…..,nk}. La variance de cette série s'écrit :
Remarque : Si {n1, n2, …..,nk} = {1, 1,….,1} et que k = n, la variance de la série s'écrira :
Autrement dit, lorsque les données sont connues individuellement ou qu’elles ne se répètent pas, c’est
la formule (1-a) qui s’applique. En revanche, lorsque les données sont groupées par valeurs, c’est la
formule (1) qui s’applique. Enfin, lorsque les données sont groupées par classe, c’est le centre de classe
ci, qui remplace xi dans la formule (1).
2) Mode de calcul de la formule (1-a)
Pour calculer la variance à partir de la formule (1-a), on applique successivement les étapes suivantes:
a) Calcul de la moyenne
b) Calcul des écarts à la moyenne
c) Calcul des carrés des écarts à la moyenne
d) Somme des carrés des écarts à la moyenne
e) Division par n
L’exemple ci-après illustre cette méthode.
Exemple : soit la série {2, 5, 7, 1, 9, 13, 6, 15, 8, 16}
Les étapes a), b), c) et d) sont facilitées par la disposition en tableau :
1
STATISTIQUE INFERENTIELLE
Tableau 4
La formule (1) peut aussi être calculé suivant la méthode précédente. Toutefois, pour faciliter
les calculs, il est préférable d’utiliser la formule dite « développée ». On montre en effet que
la formule (1) peut s’écrire :
(1-b)
Tableau 5
Les étapes a), b), c), d) et e) sont facilitées par la disposition en tableau :
2
STATISTIQUE INFERENTIELLE
Tableau 6
Naturellement, si aucune valeur n’est répétée ou si les données ne sont pas regroupées par
valeur, on aura :
L’écart-type est :
3
STATISTIQUE INFERENTIELLE
2) Le coefficient de variation
Exemple : On connaît Ies salaires mensuels bruts en euros des 200 employés de Ia même
entreprise, à 10 ans d’intervaIIe (voir Ie tabIeau 7). Les données sont groupées par cIasse. Le
nombre d’empIoyés est passé de 200 en 1994 à 280 en 2004. On veut savoir si Ia dispersion des
salaires à augmenté. Pour ceIa on va caIcuIer Ie coefficient de variation en 1994 et en 2004.
Tableau 7
On notera tout d’abord que Ies données sont groupées par cIasses de vaIeurs. Dés Iors, iI convient
de caIcuIer ci, Ie centre de chaque cIasse, qui tiendra Iieu de xi dans Ies diffirentes formuIes. Les
tabIeaux 8 et 9 ci-après indiquent Ies caIcuIs intermédiaires nécessaires pour obtenir Ie coefficient
de variation des saIaires, respectivement en 1994 et en 2004.
Tableau 8
1994
SaIaires ci nici ci 2 nici2
(ni)
1000-2000 40 1500 6000 2250000 90000000
2000-3000 70 2500 175000 6250000 43750000
3000-4000 80 3500 280000 12250000 980000000
4000-5000 5 4500 22500 20250000 101250000
5000-10000 5 7500 37500 56250000 281250000
200 575000 1890000000
Totaux
11
4
STATISTIQUE INFERENTIELLE
Et Ie coefficient de variation des saIaires pour I’année 1994 est donc égaI à :
Tableau 9
2004
SaIaires ci nici ci 2 nici2
(ni)
1000-2000 56 1500 84000 2250000 126000000
2000-3000 118 2500 295000 6250000 737500000
3000-4000 92 3500 322000 12250000 1127000000
4000-5000 10 4500 45000 20250000 202500000
5000-10000 4 7500 30000 56250000 225000000
280 776000 2418000000
Totaux
En comparant Ies deux coefficients de variation, on constate que Ia dispersion des saIaires s’est
réduite.