Vous êtes sur la page 1sur 22

MESURES DE DISPERSION ET DE FORME 49

Chapitre 4: Mesures de dispersion et mesure de forme


Le statisticien est un homme qui, ayant les pieds
dans un four et la tête dans une armoire frigorifique,
se considère comme, en moyenne, à la bonne
température!

Introduction Le chapitre précédent a été consacré à l'étude des mesures de


tendance centrale. Elles indiquent autour de quelle valeur se
situent les données, mais ne donnent pas une description
suffisante de la variable statistique. Par exemple, si on désire
comparer les 2 groupes d'élèves proposés dans les diagrammes
ci-dessous:

x = …… x = ……

Mais pourtant, les 2 distributions ne sont pas identiques. Les


distributions peuvent être comparées à une douche. Si elle est en
position « jet étroit », presque toute l’eau est concentrée sur un
seul point, c’est-à-dire le jet n’arrose pratiquement que la valeur
moyenne. Si la douche est en position « pluie », l’eau est
dispersée plus largement : il y a de grands écarts par rapport à la
moyenne.

Pour mettre en évidence cette différence, il faut mesurer la


dispersion des données autour de cette mesure de tendance
centrale. Nous allons étudier quelques mesures de dispersions.

1
Illustrations de Peter Fejes : Statistiques (les stats en bulles) / Pearson Education

3OCMath – Jt 2021
50 CHAPITRE 4

§4.1 Les mesures de dispersion absolue

L'étendue: L'étendue d'une variable discrète est la différence entre la plus


grande et la plus petite modalité. Il n'y a pas de notation
particulière pour l'étendue.

L'étendue d'une variable continue est la différence entre la borne


supérieure de la dernière classe et la borne inférieure de la
première classe.

L'écart moyen: L'écart moyen EM est la moyenne pondérée des valeurs absolues
des écarts à la moyenne:
k k
1
EM = ∑ ni x i − x = ∑ f i x i − x
N i=1 i=1

Question: Pourquoi doit-on considérer cette valeur absolue ?


k
Ne pourrait-on pas définir une mesure de dispersion par ∑ f ( x − x) ?
i i
i=1

L'écart interquartile: L'écart interquartile est l'écart entre le 1er et le 3ème quartile:
Q = Q3 – Q 1

La variance: La variance σ 2 d'une variable statistique est la moyenne


pondérée des carrés des écarts à la moyenne:
k k
1 2 2
σ2 = ∑
N i=1
ni ( x i − x ) = ∑ f i ( x i − x )
i=1

L'écart-type: L'écart-type σ est la racine carrée de la variance: σ = σ 2

Exercice 4.1: En reprenant la situation d'introduction:

Calculer les différentes mesures de dispersion.

3OCMath – Jt 2021
MESURES DE DISPERSION ET DE FORME 51

Modèle 1: Alain qui est gardien de but de l'équipe de hockey de son école,
note évidemment le nombre de buts encaissés à chaque match.
V.S quantitative discrète Il a résumé sa dernière saison dans le tableau ci-dessous:

xi ni fi Fi fi xi
0 5 0,093 0,093 0,000 0,244 0,638
1 12 0,222 0,315 0,222 0,359 0,582
2 14 0,259 0,574 0,518 0,160 0,099
3 8 0,148 0,722 0,444 0,056 0,021
4 7 0,130 0,852 0,520 0,180 0,248
5 4 0,074 0,926 0,370 0,176 0,420
6 2 0,037 0,963 0,222 0,125 0,423
7 1 0,019 0,982 0,133 0,083 0,365
10 1 0,019 ∼1 0,190 0,140 1,035
TOTAUX 54 ∼1 2,619 1,523 3,831

Calculer les mesures de dispersion de cette distribution.

Exercice 4.2: La compagnie TEHOU a révélé les chiffres des absences de ses
employés syndiqués pour le mois dernier:

Nombre de jours Nombre


d'absence d'employés
0 36
1 42
2 20
3 11
4 3
5 2
12 1

a) Calculer l'étendue, l'écart moyen et l'écart interquartile.


b) Calculer la proportion des employés ayant manqué plus de
deux jours de travail.

Indication: la fonction = abs(…) d'OpenOffice permet de calculer la valeur


absolue d'un nombre.

3OCMath – Jt 2021
52 CHAPITRE 4

Modèle 2: Le magasin de vêtements ROBA étudie depuis 90 jours ses


ventes de jupes. Les données recueillies ont été regroupées en
V.S quantitative continue classes:

[bi-1 ; bi[ xi ni fi Fi fi xi
[12 ; 16[ 14 5 0,056 0,056 0,778 0,711 9,102
[16 ; 20[ 18 11 0,122 0,178 2,200 1,076 9,465
[20 ; 24[ 22 16 0,178 0,356 3,911 0,853 4,096
[24 ; 28[ 26 21 0,233 0,589 6,067 0,187 0,149
[28 ; 32[ 30 15 0,167 0,756 5,000 0,533 1,707
[32 ; 36[ 34 12 0,133 0,889 4,533 0,960 6,912
[36 ; 40[ 38 8 0,089 0,978 3,378 0,996 11,150
[40 ; 44[ 42 2 0,022 1 0,933 0,338 5,134
TOTAUX : 90 1 26,8 5,653 47,716

Calculer les mesures de dispersion de cette distribution.

Exercice 4.3: André a pris en note le coût de son marché hebdomadaire


pendant 50 semaines. Il a regroupé ses données en classes :

Coût en Euros Nombre de semaines


[40 ; 50[ 1
[50 ; 60[ 2
[60 ; 70[ 4
[70 ; 80[ 6
[80 ; 90[ 23
[90 ; 100[ 7
[100 ; 110[ 4
[110 ; 120[ 2
[120 ; 130[ 1

a) Calculer l'étendue, l'écart moyen et l'écart interquartile.


b) Calculer la proportion des marchés dont le coût excède 100 €.

3OCMath – Jt 2021
MESURES DE DISPERSION ET DE FORME 53

Exercice 4.4: Calculer la variance et l'écart-type.

Modalités Effectifs
25 4
30 8
35 11
38 15
41 18
52 12
55 7
60 5

Formule de Koenig: Nous venons de calculer des écarts-types en nous référant à la


définition. Cependant, ce calcul risque de devenir laborieux si la
moyenne n'est pas un nombre entier : on a à traiter des "écarts à
la moyenne" non entiers avec d'inévitables arrondis, d'où des
calculs lourds et forcément peu précis. Pour alléger ces calculs,
on utilise plutôt une des formules suivantes:
k
2 ⎛ k ⎞
σ 2 = ∑ f i ( x i − x ) est "remplacé" par σ 2 = ⎜∑ f i x i 2 ⎟ − x 2
i=1 ⎝ i=1 ⎠
Samuel Koenig
mathématicien allemand 1 k 2 ⎛1 k 2

(1712-1757) σ2 = ∑ i i
N i=1
n ( x − x ) est "remplacé" par σ 2
= ⎜
N
∑ i i ⎟ − x2
n x
⎝ i=1 ⎠
la variance = la moyenne des carrés – le carré de la moyenne
Preuve:

On ajoute au tableau de distribution des effectifs la colonne des


2
termes f i x i2 en lieu et place des termes f i ( x i − x ) et on
applique la formule de Koenig.

3OCMath – Jt 2021
54 CHAPITRE 4

Modèle 3: En reprenant le modèle précédent:

[bi-1 ; bi[ xi ni fi Fi fi xi fi xi2


[12 ; 16[ 14 5 0,056 0,056 0,778 0,711 9,102 10,889
[16 ; 20[ 18 11 0,122 0,178 2,200 1,076 9,465 39,600
[20 ; 24[ 22 16 0,178 0,356 3,911 0,853 4,096 86,044
[24 ; 28[ 26 21 0,233 0,589 6,067 0,187 0,149 157,733
[28 ; 32[ 30 15 0,167 0,756 5,000 0,533 1,707 150,000
[32 ; 36[ 34 12 0,133 0,889 4,533 0,960 6,912 154,133
[36 ; 40[ 38 8 0,089 0,978 3,378 0,996 11,150 128,356
[40 ; 44[ 42 2 0,022 1 0,933 0,338 51,340 39,200
TOTAUX : 90 1 26,8 5,653 47,716 765,956

Ainsi la variance vaut:

Exercice 4.5: Calculer la variance et l'écart-type.

Classes Effectifs
[6 ; 10[ 2
[10 ; 14[ 9
[14 ; 18[ 16
[18 ; 22[ 15
[22 ; 26[ 7
[26 ; 30[ 1

Exercice 4.6: Une étude des salaires annuels des employés d'une grande
compagnie a donné les résultats suivants:

Classe Effectifs
[20'000 ; 22'000[ 80
[22'000 ; 24'000[ 130
[24'000 ; 26'000[ 340
[26'000 ; 28'000[ 210
[28'000 ; 30'000[ 120
[30'000 ; 36'000[ 120

a) Calculer les mesures de tendance centrale.


b) Calculer la variance et l'écart-type.

Indication: la fonction = RACINE(…) d'OpenOffice permet de calculer la racine carrée


d'un nombre.

3OCMath – Jt 2021
MESURES DE DISPERSION ET DE FORME 55

Exercice 4.7: Pourquoi n'est-il pas possible d'avoir pour une variable
k k
statistique ∑fx i
2
i = 10 et ∑fx i i =5 ?
i=1 i=1

Exercice 4.8: La maison de jeu PROBA a demandé à son croupier de noter


pendant 60 jours consécutifs combien de fois par jour on obtient
le 00 au jeu de la roulette. Le croupier a présenté les données
suivantes:

Nombre de 00 par jour 7 8 9 10 11 12 13 14 15 16


Nombre de jours 1 3 6 9 14 11 7 6 2 1

a) Calculer les mesures de tendance centrale.


b) Calculer la variance et l'écart-type.

Exercice 4.9: Claude s'entraîne dans le but de participer à une course d'un
kilomètre. Il a noté pour chacune de ses 60 dernières courses
d'entraînement son temps en secondes:

261 265 269 273 276 277 281 284 285 287
262 266 271 274 276 278 281 284 286 288
262 266 271 274 276 278 282 284 286 290
263 266 272 275 276 278 282 284 287 290
264 266 272 275 276 279 282 285 287 290
265 268 272 275 277 279 282 285 287 292

Regrouper les données en classes de largeur 5 en prenant b0 = 260.


Construire le tableau complet de distribution des fréquences.
a) Calculer les mesures de tendance centrale.
b) Calculer l'écart-type et l'écart moyen.

§4.2 Choix et comparaison des mesures de dispersion absolue

Le choix de la mesure de tendance centrale implique le choix de


la mesure de dispersion:
mode ↔ étendue
médiane ↔ écart interquartile
moyenne ↔ écart-type ou écart moyen

Les 5 mesures que nous venons de définir visent un même


objectif: mesurer la dispersion des valeurs d'une variable
statistique. Elles ont de par leur définition des caractéristiques,
des avantages et des inconvénients. L'objectif du prochain
exercice est de les reconnaître selon leurs caractéristiques.

3OCMath – Jt 2021
56 CHAPITRE 4

Exercice 4.10: De quelle mesure parle-t-on?

1ère mesure: Elle tient compte de toutes les données et elle accorde le même
poids à chacun des écarts; elle est donc moins influencée que la
variance par les données extrêmes.
Elle se prête mal aux manipulations algébriques.

2ème mesure: Elle est simple à calculer et à interpréter.


Elle ne tient pas compte de toutes les données; elle n'est donc
pas influencée par les données extrêmes.
Elle est utilisée lorsque la distribution des valeurs est fortement
dissymétrique. Dans ce cas, on utilise la médiane comme mesure
de tendance centrale.

3ème mesure: Son calcul est plus long et son interprétation est moins
immédiate.
Elle tient compte de toutes les données.
Elle se prête bien aux manipulations algébriques.
Le carré des écarts accorde du poids aux grands écarts; elle est
ainsi fortement influencée par les données extrêmes.
Elle est, avec l'écart-type, la mesure de dispersion la plus
utilisée.

4ème mesure: Elle est très simple à calculer et à interpréter.


Elle ne tient pas compte de toutes les données; elle n'utilise que
les valeurs extrêmes.
Elle est utilisée pour donner une idée sommaire et rapide de la
dispersion et pour déterminer les largeurs de classes lorsqu'on
fait un regroupement en classes.

5ème mesure: Elle a les mêmes caractéristiques que la variance. Elle est, avec
la variance, la mesure de dispersion la plus utilisée.

Exercice 4.11: Calculer les mesures de tendance centrale et de dispersion des


données suivantes:

Classe Effectifs
[32 ; 38[ 16
[38 ; 44[ 186
[44 ; 50[ 191
[50 ; 56[ 196
[56 ; 62[ 221
[62 ; 68[ 121
[68 ; 74[ 69

3OCMath – Jt 2021
MESURES DE DISPERSION ET DE FORME 57

§4.3 Mesures de dispersion relative

Pour caractériser la distribution des valeurs d'une variable


statistique, on utilise généralement une mesure de tendance
centrale et une mesure de dispersion. On peut donner par
exemple la médiane et l'intervalle interquartile. Dans la grande
majorité des cas, on caractérise la distribution des valeurs par la
moyenne et l'écart-type.
Si l'écart-type d'une variable est égal à 10, peut-on dire que les
données sont très dispersées? Bien sûr, cela dépend de l'ordre de
grandeur des données. Il est donc nécessaire parfois de mesurer
la dispersion relative.

Le coefficient de variation Le coefficient de variation CV d'une variable statistique est le


ratio entre l'écart-type et la moyenne exprimé sous la forme d'un
pourcentage:
σ
CV =
x
Le coefficient de variation est un indicateur de l'homogénéité de
la population. On considère qu'un coefficient de variation
inférieur à 15% indique que la population est homogène, tandis
qu'un coefficient supérieur à 15% indique que les valeurs sont
relativement dispersées. Le coefficient de variation est une
mesure sans unité et indépendante de l'ordre de grandeur. On
peut donc l'utiliser pour comparer la dispersion de variables
statistiques avec des ordres de grandeur et des unités différentes.

Modèle 4: Calculer le coefficient de variation dans le cas d'une V.S discrète

xi ni fi fi xi fi xi2
0 5 0,093 0,000 0,000
1 12 0,222 0,222 0,222
2 14 0,259 0,519 1,037
3 8 0,148 0,444 1,333
4 7 0,130 0,519 2,074
5 4 0,074 0,370 1,852
6 2 0,037 0,222 1,333
7 1 0,019 0,130 0,907
10 1 0,019 0,185 1,852
TOTAUX 54 1 2,611 10,611

3OCMath – Jt 2021
58 CHAPITRE 4

Modèle 5: Calculer le coefficient de variation dans le cas d'une V.S


continue

[bi-1 ; bi[ xi ni fi fi xi fi xi2


[12 ; 16[ 14 5 0,056 0,778 10,889
[16 ; 20[ 18 11 0,122 2,200 39,600
[20 ; 24[ 22 16 0,178 3,911 86,044
[24 ; 28[ 26 21 0,233 6,067 157,733
[28 ; 32[ 30 15 0,167 5,000 150,000
[32 ; 36[ 34 12 0,133 4,533 154,133
[36 ; 40[ 38 8 0,089 3,378 128,356
[40 ; 44[ 42 2 0,022 0,933 39,200
TOTAUX : 90 1 26,800 765,956

Exercice 4.12: Lise et Michel sont deux professeurs de statistiques. Chacun a


fait passer à ses élèves un examen sur la statistique descriptive.
Lise a corrigé sur 100 points et Michel sur 50 points.

Classe de Lise 42 53 60 67 75 83 86 93
46 56 61 67 78 83 86 95
47 58 61 68 81 84 88 96
48 59 64 69 81 85 88 97
51 60 66 73 81 86 91 98

Classe de Michel 20 28 37 39 41 42 45 48 50
21 30 38 39 42 43 46 48
25 33 39 40 42 43 47 48
27 35 39 40 42 43 47 49
28 36 39 40 42 44 47 49

Déterminer la classe la plus homogène.


Largeur des classes: • 10 pour la classe de Lise;
• 5 pour celle de Michel.

3OCMath – Jt 2021
MESURES DE DISPERSION ET DE FORME 59

§4.4 L'inégalité de Bienaymé – Tchebychev


Dans la définition même de l'écart-type, on retrouve la moyenne.
Il semble donc naturel de croire qu'il y a une relation entre
l'écart-type et la moyenne. On sait que plus l'écart-type est petit
plus les données sont concentrées autour de la moyenne. On
peut préciser davantage cette relation dans une version "faible"
de l'inégalité de Bienaymé-Tchebychev:
La proportion des données comprises dans l'intervalle
Irénée-Jules Bienaymé 1
mathématicien français ] x − k ⋅ σ ; x + k ⋅ σ [ est supérieure à 1− 2 (pour k ≥ …)
(1796-1878) k
1 3
k=2 ] x − 2⋅ σ ; x + 2⋅ σ [ 1− = = 75%
22 4
1 8
k=3 ] x − 3⋅ σ ; x + 3⋅ σ [ 1− 2 = ≅ 89%
3 9
  

Pafnouti Tchebychev
mathématicien russe
(1821-1894)

       

 
 
 
   

Exercice 4.13: On considère la v.s. correspondant aux montants des factures d'un
restaurant lausannois (par pers.).
a) Calculer x et σ .
b) Utiliser théorème de Bienaymé-Tchebychev pour les valeurs
de k comprises entre 2 et 5.
c) Utiliser la courbe des fréquences cumulées donnée ci-dessous
pour estimer les proportions réelles des données comprises
dans les intervalles ] x − k ⋅ σ ; x + k ⋅ σ [ pour k compris entre 1
et 5.
d) Comparer.
Montant de Nombre de
la facture factures
[0 ; 10[ 12

[10 ; 20[ 28

[20 ; 30[ 63

[30 ; 40[ 46

[40 ; 50[ 20

[50 ; 60[ 16

[60 ; 70[ 11

[70 ; 100[ 4

3OCMath – Jt 2021
60 CHAPITRE 4

Exercice 4.14: On considère une variable statistique telle que x = 50 et σ = 5.


Quelle est la proportion minimum de données que l'on retrouve
dans l'intervalle [35 ; 65] ?

§4.5 Mesures de forme: coefficients de dissymétrie

Introduction: On peut chercher à caractériser la forme d'une distribution de


fréquences au moyen de coefficients appropriés. On comparera
volontiers ces distributions de fréquences avec celle obtenue, par
le fruit du hasard, en faisant tomber des billes sur une grille
ajourée. Le polygone des fréquences "lissé" admet une forme
caractéristique de courbe en cloche. Une telle situation est
appelée "loi normale".

Les distributions peuvent aussi présenter une asymétrie ou un


aplatissement par rapport à la courbe normale. Les deux types de
mesures de forme sont les mesures d'asymétrie ou de
dissymétrie et les mesures d'aplatissement.

La distribution des valeurs est symétrique si le polygone des


fréquences est symétrique par rapport à un axe vertical passant
par son sommet. Dans un tel cas, le mode, la médiane et la
moyenne se confondent.

3OCMath – Jt 2021
MESURES DE DISPERSION ET DE FORME 61

La distribution des valeurs est La distribution des valeurs est


dissymétrique à droite si la dissymétrique à gauche si la
portion du polygone des portion du polygone des
fréquences située à droite du fréquences située à gauche du
sommet est plus longue que sommet est plus longue que
l'autre. l'autre.

Dans ce cas M0 < M < x Dans ce cas x < M < M0

Le coefficient de dissymétrie Il existe différentes manières de caractériser et de mesurer la


de Pearson : dissymétrie. Karl Pearson a proposé de définir un coefficient de
dissymétrie basé sur les écarts entre les mesures de tendance
centrale. Il a observé que dans les distributions des valeurs
modérément dissymétriques, la distance entre la moyenne et le
mode est approximativement le triple de la distance entre la
moyenne et la médiane. Il a donc proposé, ce que l'on appelle
maintenant le coefficient de dissymétrie de Pearson :

3( x − M )
β1 =
σ
Karl Pearson Il divise par l'écart-type pour avoir une mesure de dissymétrie
mathématicien britannique relative indépendante de l'unité de mesure. La distribution des
(1857 -1936)
valeurs est symétrique quand ce coefficient est nul. Elle a une
dissymétrie à droite ou à gauche suivant le signe du coefficient
de dissymétrie.
Sa valeur est généralement comprise entre -1 et +1:

β1 < 0 distribution dissymétrique à gauche


β1 = 0 distribution symétrique
β1 > 0 distribution dissymétrique à droite

3OCMath – Jt 2021
62 CHAPITRE 4

Exercice 4.15: La discothèque PDO a commandé une étude sur l'âge de ses
clients. Les résultats sont présentés sous la forme du tableau de
distribution des fréquences:

Groupes d'âges Effectifs


[16 ; 18[ 121
[18 ; 20[ 364
[20 ; 22[ 206
[22 ; 24[ 115
[24 ; 26[ 87
[26 ; 28[ 50
[28 ; 30[ 36
[30 ; 50[ 21

a) Calculer l'âge médian, l'âge moyen et l'écart-type.


b) Calculer le coefficient de dissymétrie de Pearson. Interpréter,
puis comparer avec son histogramme

Exercice 4.16: Voici des histogrammes ainsi que des diagrammes à moustaches
montrant des situations éventuellement dissymétriques. Associer
chaque dissymétrie à son histogramme et à son diagramme:
dissymétrie à gauche – dissymétrie à droite – symétrie
symétrie – dissymétrie à droite

 

 

 

3OCMath – Jt 2021
MESURES DE DISPERSION ET DE FORME 63

Le coefficient de dissymétrie Yule et Kendall ont proposé de définir un coefficient de


de Yule – Kendall : dissymétrie basé sur la position relative des quartiles. Dans une
distribution symétrique, les quartiles sont situés à égale distance
de chaque côté de la médiane. Par conséquent:
(Q3 − Q2 ) − (Q2 − Q1 ) = 0
Si la distribution est dissymétrique, l'égalité ci-dessus n'est plus
vraie. L'expression de gauche sera positive ou négative suivant
le sens de l'asymétrie. Pour obtenir un coefficient d'asymétrie
indépendant de l'unité de mesure, ils utilisent un ratio. Le
George Yule coefficient dissymétrie de Yule et Kendall mesure l'asymétrie
mathématicien britannique à partir de la position relative des quartiles par rapport à la
(1871 –1951)
médiane:
Q3 + Q1 − 2Q2
CY =
Q3 − Q1
La valeur du coefficient de Yule et Kendall est toujours
comprise entre -1 et +1 et son signe indique le sens de
l'asymétrie :

- 1 ≤ CY < 0 distribution dissymétrique à gauche


CY = 0 distribution symétrique
0 < CY ≤ 1 distribution dissymétrique à droite
Maurice Kendall
mathématicien britannique
(1907-1983)

Exercice 4.17: Reprendre les données numériques de l'exercice 4.15 afin d'en
calculer le coefficient de dissymétrie de Yule et Kendall, puis
interpréter la valeur obtenue.

Exercice 4.18: Dans quel cas CY = -1 ? CY = 0 ? CY = 1 ?


Démontrer: -1 ≤ CY ≤ 1

3OCMath – Jt 2021
64 CHAPITRE 4

Le coefficient de dissymétrie Ronald Fischer a proposé un coefficient basé sur les écarts par
de Fischer : rapport à la moyenne des valeurs en utilisant le moment centré
d'ordre 3. Il est difficile de justifier intuitivement le coefficient
de dissymétrie de Fischer :

μ3
γ1 =
σ3
k
3
où μ 3 = ∑ f i ( x i − x )
i=1
Ronald Fischer k
2
mathématicien britannique et σ = σ 2 = μ 2 = ∑ f (x i i − x ) écart-type
(1890-1962) i=1

Le signe du coefficient de Fischer indique le sens de la


dissymétrie :

γ1 < 0 distribution dissymétrique à gauche


γ1 = 0 distribution symétrique
γ1 > 0 distribution dissymétrique à droite

Exercice 4.19: Reprendre les données numériques de l'exercice 4.15 afin d'en
calculer le coefficient de dissymétrie de Fischer, puis interpréter
la valeur obtenue.

Remarque importante: Les résultats varient considérablement d'un coefficient


d'asymétrie à l'autre. Ils permettent de comparer deux ou
plusieurs distributions.
Il est alors évident que les comparaisons doivent être faites
avec le même coefficient.

Exercice 4.20: Diane a demandé à chacun de ses élèves d'apprécier son


enseignement en lui donnant une note entre 1 et 10.
Les résultats sont condensés dans le tableau:

Note 4 5 6 7 8 9
Nombre d'élèves 1 3 6 15 12 3

a) Calculer la note médiane et la note moyenne.


b) Calculer l'écart-type.
c) Calculer le coefficient de variation. Interpréter.
d) Calculer tous les coefficients de dissymétrie. Interpréter.
e) Visualiser le tout sur un histogramme.

3OCMath – Jt 2021
MESURES DE DISPERSION ET DE FORME 65

§4.5 Mesures de forme: coefficients d'aplatissement

Les mesures d'aplatissement font partie des mesures qui


caractérisent la forme d'une distribution. Elles caractérisent le
degré d'aplatissement de la distribution par rapport à
l'aplatissement de la distribution normale («courbe en cloche»2).
Il est alors utile de pouvoir mesurer si la forme de la distribution
présente une déviation par rapport à l'aplatissement de la
distribution normale. Une distribution est platicurtique ou
hyponormale si la courbe est plus aplatie que la courbe
normale; elle est leptocurtique ou hypernormale si la courbe
est plus pointue que la courbe normale.

 
  
 





  




Pour mesurer l'aplatissement de la courbe, on utilise le


coefficient β 2 de Pearson basé sur le moment centré d'ordre 4:
Le coefficient d'aplatissement μ4
de Pearson : β2 =
σ4
k k
4 2
où μ 4 = ∑ f i ( x i − x ) et σ 2 = μ 2 = ∑ f i ( x i − x ) variance
i=1 i=1

β2 > 3 courbe leptocurtique ou hypernormale


β2 = 3 courbe normale
β2 < 3 courbe platicurtique ou hyponormale

(x−a )2
2 1 −
La courbe "en cloche" de Gauss représentée ci-dessus correspond à la courbe représentative de f (x) = e 2

3OCMath – Jt 2021
66 CHAPITRE 4

Exercice 4.21: Voici la distribution des tarifs horaires des électriciens de


l'association CHOC

Tarif horaire Nombre de membres


[20 ; 23[ 66
[23 ; 26[ 244
[26 ; 29[ 321
[29 ; 32[ 506
[32 ; 35[ 113
[35 ; 38[ 46
[38 ; 41[ 13

Calculer le coefficient d'aplatissement de Pearson.

Exercice 4.22: Voici la distribution du nombre d'élèves par classe pour


l'ensemble des gymnases d'un canton:

Nombre d'élèves
Nombre de classe
par classe
16 8
17 17
18 33
19 128
20 206
21 173
22 85
23 72
24 51
25 14

Calculer le coefficient de variation, les coefficients de dissymétrie


et de forme. Interpréter.

3OCMath – Jt 2021
MESURES DE DISPERSION ET DE FORME 67

§4.7 Transformation affine d'une variable statistique

Exemple d'intro: Un professeur de statistique a fait passer un examen à ses


étudiants. La correction a été faite sur une échelle de 50. Les
résultats sont donnés dans le tableau suivant:

[bi-1 ; bi[ xi ni fi Fi
[5 ; 10[ 7,5 8 0,103 0,103
[10 ; 15[ 12,5 16 0,205 0,308
[15 ; 20[ 17,5 30 0,385 0,692
[20 ; 25[ 22,5 12 0,154 0,846
[25 ; 30[ 27,5 7 0,090 0,936
[30 ; 35[ 32,5 4 0,051 0,987
[35 ; 40[ 37,5 1 0,013 1
TOTAUX 78 1

Voulant obtenir des notes sur 100, il décide de doubler chaque


résultat. Il se rend compte que les résultats sont très faibles et
ajoute encore 10 points à chaque note.
Si on désigne la note obtenue à l'examen par X et par Y la note
transformée, on a Y = …………
Pour bien saisir les effets de la transformation affine, distinguons
bien les deux étapes. La première étape consiste à doubler les
notes. Soit W = …… la nouvelle variable. Considérons la
distribution des fréquences de W:

[bi-1 ; bi[ wi ni fi Fi
[10 ; 20[ 15 8 0,103 0,103
[20 ; 30[ 25 16 0,205 0,308
[30 ; 40[ 35 30 0,385 0,692
[40 ; 50[ 45 12 0,154 0,846
[50 ; 60[ 55 7 0,090 0,936
[60 ; 70[ 65 4 0,051 0,987
[70 ; 80[ 75 1 0,013 1
TOTAUX 78 1

On modifie les bornes des classes de manière à retrouver le même


regroupement en classes. Les effectifs et les fréquences ne sont pas
modifiés; seules les bornes des classes et les milieux des classes
sont multipliés par le facteur 2.

Ajoutons maintenant la seconde étape de la transformation en


ajoutant 10 points aux notes doublées. Soit Y = ……… = 2X + 10
la nouvelle variable obtenue. Considérons la distribution:

3OCMath – Jt 2021
68 CHAPITRE 4

[bi-1 ; bi[ yi ni fi Fi
[20 ; 30[ 25 8 0,130 0,103
[30 ; 40[ 35 16 0,205 0,308
[40 ; 50[ 45 30 0,385 0,692
[50 ; 60[ 55 12 0,154 0,846
[60 ; 70[ 65 7 0,090 0,936
[70 ; 80[ 75 4 0,051 0,987
[80 ; 90[ 85 1 0,013 1
TOTAUX 78 1

Encore une fois les effectifs et les fréquences demeurent les mêmes
alors que les bornes des classes et les milieux des classes
augmentent de 10 unités.

Observons maintenant graphiquement, sur un polygone des


fréquences, l'effet des 2 étapes de cette transformation affine :

⇒ ⇒

Tous les points du polygone des fréquences Le polygone des fréquences est tout à
conservent la même ordonnée, mais fait identique au précédent, mais il est
l'abscisse est multipliée par 2. déplacé de 10 unités vers la droite.

En résumé: Le facteur b d'une transformation affine Y = aX + b translate


horizontalement la distribution et le polygone des fréquences,
alors que le facteur a dilate horizontalement (ou contracte
si a < l), la distribution et le polygone des fréquences.
Les mêmes observations sont valables pour l'histogramme.

Observons l'effet de cette transformation affine sur quelques


mesures de tendance centrale et de dispersion:

X W Y
x 18,36 w 36,72 y 46,72
M0(X) 17,69 M0(W) 35,38 M0(Y) 45,38
M(X) 17,44 ⇒ M(W) 34,88 ⇒ M(Y) 44,88
σ 2X 38,34 σW2 153,36 σY2 153,36
σX 6,19 σW 12,38 σY 12,38

3OCMath – Jt 2021
MESURES DE DISPERSION ET DE FORME 69

Théorème: Soit X une variable statistique quantitative et Y = aX + b une


transformation affine.
1) M0(Y) = a · M0(X) + b
2) M(Y) = a · M(X) + b
3) y = a⋅ x + b
4) Étendue de Y = a · Étendue de X
5) EM(Y) = a · EM(X)
6) σY2 = a 2 ⋅ σ 2X
7) σY = a ⋅ σ X
8) Q(Y) = a · Q(X)

Preuve de y = a ⋅ x + b :

Modèle 6: Soit X une variable statistique et la transformation affine:


Y = 1000x + 500.
Déduire directement les mesures de tendance centrale et de
dispersion de la variable Y de celles de X:

x = 18,5 ⇒ y=
σ 2X = 3,45 ⇒ σY2 =
σ X = 1,86 ⇒ σY =

3OCMath – Jt 2021
70 CHAPITRE 4

Exercice 4.23: L'association des locataires du quartier fait une étude sur le prix
des loyers. L'association a recueilli les données suivantes:

Nombre de
Prix du loyer
logements
455 8
465 16
475 25
485 34
495 23
505 11
515 5

a) Calculer le prix moyen, l'écart-type et l'écart moyen.


b) Si tous les propriétaires réunis en association décident
d'augmenter les prix de 10 % pour parer à l'augmentation
générale des coûts et, en plus, d'un montant de Fr 20.- pour
couvrir une taxe spéciale, quels seront le nouveau prix moyen
et le nouvel écart-type ?

Exercice 4.24: On désire effectuer une mini-étude statistique sur la température


(en [°] Fahrenheit) mesurée au centre d’une grande ville
américaine et ceci entre le mois d’avril et le mois de septembre.
Echelle Echelle
Celsius Fahrenheit

100 212 Avril Mai Juin Juillet Août Septembre


52,5 62,7 71,6 76,8 75,5 68,2
C F

0 32
a) Calculer la température moyenne, l’écart-type3.
b) Cette étude devant être publiée en Europe, il s’agit de
transcrire ces informations en [°] Celsius à l’aide de la
–100 –148
formule :
5
C = (F – 32) .
9
Calculer alors la moyenne, l’écart-type en [°] Celsius.

Exercice 4.25: Soit X une variable statistique quantitative et Y = ax + b une


transformation affine. Démontrer les formules suivantes:

a) σY2 = a 2 ⋅ σ 2X b) σY = a ⋅ σ X

3
Savez-vous que votre calculatrice admet un mode statistique qui vous permet directement de calculer ces valeurs attendues ??
N'hésitez pas à me le demander !!

3OCMath – Jt 2021

Vous aimerez peut-être aussi