Vous êtes sur la page 1sur 14

M.

BOUMESKA Mustapha FSJES D’AGADIR

Chapitre III. La réduction des données : Paramètres


de tendance centrale

Introduction :

La réduction des données a pour objet le calcul de paramètres qui permettent de caractériser de
façon simple les séries statistiques et les distributions observées.
Les paramètres les plus utilisés sont :
✓ Les paramètres de tendance centrale ou de position :
Ces paramètres servent à caractériser l’ordre des grandeurs des observations
✓ Les paramètres de dispersion :
Ces paramètres permettent de chiffrer la variabilité des valeurs observées autour d’un
paramètre de position
✓ Les paramètres de forme :
Ces paramètres permettent de caractériser la forme d’une distribution.

I. La moyenne arithmétique :

La moyenne arithmétique simple, qu’on appelle tout simplement moyenne, est égale à la
somme des valeurs observées divisée par le nombre d’observations.
▪ Cas d’une série de données brutes sous forme (𝒙i) :

𝑛
∑ 𝑥
𝑋̅ = 𝑖=1 𝑖 avec ∑𝑛𝑖=1 𝑥𝑖 = 𝑥 1 + 𝑥 2 + 𝑥 3 + ……. + 𝑥 i + ……… + 𝑥 n
𝑛

▪ Cas d’une série statistique sous forme (𝐱i, 𝐧i) :

𝑘 𝑘 𝑘 𝑘
∑ ∑𝑖=1 𝑛𝑖 ×𝑥𝑖
𝑋̅ = 𝑖=1𝑘
𝑛𝑖 ×𝑥𝑖
= (VQD) ou ̅ = ∑𝑖=1𝑘 𝑛𝑖×𝑐𝑖 = ∑𝑖=1 𝑛𝑖 ×𝑐𝑖 (VQC)
𝑋
∑ 𝑖=1 𝑛𝑖 𝑛 ∑ 𝑖=1 𝑛𝑖 𝑛

▪ Cas d’une série statistique sous forme (𝐱i, 𝐟i) :

𝑋̅ = ∑𝑘𝑖=1 𝑓𝑖 × 𝑥𝑖 ou 𝑋̅ = ∑𝑘𝑖=1 𝑓𝑖 × 𝑐𝑖
𝑛𝑖
avec 𝑓𝑖 = et ∑𝑘𝑖=1 𝑓𝑖 = 1
𝑛

Exemple 1 : Cas d’une série de données brutes (𝑥i) :


Nombre de salariés de 10 PME de la région Souss-Massa
18 4 9 10 12

7 14 20 15 11

Statistique descriptive 17
M. BOUMESKA Mustapha FSJES D’AGADIR

𝑘
∑ 𝑥 4+7+9+10+11+12+14+15+18+20 120
𝑋̅ = 𝑖=1 𝑖 = = = 12
𝑛 10 10
Interprétation :
En moyenne, chaque PME, de la région Souss-Massa, emploie 12 salariés.
Ou : le nombre moyen des salariés dans les PME de la région Souss-Massa est : 12.

Exemple 2 : Cas d’une série de données (𝑥i, 𝑛i) et (𝑥i, 𝑓i) :


Le prix de vente d’un même produit A chez 100 concurrents :

Prix en dhs (xi) Nombre (ni) fi fi*xi


7 10 10% 0,7
8 20 20% 1,6
9 55 55% 4,95
10 15 15% 1,5
Total 100 100% 8,75

𝑘
∑ 𝑛𝑖𝑥 875
𝑋̅ = 𝑖=1 𝑖 = = 8,75 DH
𝑛 100
ou
𝑋̅ = ∑𝑘𝑖=1 𝑓𝑖𝑥𝑖 = 8,75
Interprétation :
▪ En moyenne, le produit A coûte 8,75 DH ;
▪ Ou : le prix moyen du produit A est 8,75 DH.

La moyenne arithmétique pondérée :


Il s’agit de la moyenne d’une série d’observations affectée chacune d’un certain poids ou
coefficient de pondération.
▪ Exemple : Exemple de bulletin de notes d’un étudiant :

Matière Coefficient (αi) Notes (xi)


Français 4 12
Mathématiques 6 10
Physique 6 13
Anglais 2 11
Total 18

𝑛
∑ 𝛼𝑖𝑥𝑖 4∗12+6∗10+ 6∗13+2∗11 208
𝑋̅ = ∑𝑖=1
𝑛 = = = 11,55
𝑖=1 𝛼𝑖 4+6+6+2 18
Interprétation :
▪ La note moyenne de cet étudiant est 11,55.

Statistique descriptive 18
M. BOUMESKA Mustapha FSJES D’AGADIR

▪ Application 1 :
On observe dans un complexe résidentiel, le nombre de pièce de 400 appartements. Les
résultats sont classés dans le tableau suivant :

Nombre de pièces (xi) Nombre d’appartements (ni)


1 62
2 73
3 175
4 54
5 36
TOTAL 400

1. Préciser :
✓ la population étudiée,
✓ sa taille,
✓ l’unité statistique,
✓ le caractère étudié et sa nature, et
✓ nombre de modalités.
2. Calculer et interpréter la moyenne arithmétique.

Application 2 :
o Le salaire mensuel d’un ensemble d’employés d’une entreprise industrielle se présente
ainsi :

Salaires (xi) Nombre d’employés (ni)

[0 – 2000[ 5
[2000 – 4000[ 20
[4000 – 6000[ 38
[6000 – 8000[ 25
8000 et plus 12

1. Préciser :
✓ la population étudiée,
✓ sa taille,
✓ l’unité statistique,
✓ le caractère étudié et sa nature, et
✓ nombre de modalités.
2. Calculer et interpréter la moyenne arithmétique.

Statistique descriptive 19
M. BOUMESKA Mustapha FSJES D’AGADIR

II. Le mode :
Le mode est l’observation la plus fréquente dans une série statistique, c’est-à-dire la modalité
qui a la plus grande fréquence.
3 cas de figures sont possibles : Un seul mode, plusieurs modes ou aucun mode.
▪ Cas d’un caractère quantitatif discret sous forme (𝒙i) :
 Nombre d’enfants par famille :
Cas 1 : 0 1 2 1 2 3 ▪ Un seul mode : Mo = 2.
Cas 2 : 1 2 2 1 0 3 ▪ Plusieurs modes : Mo = 1 et 2.
Cas 3 : 5 2 0 3 1 4 ▪ Aucun mode.

▪ Interprétation du Mode :
Si on prend le Cas 1 : On dit que la plupart des familles ont 2 enfants ;
Pour le Cas 2 : On dit que la plupart des familles ont 1 ou 2 enfants.

▪ Cas d’un caractère quantitatif discret sous forme (𝒙i, ni) :


 Nombre de pièces par appartement :
Nombre de pièces (xi) Nombre d’appartements (ni)
1 62
2 73
3 175
4 54
5 36
TOTAL 400

Le mode correspond à la modalité qui a le plus grand effectif (fréquence) ;


Le plus grand effectif est : 175 ;
Donc : Mo = 3 pièces.
On dit que la plupart des appartements ont 3 pièces.
Graphiquement :
Le mode correspond au maximum des bâtons.
Nombre de pièces par appartement
200

150
Mo = 3
Effectif

100

50

0
1 2 3 4 5
Nombre de pièces

Statistique descriptive 20
M. BOUMESKA Mustapha FSJES D’AGADIR

▪ Cas d’un caractère quantitatif continu sous forme (𝒄i,ni) :


 Le chiffre d’affaires de 2200 entreprises marocaines :

Chiffre d’affaires en 1000 DH ni


[0 – 100[ 385
[100 – 200[ 315
[200 – 300[ 763
[300 – 400[ 250
[400 – 500[ 357
500 et plus 130
Total 2200

On parle dans ce cas de la classe modale ;


La classe modale correspond à l’effectif le plus élevé ;
L’effectif le plus élevé est : 763 ;
Donc : la classe modale = [200 – 300[.

Chiffre d'affaires des entreprises marocaines


1000
800
La classe modale
Effectif

600
400
200
0
0 100 100 200200 300300 400 400 500500500 et600
plus
Chiffre d'affaires

Pour déterminer la valeur exacte du Mode, On va utiliser deux méthodes : la méthode


Graphique et la méthode algébrique.
1. La méthode algébrique :
(𝐝𝟏 ∗ 𝐚)
𝐌𝐨 = 𝐋𝟏 +
(𝐝𝟏 + 𝐝𝟐)
Avec
L1 : la limite (Borne) inférieure de la classe modale ;
d1: la différence entre l’effectif de la classe modale et l’effectif de la classe précédente ;
d2: la différence entre l’effectif de la classe modale et l’effectif de la classe suivante ;
a : L’amplitude de la classe modale.

Statistique descriptive 21
M. BOUMESKA Mustapha FSJES D’AGADIR

Exemple : Le chiffre d’affaires de 2200 entreprises marocaines :

Chiffre d’affaires en 1000 DH ni


[0 – 100[ 385
[100 – 200[ 315
[200 – 300[ 763
[300 – 400[ 250
[400 – 500[ 357
500 et plus 130
Total 2200

L’effectif le plus élevé est : 763 ;


Donc : la classe modale = [200 – 300[.
Pour calculer le mode précisément, nous utilisons la formule suivante :
(𝐝𝟏 ∗ 𝐚)
𝐌𝐨 = 𝐋𝟏 +
(𝐝𝟏 + 𝐝𝟐)
▪ L1 = 200 ;
▪ d1 = 763 – 315 = 448
▪ d2 = 763 – 250 = 513
▪ a = 300 – 200 = 100
(𝟒𝟒𝟖 ∗𝟏𝟎𝟎)
Mo = 200 + (𝟒𝟒𝟖 +𝟓𝟏𝟑) = 246,62
On dit que la plupart des entreprises marocaines réalisent un chiffre d’affaires de 246 620 DH.

2. La méthode graphique :

Chiffre d'affaires des entreprises marocaines


900
800
700
600
Effectif

500
400
300
200
100
0
Mo 300 400 400 500 500500 et plus
0 100 100 200 200 300 600

Chiffre d'affaires

Statistique descriptive 22
M. BOUMESKA Mustapha FSJES D’AGADIR

III. La médiane :

La médiane d’une distribution statistique, noté Me, est la valeur de la variable étudiée qui
partage en deux parties égales la population étudiée.
▪ La première partie regroupe tous les individus ayant une modalité inférieure ou égale à
la médiane Me.
▪ La deuxième partie regroupe tous les individus ayant une modalité supérieure ou égale à
la médiane Me.

▪ Cas d’un caractère quantitatif discret sous forme (𝒙i) :


Pour une série de données groupées dans un ordre croissant :
Cas n°1 : Si le nombre d’observations est impair, la médiane est l’observation de rang (n+1)/2.
Me = X (n+1)/2
 Exemple : la note des étudiants d’une classe
𝟕 𝟗 𝟏𝟏 𝟏𝟐 14 𝟏𝟔 17
n = 7, il est impair ;
Me = X (n+1)/2 = X (7+1)/2 = X4 (l’observation n°4)
Donc : Me = 12.
Interprétation : La moitié des étudiants ont une note inférieure ou égale à 12, et l’autre moitié
ont une note supérieure ou égale à 12.

Cas n°2 : Si le nombre d’observations est pair, la médiane est comprise entre l’observation de
rang (n/2) et l’observation de rang (n/2)+1.
X n/2 ≤ Me ≤ X (n/2) +1
 Exemple : la note des étudiants d’une classe
𝟕 𝟗 𝟏𝟏 𝟏𝟐 14 𝟏𝟔
n = 6, il est pair ;
X n/2 ≤ Me ≤ X (n/2)+1
Donc X 6/2 ≤ Me ≤ X (6/2)+1
c-à-d : X3 ≤ Me ≤ X4
Ainsi : 11 ≤ Me ≤ 12,
On prend comme médiane, la moyenne arithmétique de ces deux valeurs :
𝟏𝟏+𝟏𝟐
𝐌𝐞 = = 11,5.
𝟐
Interprétation : La moitié des étudiants ont une note inférieure ou égale à 11,5, et l’autre
moitié ont une note supérieure ou égale à 11,5.

▪ Cas d’un caractère quantitatif discret sous forme (𝒙i, ni) :


Pour déterminer la médiane, il faut raisonner en terme de fréquences cumulées croissantes.
La médiane correspond à la moitié de l’effectif global.

Statistique descriptive 23
M. BOUMESKA Mustapha FSJES D’AGADIR

 Exemple : Le nombre de pièces par appartement :

Nombre
Nombre de pièces (xi) fi Ni ↑ Fi ↑
d’appartements (ni)
1 92 23,00% 92 23,00%
2 108 27,00% 200 50,00%
3 110 27,50% 310 77,50%
4 54 13,50% 364 91,00%
5 36 9,00% 400 100,00%
TOTAL 400 100,00%

o L’effectif est pair, n=400 ;


La médiane est comprise entre l’observation de rang (n/2) et l’observation de rang (n/2)+1 :
X n/2 ≤ Me ≤ X (n/2) +1
X 200 ≤ Me ≤ X 201 ;
En consultant l’effectif cumulé croissant :
2 ≤ Me ≤ 3
2+3
𝑀𝑒 = = 2,5.
2
Interprétation : La moitié des appartements ont 2 pièces ou moins, et l’autre moitié ont 3
pièces ou plus.

▪ Cas d’un caractère quantitatif continu sous forme (𝒄i, ni) :

On parle dans ce cas de la classe médiane. C’est la classe qui contient la médiane ;
On détermine la médiane par interpolation linéaire.

 Exemple : Le chiffre d’affaires de 2200 entreprises marocaines

Chiffre d’affaires en
ni fi N↑ F↑
1000 DH
[0 – 100[ 385 17,50% 385 17,50%
[100 – 200[ 315 14,32% 700 31,82%
[200 – 300[ 763 34,68% 1463 66,50%
[300 – 400[ 250 11,36% 1713 77,86%
[400 – 500[ 357 16,23% 2070 94,09%
500 et plus 130 5,91% 2200 100,00%
Total 2200 100%

Statistique descriptive 24
M. BOUMESKA Mustapha FSJES D’AGADIR

La médiane correspond à l’observation de rang (n/2) :


X n/2 = X 2200/2 = X 1100
En consultant l’effectif cumulé croissant, on va déterminer la classe médiane :
La classe médiane est la classe [200 – 300[ ;
La médiane est déterminée par interpolation linéaire :

200 Me 300
Me – 200 300 – 200
=
1100 1463 1100 – 700 1463 – 700
700

300 – 200
Me = 200 + x (1100 – 700)
1463 – 700
Me = 252,42 DH
La médiane = 252 420 DH (le chiffre d’affaires est en 1000 DH) ;

Interprétation :

La moitié des entreprises marocaines ont un chiffre d’affaires inférieure ou égale à 252 420
DH, et l’autres moitié ont un CA supérieure ou égale à 252 420 DH.

Statistique descriptive 25
M. BOUMESKA Mustapha FSJES D’AGADIR

IV. Les fractiles :

Le fractile d’ordre p permet de partager la population en p parties égales. Ainsi :


▪ Les quartiles partagent la population en quatre parties égales ;
▪ Les déciles partagent la population en dix parties égales
▪ Les centiles partagent la population en cent parties égales.

1. Les quartiles :
Q1 : est la valeur de la variable telle que 25% (1/4) des observations lui sont inférieures ou
égales et 75% (3/4) des observations lui sont supérieures ou égales ;
Q2 : est la valeur de la variable telle que 50% (2/4) des observations lui sont inférieures ou
égales et 50% (2/4) des observations lui sont supérieures ou égales. Le deuxième quartile est
égale aussi à la médiane (Q2 = Me);
Q3 : est la valeur de la variable telle que 75% (3/4) des observations lui sont inférieures ou
égales et 25% (1/4) des observations lui sont supérieures ou égales.

25% 25% 25% 25%


n
x
Q1 Q2 Q3

Intervalle interquartile
Pour calculer la valeur exacte de chaque quartile, on va procéder de la même façon que pour la
médiane, c’est-à-dire par interpolation linéaire.

Application : Le chiffre d’affaires 2200 entreprises marocaines

Chiffre d’affaires en
ni fi N↑ F↑
1000 DH
[0 – 100[ 385 17,50% 385 17,50%
[100 – 200[ 315 14,32% 700 31,82%
[200 – 300[ 763 34,68% 1463 66,50%
[300 – 400[ 250 11,36% 1713 77,86%
[400 – 500[ 357 16,23% 2070 94,09%
500 et plus 130 5,91% 2200 100,00%
Total 2200 100%

Statistique descriptive 26
M. BOUMESKA Mustapha FSJES D’AGADIR

 Le 1er quartile (Q1) correspond à l’observation de rang n/4 = 2200/4 = 550 ;


Donc la classe qui contient Q1 est la classe [100 – 200[ ;
Q1 est déterminé par interpolation linéaire :

100 Q1 200
Q1 – 100 200 – 100
=
550 700 550 – 385 700 – 385
385

200 – 100
Q1 = 100 + x (550 – 385)
700 – 385

Q1 = 152,38

Interprétation :
Le chiffre d’affaires étant en millier de DH, on dit que : 25% des entreprises marocaines réalisent
un chiffre d’affaires inférieure ou égale à 152 380 DH, et 75% de ces entreprises réalisent un chiffre
d’affaires supérieure ou égale à 152 380 DH.

 Le 2ème quartile (Q2) correspond à l’observation de rang n/2 = 2200/2 = 1100;


Donc la classe qui contient Q2 est la classe [200 – 300[ ;
Q2 est déterminé par interpolation linéaire :

200 Q2 300
Q2 – 200 300 – 200
=
1100 1463 1100 – 700 1463 – 700
700

300 – 200
Q2 = 200 + x (1100 – 700)
1463 – 700

Q2 = Me = 252,42

Interprétation :
Le chiffre d’affaires étant en millier de DH, on dit que : La moitié des entreprises marocaines ont
un chiffre d’affaires inférieure ou égale à 252 420 DH, et l’autres moitié ont un CA supérieure ou égale
à 252 420 DH.

 Le 3ème quartile (Q3) correspond à l’observation de rang 3n/4 = 3*2200/4 = 1650


Donc la classe qui contient Q3 est la classe [300 – 400[ ;
Q3 est déterminé par interpolation linéaire :

Statistique descriptive 27
M. BOUMESKA Mustapha FSJES D’AGADIR

300 Q3 400
Q3 – 300 400 – 300
=
1650 1713 1650 – 1463 1713 – 1463
1463

400 – 300
Q3 = 300 + x (1650 – 1463)
1713 – 1463

Q3 = 374,80

Interprétation :
Le chiffre d’affaires étant en millier de DH, on dit que : 75% des entreprises marocaines réalisent
un chiffre d’affaires inférieure ou égale à 374 800 DH, et 25% de ces entreprises réalisent un chiffre
d’affaires supérieure ou égale à 374 800 DH.

 L’intervalle interquartile et l’Ecart interquartile :


L’Ecart interquartile = Q3 – Q1.
L’Intervalle Interquartile [Q1 – Q3] est l’intervalle central qui regroupe 50% des observations.
Application : Le chiffre d’affaires 2200 entreprises marocaines
L’intervalle interquartile = [Q1 – Q3] = [152,38 – 374,80]
Interprétation :
On dit que : 50 % des entreprises marocaines réalisent un chiffre d’affaires compris entre
152.380,00 DH et 374.800,00 DH.

2. Les déciles :
d1 : est la valeur de la variable telle que 10% (1/10) des observations lui sont inférieures ou
égales et 90% (9/10) des observations lui sont supérieures ou égales ;
d2 : est la valeur de la variable telle que 20% (2/10) des observations lui sont inférieures ou
égales et 80% (8/10) des observations lui sont supérieures ou égales ;

d9 : est la valeur de la variable telle que 90% (9/10) des observations lui sont inférieures ou
égales et 10% (1/10) des observations lui sont supérieures ou égales.
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
n
x
d1 d2 d3 d4 d5 d6 d7 d8 d9
Pour calculer la valeur des différents déciles, on procède de la même façon que la médiane et
les quartiles (interpolation linéaire) ;

Statistique descriptive 28
M. BOUMESKA Mustapha FSJES D’AGADIR

3. Les centiles :
C1 : est la valeur de la variable telle que 1% (1/100) des observations lui sont inférieures ou
égales et 99% (99/100) des observations lui sont supérieures ou égales ;
C2 : est la valeur de la variable telle que 2% (2/100) des observations lui sont inférieures ou
égales et 98% (98/100) des observations lui sont supérieures ou égales ;

C78 : est la valeur de la variable telle que 78% (78/100) des observations lui sont inférieures ou
égales et 22% (22/100) des observations lui sont supérieures ou égales ;

1% 1% 1% 1% 1% 1% 1% 1% 1% 1%
n
x
c1 c2 c3 c4 c5 c77 c78 c79 c80 c98 c99

V. La médiale :
La médiale d’une distribution statistique, notée Ml, est la valeur de la variable étudiée qui
partage en deux parties égales la somme des observations (∑nixi).

50% 50%
∑nixi

x
Ml
Application : Le chiffre d’affaires 2200 entreprises marocaines

Chiffre d’affaires en
ci ni ni * ci ni * ci ↑
1000 DH
[0 – 100[ 50 385 19 250,00 19 250,00
[100 – 200[ 150 315 47 250,00 66 500,00
[200 – 300[ 250 763 190 750,00 257 250,00
[300 – 400[ 350 250 87 500,00 344 750,00
[400 – 500[ 450 357 160 650,00 505 400,00
500 et plus 550 130 71 500,00 576 900,00
Total 2200 576 900,00

Statistique descriptive 29
M. BOUMESKA Mustapha FSJES D’AGADIR

La médiale (Ml) correspond à l’observation de rang :


∑nici /2 = 576 900/2 = 288 450,00 ;
Donc la classe médiale est la classe [300 – 400[ ;
La Ml est déterminée par interpolation linéaire :

300 Ml 400
Ml – 300 400 – 300
=
257.250 288.450 288.450– 257.250 344.750– 257.250
344.750

400 – 300
Ml = 300 + x (288.450– 257.250)
344.750 – 257.250

Ml = 335,66

Interprétation :
Le chiffre d’affaires étant en millier de DH.
On dit que : Le chiffre d’affaires total réalisé par les entreprises marocaines est répartit en deux
parties égales. La première est inférieure ou égale à 335 660,00 DH et la deuxième est supérieure ou
égale à 335 660,00 DH.

Statistique descriptive 30