Vous êtes sur la page 1sur 47

CHAPITRE 2

PARAMÈTRES STATISTIQUES

Statistiques Descriptives 2019-2020 1


Paramètres Statistiques
Les paramètres statistiques ont pour but de

résumer, à partir de quelques nombres clés, l'essentiel

de l'information relative à l'observation d'une variable.

Statistiques Descriptives 2019-2020 2


I- Paramètres de tendance centrale :

Le mode

Statistiques Descriptives 2019-2020 3


I- Paramètres de tendance centrale :

La Médiane
 

Elle ne peut être calculée que pour les caractères


quantitatifs
Statistiques Descriptives 2019-2020 4
I- Paramètres de tendance centrale :

La moyenne

Statistiques Descriptives 2019-2020 5


I- Paramètres de tendance centrale :

  La moyenne pondérée

Statistiques Descriptives 2019-2020 6


I- Paramètres de tendance centrale :

La moyenne géométrique simple

Statistiques Descriptives 2019-2020 7


I- Paramètres de tendance centrale :

La moyenne géométrique pondérée

Statistiques Descriptives 2019-2020 8


I- Paramètres de tendance centrale :
La moyenne harmonique simple

Statistiques Descriptives 2019-2020 9


I- Paramètres de tendance centrale :

La moyenne harmonique pondérée

Statistiques Descriptives 2019-2020 10


I- Paramètres de tendance centrale :

La moyenne quadratique simple

Statistiques Descriptives 2019-2020 11


I- Paramètres de tendance centrale :

La moyenne quadratique pondérée

Statistiques Descriptives 2019-2020 12


II- Paramètres de position :

Statistiques Descriptives 2019-2020 13


II- Paramètres de position :
2-1- Les quantiles

• on cherche une valeur de la variable


partageant la série en:

✔ Quatre sous-ensembles égaux les quartiles

✔ Dix sous-ensembles égaux les déciles


✔ Cent sous-ensembles égaux les centiles

14
a) Les quartiles
• Ce sont les valeurs du caractère (xi) qui
partagent la série en quatre sous-ensembles
égaux .
• Ils sont donc au nombre de trois : Q1,Q2,Q3
• Les intervalles qu’ils définissent contient chacun
25% des observations ,soit un quart de
l’effectif(n/4).
• L’intervalle interquartile [Q1,Q3] contient 50%
des observations
0 n
n/4 n/4 n/4 n/4

0,25 0,25 0,25 0,25


Q1 Q2 Q3
0 1
15
Intervalle interquartile: 50%
a) Les quartiles

On note que :
- Q1 laisse 25% des observations « AVANT » et 75% « APRES
»

- Q2 laisse 50% des observations « AVANT » et 50 % « APRES


» c’est la médiane

- Q3 laisse 75 % des observations « AVANT » et 25% « APRES


»

16
Statistiques Descriptives 2019-2020
b) les déciles
• Ce sont les valeurs du caractère (xi) qui partagent la série en dix sous-ensembles égaux .
• Ils sont donc au nombre de neuf : D1,D2,D3,D4,D5,D6,D7,D8,D9
• Les intervalles qu’ils définissent contient chacun 10% des observations ,soit un quart de
l’effectif(n/10).
• L’intervalle interdécile [D1,D9] contient 80% des observations
0 n

n/10 n/10 n/1 n/10 n/10 n/10 n/10 n/10 n/10 n/10
0
10 D110 10
D2 10
D3 10
D4 D510 D610 10
D7 D810 D910
0 1
% % % % % % % % % %
Intervalle interdécile : 80 %
On note que :
D1 laisse 10% des observations « AVANT » et 90% « APRES »
D2 laisse 20% des observations « AVANT » et 80 % « APRES »
D3 laisse 30 % des observations « AVANT » et 70% « APRES »
D4 laisse 40 % des observations « AVANT » et 60% « APRES »
D5 laisse 50 % des observations « AVANT » et 50% « APRES » c’est la médiane
D6 …. D9 : 90% des observations « AVANT » et 10% « APRES »;
17
Statistiques Descriptives 2019-2020
c) les centiles
•Ce sont les valeurs du caractère (xi) qui partagent la série en cent sous-ensembles
égaux en termes d’effectif.
• Ils sont donc au nombre de 99 : C1,C2,C3,…. C99
• Les intervalles qu’ils définissent contient chacun 1% des observations ,soit un quart de
l’effectif(n/100).
• L’intervalle interdécile [C1,C99] contient 98% des observations
0 n

n/10 n/10 n/10 ............................ ……………………………………………………….. n/100


0 0 0
1% C11% 1% ……………………… ………………………………………………….. C991%
0 C2 C3 C50 1
Intervalle intercentile : 98 %

On note que :
C1 laisse 1% des observations « AVANT » et 99% « APRES »
C2 laisse 2% des observations « AVANT » et 98 % « APRES »
C3 laisse 3 % des observations « AVANT » et 97% « APRES »
C4……….C49 : 49 % des observations « AVANT » et 51% « APRES »
C50 laisse 50 % des observations « AVANT » et 50% « APRES » c’est la médiane
C51 …. C99 : 99 % des observations « AVANT » et 1 % « APRES »
18
Statistiques Descriptives 2019-2020
Application
Salaire Effectifs fi FCC ECC FCD ECD
[ 1500,2500 10 0,05 0,05 10 1 200
[
[ 2500,3500 20 0,1 0,15 30 0,95 190
[
[ 3500,4500 50 0,25 0,40 80 0,85 170
[
[ 4500,5500 60 0,3 0,7 140 0,60 120
[
[ 5500,6500 40 0,2 0,9 180 0,3 60
[
[ 6500,7500 20 0,1 1 200 0,1 20
Calculer
[ les quartiles , l’intervalle interquartile et Interpréter les
résultats
Total 200 1 0 0
Calculer les déciles , l’intervalle interdécile et Interpréter les résultats
Calculer les centiles C1,C50 ,C99 , l’intervalle intercentile et Interpréter
les résultats Statistiques Descriptives 2019-2020
19
I) Les quartiles
1) Q1: la modalité qui correspond à la plus petite fréquence
Cumulée croissante qui dépasse strictement 0,25.
✔ Donc c’est la classe [ 3500,4500 [ ,
✔ Alors par interpolation linéaire
 

On dit que 25% des salariés perçoivent un salaire


inférieur ou égal à 3900dh ou 75% des salariés
perçoivent un salaire supérieur ou égal à 3900 dhs
20
Statistiques Descriptives 2019-2020
I) Les quartiles
1) Q2: la modalité qui correspond à la plus petite fréquence
Cumulée croissante qui dépasse strictement 0,5.
✔ Donc c’est la classe [ 4500;5500[
✔ Alors par interpolation linéaire
 

On dit que 50% des salariés perçoivent un salaire


inférieur ou égal à 4833 dhs ou 50% des salariés
perçoivent un salaire supérieur ou égal à 4833dhs.
21
Statistiques Descriptives 2019-2020
I) Les quartiles
1) Q3: la modalité qui correspond à la plus petite fréquence
Cumulée croissante qui dépasse strictement 0,75.
✔ Donc c’est la classe [ 5500;6500[
✔ Alors par interpolation linéaire
 

On dit que 75% des salariés perçoivent un salaire


inférieur ou égal à 5750dhs ou 25% des salariés
perçoivent un salaire supérieur ou égal à 5750dhs.
22
Statistiques Descriptives 2019-2020
I) Les quartiles

• L’intervalle interquartile [ Q1,Q3] est donc [ 3900,

5750]

On dit que 50% de la pop étudiée perçoivent un salaire

entre 3900 dhs et 5750 dhs

23
Statistiques Descriptives 2019-2020
III- Paramètres de dispersion:

Statistiques Descriptives 2019-2020 24


III- Paramètres de dispersion:

Deux distributions peuvent, tout en ayant


des caractéristiques de tendance centrale
voisines, être très différentes.

Il est donc nécessaire de mesurer la


dispersion des valeurs autour des tendances
centrales.

Statistiques Descriptives 2019-2020 25


III- Paramètres de dispersion:

Statistiques Descriptives 2019-2020 26


III- Paramètres de dispersion:

Statistiques Descriptives 2019-2020 27


III- Paramètres de dispersion:
2-1- L’´etendue
• L'étendue (ou amplitude) d'une série statistique
est la différence entre la valeur maximum et la
valeur minimum de la série.
• E = Maximum (X) - Minimum (X)
• Facile à déterminer, l'étendue ne dépend que des
2 observations extrêmes qui sont parfois le fait de
situations exceptionnelles.
• Il est donc difficile de considérer l'étendue comme
une mesure stable de la dispersion.

Statistiques Descriptives 2019-2020 28


III- Paramètres de dispersion:
2-1- L’´etendue
L’´etendue est la différence entre la plus grande et la
plus petite valeur observée.
Classe des Effectifs (nᵢ) Effectifs
Xᵢ Effectifs Effectifs Cumulés
(nᵢ) Cumulés valeurs
croissants
croissants
[15 ;20 ) 8 8
19 12 12
18 25 37 [20 ;25 ) 18 26
20 32 69 [25 ;30 ) 23 49
22 27 96 [30 ;35 ) 16 65
21 8 104 [35 ;40 ) 10 75
L’étendu est 22 – 18 = 4 L’étendu est 40 – 15 = 25

Statistiques Descriptives 2019-2020 29


III- Paramètres de dispersion
2-3- La variance σ²
• La variance est la somme des carrés des écarts à la moyenne
divisée par le nombre d’observations

Statistiques Descriptives 2019-2020


30
III- Paramètres de dispersion
2-3- La variance σ²

Statistiques Descriptives 2019-2020


31
III- Paramètres de dispersion
2-3- La variance σ²
Xᵢ(u Effectifs Nᵢ Xᵢ Eᵢ² Nᵢ Eᵢ² Xᵢ² NᵢXᵢ²
) (nᵢ)
0 25
1 35
2 11
3 2
4 1
5 1
75

Statistiques Descriptives 2019-2020 32


III- Paramètres de dispersion
2-3- La variance σ²
Xᵢ(u) Effectifs (nᵢ) Nᵢ Xᵢ Eᵢ² Nᵢ Eᵢ² Xᵢ² NᵢXᵢ²
0 25 0 -0.96 0.9216 23.04 0 0

1 35 35 0.04 0 .0016 0.056 1 35

2 11 22 1.04 1.0816 11.8976 4 44

3 2 6 2.04 4.1616 8.3232 9 18

4 1 4 3.04 9.2416 9.2416 16 16

5 1 5 4.04 16.3216 16.3216 25 25

75 72 68.88 138

ou

Statistiques Descriptives 2019-2020 33


III- Paramètres de dispersion
2-4- Écart-type (σ)
• Écart-type (σ ) = Racine carrée de la variance
• L'écart-type est la mesure de dispersion la
plus couramment utilisée en statistique
lorsqu'on emploie la moyenne pour calculer
une tendance centrale.

Statistiques Descriptives 2019-2020 34


III-Paramètres de dispersion
2-5- Coefficient de variation
• le coefficient de variation de X est un indice noté et
défini comme suit

• Le coefficient de variation est un indicateur du degré


d’homogénéité des valeurs de la distribution ;
• Le coefficient de variation est indépendant des unités
choisies, il est utile pour comparer des distributions qui
ont des unités différentes.

Statistiques Descriptives 2019-2020


35
III-Paramètres de dispersion

La variance, l'écart‑type et le coefficient de


variation sont les paramètres de dispersion les
plus utilisés.

En particulier, le coefficient de variation


permet de comparer la variabilité relative de
plusieurs distributions qui diffèrent fortement
par leur ordre de grandeur et éventuellement
même par leur unité de mesure
Statistiques Descriptives 2019-2020
36
Comparons le salaire moyen dans 2 entreprises

Entreprise A :
1/ 3 de femmes , salaire moyen 8000Dh
2/3 hommes, salaire moyen 11000

Entreprise B :
2/ 3 de femmes , salaire moyen 9000Dh
1/3 hommes, salaire moyen 12000

La quelle des deux entreprise a le salaire moyen le


plus élevé ?

Statistiques Descriptives 2019-2020 37


Comparons le salaire moyen dans 2 entreprises

Entreprise A :
1/ 3 de femmes , salaire moyen 8000Dh
2/3 hommes, salaire moyen 11000
Dans l'entreprise A le salaire moyen est de : ….

Entreprise B :
2/ 3 de femmes , salaire moyen 9000Dh
1/3 hommes, salaire moyen 12000
Dans l'entreprise B le salaire moyen est de : ….

Statistiques Descriptives 2019-2020 38


• On constate donc que le salaire moyen de
B est égal à celui de A. Pourtant le salaire
moyen des hommes est supérieur en B à
celui des hommes en A. Il en est de même
pour les femmes.

• D'où vient ce résultat paradoxal ?

Statistiques Descriptives 2019-2020 39


• Il s'agit d'un effet de structure : cela vient du fait que les
femmes (au salaire plus bas) sont plus nombreuses en B
qu'en A.

• Cela montre aussi qu'une moyenne ne résume pas bien une


population hétérogène, comprenant des sous-populations
différentes vis à vis du caractère étudié (ici le salaire).

Statistiques Descriptives 2019-2020 40


Synthèse
En plus des tableaux et graphiques, on

résume l'observation d'une variable

quantitative par un petit nombre de

paramètres.

Statistiques Descriptives 2019-2020 41


Exercice 1
La répartition de 40 exploitations agricoles selon leur superficie en
hectares :
Surface en ha Effectif (ni)

]10 - 20] 10
]20 - 30] 5
]30 - 40] 18
]40 - 50] 3
]50 - 60] 1
]60 - 70] 2
]70 - 80] 1
Total 40
T.A.F
1) Représenter graphiquement la série statistique.
2) Déterminer et interpréter les indicateurs suivants :
a. Le mode
b. La médiane
c. La moyenne arithmétique 42
1/ Graphique de la répartition de 40 exploitations agricoles selon leur
superficie.

Statistiques Descriptives 2019-2020 43


2/ Tableau de la répartition de 40 exploitations agricoles selon leur
superficie

Surface en Effectif Centre de


ha (xi) (ni) classe (ci)
ni c ni × ci
]10 - 20] 10 15 10 150
]20 - 30] 5 25 15 125
]30 - 40] 18 35 33 630
]40 - 50] 3 45 36 135
]50 - 60] 1 55 37 55
]60 - 70] 2 65 39 130
]70 - 80] 1 75 40 75
Total 40 -- -- 1300

Statistiques Descriptives 2019-2020 44


Le Mode : la modalité qui a le plus d’effectif c’est la classe: ] 30 - 40 ].

Mo = 34,64 ha

Interprétation : La majorité des exploitations enquêtées ont une superficie de 34, 64.

Statistiques Descriptives 2019-2020 45


La médiane  
[30;40]

Me= 32, 78 ha

Interprétation : La moitié des exploitations ont une superficie


supérieur à 32,78 ha tandis que l’autre moitié ont une superficie
inférieur à 32,78 ha.
Statistiques Descriptives 2019-2020 46
La moyenne
 

Interprétation : les exploitations ont une superficie moyenne de 32,5 ha.

Statistiques Descriptives 2019-2020 47

Vous aimerez peut-être aussi