Académique Documents
Professionnel Documents
Culture Documents
Statistique Descriptive
Chapitre I : Les caractéristiques des
distributions à un caractère
Caractéristiques de position
La moyenne
Le mode (ou la dominante)
La médiane
La moyenne
De…nition
La moyenne arithmétique d’une série statistique (xi ) est égale au rapport de la
somme des valeurs observées par le nombre d’observations (n ).
Notation : X (x barre)
De…nition
On dit qu’une moyenne arithmétiques est simple ou non pondérée lorsqu’à
chaque valeur de xi ne correspond qu’une seule observation.
n
x1 + x2 + + xn 1
x=
n
=
n ∑ xi (1)
i =1
La moyenne
Example
8 étudiants ont obtenu les notes (sur 20) suivantes :
3 ; 5 ; 7 ; 9 ; 10 ; 11 ; 12 ; 18
La moyenne
Solution
La note moyenne des étudiants de cet échantillon est :
3 + 5 + 7 + 9 + 10 + 11 + 12 + 18
x= = 9, 375
8
La moyenne
De…nition
On se souvient que la fréquence relative est :
ni
fi = (avec n = e¤ectif total = Σni ) (2)
n
et la formule de la moyenne arithmétique peut s’ecrire égalment :
n
x= ∑ fi xi (3)
i =1
La moyenne
De…nition
On dit une moyenne arithmétique est "pondérée" lorsqu’à chaque valeur de xi
peut correspondre à plusieurs observations :
n
1
x=
n ∑ ni xi (4)
i =1
Example
8 étudiants ont obtenu les notes (sur 20) suivantes :
3, 3, 3, 5, 9, 9, 11, 11
La moyenne
Solution
La note moyenne des étudiants de cet échantillon est :
(3 3) + (5 1) + (9 2) + (11 2)
x= = 6, 75
8
La moyenne
Variable statistique discrète
De…nition
Il faut ajouter au tableau statistique des données fxi ; ni g ,soit la colonne
produit par les e¤ectifs" (xi ni ), soit la colone "produit par les fréquences"
( xi fi ) .
Example
L’entreprise E compte 30 ouvriers salariés à 6000 Dh, 15 employés salariés à
7000 Dh et 5 cadres salariés à 10000 DH. Quel est le salaire moyen
Salaire E¤ectif
xi ni
6000 30
7000 15
10000 5
La moyenne
Variable statistique discrète
Solution
Salaire E¤ectif
xi ni xi ni fi f i xi
6000 30 180000 0,6 3600
7000 15 105000 OU 0,3 2100
10000 5 50000 0,1 1000
n=50 335000 Σ=1 6700
n
1 335000
x =
n ∑ ni xi =
50
= 6700dh (5)
i =1
n
ou x = ∑ f i xi = 6700dh (6)
i =1
La moyenne
Variable statistique continue
De…nition
Les modalités sont regroupées en classes et pour obtenir la valeur exacte de la
moyenne à l’interieur de la classe on procède comme suit :
n
1
x=
n ∑ ni ci
i =1
La moyenne
Variable statistique continue
Example
Modalités E¤ectifs
(classes) ni
[3000; 4000[ 26
[4000; 5000[ 33
[5000; 6000[ 64
[6000; 7000[ 7
[7000; 8000[ 10
La moyenne
Variable statistique continue
Notes xi E¤ectifs ni ci ci n i
0-2 39 1 1 39
2-4 50 3 3 50
4-6 44
6-8 44
8-10 14
10-12 39
12-14 29
14-16 14
16-18 7
18-20 4 19 19 4
N 284 2054
c1 = 0 + 2
2 =1
c10 = +18 20 = 19
2
n
1 2054
x =
n ∑ ni ci =
284
i =1 Statistique Descriptive Enseignant : Ragbi Aziz
Les caractéristiques de tendance centrale ou de position
Chapitre I : Les caractéristiques des distributions à un caractère Les caractéristiques de dispersion
Les paramètres de concentration
La moyenne
Variable statistique continue
Solution
Modalités E¤ectifs Centre de classe
(classes) ni ci ni c i
[3000; 4000[ 26 3500 91000
[4000; 5000[ 33 4500 148500
[5000; 6000[ 64 5500 352000
[6000; 7000[ 7 6500 45500
[7000; 8000[ 10 7500 75000
712000
Le salaire moyen est :
n
1 712000
x=
n ∑ ni ci =
140
= 5085, 7
i =1
La moyenne Géométrique
De…nition
La moyenne Géométrique : Notation G
C’est la racine ni éme du produit des n valeurs positives du caractère x .
On l’emploi dans le calcul de taux d’accroissement moyens, ou de
moyennes de coe¢ cients multiplicateurs. Sa formule :
p
n
G = x1 x2 xi (8)
La moyenne Géométrique
Généralisation de la notion de moyenne
Example
x1 = 8
La moyenne géométrique de est :
x2 = 12
La moyenne
Généralisation de la notion de moyenne
Solution
p
2
G = 8 12 = 9, 8
La moyenne harmonique
De…nition
La moyenne harmonique : notation H
C’est la valeur de la variable pour laquelle son inverse est la moyenne
arithmétique de l’inverse des valeurs de la variable.
On l’emploi dans le calcul des moyennes de pourcentages et de rapports et
notamment dans celui des durée moyennes et des vitesses moyennes. Sa
formule :
1 1 1 1 1 1
= + + + + (9)
H n x1 x1 xi xn
n
H = n (10)
∑ni=1 ( xii )
La moyenne
Généralisation de la notion de moyenne
Example
Sur un trajet on fait 60 km/h à l’aller et 30 km/h au retour. Quelle est la
vitesse moyenne ?
La moyenne
Généralisation de la notion de moyenne
Solution
2
H= h i = 40 ! H = 40km/h
1 + 1
30 60
Le mode
Example
Dans la série f5, 6, 7, 7, 8, 8, 8, 9, 10g la valeur "8" apparaît le plus
fréquement ; Le mode est donc 8.
Le mode
Cas des variables discretes
De…nition
Lorsque la variable est discrète, le mode est facilement repérable ;
Sur le tableau statistique fxi ; ni g , c’est le xi pour lequel la fréquence est
la plus élevée ;
Sur le diagrame en bâtons, c’est la valeur xi correspondant au bâton le
plus haut :
Le mode
Cas des variables continues
De…nition
Les données sont groupées en calsses, et le graphe est généralement un
histogramme.
Deux situations se présentent :
Les amplitudes de classe sont égales :
On dé…nit la classe modale comme la classe du tableau ou de
l’histogramme correspondant à la fréquence maximum :
Example
xi ni
[10; 20[ 10
[20; 30[ 20
[30; 40[ 35
[40; 50[ 15
Le mode
Cas des variables continues
Solution
xi
[10; 20[
[20; 30[
Classe
[30; 40[ [modale ]
[40; 50[
En faisant l’hypthèse de centre de classe, on peut admettre, que le mode est
égale à 35.
Le mode
Cas des variables continues
Notes xi E¤ectifs ni ai
0-2 39 2
2-4 50 2
4-6 44 2
6-8 44 2
8-10 14 2
Cas Amplitudes égales
10-12 39 2
12-14 29 2
14-16 14 2
16-18 7 2
18-20 4 2
N 284
La classe modale correspond à [2 4[ puisque l’e¤ectif le plus observé
c’est 50.
Le mode
Cas des variables continues
Example
z }| {
Données
xi ni
[10; 20[ 10
[20; 30[ 40
[30; 50[ 220
[50; 90[ 240
[90; 100[ 10
Le mode
Cas des variables continues
Solution
z }| {
Données
xi ni ai ai /a hi
[10; 20[ 10 10 1 10
[20; 30[ 40 10 1 40
[30; 50[ 220 20 2 110 valeur dominante
[50; 90[ 240 40 4 60
[90; 100[ 10 10 1 10
La médiane
De…nition
La médiane d’une variable statistique est une valeur pour laquelle, la
moitié des observations lui sont inférieure ou égales et la moitié supérieure
ou égales.
La médiane partage donc le nombre total d’observations en deux parties
égales.
La médiane est un paramètre statistique qui ne dépend que du nombre
d’observations.
Pour déterminer la médiane, il faut raisonner en terme de fréquences
cumulées, la médiane est alors la valeur de la variable qui correspond à la
moitié de l’e¤ectif total.
De…nition
Pour une série statistique de n observations : x1 , x2 , . . . , xi , . . . , xn
Si le nombre d’observation est impair, la médiane est l’observation de rang
n +1
2
Me = x n +1 (11)
2
x n2 6 Me 6 x n2 +1 (12)
x n2 + x n2 +1
Me = (13)
2
La médiane
(
S érie f3, 6, 12, 15, 21, 28, 32g
Exemple | {z } | {z } (14)
Avant M é Apr és
Solution
La médiane est donc 15 : Il y a autant d’obsérvations supérieures à la médiane
que d’observations inférieures à la médiane.
Example
Nombre Nombre de
d’employés commerçants
(modalité xi ) (ni )
0 5
1 10
2 20
3 15
4 12
5 16
6 13
7 9
Total 100
Example
Nombre Nombre de Fréquences Fréquences
d’employés commerçants en % cumulées croissantes
(modalité xi ) (ni )
0 5 5 5
1 10 10 15
2 20 20 35
3 15 15 50
4 12 12 62
5 16 16 78
6 13 13 91
7 9 9 100
Total 100 100%
La médiane :
Pour des données groupées en classes, la classe médiane est la classe
qui contient la médiane.
On détermine la médiane par interpolation linéaire.
Désignons par :
L0 : borne inférieure de la classe médiane ;
ai : amplitude de la classe médiane ;
n : nombre total des observations ;
ni : fréquence absolue de la classe médiane ;
Ni 1 : fréquence absolue cumulée croissante de la classe qui précède
la classe médiane ;
Me = L0 + ai (((n/2) Ni 1 )/ (ni ))
Example
Solution
La classe médiane est la classe 40 à 60 m2 . La médiane est donc :
50 28
Me = 40 + 20 = 60m2 (18)
22
La moitié des logements ont une super…cie inférieure ou égale à
60m2
et la moitié des logements ont une super…cie supérieure ou égale à
60m2 .
De…nition
Les quantiles sont des caractéristiques de position, tout comme la
médiane ;
On cherche une valeur de la variable, partageant la série non plus en deux
sous-ensembles égaux (50% et 50%), mais entre quatre sous-ensembles
égaux, ou en dix sous-ensembles égaux, ou en cent sous ensembles
égaux....
Le calcul des quantiles est similaire à celui de la médiane.
Les Quartiles
De…nition
Les quartiles sont des valeurs du caractère (x i ) qui partagent la série en
quatre sous-ensembles égaux ;
Ils sont au nombre de trois : Q1 , Q2 , Q3 ;
Les intervalles qu’ils dé…nissent contiennent chacun 25% des observations,
soit un quart de l’e¤ectif (n/4), comme le montre le shéma suivant.
L’intervalle Q3 Q1 s’appelle intervalle interquartilee : Il contient 50%
des observations.
Les Quartiles
De…nition
Le calcul se fait, comme pour la médiane, en construisant la colonne des
e¤ectifs cumulés N (x ) ou celle des fréquences relatives cumulées F (x ),
mais ici en repérant les valeurs 25%, 50%, 75% dans la colone F (x ) :
F (Q1 ) = 0, 25 N (Q1 ) = 1 n
En e¤et : 4
F (Q2 ) = 0, 50 ou N (Q2 ) = 1 n
4
F (Q3 ) = 0, 75 N (Q3 ) = 1 n
4
Les Quartiles
De…nition
Désignons par :
L0 : borne inférieure de la classe qui contient le quartile ;
ai : amplitude de la classe qui contient le quartile ;
n : nombre total des observations ;
Nn 1 : fréquence absolue cumulée croissante de la classe qui précède
la classe qui contient le quartile ;
ni : fréquence absolue de la classe qui contient le quartile.
n
4 Ni 1
q1 = L 0 + ai (19)
ni
3n
4 Ni 1
q3 = L 0 + ai (20)
ni
Les Quartiles
Example
La répartition de la surface, en m2 , de 100 logements est représentée dans le
tableau suivant :
Les Quartiles
De…nition
En consultant les fréquences absolues cumulées croissantes, q1 , qui
correspond à la 25ème observation, se trouve dans la classe 20 à 40m2 .
q3 , qui correspond à la 75ème observation, se trouve dans la classe 60 à
100m2 .
100 10
q1 = 20 + 20 4 = 36.67 m2 (21)
18
3 100 50
q3 = 60 + 40 4 = 86.32 m2 (22)
38
50 % des logements ont une super…cie comprise entre 36,67 m2 et 86,32
m2 .
Les Déciles
De…nition
Les déciles sont les valeurs du caractère (x i ) qui partagent la série en dix
sous-ensemble égaux ;
Ils sont au nombre de 9 : D1 , D2 , , D9 ;Les intervalles qu’ils dé…nissent
contiennet chacun 10% des observations.
Les Déciles
De…nition
L’intervalle D9 D1 , s’appelle intervalle interdécile ; il contient 80% des
observations.
F (D 1 ) = 0, 25 1 n
N (D 1 ) = 10
F (D 2 ) = 0, 50 ou 2 n
N (D 2 ) = 10
.. ..
. .
F (D 9 ) = 0, 75 9 n
N (D 9 ) = 10
Les centiles
De…nition
Les centiles sont les valeurs du caractère (x i ) qui partagent la série en
cent sous-ensemble égaux.
Ils sont au nombre de 99 : P1 , P2 , , P99 ;
L”intervalle intercentile est P99 P1 : il contient 98% des observations.
F (P 1 ) = 0, 01 1 n
N (P 1 ) = 100
F (P 2 ) = 0, 02 ou 2 n
N (P 2 ) = 100
.. ..
. .
F (P 99 ) = 0, 99 99 n
N (P 99 ) = 100
Caractéristiques de dispersion :
L’étendue d’une série ou l’intervalle de variation
L’écart absolu moyen
La variance et l’écart-type
L’étendue
L’étendue :
C’est la manière la plus simpliste de mesurer la dispersion ;
L’étendue d’une série est la di¤érence de ses valeurs extrêmes ;
E = xn x1 (23)
Example
Soit la série suivante : f8; 15; 20; 30; 40; 60g
Solution
E = 60 8 = 52
L’étendue
Example
Pendant une période déterminée, les investissements réalisés par 80 PME d’une
région se présentent comme suit :
Solution
E = 800 200 = 600
De…nition
Le mot écart signi…e la valeur absolue de la di¤érence entre une
valeur observée et une valeur centrale (le plus souvent la moyenne).
De…nition
Cas d’une série statistique discrète
Ecart absolu moyen par rapport à la moyenne arithmétique :
1 n
n i∑
ex = ni jxi xj (25)
=1
De…nition
Cas d’une série statistique continue groupée en classes :
Ecart absolu moyen par rapport à la moyenne arithmétique :
1 n
n i∑
ex = ni jC i xj (26)
=1
Salaire Nombre
horaire d’employés
30-50 33
50-70 35
70-90 19
Total 87
La variance
De…nition
La variance d’une série statistique est la moyenne des carrés des écarts à
la moyenne arithmétique.
n
1
V (x ) =
n ∑ ( xi x )2 (27)
i =1
∑ni=1 ni xi2
x2 (28)
∑ni=1 ni
L’écart-type
De…nition
L’écart-type d’une série statistique est la racine carrée de sa variance
V(X) ;
q
σ (X ) = V (X ) (29)
s
1 n
n i∑
= (xi x )2
=1
L’écart-type
Example
Tableau : Salaire horaire des employés de deux entreprises.
30-50 33
50-70 35
70-90 19
Total 87
Indice de concentration
De…nition
On peut étudier la concentration directement à partir de la di¤érence entre la
médiale et la médiane d’une distribution.
Médiale Médiane
I ndice de concentration = 100
Etendu
La médiale
La médiale est une valeur telle que la somme des observations qui lui sont
inférieures est égale à la somme des observations qui lui sont supérieures.
La médiale partage donc la somme des observations en deux parties
égales.
La médiale est un paramètre statistique qui dépend de la somme de toutes
les observations.
pour déterminer la médiale, il faut raisonner en terme de sommes
cumulées, la médiale est alors la valeur de la variable qui correspond à la
moitié de la somme des observations.
La médiale est calculée pour une variable statistique groupée en classes, la
classe médiale est la classe qui contient la médiale.
La médiale
De…nition
On détermine la médiale par interpolation linéaire.
Désignons par :
L0 : borne inférieure de la classe médiale ;
ai : amplitude de la classe médiale ;
∑ni=1 ni xi : somme des observations ;
Sn 1 : sommes des observations cumulées croissantes de la classe qui
précède la classe médiale ;
ni xi : somme des observations de la classe médiale.
" ∑n ni xi
#
i =1
2 Sn 1
Ml = L0 + ai
ni xi
La médiale
Example
La répartition de la surface, en m2 , de 100 logements est représentée dans le
tableau suivant :
La médiale
Solution
La moitié de la somme des observations :
∑ni=1 ni xi 6660
= = 3330
2 2
En consultant les sommes cumulées croissantes, la classe médiale est la
classe 60 à 100 m2 . La médiale est donc :
3330 1740
Ml = 60 + 40 = 80, 92m2
3040
La moitié de la super…cie totale des 100 logements est répartie sous forme
de logements dont la super…cie est inférieure ou égale à 80,92 m2 et
l’autre moitié sous forme de logements dont la super…cie est supérieure ou
égale à 80,92 m2 .
La médiale
Solution
L’indice de concentration est donc
Médiale Médiane
I ndice de concentration = 100
Etendu
80.92 60
= 100
260
= 8, 04
Exercice
Salaire mensuel xi E¤ectif de la classe ni
[500, 1500[ 50
[1500, 2500[ 125
[2500, 5500[ 25
On obtient
Salaire E¤ectif de Centre de Masse sal % de fréq. cumulées
mensuel xi la classe ni la classe Ci ni ci MS gi MS F (nx )
[500, 1500[ 50 1000 50000 0.125 0.125
[1500, 2500[ 125 2000 250000 0.625 0.75
[2500, 5500[ 25 4000 100000 0.25 1
∑ ni ci 400000
g = 1 ∑ fj +1 qj +1 + qj
g = 1 (0.25 (0.125 + 0.00) + 0.625 (0.75 + 0.125)
+0.125 (1 + 0.75)
= 0.203
(1 0, 875) (0, 75 + 1)
= 0, 1094
2
Au …nal :
1
Ind.Gini = 2 (0, 0156 + 0, 2734 + 0, 1094) = 0, 2032
2