Vous êtes sur la page 1sur 44

FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Chapitre 2 : Série statistique à un caractère

1 . Ca r a c t é r i s t i q u e s de t e n da n c e c e nt r a l e

Dans le paragraphe précédent, nous avons appris à ranger les données


et à les présenter à l’aide de tableaux statistiques. Nous avons
également étudié les graphiques qui constituent un moyen
particulièrement adéquat de présentation des résultats. Grâce à eux, on
peut se faire une première idée de l’aspect d’une distribution statistique.
Cependant ces constatations visuelles demeurent imprécises et restent
soumises aux dangers d’une appréciation synthétique forcément
subjective. Il faut donc trouver le moyen d’exprimer, autrement que par
un commentaire de graphiques ou de tableaux, les éléments qui
particularisent la série d’observations dont dispose le statisticien. On
utilise alors les caractéristiques de tendance centrale (ou de position) qui
sont les moyennes, les quantiles et le mode.

1 . 1 L e s m o ye n n e s

1 . 1 . 1 M o ye n n e a r i t h m é t i q ue

La moyenne arithmétique d’une série statistique x i  i  1 à n, est égale


à la somme des valeurs observées, divisée par le nombre
d’observations.
On la note généralement x .
Ainsi
1 n
x   xi
n i1

Dans le cas d’un tableau de distribution, on a

p p
1
x
n
 n i x i   fi x i
i1 i1

où x 1, x 2 ,, x p sont les valeurs observées (ou les centres des classes
si la distribution est groupée), n1, n 2 ,, n p sont les effectifs
correspondants, f1, f 2 ,, fp sont les fréquences correspondantes

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
1
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

ni p
fi  et n   ni .
n i1
Propriété

Soit x i  une série statistique et y i  la série définie par y i  ax i  b où


a et b sont deux réels quelconques, alors :

y  ax b

Démonstration

1 p 1 p
y 
n i1
ni y i 
n
 n i a x i  b
i1
p
1 1 p
 a .  ni x i  b .  ni
n i1 n i1
 a.x  b

Remarque : Cette formule de changement de variable permet de


simplifier le calcul de la moyenne arithmétique dans certains cas.

E x e r c i c e d’ a pp l i c a t i o n

Un étudiant obtient aux examens les notes suivantes : mathématiques


10 (coefficient 2), économie 14 (coefficient 4), statistique 12 (coefficient
2), langues 8 (coefficient 1). Calculer sa moyenne à l’examen.

Discipline Notes x i Coefficients n i ni x i

Mathématiques 10 2 20
Economie 14 4 56
Statistique 12 2 24
Langues 8 1 8
Total n9 108

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
2
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

La note moyenne est

1 4 108
x
n
 ni x i  9
 12
i 1

Remarque : Si toutes les disciplines étaient affectées du même


coefficient, la note moyenne serait :

10  14  12  8 44
x   11
4 4

1 . 1 . 2 M o ye n n e g é om é t r i qu e

La moyenne géométrique d’une série statistique positive x i  , i  1,, n ,


est la racine n ième du produit des valeurs observées.

On la note généralement G.

Ainsi :
1
 n n
G  n x 1  x 2  x 3    x n   x i 
 i1 
n
avec  xi  x1  x 2  x 3    x n
i1

Dans le cas d’un tableau de distribution, on a :

1
p ni  n
p
G   xi    xifi
i 1  i 1

ni p
a ve c fi 
n
et n  ni .
i1

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
3
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Le calcul de G peut s’effectuer grâce à la relation :

p
1
log G 
n
 n i log x i
i1

 i  1, 2 , , p si x i  0 , o ù l o g e s t l e l o g a r i t h me n é p é r i e n .

Exercice d’application

Calculer la moyenne géométrique de la série suivante :

xi ni
2 2
16 1
Total 3

Corrigé

La moyenne géométrique est :


G  2 2  16 1  1/3
 64 
1/3
 4

O n p e u t a u s s i p a s s e r a u x l o g a r i t h me s :

1
log (G)  log( 64)  1,38629
3
De la relation précédente, on tire

G  exp(1,38629 )  4 .

1 . 1 . 3 . M o ye n n e ha r m o ni q u e

La moyenne harmonique d’une série statistique strictement


positive  x i , i  1,, n est égale à l’inverse de la moyenne arithmétique
des inverses des valeurs observées. On la note H.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
4
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Ainsi :
1 n
H 
1 n 1 n 1

n i 1 x i
x
i 1 i
ou
1 1 n 1
 
H n i 1 x i

Dans le cas d’un tableau de distribution, on a :

p
 ni
1
H  i 1 
p p
n f
 xii  xii
i 1 i 1

Exercice d’application : Le jour d’un devoir de statistique, un


étudiant va de son domicile à la faculté à la vitesse de 3 km/h. Il
en revient à la vitesse de 6 km/h. Quelle est sa vitesse moyenne ?

Corrigé

Soit d la distance, V1 et V2 les vitesses, t 1 et t 2 les temps de


parcours à l’aller et au retour. Le temps à l’aller est t 1  d / V 1 et au
retour t 2  d / V 2 . La vitesse moyenne est :

2d 2d 2
VM   
t1  t 2 d d 1 1
 
V1 V2 V1 V2

La vitesse moyenne est donc ici la moyenne harmonique des vitesses :

2
VM   4 km/h
1 1

3 6

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
5
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

1.1.4. Moyenne quadratique

La moyenne quadratique d’une série statistique positive  x i  , i  1,  , n


est la racine carrée de la moyenne arithmétique des carrés des valeurs
observées. On la note Q.

n
Q 1
n  xi2
i 1

Dans le cas d’un tableau de distribution, on a :

1
p 
2 2
  ni x i  1
  p 
2 2
Q   i 1      fi x i 
p
  i 1 
  i
n

 i 1 

Remarque : Soit une série pour laquelle les quatre moyennes définies
ci-dessus existent, on a alors :

H  G  x  Q

Exercice d’application : Soit la série statistique simple:

1, 2, 5, 7, 10, 13.

Calculer les moyennes arithmétique, géométrique, harmonique,


quadratique.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
6
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Corrigé

1) Moyenne arithmétique

1 n
x   x i  1  2  5  7  10  13
1
n i 1 6
1
  38  6,33
6

2) Moyenne géométrique

1
n n
 1 2  5  7  10  13 6
1
G   x i 
i 1 
 9100  6  4,57
1

3) Moyenne harmonique

n 6
H 
n 1 1  1  1  1  1
 1
xi
2 5 7 10 13
i 1
 2,97

4) Moyenne quadratique

Q
1 n 2
 xi 
n i1
1 2
6

1  2 2  5 2  7 2  10 2  13 2 
 58  7,61

On vérifie : H  G  x  Q

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
7
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

1.2. Les quantiles


1.2.1. Définitions
On appelle quantile d’ordre  %, et on note Q  , la valeur x i du
caractère telle que  % des valeurs observées soient inférieures
strictement à x i .

Si F désigne la fonction « fréquences cumulées croissantes » alors :


FQ   
100

a) La médiane

Elle correspond au quantile d’ordre 50%. C’est donc la valeur du


caractère étudié telle qu’il y ait autant d’observations qui lui soient
supérieures que d’observations qui lui soient inférieures. La médiane
partage donc la série des valeurs observées en deux séries de même
taille.

C’est la valeur Me de la variable statistique pour laquelle la fréquence


1
cumulée est égale à .
2
1
FM e  
2
b) Les quartiles

On a 3 quartiles Q1, Q 2 , Q 3  qui partagent la série en quatre séries de


même taille.

Q1 Q2 Q3

25% 25% 25% 25%

Q1 est le premier quartile, c’est donc le quantile d’ordre 25%. Ce qui


signifie que 25% des observations sont inférieures au premier quartile
Q1 .

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
8
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Q 2 est le deuxième quartile, c’est le quantile d’ordre 50%. Q 2 est donc


confondu avec la médiane. 50% des observations sont inférieures au
deuxième quartile Q 2 = Me .

Q 3 est le troisième quartile, c’est le quantile d’ordre 75%. Ce qui signifie


que 75% des observations sont inférieures au troisième quartile Q 3 .

F ( Q1 ) = 0,25 , F ( Q 2 ) = 0,50 , F ( Q 3 ) = 0,75.

c) Les déciles

On a 9 déciles D1 , D 2 , D 3 ,, D 9  qui partagent la série en 10 séries de


même taille. Le premier décile D1 correspond au quantile d’ordre 10%.
Le cinquième décile correspond à la médiane.

D1 D5 D9

10% 10%

10% des observations sont inférieures à D1 .

90% des observations sont inférieures au neuvième décile D 9 .

d) Les centiles

On a 99 centiles C1, C 2 , C 3 ,, C 99  qui partagent la série en 100 séries


de même taille.

Le premier centile C1 correspond au quantile d’ordre 1%. Le


cinquantième centile correspond à la médiane.

C1 C2 C 98 C 99

1% 1%

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
9
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

1% des observations sont inférieures au premier centile C1 .

99% des observations sont inférieures à C 99 .

1.2.2 Détermination d’un quantile d’ordre  d’une série groupée

On distingue deux cas :

a) Cas discret

La fonction de répartition est une fonction discontinue en escaliers.

Fi

Fx i 1 

%

Fx i 

x i 1 xi x i 1

On convient alors de considérer comme quantile d’ordre % , la valeur


observée x i 1 telle que l’on ait :

Fx i    %  Fx i1 


On a : Q   x i  1

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
10
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Exemple d’application

Une enquête effectuée auprès de 100 familles sénégalaises a conduit à


la distribution suivante, selon le nombre d’enfants.

xi 0 1 2 3 4 5 6 7 8
ni 6 9 13 16 10 12 10 4 3

xi 9 10 et plus
ni 5 12

Le caractère « nombre d’enfants » qui est ici étudié est un caractère


quantitatif discret. Nous allons déterminer la médiane Me et les quartiles
Q1 et Q 3 .

Pour cela, il nous faut calculer les fréquences cumulées.

xi fi Fi
0 0,06 0,06
1 0,09 0,15
2 0,13 0,28
3 0,16 0,44
4 0,10 0,54
5 0,12 0,66
6 0,10 0,76
7 0,04 0,80
8 0,03 0,83
9 0,05 0,88
10 0,12 1,00

1) Détermination de la médiane

La médiane est le quantile d’ordre 50 %.

44 % < 50 % < 54 %
Fx i  < 50 % < Fx i 1 
F3 < 50 % < F4 

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
11
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Le second quartile ou la médiane est : Q 2  Me  4


50 % des familles ont moins de quatre enfants.

2) Calcul de Q1

Le premier quartile est le quantile d’ordre 25 % .

15 % < 25 % < 28 %

Fx i  < 25 % < F x i 1 
F1 < 25 % < F2 

Le premier quartile est : Q1 = 2

25 % des familles ont moins de deux enfants.

3) Calcul de Q 3

Le troisième quartile correspond au quantile d’ordre 75 %.

66 % < 75 % < 76 %

Fx i  < 75 % < F x i 1 
F5 < 75 % < F6 

Le troisième quartile est : Q 3 = 6.

75 % des familles ont moins de six enfants.

b) Cas continu (Interpolation linéaire)


Pour calculer le quantile d’ordre  % , il faut déterminer la classe dans
laquelle les fréquences cumulées croissantes atteignent  % .
Soit [a, b[ cette classe ; on note :

a : limite inférieure de la classe


b : limite supérieure de la classe
F(a) : fréquence cumulée croissante au point a
F(b) : fréquence cumulée croissante au point b

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
12
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Les fréquences cumulées sont en pourcentage :

F(b) ---------------------------------------------------

 - ---------------------------

F(a) -----------

a Q b

a < Q < b

F(a) <  < F(b)


Q  a   F(a)

b  a F(b)  F(a)
ou encore :
  F(a)
Q  a  b  a  
F(b)  F(a)

Remarque : Détermination graphique d’un quantile d’ordre  %


On peut déterminer graphiquement la valeur du quantile d’ordre  % à
l’aide de la courbe des fréquences cumulées croissantes.

% - - - - - - - - - - - - - - -

0,5 - - - - - - - - - -

Me Q
Cours de statistique descriptive
Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
13
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Exemple d’application : Calcul de quartiles


La représentation des employés d’une entreprise en fonction de la prime
de fin d’année est la suivante.

Prime en F ni f i en % Fi en %
[0,1000[ 18 2,1 2,1
[1000,2000[ 44 5,1 7,2
[2000,3000[ 112 13,0 20,2
[3000,3500[ 120 14,0 34,2
[3500,4000[ 138 16,0 50,2
[4000,4500[ 164 19,1 69,3
[4500,5000[ 106 12,3 81,6
[5000,6000[ 98 11,4 93,0
[6000,7000[ 52 6,0 99,0
[7000,8000[ 8 1,0 100
Total 860 100,0

Nous allons calculer les quartiles par interpolation linéaire. En effet le


caractère « prime de fin d’année » est quantitatif continu. On utilise le
tableau des fréquences cumulées croissantes :
1) Le premier quartile est dans la classe [3000,3500[, car les fréquences
cumulées croissantes dépassent 25 %.
3000  Q1  3500
20,2  25  34,2

Q1  3000 25  20,2

3500  3000 34,2  20,2
25  20,2
Q1  3000  500   3171,43
34,2  20,2

25 % des employés ont une prime de fin d’année inférieure à 3171,43 F.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
14
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

2) Le deuxième quartile est dans la classe [3500,4000[ , car les


fréquences cumulées croissantes dépassent 50 %.

3500  Q2  4000
34,2  50  50,2

Q 2  3500 50  34,2

4000  3500 50,2  34,2
50  34,2
Q 2  3500  500   3993,75
50,2  34,2

50 % des employés ont une prime de fin d’année inférieure à 3993,75 F.

3) Le troisième quartile est dans la classe [4500,5000[, car les


fréquences cumulées croissantes dépassent 75 %.

4500  Q3  5000
69,3  75  81,6

Q3  4500 75  69,3

5000  4500 81,6  69,3

75  69,3
Q3  4500  500   4731,70
81,6  69,3

75 % des employés ont une prime de fin d’année inférieure à 4731,70 F.

1.2.3. Détermination d’un quantile d’ordre  d’une série de


données ponctuelles

Dans ce cas, on classe d’abord les données ponctuelles en ordre


croissant. Calculer par exemple le quantile d’ordre 50 %, revient à
déterminer la valeur du caractère x i telle que 50 % des valeurs
observées soient strictement inférieures à x i .

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
15
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Si le nombre des observations est impair, on a : n  2p  1.


On convient de considérer comme quantile d’ordre 50 %, la p  1ième
valeur de la série des valeurs observées.

Si le nombre des observations est pair, on a : n  2p . Deux cas sont


alors possibles :

La p ième et la p  1ième valeur de la série sont égales ; on conviendra


de considérer, comme quantile d’ordre 50 %, cette valeur.

La p ième et la p  1ième valeur de la série sont différentes ; on prend


comme quantile d’ordre 50 %, la p  1ième valeur de la série.

On peut procéder de la même manière pour les autres quantiles.

Exemple d’application

Soit une série statistique possédant un nombre impair de termes

7, 9, 9, 18, 37, 37, 37, 39, 3, 7, 3

Nous allons déterminer les quartiles de cette série statistique.

Dans un premier temps, nous rangeons par ordre croissant les


nombres de cette série ; d’où on obtient :

3, 3, 7, 7, 9, 9, 18, 37, 37, 37, 39 

Dans un second temps, nous déterminons les trois quartiles :

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
16
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

1) Le second quartile ou médiane

Nous savons que la médiane Me ou second quartile est le nombre


qui partage la série des valeurs observées en deux séries de
même taille.

D’où on obtient :

3 3 7 7 9 9 18 37 37 37 39

5 éléments Me 5 éléments

La médiane est : M e  9 .

2) Le premier quartile

Nous avons ainsi obtenu deux nouvelles séries

S1  3, 3, 7, 7, 9  et S 2  18, 37, 37, 37, 3 9 


Le premier quartile correspond à la médiane de la nouvelle série S1

D’où on obtient 3 3 7 7 9

Q1

Le premier quartile est Q1  7 .

3) Le troisième quartile

Le troisième quartile correspond à la médiane de la nouvelle série S 2

D’où on obtient 18 37 37 37 39

Q3

Le troisième quartile est Q 3  37

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
17
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

1.3. Le mode
1.3.1. Définition
Le mode M o d’une distribution statistique est sa valeur la plus fréquente.
C’est la valeur du caractère qui correspond à l’effectif le plus grand
ou à la fréquence la plus importante. Le mode permet ainsi de
connaître la valeur la plus probable du caractère.

1.3.2. Détermination

Deux cas se présentent pour sa détermination pratique.

a) Cas où la variable est quantitative discrète

Dans ce cas, le mode est défini avec précision. Il correspond à la valeur


qui a l’effectif le plus élevé.

b) Cas où la variable est quantitative continue


Si la distribution est répartie en classes, le mode est indéterminé. Dans
ce cas on peut seulement définir la classe modale.

Si les classes de la distribution sont d’amplitudes égales, la classe


modale est la classe d’effectif maximum. Par contre, si les classes sont
d’amplitudes inégales, la classe modale est la classe de densité
maximum.
Remarque : Une distribution peut avoir un ou plusieurs modes

 Si une distribution statistique possède un seul mode, elle est


dite unimodale ;

 Si elle possède deux modes, elle est dite bimodale ;

 Si elle possède plusieurs modes, elle est dite plurimodale.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
18
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Exemple d’application : Détermination du mode dans le cas d’une


variable discrète

Une enquête effectuée auprès de 100 familles sénégalaises a conduit à


la distribution suivante, selon le nombre d’enfants.

xi 0 1 2 3 4 5
ni 6 9 13 16 10 12

xi 6 7 8 9 10 et plus
ni 10 4 3 5 12

Ici le mode est M o = 3 car n i est maximum pour x i = 3, la plupart des


familles ont trois enfants.

2. Caractéristiques de dispersion
Les paramètres de dispersion sont des nombres qui mesurent la
dispersion des valeurs observées autour d’un paramètre de position
 x , M e ,   . Ces paramètres permettent de comparer des séries
statistiques de même nature.

2.1. Les moments


2.1.1 Moments d’ordre r

On appelle moment d’ordre r r  IN d’une variable X le nombre :


p
 ni x i
r
p
m r X   i1
  fi x i
r
n i1
avec :
p ni
n  ni ; fi 
n
i1

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
19
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Remarque :

Si l’on dispose de données ponctuelles, alors ni =1 pour tout i ; pour des


données groupées, x i est le centre de la classe n° i.

2.1.2 Moments centrés d’ordre r

On appelle moment centré d’ordre r r  IN  le nombre :

p
 ni x i  x 
r
p
 r X   i1
  fi x i  x 
r
n i1
avec :
p
1
x
n
 ni x i
i1

2.1.3. Egalités remarquables

On a :
mo  1
m1  X
m2  Q (moyenne quadratique)
o  1 , 1  0

En utilisant la formule du binôme de Newton, on montre les relations


suivantes :
2
 2  m 2  m1
 3  m 3  3 m 2 m1  2 m13
2 4
 4  m 4  4 m 3 m 1  6 m 2 m1  3 m 1

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
20
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Remarque : Formule du binôme de Newton

Soient a et b deux éléments et n un entier positif. Le développement de


a  bn est donné par la formule du binôme de Newton :
n
a  b  n
  Ckn a k b n-k
k 0

Les C kn s’appellent aussi coefficients binomiaux.

2.1.4. Changements d’origine et d’unité

Soient a et b deux réels quelconques, et les séries statistiques :


X  x i , i  1,..., n ; Y  y i  , i  1,..., n
telles que :
yi  a xi  b

Alors :
 r  IN  r Y   a r  r X 

Démonstration
y i  y  a x i  b  ( a x  b)
 a ( xi  x )
On a :
1 p
 r Y    n i y i  y 
r
n i1
1 p
  ni a x i  x r
n i 1
p
r 1
a  n i x i  x r
n i 1
 a r  r X 

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
21
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

2.2 La variance et l’écart type


2.2.1 Variance

On appelle variance d’une variable X son moment centré d’ordre 2 :

p
 ni x i  x 
2
p
Var X   i1
  fi x i  x 
2
n i1

Formule développée
1 p
Var X    n i x i 2  x 2
n i 1

 m 2  m12
Démonstration
1 p
Var X    n i x i  x 2
n i 1

1 p

  ni x i 2  2 x x i  x 2
n i 1

1 p 1 p 2 1
p
  ni x i  2 x  ni x i  x
2
 ni
n i 1 n i 1 n i 1
1 p
  n i x i 2  2 x .x  x 2 .1
n i 1

1 p
 
n i 1
ni x i 2  x 2

Propriété
Soit x i  une série statistique et y i  la série définie par y i  a x i  b , où
a et b sont deux réels quelconques, alors :

Var ( Y )  a 2 Var (X)

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
22
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

2.2.2 Ecart Type


De tous les critères de dispersion, l’écart-type est certainement le
plus utilisé. L’écart type d’une série est égal à la racine carrée de la
variance :
X   Var X 

L’écart type, noté  (sigma) est une mesure de dispersion absolue,


il s’exprime dans la même unité que les valeurs observées et mesure la
dispersion autour de la moyenne x . Plus l’écart type est grand, plus la
dispersion des observations autour de la moyenne est importante.

2.3 Le coefficient de variation

Pour faciliter les comparaisons entre séries, on utilise une mesure


de dispersion relative appelée coefficient de variation. Le coefficient de
variation CV est le rapport de l’écart type  à la moyenne x :

CV 
x
C’est un nombre sans dimension et indépendant des unités choisies. On
l’utilise pour comparer par exemple des distributions de salaires dans
différents pays. Ainsi les salaires des journalistes ont pour coefficient de
variation 0,45 alors que les salaires des enseignants ont pour coefficient
de variation 0,75 : le salaire est une variable relativement (c’est à dire
compte tenu du rapport des moyennes) plus homogène chez les
journalistes que chez les enseignants.

Dans la pratique une distribution est dite homogène si son coefficient de


variation est inférieur à 0,30 ; elle sera considérée comme hétérogène
si son coefficient de variation est supérieur ou égal à 0,30.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
23
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Exemple d’application : Le tableau ci-dessous représente la


distribution des notes obtenues à un devoir de Statistique pour 50
étudiants.

Notes Effectifs
[0, 5[ 4
[5, 10[ 17
[10, 15[ 26
[15, 20[ 3
Total 50

Calculer la moyenne, l’écart type et le coefficient de variation de cette


distribution.

Réponse

On dresse le tableau suivant, où x i et n i sont le centre et


l’effectif de la classe numéro i, respectivement.

Notes xi ni nixi ni x i 2
[0, 5[ 2,5 4 10 25
[5, 10[ 7,5 17 127,5 956,25
[10, 15[ 12,5 26 325 4062,5
[15, 20[ 17,5 3 52,5 918,75
Total 50 515 5962,5

a) Moyenne arithmétique :

1 4 515
x   ni x i   10,3
n i 1 50

b) La variance est
1 p
Var  X    ni xi  x 2
2

n i 1
5962,5
  (10,3) 2
10
 13,16

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
24
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

c) L’écart type est ( X)  13,6  3,628

La dispersion des notes autour de la note moyenne est 3,628

d) Le coefficient de variation est :


( X) 3,628
CV  
X 10,3
 0,352

Le coefficient de variation est 35,2%, la distribution des notes est


hétérogène, elle est donc relativement dispersée.

2.4 Les écarts absolus moyens

Les caractéristiques de dispersion qui suivent sont construits à partir de


la même idée : mesurer la dispersion d’une série au moyen des écarts
entre les observations x i et leur moyenne arithmétique x . Si l’on fait la
moyenne de ces quantités, on obtient :

1 p
 ni x i  x 
n i 1

Mais par construction cette moyenne des écarts à la moyenne est nulle.
Donc cette quantité ne peut être une mesure de dispersion, une façon de
contourner cette difficulté est de prendre les écarts en valeur absolue.

2.4.1. Ecart absolu moyen par rapport à la moyenne

Il est défini par :


1 p p
e x   ni x i  x   fi x i  x
n i 1 i 1

e x est donc la moyenne des écarts à la moyenne.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
25
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

2.4.2. Ecart absolu moyen par rapport à la médiane

Il est défini par :


1 p
e Me   ni x i  Me
n i1
p
  fi x i  M e
i1

eMe est la moyenne des écarts à la médiane.

Remarque

Pour toute distribution statistique :

e Me  e x  

2.5. Les écarts inter quantiles

2.5.1. Intervalles inter quantiles

- L’intervalle interquartile est [Q1 , Q 3 [ , il contient 50 % des


observations.
- L’intervalle interdécile est [D1 , D 9 [ , il contient 80 % des
observations.
- L’intervalle intercentile est [C1 , C 99 [ , il contient 98 % des
observations.

xmin C1 D1 Q1 Q3 D 9 C 99 xmax

50 %

80 %

98 %

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
26
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

2.5.2 Ecarts inter quantiles

- L’écart interquartile est le nombre Q 3  Q1 .


- L’écart interdécile est le nombre D 9  D1 .
- L’écart intercentile est le nombre C 99  C1 .
Ces écarts permettent de mesurer la dispersion de la série autour de la
médiane.

2.5.3 Etendue

C’est la valeur de dispersion la plus simple. Encore appelée intervalle


de variation, amplitude de la série ou intervalle maximal, l’étendue W
est égale à la différence entre la valeur maximum observée et la valeur
minimum observée.
On note :
W  X max  X min

L’étendue est un indice très élémentaire, il est très utilisé en contrôle de


fabrication industrielle.

Exercice d’application

On considère la distribution suivante :

Classes [15,25[ [25,35[ [35,45[ [45,55[ [55,65[ [65,75[ [75,85[

Effectifs 9 15 22 29 17 6 2

1) Calculer les quartiles de cette distribution. En déduire l’intervalle et


l’écart interquartile.

2) Calculer l’écart absolu moyen par rapport à la moyenne.

3) Calculer l’écart absolu moyen par rapport à la médiane.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
27
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Réponse : On dresse le tableau suivant :

Classes xi ni ni x i Fi en % ni x i  x n i x i  Me
[15,25[ 20 9 180 9 230,4 237,42
[25,35[ 30 15 450 24 234,0 245,70
[35,45[ 40 22 880 46 123,2 140,36
[45,55[ 50 29 1450 75 127,6 104,98
[55,65[ 60 17 1020 92 244,8 231,54
[65,75[ 70 6 420 98 146,4 141,72
[75,85[ 80 2 160 100 68,8 67,24
Total 100 4560 1175,2 1168,96

1). Calcul des quartiles


Q1  [35, 45[ , 24  25  46
25  24
Q1  35  10 .  35,45
46  24
Q 2  [45, 55[ , 46  50  75
50  46
Me  Q2  45  10 .  46,38
75  46
Q 3  [55, 65[ , 75  75  92
75  75
Q 3  55  10 .  55
92  75
L’intervalle interquartile est [Q1 , Q 3 [  [35,45 ; 55 [ , cet intervalle
contient 50 % des observations.

L’écart interquartile est le nombre :

Q 3  Q1  55  35,45  19,55

1 7 4560
x 
n i 1
ni x i 
100
 45,60

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
28
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

2) Calcul de l’écart absolu moyen par rapport à la moyenne

1 7 1175,2
e x   ni x i  x   11,75
n i 1 100

3) Calcul de l’écart absolu moyen par rapport à la médiane.

Me  46,38

1 7 1168,96
eMe   n i x i  M e   11,69
n i 1 100

On vérifie que : eMe  e x

3. Caractéristiques de forme

Les caractéristiques de forme permettent de préciser l’allure de la


courbe des fréquences sans avoir recours à son tracé.
Les principales caractéristiques en ce qui concerne la forme sont : la
dissymétrie (ou l’asymétrie) et l’aplatissement.

3.1 La dissymétrie

Il est toujours intéressant de savoir si une courbe de fréquence est


symétrique ou non, et si elle ne l’est pas de mesurer sa dissymétrie. Il
s’agit de mesurer son degré de dissymétrie.
L’asymétrie d’une distribution s’étudie par rapport à une valeur
centrale. Elle cherche à évaluer si la distribution est, par rapport à
cette valeur centrale, plus étalée à gauche ou à droite, ou si, au
contraire les observations sont également réparties de part et
d’autre de cette valeur centrale.

La dissymétrie entraîne le fait suivant : les trois caractéristiques de


tendance centrale, c’est à dire le mode (Mo), la médiane (Me) et la
moyenne arithmétique ( x ), ne sont plus confondues au centre de
cette distribution, mais s’échelonnent dans un ordre différent selon
que la distribution est étalée vers la gauche ou vers la droite.
Cours de statistique descriptive
Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
29
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

On dispose de différents coefficients permettant de mesurer la


dissymétrie.

3.1.1 Le coefficient d’asymétrie de Fisher

Il est défini par :


3 3
  3
3  22

1 p
2   n i x i  x 2
n i 1
1 p
 3   n i x i  x 3
n i 1

 Si   0 , la distribution est étalée vers la gauche (on dit qu’elle a un


biais négatif).

Dans ce cas on a : x  Me  Mo

 Si   0 la distribution est symétrique

Dans ce cas on a : x  Me  Mo

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
30
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

 Si   0 , elle est étalée vers la droite ( on dit qu’elle a un biais


positif).

Dans ce cas on a : Mo  Me  x.

3.1.2 Le coefficient de Yule

Il est défini par :


Q 3  Q 2   Q 2  Q1 
CD 
Q 3  Q1

- Si C D  0 , la distribution est étalée vers la gauche.


- Si C D  0 , la distribution est symétrique.
- Si C D  0 , la distribution est étalée vers la droite.

3.1.3 Autres coefficients d’asymétrie

Premier coefficient de dissymétrie de Pearson :


x  M0
P1 

Deuxième coefficient de dissymétrie de Pearson :

3 x  M e 
P2 

3.2. L’aplatissement

Une distribution statistique peut être plus ou moins aplatie selon


qu’une proportion plus ou moins grande des observations est
proche de son mode. En effet, plus une forte proportion des
individus prendra une valeur proche de celle du mode de la
distribution , plus l’aplatissement sera faible.
Cours de statistique descriptive
Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
31
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

On mesure l’aplatissement d’une courbe par comparaison à la courbe


« normale » de Laplace-Gauss dont le moment centré d’ordre 4 est égal
à 3.
Le degré d’aplatissement d’une courbe est caractérisé par la valeur de :
4 4
 
4  22

 est appelé coefficient d’aplatissement de Pearson.

 Si   3 , la distribution est plus aplatie que la distribution normale


(on dit qu’elle est hyponormale ou platykurtique)

 Si   3 , la distribution est « normale » (courbe en « cloche » de


Gauss).

 Si   3 , la distribution est moins aplatie que la distribution normale


(on dit qu’elle est hypernormale ou leptokurtique).

Remarque : Le coefficient d’asymétrie de Fisher et le coefficient


d’aplatissement de Pearson sont sans dimension et indépendants d’un
changement d’échelle et d’origine.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
32
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Exercice d’application : Le tableau ci-dessous représente la


distribution des notes obtenues à un devoir de Statistique pour 50
étudiants.

Notes Effectifs
[0, 5[ 4
[5, 10[ 17
[10, 15[ 26
[15, 20[ 3
Total 50

Calculer les moments centrés d’ordre 2, 3 et 4, puis le coefficient


d’asymétrie de Fisher et le coefficient d’aplatissement de Pearson.

Réponse

On dresse le tableau suivant, où x i et ni sont le centre et l’effectif


de la classe numéro i, respectivement.

xi ni ni x i ni ( x i  x ) 2 n i ( x i  x )3 ni ( x i  x ) 4
2,5 4 10 243,36  1898,208 14806,0224
7,5 17 127,5 133,28  373,184 1044,9152
12,5 26 325 125,84 276,848 609,0656
17,5 3 52,5 155,52 1119,744 8062,1568
Total 50 515 658  874,8 24522,16

On trouve :
Moyenne arithmétique :
1 4 515
x 
n i 1
ni x i 
50
 10,3

Moment centré d’ordre deux

1 4 658
 2   ni ( x i  x ) 2   13,2
n i 1 50

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
33
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Moment centré d’ordre trois

1 4  874,8
 3   ni ( x i  x ) 3   17,5
n i 1 50

Moment centré d’ordre quatre

1 4 24522,16
 4   ni ( x i  x ) 4   490,4
n i1 50

Coefficient d’asymétrie de Fisher

3  17,5
    0,4
 23 / 2 47,7

La distribution des notes est étalée vers la gauche.

Coefficient d’aplatissement de Pearson

4 490,4
   2,8
22 173,2

La distribution des notes est hyponormale.

Exercice d’application : On considère la distribution suivante :

Classes [15,25[ [25,35[ [35,45[ [45,55[ [55,65[ [65,75[ [75,85[

Effectifs 5 15 32 40 66 25 17

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
34
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

1) Calculer les quartiles de cette distribution, puis le coefficient de


dissymétrie de Yule.

2) Calculer ses moments centrés d’ordre 2,3 et 4, puis le coefficient


d’asymétrie de Fisher et le coefficient d’aplatissement de Pearson.

Corrigé

On dresse le tableau suivant, où x i est le centre de la classe numéro i


x  50
et y i  i , on a x i  10 y i  50 .
10
On posera z i  y i  y avec y  0,45 .

Fi en
xi ni fi en % yi n i yi ni z i2 ni z i3 ni z i4
%

20 5 2,5 2,5 3  15 59,5125  205,3181 708,3475


30 15 7,5 10 2  30 90,0375  220,5918 540,4500
40 32 16 26 1  32 67,28  97,556 141,4562
50 40 20 46 0 0 8,1  3,645 1,6402
60 66 33 79 1 66 19,965 6,0391
10,9807
70 25 12,5 91,5 2 50 60,0625 144,3001
93,0968
80 17 8,5 100 3 51 110,5425 718,8026
281,8833

200 100 90 415,5  141,15 2261,0364

1) Calcul des quartiles.


25  10
Q1  35  10.  44,375
26  10
50  46
Q2  55  10.  56,212
79  46
75  46
Q3  55  10.  63,787
79  46

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
35
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

 Coefficient de dissymétrie de Yule.

Q 3  Q 2   Q 2  Q1 
CD 
Q 3  Q1

7,575  11,837
CD    0,22
19,412

La distribution est étalée vers la gauche.

90
2) On a : y  0,45
200

 2 Y   2,0775 , donc  2 X   10 2  2 Y   207,75

 3 Y    0,70575 , donc  3 X   10 3  3 Y    705,75

 4 Y   11,305182 , donc  4 X   10 4  4 Y   113051,82

 Coefficient d’asymétrie de Fisher.

 3 X   705,75
 3
   0,236
 22 X 
2994,412

La distribution est étalée vers la gauche.

 Coefficient d’aplatissement de Pearson.

 4 X  113051,82
   2,62
 2 2 X  43160 ,0625

La distribution est légèrement hyponormale.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
36
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

4. Caractéristiques de concentration.

4.1 Introduction
4.1.1 Domaine d’application

Les indicateurs de dispersion peuvent parfois se révéler insuffisants


pour traduire certains phénomènes. La notion de concentration est
une notion connexe de celle de dispersion.

Y a-t-il concentration des revenus dans un pays donné ? Telle branche


industrielle est-elle concentrée ? Une mesure de la concentration se
révèle très utile pour répondre à de telles questions.

Deux conditions sont nécessaires pour étudier la concentration.


L’addition des différentes modalités du caractère doit avoir un sens ;
additionner les tailles des individus d’une population n’aurait guère de
signification.

Le partage de la masse globale du caractère doit être possible :


partage des revenus entre les individus ou répartition du chiffre
d’affaires globale d’un groupe d’entreprises entre ces entreprises ;
mais répartir la somme des tailles d’un groupe d’individus entre ces
individus serait absurde.

La mesure des inégalités de revenu, au niveau mondial, au niveau


national, avant ou après impôt, ou même au niveau d’une profession,
constitue des exemples d’application de la notion de concentration.

4.1.2 Notion de valeur globale (masse de valeurs)

On appelle valeur globale d’une série statistique, les valeurs n i x i , n i


étant l’effectif de la classe de centre x i .
On appelle valeur globale relative la quantité :
nx
qi  i i
p
 nixi
i 1

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
37
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

4.1.3 Notion de concentration

Une série statistique est dite concentrée si une faible proportion des
individus observés possède une forte proportion des valeurs globales.

Exemple 1 : Soit la série statistique représentant le salaire. Si 30 %


des salariés reçoivent 80 % de la masse salariale, alors on dit que
la distribution est fortement concentrée ; la distribution est dite
inégalitaire.

Exemple 2 : On considère une autre série statistique représentant le


salaire. Si 33 % des salariés reçoivent 30 % de la masse salariale,
alors on dit que la distribution est peu concentrée ; la distribution
est dite égalitaire.

4.2 L’écart de concentration


4.2.1 La médiale

La médiale est la valeur du caractère qui partage en deux la masse


globale du caractère. Elle est notée Mle .
La médiale est donc une médiane calculée relativement aux valeurs
globales relatives. C’est donc une quantité qui se détermine de façon
analogue à la médiane, mais au lieu de travailler sur les fréquences
cumulées Fi , on travaille sur les valeurs globales relatives cumulées Q i

Exemple 3 : Les salaires des employés d’une entreprise se


répartissent de la façon suivante :

Classes [0,10[ [10,20[ [20,30[ [30,40[ [40,50[


en 10 4 F CFA

Effectifs 200 200 200 200 200

Nous voulons déterminer la médiale de cette distribution. Pour cela, on


calcule les valeurs globales relatives cumulées croissantes à l’aide du
tableau suivant.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
38
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

Classes xi ni nixi q i en % Q i en %
[0,10[ 5 200 1000 4 4
[10,20[ 15 200 3000 12 16
[20,30[ 25 200 5000 20 36
[30,40[ 35 200 7000 28 64
[40,50[ 45 200 9000 36 100
1000 25000 100

ni x i i
qi   100 , Qi  qj
 i i
n x j 1
i
On calcule la médiale par interpolation linéaire.
Mle  [30 , 40 [ car les valeurs globales relatives cumulées croissantes
dépassent 50 %.
30  Mle  40
36  50  64
Mle  30 50  36

40  30 64  36
50  36
Mle  30  10 .
64  36
Mle  35

La médiale est 350 000 F CFA

La médiale est le salaire qui partage en deux la masse salariale.

La médiane de cette distribution vaut Me = 25.

4.2.2 Propriété
.
On peut montrer que l’on a toujours Mle > M e . L’écart Mle  M e est
donc toujours positif. La comparaison des valeurs de la médiane et de
la médiale constitue une mesure de concentration
L’étendue W de la série étant fixée, on peut montrer que l’écart
  Mle  M e est d’autant plus grand que la série est concentrée. On
prend donc le rapport de  à W pour mesurer la concentration.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
39
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

4.2.3 L’écart de concentration

L’écart de concentration est le rapport de  à W. On le note E

 Mle  M e
E 
W W
avec
W  X max  X min .

E est toujours compris entre 0 et 1 et est d’autant plus grand que la


concentration est forte.

Si l’on considère la distribution de l’exemple 3 ci-dessus on a :


  Mle  M e  35  25  10
W  50  0  50
D’où :
10
E  0,20 .
50

L’écart de concentration est plus proche de 0 que de 1, la


concentration n’est pas élevée. La distribution des salaires considérée
est faiblement concentrée, on dit qu’elle est égalitaire.

4.3 L’indice de concentration de Gini


4.3.1 La courbe de concentration

Cette courbe a été introduite par Gini en 1912, lors d’études sur les
salaires et les revenus. Elle a pour but de décrire les effets de la
concentration dans une population.
La courbe de concentration nécessite la détermination des fréquences
cumulées Fi .

On a donc :
 0  Fi  1
 i  1,2, , p 
0  Q i  1

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
40
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

On construit alors un carré de coté 1 sur lequel on porte en abscisses les


Fi et en ordonnée les Q i .

Ainsi on détermine (p+1) points (avec l’origine) à l’intérieur du carré ;la


courbe qui joint ces (p+1) points est appelée courbe de concentration ou
courbe de Gini ou courbe de Lorenz.

Traçons la courbe de concentration de la distribution de l’exemple 3


précédent.

Qi Fi
0,04 0,20
0,16 0,40
0,36 0,60
0,64 0,80
1 1

Qi

1 - --- -- -- -- -- --- --- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ---

Aire de
concentration

0,5 -
Courbe de
Gini

0 0,5 1 Fi

L’aire de concentration est faible.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
41
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

4.3.2 L’indice de concentration de Gini

Qi

1-- A

0 1 Fi
On appelle aire de concentration l’aire S comprise entre la courbe de
concentration et la diagonale OA du carré.

On appelle indice de concentration G (ou indice de Gini) le rapport de


l’aire S à l’aire du triangle OAB.
On a bien sûr
0  G  1.

G est d’autant plus grand que la série considérée est concentrée.


On utilise l’indicateur G pour mesurer la concentration.

4.3.3 Modes de calculs de l’indice G

On dispose de plusieurs méthodes pour déterminer numériquement


l’indice G

a) Méthode des triangles

p 1
G  Fj .Q j 1  Fj 1.Q j 
j 1
(p = nombre de classes).

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
42
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

b) Méthode des trapèzes


 p 

G  1  f1Q1    f j .Q j 1  Q j
 

 j2 

c) Méthode des différences moyennes

On appelle différence moyenne le nombre :

p p
1
DM 
2   n in j x j  xi
n i 1 j 1

Par cette méthode, on obtient :


DM 
G 
2x x

où   DM 
2
1
2  i j j
n n x  xi  
n i j

Exemple d’application : Calcul de l’indice de Gini par la méthode


des triangles

p 1
G   Fj .Q j 1  Fj 1.Q j 
j 1

On considère toujours la distribution de l’exemple 3, p = 5.


Fj Qj FjQ j1  Fj1Q j
0,20 0,04 0,016
0,40 0,16 0,048
0,60 0,36 0,096
0,80 0,64 0,160
1 1
0,32

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
43
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance

j 1 F1Q2  F2Q1  (0,20 0,16)  (0,40 0,04)  0,016

j  2 F2Q3  F3Q2  (0,40  0,36)  (0,60  0,16)  0,048

j 3 F3Q4  F4 Q3  (0,60  0,64)  (0,80  0,36)  0,096

j4 F4 Q 5  F5 Q 4  ( 0 ,80  1)  (1  0 , 64 )  0 ,16

Ainsi

G  0,016  0,048  0,096  0,16  0,32

Le coefficient de Gini vaut 0,32 ; il est plus proche de 0 que de 1, la


concentration n’est pas élevée. La distribution des salaires considérée
est faiblement concentrée, on dit qu’elle est égalitaire.

Cours de statistique descriptive


Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
44

Vous aimerez peut-être aussi