Vous êtes sur la page 1sur 2

Mesurer la concentration

La courbe de Gini
Cas d'un caractère discret: Soit un caractère statistique dont la distribution statistique est
( x 1 ,n 1) , ( x 2 ,n 2) , … ,( x p , n p ), les modalités x i étant classées par ordre croissant. Pour chaque
modalité x i du caractère statistique, on note pi les fréquences cumulées croissantes, et on note q i le
∑ nk x k
k ≤i
nombre q i= p . Par convention, on pose également p0=0 et q 0=0 . La courbe de
∑ nk x k
k=1
concentration, ou courbe de Gini, du caractère statistique quantitatif discret X , est la courbe
polygonale qui joint les points M i de coordonnées M i ( pi ,q i) , pour i variant de 0 à p.
Cas d'un caractère quantitatif continu: Dans le cas d'un caractère continu, pour chaque classe de
modalités ¿, on définit pi comme la fréquence cumulée croissante de la valeur a i+1 et q i comme dans
le cas d'un caractère discret, mais en prenant comme modalité x i le centre des classes de modalités ¿
. La courbe de concentration ou de Gini est alors la courbe reliant les points de coordonnées
M i ( pi ,q i).
Propriétés de la courbe de Gini: La courbe de Gini joint le point O(0 , 0) et le point A(1 , 1). Les
pentes de segments M i M i+ 1 étant de plus en plus grandes, cette courbe est convexe. Elle est donc
située en dessous de la droite qui joint les points O(0 , 0) et A(1 , 1) .
Remarque 1: Dans le cas d'une distribution totalement égalitaire, il n'y a qu'une seule classe de
modalités et la courbe de Gini est alors réduite à un seul segment: celui qui joint O et A .
Remarque 2: Dans le cas d'une inégalité extrême, la quasi-totalité des valeurs est détenue par une
infime minorité des individus. Cela signifie que la courbe de Gini est très proche de l'axe x x ' , puis de
la droite verticale d'équation x=1. On a alors deux types de graphiques selon que la distribution
statistique est ou non égalitaire, c'est-à-dire faiblement ou fortement concentrée.

L'indice de Gini, la mé diale


Définition: L'indice de Gini mesure le degré de concentration du caractère statistique. Il représente le
rapport de la surface comprise entre la courbe et le segment OA avec la surface du triangle OHA .
S
I G= .
0.5
Remarque 1: Dans le cas d'une faible inégalité, la courbe étant proche de la droite OA , la surface S
est petite et l'indice de Gini est proche de 0.
Remarque 2: Dans le cas d'une forte inégalité, la courbe est proche des cotés du triangle OHA et la
surface S est proche de celle du triangle OAH . L'indice de Gini est alors proche de 1.
Calcul pratique de l'indice de Gini: Le calcul exact de l'indice de Gini nécessite le calcul de la surface
S. Pour cela, il est plus simple de calculer la surface S' située entre la courbe de Gini et l'axe des
abscisses, donc celle d'un polygone formé d'une succession de trapèzes. On a ensuite: S=0.5−S' .
Le calcul de l'indice de Gini, donc de la surface S' , se ramenant à un calcul d'aires de triangles ou de
trapèzes, il est utile de connaitre les formules suivantes:
base × hauteur
Aire d'un triangle:
2
somme des bases
Aire d'un trapèze: × hauteur .
2
Définition: La médiale d'un caractère statistique est le nombre M l qui partage la masse des valeurs
en deux égales.

Vous aimerez peut-être aussi