Vous êtes sur la page 1sur 17

Chapitre 5 

: Quelques caractéristiques de formes et de concentration


Peut on deviner l’allure d’une distribution sans pour autant avoir à la tracer ?

1- La forme d’une distribution

1.1/ L’asymétrie d’une distribution

Deux moyens existent pour repérer la symétrie (ou asymétrie) d’une distribution.

1.1.1. / Par comparaison de tendances centrales traditionnelles

Ayant les valeurs du Mode, de la Médiane et de la Moyenne, on peut deviner l’allure


d’une série.

Si Mo=Mé=Moyenne alors la série est symétrique


Si Mo>Mé alors la distribution est étalée vers la gauche
Si Mo<Mé alors la distribution est étalée vers la droite
Etalement à droite Symétrie parfaite

Mo Mé Mo=Mé
=Moy
Etalement à gauche

Mé Mo
Source : Veronis, Université de provence
1.1.2. / Par un calcul des coefficients d’asymétrie

Nous ne retiendrons ici que deux coefficients

1.1.2.1/ Le coefficient de Yule

Le coefficient d’asymétrie de Yule est basé sur les écarts de quartiles. Il s’écrie :
(Q3Mé)(MéQ1)
s
(Q3Mé)(MéQ1)

Si s=0, alors il y a symétrie


Si s>0 (l’écart entre Médiane et Q1 est relativement petit), donc Médiane se rapproche
plus de Q1, alors la courbe des fréquences étalée à droite
Si s<0 (raisonnement inversé) alors série est étalée à gauche
1.1.2.2/ Le coefficient de Pearson

Person établit une statistique basée sur les écarts entre Moyennes et Modes. Ainsi,

p xMo

Si p=0, la série est symétrique


Si p>0 la série est étalée à droite
Si p<0 la série est étalée à gauche
1.2/ La mesure de l’aplatissement

1.2.1- Définition et formes graphiques

Définition : Une courbe est aplatie (platicurtique) quand une variation forte de la
valeur étudiée ne s’accompagne pas de forte variation de la fréquence, par référence à
la courbe des fréquences de la loi Normale
A contrario, quand la courbe est moins aplatie que celle de la loi normale alors la
courbe est leptocurtique

Aplatie Normale Concentrée


(platicurtique) (leptocurtique)
Source : Veronis, Université de Provence
1.2.2- Les coefficients d’aplatissement

Ici, interviennent les statistiques de moments centrés d’ordre ‘r’

1.2.2.1/ Coefficient de Pearson

Il s’écrit :
4 4
2   avec i moment centré d’ordre i
 22  4
Si  2 =3 alors la distribution est normale
Si 2 >3 alors distribution est leptocurtique
Si 2 <3 alors distribution est platicurtique
2- La concentration d’une distribution

Jusque là, nous avions analysé les formes de la distribution à l’aide de certaines
statistiques, les plus importantes d’entre elles étaient les statistiques de dispersion.
Seulement, les mesures déjà rencontrées (écart type, écart absolu moyen,etc..) ne
renseignent que sur la dispersion au sein d’une série .
Mais, peut-on trouver un moyen de comparer une dispersion par rapport à une
autre (qui serait une norme) pour chaque quantile observé ? (comparaison de
dispersion entre séries)

Par exemple, si on observe une distribution des ménages ainsi qu’une distribution de
leurs revenus, on serait tenté de comparer les deux distributions pour voir si elles
évoluent, par quantile, de la même manière:
Si 30% des ménages détiendraient 30% du total des revenues alors les revenus sont
équitablement réparties.
Par contre, si 30% des ménages détiennent 80% des revenus alors les revenus sont très
inéquitablement réparties (inégalités).

Ou encore, quand on dit que 10% des entreprises occupent 90% du total du marché (ou
encore 90% de part de marché) dans une économie, c’est que la structure de marché est
fortement concentrée également (10% des entreprises détiennent un quasi monopole du
marché).

Ainsi, comparer la répartition entre deux distributions reviendrait à comparer leurs


fréquences cumulées.

2.1/ Définition de la concentration

Définition : La concentration d’une distribution mesure sa répartition ‘observée’ par


rapport à une ‘norme’ de répartition (la répartition à laquelle on s’attend). Donc il
s’agit de comparer deux séries de fréquences cumulées. Elle est souvent utilisée dans
l’analyse des parts distributives des salaires, des fortunes, des parts de marché des
entreprises, etc…C’est aussi une mesure de l’état des inégalités dans la distribution.
2.2/ Détermination par le calcul

Un moyen de comparer deux distributions serait de comparer leur médiane.


Est ce que 50% d’une distribution correspond à 50% d’une autre distribution ?

Bien entendu, il ne s’agit pas de comparer des distributions parfaitement indépendantes


comme : la distribution des noix de cocos vendues par la guadeloupe à celle des tulipes
vendues par les Pays bas !
Il s’agit de comparer des distributions qui ont un lien économique rationnel entre elles.
Exemple : On étudie la répartition des individus et des ventes d’un échantillon de 500 entreprises.
Ventes (en Ventes N f ( xi ) F(xi) ni.xi f ( x i ni ) F(ni.xi)
milliards centrées ( xic

d’euros) )
[0-4[ 2,5 33 0,33 0,33 82,5 0,16 0,16
[4-6[ 5 50 0,5 0,83 250 0,48 0,64
[6-9[ 7,5 10 0,1 0,93 75 0,14 0,79
[9-11[ 10 5 0,05 0,98 50 0,10 0,88
[11-50[ 30.5 2 0,02 1 60 0,12 1
100 517,5

Donc on nous donne :


-Distribution simple (fréquence) et distribution cumulative des (f(x) et F(x)) des
effectifs (des entreprises).

Mais on peut aussi trouver la distribution simple et cumulative de leur vente.


(Ventes totales par tranche/ Total du marché) =f(ni.xi) :
ex. ligne 1 : 33 individus, qui vendent moins de 4 Milliards, ont une part de marché de
16%

On calcule la médiane des deux distributions et on les compare.


Ainsi, par interpolation linéaire :
- distribution des entreprises F(xi) : on trouve que 50% des entreprises vendent
moins de Mé =4.68 Milliards d’euros
- distribution des ventes F(ni.xi), la médiane s’appelle Médiale  (notée Ml)
Ml  4 64
Relation par interpolation : 0.5  0.16  0.64  0.16 et Ml=5.41

Intérprétation : 50% des entreprises gagnent moins de 4.68 Miliards euros


Et 50% des ventes (ou une part de marché de 50%) sont détenues par des entreprises
qui gagnent moins de 5.41 milliards.

Donc la moitié des entreprises détient moins de la moitié des parts de marchés.

Le marché n’est pas répartit équitablement entre les entreprises.

Mé  Ml
Une mesure de la concentration serait alors : C
Intervalle Variation

Avec Intervalle variation= Etendue de la série=50


on a : C=0.015 (ou 1.5%)
Ainsi, quand la concentration est égale à 0 alors on dit qu’il y a équi-répartition
Mais si elle est différente de 0 alors il y concentration : ici elle est 1.5% (faible)

2.3/ Détermination par le graphe de la courbe de concentration (Courbe de Lorenz)

Il existe un moyen visuel de déterminer la concentration sans passer par la


comparaison des deux médianes. Il suffit de confronter les deux fonctions cumulatives
sur un graphique.

Exemple :
Dans l’exemple des ventes des entreprises : On compare la part des entreprises
observées ayant fait moins d’un certain seuil de ventes dans l’année (par F ( x ) ) à la part
i

des ventes observées à ce niveau dans le total des ventes de l’échantillon F ( n x ) .


i i

L’ensemble des points désignant les combinaisons des valeurs des deux fonctions
s’appelle la courbe de Lorenz. (Cet courbe est alors représentée dans un carré avec les
extrémités de 0 à 1 : carré de Gini).
1

0.8

0.6
F(ni.xi)
F(xi)'
0.4

0.2

0
0 0.2 0.4 0.6 0.8 1
2.4/ Mesure de la concentration à l’aide de la courbe de Lorenz

La mesure de l’indice de concentration à partir du graphique se fait à l’aide de l’indice


de Gini :
Aire concentration
G
Aire du triangle

or, l’aire du Triangle OO’O’’=1/2

D’où : G  2* Aire concentration

Comment trouver l’aire de concentration ?

La méthode des trapèzes :


1/On peut définir autant de trapèzes que de classes dont le sommet est délimité par la
courbe de Lorenz.
2/ La partie de la courbe au sein de chaque classe est approchée par une droite.
1

Fi (n.x)
Trapèze j

Fi1(n.x)

Bj
bj

h
0 1
0
Fi1(x)Fi (x)
3/ On calcule la surface de chaque trapèze :
(b j  B j )h j ( Fi 1 (nx)  Fi (nx)).( Fi ( x)  Fi 1 ( x))
Sj  
2 2
4/ On somme sur tous les trapèzes (il y en a autant que de classes) :
Surface totale= j S j
5/ Aire concentration=(Aire Triangle)-(Surface totale)=1/2 – Surface totale
5/ enfin, G  2 * Aire concentration

G varie entre 0 et 1 :


G=0, concentration nulle ou équirépartition
G=1, concentration maximale ou inégalité maximale
Reprenons l’exemple des entreprises et de leur parts de marché
Ventes (en F(xi) F(ni.xi) T=(1/2).
milliards (b+B).h
d’euros)
[0-4[ 0.33 0.16 Trapèze 1 0.03
[4-6[ 0.83 0.64 Trapèze 2 0.20
[6-9[ 0.93 0.79 Trapèze 3 0.07
[9-11[ 0.98 0.88 Trapèze 4 0.04
[11-50[ 1 1 Trapèze 5 0.02

Somme 0.36
Trapèzes=
Aire 0.14
Concentration
=
I(gini)= 0.28

Vous aimerez peut-être aussi