Amphi 4
Indices dingalit
et de concentration
Denis Fougre et Francis Kramarz
19 septembre 2008
1. La courbe de Lorenz
Intuitivement une distribution de revenus est ingalitaire si une
faible proportion des individus reoit une forte proportion du
montant total des revenus distribus
Cette ide est la base de la construction de la courbe de
Lorenz
Rappel : Max Otto Lorenz (1880 - 1962) tait un conomiste amricain. Il publia en
1905 un article dcrivant la courbe dite depuis de Lorenz alors quil prparait son
doctorat lUniversit du Wisconsin. Son doctorat (1906), qui portait sur La thorie
conomique des prix de chemin de fer, ne fait aucune rfrence ce qui a
certainement t son plus clbre article. Sa vie sest partage entre les publications
et lenseignement. Il a galement t employ par le bureau du recensement des
tats-Unis, le bureau des chemins de fer amricains, le bureau des statistiques
amricaines et la chambre de commerce amricaine.
3
Proprits
1. La courbe de Lorenz est linaire par morceaux, inscrite dans
le carr de ct 1 (car p et q sont des proportions variant entre 0
et 1)
2. La courbe passe par les points 0, 0 et 1, 1 correspondant
respectivement k 0 et k n
3. Elle est croissante car q k1 q k . Elle lest strictement sil ny a
pas de revenu nul
4. La courbe de Lorenz est convexe car
xk
k1
q k1 q k x x
k
k1
x
x x
1
Invariances
1. La courbe de Lorenz est invariante par changement dchelle: les distributions
x 1 x n et x 1 x n 0 ont mme courbe de Lorenz, elles
sont pareillement galitaires (ou ingalitaires)
2. La distribution x 1 h
distribution x 1 x n
x 1 x k kh x 1 x k
x1 xn
x 1 x n nh
khx 1 x n nhx 1 x k k
khx k1 x n n khx 1 x k k
or cette dernire galit est vraie car les revenus sont rangs par ordre croissant:
qx
0 vfvdv
0 vfvdv
1
m
0 vfvdv
1
q Lp m
0 F 1 udu
Preuve: Si la densit f est strictement positive (cas dune v.a.r. continue), F est
inversible, et donc:
1
qx m
F 1 p
vfvdv
Fv,
qui implique v
F 1 u
1
1 F 1 p 0 et L p 1
L p m
0
1
m
fF p
1
puisque F 1
F F 1
10
surface du traingle
soit encore
1
2
2x 1 2x k x k1
2n x n
La surface totale sous la courbe de Lorenz est donc:
n1
1 G
1
2x 1 2x k x k1
2
k0
2
2
2n x n
1 1 x 1 2x 2 2 nx n
2n
n xn
12
G 1 1
n
n2 x n
Expression quivalente:
1 x 1 3x 2 2n 1x n
n2 x n
1 21 2n 1x 1 2n 3x 2 x n
n xn
soit encore:
G 1
G 1 21
n xn
i1 j1 minx i , x j
n
13
i1 j1 |x i x j |
n
1
2
2n x n
0 p Lpdp
14
G 2 p Lpdp
0
p
1
Comme Lp m F 1 udu, on en dduit que :
0
1
p
1
1
2
2
1
G 1 m F udu dp 1 m F 1 udp du
0
0
0
u
2
1 m
2
1 m
0 1 uF udu 1 m2
2
vfvdv m
0 uF 1 udu
F 1
2
udu m
0 uF 1 udu
en posant u Fv
soit encore
2
G 1 m
0 uF 1 udu
15
0 vFvfvdv
CV m
Lorsque les revenus sont observs dans le cadre dun
chantillonnage, il est estim par:
1/2
n
2
1
1
CV
x i x n
xn n1
i1
16
0 v m fvdv
2
1/2
i1
n
Iq 1
n
Iq
v
ln m
ln x i
xn
2
fvdv
3. Mesures de concentration
Ces mesures sont principalement utilises pour fournir des
indicateurs de la plus ou moins grande concentration des
entreprises dans un secteur dactivit
Quelle variable retenir? Nombre de salaris, chiffre daffaire,
bnfice, montant des investissements, etc.? Pas de rponse
gnrale, tout dpend de langle danalyse
Dans la suite, nous considrerons la taille de lentreprise
(nombre de salaris)
Si, dans un secteur dactivit, une faible proportion dentreprises
emploie une proportion leve du nombre total de salaris
employs dans ce secteur, le secteur est concentr
De ce fait, on pourrait utiliser lordre dduit des courbes de
Lorenz
19
n fois
n1 fois
21
xi xj
x i x j
h
nx n
nx n
xi
nx n
xi
nx n
xj
nx n
xj
nx n
22
23
24
25
26
L 1 nk1
si k 0, , n 1
n1 x n2 y
et
x x y y
L n k n
x1 xn 1 y1 ykn 1
1
2
1
n1
1
n2
n 1 x n 2 y L 2 k n 2n 1
si k n 1 1, , n 1 n 2
n1 x n2 y
28
n2 n2
n1 n2
i1 j1
i1 j1
i1 j1
|x i x j | |y i y j | 2 |x i y j |
G
2n 1 n 2 n 1 x n 2 y
Les indices de Gini associs aux deux sous-populations sont:
G1
n1 n1
n2 n2
1 |x i x j | et G 2
1 |y i y j |
2n 21 x i1 j1
2n 22 y i1 j1
29
Appelons G 12 la quantit:
G 12
n1 n2
1
2n 1 n 2 x
|x i y j |
i1 j1
G 12
n 1 n 2 n 1 x n 2 y
30
ln
n1 x n2 y
n1 x n2 y
n1 x n2 y
n1 x n2 y
i1
j1
n1
i1
xi
n1 x
n1 x
ln x i
ln
n1 x n2 y
n1 x
n1 x n2 y
n1 x n2 y
n2
yj
yj
n2 y
n2 y
ln
ln
n
x
n
y
n
y
x
n
y
n
n1 x n2 y
1
2
2
1
2
j1
Les indices de Theil pour chacune des sous-populations sont:
n1
n2
yj
yj
x
x
i
i
T1
ln
et T 2
ln
n
x
n
x
n
y
n2 y
1
1
2
i1
j1
31
Appelons T 12 la quantit:
n2 y
n2 y
n
n
1x
1x
T 12
ln
ln
n1 x n2 y
n1 x n2 y
n1 x n2 y
n1 x n2 y
T 12 est la mesure de la concentration entre les deux
sous-populations affectes dune taille gale la somme des
tailles des entreprises les composant
Finalement on obtient:
n2 y
n1 x
T
T1
T T 12
n1 x n2 y 1
n1 x n2 y
concentration totale moyenne des concentrations intra concentration inter
32
n
x
n
y
n1 x n2 y
1
2
i1
j1
n1 x
n1 x n2 y
H1
n2 y
n1 x n2 y
H2
33
Principe du bootstrap
Le bootstrap permet destimer certaines fonctions dune variable
alatoire X de loi de probabilit inconnue P X , ainsi quune
mesure de la prcision cette estimation, et ce partir dun
unique chantillon X 1 , , X n
La variable alatoire X peut tre continue ou discrte
Le bootstrap a deux caractristiques essentielles :
1) il est non-paramtrique (on ny fait aucune hypothse
paramtrique sur la distribution sous-jacente)
2) il peut tre utilis en lieu et place dune mthode
paramtrique lorsque celle-ci conduit des calculs inextricables
35
chantillons bootstrap
X 1l
, , X nl
l1,,L
36
37