Vous êtes sur la page 1sur 32

Les caractristiques des distributions un caractre

Tendance centrale, dispersion, disparit et concentration.

Les indicateurs de tendance centrale


Les moyennes
On peut calculer 2 types de moyennes :
La moyenne arithmtique (ou moyenne simple). Il sagit dune moyenne calcule de telle sorte que chaque variable de la population tudie a le mme poids dans le calcul. La moyenne pondre tient compte du poids qua chaque valeur. On va pondrer chaque valeur dun coefficient.

La mdiane
Cest la valeur dune srie statistique qui divise en 2 groupes gaux la population tudie.

Le mode
Cest la valeur dune srie statistique qui est la plus frquente.

Tendance centrale et caractristique de forme


Les indicateurs de tendance centrale nous renseignent sur lordre de grandeur de la srie statistique et sur sa forme.
Une distribution est symtrique si les observations, repres par leurs frquences sont galement disperses de part et dautres de la valeur centrale. Une distribution est symtrique si mode, moyenne et mdiane sont confondues.

Tendance centrale et caractristique de forme


Une courbe non symtrique est dite oblique: lobliquit se repre du ct de la dcroissance la plus forte de la courbe des frquences.

Limite des indicateurs de tendance centrale


Exemple: 2 lves ont les notes de SES suivantes: Elve 1 : 2;2;2;2;10;10;10;10;10;18;18;18;18 Elve 2 : 9;9;9;9;10;10;10;10;10;11;11;11;11 Ces 2 lves ont la mme moyenne, le mme mode et la mme mdiane. Ainsi, les indicateurs de tendance centrale ne montrent pas les irrgularits des notes. Il parait donc utile de mettre en relief ces carts. La notion de dispersion va donc complter linformation sur les sries statistiques.

La dispersion
On appelle dispersion statistique, la tendance qu'ont les valeurs de la distribution d'un caractre s'taler, se disperser, de part et d'autre d'une valeur centrale.
Exemple : analyser les ingalits de revenus en France, cest--dire les carts plus ou moins importants par rapport la moyenne

On distingue la dispersion absolue (mesure dans l'unit de mesure du caractre), et la dispersion relative (mesure par un nombre sans dimension).

Les mesures de la dispersion absolue


Ville Part des cadres Nombre dans population d'habitants active occupe 2181374 839043 472304 437715 347060 282853 272975 251634 232260 226014 209613 183837 182580 177480 167816 156107 152337 151504 144548 144092 360657 209613 41,04 16,02 26,49 24,48 14,95 22,19 20,61 20,11 22,95 22,68 21,69 14,51 9,78 12,88 11,44 25,74 16,47 17,91 14,64 13,43 19,50 17.91

Paris Marseille Lyon Toulouse Nice Nantes Strasbourg Montpellier Bordeaux Lille Rennes Reims Le Havre Saint-tienne Toulon Grenoble Angers Dijon Brest Nmes Moyenne Mdiane

Les paramtres de dispersion absolue indiquent de combien les valeurs d'une distribution s'cartent en gnral de la valeur centrale de rfrence.
Les mesures de la dispersion absolue sexpriment dans lunit de mesure de la variable considre. Exemples:
Pour le nombre d'habitants en 2006, il sagira du nombre d'habitants Pour la part des cadres dans le total de la population active occupe, il sagira de % de personnes actives occupant un emploi de cadre.

Les trois paramtres de dispersion absolue les plus courants sont l'tendue, l'cart type et l'intervalle inter quantile

Source : INSEE, recensement 2006.

Ltendue ou amplitude
L'tendue ou amplitude d'une distribution est gale la diffrence entre la plus grande et la plus petite valeur de la distribution :
Etendue de X = Xmax Xmin Ainsi, pour le nombre dhabitants des plus grandes villes franaises, ltendue de la srie est de 2037282 habitants. Lamplitude pour la part des cadres dans la population active occupe de ces mmes villes est de 31,26 points.

La mesure de la dispersion statistique et les valeurs centrales

A lexception de lamplitude, les paramtres de dispersion statistique caractrisent lcart des valeurs de la distribution statistique de part et d'autre d'une valeur centrale de rfrence. Il peut sagir de la moyenne ou de la mdiane.

Mesures de la dispersion autour de la moyenne


La variance de X, note est une mesure globale de la variation d'un caractre de part et d'autre de la moyenne arithmtique. Elle exprime la dispersion dans une unit de lordre du carr de lunit de mesure du caractre. Pour obtenir un paramtre de dispersion absolue, on calcule la racine carre de la variance L'cart type, not est la racine carr de la moyenne des carrs des carts la moyenne, c'est dire la racine carre de la variance.

La signification probabiliste de lcart-type


Lcart-type a l'avantage d'avoir une signification probabiliste. La thorie des probabilits permet en effet d'estimer la chance qu'a une valeur d'tre loigne de la moyenne de plus d'un certain nombre d'cart-types. Lorsqu'une distribution est gaussienne (on dit aussi "normale") les probabilits de trouver les valeurs a une distance donne de la moyenne sont les suivantes :
68,3% des valeurs sont entre - et + 95,5% des valeurs sont entre -2

et +2
99,7 % des valeurs sont entre -3

et +3

Mesures de la dispersion autour de la mdiane


Les quantiles sont les valeurs du caractre qui dfinissent les bornes d'une partition en classes d'effectifs gaux.
Nombre de parties Nombre de quantiles Nom du quantile 2 4 5 10 20 100

19

99

Mdiane

Quartile

Quintile

Dcile

Vingtile

Centile

Les carts et les rapports interquantiles


L'intervalle interquartile (Xq3-Xq1) est l'tendue de la distribution sur laquelle se trouvent concentre au moins la moiti des lments dont les valeurs de X sont les plus proches de la mdiane. On exclut alors de la distribution les 25% des valeurs les plus faibles et les 25 % des valeurs les plus fortes de X.
L'intervalle interdcile (Xd9-Xd1) est l'tendue de la distribution sur laquelle se trouvent concentrs 80% des lments dont les valeurs de X sont les moins diffrentes de la mdiane. On exclut alors de la distribution les 10 % des valeurs les plus faibles et les 10% des valeurs les plus fortes.

Les mesures de la dispersion relative


Eliminer leffet de lunit de mesure du caractre pour pouvoir comparer les degrs de dispersion de deux caractres Deux mesures usuelles de la dispersion relative partir de:
lintervalle interquantile: lintervalle interquantile relatif (IIQR) le rapport interquantile lcart-type: le coefficient de variation (CV)

Exemple : la distribution des niveaux de vie en France


(en euros 2006) 2004 2006

Lecture : en 2006, en France, 10 % des individus ont un niveau de vie infrieur 9723 euros. Le plus pauvre des 10 % les plus riches avait un niveau de vie 3.4 fois plus lev que le plus riche des 10 % les plus pauvres.

1er dcile (D1)


2me dcile (D2) 3me dcile (D3) 4me dcile (D4)

9 357
11 474 13 098 14 713

9 723
12 089 13 958 15 755

Mdiane (D5)
6me dcile (D6) 7me dcile (D7) 8me dcile (D8) 9me dcile (D9) Rapport interdcile (D9/D1)

16 318
18 278 20 571 23 676 29 357 3,14

17 597
19 683 22 240 25 799 33 193 3,41

Sources : Insee-DGI, enqutes Revenus fiscaux 2002 2005, Insee-DGFiP-Cnaf-Cnav-CCMSA, enqutes Revenus fiscaux et sociaux 2005 et 2006.

Avantage et limites des quantiles


Les quantiles permettent dliminer les problmes lis aux valeurs extrmes exceptionnelles.
Les indicateurs de dispersion utilisant les quantiles ignorent : Ce qui se passe entre les valeurs limites des quantiles extrmes. Ce qui se passe au-del des valeurs limites des quantiles extrmes.

La bote moustaches
En mathmatiques, les lves ont lhabitude de reprsenter les sries statistiques laide dun graphique appel bote moustaches .

Les diagrammes en bote

La mesure de la disparit
La disparit consiste mesurer lcart entre les valeurs centrales qui caractrisent une ou plusieurs populations statistiques.
Exemple : comparer les revenus entre la France et les EU, analyser les disparits rgionales, entre PCS, entre sexes, en termes de chmage, de revenus)

Exemple : la distribution des niveaux de vie moyen en France


Lecture : En 2006, le niveau de vie des 10% de la population les plus pauvres tait en moyenne de 7494 . Entre 2004 et 2006, le niveau de vie moyen des franais a augment de 10.4%. Les ingalits ont elles aussi augment, le rapport du niveau de vie moyen des 10% de la population les plus riches sur celui des 10% les plus pauvres passant de 5,63 6,75. On peut dailleurs noter que cette volution sexplique par la stagnation des niveaux de vie moyen des 10% les plus pauvres et par une augmentation prs de 20% du niveau de vie moyen du dixime de la population le plus ais.
Dixime de la population ordonn par niveau de vie croissant 2004 2006

1er
2me 3me

7 492
10 474 12 301

7 494
10 968 13 030

4me
5me 6me 7me 8me

13 920
15 492 17 259 19 407 21 990

14 866
16 661 18 621 20 879 23 893

9me
10me Ensemble Rapport (B)/(A)

26 112
42 176 18 661 5,63

29 074
50 552 20 603 6,75

Disparit versus dispersion


Dans des socits comme la ntre, le rapport des revenus moyens des deux diximes extrmes est en gnral un meilleur indicateur des ingalits que le rapport interdcile.

Exemple:
Une amlioration des revenus des 5% les plus pauvres. Une hausse des revenus des 1% les plus riches.

Dans les 2 cas ci-dessus, le rapport interdcile reste inchang.

La concentration
La concentration permet de consquences de la dispersion. visualiser les

Elle concerne les variables continues pouvant prendre que des valeurs positives.

ne

Nous limiterons notre mthode de dtermination de la concentration la mthode graphique.

La courbe de Lorenz (1905)


La courbe de Lorenz permet de visualiser la concentration.

Cette courbe se construit dans un repre orthonorm :


Les valeurs de la frquence cumule de la population en abscisses. Les valeurs de la frquence cumule des revenus ou du patrimoine.

Des exemples de courbes de Lorenz


Plus la courbe de Lorenz sloigne de la droite dquirpartition (cette surface est appele surface de concentration), plus la concentration (les ingalits) est forte. Sur la reprsentation cicontre, on peut sapercevoir que le Portugal a une distribution des revenus plus ingalitaire que la France
Source : Eurostats, 2004.

Le coefficient de Gini
Cet indice est gal au rapport de deux surfaces : Au numrateur, on trouve la surface comprise entre la droite dquirpartition et la courbe de Lorenz, appele surface de concentration. Au dnominateur, la surface du triangle compris entre la droite dquirpartition et laxe des abscisses.

Comparaison de coefficient de Gini


Le coefficient de Gini est un nombre compris entre 0 et 1. Plus il est grand (plus la surface de concentration est grande), plus la rpartition est ingalitaire. Le coefficient de Gini de la France est de 0,27 et celui du Portugal est de 0,37.

Une critique de Gini par Chauvel


La pertinence des mesures offertes par le coefficient de Gini est discutable car il sagit dune mesure unidimensionnelle de lingalit.

Exemple de Chauvel.

Les strobilodes
Pour rsoudre ce problme, il faut utiliser une loi de Champernowne.
chelle de revenu dont l'unit est le revenu mdian

Cette fonction de rpartition se drive, ce qui permet d'obtenir la densit de la rpartition.

est un indicateur de densit et donc dhomognit de la classe moyenne. Plus est grand, plus la courbe est asymtrique.

Les strobilodes
La courbe reprsentative de cette fonction est appele strobilode, elle prend ce nom en l'honneur de Henri Mendras, et de la toupie () de sa Seconde rvolution franaise (Mendras, 1994), qui mettait en vidence le fait que la socit ne se scinde pas en deux, et que l'architecture sociale chappe largement une logique univoque de domination.
Revenu mdianis

Part de la population

Lavantage des strobilodes


En superposant 2 strobilodes, on peut avoir une lecture immdiate des consquences dun partage du revenu disponible dans la population, en termes de qui est gagnant et qui est perdant. Ainsi, Chauvel propose des simulations de dformation de la courbe franaise de rpartition des revenus vers des modles de rpartition dautres pays.

Dformation de la courbe franaise vers le modle amricain


Principales consquences sur la rpartition du revenu disponible : Baisse de 36% du premier dcile. Baisse de 14 % du premier quartile. Hausse du dernier quartile de 8 %.
Prlever une part substantielle du revenu disponible des plus pauvres (moins de prestations sociales) ne dgage en dfinitive que des sommes fort modestes et ne conduit qu un enrichissement trs limit des plus riches.
Part de la population
Revenu mdianis

Dformation de la courbe franaise vers le modle sudois


Principales consquences sur la rpartition du revenu disponible : Accroissement de 13 % du premier dcile. Hausse du premier quartile de 18%. Hausse du revenu mdian de 12 % Baisse de 11% pour le dernier dcile. Baisse de 18 % pour le dernier vingtile. Cette volution profiterait donc surtout au bas de la classe moyenne. On conserverait lidentique la pauvret relative, cest--dire la distance entre les pauvres et les gens moyens.
Revenu mdianis

Part de la population

Vous aimerez peut-être aussi