Vous êtes sur la page 1sur 28

Caractéristiques de la forme et

de la concentration

Réalisé par : Encadré par :


BENMOUSSA Rania Mr IBOURK Omar
BOUNAKAB Latifa
Plan
Introduction
Caractéristiques de la forme :
 Coefficient d’asymétrie
 Coefficient d’aplatissement
 Application
 Test de normalité : Test de Shapiro Wilk
 Exercice
Caractéristiques de la concentration :
 Courbe de Lorenz
 Application
 Indice de Gini
 Exercice
Conclusion
2
Introductio
n
3
Coefficient d’asymétrie et d’aplatissement

Qu'est-ce que le Coefficient de Fisher ?

Les coefficients de Fisher regroupent deux


coefficients :

Le coefficient d’asymétrie et le coefficient


d’aplatissement.

4
Coefficient d’asymétrie
 Le coefficient d’asymétrie de Fisher : il est dit
également « gamma un ». Il permet de
comparer les distributions même si leurs
échelles sont différentes. Il est définit par le
rapport entre le moment centré d’ordre 3 et
l’écart-type au cube :

5
 Si la répartition de l’échantillon ou de la
distribution est symétrique autour de la
moyenne alors le coefficient est nul. Si la
valeur est positive, l’étalement est à droite
(asymétrique gauche), en revanche si elle est
négative alors l’étalement est à gauche
(asymétrie droite).

6
Coefficient d’aplatissement
 Le coefficient d’aplatissement de Fisher : c’est
un indicateur de dispersion autour des valeurs
centrales. Ce coefficient permet de calculer le
degré d’aplatissement d’une distribution de la
variable en question. Il est définit par le
rapport entre le moment centré d’ordre 4 et la
variance au carré :

7
 Si la valeur obtenue est nulle, on dit que la
répartition des observations est de type
gaussien ou normal. Dans le cas où le
coefficient d’aplatissement est positif, on
obtient une courbe moins aplatie que celle
de la densité normale. A l’inverse s’il est
négatif, la représentation de la courbe est
plus aplatie qu’une densité normale.

8
Application
 Une enquête menée auprès de 1500 ménages d'une certaine
région géographique rurale s'est intéressée à la
variable correspondant à la taille du ménage, c'est-à-dire au
nombre de personnes constituant le ménage. Les données
recueillies peuvent être présentées sous la forme du diagramme
en bâtons suivant.

9
 On a par ailleurs déterminé que la taille
moyenne des 1500 ménages était égale à 2.67
et que la variance des tailles des ménages
s'élevait à 2.27.
 On a une asymétrie gauche.
 Mesurons à présent la force de cette
asymétrie à l'aide du coefficient d'asymétrie
que nous avons étudiés.

10
11
Test de normalité
 En statistiques, les tests de normalité
permettent de vérifier si des données réelles
suivent une loi normale ou non. Les tests de
normalité sont des cas particuliers des tests
d'adéquation, appliqués à une loi normale.
Ces tests prennent une place importante en
statistiques.

12
Le test de Shapiro-Wilk
 Tant mieux si votre logiciel vous le fournit car c’est le test le plus fiable.
Dans le cas contraire, il n’est pas difficile de calculer sur tableur la
statistique W qui permet de procéder au test. Mais vous avez besoin de
deux tables.
 Sur tableur, la procédure commence par le tri des observations par ordre
croissant.
 Au dénominateur : calcul de la somme des carrés des écarts à la moyenne.
 Au numérateur : calcul des différences (entre le premier et le dernier, le
deuxième et l’avant-dernier et ainsi de suite, l’observation médiane est
ignorée si n est impair). On applique à chaque différence un coefficient lu
dans une table. On additionne et on élève au carré.
 Le W est prêt à servir, ou plutôt à être lu dans une autre table. Il est
compris entre 0 et 1.
 L’hypothèse H0 de normalité est vérifiée quand la valeur est élevée.

13
Exercice
 Le tableau suivant contient les résultats de
deux groupes:
Groupe 1 6 7 18 9 9 18 27 12 10 32 37
Groupe 2 10 13 13 15 17 15 24 10 10 4
 Effectuer un test de normalité pour chacun
des deux groupes.

14
15
16
Les caractéristiques de concentrations
La mesure de la concentration revient à celle de la conséquence de la dispersion. Très
importante en économique (concentration des salaires, des revenus, de la taille des
entreprise…). Elle concerne des variables continues ne pouvant prendre que des valeurs
positives.

C’est la conséquence de la dispersion ; On la détermine par 2 méthodes : le calcul et les


graphes.

Détermination par le calcul

La démarche est la suivante :

On calcule la médiane (Mé) de la série

On calcule la médiale (Ml) de la série

On mesure l’écart (∆ M) entre la médiale et la médiane

On compare cet écart (∆ M) à l’intervalle de variation de la série.


17
Détermination par le graphe
Cette analyse a été développée par l’italien Corrado Gini au cours de ses travaux sur les
disparités de revenus et a abouti à la construction d’une courbe dite « de
concentration » et à la détermination d’un ratio : l’indice de Gini

18
Courbe de concentration
A) La courbe de concentration

Elle se construit sur un repère orthonormé à partir des fréquences cumulées relatives :

•Sur l’axe des abscisses : on reporte les valeurs de F(x) (fonction de répartition), c’est-
à-dire la colonne où l’on a fait la somme des fi. Les valeurs varient de 0 à 1.

•Sur l’axe des ordonnées : on reporte les valeurs de F(nx), c’est-à-dire la colonne ou
l’on a fait la somme des pour calculer la médiale Ml. Les valeurs varient de 0 à 1.

F(x) = = et F(nx) =

19
Application

20
La concentration est forte si elle dépasse les 15%. 21
Dans le schéma, F(x) = 0,7 pour F(nx)=0,34 ; si l’on reprenait l’exemple des
salaires, on pourrait dire que 70% des salariés se partagent 34% de la masse
salariale. La bissectrice AC correspond à la ligne d’équirépartition parfaite, par
construction. Toujours dans l’exemple des salaires, 10% des salariés recevraient
10% de la masse salariale ; 20%, etc…) C’est la ligne de concentration nulle.
Donc : plus la courbe de concentration s’écarte de la bissectrice, plus la
concentration est forte.

Ou encore : plus la concentration est forte, plus l’aire de concentration se


rapproche de l’axe des abscisses.

C’est le message visuel.


EXERCICE : Indice de Gini et courbe de concentration

Ci-dessous, l’effectif d’une unité de production a été trié par rémunération perçue, en ordre
croissant. Un décilage est effectué mais n'importe quel découpage à peu près équilibré aurait été
envisageable. On a réparti une masse salariale de 175,4 selon un décilage de la population
On relève le salaire moyen de chaque écart interdécile puis la part de ce salaire
par rapport au total de la colonne (ou si vous préférez, la proportion de masse
salariale versée à chaque dixième de population par rapport à la masse totale). Le
cumul est résumé par la courbe de concentration, en rouge. À titre d'exemple, 20
% de l’effectif (les salariés les moins bien payés) se partage 9,24 % de la masse
L'aire totale du graphique est égale à 1. Celle qui est située entre les deux courbes se nomme surface
de concentration. Plus elle est faible et plus la distribution est égalitaire. Le maximum serait 0,5
(situation d’un seul maître et d’esclaves !). Afin d’obtenir une grandeur comprise entre 0 et 1, on
multiplie cette valeur par 2. Le résultat est appelé indice de Gini.

Dans une problématique de scoring (ou plus globalement de risque ou de marketing), l’indice de Gini
ne se réfère pas à la différence entre courbe de Lorenz et première bissectrice mais entre une courbe
constatée (ROC ou de lift) et une situation parfaite de discrimination fiable à 100 %.

Le mode de calcul de l'indice consiste d'abord à estimer l'aire située sous la courbe de Lorenz.
Comme en pratique il s'agit d'une fonction affine par morceaux, le calcul consiste généralement en
une somme d'aires de trapèzes. La différence entre ce résultat et 0,5 (aire du triangle) permet
évidemment de connaître l'aire de concentration. Nous avons vu qu'il fallait ensuite la multiplier par
2 (ou la diviser par 0,5, ce qui est la même chose, mais qui est peut être plus simple à comprendre :
c'est la surface de concentration qui est rapportée à l'aire du triangle) :
Reprenons notre exemple. L'indice est calculé dans le tableau ci-dessous. En dernière colonne, les
aires des trapèzes sont obtenues en multipliant chaque centre de classe par la proportion de
population correspondante (ici, 0,1 chaque fois).
Soit f(x) l’expression de la courbe de Lorenz. On suppose qu'elle est représentative d'une fonction
ayant une expression algébrique. La surface de concentration est donc la différence entre la droite
d’équation y = x et la courbe représentative d'une fonction f entre les valeurs 0 et 1. On rapporte
cette surface à l'aire du triangle. Donc :

Supposons que votre logiciel favori estime par l’équation y = x² votre courbe de Lorenz. À
combien s’élève l’indice de Gini ? Réponse :
Conclusion
28

Vous aimerez peut-être aussi