Vous êtes sur la page 1sur 154

Portail Licence 1ère année-1er semestre (L1S1)

Site de Marseille, division M

Techniques statistiques
Alain Paraponaris, PR
alain.paraponaris@univ-amu.fr
Plan de l’enseignement 3. Les nombres-indices
1. Distributions statistiques à 1 caractère 3.1. Les indices élémentaires
3.1.1. Indices diachroniques et indices synchroniques
1.1. Définitions
1.1.1. Individu et population statistiques 3.1.2. Propriétés des indices élémentaires
1.1.2. Caractères 3.1.3. Indices d’expressions complexes
1.1.3. Modalités 3.2. Introduction aux indices synthétiques
1.2. Distributions statistiques 3.2.1. Principes d’agrégation d’indices élémentaires
1.2.1. Effectifs et fréquences 3.2.2. Indices de Laspeyres
1.2.2. Effectifs et fréquences cumulés 3.2.3. Indices de Paasche
1.2.3. Représentations graphiques 3.2.4. Indices de Fisher
1.3. Caractéristiques numériques
1.3.1. Tendance centrale (mode, moyenne, médiane)
1.3.2. Dispersion (étendue, écart-type, quantiles)
1.3.3. Concentration (Lorenz, Gini)
1.4. Forme des distributions
1.4.1. Distributions symétriques
1.4.2. Distributions asymétriques

2. Distributions statistiques à 2 caractères


2.1. Tableaux de contingence
2.1.1. Effectifs absolus et marginaux
2.1.2. Fréquences absolues, marginales, conditionnelles
2.1.3. Représentations graphiques
2.2. Relations entre deux variables
2.2.1. Corrélation
2.2.2. Ajustement et régression linéaire
Références
Ouvrages
Anderson D.R., Cam J.D., Cochran J.J., Sweeney D.J., Williams T.A., Statistiques pour l’économie et la gestion, De Boeck
Université, 2015 (5ème édition)
Comte M., Gaden J., Statistiques et probabilités pour les sciences économiques et sociales, PUF, 2000
Delmas B., Statistique descriptive, Armand Colin, 2005
Goldfarb B., Pardoux C., Introduction à la méthode statistique, Dunod, 7ème édition, 2013
Py B. Statistique descriptive, Economica, 2011, 4ème édition
Py B. Exercices corrigés de statistique descriptive, Economica, 2007, 3ème édition
Py B., La statistique sans formule mathématique. Comprendre la logique et maîtriser les outils, Pearson Education, 2007
Tribout B., Statistiques pour économistes et gestionnaires, Pearson Education, 2013, 2ème édition

Liens utiles
Notes de cours
http://math.univ-lille1.fr/~ayache/cours_SD.pdf
http://www.itse.be/statistique2010/co/Module_statistique_FSP_1.html
https://www.deleze.name/marcel/sec2/stat-descr/exercices/exercices.pdf
Chaînes YouTube
La statistique expliquée à mon chat: https://www.youtube.com/channel/UCWty1tzwZW_ZNSp5GVGteaA
INSEE: https://www.youtube.com/channel/UChCCvJTbZEYsCXyfu27eQ6g
Présentation de l’UE
Introduction aux concepts principaux de l’analyse statistique descriptive
Un triple objectif
Présenter les instruments et la terminologie de l’analyse statistique
Utiliser ces instruments pour le décryptage et la compréhension de l’information économique et statistique
Produire de l’information statistique
Composition
Cours Magistraux: 24h (12 x 2h), Travaux Dirigés: 12h (8 x 1h30)
Evaluation
MCC 2022-2023: https://intra-feg.univ-amu.fr/system/files/ressources_docs/FEG_M3C_2021_2022_portail_Version_Web_2021_09_13.pdf
UE Statistiques appliquées aux sciences sociales (8 ECTS)
Techniques Statistiques (coeff. 2)
Approches statistiques des questions économiques et sociales (coeff. 1)
Méthodologie documentaire (coeff. 0)
3 éléments d’évaluation au sein du module Techniques Statistiques
Examen de fin de semestre (CT), Travaux Dirigés (inclut l’assiduité) (TD), Contrôle intermédiaire (distant) (CI)
Note finale=Max{CT,[2*CT+Max(CI,(CI+TD)/2)/3]}

Matériel
AMeTICE: https://ametice.univ-amu.fr/course/view.php?id=92247#section-0
Présentation de l’UE
Des récapitulatifs réguliers des connaissances et compétences pour consolider les acquis

TSC: Techniques Statistiques Challenge


Ice Bucket Challenge
Un prize money jamais vu!
1er prix: deux verres d’eau
2ème prix: un verre d’eau
3ème prix: de l’eau

1. Scannez le QR code
J’ai pas de cerveau Challenge

2. Identifiez vous

3. Jouez!
1. Distributions statistiques à 1 caractère
1.1. Définitions
Population statistique: ensemble des individus sur lesquels porte l'étude
statistique.
Population marseillaise, parc automobile français, ensemble des villes de plus de 100 000
habitants, …
Individus statistiques: éléments de base de la population statistique (unités
statistiques)
Marseillais(e), automobile, Marseille, …
Population: ensemble d’individus statistiques présentant (au moins) une
caractéristique commune
Echantillon: sous-ensemble d’individus dans une population
Marseillais de moins de 25 ans, voitures à 3 portes, villes de plus de 100 000 habitants
littorales, …
1. Distributions statistiques à 1 caractère
1.1. Définitions Caractère

Caractère: objet de l’étude


sur une population ou
un échantillon.

Modalités: ensemble
des valeurs ou états pris par un
caractère
1. Distributions statistiques à 1 caractère
1.1. Définitions Caractère

Caractère: objet de l’étude


sur une population ou quantitatif qualitatif
un échantillon.

Modalités: ensemble
des valeurs ou états pris par un
caractère
1. Distributions statistiques à 1 caractère
1.1. Définitions Caractère

Caractère: objet de l’étude


sur une population ou quantitatif qualitatif
un échantillon.

Modalités: ensemble discret continu

des valeurs ou états pris par un


caractère
1. Distributions statistiques à 1 caractère
1.1. Définitions Caractère

Caractère: objet de l’étude


sur une population ou quantitatif qualitatif
un échantillon.

Modalités: ensemble discret continu

des valeurs ou états pris par un


caractère
1. Distributions statistiques à 1 caractère
1.1. Définitions Caractère

Caractère: objet de l’étude


sur une population ou quantitatif qualitatif
un échantillon.

Modalités: ensemble discret continu

des valeurs ou états pris par un


caractère
1. Distributions statistiques à 1 caractère
1.1. Définitions Caractère

Caractère: objet de l’étude


sur une population ou quantitatif qualitatif
un échantillon.

Modalités: ensemble discret continu nominal

des valeurs ou états pris par un


caractère
1. Distributions statistiques à 1 caractère
1.1. Définitions Caractère

Caractère: objet de l’étude


sur une population ou quantitatif qualitatif
un échantillon.

Modalités: ensemble discret continu nominal ordinal

des valeurs ou états pris par un


caractère
1. Distributions statistiques à 1 caractère
1.1. Définitions
« Combien de personnes composent votre ménage ?»
èCaractère quantitatif discret
« Pourriez-vous indiquer votre revenu mensuel net en €?» * * *. * * * €/mois
èCaractère quantitatif continu
« Pourriez-vous indiquer votre revenu mensuel net en €?»
* De 0 à 999€ * De 5000 à 9999€
* De 1000 à 1999€ * De 10000€ à 99999€
* De 2000 à 4999€ * 100000€ et plus
èCaractère quantitatif continu en classes (discrétisé)
« Vous aimez les endroits: * très secs * secs * ni secs ni humides
* humides * très humides »
èCaractère qualitatif à modalités ordinales
« Vous êtes: * propriétaire * locataire * hébergé(e) à titre gratuit
* logé(e) par votre employeur * sans domicile
* autre, précisez:……………………………….. »
èCaractère qualitatif à modalités nominales
« Neymar Jr est-il un (grand) footballeur? » * non * non
èCaractère qualitatif à modalités … indéfinissables?!?
1. Distributions statistiques à 1 caractère
1.1. Définitions
1. Distributions statistiques à 1 caractère
1.1. Définitions
1. Distributions statistiques à 1 caractère
1.1. Définitions
1. Distributions statistiques à 1 caractère
1.1. Définitions
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.1. Effectifs et fréquences
Modalités On considère le caractère quantitatif X, dont on
Effectifs
du caractère X ordonne de façon croissante les p modalités: X1, X2,
X1 n1 …, Xp.
X2 n2 On distribue une population de taille N selon les p
… … modalités du caractère X.
Xi ni On obtient la distribution statistique des n1, n2, …, np
… … individus statistiques qui présentent respectivement
Xp np la modalité X1, X2, …, Xp du caractère X.
Total N
On vérifie:
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.1. Effectifs et fréquences
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.1. Effectifs et fréquences
Modalités On définit la fréquence de la modalité i du caractère
Fréquences
du caractère X X dans le total de la population par:
X1 f1
X2 f2
… …
Xi fi Il y a % de la population qui présente la modalité i
… … du caractère X.
Xp fp
Total 100%
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.1. Effectifs et fréquences
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.2. Effectifs et fréquences cumulés

Modalités Effectifs On définit l’effectif cumulé jusqu’à la k-ème


Effectifs modalité du caractère X:
du caractère X cumulés
X1 n1 N1
X2 n2 N2
… … …
Xi ni Ni
… … …
Xp np N
Total N
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.2. Effectifs et fréquences cumulés

Effectifs cumulés
3 618,7
6 718,6
7 743,1
8 045,9
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.2. Effectifs et fréquences cumulés

Modalités On définit la fréquence cumulée jusqu’à la


Fréquences k-ème modalité du caractère X:
du Fréquences
cumulées
caractère X
X1 f1 F1
X2 f2 F2
… … …
Xi fi Fi
… … …
Xp fp 100%
Total 100%
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.2. Effectifs et fréquences cumulés

Fréquences
cumulées
45,0
83,5
96,2
100,0
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques
Les graphiques les plus courants: courbe, bâtons, histogramme, diagramme circulaire, boîte à
moustaches
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques

La détermination du type de représentation graphique appropriée dépend du


caractère étudié
Pour certains caractères, certaines représentations graphiques ne sont pas envisageables
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques
La courbe
Caractère observable
en temps continu
ou
caractère quantitatif
continu
Déconseillée pour la
représentation graphique
de distributions statistiques
Adaptée aux séries chronologiques (a fortiori en temps continu)
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques

Caractère qualitatif
Effectifs et fréquences (diagrammes différentiels)
Représentations autorisées
Diagramme circulaire
Diagramme à bâtons (histogramme toléré)
Épaisseur des traits identique
Espacement des traits identique
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques
Caractère quantitatif discret
Effectifs et fréquences (diagrammes différentiels), effectifs et fréquences cumulés
(diagrammes intégraux)
Représentations autorisées
Diagramme circulaire
Bâtons ou histogramme
Épaisseur des traits identique
Espacement des traits identique
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques Diagrammes différentiels
1.2.3. Représentations graphiques
Caractère quantitatif discret
Nombre de 1
2

pièces dans le Effectifs 3


4
logement 5

1 1000
2 2000
3 3000 3000
4 2500 2500
2000
5 1500
1500
Total 10000
1000
500
0
1 2 3 4 5
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques
Caractère quantitatif discret Diagramme intégral

Nombre de
Fréquences
pièces dans Effectifs 100%
cumulées
le logement 90%
80%
1 1000 10% 70%
60%
2 2000 30% 50%

3 3000 60% 40%


30%
4 2500 85% 20%
10%
5 1500 100% 0%
Total 10000 0 1 2 3 4 5
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques
Caractère quantitatif continu avec amplitudes de classe égales
Amplitude de classe: !" = $%&" − ()*"
!" = !+ ∀ ( ≠ .
Effectifs et fréquences (diagrammes différentiels), effectifs et fréquences
cumulés (diagrammes intégraux)
Représentations autorisées
Diagramme circulaire
Histogramme
Épaisseur des traits identique
Pas d’espacement des traits
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques Diagrammes différentiels
1.2.3. Représentations graphiques

Caractère quantitatif continu avec


[0;5[
amplitudes de classe égales [5.10[
[10;15[
Notes Fréquences
[15;20[
[0;5[ 20%
[5;10[ 40%
[10;15[ 30% 45%
40%
[15;20[ 10% 35%
Total 100% 30%
25%
20%
15%
10%
5%
0%
[0;5[ [5.10[ [10;15[ [15;20[
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques

Caractère quantitatif continu avec


amplitudes de classe égales Diagramme intégral
100%
Fréquences
80%
Notes Fréquences cumulées
[0;5[ 20% 20% 60%

[5;10[ 40% 60% 40%

[10;15[ 30% 90% 20%


[15;20[ 10% 100% 0%
Total 100% [0;5[ [5.10[ [10;15[ [15;20[
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques
Caractère quantitatif continu
avec amplitudes de classe inégales
!" = $%&" − ()*"
∃ ( ≠ -/ !" ≠ !/
Effectifs et fréquences (diagrammes différentiels), effectifs et fréquences
cumulés (diagrammes intégraux)
Représentations autorisées
Diagramme circulaire
Histogramme
Épaisseur des traits pas identique
Pas d’espacement entre les traits
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques Diagrammes différentiels

Caractère quantitatif continu


avec amplitudes de classe inégales [15;25[
[25;50[

Age Effectifs [50;65[

[15;25[ 30%
[25;50[ 40%
45%
[50;65[ 30%
40%

X
Total 100% 35%

U
30%

FA
25%
20%
(25-15)x0,3=3 (50-25)x0,4=10 (65-50)x0,3=4,5
15%
10%
5%
0%
[15;25[ [25;50[ [50;65[
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques Diagrammes différentiels

Caractère quantitatif continu


avec amplitudes de classe inégales [15;25[
[25;50[
Age Fréq. Amplitude Densité
[50;65[
[15;25[ 30% 10 3%
[25;50[ 40% 25 1,6% densité
[50;65[ 30% 15 2% 4%

T
Total 100% 3%3%

C
3%
2,5%

A
Densité: di=fi / ai

=0,3
2%
3%

0,03 X
2%

E
1,5%

,3
(25-15)x0,3=3 (50-25)x0,4=10 (65-50)x0,3=4,5

=0
0,4
1%1% 15)x =

,02
0,016

)x0
x
(25-

1%
0,5% 25)

50
0-
(5

5-
(6
0%
15 25 50 65
1. Distributions statistiques à 1 caractère
1.2. Distributions statistiques
1.2.3. Représentations graphiques
Caractère quantitatif continu
avec amplitudes de classe Diagramme intégral
inégales 100%
90%
Fréquences 80%
Age Fréquences cumulées 70%
[15;25[ 30% 30% 60%

[25;50[ 40% 70% 50%

[50;65[ 30% 100% 40%

Total 100% 30%


20%
(25-15)x0,3=3 (50-25)x0,4=10 (65-50)x0,3=4,5
10%
0%
15 20 25 30 35 40 45 50 55 60 65
1. Distributions statistiques à 1 caractère
1.3.Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Principe: résumer l’ensemble de la distribution statistique à l’aide d’un indicateur
unique
3 indicateurs de tendance centrale: mode, moyenne, médiane
Mode / classe modale
Modalité du caractère présentant le plus fort effectif ou la plus forte fréquence
Caractère qualitatif (mode)
Caractère quantitatif discret (mode)
Caractère quantitatif continu avec amplitudes de classe égales (classe modale)
Modalité du caractère présentant la plus forte densité
Caractère quantitatif continu avec amplitudes de classe inégales
S’exprime dans la même unité que les modalités du caractère
1. Distributions statistiques à 1 caractère
1.3.Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)

Nature de l’inconfort du logement


Caractère qualitatif avec modalités nominales Mode (2002 et 2006): signes
7 modalités d’humidité sur certains murs
1. Distributions statistiques à 1 caractère
1.3.Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
30%
Nombre de brosses à dents
25%
utilisées en une année
20% Caractère quantitatif discret
15%
13 modalités
Mode: 1 brosse à dents
10%
5%
0%
0 1 2 3 4 5 6 7 8 9 10 11 12
1. Distributions statistiques à 1 caractère
1.3.Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)

Notes Effectifs Note des étudiants au premier DSH


[0, 5[ 35 Caractère quantitatif continu avec amplitudes de
classe égales
[5, 10[ 50 4 modalités
[10, 15[ 75 Classe modale: [10, 15[
[15, 20[ 40
Total 200
1. Distributions statistiques à 1 caractère
1.3.Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)

Age Fréquences Densité


[15;25[ 20% 2%
Age des téléspectateurs du JT de TF1 de 13 heures
Caractère quantitatif continu avec amplitudes de classe inégales
[25;50[ 50% 2% 3 modalités
[50;60[ 30% 3%
Total 100%
1. Distributions statistiques à 1 caractère
1.3.Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)

Age Fréquences Densité Age des téléspectateurs du JT de TF1 de 13 heures


[15;25[ 20% 2% Caractère quantitatif continu avec amplitudes de classe inégales
3 modalités
[25;50[ 50% 2%
Classe modale: [50, 60[
[50;60[ 30% 3%
Total 100%
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Moyenne (valeurs numériques ponctuelles)

On distribue une population de taille N selon les p modalités


d’un caractère S (par exemple le niveau de salaire), ordonnées
de la plus petite (S1) à la plus grande (Sp).

La moyenne est calculable uniquement pour les caractères


quantitatifs.
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Moyenne (valeurs numériques ponctuelles)
∑(%&' )% "%
"̅ = (
∑%&' )%

)' "' + )+ "+ + ⋯ + )- "-


=
)' + )+ + ⋯ + )-
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position) ∑(%&' )% "%
Moyenne (valeurs numériques ponctuelles) "̅ = (
∑%&' )%
)' "' + )+ "+ + ⋯ + )- "-
=
)' + )+ + ⋯ + )-

)' "' + )+ "+ + ⋯ + )- "-


=
. (2
(/ (1
= "' + " + ⋯ + "-
0 0 + 0
= 3' "' + 3+ "+ + ⋯ + 3- "-
(

= 4 3% "%
%&'
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Moyenne (valeurs numériques en classes)
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Moyenne (valeurs numériques en classes)
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Moyenne (valeurs numériques en classes)
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Moyenne (valeurs numériques en classes)
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Propriété de la moyenne

La moyenne pondérée des écarts à la moyenne est nulle


1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)

Heures passées
devant la télévision
0 40 0 10% 0
1 80 80 20% 0,2
2 100 200 25% 0,5
3 120 360 30% 0,9
4 60 240 15% 0,6
Total 400 880 100% 2,2
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)

Heures passées
devant la télévision
0 40 0 10% 0
1 80 80 20% 0,2
2 100 200 25% 0,5
3 120 360 30% 0,9
4 60 240 15% 0,6
Total 400 880 100% 2,2
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)

Heures passées
devant la télévision
0 40 0 10% 0
1 80 80 20% 0,2
2 100 200 25% 0,5
3 120 360 30% 0,9
4 60 240 15% 0,6
Total 400 880 100% 2,2
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)

Notes

[0, 5[ 35 2,5 87,5 17,5% 0,4375


[5, 10[ 50 7,5 375 25% 1,875
[10, 15[ 75 12,5 937,5 37,5% 4,6875
[15, 20[ 40 17,5 700 20% 3,5
Total 200 2100 10,5
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)

Notes

[0, 5[ 35 2,5 87,5 17,5% 0,4375


[5, 10[ 50 7,5 375 25% 1,875
[10, 15[ 75 12,5 937,5 37,5% 4,6875
[15, 20[ 40 17,5 700 20% 3,5
Total 200 2100 10,5
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)

Notes

[0, 5[ 35 2,5 87,5 17,5% 0,4375


[5, 10[ 50 7,5 375 25% 1,875
[10, 15[ 75 12,5 937,5 37,5% 4,6875
[15, 20[ 40 17,5 700 20% 3,5
Total 200 2100 10,5
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)

Notes

[0, 5[ 35 2,5 87,5 17,5% 0,4375


[5, 10[ 50 7,5 375 25% 1,875
[10, 15[ 75 12,5 937,5 37,5% 4,6875
[15, 20[ 40 17,5 700 20% 3,5
Total 200 2100 10,5
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Médiane: valeur de la modalité du caractère qui divise la population totale en deux sous-
populations de taille égale
http://www.konbini.com/fr/entertainment-2/great-teacher-
Intuition issaba-kery-james-maths-rap-statistiques/

On compte le nombre de pièces de 2€ dans le porte-monnaie de 5 personnes. On en trouve:


3, 5, 3, 4, 7.
On ordonne la liste: 3, 3, 4, 5, 7.
La valeur médiane est celle qui divise la liste (le nombre de porte-monnaie) en deux sous-
listes de taille égale: 4.
Discussion: nombre impair/pair d’individus statistiques
Si dans un 6ème porte-monnaie, on trouve 8 pièces de 2€, la liste devient:
3, 3, 4, 5, 7, 8 et la médiane est comprise entre 4 et 5 pièces.
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane: Expression de la distribution en fréquences cumulées
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane
Expression de la distribution en fréquences cumulées

Pour quelle valeur k de la modalité du caractère, est-elle égale à 50%?

N (100%)

min max
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane
Expression de la distribution en fréquences cumulées

Pour quelle valeur k de la modalité du caractère, est-elle égale à 50%?

N/2 (50%) N/2 (50%)

min médiane max


1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane
Repérage de la tranche dans
laquelle dépasse 50%
(hyp. tranche [ Bi -1; Bi [ )

Représentation graphique de la
série de fréquences cumulées

Construction des couples de


points:
A0 ( 0;0% ) , A1 ( B1 ; F1 ) , A2 ( B2 ; F2 ) ,
A3 ( B3 ; F3 ) ,..., Ai ( Bi ; Fi ) ,..., Ap ( B p ;100% )
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane
Ap
Fp = 100%

Fi
Ai
Fi -1 Ai -1

F2
A1 A2
F1
0%
0 B1 B2 Bi -1 Bi Bp
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane

Fi
Ai
Fi -1 Ai -1

0%
0 Bi -1 Bi
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane

Fi
Ai
Fi -1 Ai -1

0%
0 Bi -1 Bi
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane Hypothèse de répartition uniforme de
la population entre les valeurs Bi -1
et Bi (ajustement linéaire de Ai -1 à Ai )

Fi
Ai
Fi -1 Ai -1

0%
0 Bi -1 Bi
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane

Fi
50% Ai
Fi -1 Ai -1

0%
0 Bi -1 Me B
i
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane
Ce théorème est connu sous le nom de:
1. Théorème de Jessica

A
2. Théorème de Julien Marie
B’

3. Théorème de Afida
B

C’
4. Théorème de Thalès

C
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane https://www.youtube.com/watch?v=MaMo2ed6kP0
Ce théorème est connu sous le nom de:
1. Théorème de Jessica

A
2. Théorème de Julien Marie
B’

3. Théorème de Afida
B

C’
4. Théorème de Thalès

C
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane Corollaire du théorème de Thalès:
,-
!" !"′ !#′ que déduire quant au rapport ?
= → !# = ×!" ,.
!# !#′ !"′ On trace une troisième droite (DD’) parallèle à (BB’) et
!" !"′ !(′ (CC’)
= → !( = ×!" A
!( !(′ !"′
!#′
"# !# − !" ×!" − !"
= !"′ B’
=
"( !( − !" !(′
×!" − !"
!"′
!#′ !# + − !"′ B
!" −1
!"′ = !"′
= +
!(′ !( − !"′ C’
!" −1 !"′
!"′
!# + − !"′ !"′
= × C D’
!"′ !( + − !"′
!# + − !"′ " + #′
= =
!( + − !"′ " + (′ D
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane
En vertu de ce qui vient
d’être démontré:
=

Fi
50% Ai
Fi -1 Ai -1

0%
0 Bi -1 Me B
i
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Calcul de la médiane
Fréquences La médiane appartient à l’intervalle [25;50[.
Age Fréquences cumulées
[15;25[ 30% 30%
[25;50[ 40% 70%
[50;65[ 30% 100%
Total 100%
x
100%
Fk
x
70%
50%

30% x ans
0% Age
15 25 Me 50 65
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.1. Indicateurs de tendance centrale (ou de position)
Autre manière de procéder:
Calcul de la médiane
Fréquences F2-F1=40% (=f2) X3-X2=25 (=a2)
Age Fréquences cumulées
[15;25[ 30% 30% 50%-F1=20% Me-X2
[25;50[ 40% 70%
(F2-F1) x (Me-X2) = (50%-F1) x ( X3-X2)
[50;65[ 30% 100% (50%-F1)
(Me-X2) = x ( X3-X2)
Total 100% (F2-F1)
(50%-F1)
F2-F1=40% (=f2) Me = x ( X3-X2) + X2
(F2-F1)
50%-F1=20%
30% 70% Fréq Cum
50%
médiane
25 50 Age
Me-X2
X3-X2=25 (=a2)
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Principe: caractériser à l’aide d’un indicateur unique la variabilité des réalisations
des modalités du caractère
3 indicateurs de dispersion: étendue, écart-type, quantiles
S’exprime dans la même unité que les modalités du caractère
Ne se calcule que pour les caractères quantitatifs
Etendue
Différence entre la valeur maximale et la valeur minimale des modalités du caractère
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Etendue Heures passées ni
devant la télévision
0 40 Mode: 3h
1 80
2 100
Etendue: 4-0=4h
3 120
4 60
Total 400

Age Fréquences
[15;25[ 30% Classe modale: 15-24 ans
[25;50[ 40% Etendue: 65-15=50h
[50;65[ 30%
Total 100%
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Définition L’écart-type d’un caractère est défini comme la racine carrée de la moyenne pondérée
du carré des écarts des réalisations de la variable à la moyenne des réalisations (variance).
Pour une distribution statistique, c’est la racine carrée de la moyenne pondérée du carré des
écarts entre les modalités du caractère étudié et la moyenne de la distribution selon ce même
caractère.
L’écart-type se lit ainsi comme l’écart moyen par rapport à la moyenne:
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)

Pour les caractères quantitatifs continus dont les modalités sont


exprimées à l’aide de classes, est substitué à .
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)

Coefficient de variation relatif à la moyenne (%)

Mesure la magnitude des variations du caractère par rapport à


son comportement moyen
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 0 -2,2 4,84 193,6
1 80 80 -1,2 1,44 115,2
2 100 200 -0,2 0,04 4,0
3 120 360 0,8 0,64 76,8
4 60 240 1,8 3,24 194,4
Total 400 880 584
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 0 -2,2 4,84 193,6
1 80 80 -1,2 1,44 115,2
2 100 200 -0,2 0,04 4,0
3 120 360 0,8 0,64 76,8
4 60 240 1,8 3,24 194,4
Total 400 880 584
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 0 -2,2 4,84 193,6
1 80 80 -1,2 1,44 115,2
2 100 200 -0,2 0,04 4,0
3 120 360 0,8 0,64 76,8
4 60 240 1,8 3,24 194,4
Total 400 880 584
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 0 -2,2 4,84 193,6
1 80 80 -1,2 1,44 115,2
2 100 200 -0,2 0,04 4,0
3 120 360 0,8 0,64 76,8
4 60 240 1,8 3,24 194,4
Total 400 880 584

=1,21
=584/400=1,46
=55%
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 10% -2,2 4,84 0,484
1 80 20% -1,2 1,44 0,288
2 100 25% -0,2 0,04 0,01
3 120 30% 0,8 0,64 0,192
4 60 15% 1,8 3,24 0,486
Total 400 100% 1,46
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 10% -2,2 4,84 0,484
1 80 20% -1,2 1,44 0,288
2 100 25% -0,2 0,04 0,01
3 120 30% 0,8 0,64 0,192
4 60 15% 1,8 3,24 0,486
Total 400 100% 1,46
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 10% -2,2 4,84 0,484
1 80 20% -1,2 1,44 0,288
2 100 25% -0,2 0,04 0,01
3 120 30% 0,8 0,64 0,192
4 60 15% 1,8 3,24 0,486
Total 400 100% 1,46
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 10% -2,2 4,84 0,484
1 80 20% -1,2 1,44 0,288
2 100 25% -0,2 0,04 0,01
3 120 30% 0,8 0,64 0,192
4 60 15% 1,8 3,24 0,486
Total 400 100% 1,46

=1,21

=1,46
=55%
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 0 0,0 0
1 80 80 1,0 80
2 100 200 4,0 400
3 120 360 9,0 1080
4 60 240 16,0 960
Total 400 880 2520
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 0 0,0 0
1 80 80 1,0 80
2 100 200 4,0 400
3 120 360 9,0 1080
4 60 240 16,0 960
Total 400 880 2520
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 0 0,0 0
1 80 80 1,0 80
2 100 200 4,0 400
3 120 360 9,0 1080
4 60 240 16,0 960
Total 400 880 2520

=1,21

=2520/400 – 2,22=1,46
=55%
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 10% 0,0 0,0
1 80 20% 1,0 0,2
2 100 25% 4,0 1,0
3 120 30% 9,0 2,7
4 60 15% 16,0 2,4
Total 400 100% 6,3
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 10% 0,0 0,0
1 80 20% 1,0 0,2
2 100 25% 4,0 1,0
3 120 30% 9,0 2,7
4 60 15% 16,0 2,4
Total 400 100% 6,3
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Ecart-type (variance)
Heures passées
devant la télévision
0 40 10% 0,0 0,0
1 80 20% 1,0 0,2
2 100 25% 4,0 1,0
3 120 30% 9,0 2,7
4 60 15% 16,0 2,4
Total 400 100% 6,3

=1,21

=6,3 – 2,22=6,3-4,84=1,46
=55%
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles
Définition Les quantiles d’ordre n permettent de diviser la population statistique distribuée
selon les modalités d’un caractère en n sous-populations de taille égale (N/n).
On peut définir autant de répartitions d’une distribution en quantiles que de sous-populations
de taille égale envisageables (une infinité).

https://www.youtube.com/watch?v=uIx2xvdwIIo
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles
Pour quelle valeur k de la modalité du caractère, est-elle égale à:
– 50% (médiane)?

N/2 (50%) N/2 (50%)

min médiane max


1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles
Pour quelle valeur k de la modalité du caractère, est-elle égale à:
– 50% (médiane)?
– 10% (premier décile, D1)?

10% 90%

min D1 max
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles
Pour quelle valeur k de la modalité du caractère, est-elle égale à:
– 50% (médiane)?
– 10% (premier décile, D1)?
– 25% (premier quartile, Q1)?

25% 75%

min Q1 max
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles
Pour quelle valeur k de la modalité du caractère, est-elle égale à:
– 50% (médiane)?
– 10% (premier décile, D1)?
– 25% (premier quartile, Q1)?
– 90% (neuvième décile, D9)?

90% 10%

min D9 max
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles
Pour quelle valeur k de la modalité du caractère, est-elle égale à:
– 50% (médiane)?
– 10% (premier décile, D1)?
– 25% (premier quartile, Q1)?
– 90% (neuvième décile, D9)?
– 99% (quatre-vingt-dix-neuvième (per)centile, C99 ou P99)?

99% 1%

min C99 max


1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles
Exemple de définition d’un quantile dans la distribution d’un caractère quantitatif dont les modalités sont exprimées
par des classes: troisième quartile (Q3)
On repère la modalité dans laquelle les 75% de fréquence cumulée sont dépassés. On relève la fréquence cumulée à
l’entrée de la classe FA et la fréquence cumulée à la sortie FB, la borne inférieure XA et la borne supérieure de la
classe XB.
Fi
100% x
FB x
75%

50%
FA x
x
0%
XA Xp Xi
0 Q3 XB
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles
Mesure de dispersion utilisant les quantiles: l’écart inter-quartile Q3-Q1

Par construction: l’intervalle [Q1;Q3] contient 50% de la population


1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles

Notes

[0, 5[ 35 17,5% 17,5%


[5, 10[ 50 25% 42,5%
[10, 15[ 75 37,5% 80%
[15, 20[ 40 20% 100%
Total 200 100%
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles: revenu individuel
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion https://www.insee.fr/fr/metadonnees/definition/c1890
Quantiles: revenu individuel
Richesse mondiale
100% x

52% x

0% x 99%
100%
0%
Population mondiale

Revenu ⇢ quel quantile?


https://www.inegalites.fr/Salaire-etes-vous-riche-ou-pauvre
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles: revenu individuel

+7,7%
+7,1%
+11,8%
+23,3%
+42,8%
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.2. Indicateurs de dispersion
Quantiles: revenu individuel
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

La courbe de Lorenz permet de mesurer la concentration d’un phénomène économique (par


exemple, la concentration de richesses).
Attention! La concentration n’est pas l’antonyme de la dispersion.
La dispersion se mesure à partir de la distribution en fréquence cumulée d’une population selon
les modalités d’un caractère.
La concentration met en relation cette distribution en fréquence cumulée avec la distribution en
fréquence cumulée des valeurs concentrées par les individus présentant la même modalité.
Elle donne lieu à des constats du type: « X% de la population détient Y% de la richesse. »

https://www.youtube.com/watch?v=3QqR3AQe-SU
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

ordonnée abscisse
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

Courbe de Lorenz:
ensemble des points de coordonnées ( Fi ; Fi )
v

Fi varie de 0 à 100%
100%
Fi v
90%

Fi v varie de 0 à 100% 80%

70%

60%

50%

40%

30%

20%

10%

0%
Fi
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

fi fi v Fi Fi v 100%
Fi v
0% 0% 0% 0% 90%

10% 3% 10% 3% 80%

10% 5% 20% 8% 70%

10% 6% 30% 13% 60%


10% 7% 40% 20% 50%
10% 8% 50% 28%
40%
10% 9% 60% 37%
30%
10% 11% 70% 48%
20%
10% 13% 80% 60%
10%
10% 15% 90% 75%
Fi
10% 25% 100% 100% 0%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
100% 100% Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

fi fi v Fi Fi v 100%
Fi v
0% 0% 0% 0% 90%

10% 3% 10% 3% 80%

10% 5% 20% 8% 70%

10% 6% 30% 13% 60%


10% 7% 40% 20% 50%
10% 8% 50% 28%
40%
10% 9% 60% 37%
30%
10% 11% 70% 48%
20%
10% 13% 80% 60%
10%
10% 15% 90% 75%
Fi
10% 25% 100% 100% 0% X
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
100% 100% Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

fi fi v Fi Fi v 100%
Fi v
0% 0% 0% 0% 90%

10% 3% 10% 3% 80%

10% 5% 20% 8% 70%

10% 6% 30% 13% 60%


10% 7% 40% 20% 50%
10% 8% 50% 28%
40%
10% 9% 60% 37%
30%
10% 11% 70% 48%
20%
10% 13% 80% 60%
10%
10% 15% 90% 75%
X Fi
10% 25% 100% 100% 0% X
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
100% 100% Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

fi fi v Fi Fi v 100%
Fi v
0% 0% 0% 0% 90%

10% 3% 10% 3% 80%

10% 5% 20% 8% 70%

10% 6% 30% 13% 60%


10% 7% 40% 20% 50%
10% 8% 50% 28%
40%
10% 9% 60% 37%
30%
10% 11% 70% 48%
20%
10% 13% 80% 60%
10%
10% 15% 90% 75%
X
X
Fi
10% 25% 100% 100% 0% X
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
100% 100% Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

fi fi v Fi Fi v 100%
Fi v
0% 0% 0% 0% 90%

10% 3% 10% 3% 80%

10% 5% 20% 8% 70%

10% 6% 30% 13% 60%


10% 7% 40% 20% 50%
10% 8% 50% 28%
40%
10% 9% 60% 37%
30%
10% 11% 70% 48%
20%
10% 13% 80% 60%
X
10%
10% 15% 90% 75%
X
X
Fi
10% 25% 100% 100% 0% X
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
100% 100% Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

fi fi v Fi Fi v 100%
Fi v
0% 0% 0% 0% 90%

10% 3% 10% 3% 80%

10% 5% 20% 8% 70%

10% 6% 30% 13% 60%


10% 7% 40% 20% 50%
10% 8% 50% 28%
40%
10% 9% 60% 37%
30%
10% 11% 70% 48%
20% X
10% 13% 80% 60%
X
10%
10% 15% 90% 75%
X
X
Fi
10% 25% 100% 100% 0% X
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
100% 100% Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

fi fi v Fi Fi v 100%
Fi v
0% 0% 0% 0% 90%

10% 3% 10% 3% 80%

10% 5% 20% 8% 70%

10% 6% 30% 13% 60%


10% 7% 40% 20% 50%
10% 8% 50% 28%
40%
10% 9% 60% 37%
30%
X
10% 11% 70% 48%
20% X
10% 13% 80% 60%
X
10%
10% 15% 90% 75%
X
X
Fi
10% 25% 100% 100% 0% X
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
100% 100% Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

fi fi v Fi Fi v 100%
Fi v
0% 0% 0% 0% 90%

10% 3% 10% 3% 80%

10% 5% 20% 8% 70%

10% 6% 30% 13% 60%


10% 7% 40% 20% 50%
10% 8% 50% 28%
40%
X
10% 9% 60% 37%
30%
X
10% 11% 70% 48%
20% X
10% 13% 80% 60%
X
10%
10% 15% 90% 75%
X
X
Fi
10% 25% 100% 100% 0% X
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
100% 100% Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

fi fi v Fi Fi v 100%
Fi v
0% 0% 0% 0% 90%

10% 3% 10% 3% 80%

10% 5% 20% 8% 70%

10% 6% 30% 13% 60%


10% 7% 40% 20% 50%
X
10% 8% 50% 28%
40%
X
10% 9% 60% 37%
30%
X
10% 11% 70% 48%
20% X
10% 13% 80% 60%
X
10%
10% 15% 90% 75%
X
X
Fi
10% 25% 100% 100% 0% X
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
100% 100% Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

fi fi v Fi Fi v 100%
Fi v
0% 0% 0% 0% 90%

10% 3% 10% 3% 80%

10% 5% 20% 8% 70%

10% 6% 30% 13% 60% X


10% 7% 40% 20% 50%
X
10% 8% 50% 28%
40%
X
10% 9% 60% 37%
30%
X
10% 11% 70% 48%
20% X
10% 13% 80% 60%
X
10%
10% 15% 90% 75%
X
X
Fi
10% 25% 100% 100% 0% X
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
100% 100% Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

fi fi v Fi Fi v 100%
Fi v
0% 0% 0% 0% 90%

10% 3% 10% 3% 80%


X
10% 5% 20% 8% 70%

10% 6% 30% 13% 60% X


10% 7% 40% 20% 50%
X
10% 8% 50% 28%
40%
X
10% 9% 60% 37%
30%
X
10% 11% 70% 48%
20% X
10% 13% 80% 60%
X
10%
10% 15% 90% 75%
X
X
Fi
10% 25% 100% 100% 0% X
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
100% 100% Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration
fi fi v Fi Fi v
100% X
v
0% 0% 0% 0%
90%
Fi
10% 3% 10% 3%
80%
10% 5% 20% 8% X
70%
10% 6% 30% 13% n
60% t i tio X
10% 7% 40% 20% r
pa
10% 8% 50% 28% 50% u iré
q X
d’é

in é
10% 9% 60% 37%
ite

ga
40%
o X
Dr

li
in é


10% 11% 70% 48% 30%

s
ga
X

-
10% 13% 80% 60%

li té
20% X

s
10% 15% 90% 75%

+
X
10%
10% 25% 100% 100%
0% X X
X
inégalité parfaite Fi
100% 100% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

Richesse mondiale
100% x

52% x

0% x 99%
100%
0%
Population mondiale
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

Richesse mondiale
100% x

52% x

0% x 99%
100%
0%
Population mondiale
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

Richesse mondiale
100% x

52% x

0% x 99%
100%
0%
Population mondiale
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

Richesse mondiale
100% x

52% x

5,5%
0% x x 99%
0% 80% 100%
Population mondiale
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

http://www.lemonde.fr/les-
decodeurs/article/2015/01/19/la-concentration-des-
richesses-dans-le-monde-en-
graphiques_4558914_4355770.html
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

https://www.lemonde.fr/les-
decodeurs/article/2017/05/30/dix-
graphiques-qui-illustrent-les-inegalites-
en-france_5136168_4355770.html
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

https://wid.world/fr/country/france-2/
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

100% X
v
La situation révélée par la 90%
Fi
courbe bleue est-elle plus
égalitaire que la situation 80%
X
représentée par la courbe 70%
marron?
60% X

50%
X
Impossible de l’établir sur la
40%
base de la comparaison des X
courbes de Lorenz 30%
X
20% X
X
10%

0% X X
X
Fi
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

100% X
v
La situation révélée par la 90%
Fi
courbe bleue est-elle plus
égalitaire que la situation 80%
X
représentée par la courbe 70%
marron?

in é
60% X

ga
li
50%


X
Impossible de l’établir sur la

+s
40%
base de la comparaison des X
courbes de Lorenz 30%

in é
X

ga
20% X

lité
s
X
10%

-
0% X X
X
Fi
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

100% X
v
Méthode algébrique 90%
Fi
80%
Détermination de la part de
X
l’aire entre la droite 70%
d’équirépartition et la courbe
60% X
de Lorenz …
50%
X
40%
X
30%
X
20% X

10% X

0% X X
X
Fi
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

100% X
v
Méthode algébrique 90%
Fi
Détermination de la part de 80%
X
l’aire entre la droite 70%
d’équirépartition et la courbe
60% X
de Lorenz …
50%
X
A
40%
X
30%
X
20% X
X
10%

0% X X
X
Fi
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

100% X
v
Méthode algébrique 90%
Fi
Détermination de la part de 80%

l’aire entre la droite


A1 X
70%
d’équirépartition et la courbe
60% X
de Lorenz …
d’où: 50% A1
A = A1 + A2
X
40%

A1 A - A2 A2
X
A2
= = 1- 30%
X
A A A 20% X
d’où: X
A1 10%
A= 1 = 1 - 2 A0%
X
Fi
2 A
2 X X

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

100% X
A1 Fi v
= 1 - 2 A2 90%
A
80%
A A1 X
A1 = A, A2 = 0 et 1 = 1 70%

A 60% X
inégalité parfaite
50% A1 X
A1
A1 = 0, A2 = A et =0 40%
X
A2
A 30%
X
égalité parfaite
20% X
X
10%

0% X X
X
Fi
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

100% X
A2 , somme d’aires de Fi v
polygones (trapèzes) 90%

80%
A1 X
70%

60% X
B = Fi v
b = Fi -v1
50%
v
A1 X
Fi
h = ( Fi - Fi -1 ) 40% X
A2
aire du trapèze jaune = 30% X
v
B+b 20% F i -1 X
´h = X
2 10%
Fi -1 Fi
X
X
Fi
Fi v + Fi -v1 0%X
´ ( Fi - Fi -1 ) 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
2 Revenu disponible, France-2004
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

B+b Fi v + Fi -v1
aire du trapèze jaune = ´h = ´ ( Fi - Fi -1 )
2 2
p
(F v
+ Fi -v1 ) ( Fi - Fi -1 ) p
A2 = å =1 å ( i i-1 ) ( Fi - Fi-1 )
i
F v
+ F v

i =1 2 2 i =1
p

2 å(
Gini = 1 - 2 ´ A2 = 1 - 2 ´ 1 F i
v
+ Fi -v1 ) ( Fi - Fi -1 )
i =1
p
= 1 - å ( Fi v + Fi -v1 ) ( Fi - Fi -1 )
i =1
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

Fi Fi v ( Fi - Fi-1 ) ( F
i
v
+ Fi -v1 ) ( Fi - Fi-1 ) ´ ( Fi v + Fi-v1 ) Revenu disponible,
0% 0% 0% 0% 0% France-2004
10% 3% 10% 3% 0%
p
20% 8% 10% 11% 1% Gini = 1 - å ( Fi v + Fi -v1 ) ( Fi - Fi -1 )
i =1
30% 13% 10% 21% 2%
= 1 - 68% = 32%
40% 20% 10% 33% 3%
50% 28% 10% 47% 5%
60% 37% 10% 64% 6%
70% 48% 10% 84% 8%
80% 60% 10% 108% 11%
90% 75% 10% 135% 14%
100% 100% 10% 175% 18%
68%
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration

https://www.populationdata.net/cartes/monde-coefficient-de-gini/
1. Distributions statistiques à 1 caractère
1.3. Caractéristiques numériques
1.3.3. Indicateurs de concentration
1. Distributions statistiques à 1 caractère
1.4. Forme des distributions statistiques
1.4.1. Distributions symétriques

La distribution la plus répandue dans la mesure de caractères socio-économiques est la


distribution Normale (distribution de Gauss).
Cette distribution est symétrique, faiblement dispersée autour de la moyenne et caractérisée
par:
Mode=Moyenne=Médiane
1. Distributions statistiques à 1 caractère
1.4. Forme des distributions statistiques
1.4.1. Distributions symétriques
1. Distributions statistiques à 1 caractère
1.4. Forme des distributions statistiques
1.4.2. Distributions dissymétriques
On distingue deux types de distribution statistique dissymétrique.
La distribution concentrée à gauche est appelée distribution du Khi-Deux (c2).

Concentrée à gauche Concentrée à droite

Mode<Médiane<Moyenne
1. Distributions statistiques à 1 caractère
1.4. Forme des distributions statistiques
1.4.2. Distributions dissymétriques
On distingue deux types de distribution statistique dissymétrique.
La distribution concentrée à gauche est appelée distribution du Khi-Deux (c2).

Concentrée à gauche Concentrée à droite

Mode<Médiane<Moyenne Mode>Médiane>Moyenne
1. Distributions statistiques à 1 caractère
1.4. Forme des distributions statistiques
1.4.2. Distributions dissymétriques

Vous aimerez peut-être aussi