Vous êtes sur la page 1sur 33

Chapitre 2 : Représentations de Distributions à un caractère

Dans le chapitre 1 : on a vu

1/ Comment calculer des taux de croissance


2/ Faire des sommes et des produits

Ce sont deux outils de traitement de l’information

Dans ce chapitre, on va pouvoir utiliser ces outils et d’autres pour représenter


l’information : graphiquement, ou à l’aide de tableaux.
2.1/ Tableaux statistiques

Comment peut-on lire un tableau statistique à un caractère (une variable) ?

Individu Variable x
statistique
I1 x1
I2 x2
I3 x3=x1
… ..
… ..
Ik xK=x2

La variable X a plusieurs modalités


Chaque modalité peut être attribuée à plusieurs individus à la fois
2.1.1/ La fréquence

En synthétisant un peu plus le tableau on a :

Variable x Effectifs (ni)


X1 n1
X2 n2

xk Nk
N
A chaque modalité ‘i’ correspond un nombre d’inidividus ni
Exemple : Echantillon de 2.500.000 personnes
Var. Couleur des yeux Effectif
Verts 500.000
Bleus 400.000
Marrons 1.000.000
Noirs 600.000

La notion de fréquence (ou fréquence relative) :


Définition : La fréquence est la proportion d’individus présentant la même modalité
(observation) dans la population totale :
C’est aussi le rapport entre le nombre d’individus présentant la même observation par
rapport au nombre total d’individu.
ni ni
fi =
n
et en pourcentage fi % =
n
*100
Exemple :
Couleur des yeux Effectifs Fréquence
Verts 500000 0,2
Bleus 400000 0,16
Marrons 1000000 0,4
Noirs 600000 0,24
2.500.000 100%
Interprétation : ex . Il y a 20% des individus ayant les yeux verts

2.1.2/ La fréquence cumulée

Définition : La fréquence cumulée donne le pourcentage d’individus ayant une


observation inférieure (ou supérieure) à un certain seuil.
Cela suppose que les observations sont mesurables pour être ordonnées et pour qu’on
leur applique le seuil. Ainsi, la fréquence cumulée ne s’applique qu’aux variables
quantitatives.
Exemple :
Nombre de voitures Effectifs Fréquence Fréquence Fréquence
(Xi) cumulée (« au cumulée
plus Xi» ou (« au
« moins de moins Xi» ou
X(i+1) ») « plus de
« X(i-1) »)
1 1000000 0,4 0,4 100
2 600000 0,24 0,64 0,6
3 500000 0,2 0,84 0,36
4 400000 0,16 100 0,16
2.500.000 100%
Intérprétaion : 64% des ménages ont moins de 3 voitures (ou ont au plus 2 voitures)
On peut aussi avoir un même raisonnement sur un cumul en effectif (et non en
fréquence)
Exemple :
nombre de voitures Effectifs Fréquence Cumul effectif Cumul
(moins de X(i+1)) effectif (plus
de X(i-1))
i=1 1000000 0,4 1000000 2500000
i=2 600000 0,24 1600000 1500000
i=3 500000 0,2 2100000 900000
i=4 400000 0,16 2500000 400000
2.500.000 100%
Intérprétaion : 2.500.000 ont au moins une voiture ;
900.000 ont plus de 2 voitures (ou ils ont au moins 3 voitures)

Fi ( x ) = ∑ f i ( xi )
Notation de la fréquence cumulée :
A contrario, le cumul des fréquences pour une variable qualitative n’est pas très joli à
représenter

Exemple :
Exemple :
Couleur des yeux Effectifs Fréquence Fréquence
cumulée ?
Verts 500000 0,2 0.2
Bleus 400000 0,16 0.36
Marrons 1000000 0,4 0.76
Noirs 600000 0,24 100
2.500.000 100%
Interprétation : ex . Il y a 76% des individus ayant les yeux verts, bleus ou
marrons ! !

Dans le cas d’une variable à plus de modalités encore ça devient ininterprétable !


(exemple adresse de résidence avec codes postaux comme modalités…)
2.1.2/ Fréquence cumulée avec variable continue

La variable continue (observation par classe) subit en général un traitement similaire à


la variable discrète. Excepté quand les amplitudes de la classes ne sont pas égales.

2.1.2.1/ Amplitudes égales

Une variable continue à amplitudes égales est une variable où toutes les classes
d’observation sont à intervalles égales.
Exemple :

Salaires Nombre amplitude Fréquence Fréquence cumulée


(euros/mois) salariés (moins de)
[1000-1500[ 20 500 25% 25%
[1500-2000[ 25 500 31.25% 56.25%
[2000-2500[ 35 500 43.75% 100%

• Amplitude : a = e − e avec e la valeur de la borne de droite ; e celle de gauche.


i i i −1 i i−1

• Meilleur lisibilité des tableaux de fréquences cumulées avec une variable continue :

56.25% des salariés gagnent moins de 2000 euros/mois


2.1.2.2/ Amplitudes inégales

Quand l’amplitude est inégale, les intervalles de classe ne sont pas équivalents.

Salaires Nombre amplitude Fréquence Fréquence Fréquence


(euros/mois) salariés cumulée ajustée (à
(moins de) amplitude égale)
[1000-1500[ 20 500 25% 25% 25%
[1500-3000[ 35 1500 43.75% 68.75% 68.75/3=14.6%
[3000-3500[ 25 500 31.25% 100% 31.25%

1/ On ne peut pas comparer 43.75% dans la classe 1500-3000, aux fréquences des deux
autres classes. Bien que la proportion des salariés est large, la classe de rémunération
est beaucoup plus large.

2/ A des fins de comparaison, il faut alors ramener cette proportion à une échelle
comparable à celle des autres classes : Ici l’unité d’échelle est de 500. Comme l’Unité
d’échelle est le 1/3 de l’amplitude inégale alors il faut multiplier la fréquence par 1/3.
3/ En moyenne, 14.3% des salariés ont un salaire dans l’une des intervalles égales
‘fictives’ : 1500-2000, 2000-2500, 2500-3000.

Question : Est ce que la fréquence cumulée est affectée ?

Réponse : non. La taille de l’intervalle est indépendante de la fréquence cumulée.


68.75 % auront toujours moins de 3000 euros/mois.
2.2/ Représentations graphiques

Les tableaux synthétisent les données mais ne permettent pas d’avoir une vue
d’ensemble des distributions. Au contraire, les graphiques viennent compléter le travail
d’analyse en apportant une synthèse visuelle d’ensemble.

2.2.1/ Représentations de fréquences (relatives)

Quatre modes : Diagramme à secteurs circulaires (ou disques), Tuyaux d’orgues,


diagrammes en bâtons et histogrammes

-Les Diagrammes à secteurs circulaires (ou disques) (s’appliquent aux var. discrètes
ou continues)

Définition : Les disques permettent de visualiser des parts relatives


10

Eco Industrielle
7%
Eco inter
21%

Eco inter
Macro économie
Micro économie
Eco Industrielle
Macro économie
17%

Micro économie
55%
Chaque secteur (part) correspond à une modalité

L’angle au centre : a=fi.360°=fréquence*360 degrés

- Le diagramme en bâtons (var. discrètes)

Définition : Diagramme qui représente chaque valeur d’une variable (ou sa fréquence)
par un bâton (segment vertical) qui lui est proportionnel.
Exemple : Nombre d’éléctroménagers des ménages
Electroménager Ménages Fréquence
1 25 6,25%
2 100 25%
3 125 31,25%
4 100 25%
5 50 12,50%

Nombre d'Electroménagers

35
30
25
Fréquence

20
Electroménager
15
10
5
0
1 2 3 4 5
Nombre Electro

400 1

- Les graphiques en tuyaux d’orgue (var. discrètes ou continues)

Pour variables discrètes. définition : rectangles à base constante, proportionnels en


taille aux effectifs ou fréquence
Matière

90
80
Nb de professeurs

70
60
50
Matière
40
30
20
10
0
Eco inter Macro Micro Eco
économie économie Industrielle

-
- Graphiques en tuyaux d’orgue composés
Souvent il s’agit de synthétiser 2 informations ou +, dans une seule représentation
graphique.
Définition : Les tuyaux d’orgue composés représentent des distributions de variables
imbriquées.

Exemple : Commerce de la France

Valeurs Fréquence
1970 1980 1990 1970 1980 1990
ALL 50 70 80 0,5 0,58 0,5
ITA 30 30 50 0,3 0,25 0,31
ESP 20 20 30 0,2 0,17 0,19
Total 100 120 160 1 1 1

2 distributions : 1/ Celle du commerce total dans le temps ;


2/ celle de sa composition par année
Graphique tuyaux d'orgue composés

100%

80%
fréquence

60% ESP
ITA
40% ALL
20%

0%
1970 1980 1990
Année

- Graphique en tuyau d’orgue pour variables continues : Les histogrammes

Définition : Les histogrammes sont comparables à des diagrammes en tuyaux d’orgue


mais dont les extrémités sont délimitées par celles des classes de variables continues

A- Cas simple : Egalité des amplitudes


Salaires amplitude Fréquence
(euros/mois)
[1000-1500[ 500 20%
[1500-2000[ 500 25%
[2000-2500[ 500 40%
[2500-3000[ 15%

1000 1500 2000 2500 3000


On pose l’amplitude=Ai=1 unité d’échelle. Donc 1 unité=500
Surface totale de l’aire délimité par l’histogramme :

S= ∑A . f =0.20*1+0.25*1+0.40*1+0.15*1=100%
i
i i

B- Cas approfondi : Amplitudes Inégales

Dans le cas d’amplitudes différentes, il faut ajuster les fréquences à la même échelle
d’amplitude

Exemple :
Salaires amplitude Fréquence Fréquence
(euros/mois) ajustée (à
amplitude égale)
[1000-1500[ 500 20% 20%
[1500-2000[ 500 25% 25%
[2000-3000[ 1000 55% 55%/2=27.5

1000 1500 2000 3000


On pose l’amplitude=Ai=1 unité d’échelle. Donc 1 unité=500
Surface totale de l’aire délimité par l’histogramme :

S= ∑ A.
i fi
a
i =0.20*1+0.25*1+0.275*2=100%
- Polygone (ou courbe) de fréquence

Définition : La courbe de fréquence est une courbe synthétisant les distributions


représentées par des histogrammes en joignant les milieux des sommets des classes
d’amplitude égale.
Remarque : la surface à l’intérieur de la courbe est égale à 100%

1000 1500 2000 3000


-
2.2.2- Représentations de fréquences cumulées

-Courbe cumulative pour variables discrètes

Définition : La courbe des fréquences cumulées est une représentation des fréquences
‘en escalier’. Elle s’applique aux variables discrètes.
Exemple des électroménagers
Electromén Ménages Fréquenc Fréquences cum. Fréquences cum.
ager e croissantes Décroissantes
1 25 0.06 0.06 1
2 100 0.25 0.31 0.94
3 125 0.31 0.63 0.69
4 100 0.25 0.88 0.38
5 50 0.13 1 0.13
total 400
100%
- Courbe cumulative de Variables Continues : la fonction de répartition

Définition : La fonction de répartition est une courbe de fréquence cumulative


relative à une variable continue. Mais à la différence de la variable discrète qui est en
‘escalier’ (discontinue), la fonction de répartition est, à l’image de sa variable, elle
aussi continue.

Exemple : Distribution de salaires

Salaires Fréquence Fi (cumulative) Fi (cumulative) (plus


(moins de) de)
[100-150[ 0.20 0.20 1
[150-200[ 0.25 0.45 0.8
[200-250[ 0.40 0.85 0.55
[250-300[ 0.15 1 0.15
1.2

0.8
Fi croissante
0.6
Fi décroissante
0.4

0.2

0
100 150 200 250 300 350

2.2.3- Représentation logarithmique

Jusque là : on a vu des représentations arithmétiques uniquement


Ces représentations ont deux inconvénients :
1/ On ne peut pas juxtaposer des grandeurs (ou distributions) à échelles très
différentes :
Exemple : Projeter indice des prix à l’importation dans le temps avec le volume biens
importés
Année indice (1990 importations
base 100)
1990 100 75000
1991 125 65000
1992 135 58000
1993 150 48000
1994 178 32000
1995 200 24000
1996 120 48000
1997 101 67000
1998 76 85000
1999 54 102000
120000

100000

80000 indice (1990 base


100)
60000
importations
40000

20000

97
90

91

92

93

94

95

96

98

99
19

19

19

19

19

19

19
19

19

19
2/ On ne peut pas comparer les variations
Date variation indice des prix variation Importations
1991 25 -10000
1992 10 -7000
1993 15 -10000
1994 28 -16000
1995 22 -8000
1996 -80 24000
1997 -19 19000
1998 -25 18000
1999 -22 17000
30000
25000
20000
15000
10000 variation indice des
prix
5000
variation Importations
0
-5000
91

92

93

94

95

96

98

99
97
19

19

19

19

19

19
19

19

-10000 19

-15000
-20000
Une manière alternative de représentation : Transformer les variables en logarithme.

Ainsi :
Année Log (indice prix Log (importations) Dlog(indice Prix) Dlog(Importations)
(1990 base
100))
1990 2 4,87 0,09 -0,062
1991 2,09 4,81 0,03 -0,04
1992 2,13 4,76 0,045 -0,08
1993 2,17 4,68 0,07 -0,17
1994 2,25 4,50 0,05 -0,12
1995 2,30 4,38 -0,22 0,30
1996 2,07 4,68 -0,07 0,14
1997 2,01 4,82 -0,12 0,10
1998 1,88 4,92 -0,14 0,07
1999 1,73 5,01 -1,73 -5,01

Les variations des logs sont comparables à des taux de croissance des variables (pour
des petites variations) :
Démonstration : Soit x une variable quelquonque
dx
x = taux de croissance x
d (log x) = f ' ( x) =
6

4 Log (indice prix (1990


base 100))
3
Log (importations)
2

0
90

91

92

93

94

95

96

97

98

99
19
19

19

19

19

19

19

19

19

19

Vous aimerez peut-être aussi