Académique Documents
Professionnel Documents
Culture Documents
Dans le chapitre 1 : on a vu
Individu Variable x
statistique
I1 x1
I2 x2
I3 x3=x1
… ..
… ..
Ik xK=x2
xk Nk
N
A chaque modalité ‘i’ correspond un nombre d’inidividus ni
Exemple : Echantillon de 2.500.000 personnes
Var. Couleur des yeux Effectif
Verts 500.000
Bleus 400.000
Marrons 1.000.000
Noirs 600.000
Fi ( x ) = ∑ f i ( xi )
Notation de la fréquence cumulée :
A contrario, le cumul des fréquences pour une variable qualitative n’est pas très joli à
représenter
Exemple :
Exemple :
Couleur des yeux Effectifs Fréquence Fréquence
cumulée ?
Verts 500000 0,2 0.2
Bleus 400000 0,16 0.36
Marrons 1000000 0,4 0.76
Noirs 600000 0,24 100
2.500.000 100%
Interprétation : ex . Il y a 76% des individus ayant les yeux verts, bleus ou
marrons ! !
Une variable continue à amplitudes égales est une variable où toutes les classes
d’observation sont à intervalles égales.
Exemple :
• Meilleur lisibilité des tableaux de fréquences cumulées avec une variable continue :
Quand l’amplitude est inégale, les intervalles de classe ne sont pas équivalents.
1/ On ne peut pas comparer 43.75% dans la classe 1500-3000, aux fréquences des deux
autres classes. Bien que la proportion des salariés est large, la classe de rémunération
est beaucoup plus large.
2/ A des fins de comparaison, il faut alors ramener cette proportion à une échelle
comparable à celle des autres classes : Ici l’unité d’échelle est de 500. Comme l’Unité
d’échelle est le 1/3 de l’amplitude inégale alors il faut multiplier la fréquence par 1/3.
3/ En moyenne, 14.3% des salariés ont un salaire dans l’une des intervalles égales
‘fictives’ : 1500-2000, 2000-2500, 2500-3000.
Les tableaux synthétisent les données mais ne permettent pas d’avoir une vue
d’ensemble des distributions. Au contraire, les graphiques viennent compléter le travail
d’analyse en apportant une synthèse visuelle d’ensemble.
-Les Diagrammes à secteurs circulaires (ou disques) (s’appliquent aux var. discrètes
ou continues)
Eco Industrielle
7%
Eco inter
21%
Eco inter
Macro économie
Micro économie
Eco Industrielle
Macro économie
17%
Micro économie
55%
Chaque secteur (part) correspond à une modalité
Définition : Diagramme qui représente chaque valeur d’une variable (ou sa fréquence)
par un bâton (segment vertical) qui lui est proportionnel.
Exemple : Nombre d’éléctroménagers des ménages
Electroménager Ménages Fréquence
1 25 6,25%
2 100 25%
3 125 31,25%
4 100 25%
5 50 12,50%
Nombre d'Electroménagers
35
30
25
Fréquence
20
Electroménager
15
10
5
0
1 2 3 4 5
Nombre Electro
400 1
90
80
Nb de professeurs
70
60
50
Matière
40
30
20
10
0
Eco inter Macro Micro Eco
économie économie Industrielle
-
- Graphiques en tuyaux d’orgue composés
Souvent il s’agit de synthétiser 2 informations ou +, dans une seule représentation
graphique.
Définition : Les tuyaux d’orgue composés représentent des distributions de variables
imbriquées.
Valeurs Fréquence
1970 1980 1990 1970 1980 1990
ALL 50 70 80 0,5 0,58 0,5
ITA 30 30 50 0,3 0,25 0,31
ESP 20 20 30 0,2 0,17 0,19
Total 100 120 160 1 1 1
100%
80%
fréquence
60% ESP
ITA
40% ALL
20%
0%
1970 1980 1990
Année
S= ∑A . f =0.20*1+0.25*1+0.40*1+0.15*1=100%
i
i i
Dans le cas d’amplitudes différentes, il faut ajuster les fréquences à la même échelle
d’amplitude
Exemple :
Salaires amplitude Fréquence Fréquence
(euros/mois) ajustée (à
amplitude égale)
[1000-1500[ 500 20% 20%
[1500-2000[ 500 25% 25%
[2000-3000[ 1000 55% 55%/2=27.5
S= ∑ A.
i fi
a
i =0.20*1+0.25*1+0.275*2=100%
- Polygone (ou courbe) de fréquence
Définition : La courbe des fréquences cumulées est une représentation des fréquences
‘en escalier’. Elle s’applique aux variables discrètes.
Exemple des électroménagers
Electromén Ménages Fréquenc Fréquences cum. Fréquences cum.
ager e croissantes Décroissantes
1 25 0.06 0.06 1
2 100 0.25 0.31 0.94
3 125 0.31 0.63 0.69
4 100 0.25 0.88 0.38
5 50 0.13 1 0.13
total 400
100%
- Courbe cumulative de Variables Continues : la fonction de répartition
0.8
Fi croissante
0.6
Fi décroissante
0.4
0.2
0
100 150 200 250 300 350
100000
20000
97
90
91
92
93
94
95
96
98
99
19
19
19
19
19
19
19
19
19
19
2/ On ne peut pas comparer les variations
Date variation indice des prix variation Importations
1991 25 -10000
1992 10 -7000
1993 15 -10000
1994 28 -16000
1995 22 -8000
1996 -80 24000
1997 -19 19000
1998 -25 18000
1999 -22 17000
30000
25000
20000
15000
10000 variation indice des
prix
5000
variation Importations
0
-5000
91
92
93
94
95
96
98
99
97
19
19
19
19
19
19
19
19
-10000 19
-15000
-20000
Une manière alternative de représentation : Transformer les variables en logarithme.
Ainsi :
Année Log (indice prix Log (importations) Dlog(indice Prix) Dlog(Importations)
(1990 base
100))
1990 2 4,87 0,09 -0,062
1991 2,09 4,81 0,03 -0,04
1992 2,13 4,76 0,045 -0,08
1993 2,17 4,68 0,07 -0,17
1994 2,25 4,50 0,05 -0,12
1995 2,30 4,38 -0,22 0,30
1996 2,07 4,68 -0,07 0,14
1997 2,01 4,82 -0,12 0,10
1998 1,88 4,92 -0,14 0,07
1999 1,73 5,01 -1,73 -5,01
Les variations des logs sont comparables à des taux de croissance des variables (pour
des petites variations) :
Démonstration : Soit x une variable quelquonque
dx
x = taux de croissance x
d (log x) = f ' ( x) =
6
0
90
91
92
93
94
95
96
97
98
99
19
19
19
19
19
19
19
19
19
19