Vous êtes sur la page 1sur 21

conomie / Gestion

&
Statistique
descriptive
Applications avec Excel
et la calculatrice
tienne Bressoud
Jean-Claude Kahan
collection
Synthex
Synthse
de cours
exercices
corrigs
prelim.fm Page I Mardi, 1. avril 2008 9:34 09
prelim.fm Page IV Mardi, 1. avril 2008 9:34 09
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


V

Sommaire

Prface .................................................................... VII
Introduction .............................................................. IX
Les auteurs................................................................ XI
Chapitre 1 Introduction la statistique descriptive ...................... 1
Chapitre 2 Les caractristiques de tendance centrale ................. 45
Chapitre 3 Les caractristiques de dispersion ............................ 79
Chapitre 4 Les caractristiques de forme et de concentration .. 101
Chapitre 5 Les sries bivaries................................................. 129
Chapitre 6 La rgression ......................................................... 173
Chapitre 7 Les sries chronologiques ...................................... 217
Chapitre 8 Les indices.............................................................. 257
Index..................................................................... 287

Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19



1. Terminologie..........................2
2. Prsentation des donnes........9
3. Reprsentations graphiques
des sries une variable .....12
Exercices...................................22
1. De la srie brute la
prsentation des statistiques ..22
2. Reprsentations graphiques
simples ................................26
3. Lhistogramme .....................30
4. Discrtisation des donnes ....32
5. Les polygones ......................35
Les mthodes de la statistique descriptive (statistique dduc-
tive) permettent de mener des tudes partir de donnes
exhaustives, cest--dire concernant tous les individus de la
population concerne par ltude. Comme le rappelle Andr
Vessereau (voir bibliographie), lide premire et toujours
fondamentale de la statistique descriptive est celle de dnom-
brement.
Quand les donnes ne concernent quun chantillon de la
population, comme dans le cas des sondages, on a recours
la statistique infrentielle (statistique inductive), qui utilise la
thorie des probabilits.
Globalement, la statistique reste trs lie la science du
hasard, puisque les recensements nous fournissent des fr-
quences dapparition auxquelles on fait jouer le mme rle
qu la probabilit. Dj, les manuscrits de Gottfried Leibniz,
rdigs au dbut des annes 1680, se situaient, partir des
travaux de John Graunt, dans la perspective dune synthse
entre science de la population et calcul des probabilits .

1

Introduction
la statistique
descriptive
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


4 Statistique descriptive
Dfinitions


Leffectif (aussi appel frquence absolue) de la modalit x
i
est not n
i
et dsigne le nom-
bre dindividus de la population prsentant la modalit x
i
. Leffectif total de la popula-
tion n est alors : n = n
1
+ n
2
+ + n
r
, soit
1
r
i
i
n n
=
=

(la somme des n
i
pour i variant de 1
r, et la lettre grecque sigma, , dsignant la somme).
La frquence (par dfaut frquence relative) de la modalit x
i
est note f
i
et est dfinie
par : f
i
= n
i
/ N ; la frquence exprime la proportion dindividus prsentant une modalit
donne. Elle peut sexprimer sous la forme dun nombre dcimal (en gnral avec une
prcision de quatre chiffres aprs la virgule) ou sous la forme dun pourcentage.
Proprit

Soit X une variable r modalits :
0 f
i
1
i
1
f 1
r
i =
=

(ou, en pourcentage :
i
1
f 100
r
i =
=

)
Exemple 1.2 Effectifs et frquences
Reprenons lexemple prcdent sur le sexe des individus de la population rsidant en
France mtropolitaine. Les effectifs respectifs de ces modalits sont nots n
1
= 31 444 et
n
2
= 29 722, avec n = n
1
+ n
2
= 61 166 milliers, effectif total de la population.
Les frquences sont telles que : f
1
= n
1
/ n = 31 444 / 61 166 = 0,5141 et f
2
= n
2
/ N
= 29 722 / 61 166 = 0,4859, soit 51,41 % de femmes et 48,59 % dhommes.

Lexemple 1.1 a mis en vidence une des deux natures des variables statistiques : la varia-
ble qualitative. Le sexe est une variable qualitative, car ses modalits ne sont pas des
nombres. Une variable quantitative est une variable dont les modalits sont numriques.
Le poids dun individu, lge, le nombre denfants par mnage, le salaire constituent des
exemples de variables quantitatives.
1.3 LES VARIABLES QUALITATIVES
Dfinition

Une variable statistique est dite de nature qualitative si ses modalits ne sont pas
mesurables. Les modalits dune variable qualitative sont les diffrentes catgories dune
nomenclature. Ces catgories doivent tre exhaustives (chaque individu est affect une
modalit) et incompatibles (un individu ne peut tre affect plusieurs modalits) de
faon crer une partition.
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


5 Introduction la statistique descriptive
Le sexe, la profession, ltat matrimonial sont quelques exemples de variables qualitati-
ves. Pour ses enqutes auprs des mnages, lInsee utilise la nomenclature des Professions
et catgories socioprofessionnelles (PCS-2003).
Les modalits dune variable qualitative peuvent tre classes sur deux types dchelle :
nominale ou ordinale. ces deux types dchelle correspondent deux types de variables
qualitatives.
Variables qualitatives nominales
Les variables qualitatives nominales ne se mesurent pas. Cependant, leurs modalits
peuvent tre codes. Lordre et lorigine de la codification sont arbitraires, cette codifica-
tion pouvant tre numrique, alphabtique ou alphanumrique. Les individus dune
mme catgorie sont rputs quivalents pour la variable tudie.
Dfinition

Une variable statistique qualitative est dite dfinie sur une chelle nominale si ses
catgories ne sont pas naturellement ordonnes.
Exemple 1.3 Codage dune variable qualitative nominale
Le tableau suivant indique les diffrentes catgories de la variable nominale Professions et
catgories socioprofessionnelles (CSP) :
Code Catgorie
1 Agriculteurs exploitants
2 Artisans, commerants et chefs dentreprise
3 Cadres et professions intellectuelles suprieures
4 Professions intermdiaires
5 Employs
6 Ouvriers
7 Retraits
8 Autres personnes sans activit professionnelle
Source : Insee, PCS-2003 (niveau 1 de la nomenclature)
Dans cet exemple, il ny a pas dordre naturel entre les huit catgories, ou modalits, qui
sont de simples tiquettes ; la variable qualitative CSP est dfinie sur une chelle
nominale.
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


179 La rgression
2 Lajustement linaire
En cherchant mettre en vidence une fonction f qui reprsente la liaison statistique
entre deux variables X et Y, on se trouve face au problme gnral de linterpolation. La
dtermination analytique de f aurait a priori comme seule contrainte de vrifier y
i
= f(x
i
),
avec Y la variable explique et en faisant abstraction des erreurs dues lchantillon.
Dans le cas o le nuage de points a une forme allonge, on prsume un ajustement
linaire. La fonction cherche est une fonction affine. Le but est de trouver la meilleure
droite qui rsume le nuage de points, ce qui nous amne rsoudre un problme
dinterpolation linaire. Pour cela, nous utilisons une proprit importante de la
moyenne arithmtique : la moyenne arithmtique dune srie est le nombre le plus
proche de cette srie au sens des moindres carrs.
2.1 DROITES DE RGRESSION PAR LA MTHODE MCO
La loi normale ou de Laplace-Gauss est encore appele loi des erreurs ou des carts, car
cest ainsi quelle a t introduite. Le principe de la mthode des moindres carrs ordinai-
res (MCO) consiste sintresser la srie statistique des erreurs ou rsidus (e
i
).
On notera que lon peut mettre des hypothses sur le choix de la variable explique,
mais que le statisticien doit galement mener les calculs dans le cas o X est la variable
explique. Il appartiendra au spcialiste concern conomiste, mdecin, etc. de dci-
der ventuellement dcarter un des cas sur la base dune analyse propre sa spcialit.
Dfinitions

On appelle droite de rgression de Y selon x, note D
Y / x
, dtermine par la mthode
des moindres carrs, la droite dquation y = ax + b, pour laquelle la somme des carrs
des rsidus est minimale.
On note = +
i i
y ax b la valeur de y
i
estime par la droite de rgression de Y selon x.
De mme, la droite de rgression de X selon y, note D
X / y
est la droite dquation
x = ay + b avec = + ' '
i i
x a y b .
Notons que, graphiquement, la somme des carrs des rsidus reprsente la somme des
carrs des carts entre les points du nuage et la droite, carts calculs paralllement
laxe des ordonnes.
partir du modle linaire construit, il est possible deffectuer des prvisions. Dans le cas
dune liaison linaire avre, une fois dtermine la droite de rgression de Y selon x, on
peut lutiliser pour estimer la valeur de y associe une valeur de x appartenant
ltendue des valeurs de x retenues dans lchantillon. Dans ce cas, il ny a pas de raison
statistique de supposer que le modle linaire puisse se prolonger au-del de lintervalle
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


180 Statistique descriptive
tudi. Si lon effectue des prvisions en dehors de lintervalle dfini par les valeurs
extrmes de x, on peut obtenir des valeurs aberrantes.
On pourra sortir de cet intervalle, notamment dans les sries chronologiques, condi-
tion davoir des informations sur la stabilit de la liaison linaire.
Dtermination des droites de rgression
Remarque pralable : nous cherchons dterminer les paramtres a et b traduisant une
ventuelle liaison linaire du type Y = aX + b (dans le cas de la droite de rgression de
Y selon X) entre les variables X et Y ; pour cela, nous devons dterminer les paramtres a
et b de la droite qui sloigne le moins du nuage de points constitu par un chantil-
lon de taille n de la population. En consquence, nous allons dterminer des estimateurs
de a et b, cest--dire des fonctions des n observations de lchantillon, notes a

et b

,
qui permettent dobtenir les meilleures estimations possibles des paramtres a et b.
Dans les calculs, nous garderons les notations a et b de la statistique descriptive.
Posons : = + y ax b , a dsignant le coefficient directeur de la droite D
Y / x
et b lordonne
lorigine (on notera que certains auteurs prennent la notation : = + y a bx ).
Nous devons dterminer les estimateurs de a et b qui minimisent
= =
= =

2 2
1 1
( ) ( )
n n
i i i i
i i
S y y y ax b = S(a ; b).
S est une fonction de deux variables et les mathmatiques nous enseignent que les condi-
tions ncessaires du premier ordre pour avoir un extremum (minimum ou maximum)
sont :


=


0
0
S
a
S
b
, cest--dire la nullit des drives partielles premires.
=


1
2 ( )
n
i i i
i
S
x y ax b
a
et
=


1
( )
n
i i
i
S
y ax b
b
; on doit rsoudre le systme :
=
=

1
1
( ) 0
( ) 0
n
i i i
i
n
i i
i
x y ax b
y ax b
. En utilisant les relations
=
=
=

1
i n
i
i
x nx et
=
=
=

1
i n
i
i
y ny , on obtient :
=

2
1
( ) 0
0
n
i i i i
i
x y ax bx
ny anx nb
. La deuxime quation du systme scrit = b y ax , ce qui
permet de remplacer b par sa valeur dans la premire quation du systme, ce qui
donne : ( )
= = =
=

2
1 1 1
0
n n n
i i i i
i i i
x y a x y ax x soit ( )
= =
=

2
1 1
0
n n
i i i
i i
x y a x nx y ax soit
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


181 La rgression
= =

=



2 2
1 1
n n
i i i
i i
a x nx x y nxy , qui donne : = =
( ; ) ( ; )
( ) ( )
nCov X Y Cov X Y
a
nV X V X
. Nous admet-
trons que ces valeurs correspondent bien un minimum.
Les calculs sont similaires pour la droite de rgression de X selon y ; on retiendra donc les
rsultats suivants pour les estimateurs de a et b, nots a

et

b :

= +

/
( ; )
( )
: ,

Y x
Cov X Y
a
V X
D y ax b avec
b y ax

et

= +

/
( ; )
'
( ) : ' ',
' '
X y
Cov X Y
a
V Y D x a y b avec
b x a y


.
Ces deux droites se coupent au point moyen G. La droite de rgression de X selon y peut
tre mise sous forme affine : y = (1 / a)x (b / a), de faon faire apparatre son coeffi-
cient directeur : 1 / a.
Exemple 6.4 Calculs de droites de rgression
Le tableau suivant donne les indices du pouvoir dachat (base 100 en 1951) du salaire
minimum net, not x, et moyen, not y, pour les salaris franais des secteurs priv et
semi-public.
Anne x y
1994 293 329
1995 296 336
1996 296 334,35
1997 302,15 337,33
1998 311,45 340,34
1999 313,93 345,76
2000 315,47 347,46
2001 321,99 349,17
2002 326,41 352,25
2003 330,57 350,87
Source : Insee, 2006
Pour calculer les coefficients des droites de rgression, il est ncessaire de calculer les
moyennes, les carts-types et la covariance de X et Y. La figure 6.4 propose les calculs
intermdiaires ncessaires, raliss sous Excel.
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


182 Statistique descriptive
Figure 6.4
Calculs pralables
sous Excel.


De l,
=
= = =

10
1
3106, 97 1
310, 7
10 11
i
i
x x ,
=
= = =

10
1
3 422, 53 1
342, 25
10 10
i
i
y y ,

=
=

10
1
1
( )
10
i
i
V x x x ( ) = =
2 966 944, 70
310,7 162, 09
10
et
( )
=
= = =

10
2
1
1171938, 41 1
( ) 342, 25 56, 66
10 10
i
i
V y y y .
=
= = =

10
1
1064 294, 54 1
( ; ) 310,7 342, 25 92, 57
10 10
i i
i
Cov x y x y x y .
On dispose donc de tous les lments pour calculer des estimations des paramtres a, b,
a et b :
a

= Cov(x ; y) / V(x) = 92,57 / 162,09 = 0,5711 et b

= y ax

= 342,25 0,5711 310,7


= 164,80.
' a

= Cov(x ; y) / V(y) = 92,57 / 56,66 = 1,6340 et ' b

= ' x a y

= 310,7 1,6340 342,25


= 248,54.
On obtient les droites de rgression :
= +

/
/
: 0, 5711 164, 80
: 1, 6340 248, 54
Y x
X y
D y x
D x y
.
On peut vrifier que ces deux droites sont scantes au point moyen G.
Si nous validons provisoirement lexistence dun lien linaire entre X et Y, les valeurs de x
varient dans lintervalle [293 ; 330,57] et cet intervalle est en toute rigueur lintervalle de
validit du modle. Si nous relevons une valeur de lindice du pouvoir dachat du salaire
minimum x = 305, on peut faire une prvision pour y : = + 0, 5711 164, 80 y x

soit
= + = 0, 5711 305 164, 80 338, 99 y

.
De mme, sachant que lindice du pouvoir dachat du salaire minimum en 2005 est
x = 341,90, il est possible dutiliser D
Y / x
pour faire une prvision de lindice du
pouvoir dachat du salaire moyen en 2005, soit = + = 0, 5711 341, 9 164, 8 360, 06 y .
Cependant, la valeur x = 341,90 est hors de lintervalle de construction du modle dfini
par [293 ; 330,57]. Cest pourquoi nous navons pas dinformation sur la fiabilit de cette
prvision (en ralit, la vraie valeur est 351,56).
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


188 Statistique descriptive
Focus 6.1 La loi de Student
La loi de Student est due William Sealy Gosset (1876-1937), statisticien, employ de la
clbre brasserie Guinness. Student tait son pseudonyme. Si Z et X dsignent deux
variables alatoires indpendantes suivant respectivement la loi normale centre rduite
et la loi du khi-deux n degrs de libert, la variable alatoire =
/
n
Z
T
X n
, appele le t
de Student, suit la loi de Student n degrs de libert. La courbe reprsentative de sa
densit est symtrique par rapport laxe des y et en forme de cloche comme celle de la
loi normale. Cette loi est tabule en fonction du nombre de degrs de libert, not en
gnral , et de la probabilit ; on note t
;
la valeur de t ayant la probabilit dtre
dpasse. On notera que, dans le cas dun test bilatral, pour un seuil de signification de
5 %, on devra prendre / 2 = 2,5 %, de faon avoir : P(t
/ 2 ; n 2
T
n
t
/ 2 ; n 2
) = 0,95.
La loi de Student est trs utile pour caractriser la loi de la moyenne empirique dune
distribution normale de variance inconnue. Quand le nombre de degrs de libert
augmente, T se rapproche de la loi normale centre rduite.

Posons t
/ 2 ; n 2
la valeur de T donne par la table de Student telle que P(t
/ 2 ; n
2
T t
/ 2 ; n 2
) = 1 et le coefficient de corrlation linaire de la population totale.
Tester lexistence ventuelle dune corrlation linaire entre X et Y au sein de la popula-
tion ncessite de passer par les tapes suivantes :
1. Formuler les hypothses tester :
H
0
: = 0 (absence de corrlation linaire) ;
H
1
: 0 (prsence de corrlation linaire).
2. Dterminer le degr de libert : n 2.
3. Dfinir la rgle de dcision du test partir de la valeur t
/ 2 ; n 2
dpendant du seuil de
signification et du degr de libert :
Si T t
/ 2 ; n 2
ou si T t
/ 2 ; n 2
, lhypothse H
0
est rejete et lhypothse H
1
est
accepte : il y a une corrlation linaire significative entre les variables.
Si t
/ 2 ; n 2
T t
/ 2 ; n 2
, lhypothse H
0
nest pas rejete : il est impossible de
conclure de faon significative lexistence dune corrlation linaire entre les
variables.
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


189 La rgression
Exemple 6.7 Test du coefficient de corrlation linaire
Reprenons les donnes de lexemple 6.4.
n = 10 et la droite de rgression ncessite destimer deux paramtres. Donc le degr de
libert est 10 2 = 8.
Par ailleurs, partir de ces mmes donnes, nous avons calcul r = 0,9660 (voir
exemple 6.6). Nous noterons t
c
la valeur de t calcule sur lchantillon. On a

= = =

2 2
2 0, 9660 8
10, 57
1 1 0, 9660
c
r n
t
r
et la table de Student donne t
0,025 ; 8
= 2,3060.
Puisque 10,57 2,3060, soit t
c
t
/ 2 ; n 2
, il faut rejeter lhypothse H
0
. Il y a donc une
corrlation linaire significative entre x et y.


Test de Student sur la pente a de la droite de rgression
Quittons lapproche descriptive pour adopter le point de vue de la statistique infren-
tielle : le problme est similaire celui voqu pour le coefficient de corrlation linaire.
Nous supposons que nous avons dtermin lquation de la droite de rgression de
Y selon x et nous noterons cette quation : = + y ax b

, pour ne pas oublier que les coeffi-


cients de cette droite sont des coefficients empiriques calculs sur notre chantillon et
quils constituent des estimations ponctuelles des coefficients a et b inconnus dans la
population.
On se place dans lhypothse o la distribution des y est normale et o la variance de Y
est constante pour toute valeur de X. On dmontre que lcart-type de a

, not ( ) a

, est
estim par : ( )
( ) ( )

=
=

2
2
1
2
n
i
i
SCR
a
n x x

o
=
=

2
1
( )
n
i i
i
SCR y y

; le nombre not
=
=


2 2
/
1
1
( )
2
n
Y x i i
i
S y y
n

reprsente un estimateur de la variance rsiduelle.


Lintervalle de confiance de a est donn par : ( )

; 2
2
n
a t a

.
Tester lhypothse H
0
: a = 0 revient tester le paralllisme de la droite de rgression de
Y selon x avec laxe des x et donc tester la nullit du coefficient de corrlation.
1. Les hypothses tester :
H
0
: a = 0 (absence de corrlation linaire) ;
H
1
: a 0 (prsence de corrlation linaire).
2. Dterminer le degr de libert : n 2.
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


190 Statistique descriptive
3. Dfinir la rgle de dcision du test partir de la valeur t
/ 2 ; n 2
dpendant du seuil de
signification et du degr de libert.
Si t t
/ 2 ; n 2
ou si t t
/ 2 ; n 2
, lhypothse H
0
est rejete en faveur de lhypothse
alternative H
1
: a 0.
Si t
/ 2 ; n 2
t t
/ 2 ; n 2
, lhypothse H
0
nest pas rejete.
Exemple 6.8 Test de student sur le paramtre a (pente de D
Y / x
)
Si lon reprend lexemple 6.5, on a :
=
= = =


2 2
/
1
1 37, 81
( ) 4,7263
2 8
n
Y x i i
i
S y y
n

et
= =
/
37.81
2,174
8
Y x
S , ce qui donne : ( )
( )

=
= =

2
2 /
2
1
4,7263
1620, 9
Y x
n
i
i
S
a
x x

et
( ) = =
4,7263
0, 0029
1620, 9
a

. On calcule alors
( )
= =
0, 5711
0, 0029
c
a
t
a

= 196,93 et
t
0,025 ; 8
= 2,3060, ce qui donne pour intervalle de confiance pour a, au seuil de signification
de 5 % : 0,5711 2,3060 0,0029, soit [0,5644 ; 0,5778].
t
c
> t
0,025 ; 8
, donc on doit rejeter lhypothse H
0
et conclure lexistence dune relation
linaire entre X et Y. Si on utilise lintervalle de confiance, on aura la mme conclusion,
car il ne recouvre pas la valeur 0, ce qui signifie quau niveau de confiance 95 % a est
diffrent de 0.

Test de Student sur lordonne lorigine b de la droite de rgression
On peut effectuer la mme dmarche pour le coefficient b et dterminer un intervalle de
confiance pour ce paramtre, et tester lhypothse dune droite de rgression passant par
lorigine (b = 0).
Avec les mmes notations que prcdemment, on obtient :
( )
( )

=
=
=

2
2 2 1
/
2
1
n
i
i
Y x n
i
i
x
b S
n x x

.
Test de Fisher sur la pente a de la droite de rgression
La seconde approche pour tester une rgression linaire passe par ltude de la part de la
variance explique dans la variance totale
1
. On dmontre que la variable alatoire
=

1
2
SCE
F
SCR
n
suit la loi de Fisher avec 1 et (n 2) degrs de libert, note F(1 ; n 2).

1. Voir P. Roger.
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


277 Les indices
Problmes et exercices
Les indices autorisent les comparaisons de donnes longitudinales, en figeant un point de
comparaison selon la base annuelle retenue.
Lexercice 1 expose le calcul des indices lmentaires et leurs proprits.
Lexercice 2 sintresse aux indices particuliers que sont les indices synthtiques.
Lexercice 3 propose une lecture de ces indices par les coefficients budgtaires et
montre que ces indices sont lis entre eux.
EXERCICE 1 INDICES LMENTAIRES

Les sries suivantes indiquent lvolution du revenu moyen disponible par mnage et celle
du nombre de mnages (France). Par ailleurs, on dfinit le revenu disponible des Franais
par la multiplication du revenu moyen disponible par mnage avec le nombre de mnages.
Anne Revenu moyen disponible par mnage () Nombre de mnages (milliers)
1975 23 016 17 745
1990 26 529 21 542
1999 26 612 23 808
Source : Insee, recensement de la population, 1999
1. Calculez les indices relatifs au revenu moyen disponible par mnage, nots IRM :
a. IRM
1999 / 1990
;
b. IRM
1990 / 1975
;
c. IRM
1999 / 1975
laide de la proprit de circularit ;
d. IRM
1975 / 1999
laide de la proprit de rversibilit.
2. Calculez les indices relatifs au nombre de mnages, nots INM :
a. INM
1999 / 1990
;
b. INM
1990 / 1975
;
c. INM
1999 / 1975
laide de la proprit de circularit ;
d. INM
1975 / 1999
laide de la proprit de rversibilit.
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


278 Statistique descriptive

3. En utilisant la proprit lie la multiplication, calculez les indices relatifs au revenu
disponible des Franais, nots IRF :
a. IRF
1999 / 1990
;
b. IRF
1990 / 1975
;
c. IRF
1999 / 1975
;
d. IRF
1975 / 1999
.


1. a. = =
1999
1999
1990
1990
V 26 612
IRM 100 100
V 26 529
, soit IRM
1999 / 1990
= 100,31. Le revenu moyen
disponible par mnage a augment de 0,31 % entre 1990 et 1999.
b. = =
1990
1990
1975
1975
V 26 529
IRM 100 100
V 23016
, soit IRM
1990 / 1975
= 115,26. Le revenu moyen
disponible par mnage a augment de 15,26 % entre 1975 et 1990.
c. En sappuyant sur la proprit de circularit,
= =
1999 1999 1990
1975 1990 1975
IRM IRM IRM /100 100, 31 115, 26/100 , soit IRM
1999 / 1975
= 115,62.
Le revenu moyen disponible par mnage a augment de 15,62 % entre 1975 et 1999.
d. En sappuyant sur la proprit de rversibilit, = =
1975
1999
1999
1975
10 000 10 000
IRM
IRM 115,62
, soit
IRM
1975 / 1999
= 86,49. Le revenu moyen disponible par mnage en 1975 reprsente 86,49 % du
revenu disponible par mnage en 1999.
2. a. = =
1999
1999
1990
1990
V 23 808
INM 100 100
V 21542
, soit INM
1999 / 1990
= 110,52. Le nombre de
mnages a augment de 10,52 % entre 1990 et 1999.
b. = =
1990
1990
1975
1975
V 21542
INM 100 100
V 17 745
, soit INM
1990 / 1975
= 121,40. Le nombre de mna-
ges a augment de 21,40 % entre 1975 et 1990.
c. En sappuyant sur la proprit de circularit,
= =
1999 1999 1990
1975 1990 1975
INM INM INM /100 110, 52 121, 40/100 , soit INM
1999 / 1975
= 134,17.
Le nombre de mnages a augment de 34,17 % entre 1975 et 1999.
d. En sappuyant sur la proprit de rversibilit, = =
1975
1999
1999
1975
10 000 10 000
INM
INM 134,17
, soit
INM
1975 / 1999
= 74,53. Le nombre de mnages en 1975 reprsente 74,53 % du nombre de
mnages en 1999.
3. a. En sappuyant sur la proprit des indices relative la multiplication, on obtient :
= =
1999 1999 1999
1990 1990 1990
IRF IRM INM /100 100, 31 110, 52/100 , soit IRF
1999 / 1990
= 110,86. Le
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


279 Les indices
revenu disponible des Franais a augment de 10,86 % entre 1990 et 1999.
b. En sappuyant sur la proprit des indices relative la multiplication, on obtient :
= =
1990 1990 1990
1975 1975 1975
IRF IRM INM /100 115, 26 121, 40/100 , soit IRF
1990 / 1975
= 139,93. Le
revenu disponible des Franais a augment de 39,93 % entre 1975 et 1990.
c. De mme, on obtient : = =
1999 1999 1999
1975 1975 1975
IRF IRM INM /100 115, 62 134,17/100 ,
soit IRF
1999 / 1975
= 155,13. Le revenu disponible des Franais a augment de 55,13 % entre
1975 et 1999.
d. De mme, on obtient : = =
1975 1975 1975
1999 1999 1999
IRF IRM INM /100 86, 49 74, 53/100 , soit
IRF
1975 / 1999
= 64,46. Le revenu disponible des Franais en 1975 reprsente 64,46 % du revenu
disponible des Franais en 1999.

EXERCICE 2 INDICES SYNTHTIQUES

Le tableau suivant recense les prix moyens des chambres dhtel en 2006 et 2007, selon leur
catgorie et le nombre de nuites annuelles.
Catgorie Prix 2006
()
Prix 2007
()
Nuites 2006
(milliers)
Nuites 2007
(milliers)
0 & 1 toile 33 35 1 676 1 909
2 toiles 57 59 3 631 3 813
3 toiles 86 88 3 475 3 850
4 toiles & luxe 175 187 2 371 2 229
Sources : Insee, 2007, et KPMG, 2007
1. Calculez lindice des prix de Laspeyres entre 2006 et 2007 (base 2006). Interprtez.
2. prix constants (base 2006), quelle est laugmentation des nuites entre 2006 et 2007 ?
Quel indice connu avez-vous calcul ?
3. Calculez lindice des quantits de Paasche entre 2006 et 2007 (base 2007). Interprtez.
4. nuites constantes (base 2007), quelle est laugmentation du prix des chambres entre
2006 et 2007 ? Quel indice connu avez-vous calcul ?
5. Calculez les indices de Fisher :
a. des prix ;
b. des quantits.

Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


280 Statistique descriptive

1. Afin de pouvoir calculer lindice des prix de Laspeyres entre 2006 et 2007 (base 2006), il
est ncessaire de connatre la somme du produit des prix 2007 par les quantits 2006 et celle
des prix 2006 par les quantits 2006.
Les produits et leurs sommes sont calculs dans les colonnes F et G de la figure 8.1.

Figure 8.1
Rsultats sous Excel.


Do :
=
=

= =

4
2007 2006
1
2007
4
2006
2006 2006
1
1022 066
( ) 100 100
976 050
i i
i
i i
i
p q
P
p q
L
, soit =
2007
2006
( ) 104,71 P
L
.
quantits constantes (base 2006), les prix des chambres dhtel, toutes catgories
confondues, ont augment de 4,71 % entre 2006 et 2007.
2. Afin de pouvoir calculer laugmentation des nuites entre 2006 et 2007 prix constant
(base 2006), il est ncessaire de connatre la somme du produit des prix 2006 par les
quantits 2007 et celle des prix 2006 par les quantits 2006. Il sagit de calculer lindice
des quantits de Laspeyres entre 2006 et 2007 (base 2006).
Les produits des prix 2006 par les quantits 2007 et leur somme sont prsents la suite
des prcdents calculs, dans la colonne H de la figure 8.1.
Do :
=
=

= =

4
2006 2007
1
2007
4
2006
2006 2006
1
1001513
( ) 100 100
976 050
i i
i
i i
i
p q
Q
p q
L
, soit =
2007
2006
( ) 102, 61 Q
L
.
prix constants (base 2006), le nombre de nuites, toutes catgories dhtel confondues,
a augment de 2,61 % entre 2006 et 2007.
3. Afin de pouvoir calculer lindice de Paasche des quantits entre 2006 et 2007 (base
2007), il est ncessaire de connatre la somme du produit des prix 2007 par les quantits
2007 et celle des prix 2007 par les quantits 2006.
Les produits des prix 2007 par les quantits 2007 et leur somme sont prsents la suite
des prcdents calculs, dans la colonne I de la figure 8.1.
Do :
=
=

= =

4
2007 2007
1
2007
4
2006
2007 2006
1
1047 405
( ) 100 100
1022 066
i i
i
i i
i
p q
Q
p q
P
, soit =
2007
2006
( ) 102, 48 Q
P
.
prix constants (base 2007), le nombre de nuites, toutes catgories dhtel confondues,
a augment de 2,48 % entre 2006 et 2007.
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


287








A
Ajustement
linaire Voir Droite de
rgression
non linaire, 192, 206
Amplitude de classe, 7, 15, 30,
34, 36
Analyse de variance, 183, 194
Aplatissement, 108
Asymtrie, 104, 115
B
Bote moustaches, 81, 92, 103,
115
Box plot Voir Bote
moustaches
C
Caractre, 22, 26, 30, 33, Voir
Variable
Centile, 63, 69
Centre de classe, 7
Classe, 7
Coefficient
budgtaire, 267, 281
daplatissement
de Fisher, 109, 118
de Pearson, 108, 118, 121
dasymtrie
de Fisher, 106, 115
de Pearson, 105, 115, 121
de corrlation
de rang, 193, 211
linaire, 185, 194
de dtermination, 194, 200,
206
de Kendall, 105
de Spearman Voir Coefficient
de corrlation de rang
de variation, 88, 93, 94
de Yule, 105, 115
saisonnier, 233, 236, 239, 242,
247
Composante
extra-saisonnire, 222, 234,
237
gnrale, 222, 234, 237
rsiduelle, 222, 234, 237
saisonnire, 222, 233, 234,
237
Corrlation, 175
Courbe
de concentration, 124
de rgression, 174
Covariance, 141, 167
formule dveloppe, 142
proprits, 143
Cycle, 222, 234, 237
D
Dcile, 63
Degr de libert, 148
Densit, 14, 30, 34, 46
Diagramme
circulaire, 12, 26
cumulatif Voir Fonction de
rpartition
de Tukey Voir Bote
moustaches
Index
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


288 Statistique descriptive
en barres Voir Diagramme en tuyaux dorgue
en btons, 14, 22, 118
en tuyaux dorgue, 13
Discrtisation, 9, 33
Distribution, 9, 12, 14, 16, 26, 30, 32, 35, 64, 81, 95
Donne brute, 9
Droite de rgression, 179, 194, 200, 205, 247, 251
E
cart
absolu moyen, 82, 90
intercentile, 80, 91
interdcile, 80, 91
interquantile, 80, 90
interquartile, 80, 91
saisonnier, 233, 236
type, 83, 93, 94, 97
conditionnel, 139
marginal, 137
chantillon, 2
Effectif, 4, 9
corrig, 15, 31, 34
cumul, 10, 26
croissant, 10, 22
dcroissant, 11, 22
marginal, 132, 160
partiel, 132, 160
tendue, 80, 90
F
Fonction
affine, 179
de rpartition, 19, 26
Frquence, 9, 25
absolue, 4
conditionnelle, 135, 160
cumule, 10, 35
croissante, 10, 22
dcroissante, 11, 22
marginale, 134, 160
partielle, 134, 160
proprits, 4
relative, 4
G
Graphique semi-logarithmique, 206
H
Histogramme, 14, 30, 32, 35, 72, 121
I
Indpendance, 145
Indice
de Fisher, 274, 279
de Gini, 113, 124
de Laspeyres, 268, 279, 281
de Paasche, 271, 279, 281
de valeur globale, 273
des prix, 268, 271, 279, 281
des quantits, 269, 272, 279
lmentaire, 258, 277
proprits, 261, 269, 271, 274, 278
synthtique, 265, 279
Individu, 2
Intervalle interquantile Voir cart interquantile
K
Kurtosis, 108
L
Leptocurtique, 109
Loi
de Fisher, 191
de Student, 188
normale, 102
M
Mdiale, 111, 124
Mdiane, 56, 67, 68, 69, 72, 115
Mthode
analytique, 223, 247, 251
empirique, 226, 228, 239, 242
Modalit, 3, 22, 26, 30, 33
Mode, 46, 48, 67, 68, 69, 72, 115
Modle
additif, 231, 239, 242, 247
multiplicatif, 231, 251
Moindres carrs ordinaires, 179, 200, 205
Moyenne, 49, 68, 69, 72, 115
arithmtique, 50
conditionnelle, 139, 163
chelonne, 224
gomtrique, 53, 74
harmonique, 54, 75
marginale, 137, 163, 167
mobile, 242
centre, 228
non centre, 226
proprits, 52, 97
quadratique, 55
N
Nature, 4, 22, 26, 30, 33, 154, 158
P
Platicurtique, 109
Sansnom1.fm Page 1 Jeudi, 13. mars 2008 7:13 19


289 Index
Polygone
des effectifs, 20, 72
des frquences, 35
Population, 2, 22, 26, 30, 33
Pyramide Voir Diagramme en tuyaux dorgue
Q
Quantile, 56
Quartile, 62, 68, 69, 72
R
Rgression
courbe, 174
droite, 179, 194, 200, 205, 247, 251
S
Srie
ajuste, 238, 239, 242, 247, 251
brute, 239, 242, 247, 251
chronologique, 219
CVS, 237, 239, 242, 247, 251
temporelle, 219
T
Tableau
crois Voir Tableau de contingence
de contingence, 131, 154, 158
lmentaire, 9
simple, 130
statistique, 9, 22, 33
Tendance, 222, 234, 237, 239, 242, 247, 251
Test, 147
de corrlation, 189, 194, 200, 206
de Fisher, 200, 206
de Student, 189, 194, 200, 206
du khi, 163
du khi-deux, 146, 167
Tri
plat, 9
crois Voir Tableau de contingence
V
Variable
qualitative, 4
nominale, 5
ordinale, 6
quantitative, 6, 10
continue, 7, 30, 33
discrte, 7, 23, 27
statistique, 3
Variance, 83, 93
conditionnelle, 139, 163
formule dveloppe, 84, 94
marginale, 137, 163, 167
proprits, 86, 97