Vous êtes sur la page 1sur 35

D.

TOUIJAR 02/10/2013
1
Elment :
STATISTIQUE I
Filire: Sciences Economiques et Gestion
Module: Mthodes Quantitatives I
Sections A &B
Anne Universitaire 2013-14
SemestreS1
Enseignant: Driss TOUIJAR Driss TOUIJAR Driss TOUIJAR Driss TOUIJAR
Attention !
N essayez pas de comprendre le cours en lisant
tout (e) seul(e) Ce document.
Par contre, je vous recommande vivement dassister
toutes les sances en esprant mieux cerner le
programme de statistique I
INTRODUCTION
GENERALE
3
la Statistique et Les Statistiques
Le mot statistique dsigne la fois un ensemble de
donnes d'observations et l'activit qui consiste dans
leur recueil, leur traitement et leur interprtation.
D'une faon plus prcise :
On dsigne par Les statistiques, un ensemble de
donnes ou d'informations relatives un
phnomne ou un processus donn;
exemple : la population marocaine en 2012, les
naissances au Maroc en 2010, lvolution des
entreprises, des emplois
4
Par contre La statistique est en gnral, un
ensemble de mthodes scientifiques qui servent
dcrire et analyser des donnes. Elles nous
permettent aussi de tirer des conclusions et de
prendre des dcisions et aussi de faire des
prvisions.
En ce qui concerne ce semestre, on se
contentera dtudier la mthode descriptive : c'est
une mthode qui vise dcrire des ensembles
nombreux ; do lappellation:
statistique descriptive.
5
Elle a pour objet de prsenter les donnes sous
forme de tableaux et de graphiques et de les rsumer
en quelques valeurs numriques appele
caractristiques.
6
D.TOUIJAR 02/10/2013
2
Actuellement, la Statistique est considre
comme lun des meilleurs outils de la recherche
scientifique. En effet, on fait appel aux mthodes
statistiques dans presque tous les secteurs de
lactivit humaine :
Agronomie, astronomie, balistique, biologie,
dmographie, conomie, pidmiologie,
gestion, mdecine, mtorologie, physique,
psychologie, sciences politiques ... ,etc.
Domaines dapplication
7
PROGRAMME DU SEMESTRE
PARTIE 1 : SERIES SIMPLES
Chapitre 1 : Tableaux statistiques et
reprsentations graphiques
Chapitre 2 : Les paramtres de tendance centrale
Chapitre 3 : Les paramtres de dispersion et de
Concentration
8
PARTIE 2 : LES SERIES DOUBLES
Ajustement linaire et Corrlation.
PARTIE 3 : LES INDICES
Les Indices lmentaires et synthtiques
PROGRAMME DU SEMESTRE
9
BIBLIOGRAPHIE
statistique descriptive B. Py Stat 29
Introduction la
statistique
J.P Blisle ;J.
Desrosiers
Stat 20
statistique descriptive B. Grais Stat 69
statistique descriptive
Hamid El
Farouki
Stat 59
statistique descriptive
Benhmida
et Touijar
-
10
PARTIE 1
SERIES SIMPLES
CHAPITRE 1 :
Tableaux statistiques et reprsentations
graphiques
I) DEFINITIONS :
Dfinition 1: La population est un
ensemble d'objets ou de personnes
sur lesquelles porte une tude.
Exemples de populations :
-La population du Maroc la date du
recensement de 2004.
-Lensemble des socits SARL Fs en
2013.
12
D.TOUIJAR 02/10/2013
3
Dfinition 2 : Les lments qui
composent une population sont
appels des Individus (ou units
Statistiques). Un sous-ensemble dune
population est appel chantillon.
13
Dfinition 3 : La taille dune population est le nombre
dindividus qui la composent.
Dfinition 4 : Un caractre est un critre relatif auquel
on observe les individus dune population.
A chaque individu, on attribut un ou plusieurs
caractres qui peuvent tre soit quantitatifs (s'ils sont
mesurables; exemple : salaire, nb denfants par
mnage...) ou qualitatifs (sinon; exemple : sexe, tat
matrimonial ).
Une valeur que peut prendre un caractre s'appelle
modalit.
14
Un caractre qualitatif peut tre soit :
Ordinal : si ses modalits peuvent tre
naturellement ordonnes exemple : satisfaction
plus ou moins grande aprs lachat dun produit.
Nominal : si ses modalits ne peuvent tre
naturellement ordonnes exemple : tat
matrimoniale.
On appelle variable statistique, un caractre
quantitatif.
On distingue deux sortes de variables statistiques:
15
Les variables statistiques discrtes (notes: v.s.d.) :
se sont des variables dont l'ensemble des
modalits est un ensemble discret (la variable ne
peut prendre que des valeurs isoles d'un
intervalle).
Exemple : Pour le nombre d'enfants par
mnage lensemble des modalits peut tre
{0, 1, 2, 3, 4}.
Les variables statistiques continues (v.s.c.) : dans
ce cas, l'ensemble des modalits est continue; la
variable peut prendre toutes les valeurs d'un
intervalle.
Exemple : Salaire, ge, taille, poids etc.
16
Tableau Rcapitulatif
Caractre
quantitatif qualitatif
17
Exemple : On observe, au cours dune semaine, 20
machines selon le nombre de pices dfectueuses
produites :
8, 16, 9, 33, 14, 5, 3, 7, 10, 7, 9, 9, 3, 8, 3, 3, 5,
14, 8, 7.
On lappelle srie brutes.
L'effectif total de la population est donc
n =20.
18
D.TOUIJAR 02/10/2013
4
En classant ces nombres par ordre croissant, on
obtient la srie ordonne :
3, 3, 3, 3, 5, 5, 7, 7, 7, 8, 8, 8, 9, 9, 9, 10, 14,
14,16, 33.
On obtient les K modalits aprs regroupement des
observations :
3, 5, 7, 8, 9, 10, 14, 16, 33 (k=9) < (n=20)
19
la modalit 3 a pour effectif n
1
=4
la modalit 5 a pour effectif n
2
=2
la modalit 7 a pour effectif n
3
=3
la modalit 8 a pour effectif n
4
=3
la modalit 9 a pour effectif n
5
=3
la modalit 10 a pour effectif n
6
=1
la modalit 14 a pour effectif n
7
=2
la modalit 16 a pour effectif n
8
=1
la modalit 33 a pour effectif n
9
=1
Remarque : 4+2+3+3+3+1+2+1+1=20
20
Dfinition : L'effectif n
i
d'une modalit x
i
est le
nombre d'individus ayant cette modalit. L'effectif
total (ou taille) d'une population, not n , est le
nombre d'individus qui composent cette population.
On a donc :
n n
k
i
i
=

=1
21
1
1
=

=
k
i
i
f
k i
n
n
f
i
i
, , 1 ; = =
Dfinition : On appelle frquence de la modalit
x
i
, la proportion des individus prsentant cette
modalit. On crit :
Remarque :
En %:
100 % 100 %
1
= =

=
k
i
i i i
f f f
22
Exemple :
Commentaire : La proportion des machines ayant
produit 3 pices dfectueuses est de 20%; et celle
des machines ayant produit 10 pices dfectueuses
est de 5%.
Dfinition: On appelle distribution d'un
caractre X, l'ensemble de couples
05 , 0 et 20 , 0
20
4
6
6
1
1
= = = = =
n
n
f
n
n
f
( ) ( ) ( ) { }
k k
n x n x n x , , , , , ,
2 2 1 1

23
Remarque :
En terme de frquence, la distribution de X, scrit
aussi :
Exemple : La distribution des dfectuosits des 20
machines est :
Ou
( ) ( ) ( ) {
( ) ( ) ( ) ( ) ( ) ( )} 1 ; 33 , 1 ; 16 , 2 ; 14 , 1 ; 10 , 3 ; 9 , 3 ; 8
, 3 ; 7 , 2 ; 5 , 4 ; 03
( ) ( ) ( ) ( ) { } 15 , 0 ; 8 , 15 , 0 ; 7 , 10 , 0 ; 5 , 20 , 0 ; 3
( ) ( ) ( ) { }
k k
f x f x f x , , , , , ,
2 2 1 1

24
D.TOUIJAR 02/10/2013
5
Pour une meilleure exploitation de la distribution, on a intrt
la reprsenter par un tableau statistique .
II) TABLEAUX STATISTIQUES
Exemple Introductif : Supposons que l'on
ait fait une enqute auprs de 20 femmes selon
9 caractres : Prnom, nom, jour de naissance,
mois de naissance, annes de naissance,
nombre d'enfants, revenu annuel du mnage,
ville natale, opinion sur la qualit d'un produit
alimentaire pour bb.
Ces donnes ont t reportes sur un
bordereau, sous forme d'une matrice de 20
lments qui comprennent chacun les 9
donnes concernant une femme.
25
Cette matrice (srie selon plusieurs variables) peut tre reprsente
comme suit :
Date de naissance
Prnom Nom Jour Mois Anne
Nombre
d'enfants Revenu Ville Opinion
1 Aline Michalco 23 1 1953 4 30000 Paris Mauvaise
2 Mathilde Crepineau 13 10 1953 0 60000 Montpellier Trs bonne
3 Bndicte Avelin 9 3 1953 1 9000 Rouen Mauvaise
4 Henriette Tufte 3 2 1953 1 15000 Paris Mauvaise
5 Danielle Cron 16 4 1953 2 40000 Marseille Moyenne
6 Ludivine Laposte 15 5 1953 2 40000 Marseille Moyenne
7 Agns Roche 2 5 1953 2 10000 Nice Bonne
8 Rita Mena 5 5 1953 3 45000 Paris Moyenne
9 Andre Lamiral 22 6 1953 3 80000 Nancy Passable
10 Pauline Zatti 20 7 1953 4 50000 Nice Moyenne
11 Zo Foret 9 9 1953 2 60000 Nice Passable
12 Lola Marseille 7 7 1953 3 55000 Marseille Bonne
13 Priscilla Lounad 3 2 1953 3 85000 Montpellier Bonne
14 Violaine Turk 16 4 1953 5 60000 Nice Moyenne
15 Christine Dodue 15 5 1953 2 40000 Rouen Bonne
16 Fabiola Couic 2 5 1953 1 10000 Nancy Passable
17 Noelle Gant 5 11 1953 3 120000 Nice Mauvaise
18 Rachel Nol 22 2 1953 3 80000 Paris Moyenne
19 Sabine Eboum 20 10 1953 4 18000 Paris Trs bonne
20 Jeanne Rivire 9 12 1953 5 90000 Marseille Passable
26
Dans cette 1
re
Partie, on ne considrera quun seul caractre
la fois.
Reprsentation de la distribution dun
caractre X par un Tableau
1) Cas dun caractre qualitatif :
Soit la distribution d un caractre
qualitatif X tudi sur une population de
n individus :
( ) ( ) ( ) { }
k k
n x n x n x , , , , , ,
2 2 1 1

27
Sa reprsentation par tableau est alors comme suit :
Modalit
x
i

Effectif
n
i

Frquence
f
i

x
1
n
1
f
1

x
2
n
2
f
2


x
i
n
i
f
i


x
k
n
k
f
k

Total n= n
i
1= f
i


28
Exemple : On reprend les 20 femmes selon
lopinion caractre ordinal :
Ma, Tb, Ma, Ma, Mo, Mo, Bo, Mo, Pa, Mo, Pa, Bo,
Bo, Mo, Bo, Pa, Ma, Mo, Tb, Pa.
Une fois classes : Ma, Ma, Ma, Ma, Pa, Pa, Pa, Pa,
Mo, Mo, Mo, Mo, Mo, Mo, Bo, Bo, Bo, Bo, Tb, Tb.
On a donc 5 modalits (k=5 ).
La distribution scrit :
( ) ( ) ( ) ( ) ( ) { } 2 ; , 4 ; , 6 ; , 4 ; , 4 ; Tb Bo Mo Pa Ma
29
Le Tableau statistique est comme suit :
n
i
f
i
4 0,2
4 0,2
6 0,3
4 0,2
2 0,1
n=20 1
30
D.TOUIJAR 02/10/2013
6
2) Cas du caractre quantitatif :
a) Variable Statistique Discrte (v.s.d)
Soit X le caractre qui dsigne le nombre
denfants par mnage pour les 20 femmes :
La distribution est alors :
( ) ( ) ( ) ( ) ( ) { } ) 2 , 5 ( , 3 , 4 , 6 , 3 , 5 , 2 , 3 , 1 , 1 , 0
4 0 1 1 2 2 2 3 3 4
2 3 3 5 2 1 3 3 4 5
31
Le tableau est alors le suivant :
32
Question : Combien de femmes ont au moins
ou au plus 3 enfants ?
i) Effectifs et frquences cumuls :
*) Effectifs et frquences cumuls croissants:
Soit N
i
le i
me
effectif cumul croissant
associ x
i
N
i
est le nombre dindividus prsentant au
plus la modalit x
i
.

=
= + + + =
i
j
j i i
n n n n N
1
2 1

33
On dit que 15 femmes ont au plus x
4
=3
enfants.
En divisant lgalit ci-dessus par n=20, on
obtient la frquence cumule croissante:
On dit que 75% des femmes ont au plus
x
4
=3 enfants.
15
4
1
4 3 2 1 4
= = + + + =

= j
j
n n n n n N
% 75
4
1
4 3 2 1 4
= = + + + =

= j
j
f f f f f F
34
En gnral, on a :
Effectifs et frquences cumuls dcroissants:
En sommant cette fois partir du i
me
effectif jusquau dernier, on obtient le i
me
effectif cumul dcroissant, par exemple :
N
3

=
= + + + =
i
j
j i i
f f f f F
1
2 1

16
6
3
6 5 4 3
= = + + + =

= j
j
n n n n n
35
Le tableau complet est comme suit :
x
i
n
i
N
i
N
i

F
i
F
i


x
1
n
1
n
1
n F
1
1
x
2
n
2
n
1+
n
2
n
2
+n
3
+...+n
k
f
1
+ f
2
f
2
+ f
3
+...+ f
k


x
i
n
i
n
1
+n
2
+...+n
i
n
i
+n
i+1
+...+n
k
f
1
+ f
2
+...+f
i
f
i
+ f
i+1
+...+ f
k


x
k
n
k
n n
k
1 f
k

Total n __ __ __ __

f
1
36
D.TOUIJAR 02/10/2013
7
On dit que 16 femmes ont au moins x
3
=2
enfants.
En divisant lgalit ci-dessus par n=20, on
obtient la frquence cumule
dcroissante:
F
3
On dit que 80% des mnages ont au moins
x
3
=2 enfants.
% 80
6
3
6 5 4 3
= = + + + =

= j
j
f f f f f
37
Pour notre exemple, on a :
38
Interprtation :
Il y a 19 mnages (soit 95%) qui ont
au moins 1 enfant.
Il y a 9 mnages (soit 45%) qui ont
au plus 2 enfants.
Remarque :
F
i
1
1
1
1
1
1
1

=
=
=
+
=
= + + + =

i
i
j
j
k
j
j k i i
F
f f f f f

39
2
1 i i
i
e e
x
+
=

b) Variable statistique continue (v.s.c)
Dans le cas dune v.s.c., les modalits
sont regroupes en classes. Soit k le
nombre de ces classes :
[e
0
, e
1
[ ; [e
1
, e
2
[ ; ... ; [e
i-1
, e
i
[ ; ... ; [e
k-1
, e
k
[

1
re
2
me
i
me
k
me
Pour la i
me
classe, on note :
a
i
= e
i
e
i-1
lamplitude de cette classe.
le centre de cette classe.
40
N classe Les classes n
i
f
i

1 [e
0
, e
1
[ n
1
f
1

2 [e
1
, e
2
[ n
2
f
2


i [e
i-1
, e
i
[ n
i
f
i


k [e
k-1
, e
k
[ n
k
f
k

Total __ n 1
41
Exemple : on relve le revenu des 20 femmes()
Il est plus commode de regrouper
les revenus en classe, par exemple,
on choisi 4 classes de mme
amplitude
Revenu X Effectif n
i
9000 1
10000 2
15000 1
18000 1
30000 1
40000 3
45000 1
50000 1
55000 1
60000 3
80000 2
85000 1
90000 1
120000 1
TOTAL 20
Classes Revenus(K) effectifs
[0 ; 35[ 6
[35 ; 70[ 9
[70 ; 105[ 4
[105 ; 140[ ?
TOTAL 20
42
D.TOUIJAR 02/10/2013
8
Compltons notre tableau :
Classes n
i
f
i
% F
i
% F
i
%
[0 ; 35[
6
30 30 100
[35 ; 70[
9
45 75 70
[70 ; 105[ 4
20 95 25
[105 ; 140[ 1
5 100 5
Total
20 100
Au plus Au moins
43
Interprtation :
Il y a F
2
=75% des femmes touchent
au plus e
2
= 70 m . ([e
1
,e
2
[)
Il y a F
3
=25% des femmes touchent
au moins e
2
= 70 m . ([e
2
,e
3
[)
44
III) REPRESENTATIONS GRAPHIQUES
Le graphique est une traduction visuelle de
linformation quelle soit qualitative ou quantitative.
1) Cas du caractre qualitatif :
A) Le graphique en tuyaux dorgue
est form de rectangles de mme base
constante et dont les hauteurs sont
proportionnelles aux effectifs (ou
frquences) des modalits associes.
45
Exemple : On reprend les 20 femmes
0,2 0,2
0,3
0,2
0,1
0%
10%
20%
30%
40%
Ma Pa Mo Bo Tb
Rpartition des 20 femmes selon l'opinion
46
02/10/2013
Exemple : On reprend les 20 femmes
0%
10%
20%
30%
40%
Ma Pa Mo Bo Tb
0,2 0,2
0,3
0,2
0,1
Rpartition des 20 femmes selon l'opinion
47
B) Le diagramme circulaire
Cest une reprsentation en disque.
Chaque secteur est proportionnel
leffectif (ou frquence) de la modalit
associe. En terme dangle, x
i
on associe
langle au centre
i
, du secteur i, vrifiant:

i
= c f
i
; i=1,...,K
Or
= = =

= =
360 1 360
1 1
c c f c
K
i
i
K
i
i

48
D.TOUIJAR 02/10/2013
9
Lgalit devient:

i
= 360 x f
i
; i=1,...,k
Ou
i
= 3,6 x f
i
% ; i=1,...,k
x
i
f
i
%

i

Ma 20 72
Pa 20 72
Mo 30 108
Bo 20 72
Tb 10 36
Total 100 360 49
Ma
20%
Pa
20%
Mo
30%
Bo
20%
Tb
10%
Rpartition des femmes selon l'opinion
Ma
Pa
Mo
Bo
Tb
72
108
36
50
Ma
20%
Pa
20%
Mo
30%
Bo
20%
Tb
10%
Rpartition des femmes selon l'opinion
Ma
Pa
Mo
Bo
Tb
51
2) Cas du caractre quantitatif :
A) Les V.S.D. On utilise deux types de
graphiques selon que lon considre les
effectifs (ou frquences) simple ou les
effectifs (ou frquences) cumuls:
i) Diagramme en btons
chaque modalit x
i
on associe un
52
Segment de longueur proportionnelle
leffectif (ou frquence).
Exemple : On reprend lexemple
des 20 femmes
53
0
1
2
3
4
5
6
7
-1 0 1 2 3 4 5
Rpartition des mnages selon le
nombre d'enfants
n
i
x
i
54
D.TOUIJAR 02/10/2013
10
ii) Courbe Cumulative
Dfinition : On appelle fonction de rpartition
F( x), la fonction qui chaque valeur xde R
associe la proportion dindividus pour lesquels la
valeur de la variable X est infrieure ou gale x.
Notation :
( ) ( ) x X P x F =
55
Remarques :
Si x = x
i
alors F(x
i
) = f
1
+ + f
i
= F
i
.
Si x
i
x < << < x
i+1
alors F(x)= F
i
+ 0= F
i
.
Conclusion :
F(x)=F
i
pour tout x tel que x
i
x < << < x
i+1
La reprsentation graphique de F(x) est appele
Courbe cumulative, cest une courbe
en escalier dont les paliers sont
horizontaux, puisque F(x) est constante sur
chaque intervalle [x
i
, x
i+1
[.
56
Proprit de F:
La fonction Fest dfinie sur R et valeurs dans
[0 , 1].
F(x) = 0 si x < x
1
F(x) = 1 si x x
k
F(- ) = 0 et F(+ ) = 1
F est constante sur chaque intervalle sparant deux
modalits conscutives .
Remarque : On obtient la courbe cumulative des
effectifs en remplaant les F
i
par les N
i
.
57
02/10/2013
Pour notre exemple, on a :
x
i
n
i
f
i
% F
i
%
0 1 5 5
1 3 15 20
2 5 25 45
3 6 30 75
4 3 15 90
5 2 10 100
Total 20 100
Au plus
58
Exemple : On reprend les 20 femmes
Courbe Cumulative dans le cas
d'une v.s.d
0
5
20
45
75
100
0
0
1 2 3 4
x
F(x)
90
5
59
B) Les V.S.C. On a souvent recourt trois types
de graphiques :
i) Histogramme
chaque classe, on associe un rectangle
dont la base est gale lamplitude de la
classe et dont la hauteur est de telle sorte
que sa surface (S
i
= b
i
x h
i
) soit
proportionnelle la frquence de la
classe. La juxtaposition de tous ces
rectangles forment un histogramme. 60
D.TOUIJAR 02/10/2013
11
La procdure suivre :
Toutes les classes ont mme amplitude
(a
i
= cte = a ; i=1,...,k) alors h
i
=f
i
(ou n
i
).
Au moins une classe a une amplitude
diffrente des autres : dans ce cas on
choisi une amplitude de rfrence a
r
(par
exemple la plus petite ou la plus rpandu)
Par suite, on corrige la frquence des
classes diffrentes en la divisant par
lamplitude associe
et en multipliant
par a
r
:
r
i
i
i i
a
a
f
f h = =
61
Exemple : On reprend les 20 femmes
Toutes les classes ont mme amplitude
donc pas besoin de corriger les frquences
Classes a
i
f
i
[0 ; 35[ 35 0,30
[35 ; 70[ 35 0,45
[70 ; 105[ 35 0,20
[105 ; 140[ 35 0,05
Total a
r
=35 1
62
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
35 70 105 140
X
fi
Rpartition des femmes selon le
revenu en 1000
63
Exemple : Si On regroupe les 2 dernires
classes
Rem : f
i
sappelle densit de frquence
(sans pourcentage)
Classes f
i
a
i
l
i
f
i

[0 ; 35[ 0,30 35 1 0,30


[35 ; 70[ 0,45 35 1 0,45
[70 ; 140[ 0,25
70 2 0,13
Total 1 a
r
=35 ---
--
64
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0,5
0,55
0,6
0,65
0,7
0,75
0,8
0,85
0,9
0,95
1
35 70 105 140
X
f
i
0,13
Rpartition des femmes selon le
revenu en 1000
65
ii) Polygone de frquences
On subdivise lhistogramme en sous
rectangles de mme base gale lamplitude
de rfrence a
r
. a
r
tant choisie comme la
plus petite des amplitudes et vrifiant :
Aprs avoir ajouter aux extrmits de
lhistogramme deux rectangles fictifs de hauteur
nulle et de base a
r
,on joint, par des segments
de droites, les milieux des sommets des sous
rectangles ainsi obtenus.
,... 4 , 3 , 2 , 1 ; = = k ka a
r i
66
D.TOUIJAR 02/10/2013
12
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0,5
35 70 105 140
X
f'
i
0
Rpartition des femmes selon
le revenu en 1000
175
-35
67
ii) Courbe Cumulative
On construit la courbe de la frquence
cumule en joignant les points (e
i
, F
i
), o
e
i
est la borne suprieure de la i
me
classe
[e
i-1
, e
i
[ et F
i
est la frquence cumule de
cette mme classe. On note
( )
i i
e X P F =
68
Exemple : On reprend les 20 femmes
Classes f
i
% F
i
%
[0 ; 35[ 30 30
[35 ; 70[ 45 75
[70 ; 140[ 25 100
Total 1 Au plus
69
0
10
20
30
40
50
60
70
80
90
100
0 35 70 105 140
X
F(x)
52
Rpartition des femmes selon le
revenu en 1000
Mdiane
graphiquement
0 70
Chapitre II
Les caractristiques de
Tendance centrale
71
Ici, il sagit de faire une synthse de
linformation, contenue dans la srie brute, par
le chiffre; et ce en calculant des paramtres dits
de tendance centrale, qui caractrisent lordre
de grandeur des observations.
Dans ce chapitre, on analysera trois de ces
paramtres qui sont :
les moyennes, le mode et la mdiane.
72
D.TOUIJAR 02/10/2013
13
I) LES MOYENNES
(1) La moyenne arithmtique
(a) Dfinition : Dfinition : Dfinition : Dfinition : La moyenne arithmtique, note
, dune variable statistique X de distribution
est la quantit :
x
( ) { }
k i
i i
n x
1
,

= =
= =
k
i
i i i
k
i
i
x f x n
n
x
1 1
1
73
O, n est la taille de la population, et les
x
i
sont les modalits dans le cas d'une
v.s.d. et les centres des classes dans le cas
d'une v.s.c.
Exemple 1 : On reprend lexemple des
20 femmes selon le nb denfants
74
x
i
n
i
n
i
x
i
f
i
f
i
x
i
0 1 0 0,05 0
1 3 03 0,15 0,15
2 5 10 0,25 0,50
3 6 18 0,30 0,90
4 3 12 0,15 0,60
5 2 10 0,10 0,50
Total 20 53 1 2,65
75
Exemple 2 : Pour les revenus des femmes
65 , 2
65 , 2
20
53 1
6
1
6
1
= =
= = =

=
=
i
i i
i
i
i
x f x ou
x n
n
x
55125
1
3
1
3
1
= = =

= = i
i i i
i
i
x f x n
n
x
76
Classes f
i
x
i
f
i
x
i
[0 ; 35 [ 0,30 17,5 5,25
[35 ; 70 [ 0,45 52,5 23,625
[70 ; 140 [ 0,25 105 26,25
Total 1
55,125
77
(b) Changement Changement Changement Changement dorigine dorigine dorigine dorigine et et et et dchelle dchelle dchelle dchelle
Proprit : Soit X une variable statistique
de moyenne arithmtique . Si Y est une
variable statistique telle que Y=aX+b, o a
et b sont des rels quelconques, alors la
moyenne arithmtique de Y est :
x
b x a y + =
78
D.TOUIJAR 02/10/2013
14
Dmonstration :
( )

b x a f b x f a
b ax f y f y
k
i
i
x
i
k
i
i
i
k
i
i i
k
i
i
+ = + =
+ = =


= =
= =
1
1 1
1 1

79
(c) Proprits algbriques de la moyenne Proprits algbriques de la moyenne Proprits algbriques de la moyenne Proprits algbriques de la moyenne
arithmtique arithmtique arithmtique arithmtique
i) la moyenne des carts la moyenne
arithmtique est nulle :
ii) La moyenne des carrs des carts
une constante a est minimale pour a =
( )

=
=
k
i
i i
x x f
1
0
( ) ( )

= =

=
k
i
i i
k
i
i i
a
x x f a x f
1
2
1
2
min
R
x
80
Dmonstration :
( ) ( ) ( )
( ) ( )
( )( )
( ) ( )

( ) ( )
( ) ( )
2 2
1 1
2 2
1 1
1
2 2
1 1
1
1
0
2 2
1
2
2
k k
i i i i
i i
k k
i i i
i i
k
i i
i
k k
i i i
i i
k
i i
i
k
i i
i
f x a f x x x a
f x x f x a
f x x x a
f x x x a f
x a f x x
f x x x a
= =
= =
=
= =
=
=
=
=
( = +

= +
+
= +
+
= +


81
(d) Proprit de lagrgation Proprit de lagrgation Proprit de lagrgation Proprit de lagrgation
Soit une population P PP P de taille n, compose
de m sous populations P PP P
1
, P PP P
2
, . . . , P PP P
m
; de
tailles respectives n
1
, n
2
, . . .n
m
et de
moyennes respectives . Alors
la moyenne arithmtique de la population
P PP P est donne par :
m
x x x . . . . , ,
2 1
x
i
m
i
i
x n
n
x

=
=
1
1
82
Exemple :
Le salaire moyen des cadres dans
lentreprise E est de 4000 DH.
Le salaire moyen des cadres masculins
est de 4200 DH.
Le salaire moyen des cadres fminins
est de 3000 DH.
1. Quelle est la rpartition hommes -
femmes des cadres ?
83
Soit Le salaire moyen global dans E,
celui des hommes et celui des femmes.
On a :
On aboutit alors au systme :

= +
= +
x x f x f
f f
2 2 1 1
2 1
1

= +
= +
4000 3000 4200
1
2 1
2 1
f f
f f
% 7 , 16 % 3 , 83
2 1
= = f et f
1
x x
2
x
2 2 1 1
x f x f x + =
84
D.TOUIJAR 02/10/2013
15
I) LES MOYENNES
(2) La moyenne gomtrique
(a) (a) (a) (a) Dfinition : Dfinition : Dfinition : Dfinition : On appelle moyenne gomtrique
de la distribution que lon
note G, la racine n
me
du produit des
( ) { }
k i
i i
n x
1
,
i
n
i
x
( )
n
n
k
n n
n
k
i
n
i
k i
x x x x G = =

=

2 1
2 1
1

=
=
k
i
i
n n
1
o
85
Cest plus pratique dutiliser le logarithme
( ) [ ]
[ ] ( )
[ ]
( )
( ) ( )

= =
=
=
= =
=
|
|

\
|
=
=
|
|

\
|
=
k
i
i i
k
i
i i
k
i
n
i
k
i
n
i
n
k
n n
n
n
k
n n
x L f x L n
n
x L
n
x L
n
x x x L
n
x x x L G L
i
i
k
k
1 1
1
1
2 1
1
2 1
1
1
1
1
2 1
2 1
og og
og
og
og
og og

86
Exemple :calculons la moyenne gomtrique de
2 , 12 , 2 , 50 :
Dune autre faon, calculons Log(G) :
999 , 6 50 12 2
4 2
= = G
( ) ( ) ( )
[ ]
7 o D'
946 , 1
50 12 2 2
4
1
4
1
946 , 1
4
1
4
1
= =
=
+ + =
= =

= =
e G
Log Log Log
x Log n x Log f G Log
i
i i
i
i i
87
Domaines dapplication :
On utilise la moyenne
gomtrique dans le calcul du
taux daccroissement moyen et
dans le calcul de certains indices
statistique.
88
I) LES MOYENNES
(3) La moyenne harmonique
Dfinition et proprit Dfinition et proprit Dfinition et proprit Dfinition et proprit : La moyenne
harmonique , note H, dune distribution
est linverse de la moyenne
arithmtique de la distribution :
( ) { }
k i
i i
n x
1
,

=
=
k
i
i
n n
1
o

|
|

\
|
k i
i
i
n
x
1
,
1

= =
= =
k
i
i
i
k
i
i
i
x
f
x
n
n
H
1 1
1
1
89
Exemple :calculons la moyenne
harmonique de 2 , 12 , 2 , 50 :

625 , 3
50
1
12
1
2
1
2
4
=
|

\
|
+ +
= H
90
D.TOUIJAR 02/10/2013
16
Domaines dapplication :
On utilise cette moyenne dans le
calcul des dures moyennes, dans
le calcul des moyennes de rapports
et de pourcentages et dans les
tudes du pouvoir dachat (inverse
du MGP)...etc.
91
I) LES MOYENNES
(4) La moyenne quadratique
Dfinition Dfinition Dfinition Dfinition et proprit et proprit et proprit et proprit : La moyenne
quadratique, note Q , dune distribution
est la racine carre de la moyenne
arithmtique de la distribution
( ) { }
k i
i i
n x
1
,
( ) { }
k i
i i
n x
1
2
,
2
1
2
1
1
i
k
i
i i
k
i
i
x f x n
n
Q

= =
= =
92
Domaines dapplication :
La moyenne quadratique intervient
dans le calcul de certains
paramtres de dispersion.
93
Exemple :calculons la moyenne
quadratique de 2 , 12 , 2 , 50 :

( ) 749 , 25 2500 144 4 2


4
1
= + + = Q
94
(5) Rsultat comparatif
Pour une mme srie
statistique, on montre que les
quatre moyennes vrifient
toujours lordre suivant :
Q x G H < < <
95
(6) Conclusion :
Un inconvnient de la moyenne arithmtique
est quelle est trs sensible aux valeurs
extrmes de la srie.
La moyenne gomtrique est peu sensible
ces dernires.
En ce qui concerne la moyenne
harmonique, elle est plus sensible aux plus
petites valeurs de la srie quaux plus grandes.
96
D.TOUIJAR 02/10/2013
17
II) LE MODE
(1) Dfinition : Dfinition : Dfinition : Dfinition : Le mode, not M
o
, dune srie
statistique est la valeur de cette srie, dont leffectif
(ou la frquence) est plus grand que les effectifs (ou
les frquences) des valeurs voisines.
Cest le plus simple mais le moins utilis !
97
(2) Dtermination du mode
(a) Cas d'une v.s.d.
Dans le cas d'une v.s.d. la dtermination
du mode est immdiate partir du
tableau statistique ou du diagramme en
btons.
Exemples :
i) Ci-dessous on donne trois diagrammes
en btons associs respectivement, une
distribution unimodale (qui a un seul
mode ), et une distribution bimodale
(qui a deux modes ), et une distribution
qui a un intervalle modal.
98
Distribution unimodale
M
o
M
Distribution bimodale
M
o2
M
o1
intervalle modale
99
Exemple 1 : On reprend lexemple des 20
femmes selon le nb denfants
x
i
n
i
f
i
0 1 0,05
1 3 0,15
2 5 0,25
3 6 0,30
4 3 0,15
5 2 0,10
Total 20 1
M
o
= 3 enfts
100
(b) Cas dune v.s.c.
Le mode se trouve dans la classe
modale, c'est la classe qui correspond
la plus grande frquence corrige.
On peut dmontrer que lexpression
algbrique du mode est comme suit :
) ( 2
1 1
1
1 0
+

+ =
i i i
i i
i i
h h h
h h
a e M
101
Exemple : On reprend les 20 femmes

=

modale classe la de amplitude l' est :
) frquences des leve plus la est (c' modale
classe la de corrige frquence la est :
modale classe la est : [ , [ o
1
i
i i
i i
a
f h
e e
( )
17 , 46
13 , 0 3 , 0 90 , 0
3 , 0 45 , 0
35 35
) ( 2
3 1 2
1 2
2 1 0
m
h h h
h h
a e M
=
+

+ =
+

+ =
102
D.TOUIJAR 02/10/2013
18
Exemple :
Classes
f
i
f
i
[0 ; 35[ 0,30 0,30
[35 ; 70[ 0,45 0,45
[70 ; 140[ 0,25
0,13
Total 1
--
Classe
modale
103
III) LA MEDIANE
(1) Dfinition Dfinition Dfinition Dfinition : : : : La Mdiane, note M, dune
srie statistique, est la valeur de la srie qui
partage la population en deux parties deffectifs
gaux. Par consquent, on aura autant
dobservations infrieures Mque
dobservations suprieures M.
104
(2) Dtermination de la mdiane
(a) Cas dune srie brute
Soit la srie ordonne (par ordre croissant) de n
observations : x
1
, x
2
, ..., x
n
.
Si n est impaire, alors la valeur mdiane est lobservation
qui occupe le rang (n+1)/2 .
Si n est paire, on ne peut plus dterminer exactement la
mdiane, mais on a un intervalle mdian
( )
[ ]
1 2 / 2 /
;
+ n n
x x
105
(b) Cas dune distribution
i) Cas d1 VSD
Soit X une v.s.d. de distribution
Pour dterminer sa mdiane, on utilise
les frquences cumules croissantes F
i
.
- Procdure suivre
Si i F
i
0,5 ; autrement dit, si aucune
frquence cumule F
i
nest gale 0,5 ,
dans ce cas la mdiane est la modalit x
i
qui correspond la plus petite frquence
cumule dpassant strictement 0,5.
( ) { }
1
,
i i
i k
x f

106
S'il existe une modalit x
i
pour laquelle
F
i
= 0,5, dans ce cas on parle dun intervalle
mdian : [x
i
, x
i+1
].
Exemple 1 : On
reprend lexemple
des 20 femmes
selon le nb
denfants
Do M=3 enfts
F
3
=0,45< 0,5< F
4
x
i
f
i
% F
i
%
0 5 5
1 15 20
2 25 45
3 30 75
4 15 90
5 10 100
Total 100
Au plus
107
ii) Cas dune v.s.c.
Dans le cas continue, la mdiane est
toujours unique : cest la valeur qui
partage exactement la population en
deux parties gales. En d'autres termes,
M est la solution de lquation :
F(M) =0,5
o F est la fonction de rpartition de X.
On a deux mthodes pour dterminer la
mdiane :
108
D.TOUIJAR 02/10/2013
19
( ) Dtermination graphique : -La mdiane
correspond labscisse du point de la courbe
cumulative qui admet pour ordonne la valeur 0,5
(ou 50%). (Voir Graphique de lexemple)
( ) Dtermination par interpolation : -D'aprs le
tableau ou la courbe cumulative, on dtermine la
classe contenant la mdiane M ; cest la classe
[ e
i-1
, e
i
[ telle que, F
i-1
0,5 < F
i
; puis on
dtermine M par interpolation linaire. donc on a :
M
e
i-1
e
i
4
1
2
3
F
i-1 F
i
0,5
109
i
i
i i
f
F
a e M
1
1
5 , 0

+ =

dente c pr classe la
de e cumul quence fr la est :
quence fr sa est :
amplitude son tant :
diane m classe la est [: , [
o
1
1
i
i
i
i i
F
f
a
e e
110
Exemple:
2
1
2 1
5 , 0
f
F
a e M

+ =
56 , 50
45
30 50
35
35
m
M
=

+ =
Classes f
i
%
F
i
%
[0 ; 35[ 30 30
[35 ; 70[ 45 75
[70 ; 140[
25
100
Total
1
Au plus
111
0
10
20
30
40
50
60
70
80
90
100
0 35 70 105 140
X
F(x)
52
Rpartition des femmes selon le
revenu en 1000
Mdiane
graphiquement
0 112
Conclusion Gnrale
Population htrogne : La moyenne arithmtique
est prfrable la mdiane et au mode.
Prsence des valeurs aberrantes (ou extrmes) : La
mdiane est prfrable.
Rsultats dun concours: la note mdiane est la plus
significative.
Dmographie : Lesprance de vie est conseille
pour comparer des pays en voie de dvpt. Pour un
seul, la dure mdiane ou le mode (ge le plus
frquent la mort) sont utiliss.
113
IV) POSITIONS RELATIVES DES 3
PARAMTRES M
O
, M et x
distribution symtrique unimodale : les 3
paramtres coincident au point de symtrie
f
M
o
=M=x
114
D.TOUIJAR 02/10/2013
20
distribution unimodale dissymtrique
tale droite :M
o
< M < x
f
M
o
M
x xx x
x
115
distribution unimodale dissymtrique tale
gauche : x< M < Mo
f
M
o
M x
116
Remarque : Pour des distributions
peu dissymtriques, on a la relation
suivante :
( ) M x M x 3
0
117
Chapitre III
Les caractristiques
de
Dispersion
et de
Concentration
118
Introduction
Les paramtres de dispersion servent
mesurer la dispersion des observations
autour d'une tendance centrale.
On considre deux catgories de
paramtres de dispersion :
1- Les carts simples :
tendue- cart interquantile.
2-L'cart-type, la variance et le coefficient
de variation.
119
I) I) I) I)- Les carts simples
1)Ltendue:
Dfinition: Ltendue, not e, est la
diffrence entre la plus grande et la plus
petite observation.
Cas dune v.s.d
e = x
max
x
min
Exemple : e = x
6
x
1
= 5-0 = 5 enfts
120
D.TOUIJAR 02/10/2013
21
Cas dune v.s.c
e = e
k
e
0
Exemple: e = e
3
e
0
=140-0= 140 m.
Limites :il est trs sensible aux fluctuation
d chantillonnages.
2)Ecart interquantile: Dsormais, On
ne sintressera quaux V.S.C.
a)Les quantiles: Gnralisation de la
mdiane.
121
Dfinition: Soit un nombre rel compris entre
0 et 1. On dit quune valeur x

du caractre X est un
quantile d'ordre , si :
F( x

) =P(X x

) )) ) =
On cite quatre types de quantiles :
quartiles
quintiles
dciles
centiles

e
0
e
k
x


(1-)
122
Valeurs de
Nom de x

i /4 ; i {1, 2, 3}
i
me
quartile
i /5 ; i {1, 2,,4}
i
me
quintile
i /10 ; i {1, 2 ,,9}
i
me
dcile
i /100 ; i {1,2,,99}
i
me
centile
123
1)QUARTILES: Soient Q
1
, Q
2
et Q
3
les trois
quartiles. Par dfinition :
Q
1
= x
1/4
, P(X< Q
1
) )) ) = 1/4= 25%
Q
2
= x
1/2
, P(X< Q
2
) )) ) = 2/4= 50%
Q
3
= x
3/4
, P(X< Q
3
) )) ) = 3/4= 75%
Donc Q
1
, Q
2
et Q
3
partagent la population
en quatre parties de mme effectif 25 %
chacune.

e
0
e
k
Q
2

25 %
Q
1
Q
3

25 % 25 % 25 %
124
2)QUINTILES: Soient q
1
, q
2
, q
3
et q
4
ces 4
quintiles. On a :
q
1
= x
1/5
, P(X< q
1
) )) ) = 1/5= 20%
q
2
= x
2/5
, P(X< q
2
) )) ) = 2/5= 40%
q
3
= x
3/5
, P(X< q
3
) )) ) = 60%
q
4
= x
4/5
, P(X< q
4
) )) ) = 80%
Donc q
1
, q
2
, q
3
et q
4
partagent la population
en cinq parties deffectif =20 % chacune.

e
0
e
k
q
2

20 %
q
1
q
3

20 % 20 % 20 %
q
4

20 %
125
3) DECILES: Soient D
1
, D
2
, ,D
9
ces 9 dciles. Ils
partagent la population en dix parties
deffectif =10 % chacune.
Par exemple : P(X< D
5
) )) ) = 1/2= 50% ; do
D
5
est la mdiane :
D
5
=Q
2
=M

e
0
e
k
D
2

10 %
D
1
D
3

80 %
D
9

10 %
. . .
126
D.TOUIJAR 02/10/2013
22
La dtermination des quantiles:
i) Dtermination Graphique : elle est
pratiquement la mme que celle de la
mdiane, il suffit de remplacer 0 00 0, ,, ,5 55 5 par . . . .
ii) Dtermination par Interpolation :
, elle correspond la
plus petite frquence cumule dpassant
strictement
i
i
i i
f
F
a e x
1
1

+ =

[ [
i i
e e x ;
1

127
Exemple : On reprend les 20 femmes
Classes f
i
% F
i
%
[0 ; 35[ 30 30
[35 ; 70[ 45 75
[70 ; 140[ 25 100
Total 1 Au plus
128
Exemple : Pour les vingt femmes :
F
0
<25<F
1
F
2
75<F
3
Q
2
=M
=50,56 m
17 , 29
30
0 25
35 0
25
1
0
1 0 1
m
f
F
a e Q
=

+ =

+ =
70 0 70
75
3
2
3 2 3
m
f
F
a e Q
= + =

+ =

129
Exemple : Pour les vingt femmes :
F
0
<10<F
1
F
2
90<F
3
D
5
=M
=50,56 m
67 , 11
30
10
35 0
10
1
0
1 0 1
m
f
F
a e D
= + =

+ =
112
25
75 90
70 70
90
3
2
3 2 9
m
f
F
a e D
=

+ =

+ =

130
Ecart interquantile: Ce sont des paramtres de
dispersion, donns par la diffrence entre le
premier et le dernier quantile :
i) Ecart interquartile: Q = Q
3
- Q
1
.
ii) Ecart interquintile: q = q
4
- q
1
.
iii) Ecart interdcile: D = D
9
- D
1
.
Exemple :
Q = 40,83 m
D = 79,33 m
131
c) Les carts relatifs: Afin de comparer des
distributions diffrentes, on peut utiliser :
i)Ecart interquartile relatif : Q
r
=
ii)Ecart interdcile relatif : D
r
=
Exemple :
Q
r
=40,83/50,56 = 0,808= 80,8%
D
r
=112/11,67= 9,6
Les moins riches des 10% les plus riches
ont un revenu suprieure 9,6 fois le revenu
des plus riches des 10% les plus pauvres.
M
Q
1
9
D
D
132
D.TOUIJAR 02/10/2013
23
II) II) II) II)- Ecart-type et variance
1)La variance:
Dfinition: La variance, V(X), dune
distribution statistique {(x
i
, n
i
)1 i k },
est donne par :

= =
= =
k
i
i i
k
i
i i
x x f x x n
n
X V
1
2
1
2
) ( ) (
1
) (
133
Remarque
La variance est aussi note
Pour une variable statistique continue les x
i
sont
les centres des classes.
2)Lcart type:
Dfinition: Lcart type de X, not
X
, est
la racine carre de la variance :
2
x


= =
= = =
k
i
i i
k
i
i i x
x x f x x n
n
X V
1
2
1
2
) ( ) (
1
) (
134
Cas VSD
Sachant que
Classes f
i
x
i
(x
i
- )
2
f
i
(x
i
- )
2
[0 ; 35[ 0,30
17,5 1415,641 424,692
[35 ; 70[ 0,45 52,5 6,891 3,101
[70 ; 140[ 0,25 105 2487,516 621,879
Total 1 ---
--- 1049,672
x x
125 , 55
3
1
m x f x
i
i i
= =

=
135
3)Formule dveloppe de la variance
La variance scrit aussi comme la diffrence
entre la moyenne des carrs et le carr de la
moyenne :
3986 , 32 672 , 1049
672 , 1049 ) ( ) (
3
1
2
m
x x f X V
X
i
i i
= =
= =

2
1
2 2
1
2
2 2
) ( ) (
1
) (
x x f x x n
n
x x X V
k
i
i i
k
i
i i
|

\
|
= |

\
|
=
=

= =
136
Classes n
i
x
i
n
i
x
i
n
i
x
i
2
[0 ; 35 [ 6 17,5 105 1837,5
[35 ; 70 [ 9 52,5 472,5 24806,25
[70 ; 140 [ 5 105 525 55125
Total 20 - 1102,5 81768,75
137
Exemple :
4) Changement de variable :
Si Y=X+b alors V(Y)=V(X)
Si Y=aX alors V(Y)=a
2
V(X)
( )
399 , 32 672 , 1049
672 , 1049 766 , 3038 438 , 4088
125 , 55
20
75 , 81768
) (
2 2 2
m
x x X V
X
= =
= =
= =

138
D.TOUIJAR 02/10/2013
24
4)Variances intra et inter populations
Soit une population P de taille n, compose
de 2 sous populations P
1
et P
2
; de tailles
respectives n
1
et n
2
de moyennes
respectives et de variances
respectives
1
2
,
2
2
. Alors la variance
2 22 2
de
la population P est donne par:
O
2 1
x et x
( ) ( )

pop er
pop ra
i
x
i
x x f x x f f f
int
2
2 2
2
1 1
int
2
2 2
2
1 1
2
2
2
) ( ) (

+ + + =
( )
2 2 1 1 2 2 1 1
1
x n x n
n
x f x f x + = + =
139
5)Coefficient de variation
Dfinition : Le coefficient de variation Cv dune
variable statistique positive de moyenne et
dcart-type
X
est le rapport :
: le taux dinflation dans 2 pays est
respectivement {15, 25, 35} et {150, 250, 350}. On
trouve le mme taux dinflation.
x
x
Cv
X

=
250 6 , 81 33 , 0 25 16 , 8 = = = =
B A
Cv Cv
140
Les paramtres
de
Concentration :
La notion de concentration est apparente celle de
dispersion, mais elle traduit le phnomne de
rpartition de la masse globale de la grandeur
tudie :salaires, chiffre daffaires, consommation dun
produit, superficie cultivable
Ltude de la concentration ne concerne que les
variables statistiques continues dont les modalits
sont positives et leur somme a un sens. On introduit
dans ce chapitre les paramtres de
concentration, pour apprcier la diffrence entre une
rpartition galitaire de la masse globale (une
rpartition idale) et la rpartition rellement
observe.
142
Soit X une variable statistique continue. Dont
les valeurs sont positives et regroupes en k
classes [ e
0
, e
1
[, [ e
1
, e
2
[ ,, [ e
k-1
, e
k
[
deffectifs respectifs n
1
, n
2
, ,n
k
, et de centres
respectifs x
1
, x
2
, ,x
k
. On note :
1. s
i
= n
i
x
i
: la masse du caractre X dans la
classe [ e
i-1
, e
i
[ (ou relative x
i
)
2. :est la masse globale du
caractre.

= =
= =
k
i
k
i
i i i
x n s S
1 1
143
est la masse du caractre possde
par les individus prsentant une valeur infrieure e
i
(ou la masse cumule associe la classe [e
i-1
, e
i
[).
est la masse relative de la
classe [ e
i-1
, e
i
[ (ou la proportion de la masse globale
dans [ e
i-1
, e
i
[ ).
est la masse cumule relative associe la
classe [e
i-1
,e
i
[ (ou la proportion de la masse globale
possde par les individus prsentant une valeur
infrieure e
i
).
x
x f
S
x n
S
s
g
i i i i i
i
= = =

= =
= =
i
j
i
j
j j j i
x n s S
1 1
S
S
G
i
i
=
144
D.TOUIJAR 02/10/2013
25
Remarques :
i) On a, 0 G
i
1 pour tout i.
ii) Soit x une valeur quelconque du caractre, G(x)
est la proportion de la masse globale possde par
les individus prsentant une valeur infrieure x, et
on a G(e
i
) = G
i
.
145
Exemple : On considre la distribution
statistique des salaires par heure de travail
en DH, de 110 salaris d'une entreprise :
Salaires en DH/h n
i
x
i
s
i
= n
i
x
i

g
i
=
S
s
i

G
i

[10 , 12[ 15 11 165 0,092 0,092
[12 , 15[ 35 13,5 472,5 0,264 0,356
[15 , 20[ 45 17,5 787,5 0,441 0,797
[20 , 25[ 10 22,5 225 0 ,126 0,923
[25 , 30[ 5 27,5 137,5 0,077 1
Total 110 ------- 1787,5 ------- ------- S=
146
(1) Dfinition : la mdiale de la srie statistique
X est la valeur du caractre qui partage la
masse globale en deux parties gales. On la note
M
l
, et on a :
G(M
l
) =0,5 =50 % %% %.
(2) Dtermination de la mdiale
La procdure de la dtermination de la
mdiale est similaire celle de la mdiane
en remplaant les F
i
par les G
i
.
147
Lcart absolu mdiale mdiane, not M
est un indicateur de concentration
M =M
l
- M et
Si M
r
= 0 alors M = M
l
donc on a une
distribution parfaitement galitaire
Plus M
r
est grand plus la
concentration est forte, et inversement.
i
i
i i l
g
G
a e M
1
1
5 , 0

+ =
e
M
M
r

=
148
Revenons notre exercice :
0,356 0,5 < 0,797 donc M
l
[ 15, 20 [
= 16,633 16,63 DH/h.
M = M
l
- M =16,63 -15,56 =1,07 DH/h.
III) Courbe et indice de concentration
(1) Courbe de concentration
Dans un repre orthonorm, on trace les points
de coordonnes ( F
i
, G
i
) et on les joint par des
segments de droite.
441 , 0
356 , 0 5 , 0
5 15

+ =
l
M
149
la courbe ainsi obtenue est appele
courbe de concentration ou courbe de
Lorenz.
Gi
0
0 ,2
0 ,4
0 ,6
0 ,8
1
O 0, 2 0,4 0, 6 0, 8 1
F
i

A
B C
Dr oi t e d qui r par t i t i on
Ai r e de
co ncent r at i on
Cour be de
conce ntr at i on
150
D.TOUIJAR 02/10/2013
26
(2) Indice de concentration
(a) Dfinition
L'indice de concentration ou indice de
Gini, que l'on note I
C
est donn par :

= 1- 0,872 = 0,128 = 12,8 %


) ( 1
1
1
i i
k
i
i C
G G f I + =

=

) ( 1
1
5
1

=
+ =
i i
i
i C
G G f I
151
Analogie :
Distribution Distribution
n
i
s
i
= n
i
x
i
n S =S n
i
x
i
f
i
g
i
F
i
G
i
M
e
M
l
F(x) G(x)
( ) { }
k i i i
n x
1
, ( ) { }
k i i i i
x n x
1
,
152
FIN
Salaires fi Fi Gi =
S
S
i
fi(Gi-1+Gi)
[10 , 12[ 0,136 0,136 0,092 0,013
[12 , 15[ 0,318 0,454 0,375 0,149
[15 , 20[ 0,410 0,864 0,797 0,481
[20 , 25[ 0,091 0,955 0,923 0,157
[25 , 30[ 0,045 1 1 0,087
Total 1 ____ ____ 0,887
0,356 0,142
0,473
0,872
153
PARTIE 2
SERIES DOUBLES
Ajustement linaire et Corrlation
I) TABLEAUX DE CONTINGENCE
(1) Exemple introductif
On dsire tudier la rpartition de 50184 salaris
selon lanciennet et le salaire mensuel.
Posons :

Les donnes sont reprsentes par le tableau


suivant :
: . . . '
: . . . ( )
X la v s c dsignant l anciennet en anne
Y la v s c d signant le salaire mensuel en DH

155
X en
anne
Y en
CDH
2890 1836 102 0 4828
9044 7378 884 204 17510
5746 10404 1564 374 18088
1666 6018 1666 408 9758
Total
19346 25636 4216 986 50184
Source :statistiques de la dlgation rgionale du centre
Nord : octobre 1984 en se basant sur le recensement de la
population et de lhabitat de 1982 : milieu urbain
156
D.TOUIJAR 02/10/2013
27
Si on ne considre que la 1re ligne Y et la dernire
ligne (Total) on obtient la rpartition des 50184 salaris
selon le salaire (c..d. la distribution marginale de Y)
De mme si on ne considre que la 1re colonne (X)
la dernire colonne (Total) on obtient la
rpartition des 50184 salaris selon
lanciennet : distribution marginale
de (X)
La ligne (Total) et la colonne (Total)
sont appeles marges.
n
j
19346 25636 4216 986 50184
X n
i
4828
17510
18088
9758
Total 50184
157
Cas des donnes individuelles :
Exemple introductif
Soient X et Y deux variables statistiques dfinies sur une
mme population de taille n. On note par (x
i
, y
i
) ; i =1,2,....,n
le couple de valeurs de X et Y pour le i
eme
individu.
l=k=n
y
1
y
2
y
i
y
n
TOTAL
x
1
1 0 0 0 1
x
2
0 1 0 0 1
x
i
0 0 1 0 1
x
n
0 0 0 1 1
TOTAL 1 1 1 1 n
158
Le service des tudes conomiques de
la socit veut mesurer lincidence de la
modulation de la pression marketing
(variable X: explicative) sur la vente de
flacons de parfums ( variable Y:explique).
Il enregistre, alors, les ventes y
i
(en milliers
de flacons) ainsi que les dpenses
publicitaires x
i
(en milliers de DH)dans 5
zones :
x
i
5 6 9 12 18
y
i
25 30 35 45 65
159
On cherche tudier la liaison pouvant
exister entre les variables X et Y. Pour ce,
on reprsente dans un repre orthogonal
les points (x
i
, y
i
). Lensemble de ces points
sappelle nuage de points . La forme de ce
nuage nous renseigne sur la nature de la
liaison entre X et Y et le type de courbe
qui ajustera le mieux, ce nuage. On
sintresse au cas o cette courbe est une
droite (ajustement linaire ou droite de
rgression).
160
I) Ajustement linaire
Pour ajuster un nuage de points, on
choisi parmi toutes les courbes connues
(exponentielle, logarithme, droite...) celle
qui passera le plus proche de tous les
points du nuage.
Dans le cas o le nuage a une forme
allonge, il est vident que la droite est la
plus approprie. On parle alors d'un
ajustement linaire.
Pour dterminer lquation de la droite
dajustement on utilise, trs souvent, la
mthode des moindres carrs (M.M.C.). 161
Cette mthode consiste dterminer
lquation dune droite telle que la somme
des carrs des distances entre les points du
nuage et cette droite soit minimale.
(1) Droites dajustement
On applique la M.M.C. pour dterminer
les deux droites de rgression :
a) La droite de rgression de Y en X: est utilise pour
expliquer Y par X. Cette droite est note D
Y/X
et a
pour quation y = a x + b.
O
x a y b et
X V
Y X Cov
a = =
) (
) , (
162
D.TOUIJAR 02/10/2013
28
O
Revenons notre exemple introductif
( )
( )
2
1
2
1 1
1
1
) (
1 1
1
) , (
x x
n
x V
y
n
y et x
n
x
et y x y x
n
Y X Cov
n
i
i
n
i
i
n
i
i
n
i
i i
|

\
|
=
= =
|

\
|
=



=
= =
=
163
10
20
30
40
50
60
70
4 6 8 10 12 14 16 18
X
Y
5
9
Nuage de points: Ventes en
fonction de la Pub
25
65
45
35
164
i x
i
y
i
x
i
y
i
x
i
2
y
i
2
1 5 25 125 25 625
2 6 30 180 36 900
3 9 35 315 81 1225
4 12 45 540 144 2025
5 18 65 1170 324 4225
TOTAL
50 200 2330 610 9000
/n 10 40 466 122 1800
165
La forme du nuage est plus ou moins
allonge. On peut donc estimer y partir de
x grce la droite de rgression de Y en X:
( ) 22 100
5
610 1
) (
40
5
200
5
1
10
5
50
5
1
2
1
2
5
1
5
1
= = |

\
|
=
= = =
= = =

=
=
=
x x
n
x V
mflacons y y
mDH x x
n
i
i
i
i
i
i
166
10 10 3 40 3
22
66
66 40 10 2330
5
1
5
1
5
1
5
1
) , (
5
1
5
1
5
1
= = = =
= =
|

\
|
|

\
|
|

\
|
=
=

= = =
b et a
y x y x
y x xy Y X Cov
i
i
i
i
i
i i
167
La droite D
Y/X
a pour quation:
y = a x + b
a=3 est la pente de la droite, cela signifie
que 1 DH supplmentaire investi en pub
permet de vendre 3 flacons de plus.

flacons milliers mDH
DH flacon flacons milliers
x y 10 3
/
+ =
168
D.TOUIJAR 02/10/2013
29
b) La droite de rgression de X en Y : elle est
utilise pour expliquer X par Y. Cette
droite a pour quation D
X/Y
: x =a y + b
O
Remarque : Gnralement, on trace les
deux droites D
X/Y
et D
Y/X
dans un mme
repre. Dans ce cas, l'quation de D
X/Y
s'crit :
o a' 0.
y a x b
Y V
Y X Cov
a ' ' et
) (
) , (
' = =
a
b
x
a
y

=
1
169
Revenons encore une fois notre exemple
( )
2 , 3 40 33 , 0 10
33 , 0
200
66
200
1600 1800
5
1
) (
2
5
1
2
= =
= = =
= |

\
|
=

=
b
a et
y y y V
i
i
7 , 9 03 , 3 :
/
+ = x y D
Y X
170
y = 3x + 10
Dx/y : y = 3,03x + 9,7
20
25
30
35
40
45
50
55
60
65
70
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Nuage de points: Ventes en
fonction de la Pub
G(x,y)
171
REMARQUES:
|a| < (1 / |a|); do la pente de D
Y/X
est plus
petite que celle de D
X/Y
; donc D
Y/X
plus
horizontale que D
X/Y
.
Plus les deux droites de rgression D et
D sont proches lune de lautre, cest
dire que langle entre D
Y/X
et D
X/Y
est petit
plus la liaison linaire entre X et Y est
forte.
172
Y X
Y X Cov
Y V X V
Y X Cov
r
.
) , (
) ( ). (
) , (
= =
II) Coefficient de corrlation linaire
Dans le cas dune liaison linaire entre X et Y, on
mesure le degr de cette liaison par le coefficient de
corrlation linaire.
(1) Dfinition : Le coefficient de corrlation
linaire associ X et Y, que lon note r, est
donn par :
r est sans dimension
173
(2) Proprits
(a) Le coefficient r a le mme signe que Cov(X,Y), ce
qui donne le signe de la liaison :
- Si r < 0, alors la liaison linaire est ngative.
- Si r > 0, alors la liaison linaire est positive.
- Si r = 0, alors la liaison linaire est nulle.
(b) -1 r +1 :
i) Pus la valeur absolue de r est proche de 1 et plus
la corrlation (ou la liaison) linaire entre X et Y est
forte.
ii) Pus la valeur absolue de r est proche de 0 et plus
la corrlation linaire entre X et Y est faible
174
D.TOUIJAR 02/10/2013
30
Valeurs de r pour interprtation:
0 |r| < 0,40 : faible ou quasi absence de
corrlation
0,40 | r | < 0,60 : moyenne corrlation
0,60 | r | < 0,80 : bonne corrlation;
0,80 | r | 1 : corrlation leve. 175

X
Y




D
D
r = -1
Une liaison linaire
totale et ngative.






X




Y

D
D
-1 < r < 0
Une liaison linaire
relative et ngative.
176







X






Y

D
D
r = 0
Indpendance totale.


X
Y








D
D
0 < r < 1
Une liaison linaire relative et
positive.
177

X
Y




D
D
r = 1
Une liaison linaire totale et positive.
178
Revenons encore une fois notre exemple
Conclusion:
r est positif et sa valeur est trs proche de
1, donc il y a une trs forte corrlation
linaire entre X et Y et est positive. Cest
ce que lon a constat graphiquement par
la construction des droites D et D.
( )
( ) ( )
99 , 0
33 , 66
66 , cov
= = =
Y V X V
Y X
r
179
PARTIE 3
LES INDICES :
D.TOUIJAR 02/10/2013
31
Introduction :
Le concept dindice est dfini par la
comparaison de toutes les observations
lune delle (la 1
re
par exemple), et ce
dans le temps et/ou dans lespace.
Un indice peut tre lmentaire (1seul
article: prix du pain, des oranges) ou
synthtique (plusieurs articles : produits
alimentaires, indices de capitalisation:
MASI et MADEX)
181
I) Indices lmentaires
(1) Dfinition : Soit X une grandeur simple
prenant les valeurs x
0
et x
1
aux dates t
0
et t
1
.
On appelle indice simple (ou lmentaire) de X
entre les dates t
0
et t
1
, le quotient :
( )
0
1
0
1
0
1
x
x
x
x
X I
t
t
t
t
= =
182
Remarque : Souvent, on crit et on lit :
Indice de X la date 1, base 100 la date 0
Exemple : Arrives de touristes aux
frontires du Maroc (en milliers)
Base100 en 2000 (Avril)
( ) 100
0
1
0
1
=
x
x
X I
Avril 2000 Av. 2001 Av.2002
250 260 205
183
On calcule lindice du nombre de touristes
aux frontires en 2001 base 100 en 2000
Le taux de variation en 2001 est
( ) 104 100
250
260
00
01
= = X I
( ) % X I X
r
4 100
00
01
+ = =
184
(2) Proprits des indices simples :
a)Identit :
b) Rversibilit :
Remarque : b) scrit aussi
Exemple :
2
1
0
0
100
|

\
|
=

t
t
I I
100
0 0
= I
2
0
0
100 =
t
t
I I
( ) 15 , 96 100
260
250
100
1
0
01
00
= = =
x
x
X I
185
On vrifie que :
c) Circularit :
Exemple :
10000 15 , 96 104
01
00
00
01
= I I
( ) 1
100
0
1
2
1
1
0

n
t
t
t
t
t
t
t
t
I I I
I
n
n
n
n
n

( ) 82 100
250
205
100
0
2
00
02
= = =
x
x
X I
186
D.TOUIJAR 02/10/2013
32
Remarque : si X=YxZ ; alors
82
100
8200 104 8 , 78
104 100
260
205
00
01
01
02
00
01
01
02
=

=
=
|

\
|
=
I I
I I Et
( )
( ) ( )
100
0
1
0
1
0
1
Z I Y I
X I

=
187
II) Indices synthtiques
Soit X une grandeur complexe, compose
de k variables simples :
X
1
, X
2
, , X
k
.
Notons
Lindice lmentaire de la variable X
j
la
date t, base 100 la date 0
( ) 100
0
0
=
j
j
t
j
t
x
x
X I
188
(1) Dfinition : Lindice synthtique
t/0 ,
est un
nombre qui rsume la srie des k indices
simple (I
1
t/0
,I
2
t/0
,, I
k
t/0
).
Exemple : I.G.P. (Produits alimentaires,
Produits non alimentaires)
189
(2) Diffrentes formules dindices synthtiques
a) Indice de laspeyres :
t/0
est la moyenne
arithmtique des indices simples I
j
t/0
pondrs
par les coefficients (calculs lanne de
base et dsignent limportance relative de X
j
)

t/0
j
0

1
100
1
0
1 0
0
1
0 / 0
=
= =


=
= =
k
j
j
k
j
j
j
t j
k
j
j
t
j
o
x
x
I


190
b) Indice de Paasche :P PP P
t/0
est la moyenne
harmonique des indices simples I
j
t/0
pondrs
par les coefficients (calculs la date
courante t )
P PP P
t/0
j
t


= =
= =
k
j
j
t
j
j
t
k
j
j
t
j
t
x
x
I
1
0
1 0 /
100 1

191
c) Indice de Fisher :
t/0
est la moyenne
gomtrique de laspeyres et de paasche :

t/0
=
t/0
x P PP P
t/0
Souvent, on a
P PP P
t/0

t/0

t/0
192
D.TOUIJAR 02/10/2013
33
(3) Proprits des indices synthtiques
a) La circularit nest vrifie par aucun des trois
indices.
b) Lindice de Fisher est le seul pouvoir vrifier
la proprit de rversibilit; En effet

0/t
= (1/P PP P
t/0
)x100
2
x(1/
t/0
) x100
2
100
1
100
1 0
0
1
0
=

=
=
k
j
j
j
t
j
k
j
j
t
j
j
t
x
x x
x

193

t/0
x P
t/0

t/0

t/0
x
0/t
= 100
2
2 2
100
1
100
1
= =

194
(4)Les indices utiliss dans la pratiques
a)Indice des Prix :
i) L indice de laspeyres des Prix
Soient respectivement le prix et la
quantit de larticle j consomm lanne
de base 0. et soient ceux de
lanne courante t. Alors lindice de
laspeyres des prix, not
t/0
(p), est :

t/0
(p) =
j j
q p
0 0
et
j
t
j
t
q p et

=
=
=
k
j
j j
j j k
j
j
j
j
t j
q p
q p
o
p
p
1
0 0
0 0
1
0
0
0
; 100
195
Do :

t/0
(p) =
Remarque
le produit nest autre que la valeur
de larticle j consomm lanne de base
0.
100
1
0 0
1
0

=
=
k
j
j j
k
j
j j
t
q p
q p
j j
q p
0 0
196

t/0
(p) est donc la moyenne arithmtique
des indices des prix des k articles
pondrs par leur valeur globale la date
0. Il dcrit lvolution du prix dun panier
de consommation dont les quantits sont
choisies lanne de base.
ii) L indice de Paasche des Prix
Cest la moyenne harmonique des indices
des prix des k articles pondrs par leur
valeur globale (
t
j
) la date courante t.
197
P PP P
t/0
(p) =
Do P PP P
t/0
Il dcrit lvolution du prix dun panier de
consommation dont les quantits sont
choisies lanne courante

= =
=
k
j
j
t
j
t
j
t
j
t j
t
k
j
j
t
j
j
t
q p
q p
o
p
p
1 1
0
;
100

100 ) (
1
0
1
=

=
=
k
j
j j
t
k
j
j
t
j
t
p q
p q
p
198
D.TOUIJAR 02/10/2013
34
b) Indice des Quantits :
i) L indice de laspeyres des Quantits
Cette fois les prix sont constants et les
quantits sont variables :

t/0
(q) =
100 100
1
0 0
1
0
1
0
0
=

=
=
=
k
j
j j
k
j
j
t
j
k
j
j
j
t
j
q p
q p
q
q

199
ii) L indice de paasche des Quantits
P PP P
t/0
(q) =
c) Indice de Dpenses (ou valeurs)
D DD D
t/0
=
100
100
1
0
1
1
0
=

=
=
=
k
j
j
t
j
k
j
j
t
j
t
k
j
j
t
j
j
t
p q
p q
q
q

100
1
0 0
1

=
=
k
j
j j
k
j
j
t
j
t
q p
q p
Dpenses Totales ladate t
Dpenses Totales la date 0
=
200
Posons d = p x q ; alors :

t/0
(d) =P PP P
t/0
(d) = D DD D
t/0
On a aussi
D DD D
t/0
= =
Et on a encore :
D DD D
t/0
=

t/0
(p) x P PP P
t/0
(q)
100

t/0
(q) x P PP P
t/0
(p)
100

t/0
(p) x
t/0
(q)
100
201
Exercice1: Le C.A. de la filire boulangerie ptisserie
dune grande surface a t multipli par 1,5 entre
1999 et 2001 et se rpartissait ainsi
Les indices des prix(base100 en 98) ont suivi
lvolution suivante
Anne 1999 2001
Pain 50% 25%
Ptisserie 30% 40%
Gteaux 20% 35%
Anne 1999 2001
Pain 100,8 104,7
Ptisserie 100,8 103,9
Gteaux 100,9 107,7
202
Questions:
1- Calculer P P P P (p) base 100 en 1999.
2- Calculer lindice du chiffre daffaire en01/99
3- En dduire un indice de quantit 01/99.
Rponse
1. Calculons dabord les indices
simples base 100 en 99; Circularit
100
100
98
99
98
01
99
01
98
99
99
01
98
01
=

=
j
j j
j
I
I
I
I I
I
j
j
203
Anne
Pain 103,9 25 0,25 0,002
Ptisserie 103,1 40 0,40 0,004
Gteaux 106,7 35 0,35 0,003
Total ---- 100 1 0,009
j
t

j
I
99
01
j
I
j
t
99 / 01

=
|

\
|
=
=
j
j
j
t
k
j
j
j
t
C
C
o
I
p
01
01
1 99 / 01
99 / 01
;
1
) (

P PP P
j
C
01
204
D.TOUIJAR 02/10/2013
35
Do
2- lindice du chiffre daffaire en 01/99 :
V VV V
01 01 01 01/ // /99 99 99 99
= 150 (par nonc).
3- indice de quantit ; on a :

t/0
(q)=
1 , 111
009 , 0
1
) (
99 / 01
= = p P PP P
( )
135 100
1 111
150
100
99 01
99 01
=
=
,
p
/
/
P PP P
V VV V
205