Vous êtes sur la page 1sur 35

D.

TOUIJAR 02/10/2013

Anne Universitaire 2013-14


Sections A &B
Attention !
Semestre S1 Enseignant : Driss TOUIJAR

Filire : Sciences Economiques et Gestion


N essayez pas de comprendre le cours en lisant
Module : Mthodes Quantitatives I tout (e) seul(e) Ce document.
Par contre, je vous recommande vivement dassister
Elment : toutes les sances en esprant mieux cerner le
STATISTIQUE I programme de statistique I

la Statistique et Les Statistiques


Le mot statistique dsigne la fois un ensemble de
donnes d'observations et l'activit qui consiste dans
leur recueil, leur traitement et leur interprtation.
INTRODUCTION D'une faon plus prcise :
GENERALE  On dsigne par Les statistiques, un ensemble de
donnes ou d'informations relatives un
phnomne ou un processus donn;
exemple : la population marocaine en 2012, les
naissances au Maroc en 2010, lvolution des
entreprises, des emplois

3 4

 Par contre La statistique est en gnral, un


ensemble de mthodes scientifiques qui servent
dcrire et analyser des donnes. Elles nous Elle a pour objet de prsenter les donnes sous
permettent aussi de tirer des conclusions et de forme de tableaux et de graphiques et de les rsumer
prendre des dcisions et aussi de faire des en quelques valeurs numriques appele
prvisions.
caractristiques.
 En ce qui concerne ce semestre, on se
contentera dtudier la mthode descriptive : c'est
une mthode qui vise dcrire des ensembles
nombreux ; do lappellation:

statistique descriptive. 5 6

1
D.TOUIJAR 02/10/2013

Domaines dapplication PROGRAMME DU SEMESTRE

 Actuellement, la Statistique est considre


comme lun des meilleurs outils de la recherche
PARTIE 1 : SERIES SIMPLES
scientifique. En effet, on fait appel aux mthodes Chapitre 1 : Tableaux statistiques et
statistiques dans presque tous les secteurs de reprsentations graphiques
lactivit humaine :
 Agronomie, astronomie, balistique, biologie, Chapitre 2 : Les paramtres de tendance centrale
dmographie, conomie, pidmiologie,
gestion, mdecine, mtorologie, physique, Chapitre 3 : Les paramtres de dispersion et de
Concentration
psychologie, sciences politiques ... ,etc.
7 8

PROGRAMME DU SEMESTRE BIBLIOGRAPHIE

statistique descriptive B. Py Stat 29


PARTIE 2 : LES SERIES DOUBLES
Introduction la J.P Blisle ;J.
Ajustement linaire et Corrlation. Stat 20
statistique Desrosiers

statistique descriptive B. Grais Stat 69


Hamid El
PARTIE 3 : LES INDICES statistique descriptive
Farouki
Stat 59
Les Indices lmentaires et synthtiques
Benhmida
statistique descriptive -
9
et Touijar10

I) DEFINITIONS :
Dfinition 1: La population est un
PARTIE 1
ensemble d'objets ou de personnes
SERIES SIMPLES
sur lesquelles porte une tude.

Exemples de populations :
CHAPITRE 1 : -La population du Maroc la date du
Tableaux statistiques et reprsentations recensement de 2004.
graphiques -Lensemble des socits SARL Fs en
2013.
12

2
D.TOUIJAR 02/10/2013

Dfinition 3 : La taille dune population est le nombre


Dfinition 2 : Les lments qui dindividus qui la composent.
composent une population sont Dfinition 4 : Un caractre est un critre relatif auquel
on observe les individus dune population.
appels des Individus (ou units
Statistiques). Un sous-ensemble dune A chaque individu, on attribut un ou plusieurs
population est appel chantillon. caractres qui peuvent tre soit quantitatifs (s'ils sont
mesurables; exemple : salaire, nb denfants par
mnage...) ou qualitatifs (sinon; exemple : sexe, tat
matrimonial ).

Une valeur que peut prendre un caractre s'appelle


modalit.

13 14

Un caractre qualitatif peut tre soit : Les variables statistiques discrtes (notes: v.s.d.) :
se sont des variables dont l'ensemble des
Ordinal : si ses modalits peuvent tre
modalits est un ensemble discret (la variable ne
naturellement ordonnes exemple : satisfaction
peut prendre que des valeurs isoles d'un
plus ou moins grande aprs lachat dun produit. intervalle).
Nominal : si ses modalits ne peuvent tre Exemple : Pour le nombre d'enfants par
naturellement ordonnes exemple : tat mnage lensemble des modalits peut tre
matrimoniale. {0, 1, 2, 3, 4}.
Les variables statistiques continues (v.s.c.) : dans
On appelle variable statistique, un caractre ce cas, l'ensemble des modalits est continue; la
quantitatif.
variable peut prendre toutes les valeurs d'un
intervalle.
On distingue deux sortes de variables statistiques:
Exemple : Salaire, ge, taille, poids etc.
15 16

Tableau Rcapitulatif Exemple : On observe, au cours dune semaine, 20


Caractre
machines selon le nombre de pices dfectueuses
produites :
quantitatif qualitatif
8, 16, 9, 33, 14, 5, 3, 7, 10, 7, 9, 9, 3, 8, 3, 3, 5,
14, 8, 7.

On lappelle srie brutes.


L'effectif total de la population est donc
n =20.
17 18

3
D.TOUIJAR 02/10/2013

En classant ces nombres par ordre croissant, on la modalit 3 a pour effectif n1 =4


obtient la srie ordonne : la modalit 5 a pour effectif n2 =2
3, 3, 3, 3, 5, 5, 7, 7, 7, 8, 8, 8, 9, 9, 9, 10, 14, la modalit 7 a pour effectif n3 =3
14,16, 33. la modalit 8 a pour effectif n4 =3
la modalit 9 a pour effectif n5 =3
On obtient les K modalits aprs regroupement des la modalit 10 a pour effectif n6 =1
observations : la modalit 14 a pour effectif n7 =2
la modalit 16 a pour effectif n8 =1
3, 5, 7, 8, 9, 10, 14, 16, 33  (k=9) < (n=20) la modalit 33 a pour effectif n9 =1

Remarque : 4+2+3+3+3+1+2+1+1=20
19 20

Dfinition : L'effectif ni d'une modalit xi est le Dfinition : On appelle frquence de la modalit


nombre d'individus ayant cette modalit. L'effectif
xi , la proportion des individus prsentant cette
total (ou taille) d'une population, not n , est le
nombre d'individus qui composent cette population. modalit. On crit : f = ni ; i = 1, , k
i
n
On a donc : Remarque :
k
fi = 1
k i =1

ni = n En %:
i =1 k
f i % = f i 100 f i % = 100
i =1
21 22

Exemple : Remarque :
n1 4 n En terme de frquence, la distribution de X , scrit
f1 = = = 0,20 et f 6 = 6 = 0,05 aussi :
n 20 n
Commentaire : La proportion des machines ayant
{(x1, f1 ), (x2 , f2 ),, (xk , fk )}
produit 3 pices dfectueuses est de 20%; et celle
des machines ayant produit 10 pices dfectueuses Exemple : La distribution des dfectuosits des 20
est de 5%. machines est : {(03 ; 4), (5 ; 2), (7 ; 3),
Dfinition : On appelle distribution d'un (8 ; 3), (9 ; 3), (10 ; 1), (14 ; 2), (16 ; 1), (33 ; 1)}
caractre X , l'ensemble de couples
{(x1, n1 ), (x2 , n2 ),, (xk , nk )} {(3 ; 0,20), (5 ; 0,10), (7 ; 0,15), (8 ; 0,15)}
Ou
23 24

4
D.TOUIJAR 02/10/2013

Pour une meilleure exploitation de la distribution, on a intrt Cette matrice (srie selon plusieurs variables) peut tre reprsente
la reprsenter par un tableau statistique . comme suit :
Date de naissance
Nombre
Prnom Nom Jour Mois Anne d'enfants Revenu Ville Opinion
1 Aline Michalco 23 1 1953 4 30000 Paris Mauvaise
II) TABLEAUX STATISTIQUES 2 Mathilde Crepineau 13 10 1953 0 60000 Montpellier Trs bonne
3 Bndicte Avelin 9 3 1953 1 9000 Rouen Mauvaise

Exemple Introductif : Supposons que l'on 4


5
Henriette
Danielle
Tufte
Cron
3
16
2
4
1953
1953
1
2
15000
40000
Paris
Marseille
Mauvaise
Moyenne
ait fait une enqute auprs de 20 femmes selon 6 Ludivine Laposte 15 5 1953 2 40000 Marseille Moyenne

9 caractres : Prnom, nom, jour de naissance, 7 Agns Roche 2 5 1953 2 10000 Nice Bonne

mois de naissance, annes de naissance, 8


9
Rita
Andre
Mena
Lamiral
5
22
5
6
1953
1953
3
3
45000
80000
Paris
Nancy
Moyenne
Passable
nombre d'enfants, revenu annuel du mnage, 10 Pauline Zatti 20 7 1953 4 50000 Nice Moyenne
ville natale, opinion sur la qualit d'un produit 11 Zo Foret 9 9 1953 2 60000 Nice Passable

alimentaire pour bb. 12 Lola Marseille 7 7 1953 3 55000 Marseille Bonne


13 Priscilla Lounad 3 2 1953 3 85000 Montpellier Bonne
Ces donnes ont t reportes sur un 14 Violaine Turk 16 4 1953 5 60000 Nice Moyenne
bordereau, sous forme d'une matrice de 20 15 Christine Dodue 15 5 1953 2 40000 Rouen Bonne

lments qui comprennent chacun les 9 16 Fabiola Couic 2 5 1953 1 10000 Nancy Passable

donnes concernant une femme. 17


18
Noelle
Rachel
Gant
Nol
5
22
11
2
1953
1953
3
3
120000
80000
Nice
Paris
Mauvaise
Moyenne
19 Sabine Eboum 20 10 1953 4 18000 Paris Trs bonne
25 26
20 Jeanne Rivire 9 12 1953 5 90000 Marseille Passable

Dans cette 1re Partie, on ne considrera quun seul caractre Sa reprsentation par tableau est alors comme suit :
la fois.
Reprsentation de la distribution dun Modalit Effectif Frquence
caractre X par un Tableau xi ni fi
x1 n1 f1
1) Cas dun caractre qualitatif : x2 n2 f2

Soit la distribution d un caractre


xi ni fi
qualitatif X tudi sur une population de

n individus : xk nk fk

{(x1, n1 ), (x2 , n2 ),, (xk , nk )} 27


Total n=ni 1=fi
28

Exemple : On reprend les 20 femmes selon Le Tableau statistique est comme suit :
lopinion caractre ordinal : ni fi
Ma, Tb, Ma, Ma, Mo, Mo, Bo, Mo, Pa, Mo, Pa, Bo,
Bo, Mo, Bo, Pa, Ma, Mo, Tb, Pa. 4 0,2
4 0,2
Une fois classes : Ma, Ma, Ma, Ma, Pa, Pa, Pa, Pa,
Mo, Mo, Mo, Mo, Mo, Mo, Bo, Bo, Bo, Bo, Tb, Tb.
6 0,3
On a donc 5 modalits (k=5 ). 4 0,2
La distribution scrit : 2 0,1
{(Ma ; 4), (Pa ; 4), (Mo ; 6), (Bo ; 4), (Tb ; 2) } n=20 1
29 30

5
D.TOUIJAR 02/10/2013

2) Cas du caractre quantitatif : Le tableau est alors le suivant :


a) Variable Statistique Discrte (v.s.d)

Soit X le caractre qui dsigne le nombre

denfants par mnage pour les 20 femmes :


4 0 1 1 2 2 2 3 3 4
2 3 3 5 2 1 3 3 4 5

La distribution est alors :

{(0,1), (1,3), (2,5), (3,6), (4,3), (5,2) }


31 32

Question : Combien de femmes ont au moins 4

ou au plus 3 enfants ? N 4 = n1 + n2 + n3 +n4 = n j = 15


j =1
i) Effectifs et frquences cumuls :
On dit que 15 femmes ont au plus x4 =3
*) Effectifs et frquences cumuls croissants:
enfants.
Soit Ni le ime effectif cumul croissant
En divisant lgalit ci-dessus par n=20, on
associ xi obtient la frquence cumule croissante:
i 4
N i = n1 + n2 ++ni = n j F4 = f1 + f 2 + f 3 + f 4 = f j = 75%
j =1
j =1
Ni est le nombre dindividus prsentant au
On dit que 75% des femmes ont au plus
plus la modalit xi . x4 =3 enfants.
33 34

En gnral, on a : Le tableau complet est comme suit :


i
Fi = f1 + f 2 ++ f i = f j xi ni Ni Ni Fi Fi
j =1 x1 n1 n1 n Ff11 1
x2 n2 n1+ n2 n2+n3+...+nk f1 + f2 f2 + f3+...+ fk
Effectifs et frquences cumuls dcroissants:

En sommant cette fois partir du ime
xi ni n1+n2+...+ni ni+ni+1+...+nk f1+ f2+...+fi fi+ fi+1+...+ fk
effectif jusquau dernier, on obtient le ime

effectif cumul dcroissant, par exemple :
xk nk n nk 1 fk
6
N3 = n + n +n +n =
n j = 16
Total n __ __ __ __
3 4 5 6
j =3 35 36

6
D.TOUIJAR 02/10/2013

Pour notre exemple, on a :


On dit que 16 femmes ont au moins x3=2
enfants.

En divisant lgalit ci-dessus par n=20, on


obtient la frquence cumule
dcroissante:
6
F3
 = f 3 + f 4 + f 5 + f 6 = f j = 80%
j =3

On dit que 80% des mnages ont au moins


x3=2 enfants. 37 38

Interprtation : b) Variable statistique continue (v.s.c)


Il y a 19 mnages (soit 95%) qui ont Dans le cas dune v.s.c., les modalits
au moins 1 enfant. sont regroupes en classes. Soit k le
Il y a 9 mnages (soit 45%) qui ont nombre de ces classes :
au plus 2 enfants. [e0 , e1[ ; [e1 , e2[ ; ... ; [ei-1 , ei[ ; ... ; [ek-1 , ek[
   
Remarque : k i 1
1re 2me ime kme

 = f i + f i +1 ++ f k = f j f j
Fi Pour la ime classe, on note :
j =1
  j =1 ai = ei ei-1 lamplitude de cette classe.
=1
ei 1 + ei
= 1 Fi 1 xi = le centre de cette classe.
39 2 40

Exemple : on relve le revenu des 20 femmes()


N classe Les classes ni fi Revenu X Effectif ni
Il est plus commode de regrouper
1 [e0 , e1[ n1 f1 9000 1
10000 2 les revenus en classe, par exemple,
2 [e1 , e2[ n2 f2 15000 1 on choisi 4 classes de mme
18000 1
30000 1
amplitude
40000 3
i [ei-1 , ei[ ni fi 45000 1
50000 1 Classes Revenus(K) effectifs
55000 1

k [ek-1 , ek[ nk fk 60000 3 [0 ; 35[ 6


80000 2

Total __ n 1 85000 1 [35 ; 70[ 9


90000 1
120000 1
[70 ; 105[ 4
TOTAL 20
[105 ; 140[ ?
41 TOTAL 20 42

7
D.TOUIJAR 02/10/2013

Compltons notre tableau : Interprtation :


Il y aF2=75% des femmes touchent
Classes ni fi % Fi% Fi% au plus e2= 70 m . ([e1,e2[)
[0 ; 35[ 6 30 30 100
Il y a F3 =25% des femmes touchent
[35 ; 70[ 9 45 75 70 au moins e2= 70 m . ([e2,e3[)
[70 ; 105[ 4 20 95 25
[105 ; 140[ 1 5 100 5
Total 20 100 Au plus Au moins
43 44

III) REPRESENTATIONS GRAPHIQUES Exemple : On reprend les 20 femmes


Le graphique est une traduction visuelle de Rpartition des 20 femmes selon l'opinion

linformation quelle soit qualitative ou quantitative. 40%

0,3
1) Cas du caractre qualitatif : 30%

A) Le graphique en tuyaux dorgue 20%


0,2 0,2 0,2

est form de rectangles de mme base 0,1


10%

constante et dont les hauteurs sont


0%
proportionnelles aux effectifs (ou Ma Pa Mo Bo Tb

frquences) des modalits associes. 45 46

Exemple : On reprend les 20 femmes B) Le diagramme circulaire


Rpartition des 20 femmes selon l'opinion
Cest une reprsentation en disque.
40%
Chaque secteur est proportionnel
0,3 leffectif (ou frquence) de la modalit
30%

0,2 0,2 0,2


associe. En terme dangle, xi on associe
langle au centre i, du secteur i, vrifiant:
20%

0,1

i = c fi
10%
; i=1,...,K
0%
Ma Pa Mo Bo Tb Or
K K

02/10/2013
47
i = c f i 360 = c 1 c = 360
i =1 i =1
48

8
D.TOUIJAR 02/10/2013

Lgalit devient: Rpartition des femmes selon l'opinion


i = 360 x fi ; i=1,...,k
Ma
Ou i = 3,6 x fi % ; i=1,...,k 20%

Tb
10%
xi fi % i Bo
36 Ma

Pa
20%
Ma 20 72 72 Mo
Pa 20 72 Pa
20%
Bo

Mo 30 108 108 Tb
Mo
Bo 20 72 30%

Tb 10 36
Total 100 360 49 50

Rpartition des femmes selon l'opinion 2) Cas du caractre quantitatif :


A) Les V.S.D. On utilise deux types de
Ma
20%
graphiques selon que lon considre les
Tb
10% Ma effectifs (ou frquences) simple ou les
Bo Pa
20% Pa
20% Mo
effectifs (ou frquences) cumuls:
Mo Bo
30%
Tb i) Diagramme en btons

chaque modalit xi on associe un

51 52

Rpartition des mnages selon le


Segment de longueur proportionnelle nombre d'enfants
ni
leffectif (ou frquence). 7
6
Exemple : On reprend lexemple 5

des 20 femmes 4
3
2
1
0
-1 0 1 2 3 4 5 xi
53 54

9
D.TOUIJAR 02/10/2013

Remarques :
ii) Courbe Cumulative
Si x = xi alors F(xi ) = f1++ fi = Fi .
Dfinition : On appelle fonction de rpartition Si xi x < xi+1 alors F(x)= Fi + 0= Fi .
F( x), la fonction qui chaque valeur x de R Conclusion :
associe la proportion dindividus pour lesquels la F(x)=Fi pour tout x tel que xi x < xi+1
valeur de la variable X est infrieure ou gale x.
La reprsentation graphique de F(x) est appele
Notation : Courbe cumulative, cest une courbe

F (x ) = P( X x )
en escalier dont les paliers sont
horizontaux, puisque F(x) est constante sur
55
chaque intervalle [xi , xi+1[. 56

Proprit de F: Pour notre exemple, on a :

La fonction F est dfinie sur R et valeurs dans xi ni fi % Fi%


[0 , 1]. 0 1 5 5
F(x) = 0 si x < x1
1 3 15 20
F(x) = 1 si x xk
2 5 25 45
F(-) = 0 et F(+) = 1
3 6 30 75
F est constante sur chaque intervalle sparant deux
modalits conscutives . 4 3 15 90
Remarque : On obtient la courbe cumulative des 5 2 10 100
effectifs en remplaant les Fi par les Ni . 57
02/10/2013 Total 20 100 Au plus 58

Exemple : On reprend les 20 femmes


B) Les V.S.C. On a souvent recourt trois types

F(x) Courbe Cumulative dans le cas de graphiques :


d'une v.s.d
100
90
i) Histogramme

75
chaque classe, on associe un rectangle
dont la base est gale lamplitude de la
45
classe et dont la hauteur est de telle sorte
que sa surface (Si = b i x hi) soit
20 proportionnelle la frquence de la
5 classe. La juxtaposition de tous ces
0
x
0

0 1 2 3 4 5 59 rectangles forment un histogramme. 60

10
D.TOUIJAR 02/10/2013

La procdure suivre : Exemple : On reprend les 20 femmes


Toutes les classes ont mme amplitude Toutes les classes ont mme amplitude
(ai = cte = a ; i=1,...,k) alors hi=fi (ou ni). donc pas besoin de corriger les frquences
Au moins une classe a une amplitude
diffrente des autres : dans ce cas on Classes ai fi
choisi une amplitude de rfrence ar (par [0 ; 35[ 35 0,30
exemple la plus petite ou la plus rpandu)
Par suite, on corrige la frquence des [35 ; 70[ 35 0,45
classes diffrentes en la divisant par [70 ; 105[ 35 0,20
lamplitude associe
et en multipliant [105 ; 140[ 35 0,05
fi
par ar : hi = f i = ar Total ar=35 1
ai 61 62

Rpartition des femmes selon le Exemple : Si On regroupe les 2 dernires


1 f i
classes
revenu en 1000
0,9

0,8
Classes fi ai li fi
0,7
[0 ; 35[ 0,30 35 1 0,30
0,6

0,5 [35 ; 70[ 0,45 35 1 0,45


0,4

0,3
[70 ; 140[ 0,25 70 2 0,13
0,2 Total 1 ar=35 --- --
0,1

0 Rem : fi sappelle densit de frquence


35 70 105 140 63 X
(sans pourcentage) 64

fi Rpartition des femmes selon le ii) Polygone de frquences


1
0,95 revenu en 1000
0,9 On subdivise lhistogramme en sous
0,85
0,8
rectangles de mme base gale lamplitude
0,75 de rfrence ar. ar tant choisie comme la
0,7
0,65
plus petite des amplitudes et vrifiant :
0,6
0,55
0,5
ai = kar ; k = 1,2,3,4,...
0,45
0,4
0,35 Aprs avoir ajouter aux extrmits de
0,3
0,25 lhistogramme deux rectangles fictifs de hauteur
0,2 nulle et de base ar ,on joint, par des segments
0,15
0,13
0,1
de droites, les milieux des sommets des sous
0,05 rectangles ainsi obtenus.
0
35 70 105 140 X
65 66

11
D.TOUIJAR 02/10/2013

f'i
Rpartition des femmes selon ii) Courbe Cumulative
0,5
le revenu en 1000
0,45

0,4 On construit la courbe de la frquence


0,35 cumule en joignant les points (ei , Fi ), o
0,3
ei est la borne suprieure de la ime classe
0,25
[ei-1 , ei[ et Fi est la frquence cumule de
0,2
cette mme classe. On note

Fi = P( X ei )
0,15

0,1

0,05

0
-35 0 35 70 105 140 67 X 68
175

Exemple : On reprend les 20 femmes


F(x) Rpartition des femmes selon le
revenu en 1000
100

90
Classes fi % Fi% 80

[0 ; 35[ 30 30 70

60

[35 ; 70[ 45 75 50

40

[70 ; 140[ 25 100 30 Mdiane


graphiquement
20
52
Total 1 Au plus 10

0
69 00 35 70 105 140 X70

Ici, il sagit de faire une synthse de


Chapitre II linformation, contenue dans la srie brute, par
le chiffre; et ce en calculant des paramtres dits
de tendance centrale, qui caractrisent lordre
de grandeur des observations.
Les caractristiques de Dans ce chapitre, on analysera trois de ces
Tendance centrale paramtres qui sont :
les moyennes, le mode et la mdiane.

71 72

12
D.TOUIJAR 02/10/2013

I) LES MOYENNES O, n est la taille de la population, et les


xi sont les modalits dans le cas d'une
(1) La moyenne arithmtique v.s.d. et les centres des classes dans le cas
d'une v.s.c.
(a) Dfinition : La moyenne arithmtique, note x
, dune variable statistique X de distribution
{ (xi , ni )1ik }
est la quantit :
Exemple 1 : On reprend lexemple des
k k 20 femmes selon le nb denfants
1
x =
n
ni xi = f i xi
i =1 i =1
73 74

1 6 53
xi ni ni xi fi fi xi x=
n i =1
ni x i =
20
= 2,65
0 1 0 0,05 0 6
1 3 03 0,15 0,15 ou x = f i xi = 2,65
i =1
2 5 10 0,25 0,50
Exemple 2 : Pour les revenus des femmes
3 6 18 0,30 0,90
4 3 12 0,15 0,60
1 3 3
5 2 10 0,10 0,50 x = ni xi = f i xi = 55125
Total 20 53 1 2,65 n i =1 i =1
75 76

Classes fi xi fi xi (b) Changement dorigine et dchelle

[0 ; 35 [ 0,30 17,5 5,25 Proprit : Soit X une variable statistique


de moyenne arithmtique x . Si Y est une
[35 ; 70 [ 0,45 52,5 23,625 variable statistique telle que Y=aX+b, o a
[70 ; 140 [ 0,25 105 26,25 et b sont des rels quelconques, alors la
moyenne arithmtique de Y est :
Total 1 55,125
y = ax + b
77 78

13
D.TOUIJAR 02/10/2013

Dmonstration : (c) Proprits algbriques de la moyenne


k k
arithmtique
y = f i yi = f i (axi + b ) i) la moyenne des carts la moyenne
i =1 i =1 arithmtique est nulle :
k
f i (x i x ) = 0
k k
= a f i xi + b f i = ax + b
i =1
i =1 i =1
  
x 1 ii) La moyenne des carrs des carts
une constante a est minimale pour a = x
k k
min f i ( x i a )2 = f i ( x i x )2
79 aR i =1 i =1
80

Dmonstration :
k k (d) Proprit de lagrgation
(x i a) = ( x ) + (x a )
2
x
2
f i f i i
i =1 i =1
k k Soit une population P de taille n, compose
= (x i x ) + (x a)
2 2
f f
i =1
i
i =1
i
de m sous populations P1, P2, . . . , Pm ; de
k
tailles respectives n1, n2, . . .nm et de
+ 2 f i (x i x )( x a)
i =1 moyennes respectives x 1 , x 2 ,.... x m . Alors
k k

(x i ) + (x a ) la moyenne arithmtique x de la population


2 2
= f i x fi
i =1 i =1

=1
P est donne par :
m
+ 2 (x a ) f i (x i x )
k
1
i =1
    
=0
x=
n i =1
ni x i
k

(x i ) + (x a )
2 2
= f i x
81 82
i =1

Exemple :  Soit x Le salaire moyen global dans E, x1


Le salaire moyen des cadres dans celui des hommes et x2 celui des femmes.
lentreprise E est de 4000 DH. On a :
x = f1 x1 + f 2 x2
 Le salaire moyen des cadres masculins
est de 4200 DH.  On aboutit alors au systme :

 Le salaire moyen des cadres fminins f1 + f 2 = 1 f + f2 = 1


est de 3000 DH. 1
f1 x1 + f 2 x2 = x 4200 f1 + 3000 f 2 = 4000

1. Quelle est la rpartition hommes -


femmes des cadres ? 83
f1 = 83,3% et f 2 =16,7% 84

14
D.TOUIJAR 02/10/2013

Cest plus pratique dutiliser le logarithme


I) LES MOYENNES
(2) La moyenne gomtrique

[ ]
1
L og (G ) = L og x1n1 x 2 n2 x k n k n

(a) Dfinition : On appelle moyenne gomtrique


1
([
= L og x1n1 x 2 n2 x k n k
n
])
de la distribution {(xi , ni )1ik } que lon
note G, la racine nme du produit des xi ni
1 k
[ ]
= L og x i ni
n


i =1

(x ) = ( )
k 1 k
G= n
i
ni n
x x2 xk
1
n1 n2 nk = L og xi ni
n i =1
i=1 k
1 k k
o n = ni
85
= ni L og (xi ) =
n i =1
f i L og ( xi )
86
i=1 i =1

Exemple :calculons la moyenne gomtrique de


Domaines dapplication :
2 , 12 , 2 , 50 : G = 4 22 1250 = 6,999
Dune autre faon, calculons Log(G) : On utilise la moyenne
4
gomtrique dans le calcul du
1 4
Log (G )= f i Log (xi )= ni Log ( xi ) taux daccroissement moyen et
i=1 4 i=1 dans le calcul de certains indices
statistique.
= [2 Log 2 + Log12 + Log 50]
1
4
=1,946
D'o G = e1,946 = 7 87 88

I) LES MOYENNES Exemple :calculons la moyenne


(3) La moyenne harmonique harmonique de 2 , 12 , 2 , 50 :

4
Dfinition et proprit : La moyenne
Dfinition H= = 3,625
1 1 1
harmonique , note H, dune distribution 2 + +
2 12 50
{(xi , ni )1ik }est linverse de la moyenne

arithmtique de la distribution : 1 , ni
n 1 xi 1ik
H = k
= k k
1 fi
ni xi
xi
o n = ni
i =1 i =1
89 90
i=1

15
D.TOUIJAR 02/10/2013

I) LES MOYENNES
Domaines dapplication :
(4) La moyenne quadratique
On utilise cette moyenne dans le
calcul des dures moyennes, dans Dfinition et proprit : La moyenne
le calcul des moyennes de rapports quadratique, note Q , dune distribution
et de pourcentages et dans les
{ }
(xi , ni )1ik est la racine carre de la moyenne
{( ) }
tudes du pouvoir dachat (inverse
du MGP)...etc. arithmtique de la distribution xi2 , ni 1 i k
1 k k
Q= ni xi = f x
2 2
i i
91 n i=1 i =1 92

Exemple :calculons la moyenne


Domaines dapplication :
quadratique de 2 , 12 , 2 , 50 :

La moyenne quadratique intervient
dans le calcul de certains Q=
1
(2 4 +144 + 2500 ) = 25,749
paramtres de dispersion. 4

93 94

(5) Rsultat comparatif


(6) Conclusion :
Pour une mme srie Un inconvnient de la moyenne arithmtique
statistique, on montre que les est quelle est trs sensible aux valeurs
quatre moyennes vrifient extrmes de la srie.
toujours lordre suivant : La moyenne gomtrique est peu sensible
ces dernires.
En ce qui concerne la moyenne
H <G< x<Q harmonique, elle est plus sensible aux plus
petites valeurs de la srie quaux plus grandes.
95 96

16
D.TOUIJAR 02/10/2013

(2) Dtermination du mode


II) LE MODE
(a) Cas d'une v.s.d.
Dans le cas d'une v.s.d. la dtermination
du mode est immdiate partir du
tableau statistique ou du diagramme en
(1) Dfinition : Le mode, not Mo , dune srie btons.
statistique est la valeur de cette srie, dont leffectif Exemples :
(ou la frquence) est plus grand que les effectifs (ou i) Ci-dessous on donne trois diagrammes
les frquences) des valeurs voisines. en btons associs respectivement, une
distribution unimodale (qui a un seul
mode ), et une distribution bimodale
Cest le plus simple mais le moins utilis ! (qui a deux modes ), et une distribution
qui a un intervalle modal.
97 98

Distribution unimodale
Exemple 1 : On reprend lexemple des 20
femmes selon le nb denfants

xi ni fi
0 1 0,05
Distribution bimodale Mo
1 3 0,15
M intervalle modale
2 5 0,25 M o = 3 enfts
3 6 0,30
4 3 0,15
5 2 0,10
Mo2 Mo1
99 Total 20 1 100

(b) Cas dune v.s.c. o [ei 1 , ei [: est la classe modale


Le mode se trouve dans la classe hi = f i: est la frquence corrige de la classe
modale, c'est la classe qui correspond
la plus grande frquence corrige. modale (c' est la plus leve des frquences)
ai : est l' amplitude de la classe modale
On peut dmontrer que lexpression Exemple : On reprend les 20 femmes
algbrique du mode est comme suit : h2 h1
M 0 = e1 + a2
2h2 (h1 + h3 )
hi hi 1
M 0 = ei 1 + ai 0,45 0,3
2hi ( hi 1 + hi +1 ) = 35 + 35
0,90 (0,3 + 0,13)
101 = 46,17 m 102

17
D.TOUIJAR 02/10/2013

Exemple :

III) LA MEDIANE

Classes fi fi (1) Dfinition : La Mdiane, note M, dune


srie statistique, est la valeur de la srie qui
[0 ; 35[ 0,30 0,30 partage la population en deux parties deffectifs
[35 ; 70[ 0,45 0,45 gaux. Par consquent, on aura autant
dobservations infrieures M que
[70 ; 140[ 0,25 0,13 Classe
modale
dobservations suprieures M.
Total 1 -- 103 104

(2) Dtermination de la mdiane (b) Cas dune distribution


(a) Cas dune srie brute i) Cas d1 VSD
Soit X une v.s.d. de distribution {( x i , f i )1i k }
Soit la srie ordonne (par ordre croissant) de n
Pour dterminer sa mdiane, on utilise
les frquences cumules croissantes Fi.
observations : x1 , x2 , ..., xn .
 Si n est impaire, alors la valeur mdiane est lobservation - Procdure suivre
qui occupe le rang (n+1)/2 .
 Si i Fi 0,5 ; autrement dit, si aucune
 Si n est paire, on ne peut plus dterminer exactement la frquence cumule Fi nest gale 0,5 ,
mdiane, mais on a un intervalle mdian
dans ce cas la mdiane est la modalit xi
[x n/ 2 ; x(n / 2 )+1 ] qui correspond la plus petite frquence
105
cumule dpassant strictement 0,5.
106

 S'il existe une modalit xi pour laquelle ii) Cas dune v.s.c.
Fi = 0,5, dans ce cas on parle dun intervalle Dans le cas continue, la mdiane est
mdian : [xi , xi+1].
toujours unique : cest la valeur qui
partage exactement la population en
Exemple 1 : On xi fi % Fi % deux parties gales. En d'autres termes,
reprend lexemple 0 5 5 M est la solution de lquation :
des 20 femmes 1 15 20
selon le nb F(M) =0,5
denfants 2 25 45
o F est la fonction de rpartition de X.
3 30 75
F3 =0,45< 0,5< F4 4 15 90
On a deux mthodes pour dterminer la
5 10 100
Do M=3 enfts mdiane :
Total 100 Au plus
107 108

18
D.TOUIJAR 02/10/2013

) Dtermination graphique : -La mdiane


(
correspond labscisse du point de la courbe 0,5 Fi 1
cumulative qui admet pour ordonne la valeur 0,5 M = ei 1 + ai
(ou 50%). (Voir Graphique de lexemple) fi
) Dtermination par interpolation : -D'aprs le
( o
tableau ou la courbe cumulative, on dtermine la
classe contenant la mdiane M ; cest la classe [ei 1 , ei [: est la classe mdiane
[ ei-1, ei [ telle que, Fi-1 0,5 < Fi ; puis on a : tant son amplitude
dtermine M par interpolation linaire. donc on a : i
1 f i : est sa frquence
Fi-1 2 0,5 Fi Fi 1 : est la frquence cumule de
ei-1 ei
4 M
3 109 la classe prcdente 110

0,5 F1
Exemple:
M = e1 + a2 F(x) Rpartition des femmes selon le
revenu en 1000
f2 100

Classes fi % Fi% 90

M = 35 + 80

[0 ; 35[ 30 30 70

50 30 60
[35 ; 70[ 45 75 35 50

[70 ; 140[ 25 100 45 40

30 Mdiane

Total 1 Au plus = 50,56 m 20


graphiquement
52
10

0
111 00 35 70 105 140 X112

Conclusion Gnrale
IV) POSITIONS RELATIVES DES 3
Population htrogne : La moyenne arithmtique
est prfrable la mdiane et au mode. PARAMTRES MO , M et x
Prsence des valeurs aberrantes (ou extrmes) : La f distribution symtrique unimodale : les 3
paramtres coincident au point de symtrie
mdiane est prfrable.
Rsultats dun concours: la note mdiane est la plus
significative.
Dmographie : Lesprance de vie est conseille
pour comparer des pays en voie de dvpt. Pour un
seul, la dure mdiane ou le mode (ge le plus
frquent la mort) sont utiliss.

113 114
Mo =M=x

19
D.TOUIJAR 02/10/2013

f
distribution unimodale dissymtrique distribution unimodale dissymtrique tale
tale droite :Mo < M < x gauche : x< M < Mo

Mo M x
x
115
x M Mo 116

Remarque : Pour des distributions


peu dissymtriques, on a la relation Chapitre III
suivante :
Les caractristiques
de
x M 0 3( x M ) Dispersion
et de
117
Concentration 118

Introduction I)- Les carts simples


Les paramtres de dispersion servent 1)Ltendue:
mesurer la dispersion des observations
autour d'une tendance centrale. Dfinition: Ltendue, not e, est la
On considre deux catgories de diffrence entre la plus grande et la plus
paramtres de dispersion : petite observation.
1- Les carts simples : Cas dune v.s.d
 tendue- cart interquantile. e = xmax xmin
2-L'cart-type, la variance et le coefficient
de variation. Exemple : e = x6 x1 = 5-0 = 5 enfts
119 120

20
D.TOUIJAR 02/10/2013

Cas dune v.s.c Dfinition: Soit un nombre rel compris entre


0 et 1. On dit quune valeur x du caractre X est un
e = ek e0 quantile d'ordre , si :
F( x ) =P(X x ) =
Exemple: e = e3 e0 =140-0= 140 m.
(1-)
Limites :il est trs sensible aux fluctuation
d chantillonnages. e0 x ek
2)Ecart interquantile: Dsormais, On  On cite quatre types de quantiles :
ne sintressera quaux V.S.C.  quartiles
 quintiles
a)Les quantiles: Gnralisation de la  dciles
mdiane.  centiles
121 122

1)QUARTILES: Soient Q 1, Q 2 et Q 3 les trois


Valeurs de Nom de x quartiles. Par dfinition :
Q 1 = x1/4 , P(X < Q 1 ) = 1/4= 25%
i /4 ; i {1, 2, 3} i me quartile Q 2 = x1/2 , P(X < Q 2 ) = 2/4= 50%
Q 3= x3/4 , P(X < Q 3 ) = 3/4= 75%
i /5 ; i {1, 2,,4} i me quintile Donc Q 1, Q 2 et Q 3 partagent la population
en quatre parties de mme effectif 25 %
i /10 ; i {1, 2 ,,9} i me dcile chacune.
25 % 25 % 25 % 25 %
i /100 ; i {1,2,,99} i me centile e0 Q1 Q2 Q3 ek
123 124

2)QUINTILES: Soient q 1, q 2, q 3 et q 4 ces 4 3) DECILES: Soient D1, D2, ,D9 ces 9 dciles. Ils
quintiles. On a : partagent la population en dix parties
q 1 = x1/5 , P(X < q 1 ) = 1/5= 20%
deffectif =10 % chacune.

q 2 = x2/5 , P(X < q 2 ) = 2/5= 40% 10 % 80 % 10 %


q 3= x3/5 , P(X < q 3 ) = 60%
e0 D1 D2 D3 ... D9 ek
q 4= x4/5 , P(X < q 4 ) = 80%
Donc q 1, q 2, q 3 et q 4 partagent la population Par exemple : P(X < D5 ) = 1/2= 50% ; do
en cinq parties deffectif =20 % chacune. D5 est la mdiane :
20 % 20 % 20 % 20 % 20 %
D5=Q 2=M
e0 q1 q2 q3 q4 ek
125 126

21
D.TOUIJAR 02/10/2013

La dtermination des quantiles: Exemple : On reprend les 20 femmes


i) Dtermination Graphique : elle est
pratiquement la mme que celle de la
mdiane, il suffit de remplacer 0,5 par . Classes fi % Fi%
ii) Dtermination par Interpolation : [0 ; 35[ 30 30
x [ei 1 ; ei [ , elle correspond la [35 ; 70[ 45 75
plus petite frquence cumule dpassant
strictement [70 ; 140[ 25 100
Fi 1
x =ei 1 + ai Total 1 Au plus
fi 127 128

Exemple : Pour les vingt femmes : Exemple : Pour les vingt femmes :
25 F0
F0<25<F 10 F0 F0<10<F1
Q1 =e0 + a1 1
D1 =e0 + a1
f1 f1
F2 75<F3 F2 90<F3
25 0 10
= 0 + 35 = 29,17 m = 0 + 35 = 11,67 m
30 30
90 F2
75 F2 D9 =e2 + a3
Q 2=M Q3 =e2 + a3 D5=M f3
f3
=50,56 m =50,56 m 90 75
= 70 + 0 = 70 m = 70 + 70 = 112 m
129
25 130

Ecart interquantile: Ce sont des paramtres de c) Les carts relatifs: Afin de comparer des
dispersion, donns par la diffrence entre le distributions diffrentes, on peut utiliser :
Q
premier et le dernier quantile : i)Ecart interquartile relatif : Q r =
M
i) Ecart interquartile: Q = Q 3 - Q 1 . ii)Ecart interdcile relatif : Dr =
D9
D1
ii) Ecart interquintile: q = q4 - q1 .
Exemple :
iii) Ecart interdcile: D = D9 - D1 . Q r =40,83/50,56 = 0,808= 80,8%
Exemple : Dr =112/11,67= 9,6
Q = 40,83 m
Les moins riches des 10% les plus riches
D = 79,33 m ont un revenu suprieure 9,6 fois le revenu
131 des plus riches des 10% les plus pauvres. 132

22
D.TOUIJAR 02/10/2013

II)- Ecart-type et variance Remarque


 La variance est aussi note x
2

 Pour une variable statistique continue les xi sont


1)La variance: les centres des classes.

Dfinition: La variance, V(X), dune 2)Lcart type:


distribution statistique {(xi, ni)1 i k }, Dfinition: Lcart type de X, not X , est
est donne par : la racine carre de la variance :
k k
1
V (X ) = ni ( xi x ) 2 = f i ( xi x ) 2 1 k k
n i =1 i =1 x = V (X ) = ni ( xi x ) 2 =
n i =1
f i ( xi x ) 2
133 i =1 134

3
Cas VSD 3
V ( X ) = f i ( xi x ) 2 = 1049,672
Sachant que x = f i x i = 55 ,125 m i =1
i =1
X = 1049,672 = 32,3986 m
Classes fi xi (xi- x)2 fi (xi- x)2
3)Formule dveloppe de la variance
[0 ; 35[ 0,30 17,5 1415,641 424,692 La variance scrit aussi comme la diffrence
entre la moyenne des carrs et le carr de la
[35 ; 70[ 0,45 52,5 6,891 3,101 moyenne :
[70 ; 140[ 0,25 105 2487,516 621,879 V ( X ) = x2 x 2
1 k k
Total 1 --- --- 1049,672 = ni xi2 ( x ) 2 = f i xi2 ( x ) 2
135 n i =1 i =1 136

Exemple :
(55,125)
81768,75
V ( X ) = x2 x 2 =
2

20
Classes ni xi ni xi ni xi2 = 4088,438 3038,766 = 1049,672
[0 ; 35 [ 6 17,5 105 1837,5 X = 1049,672 = 32,399 m
[35 ; 70 [ 9 52,5 472,5 24806,25
[70 ; 140 [ 5 105 525 55125 4) Changement de variable :

Total 20 - 1102,5 81768,75 Si Y=X+b alors V(Y)=V(X)


Si Y=aX alors V(Y)=a2 V(X)
137 138

23
D.TOUIJAR 02/10/2013

4)Variances intra et inter populations 5)Coefficient de variation


Soit une population P de taille n, compose
de 2 sous populations P1 et P2; de tailles
Dfinition Le coefficient de variation Cv dune
:

respectives n1 et n2 de moyennes variable statistique positive de moyenne x et


respectives x1 et x2 et de variances dcart-type X est le rapport :
respectives 12, 22. Alors la variance 2 de
la population P est donne par:
Cv = X
() ()
2= f112 + f2 22 + f1(x1 x)2 + f2 (x2 x)2 x
: le taux dinflation dans 2 pays est
i2 intra pop x2i inter pop respectivement {15, 25, 35} et {150, 250, 350}. On
trouve le mme taux dinflation.
O
x = f1 x1 + f 2 x2 =
1
(n1 x1 + n2 x2 )
n 139
Cv A = 8,16 25 = 0,33 = Cv B = 81,6 250 140

La notion de concentration est apparente celle de

Les paramtres dispersion, mais elle traduit le phnomne de


rpartition de la masse globale de la grandeur
tudie :salaires, chiffre daffaires, consommation dun

de produit, superficie cultivable

Ltude de la concentration ne concerne que les

Concentration : variables statistiques continues dont les modalits


sont positives et leur somme a un sens. On introduit
dans ce chapitre les paramtres de
concentration, pour apprcier la diffrence entre une
rpartition galitaire de la masse globale (une
rpartition idale) et la rpartition rellement
observe.
142

i i
Soit X une variable statistique continue. Dont Si = s j = n j x j est la masse du caractre possde
les valeurs sont positives et regroupes en k j =1 j =1
par les individus prsentant une valeur infrieure ei
classes [ e0 , e1 [, [ e1, e2 [ , , [ ek-1, ek [ (ou la masse cumule associe la classe [ei-1, ei [).
deffectifs respectifs n1, n2 , ,nk, et de centres
s i ni x i fx
respectifs x1, x2 , ,xk. On note : gi = = = i i est la masse relative de la
S S x
classe [ ei-1, ei [ (ou la proportion de la masse globale
1. si = ni xi : la masse du caractre X dans la dans [ ei-1, ei [ ).
classe [ ei-1, ei [ (ou relative xi )
Si
Gi = est la masse cumule relative associe la
k k S
classe [e ,e [ (ou la proportion de la masse globale
2. S = s i = n i xi :est la masse globale du i-1 i

i =1 i =1 possde par les individus prsentant une valeur


caractre. infrieure ei).
143 144

24
D.TOUIJAR 02/10/2013

Exemple : On considre la distribution


statistique des salaires par heure de travail
Remarques :
en DH, de 110 salaris d'une entreprise :
i) On a, 0 Gi 1 pour tout i. Gi
Salaires en DH/h ni xi si = ni xi gi= si
ii) Soit x une valeur quelconque du caractre, G(x) S
[10 , 12[ 15 11 165 0,092 0,092
est la proportion de la masse globale possde par
[12 , 15[ 35 13,5 472,5 0,264 0,356
les individus prsentant une valeur infrieure x, et [15 , 20[ 45 17,5 787,5 0,441 0,797
on a G(ei ) = Gi. [20 , 25[ 10 22,5 225 0 ,126 0,923
[25 , 30[ 5 27,5 137,5 0,077 1
Total 110 ------- S=1787,5 ------- -------
145 146

la mdiale de la srie statistique


(1) Dfinition : 0,5 Gi 1
M l = ei1 + ai
X est la valeur du caractre qui partage la gi
masse globale en deux parties gales. On la note
Lcart absolu mdiale mdiane, not M
Ml , et on a : est un indicateur de concentration
G(Ml) =0,5 =50 % . M
M =Ml - M et M r =
e
(2) Dtermination de la mdiale
La procdure de la dtermination de la Si M r = 0 alors M = M l donc on a une
mdiale est similaire celle de la mdiane distribution parfaitement galitaire
en remplaant les Fi par les G i. Plus M r est grand plus la
147 concentration est forte, et inversement. 148

Revenons notre exercice : la courbe ainsi obtenue est appele


0,356 0,5 < 0,797 donc M l [ 15, 20 [ courbe de concentration ou courbe de
Gi Lorenz.
0,5 0,356 C B
M l = 15 + 5 = 16,633 16,63 DH/h. 1
0,441 D r o ite d q u ir p ar titio n
0 ,8
M = M l - M =16,63 -15,56 =1,07 DH/h.
0 ,6 A ir e d e
III) Courbe et indice de concentration co n c e n tr atio n
0 ,4
(1) Courbe de concentration Courbe de
Dans un repre orthonorm, on trace les points 0 ,2 c o n ce n tr a tio n
de coordonnes ( Fi , Gi ) et on les joint par des
A
segments de droite. 0
149 O 0,2 0 ,4 0,6 0,8 1 Fi 150

25
D.TOUIJAR 02/10/2013

(2) Indice de concentration Analogie :


(a) Dfinition
L'indice de concentration ou indice de Distribution {(x , n ) } Distribution {(x , n x ) }
i i 1i k i i i 1i k
Gini, que l'on note IC est donn par :
k
ni si = ni xi
I C = 1 f i ( G i 1 + G i ) n S =S ni xi
i =1
fi gi
5 Fi Gi
I C = 1 f i ( G i + G i 1 )
i =1
= 1- 0,872 = 0,128 = 12,8 %
Me Ml
151
F(x) G(x) 152

Salaires fi Fi Gi = Si fi(Gi-1+Gi)
S
[10 , 12[ 0,136 0,136 0,092 0,013 PARTIE 2
[12 , 15[ 0,318 0,454 0,356
0,375 0,142
0,149
[15 , 20[ 0,410 0,864 0,797 0,473
0,481
SERIES DOUBLES
[20 , 25[ 0,091 0,955 0,923 0,157
[25 , 30[ 0,045 1 1 0,087 Ajustement linaire et Corrlation
Total 1 ____ ____ 0,887
0,872

FIN 153

I) TABLEAUX DE CONTINGENCE Y en
X en CDH
(1) Exemple introductif anne
On dsire tudier la rpartition de 50184 salaris
selon lanciennet et le salaire mensuel. 2890 1836 102 0 4828
Posons : 9044 7378 884 204 17510

X : la v .s .c . dsignant l ' anciennet en anne 5746 10404 1564 374 18088



Y : la v .s .c . dsignant le salaire mensuel (en DH ) 1666 6018 1666 408 9758
Total 19346 25636 4216 986 50184
Les donnes sont reprsentes par le tableau
Source :statistiques de la dlgation rgionale du centre
suivant : Nord : octobre 1984 en se basant sur le recensement de la
155
population et de lhabitat de 1982 : milieu urbain 156

26
D.TOUIJAR 02/10/2013

Si on ne considre que la 1re ligne Y et la dernire Cas des donnes individuelles :


ligne (Total) on obtient la rpartition des 50184 salaris Exemple introductif
selon le salaire (c..d. la distribution marginale de Y)
Soient X et Y deux variables statistiques dfinies sur une
mme population de taille n. On note par (xi , yi ) ; i =1,2,....,n
nj 19346 25636 4216 986 50184 le couple de valeurs de X et Y pour le ieme individu.

De mme si on ne considre que la 1re colonne (X)


y1 y2 yi yn
la dernire colonne (Total) on obtient la l=k=n TOTAL

X ni x1 1 0 0 0 1
rpartition des 50184 salaris selon
x2 0 1 0 0 1
lanciennet : distribution marginale 4828
de (X) 17510
xi 0 0 1 0 1
18088
La ligne (Total) et la colonne (Total) 9758 xn 0 0 0 1 1
sont appeles marges.
Total 50184
157
TOTAL 1 1 1 1 n 158

On cherche tudier la liaison pouvant


Le service des tudes conomiques de exister entre les variables X et Y . Pour ce,
la socit veut mesurer lincidence de la on reprsente dans un repre orthogonal
modulation de la pression marketing les points (xi , yi ). Lensemble de ces points
(variable X: explicative) sur la vente de sappelle nuage de points . La forme de ce
flacons de parfums ( variable Y:explique). nuage nous renseigne sur la nature de la
Il enregistre, alors, les ventes yi (en milliers liaison entre X et Y et le type de courbe
de flacons) ainsi que les dpenses qui ajustera le mieux, ce nuage. On
publicitaires xi (en milliers de DH)dans 5 sintresse au cas o cette courbe est une
zones : droite (ajustement linaire ou droite de
xi 5 6 9 12 18 rgression ).
yi 25 30 35 45 65159 160

I) Ajustement linaire Cette mthode consiste dterminer


Pour ajuster un nuage de points, on lquation dune droite telle que la somme
choisi parmi toutes les courbes connues des carrs des distances entre les points du
(exponentielle, logarithme, droite...) celle nuage et cette droite soit minimale.
qui passera le plus proche de tous les (1) Droites dajustement
points du nuage. On applique la M.M.C. pour dterminer
Dans le cas o le nuage a une forme les deux droites de rgression :
allonge, il est vident que la droite est la a) La droite de rgression de Y en X: est utilise pour
plus approprie. On parle alors d'un expliquer Y par X. Cette droite est note DY/X et a
ajustement linaire. pour quation y = a x + b.
Pour dterminer lquation de la droite O Cov( X , Y )
dajustement on utilise, trs souvent, la a= et b = y ax
mthode des moindres carrs (M.M.C.). 161 V (X ) 162

27
D.TOUIJAR 02/10/2013

O Y
70 Nuage de points: Ventes en
1 n
Cov( X , Y ) = xi yi ( x y ) et 65
60
fonction de la Pub
n i =1
50
1 n 1 n
x = xi et y = yi 45
40
n i =1 n i =1 35
30
1 n 2
V ( x) = xi x 2 ( ) 25
20
n i =1
10 5 9 X
Revenons notre exemple introductif 163
4 6 8 10 12 14 16 18
164

La forme du nuage est plus ou moins


i xi yi xi yi xi2 yi2 allonge. On peut donc estimer y partir de
1 5 25 125 25 625 x grce la droite de rgression de Y en X:
15 50
x = xi = =10 mDH
2 6 30 180 36 900
3 9 35 315 81 1225 5 i=1 5
4 12 45 540 144 2025
15 200
5 18 65 1170 324 4225 y = yi = = 40 mflacons
5 i=1 5
TOTAL 50 200 2330 610 9000

/n 10 40 466 122 1800


1 n 2 2 610
V (x) = xi x = 100= 22 ( )
165
n i =1 5 166

La droite DY/X a pour quation:

Cov ( X , Y ) = xy x y y=ax+b
1 5
1 5
1 5

= xi yi xi yi y = 
3 x + 10
5 i =1 5 i =1 5 i =1   
milliers flacons flacon / DH mDH milliers flacons
1
= 2330 10 40 = 66
5
a=3 est la pente de la droite, cela signifie
66
a= = 3 et b = 40 3 10 = 10 que 1 DH supplmentaire investi en pub
22
permet de vendre 3 flacons de plus.

167 168

28
D.TOUIJAR 02/10/2013

b) La droite de rgression de X en Y : elle est Revenons encore une fois notre exemple
utilise pour expliquer X par Y. Cette
droite a pour quation DX/Y : x =a y + b
O
1 5 2
( )
V ( y ) = y i y 2 = 1800 1600
Cov( X ,Y ) 5 i =1
a' = et b' = x a ' y 66
V (Y ) = 200 et a = = 0,33
Remarque : Gnralement, on trace les 200
deux droites DX/Y et DY/X dans un mme b = 10 0,33 40 = 3, 2
repre. Dans ce cas, l'quation de DX/Y
s'crit :
1 b DX / Y : y = 3,03 x + 9,7
y= x o a' 0.
a a 169 170

Nuage de points: Ventes en REMARQUES:


70
fonction de la Pub
65 Dx/y : y = 3,03x + 9,7
|a| < (1 / |a|); do la pente de DY/X est plus
60
petite que celle de DX/Y ; donc DY/X plus
55
y = 3x + 10 horizontale que DX/Y.
50
45
40 Plus les deux droites de rgression D et
G(x,y) D sont proches lune de lautre, cest
35
30
dire que langle entre DY/X et DX/Y est petit
25
plus la liaison linaire entre X et Y est
20
forte.
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
171 172

II) Coefficient de corrlation linaire (2) Proprits


Dans le cas dune liaison linaire entre X et Y, on (a) Le coefficient r a le mme signe que Cov(X,Y), ce
mesure le degr de cette liaison par le coefficient de qui donne le signe de la liaison :
corrlation linaire. - Si r < 0, alors la liaison linaire est ngative.
- Si r > 0, alors la liaison linaire est positive.
(1) Dfinition : Lecoefficient de corrlation - Si r = 0, alors la liaison linaire est nulle.
linaire associ X et Y, que lon note r, est (b) -1 r +1 :
i) Pus la valeur absolue de r est proche de 1 et plus
donn par : la corrlation (ou la liaison) linaire entre X et Y est
Cov ( X , Y ) Cov ( X , Y )
r= = forte.
V ( X ).V (Y ) X . Y
ii) Pus la valeur absolue de r est proche de 0 et plus
r est sans dimension la corrlation linaire entre X et Y est faible
173 174

29
D.TOUIJAR 02/10/2013

r = -1 -1 < r < 0
Valeurs de r pour interprtation: Y D
Y
D

D
0 |r| < 0,40 : faible ou quasi absence de D
corrlation X
X Une liaison linaire
Une liaison linaire relative et ngative.
0,40 | r | < 0,60 : moyenne corrlation totale et ngative.

0,60 | r | < 0,80 : bonne corrlation;

0,80 | r |
1 : corrlation leve. 175 176

r=0
r=1
D Y D
Y


D
D
0<r<1
D

X X
Indpendance totale. Y

Une liaison linaire totale et positive.
D

X
Une liaison linaire relative et
positive. 177 178

Revenons encore une fois notre exemple

cov ( X , Y ) 66
r= = = 0,99 PARTIE 3
V ( X )V (Y ) 66 ,33

Conclusion:
r est positif et sa valeur est trs proche de
1, donc il y a une trs forte corrlation
linaire entre X et Y et est positive. Cest
LES INDICES :
ce que lon a constat graphiquement par
la construction des droites D et D.
179

30
D.TOUIJAR 02/10/2013

Introduction : I) Indices lmentaires


Le concept dindice est dfini par la (1) Dfinition : Soit X une grandeur simple
comparaison de toutes les observations
lune delle (la 1re par exemple), et ce prenant les valeurs x0 et x1 aux dates t0 et t1 .
dans le temps et/ou dans lespace. On appelle indice simple (ou lmentaire) de X
entre les dates t0 et t1, le quotient :
Un indice peut tre lmentaire (1seul
article: prix du pain, des oranges) ou
xt1
synthtique (plusieurs articles : produits
alimentaires, indices de capitalisation:
I t1 (X ) = =
x1
t0 xt 0 x0
MASI et MADEX)

181 182

Remarque : Souvent, on crit et on lit : On calcule lindice du nombre de touristes


aux frontires en 2001 base 100 en 2000
I 1 (X ) =
x1
100
0 x0
Indice de X la date 1, base 100 la date 0
I 01 ( X ) = 260 100 = 104
00 250
Exemple : Arrives de touristes aux
frontires du Maroc (en milliers) Le taux de variation en 2001 est

( X ) 100 = +4%
Avril 2000 Av. 2001 Av.2002
250 260 205 r X = I 01
00
Base100 en 2000 (Avril)
183 184

(2) Proprits des indices simples : On vrifie que :


a) Identit : I 0 0 = 100 I 01 I 00 = 104 96,15 10000
1 00 01
b) Rversibilit : I t = I 0 100 2 c) Circularit :
I tn I t n1 I t1
0 t
I tn =
t n1 t n2 t0
Remarque : b) scrit aussi ( n 1)
t0 100
I t I 0 = 100 2 Exemple :
0 t
Exemple :

I 00 ( X ) = 0 100 =
x 250
100 = 96,15 I 02 ( X ) = x2 100 = 205 100 = 82
01 x1 260 185
00 x0 250 186

31
D.TOUIJAR 02/10/2013

205 II) Indices synthtiques


Et I 02 I 01 = 100 104 = Soit X une grandeur complexe, compose
01 00 260 de k variables simples :
I 02 I 01 X 1 , X 2 , , X k.
78,8 104 = 8200 01 00
= 82 Notons
100 xtj
I ( X ) = j 100
j
t
Remarque : si X=YxZ ; alors 0 x0

I 1 (Y ) I 1 (Z )
Lindice lmentaire de la variable X j la
date t, base 100 la date 0
I 1 (X ) = 0 0
0 100 187 188

(1) Dfinition : Lindice synthtique t/0 , est un (2) Diffrentes formules dindices synthtiques
nombre qui rsume la srie des k indices
a) Indice de laspeyres :t/0 est la moyenne
simple (I1t/0 ,I2t/0 ,, Ikt/0).
arithmtique des indices simples Ijt/0 pondrs
par les coefficients 0j (calculs lanne de
Exemple : I.G.P. (Produits alimentaires,
Produits non alimentaires) base et dsignent limportance relative de Xj)
k k j
t/0 = 0j I t j/ 0 = 0j xtj 100
j =1 j =1 x0
k
o 0j = 1
189
j =1 190

b) Indice de Paasche :Pt/0 est la moyenne c) Indice de Fisher :t/0 est la moyenne
harmonique des indices simples Ijt/0 pondrs gomtrique de laspeyres et de paasche :
par les coefficients t j (calculs la date
courante t )
t/0 = t/0 x Pt/0
1 100
Pt/0 = =
k
t j k
x0j Souvent, on a
I
j =1
j
j =1
t j
xt
j

t/ 0
Pt/0 t/0 t/0
191 192

32
D.TOUIJAR 02/10/2013

(3) Proprits des indices synthtiques


a) La circularit nest vrifie par aucun des trois
1 1
indices.
b) Lindice de Fisher est le seul pouvoir vrifier
= 1002 = 1002
la proprit de rversibilit; En effet t/0 x Pt/0 t/0
j
k
x
0/t = t j 100 1
0 j
100
xt k
j xt
j
t/0 x 0/t = 1002
j =1

j =1
0
x0j

= (1/Pt/0 )x1002x(1/ t/0 ) x1002


193 194

(4)Les indices utiliss dans la pratiques Do : k

a)Indice des Prix :


j =1
p t j q 0j
i) L indice de laspeyres des Prix
j j
t/0 (p) = k
100
Soient p0 et q0 respectivement le prix et la
quantit de larticle j consomm lanne
j j

j =1
p q
0
j
0
j

de base 0. et soient pt et qt ceux de


lanne courante t. Alors lindice de
laspeyres des prix, not t/0 (p), est : Remarque
j j
k
ptj p 0j q 0j le produit p0 q0 nest autre que la valeur
t/0 (p) = 0 100 ; o 0j =
j
j k
de larticle j consomm lanne de base
p0
j =1
p
j =1
0
j

195
q 0j 0.
196

t/0 (p) est donc la moyenne arithmtique


100 ptj qtj
des indices des prix des k articles Pt/0 (p) = k j
; o t = j
k
pondrs par leur valeur globale la date j p0
0. Il dcrit lvolution du prix dun panier
de consommation dont les quantits sont
t j
pt
p q
j =1
t
j
t
j

j =1
choisies lanne de base. k

q
j =1
t
j
ptj
ii) L indice de Paasche des Prix Do Pt/0 ( p) = k
100
q
j =1
t
j
p 0
j

Cest la moyenne harmonique des indices Il dcrit lvolution du prix dun panier de
des prix des k articles pondrs par leur consommation dont les quantits sont
valeur globale (tj) la date courante t. choisies lanne courante
197 198

33
D.TOUIJAR 02/10/2013

b) Indice des Quantits : ii) L indice de paasche des Quantits


k
i) L indice de laspeyres des Quantits
Cette fois les prix sont constants et les 100
q t
j
ptj
quantits sont variables : Pt/0 (q) = k j
= jk=1 100
j q0
k t j q0 pt j j

qt
k
qtj
p q j j
0 t
j =1 j =1

t/0 (q) = j 100 =


j =1 c) Indice de Dpenses (ou valeurs)
0
j
100 k

p q
k
q0 j j
j =1
p q
j =1
j j
0 0 Dt/0 = j =1
k
t t

100 =
Dpenses Totales la date t

199
p q
j =1
j j
0 0
Dpenses Totales la date 0
200

Posons d = p x q ; alors : Exercice1: Le C.A. de la filire boulangerie ptisserie


dune grande surface a t multipli par 1,5 entre
1999 et 2001 et se rpartissait ainsi
t/0 (d) =Pt/0 (d) = Dt/0
Anne 1999 2001
On a aussi
Pain 50% 25%
t/0 (p) x Pt/0 (q) t/0 (q) x Pt/0 (p) Ptisserie 30% 40%
Dt/0= = Gteaux 20% 35%
100 100
Les indices des prix(base100 en 98) ont suivi
lvolution suivante Anne 1999 2001
Et on a encore :
Pain 100,8 104,7
t/0 (p) x t/0(q)
Dt/0= Ptisserie 100,8 103,9
100 201
Gteaux 100,9 107,7
202


C01j t j
j
Questions: I 01
j
t
Anne j
I
1- Calculer P (p) base 100 en 1999. 99 01 / 99

2- Calculer lindice du chiffre daffaire en01/99 Pain 103,9 25 0,25 0,002

3- En dduire un indice de quantit 01/99. Ptisserie 103,1 40 0,40 0,004

Gteaux 106,7 35 0,35 0,003


Rponse
1. Calculons dabord les indices Total ---- 100 1 0,009
simples base 100 en 99; Circularit
1 C01j
I 01 I 99j
j
I 01j P01/ 99 ( p) = k ; o t = j

I j 0198 = 99 98
I 01 =
j

j
98
100

t j


C01j
100 99 I I 01j / 99
99
98 203 j =1 204

34
D.TOUIJAR 02/10/2013

Do
1
P01 / 99 ( p ) = = 111,1
0,009
2- lindice du chiffre daffaire en 01/99 :
V01/
01/99 = 150 (par nonc).

3- indice de quantit ; on a :

V 01 / 99
t/0 (q)= 100 =
P 01 / 99 ( p )
150
100 = 135
111 ,1 205

35

Vous aimerez peut-être aussi