Vous êtes sur la page 1sur 35

D.

TOUIJAR

02/10/2013

Sections A &B

Anne Universitaire 2013-14

Semestre S1

Enseignant : Driss TOUIJAR

Attention !

Filire : Sciences Economiques et Gestion


Module : Mthodes Quantitatives I
Elment :
STATISTIQUE I

N essayez pas de comprendre le cours en lisant


tout (e) seul(e) Ce document.
Par contre, je vous recommande vivement dassister
toutes les sances en esprant mieux cerner le
programme de statistique I

la Statistique et Les Statistiques


Le mot statistique dsigne la fois un ensemble de
donnes d'observations et l'activit qui consiste dans
leur recueil, leur traitement et leur interprtation.
D'une faon plus prcise :
 On dsigne par Les statistiques, un ensemble de
donnes ou d'informations relatives un
phnomne ou un processus donn;
exemple : la population marocaine en 2012, les
naissances au Maroc en 2010, lvolution des
entreprises, des emplois

INTRODUCTION
GENERALE

 Par contre La statistique est en gnral, un


ensemble de mthodes scientifiques qui servent
dcrire et analyser des donnes. Elles nous
permettent aussi de tirer des conclusions et de
prendre des dcisions et aussi de faire des
prvisions.

Elle a pour objet de prsenter les donnes sous


forme de tableaux et de graphiques et de les rsumer
en quelques valeurs numriques appele

caractristiques
 En ce qui concerne ce semestre, on se
contentera dtudier la mthode descriptive : c'est
une mthode qui vise dcrire des ensembles
nombreux ; do lappellation:

statistique descriptive.

D.TOUIJAR

02/10/2013

Domaines dapplication

PROGRAMME DU SEMESTRE

 Actuellement, la Statistique est considre


comme lun des meilleurs outils de la recherche
scientifique. En effet, on fait appel aux mthodes
statistiques dans presque tous les secteurs de
lactivit humaine :
 Agronomie, astronomie, balistique, biologie,
dmographie, conomie, pidmiologie,
gestion, mdecine, mtorologie, physique,
psychologie, sciences politiques ... ,etc.

PARTIE 1 : SERIES SIMPLES


Chapitre 1 : Tableaux statistiques et
reprsentations graphiques
Chapitre 2 : Les paramtres de tendance centrale
Chapitre 3 : Les paramtres de dispersion et de
Concentration
8

BIBLIOGRAPHIE

PROGRAMME DU SEMESTRE

PARTIE 2 : LES SERIES DOUBLES


Ajustement linaire et Corrlation.

PARTIE 3 : LES INDICES

statistique descriptive

B. Py

Stat 29

Introduction la
statistique

J.P Blisle ;J.


Desrosiers

Stat 20

statistique descriptive

B. Grais

Stat 69

Hamid El
Stat 59
Farouki
Benhmida
statistique descriptive
et Touijar10
statistique descriptive

Les Indices lmentaires et synthtiques


9

PARTIE 1
SERIES SIMPLES

I) DEFINITIONS :
Dfinition 1: La population est un

ensemble d'objets ou de personnes


sur lesquelles porte une tude.
Exemples de populations :

CHAPITRE 1 :
Tableaux statistiques et reprsentations
graphiques

-La population du Maroc la date du


recensement de 2004.
-Lensemble des socits SARL Fs en
2013.
12

D.TOUIJAR

02/10/2013

Dfinition 3 : La taille dune population est le nombre

Dfinition 2 : Les lments qui

dindividus qui la composent.

composent une population sont


appels des Individus (ou units
Statistiques). Un sous-ensemble dune
population est appel chantillon.

Dfinition 4 : Un caractre est un critre relatif auquel

on observe les individus dune population.


A chaque individu, on attribut un ou plusieurs
caractres qui peuvent tre soit quantitatifs (s'ils sont
mesurables; exemple : salaire, nb denfants par
mnage...) ou qualitatifs (sinon; exemple : sexe, tat
matrimonial ).
Une valeur que peut prendre un caractre s'appelle
modalit.
14

13

Les variables statistiques discrtes (notes: v.s.d.) :

Un caractre qualitatif peut tre soit :


Ordinal : si ses modalits peuvent tre
naturellement ordonnes exemple : satisfaction
plus ou moins grande aprs lachat dun produit.
Nominal : si ses modalits ne peuvent tre
naturellement ordonnes exemple : tat
matrimoniale.

On appelle variable statistique, un caractre


quantitatif.
On distingue deux sortes de variables statistiques:

se sont des variables dont l'ensemble des


modalits est un ensemble discret (la variable ne
peut prendre que des valeurs isoles d'un
intervalle).
Exemple : Pour le nombre d'enfants par
mnage lensemble des modalits peut tre
{0, 1, 2, 3, 4}.
Les variables statistiques continues (v.s.c.) : dans
ce cas, l'ensemble des modalits est continue; la
variable peut prendre toutes les valeurs d'un
intervalle.
Exemple : Salaire, ge, taille, poids etc.

15

Tableau Rcapitulatif

Exemple : On observe, au cours dune semaine, 20


machines selon le nombre de pices dfectueuses
produites :

Caractre

quantitatif

16

qualitatif

8, 16, 9, 33, 14, 5, 3, 7, 10, 7, 9, 9, 3, 8, 3, 3, 5,


14, 8, 7.
On lappelle srie brutes.
L'effectif total de la population est donc

n =20.
17

18

D.TOUIJAR

02/10/2013

En classant ces nombres par ordre croissant, on


obtient la srie ordonne :
3, 3, 3, 3, 5, 5, 7, 7, 7, 8, 8, 8, 9, 9, 9, 10, 14,
14,16, 33.
On obtient les K modalits aprs regroupement des
observations :
3, 5, 7, 8, 9, 10, 14, 16, 33  (k=9) < (n=20)

la modalit
la modalit
la modalit
la modalit
la modalit
la modalit
la modalit
la modalit
la modalit

3
5
7
8
9
10
14
16
33

a pour effectif
a pour effectif
a pour effectif
a pour effectif
a pour effectif
a pour effectif
a pour effectif
a pour effectif
a pour effectif

n1 =4
n2 =2
n3 =3
n4 =3
n5 =3

n6 =1
n7 =2
n8 =1
n9 =1

Remarque : 4+2+3+3+3+1+2+1+1=20
19

20

Dfinition : L'effectif ni d'une modalit xi est le


nombre d'individus ayant cette modalit. L'effectif
total (ou taille) d'une population, not n , est le
nombre d'individus qui composent cette population.

Dfinition :

On a donc :

Remarque :

On appelle frquence de la modalit


xi , la proportion des individus prsentant cette
modalit. On crit : f = ni ; i = 1, , k
i

i =1

ni = n

f i % = f i 100 f i % = 100
i =1

21

Exemple :

22

Remarque :

n1 4
n
=
= 0,20 et f 6 = 6 = 0,05
n 20
n

Commentaire : La proportion des machines ayant


produit 3 pices dfectueuses est de 20%; et celle
des machines ayant produit 10 pices dfectueuses
est de 5%.

Dfinition : On appelle distribution d'un


caractre X , l'ensemble de couples

{(x1, n1 ), (x2 , n2 ),, (xk , nk )}

fi = 1

En %:

i =1

f1 =

23

En terme de frquence, la distribution de X , scrit


aussi :

{(x1, f1 ), (x2 , f2 ),, (xk , fk )}

Exemple : La distribution des dfectuosits des 20


machines est :
{(03 ; 4), (5 ; 2), (7 ; 3),
(8 ; 3), (9 ; 3), (10 ; 1), (14 ; 2), (16 ; 1), (33 ; 1)}
Ou

{(3 ; 0,20), (5 ; 0,10), (7 ; 0,15), (8 ; 0,15)}


24

D.TOUIJAR

02/10/2013

Pour une meilleure exploitation de la distribution, on a intrt


la reprsenter par un tableau statistique .

Cette matrice (srie selon plusieurs variables) peut tre reprsente


comme suit :
Date de naissance

Prnom

Nom

Jour

Mois

Anne

Nombre
d'enfants

Revenu

Ville

Opinion

Aline

Michalco

23

1953

30000

Paris

Mauvaise

Mathilde

Crepineau

13

10

1953

60000

Montpellier

Trs bonne

Bndicte

Avelin

1953

9000

Rouen

Mauvaise

Henriette

Tufte

1953

15000

Paris

Mauvaise

Danielle

Cron

16

1953

40000

Marseille

Moyenne

Ludivine

Laposte

15

1953

40000

Marseille

Moyenne

Agns

Roche

1953

10000

Nice

Bonne

Rita

Mena

1953

45000

Paris

Moyenne

II) TABLEAUX STATISTIQUES

Exemple Introductif : Supposons que l'on

ait fait une enqute auprs de 20 femmes selon


9 caractres : Prnom, nom, jour de naissance,
mois de naissance, annes de naissance,
nombre d'enfants, revenu annuel du mnage,
ville natale, opinion sur la qualit d'un produit
alimentaire pour bb.
Ces donnes ont t reportes sur un
bordereau, sous forme d'une matrice de 20
lments qui comprennent chacun les 9
donnes concernant une femme.
25

Dans cette 1re Partie, on ne considrera quun seul caractre


la fois.

Andre

Lamiral

22

1953

80000

Nancy

Passable

10

Pauline

Zatti

20

1953

50000

Nice

Moyenne

11

Zo

Foret

1953

60000

Nice

Passable

12

Lola

Marseille

1953

55000

Marseille

Bonne

13

Priscilla

Lounad

1953

85000

Montpellier

Bonne

14

Violaine

Turk

16

1953

60000

Nice

Moyenne

15

Christine

Dodue

15

1953

40000

Rouen

16

Fabiola

Couic

1953

10000

Nancy

Passable

17

Noelle

Gant

11

1953

120000

Nice

Mauvaise

18

Rachel

Nol

22

1953

80000

Paris

Moyenne

19

Sabine

Eboum

20

10

1953

18000

Paris

20

Jeanne

Rivire

12

1953

90000

Marseille

Trs bonne
26
Passable

Sa reprsentation par tableau est alors comme suit :


Modalit

Reprsentation de la distribution dun


caractre X par un Tableau

Effectif Frquence

xi

ni

fi

x1

n1

f1

1) Cas dun caractre qualitatif :

x2

n2

f2

Soit la distribution d un caractre

xi

ni

fi

xk

nk

fk

Total

n=ni

1=fi

qualitatif

tudi sur une population de

n individus :

{(x1, n1 ), (x2 , n2 ),, (xk , nk )}

Bonne

27

28

Le Tableau statistique est comme suit :

Exemple : On reprend les 20 femmes selon

lopinion caractre ordinal :


Ma, Tb, Ma, Ma, Mo, Mo, Bo, Mo, Pa, Mo, Pa, Bo,
Bo, Mo, Bo, Pa, Ma, Mo, Tb, Pa.
Une fois classes : Ma, Ma, Ma, Ma, Pa, Pa, Pa, Pa,
Mo, Mo, Mo, Mo, Mo, Mo, Bo, Bo, Bo, Bo, Tb, Tb.
On a donc 5 modalits (k=5 ).
La distribution scrit :

{(Ma ; 4), (Pa ; 4), (Mo ; 6), (Bo ; 4), (Tb ; 2) }


29

ni

fi

4
4
6
4
2

0,2
0,2
0,3
0,2
0,1

n=20

1
30

D.TOUIJAR

02/10/2013

Le tableau est alors le suivant :

2) Cas du caractre quantitatif :


a) Variable Statistique Discrte (v.s.d)
Soit

le caractre qui dsigne le nombre

denfants par mnage pour les 20 femmes :


4 0 1 1 2 2 2 3 3 4
2 3 3 5 2 1 3 3 4 5
La distribution est alors :

{(0,1), (1,3), (2,5), (3,6), (4,3), (5,2) }


31

Question : Combien

de femmes ont au moins

ou au plus 3 enfants ?
i) Effectifs et frquences cumuls :
*) Effectifs et frquences cumuls croissants:

Soit Ni le ime effectif cumul croissant


associ xi

N 4 = n1 + n2 + n3 +n4 = n j = 15
j =1

On dit que 15 femmes ont au plus x4 =3


enfants.
En divisant lgalit ci-dessus par n=20, on
obtient la frquence cumule croissante:
4

N i = n1 + n2 ++ni = n j

F4 = f1 + f 2 + f 3 + f 4 = f j = 75%

j =1

Ni est le nombre dindividus prsentant au


plus la modalit xi .

32

33

j =1

On dit que 75% des femmes ont au plus

x4 =3 enfants.

34

Le tableau complet est comme suit :

En gnral, on a :
i

Fi = f1 + f 2 ++ f i = f j
j =1

Effectifs et frquences cumuls dcroissants:


En sommant cette fois partir du ime
effectif jusquau dernier, on obtient le ime
effectif cumul dcroissant, par exemple :

N3 = n + n +n +n =
3
4
5
6

n j = 16
j =3

35

xi

ni

Ni

Ni

Fi

Fi

x1

n1

n1

Ff11

x2

n2

n1+ n2

n2+n3+...+nk

f1 + f2

f2 + f3+...+ fk

xi

ni

n1+n2+...+ni

ni+ni+1+...+nk

f1+ f2+...+fi

fi+ fi+1+...+ fk

xk

nk

nk

fk

Total

__

__

__

__
36

D.TOUIJAR

02/10/2013

On dit que 16 femmes ont au moins

Pour notre exemple, on a :

x3=2

enfants.
En divisant lgalit ci-dessus par n=20, on
obtient la frquence cumule
dcroissante:
6

F3


= f 3 + f 4 + f 5 + f 6 = f j = 80%
j =3

On dit que 80% des mnages ont au moins

x3=2 enfants.

37

Interprtation :
Il y a 19 mnages (soit 95%) qui ont
au moins 1 enfant.
Il y a 9 mnages (soit 45%) qui ont
au plus 2 enfants.
Remarque :

b) Variable statistique continue (v.s.c)

Dans le cas dune v.s.c., les modalits


sont regroupes en classes. Soit k le
nombre de ces classes :
[e0 , e1[ ; [e1 , e2[ ; ... ; [ei-1 , ei[ ; ... ; [ek-1 , ek[
   
1re

i 1

38

Fi
 = f i + f i +1 ++ f k = f j f j
j =1

 j =1

2me
ime
Pour la ime classe, on note :

ai = ei ei-1

=1

= 1 Fi 1

N classe Les classes

xi =
39

ni

fi

[e0 , e1[

n1

f1

[e1 , e2[

n2

f2

[ei-1 , ei[

ni

fi

[ek-1 , ek[

nk

Total

__

kme

lamplitude de cette classe.

ei 1 + ei
le centre de cette classe.
2

40

Exemple : on relve le revenu des 20 femmes()


Revenu X Effectif ni
Il est plus commode de regrouper
9000
1
les revenus en classe, par exemple,
10000
2
15000
1
on choisi 4 classes de mme
18000
1
amplitude
30000
1
40000

45000

50000

55000

fk

60000

80000

85000

41

90000

120000

TOTAL

20

Classes Revenus(K)

effectifs

[0 ; 35[
[35 ; 70[
[70 ; 105[
[105 ; 140[
TOTAL

6
9
4
?
20

42

D.TOUIJAR

02/10/2013

Interprtation :

Compltons notre tableau :

F2=75% des femmes touchent


au plus e2= 70 m . ([e1,e2[)

Il y a

Fi%

20

Fi%
30
75
95

100

100

Au plus

Au moins

Classes

ni

fi %

[0 ; 35[

30

[35 ; 70[

45

[70 ; 105[

[105 ; 140[

1
20

Total

100
Il y a F3 =25% des femmes touchent
au moins e2= 70 m . ([e2,e3[)

70
25

43

III) REPRESENTATIONS GRAPHIQUES

44

Exemple : On reprend les 20 femmes

Le graphique est une traduction visuelle de


linformation quelle soit qualitative ou quantitative.

Rpartition des 20 femmes selon l'opinion


40%

1) Cas du caractre qualitatif :

0,3

30%

A) Le graphique en tuyaux dorgue

20%

est form de rectangles de mme base

0,2

0,2

0,2

0,1

10%

constante et dont les hauteurs sont


0%

proportionnelles aux effectifs (ou


frquences) des modalits associes.

Ma

Mo

Bo

Tb

45

Exemple : On reprend les 20 femmes

46

B) Le diagramme circulaire

Rpartition des 20 femmes selon l'opinion

Cest une reprsentation en disque.


Chaque secteur est proportionnel

40%

leffectif (ou frquence) de la modalit

0,3
30%
0,2

0,2

associe. En terme dangle, xi on associe

0,2

langle au centre i, du secteur i, vrifiant:

20%
0,1

i = c fi

10%

0%
Ma
02/10/2013

Pa

Pa

Mo

Bo

Or

Tb

47

i =1

i =1

i=1,...,K

i = c f i 360 = c 1 c = 360

48

D.TOUIJAR

02/10/2013

Lgalit devient:

Rpartition des femmes selon l'opinion

i = 360 x fi
Ou

i = 3,6 x fi %

; i=1,...,k
Ma
20%

; i=1,...,k

xi

fi %

Ma
Pa
Mo
Bo
Tb
Total

20
20
30
20
10
100

72
72
108
72
36
360

Tb
10%

36

Pa

72

Mo
Pa
20%

Bo
Tb

108
Mo
30%

49

50

2) Cas du caractre quantitatif :

Rpartition des femmes selon l'opinion

A) Les V.S.D.
Ma
20%

On utilise deux types de

graphiques selon que lon considre les

Tb
10%
Bo
20%

Ma

Bo
20%

Ma

effectifs (ou frquences) simple ou les

Pa
Pa
20%
Mo
30%

Mo

effectifs (ou frquences) cumuls:

Bo
Tb

i) Diagramme en btons
chaque modalit xi on associe un

51

Segment de longueur proportionnelle


leffectif (ou frquence).

52

Rpartition des mnages selon le


nombre d'enfants

ni
7
6

Exemple : On reprend lexemple


des 20 femmes

5
4
3
2
1
0

-1
53

xi
54

D.TOUIJAR

02/10/2013

ii) Courbe Cumulative


Dfinition : On appelle fonction de rpartition

F( x), la fonction qui chaque valeur x de R


associe la proportion dindividus pour lesquels la
valeur de la variable X est infrieure ou gale x.

Notation :

F (x ) = P( X x )
55

Remarques :
Si x = xi alors F(xi ) = f1++ fi = Fi .

Si xi x < xi+1 alors F(x)= Fi + 0= Fi .

Conclusion :
F(x)=Fi pour tout x tel que xi

La reprsentation graphique de F(x) est appele


Courbe cumulative, cest une courbe
en escalier dont les paliers sont
horizontaux, puisque F(x) est constante sur
chaque intervalle [xi , xi+1[.
56

Pour notre exemple, on a :

Proprit de F:

xi

La fonction F est dfinie sur R et valeurs dans


[0 , 1].
F(x)

= 0 si x < x1
F(x) = 1 si x xk
F(-) = 0 et F(+) = 1
F est constante sur chaque intervalle sparant deux
modalits conscutives .
Remarque : On obtient la courbe cumulative des
effectifs en remplaant les Fi par les Ni .

57

Exemple : On reprend les 20 femmes

F(x)

x < xi+1

02/10/2013

ni

fi %

0
1
5
1
3 15
2
5 25
3
6 30
4
3 15
5
2 10
Total 20 100

Fi%
5
20
45
75
90
100
Au plus

58

B) Les V.S.C. On a souvent recourt trois types

de graphiques :

Courbe Cumulative dans le cas


d'une v.s.d

100

i) Histogramme

90
75
45
20
5
0
0

59

chaque classe, on associe un rectangle


dont la base est gale lamplitude de la
classe et dont la hauteur est de telle sorte
que sa surface (Si = b i x hi) soit
proportionnelle la frquence de la
classe. La juxtaposition de tous ces
rectangles forment un histogramme.
60

10

D.TOUIJAR

02/10/2013

La procdure suivre :
Toutes les classes ont mme amplitude
(ai = cte = a ; i=1,...,k) alors hi=fi (ou ni).
Au moins une classe a une amplitude
diffrente des autres : dans ce cas on
choisi une amplitude de rfrence ar (par
exemple la plus petite ou la plus rpandu)
Par suite, on corrige la frquence des
classes diffrentes en la divisant par
lamplitude associe
et en multipliant
par ar

hi = f i =

fi
ar
ai

Classes

ai

fi

[0 ; 35[
[35 ; 70[
[70 ; 105[
[105 ; 140[

35
35
35
35

0,30
0,45
0,20
0,05

Total

ar=35

61

62

Exemple : Si On regroupe les 2 dernires


classes

Rpartition des femmes selon le


revenu en 1000

Exemple : On reprend les 20 femmes


Toutes les classes ont mme amplitude
donc pas besoin de corriger les frquences

0,9

Classes

0,8

fi

ai

1
[0 ; 35[ 0,30 35
1
[35 ; 70[ 0,45 35
2
[70 ; 140[ 0,25 70
Total
1 ar=35 ---

0,7
0,6
0,5
0,4
0,3
0,2

fi

li

0,30
0,45
0,13
--

0,1

Rem : fi sappelle densit de frquence

0
35

1
0,95
0,9
0,85
0,8
0,75
0,7
0,65
0,6
0,55
0,5
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
3
0,1
0,05
0

fi

70

105

140

63 X

Rpartition des femmes selon le


revenu en 1000

(sans pourcentage)

64

ii) Polygone de frquences


On subdivise lhistogramme en sous

rectangles de mme base gale lamplitude


de rfrence ar. ar tant choisie comme la
plus petite des amplitudes et vrifiant :

ai = kar ; k = 1,2,3,4,...
Aprs avoir ajouter aux extrmits de
lhistogramme deux rectangles fictifs de hauteur
nulle et de base ar ,on joint, par des segments
de droites, les milieux des sommets des sous
rectangles ainsi obtenus.
35

70

105

140

65

66

11

D.TOUIJAR

0,5

02/10/2013

Rpartition des femmes selon


le revenu en 1000

f'i

ii) Courbe Cumulative

0,45

On construit la courbe de la frquence


cumule en joignant les points (ei , Fi ), o
ei est la borne suprieure de la ime classe
[ei-1 , ei[ et Fi est la frquence cumule de
cette mme classe. On note

0,4
0,35
0,3
0,25
0,2

Fi = P( X ei )

0,15
0,1
0,05
0

-35

35

70

105

140

67 X

175

68

Exemple : On reprend les 20 femmes

Rpartition des femmes selon le


revenu en 1000

F(x)
100

Classes

fi %

Fi%

90

[0 ; 35[
[35 ; 70[
[70 ; 140[

30
45
25

30
75
100

70

Total

Au plus

80

60
50
40

Mdiane
graphiquement
52

30
20
10
0
69

00

35

70

105

140

X70

Ici, il sagit de faire une synthse de


linformation, contenue dans la srie brute, par
le chiffre; et ce en calculant des paramtres dits
de tendance centrale, qui caractrisent lordre
de grandeur des observations.
Dans ce chapitre, on analysera trois de ces
paramtres qui sont :
les moyennes, le mode et la mdiane.

Chapitre II
Les caractristiques de
Tendance centrale
71

72

12

D.TOUIJAR

02/10/2013

O, n est la taille de la population, et les

I) LES MOYENNES
(1)

xi

sont les modalits dans le cas d'une


v.s.d. et les centres des classes dans le cas
d'une v.s.c.

La moyenne arithmtique

moyenne arithmtique, note x


, dune variable statistique X de distribution
est la quantit :
(xi , ni )

(a) Dfinition : La

1ik

x =

1
n

i =1

ni xi =

Exemple 1 : On reprend lexemple des


20 femmes selon le nb denfants

i =1

f i xi
73

xi

ni

ni xi

fi

fi xi

0
1
2
3
4
5
Total

1
3
5
6
3
2
20

0
03
10
18
12
10
53

0,05
0,15
0,25
0,30
0,15
0,10
1

0
0,15
0,50
0,90
0,60
0,50
2,65

74

x=

1 6
53
ni x i =
= 2,65

n i =1
20
6

ou x = f i xi = 2,65
i =1

Exemple 2 : Pour les revenus des femmes

3
1 3
x = ni xi = f i xi = 55125
n i =1
i =1

75

Classes

fi

[0 ; 35 [
[35 ; 70 [

0,30
0,45

[70 ; 140 [

0,25

Total

xi
17,5
52,5
105

76

fi xi

(b) Changement dorigine et dchelle

5,25
23,625

Proprit : Soit X une variable statistique


de moyenne arithmtique x . Si Y est une
variable statistique telle que Y=aX+b, o a
et b sont des rels quelconques, alors la
moyenne arithmtique de Y est :

26,25
55,125

77

y = ax + b
78

13

D.TOUIJAR

02/10/2013

Dmonstration :
k

(c) Proprits algbriques de la moyenne


arithmtique

y = f i yi = f i (axi + b )
i =1

i) la moyenne des carts la moyenne


arithmtique est nulle :
k

i =1

f i (x i x ) = 0

= a f i xi + b f i = ax + b
i =1
i =1

 

i =1

ii) La moyenne des carrs des carts


une constante a est minimale pour a =

i =1

i =1

f i ( x i a )2 = f i ( x i x )2

aR

min
79

Dmonstration :
k

i =1

(x i

a) =

( x

(x i

i =1
k

i =1
k

+ 2 f
i =1

i =1

(x i
(x i

) + (x

x
x
x
x

i =1

)( x
)

a )

(x

(d) Proprit de lagrgation

a)

Soit une population P de taille n, compose


de m sous populations P1, P2, . . . , Pm ; de
tailles respectives n1, n2, . . .nm et de
moyennes respectives x 1 , x 2 ,.... x m . Alors
la moyenne arithmtique x de la population
P est donne par :
m

a)

+ (x a )

fi
i =1

=1

+ 2 (x a ) f i (x i x )
i =1

  


x=

=0

i =1

(x i

+ (x a )

80

2
81

82

 Soit x Le salaire moyen global dans E, x1


celui des hommes et x2 celui des femmes.
On a :

Exemple :
Le salaire moyen des cadres dans
lentreprise E est de 4000 DH.

x = f1 x1 + f 2 x2

 Le salaire moyen des cadres masculins


est de 4200 DH.

 On aboutit alors au systme :


+
f2
= 1
f1 + f 2 = 1
f
1

4200 f1 + 3000 f 2 = 4000


f1 x1 + f 2 x2 = x

 Le salaire moyen des cadres fminins


est de 3000 DH.
1. Quelle est la rpartition hommes femmes des cadres ?

1
ni x i

n i =1

83

f1 = 83,3% et f 2 =16,7%

84

14

D.TOUIJAR

02/10/2013

I) LES MOYENNES

(2)

La moyenne gomtrique

(a) Dfinition : On appelle moyenne gomtrique

de la distribution {(xi , ni )1ik } que lon


note G, la racine nme du produit des xi ni

G=

(x ) =
k

ni

x x2 xk
n1
1

n2

i=1

Cest plus pratique dutiliser le logarithme


1

L og (G ) = L og x1n1 x 2 n2 x k n k n

1
= L og x1n1 x 2 n2 x k n k
n
k

1
= L og x i ni

n
i =1

([

])

[ ]

nk

85

i=1

Exemple :calculons la moyenne gomtrique de

( )

1 k
L og xi ni
n i =1

1 k
ni L og (xi ) =
n i =1

o n = ni

i =1

f i L og ( xi )

Dune autre faon, calculons Log(G) :

On utilise la moyenne
gomtrique dans le calcul du
taux daccroissement moyen et
dans le calcul de certains indices
statistique.

1 4
Log (G )= f i Log (xi )= ni Log ( xi )
4 i=1
i=1
1
= [2 Log 2 + Log12 + Log 50]
4
=1,946
D'o G = e1,946 = 7

87

88

Exemple :calculons la moyenne

I) LES MOYENNES
(3)

La moyenne harmonique

harmonique de

Dfinition
Dfinition et proprit : La moyenne

harmonique , note H, dune distribution


{(xi , ni )1ik }est linverse de la moyenne

arithmtique de la distribution : 1 , ni
H =

ni
i =1

1
xi

xi

i =1

fi
xi

86

Domaines dapplication :

G = 4 22 1250 = 6,999

2 , 12 , 2 , 50 :

H=

2 , 12 , 2 , 50

4
= 3,625
1 1 1
2 + +
2 12 50

1ik
k

o n = ni
89

i=1

90

15

D.TOUIJAR

02/10/2013

I) LES MOYENNES

Domaines dapplication :

On utilise cette moyenne dans le


calcul des dures moyennes, dans
le calcul des moyennes de rapports
et de pourcentages et dans les
tudes du pouvoir dachat (inverse
du MGP)...etc.

(4)

La moyenne quadratique

Dfinition et proprit : La moyenne

quadratique, note Q , dune distribution


(xi , ni )1ik est la racine carre de la moyenne
arithmtique de la distribution xi2 , ni 1 i k

Q=
91

{(

1 k
2
ni xi =

n i=1

f x
i =1

) }

i i
92

Exemple :calculons la moyenne

Domaines dapplication :

quadratique de

2 , 12 , 2 , 50 :

La moyenne quadratique intervient


dans le calcul de certains
paramtres de dispersion.

Q=

1
(2 4 +144 + 2500 ) = 25,749
4

93

(5) Rsultat comparatif

94

(6) Conclusion :

Pour une mme srie


statistique, on montre que les
quatre moyennes vrifient
toujours lordre suivant :

Un inconvnient de la moyenne arithmtique


est quelle est trs sensible aux valeurs
extrmes de la srie.
La moyenne gomtrique est peu sensible
ces dernires.
En ce qui concerne la moyenne
harmonique, elle est plus sensible aux plus
petites valeurs de la srie quaux plus grandes.

H <G< x<Q
95

96

16

D.TOUIJAR

02/10/2013

(2) Dtermination du mode


II) LE MODE
(a) Cas d'une v.s.d.

Le mode, not Mo , dune srie


statistique est la valeur de cette srie, dont leffectif
(ou la frquence) est plus grand que les effectifs (ou
les frquences) des valeurs voisines.

(1) Dfinition :

Cest le plus simple mais le moins utilis !

Dans le cas d'une v.s.d. la dtermination


du mode est immdiate partir du
tableau statistique ou du diagramme en
btons.
Exemples :
i) Ci-dessous on donne trois diagrammes
en btons associs respectivement, une
distribution unimodale (qui a un seul
mode ), et une distribution bimodale
(qui a deux modes ), et une distribution
qui a un intervalle modal.

97

Distribution unimodale

98

Exemple 1 : On reprend lexemple des 20


femmes selon le nb denfants

Distribution bimodale

Mo2

Mo
M

intervalle modale

Mo1
99

(b) Cas dune v.s.c.


Le mode se trouve dans la classe
modale, c'est la classe qui correspond
la plus grande frquence corrige.
On peut dmontrer que lexpression
algbrique du mode est comme suit :

M 0 = ei 1 + ai

xi

ni

fi

0
1
2
3
4
5

1
3
5
6
3
2

0,05
0,15
0,25
0,30
0,15
0,10

Total

20

M o = 3 enfts

100

o [ei 1 , ei [: est la classe modale


hi = f i: est la frquence corrige de la classe

modale (c' est la plus leve des frquences)


ai : est l' amplitude de la classe modale
Exemple : On reprend les 20 femmes

M 0 = e1 + a2

hi hi 1
2hi ( hi 1 + hi +1 )

h2 h1
2h2 (h1 + h3 )

0,45 0,3
0,90 (0,3 + 0,13)
= 46,17 m

= 35 + 35
101

102

17

D.TOUIJAR

02/10/2013

Exemple :

III) LA MEDIANE

fi

Classes

[0 ; 35[ 0,30
[35 ; 70[ 0,45
[70 ; 140[ 0,25
Total
1

(1) Dfinition :

fi

0,30
0,45
0,13

Classe
modale

--

103

(2) Dtermination de la mdiane

Soit X une v.s.d. de distribution {( x i , f i )1i k }


Pour dterminer sa mdiane, on utilise
les frquences cumules croissantes Fi.

Soit la srie ordonne (par ordre croissant) de n


observations : x1 , x2 , ..., xn .
 Si n est impaire, alors la valeur mdiane est lobservation
qui occupe le rang (n+1)/2 .
 Si n est paire, on ne peut plus dterminer exactement la
mdiane, mais on a un intervalle mdian
n/ 2

; x(n / 2 )+1 ]

105

 S'il existe une modalit xi pour laquelle


Fi = 0,5, dans ce cas on parle dun intervalle
mdian : [xi , xi+1].

Exemple 1 : On
reprend lexemple
des 20 femmes
selon le nb
denfants

F3 =0,45< 0,5< F4
Do

M=3 enfts

104

(b) Cas dune distribution


i) Cas d1 VSD

(a) Cas dune srie brute

[x

La Mdiane, note M, dune


srie statistique, est la valeur de la srie qui
partage la population en deux parties deffectifs
gaux. Par consquent, on aura autant
dobservations infrieures M que
dobservations suprieures M.

xi

fi %

Fi %

15

20

25

45

3
4
5
Total

30
15
10
100

75
90
100
107
Au plus

- Procdure suivre
 Si i Fi 0,5 ; autrement dit, si aucune
frquence cumule Fi nest gale 0,5 ,
dans ce cas la mdiane est la modalit xi
qui correspond la plus petite frquence
cumule dpassant strictement 0,5.
106

ii) Cas dune v.s.c.


Dans le cas continue, la mdiane est
toujours unique : cest la valeur qui
partage exactement la population en
deux parties gales. En d'autres termes,
M est la solution de lquation :

F(M) =0,5
o F est la fonction de rpartition de X.
On a deux mthodes pour dterminer la
mdiane :
108

18

D.TOUIJAR

02/10/2013

(
) Dtermination graphique : -La mdiane

correspond labscisse du point de la courbe


cumulative qui admet pour ordonne la valeur 0,5
(ou 50%). (Voir Graphique de lexemple)
(
) Dtermination par interpolation : -D'aprs le
tableau ou la courbe cumulative, on dtermine la
classe contenant la mdiane M ; cest la classe
[ ei-1, ei [ telle que, Fi-1 0,5 < Fi ; puis on
dtermine M par interpolation linaire. donc on a :
Fi-1

2 0,5

ei-1

4 M

Exemple:

M = e1 + a2

[70 ; 140[

45
25

Fi%
30
75
100

Total

Au plus

Classes
[0 ; 35[
[35 ; 70[

fi %

30

M = ei 1 + ai
o

[ei 1 , ei [: est la classe mdiane


a : tant son amplitude
i
f i : est sa frquence
Fi 1 : est la frquence cumule de

la classe prcdente

1
3

Fi
ei
109

0,5 F1
f2

0,5 Fi 1
fi

110

Rpartition des femmes selon le


revenu en 1000

F(x)
100

M = 35 +
50 30
35
45
= 50,56 m

90
80
70
60
50
40

Mdiane
graphiquement
52

30
20
10
0
00

111

Conclusion Gnrale
Population htrogne : La moyenne arithmtique
est prfrable la mdiane et au mode.
Prsence des valeurs aberrantes (ou extrmes) : La
mdiane est prfrable.
Rsultats dun concours: la note mdiane est la plus
significative.
Dmographie : Lesprance de vie est conseille
pour comparer des pays en voie de dvpt. Pour un
seul, la dure mdiane ou le mode (ge le plus
frquent la mort) sont utiliss.

113

IV)

35

70

105

140

X112

POSITIONS RELATIVES DES 3


PARAMTRES MO , M et x
f

distribution symtrique unimodale : les 3


paramtres coincident au point de symtrie

Mo =M=x

114

19

D.TOUIJAR

02/10/2013

distribution unimodale dissymtrique


tale droite :Mo < M < x

distribution unimodale dissymtrique tale


gauche : x< M < Mo
f

Mo

M
x

115

Remarque : Pour des distributions


peu dissymtriques, on a la relation
suivante :

x M 0 3( x M

)
117

Mo

116

Chapitre III
Les caractristiques
de
Dispersion
et de
Concentration

118

I)- Les carts simples

Introduction
Les paramtres de dispersion servent
mesurer la dispersion des observations
autour d'une tendance centrale.
On considre deux catgories de
paramtres de dispersion :

carts simples :
 tendue- cart interquantile.
2-L'cart-type, la variance et le coefficient
de variation.

1- Les

1)Ltendue:

Dfinition: Ltendue, not e, est la

diffrence entre la plus grande et la plus


petite observation.
Cas dune v.s.d

e = xmax xmin
Exemple :
119

e = x6 x1 = 5-0 = 5 enfts

120

20

D.TOUIJAR

02/10/2013

Dfinition: Soit un nombre rel compris entre

Cas dune v.s.c

0 et 1. On dit quune valeur x du caractre X est un


quantile d'ordre , si :

e = ek e0
Exemple:

F( x ) =P(X x ) =

e = e3 e0 =140-0= 140 m.

Limites :il est trs sensible aux fluctuation


d chantillonnages.

2)Ecart interquantile: Dsormais, On

a)Les quantiles: Gnralisation

de la

mdiane.

ek

On cite quatre types de quantiles :




ne sintressera quaux V.S.C.

e0


(1-)

quartiles
quintiles
dciles
centiles

121

Valeurs de

1)QUARTILES: Soient Q 1, Q 2 et Q 3 les trois

Nom de x

i /4 ; i {1, 2, 3}

me

quartiles. Par dfinition :


Q 1 = x1/4 , P(X < Q 1 ) = 1/4= 25%

Q 2 = x1/2 , P(X < Q 2 ) = 2/4= 50%

quartile

i /5 ; i {1, 2,,4}

i me quintile

i /10 ; i {1, 2 ,,9}

i me dcile

122

Q 3= x3/4 , P(X < Q 3 ) = 3/4= 75%


Donc Q 1, Q 2 et Q 3 partagent la population
en quatre parties de mme effectif 25 %
chacune.
25 %

i /100 ; i {1,2,,99}

i me centile

e0

25 %

Q1

25 %
Q2

25 %
Q3

ek

123

2)QUINTILES: Soient q 1, q 2, q 3 et q 4 ces 4

124

3) DECILES: Soient D1, D2, ,D9 ces 9 dciles. Ils

quintiles. On a :

partagent la population en dix parties


deffectif =10 % chacune.

q 1 = x1/5 , P(X < q 1 ) = 1/5= 20%

q 2 = x2/5 , P(X < q 2 ) = 2/5= 40%


q 3= x3/5

10 %

, P(X < q 3 ) = 60%


, P(X < q 4 ) = 80%

q 4= x4/5
Donc q 1, q 2, q 3 et q 4 partagent la population
en cinq parties deffectif =20 % chacune.

20 % 20 %
e0

q1

20 %
q2

20 %
q3

20 %
q4

e0

80 %

D1 D2

D3

10 %
...

D9

ek

Par exemple : P(X < D5 ) = 1/2= 50% ; do


D5 est la mdiane :

D5=Q 2=M
ek

125

126

21

D.TOUIJAR

02/10/2013

La dtermination des quantiles:


i) Dtermination Graphique : elle est

Exemple : On reprend les 20 femmes

pratiquement la mme que celle de la

mdiane, il suffit de remplacer 0,5 par .

ii) Dtermination par Interpolation :

x [ei 1 ; ei [ , elle correspond la

plus petite frquence cumule dpassant


strictement

x =ei 1 + ai

Fi 1
fi

25 F0
f1

Q3 =e2 + a3

Q 2=M
=50,56 m

Fi%

[0 ; 35[
[35 ; 70[
[70 ; 140[

30
45
25

30
75
100

Total

Au plus
128

Exemple : Pour les vingt femmes :

F0<25<F

1
F2 75<F3

25 0
= 0 + 35
= 29,17 m
30

fi %

127

Exemple : Pour les vingt femmes :

Q1 =e0 + a1

Classes

75 F2
f3

F0<10<F1
10 F0
f1
F2 90<F3
10
= 0 + 35
= 11,67 m
30
90 F2
D9 =e2 + a3
f3
D5=M

D1 =e0 + a1

=50,56 m

= 70 + 0 = 70 m

= 70 + 70

129

Ecart interquantile: Ce

sont des paramtres de


dispersion, donns par la diffrence entre le
premier et le dernier quantile :

i)
ii)

Q = Q 3 - Q 1 .
Ecart interquintile: q = q4 - q1 .

Ecart interquartile:

iii) Ecart interdcile:

90 75
= 112 m
25
130

c) Les carts relatifs: Afin de comparer des


distributions diffrentes, on peut utiliser :
i)Ecart interquartile relatif :
ii)Ecart interdcile relatif :

Q r =
Dr =

D9
D1

Q
M

Exemple :

D = D9 - D1 .

Q r =40,83/50,56 = 0,808= 80,8%


Dr =112/11,67= 9,6

Exemple :

Q = 40,83 m
D = 79,33 m
131

Les moins riches des 10% les plus riches


ont un revenu suprieure 9,6 fois le revenu
des plus riches des 10% les plus pauvres.
132

22

D.TOUIJAR

02/10/2013

II)- Ecart-type et variance

Remarque
2
 La variance est aussi note x
 Pour une variable statistique continue les xi sont
les centres des classes.

1)La variance:

2)Lcart type:

Dfinition: La variance, V(X), dune


distribution statistique {(xi, ni)1 i k },

est donne par :


V (X ) =

Dfinition: Lcart type de X, not X , est

la racine carre de la variance :

1
ni ( xi x ) 2 = f i ( xi x ) 2

n i =1
i =1

x = V (X ) =

133

Cas VSD
Sachant que x =

fi

f i x i = 55 ,125 m

134

xi

(xi- x)2

i =1

fi (xi- x)2

X = 1049,672 = 32,3986 m
3)Formule dveloppe de la variance
La variance scrit aussi comme la diffrence
entre la moyenne des carrs et le carr de la
moyenne :

V ( X ) = x2 x 2

[70 ; 140[ 0,25 105 2487,516 621,879


1

i =1

f i ( xi x ) 2

V ( X ) = f i ( xi x ) 2 = 1049,672

[0 ; 35[ 0,30 17,5 1415,641 424,692


[35 ; 70[ 0,45 52,5 6,891
3,101

Total

i =1

Classes

1 k
ni ( xi x ) 2 =
n i =1

---

---

1049,672
135

1 k

= ni xi2 ( x ) 2 = f i xi2 ( x ) 2
n i =1

i =1

136

Exemple :

81768,75
2
(55,125)
20
= 4088,438 3038,766 = 1049,672

V ( X ) = x2 x 2 =

xi

ni xi

ni xi2

Classes

ni

[0 ; 35 [

6 17,5 105

[35 ; 70 [

9 52,5 472,5 24806,25

[70 ; 140 [ 5 105

Total

20

525

1837,5
55125

1102,5 81768,75
137

X = 1049,672 = 32,399 m
4) Changement de variable :

Si Y=X+b alors V(Y)=V(X)


Si Y=aX alors V(Y)=a2 V(X)
138

23

D.TOUIJAR

02/10/2013

4)Variances intra et inter populations

5)Coefficient de variation

Soit une population P de taille n, compose


de 2 sous populations P1 et P2; de tailles
respectives n1 et n2 de moyennes
respectives x1 et x2 et de variances
respectives 12, 22. Alors la variance 2 de
la population P est donne par:

() ()

2= f112 + f2 22 + f1(x1 x)2 + f2 (x2 x)2


i2 intra pop
O

x = f1 x1 + f 2 x2 =

x2i inter pop

1
(n1 x1 + n2 x2 )
n

139

Le coefficient de variation Cv dune


variable statistique positive de moyenne x et
dcart-type X est le rapport :

Cv = X
x

Dfinition

: le taux dinflation dans 2 pays est


respectivement {15, 25, 35} et {150, 250, 350}. On
trouve le mme taux dinflation.

Cv A = 8,16 25 = 0,33 = Cv B = 81,6 250


140

La notion de concentration est apparente celle de


dispersion, mais elle traduit le phnomne de
rpartition de la masse globale de la grandeur
tudie :salaires, chiffre daffaires, consommation dun
produit, superficie cultivable

Les paramtres
de
Concentration :

Ltude de la concentration ne concerne que les


variables statistiques continues dont les modalits
sont positives et leur somme a un sens. On introduit
dans ce chapitre les paramtres de
concentration, pour apprcier la diffrence entre une
rpartition galitaire de la masse globale (une
rpartition idale) et la rpartition rellement
observe.
142

Soit X une variable statistique continue. Dont


les valeurs sont positives et regroupes en k
classes [ e0 , e1 [, [ e1, e2 [ , , [ ek-1, ek [
respectifs x1, x2 , ,xk. On note :

1. si = ni xi : la masse du caractre X dans la


classe [ ei-1, ei [ (ou relative xi )
k

i =1

i =1

j =1

j =1

s j = n j x j est la masse

du caractre possde

par les individus prsentant une valeur infrieure ei


(ou la masse cumule associe la classe [ei-1, ei [).

deffectifs respectifs n1, n2 , ,nk, et de centres

Si =

gi =

s i ni x i
fx
=
= i i
S
S
x

classe [ ei-1, ei [ (ou la proportion de la masse globale


dans [ ei-1, ei [ ).

Si
est la
S
classe [e ,e [
Gi =

2. S = s i = n i xi :est la masse globale du


caractre.

143

est la masse relative de la

i-1

masse cumule relative associe la


(ou la proportion de la masse globale

possde par les individus prsentant une valeur


infrieure ei).

144

24

D.TOUIJAR

02/10/2013

Exemple : On considre la distribution


statistique des salaires par heure de travail
en DH, de 110 salaris d'une entreprise :

Remarques :
i) On a, 0 Gi 1 pour tout i.

Gi

Salaires en DH/h

ni

xi

si = ni xi

gi= si

[10 , 12[

15

11

165

0,092

0,092

ii) Soit x une valeur quelconque du caractre, G(x)


est la proportion de la masse globale possde par

[12 , 15[

35

13,5

472,5

0,264

0,356

les individus prsentant une valeur infrieure x, et

[15 , 20[

45

17,5

787,5

0,441

0,797

on a G(ei ) = Gi.

[20 , 25[

10

22,5

225

0 ,126

0,923

[25 , 30[

27,5

137,5

0,077

Total

110

------- S=1787,5

-------

-------

145

la mdiale de la srie statistique


X est la valeur du caractre qui partage la
masse globale en deux parties gales. On la note
Ml , et on a :

146

(1) Dfinition :

M l = ei1 + ai

Lcart absolu mdiale mdiane, not M


est un indicateur de concentration

G(Ml) =0,5 =50 % .

M =Ml - M et M r =

(2) Dtermination de la mdiale


La procdure de la dtermination de la
mdiale est similaire celle de la mdiane
en remplaant les Fi par les G i.

Revenons notre exercice :


0,356 0,5 < 0,797 donc M l [ 15, 20 [

0,5 0,356
= 16,633 16,63 DH/h.
0,441

M
e

Si M r = 0 alors M = M l donc on a une


distribution parfaitement galitaire
Plus M r est grand plus la
concentration est forte, et inversement.

147

M l = 15 + 5

0,5 Gi 1
gi

148

la courbe ainsi obtenue est appele


courbe de concentration ou courbe de
Gi
Lorenz.
C

B
D r o ite d q u ir p ar titio n

0 ,8

M = M l - M =16,63 -15,56 =1,07 DH/h.

0 ,6

III) Courbe et indice de concentration


(1) Courbe de concentration
Dans un repre orthonorm, on trace les points
de coordonnes ( Fi , Gi ) et on les joint par des
segments de droite.
149

A ir e d e
co n c e n tr atio n

0 ,4
Courbe de
c o n ce n tr a tio n

0 ,2

0
O

0,2

0 ,4

0,6

0,8

Fi

150

25

D.TOUIJAR

02/10/2013

(2) Indice de concentration

Analogie :

(a) Dfinition

L'indice de concentration ou indice de


Gini, que l'on note IC est donn par :

Distribution

I C = 1 f i ( G i 1 + G i )
i =1

I C = 1 f i ( G i + G i 1 )
i =1

= 1- 0,872 = 0,128 = 12,8 %


151

fi

Fi

i 1i k

ni
n
fi
Fi
Me
F(x)

Salaires

{(x , n ) } Distribution {(x , n x ) }


i i 1i k

si = ni xi
S =S ni xi
gi
Gi
Ml
G(x)

Gi = Si

fi(Gi-1+Gi)
0,013
0,142
0,149

PARTIE 2

SERIES DOUBLES

152

[10 , 12[

0,136

0,136

[12 , 15[

0,318

0,454

0,092
0,356
0,375

[15 , 20[

0,410

0,864

0,797

0,473
0,481

[20 , 25[

0,091

0,955

0,923

0,157

[25 , 30[

0,045

0,087

Total

____

____

0,887
0,872

FIN

Ajustement linaire et Corrlation

153

I) TABLEAUX DE CONTINGENCE
(1) Exemple introductif
On dsire tudier la rpartition de 50184 salaris
selon lanciennet et le salaire mensuel.
Posons :

Y en
CDH
X en
anne

X : la v .s .c . dsignant l ' anciennet en anne

Y : la v .s .c . dsignant le salaire mensuel (en DH )

Total

Les donnes sont reprsentes par le tableau


suivant :
155

2890

1836

102

4828

9044

7378

884

204

17510

5746

10404

1564

374

18088

1666

6018

1666

408

9758

19346

25636

4216

986

50184

Source :statistiques de la dlgation rgionale du centre


Nord : octobre 1984 en se basant sur le recensement de la
156
population et de lhabitat de 1982 : milieu urbain

26

D.TOUIJAR

02/10/2013

Si on ne considre que la 1re ligne Y et la dernire


ligne (Total) on obtient la rpartition des 50184 salaris
selon le salaire (c..d. la distribution marginale de Y)
nj 19346 25636 4216

986

50184

De mme si on ne considre que la 1re colonne (X)


la dernire colonne (Total) on obtient la
X
ni
rpartition des 50184 salaris selon
4828
lanciennet : distribution marginale
17510
de (X)
La ligne (Total) et la colonne (Total)
sont appeles marges.

18088

Total

5
25

6
30

9
35

12
45

Soient X et Y deux variables statistiques dfinies sur une


mme population de taille n. On note par (xi , yi ) ; i =1,2,....,n
le couple de valeurs de X et Y pour le ieme individu.

l=k=n

y1

y2

yi

yn

TOTAL

x1
x2

xi

9758

xn

50184
157

TOTAL

Le service des tudes conomiques de


la socit veut mesurer lincidence de la
modulation de la pression marketing
(variable X: explicative) sur la vente de
flacons de parfums ( variable Y:explique).
Il enregistre, alors, les ventes yi (en milliers
de flacons) ainsi que les dpenses
publicitaires xi (en milliers de DH)dans 5
zones :

xi
yi

Cas des donnes individuelles :


Exemple introductif

18
65

On cherche tudier la liaison pouvant


exister entre les variables X et Y . Pour ce,
on reprsente dans un repre orthogonal
les points (xi , yi ). Lensemble de ces points
sappelle nuage de points . La forme de ce
nuage nous renseigne sur la nature de la
liaison entre X et Y et le type de courbe
qui ajustera le mieux, ce nuage. On
sintresse au cas o cette courbe est une
droite (ajustement

linaire ou droite de

rgression ).

159

I) Ajustement linaire

Pour ajuster un nuage de points, on


choisi parmi toutes les courbes connues
(exponentielle, logarithme, droite...) celle
qui passera le plus proche de tous les
points du nuage.

Dans le cas o le nuage a une forme


allonge, il est vident que la droite est la
plus approprie. On parle alors d'un
ajustement linaire.

Pour dterminer lquation de la droite


dajustement on utilise, trs souvent, la
mthode des moindres carrs (M.M.C.).
161

158

160

Cette mthode consiste dterminer


lquation dune droite telle que la somme
des carrs des distances entre les points du
nuage et cette droite soit minimale.

(1) Droites dajustement


On applique la M.M.C. pour dterminer
les deux droites de rgression :
a) La droite de rgression de Y en X: est utilise pour
expliquer Y par X. Cette droite est note DY/X et a
pour quation y = a x + b.
O
Cov( X , Y )

a=

V (X )

et b = y ax

162

27

D.TOUIJAR

02/10/2013

1 n

Cov( X , Y ) = xi yi ( x y ) et
n i =1

1 n
1 n
x = xi et y = yi
n i =1
n i =1

Nuage de points: Ventes en


fonction de la Pub

70
Y

65

60
50

45
40

35
30

( )

1 n 2
V ( x) = xi x 2
n i =1

25
20
10

Revenons notre exemple introductif

5
4

10

12

14

16

18

163

xi

yi

xi yi

xi2

yi2

25

125

25

625

30

180

36

900

35

315

81

1225

12

45

540

144

2025

18

65

1170

324

4225

TOTAL

50

200

2330

610

9000

/n

10

40

466

122

1800
165

164

La forme du nuage est plus ou moins


allonge. On peut donc estimer y partir de
x grce la droite de rgression de Y en X:

15
50
x = xi = =10 mDH
5 i=1
5
15
200
y = yi =
= 40 mflacons
5 i=1
5

( )

1 n 2 2 610
V (x) = xi x =
100= 22
n
5
i
=
1

166

La droite DY/X a pour quation:

Cov ( X , Y ) = xy x y

y=ax+b

1
1
1

= xi yi xi yi
5 i =1
5 i =1 5 i =1
1
= 2330 10 40 = 66
5
66
a=
= 3 et b = 40 3 10 = 10
22
5

y

milliers flacons

= 
3 x + 10
 
flacon / DH

mDH

milliers flacons

a=3 est la pente de la droite, cela signifie


que

1 DH supplmentaire investi en pub

permet de vendre
167

3 flacons de plus.
168

28

D.TOUIJAR

02/10/2013

b) La droite de rgression de X en Y : elle est


utilise pour expliquer X par Y. Cette
droite a pour quation DX/Y : x =a y + b

Cov( X ,Y )
et
V (Y )

a' =

b' = x a ' y

Remarque : Gnralement, on trace les


deux droites DX/Y et DY/X dans un mme
repre. Dans ce cas, l'quation de DX/Y
s'crit :

y=

70

1
b
x
a
a

o a' 0.

DX / Y : y = 3,03 x + 9,7
170

REMARQUES:

Dx/y : y = 3,03x + 9,7

|a| < (1 / |a|); do la pente de DY/X est plus


petite que celle de DX/Y ; donc DY/X plus
horizontale que DX/Y.

60
55
y = 3x + 10

50

( )

1 5 2
V ( y ) = y i y 2 = 1800 1600
5 i =1
66
= 200 et a =
= 0,33
200
b = 10 0,33 40 = 3, 2

169

Nuage de points: Ventes en


fonction de la Pub

65

Revenons encore une fois notre exemple

45
40

Plus les deux droites de rgression D et


D sont proches lune de lautre, cest
dire que langle entre DY/X et DX/Y est petit
plus la liaison linaire entre X et Y est
forte.

G(x,y)

35
30
25
20
4

9 10 11 12 13 14 15 16 17 18 19
171

II) Coefficient de corrlation linaire

Dans le cas dune liaison linaire entre X et Y, on


mesure le degr de cette liaison par le coefficient de
corrlation linaire.
(1) Dfinition : Le

coefficient de corrlation
linaire associ X et Y, que lon note r, est
donn par :
r=

Cov ( X , Y )
Cov ( X , Y )
=
X . Y
V ( X ).V (Y )

r est sans dimension

173

172

(2) Proprits
(a) Le coefficient r a le mme signe que Cov(X,Y), ce
qui donne le signe de la liaison :
- Si r < 0, alors la liaison linaire est ngative.
- Si r > 0, alors la liaison linaire est positive.
- Si r = 0, alors la liaison linaire est nulle.
(b) -1 r +1 :
i) Pus la valeur absolue de r est proche de 1 et plus
la corrlation (ou la liaison) linaire entre X et Y est
forte.
ii) Pus la valeur absolue de r est proche de 0 et plus
la corrlation linaire entre X et Y est faible
174

29

D.TOUIJAR

02/10/2013

-1 < r < 0

r = -1

Valeurs de r pour interprtation:

0 |r| < 0,40 : faible ou quasi absence de


corrlation

Une liaison linaire


relative et ngative.

Une liaison linaire


totale et ngative.

0,40 | r | < 0,60 : moyenne corrlation

D


D

0,60 | r | < 0,80 : bonne corrlation;


0,80 | r |
1 : corrlation leve.

176

175

r=1

r=0
Y

0<r<1

Indpendance totale.

Une liaison linaire totale et positive.

Une liaison linaire relative et


positive.
177

178

Revenons encore une fois notre exemple

r=

cov ( X , Y )
66
=
= 0,99
V ( X )V (Y ) 66 ,33

PARTIE 3

Conclusion:

r est positif et sa valeur est trs proche de


1, donc il y a une trs forte corrlation
linaire entre X et Y et est positive. Cest
ce que lon a constat graphiquement par
la construction des droites D et D.

LES INDICES :

179

30

D.TOUIJAR

02/10/2013

I) Indices lmentaires

Introduction :

Le concept dindice est dfini par la


comparaison de toutes les observations
lune delle (la 1re par exemple), et ce
dans le temps et/ou dans lespace.
Un indice peut tre lmentaire (1seul
article: prix du pain, des oranges) ou
synthtique (plusieurs articles : produits
alimentaires, indices de capitalisation:
MASI et MADEX)

(1) Dfinition : Soit

X une grandeur simple


prenant les valeurs x0 et x1 aux dates t0 et t1 .
On appelle indice simple (ou lmentaire) de X
entre les dates t0 et t1, le quotient :

I t1

(X ) =
t0

xt1
xt 0

x1
x0

181

Remarque : Souvent, on crit et on lit :

I 1 (X ) =
0

182

On calcule lindice du nombre de touristes


aux frontires en 2001 base 100 en 2000

x1
100
x0

I 01

Indice de X la date 1, base 100 la date 0

Exemple : Arrives de touristes aux


frontires du Maroc (en milliers)
Avril 2000
250

Av. 2001
260

00

( X ) = 260 100 = 104


250

Le taux de variation en 2001 est

Av.2002
205

r X = I 01

Base100 en 2000 (Avril)

00

( X ) 100 = +4%

183

184

On vrifie que :

(2) Proprits des indices simples :


a) Identit : I 0 0 = 100

I 01 I 00 = 104 96,15 10000


00

b) Rversibilit :

I t = I 0 100
0
t

c) Circularit :

I tn =

Remarque : b) scrit aussi

t0

I t I 0 = 100 2
0

01

I tn

t n1

I t n1

I t1

t n2
( n 1)

t0

100

Exemple :

Exemple :

x
250
I 00 ( X ) = 0 100 =
100 = 96,15
01
x1
260
185

I 02

00

( X ) = x2 100 = 205 100 = 82


x0

250

186

31

D.TOUIJAR

02/10/2013

205

Et I 02 I 01 =
100 104 =
01
00
260

I 02 I 01
00
78,8 104 = 8200 01
= 82
100
Remarque : si X=YxZ ; alors

I 1 (X ) =

I 1 (Y ) I 1 (Z )
0

Notons

xtj
I ( X ) = j 100
0
x0
j
t

Lindice lmentaire de la variable X j la


date t, base 100 la date 0

100

II) Indices synthtiques


Soit X une grandeur complexe, compose
de k variables simples :
X 1 , X 2 , , X k.

187

synthtique t/0 , est un


nombre qui rsume la srie des k indices
simple (I1t/0 ,I2t/0 ,, Ikt/0).

(1) Dfinition : Lindice

Exemple : I.G.P. (Produits alimentaires,


Produits non alimentaires)

188

(2) Diffrentes formules dindices synthtiques


a) Indice de laspeyres :t/0

est la moyenne
arithmtique des indices simples Ijt/0 pondrs
par les coefficients 0j (calculs lanne de
base et dsignent limportance relative de Xj)

j
k
k
t/0 = 0j I t j/ 0 = 0j xtj 100
j =1

j =1

x0

o 0j = 1
189

b) Indice de Paasche :Pt/0

est la moyenne
harmonique des indices simples Ijt/0 pondrs
par les coefficients t j (calculs la date
courante t )

Pt/0 =

1
k

I
j =1

j
t/ 0

j =1

190

c) Indice de Fisher :t/0

est la moyenne
gomtrique de laspeyres et de paasche :

t/0 = t/0 x Pt/0

100
x0j
t j

xt
j =1

Souvent, on a

Pt/0 t/0 t/0


191

192

32

D.TOUIJAR

02/10/2013

(3) Proprits des indices synthtiques


a) La circularit nest vrifie par aucun des trois
indices.
b) Lindice de Fisher est le seul pouvoir vrifier
la proprit de rversibilit; En effet
j
x
0
0/t = t j 100
xt
j =1
k

(1/Pt/0 )x1002x(1/

100

j
j xt

0
x0j
j =1
k

t/0 x Pt/0

t/0

1002 =

1
1002
t/0

0/t = 1002

t/0 ) x1002
193

(4)Les indices utiliss dans la pratiques

194

Do :

a)Indice des Prix :

i) L indice de laspeyres des Prix


j
j
Soient p0 et q0 respectivement le prix et la
quantit de larticle j consomm lanne
j
j
de base 0. et soient pt et qt ceux de
lanne courante t. Alors lindice de
laspeyres des prix, not t/0 (p), est :
k

t/0 (p) = 0

j =1

ptj
100 ; o 0j =
j
p0

p 0j q 0j
k

p
j =1

j
0

q 0j

t/0 (p) =

p t j q 0j

j =1
k

100

j
0

p q

j =1

j
0

Remarque
j

le produit p0 q0 nest autre que la valeur


de larticle j consomm lanne de base
0.

195

196

t/0 (p) est donc la moyenne arithmtique


des indices des prix des k articles
pondrs par leur valeur globale la date
0. Il dcrit lvolution du prix dun panier
de consommation dont les quantits sont
choisies lanne de base.

Pt/0 (p) =

j
j p0
t j

pt
j =1
k

; o t =

197

p q
j

j =1

q
Pt/0 ( p) =

j =1
k

q
j =1

Cest la moyenne harmonique des indices


des prix des k articles pondrs par leur
valeur globale (tj) la date courante t.

ptj qtj

Do

ii) L indice de Paasche des Prix

100

ptj

j
0

100
t

Il dcrit lvolution du prix dun panier de


consommation dont les quantits sont
choisies lanne courante

198

33

D.TOUIJAR

02/10/2013

b) Indice des Quantits :

ii) L indice de paasche des Quantits


k

i) L indice de laspeyres des Quantits

Cette fois les prix sont constants et les


quantits sont variables :

Pt/0 (q) =

qtj
t/0 (q) = j 100 =
q0
j =1
k

j
0

p q

j j
0 t

j =1
k

p q

100

j j
0 0

j =1

p q
j

On a aussi

t/0 (p) x Pt/0 (q) t/0 (q) x Pt/0 (p)


100

Et on a encore :

Dt/0=

100 =

p q
j =1

j j
0 0

Dpenses Totales la date t


Dpenses Totales la date 0
200

Anne
1999
2001
Pain
50%
25%
Ptisserie 30%
40%
Gteaux 20%
35%
Les indices des prix(base100 en 98) ont suivi
lvolution suivante Anne
1999
2001
Pain
100,8
Ptisserie 100,8
Gteaux
100,9

t/0 (p) x t/0(q)


100

201

Questions:

Anne

P (p) base 100 en 1999.

1- Calculer

j =1
k

Exercice1: Le C.A. de la filire boulangerie ptisserie


dune grande surface a t multipli par 1,5 entre
1999 et 2001 et se rpartissait ainsi

t/0 (d) =Pt/0 (d) = Dt/0


=

100
= jk=1
100
j
j j
j q0
t j q0 pt

qt
j =1
j =1
k

Dt/0 =

Posons d = p x q ; alors :

100

ptj

c) Indice de Dpenses (ou valeurs)

199

Dt/0=

I 01

99

C01j t j

104,7
103,9
107,7
202

j
t

01 / 99

2- Calculer lindice du chiffre daffaire en01/99

Pain

103,9

25

0,25

0,002

3- En dduire un indice de quantit 01/99.

Ptisserie

103,1

40

0,40

0,004

Gteaux

106,7

35

0,35

0,003

Total

----

100

0,009

Rponse
1. Calculons dabord les indices
simples base 100 en 99; Circularit

I 01 I 99j
j

I j 0198 =

99

100

98

I 01 =
j

99

I 01j
I

j
99

98
98

C01j
P01/ 99 ( p) = k
; o t =
C01j
t j

I 01j / 99
j =1
1

100
203

204

34

D.TOUIJAR

Do

02/10/2013

P01 / 99 ( p ) =

1
= 111,1
0,009

2- lindice du chiffre daffaire en 01/99 :

V01/
01/99 = 150 (par nonc).
3- indice de quantit ; on a :

t/0 (q)=

V 01 / 99

P 01 / 99 ( p )

100 =

150
100 = 135
111 ,1

205

35

Vous aimerez peut-être aussi