Vous êtes sur la page 1sur 318

Statistique Appliquee a la finance

Jaouad Madkour
e-mail: jaouad.madkour@outlook.com

Master Finance, Banque et Marches

Faculte des sciences juridiques, economiques et sociales - Tanger

2016/2017

1/1
Introduction

I Quest ce que LA statistique ?

I Objectif pedagogique du cours

I Pre-requis necessaires

I Plan du cours

2/1
Introduction

I Quest ce que LA statistique ?

La statistique est une branche des mathematiques qui permet dextraire,


danalyser et dexploiter linformation contenue dans un ensemble de donnees.
Ces donnees sont appelees des statistiques .

On distingue deux sortes de statistiques :


La statistique descriptive : elle considere un ensemble de donnees dans sa
globalite et le synthetise dans des tableaux, des graphiques et des indicateurs.
La statistique inferentielle : elle se base sur un sous-ensemble de donnees pour
rendre des conclusions sur lintegralite des donnees.

3/1
Introduction
Statistique descriptive

4/1
Introduction
I Objectif pedagogique du cours

Taxonomie de Bloom

5/1
Introduction

I Pre-requis necessaires

Bien que la statistique descriptive soit une branche des mathematiques qui a
des applications dans dautres disciplines telles que la biologie, la demogra-
phie, leconomie, la finance, la gestion..., elle ne necessite que des connais-
sances en mathematiques de niveau college et les outils de la discipline a
laquelle elle sapplique.

6/1
Introduction

I Plan du cours

Chapitre 1 : Organisation des donnees

Chapitre 2 : Series statistiques a une dimension

Chapitre 3 : Series statistiques a deux dimensions

7/1
Chapitre 1 : Organisation des donnees

Section 1 : Vocabulaire et operateurs statistiques

Section 2 : Tableaux statistiques

Section 3 : Representations graphiques

8/1
1. Organisation des donnees

Section 1 : Vocabulaire et operateurs statistiques

Sous section 1 : Vocabulaire statistique

Sous section 2 : Typologie des variables statistiques

Sous section 3 : Operateurs statistiques et

9/1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques

Sous section 1 : Vocabulaire statistique

1.1.1.1. Population, echantillon et unite statistique

1.1.1.2. Caractere et modalite

1.1.1.3. Effectifs et frequences

1.1.1.4. Serie et distribution statistiques

10 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique

1.1.1.1. Population, echantillon et unite statistique


Definitions :

Population : un ensemble de personnes ou dobjets.

Echantillon : une partie de la population.

Unite statistique ou individu : un element de la population.

11 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.1. Population, echantillon et unite statistique

12 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.1. Population, echantillon et unite statistique

Exemple 1 :
Population : Moyens de transport au Maroc.
Unites statistiques : Motocycles, trains, autocars...
Echantillon : Vehicules immatricules en 2016.

Exemple 2 :
Population : Production agricole au Maroc.
Unites statistiques : Ble, tomates, pommes, vaches...
Echantillon : Production de cereales dans la region Settat-Casablanca.

13 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique

1.1.1.2. Caractere et modalite


Definitions :
Caractere : lobjet selon lequel la population est etudiee.

Modalite : une valeur prise par le caractere etudie.

Remarques :
Un caractere est aussi appele variable statistique, il est note en lettres
majuscules X , Y , ...

Une modalite est egalement appelee observation, elle est notee en


lettre minuscule indicee par le numero de la modalite xi , yj , ...

Un caractere X peut avoir plusieurs modalites x1 , x2 , ..., xk .

14 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.2. Caractere et modalite

Exemple 1 (suite) :
Population : Moyens de transport au Maroc.
Caractere : Carburant utilise.
Modalites : Diesel, essence...

Exemple 2 (suite) :
Population : Production agricole au Maroc.
Caractere : Volume de la production en millions de tonnes.
Modalites : 5, 10, 20...

15 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique

1.1.1.3. Effectifs et frequences


Definitions :
Effectif ni dune modalite xi : nombre dindividus ayant la modalite xi .

Effectif total n : nombre dindividus composant la population.

Frequence fi dune modalite xi : proportion dindividus ayant la


modalite xi , elle est donnee par :
ni
fi =
n

16 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.3. Effectifs et frequences

Remarques :
Leffectif total n est egal a la somme de tous les effectifs ni :

n1 + n2 + + nk = n

La somme des frequences fi est egale a 1 car :


n1 n2 nk
f1 + f2 + + fk = + + +
n n n
n1 + n2 + + nk
=
n
n
=
n
=1

17 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.3. Effectifs et frequences

Remarque :

Il peut arriver que la somme des fre-


quences ne soit pas egale a un a cause
des problemes darrondis comme dans
xi ni fi
lexemple ci-contre, dans une telle si- x1 1 1/3 0.33 0.34
tuation il est dusage de manipuler le- x2 1 1/3 0.33 0.33
gerement lune des frequences de sorte x3 1 1/3 0.33 0.33
Somme 3 0.99 1
que la somme soit precisement egale a
un.

18 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.3. Effectifs et frequences

Exemple :

Moyennes obtenues au baccalaureat

10 13 12 14 10 13 11 12 11 10
11 14 10 13 12 10 12 13 12 10
13 16 14 11 13 15 10 13 12 14
10 15 11 14 12 15 12 11 13 10
12 15 14 10 13 11 16 13 11 15
12 11 13 10 14 16 15 11 15 12
13 11 14 11 14 12 15 13 12 13
11 12 10 16 11 14 14 13 14 10

19 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.3. Effectifs et frequences

Exemple (suite) :

Moyennes obtenues au baccalaureat

i xi ni fi = ni /n
1 10 13 13/80 = 0.1625
2 11 14 14/80 = 0.1750
3 12 14 14/80 = 0.1750
4 13 15 15/80 = 0.1875
5 14 12 12/80 = 0.1500
6 15 08 08/80 = 0.1000
7 16 04 04/80 = 0.0500
Somme n = 80 1

20 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.3. Effectifs et frequences

Definitions (suite) :
Effectif cumule croissant Ni+ dune modalite xi : nombre dindividus
ayant des modalites au plus egales a la modalite xi :

Ni+ = n1 + n2 + + ni

Effectif cumule decroissant Ni dune modalite xi : nombre dindividus


ayant des modalites au moins egales a la modalite xi :

Ni = nk + nk 1 + + ni

21 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.3. Effectifs et frequences
Exemple (suite) :

Moyennes obtenues au baccalaureat

i xi ni Ni+ Ni
1 10 13 13 67+13 = 80
2 11 14 13+14 = 27 53+14 = 67
3 12 14 27+14 = 41 39+14 = 53
4 13 15 41+15 = 56 24+15 = 39
5 14 12 56+12 = 68 12+12 = 24
6 15 08 68+08 = 76 04+08 = 12
7 16 04 76+04 = 80 04
Somme n = 80

22 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.3. Effectifs et frequences

Definitions (suite) :
Frequence cumulee croissante Fi+ dune modalite xi : proportion din-
dividus ayant des modalites au plus egales a la modalite xi :

Fi+ = f1 + f2 + + fi

Frequence cumulee decroissante Fi dune modalite xi : proportion din-


dividus ayant des modalites au moins egales a la modalite xi :

Fi = fk + fk 1 + + fi

23 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.3. Effectifs et frequences

Exemple (suite) :

Moyennes obtenues au baccalaureat

i xi fi Fi+ Fi
1 10 0.1625 0.1625 0.8375+0.1625 = 1.0000
2 11 0.1750 0.1625+0.1750 = 0.3375 0.6625+0.1750 = 0.8375
3 12 0.1750 0.3375+0.1750 = 0.5125 0.4875+0.1750 = 0.6625
4 13 0.1875 0.5125+0.1875 = 0.7000 0.3000+0.1875 = 0.4875
5 14 0.1500 0.7000+0.1500 = 0.8500 0.1500+0.1500 = 0.3000
6 15 0.1000 0.8500+0.1000 = 0.9500 0.0500+0.1000 = 0.1500
7 16 0.0500 0.9500+0.0500 = 1.0000 0.0500
Somme 1.0000

24 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.3. Effectifs et frequences
Remarques :

Suivant la tradition anglo-saxonne, les effectifs ni sont aussi appeles


frequences absolues et les frequences fi sont appelees frequences relatives.
Il ne faut pas confondre frequence fi et pourcentage pi ; une
frequence est comprise entre 0 et 1 tandis quun pourcentage est compris
entre 0 et 100. On obtient un pourcentage en multipliant une frequence
par 100 et on le note a laide du symbole % :

pi = (fi 100) %

Lexpression au plus est equivalente a inferieur ou egal et lex-


pression au moins est equivalente a superieur ou egal .
Les effectifs et les frequences cumules nont de sens que lorsquil est pos-
sible de classer les observations dans un ordre croissant ou decroissant.

25 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique

1.1.1.4. Serie et distribution statistiques

Definition :
Une serie statistique est une suite dobservations brutes ou ordonnees. Il
sagit, par exemple, des reponses collectees lors dune enquete, des notes
obtenues dans une epreuve ecrite...etc.

Exemples :

Serie brute : 12 18 10 17 11 15 12 17 18 10

Serie ordonnee : 10 10 11 12 12 15 17 17 18 18

26 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.1. Vocabulaire statistique
1.1.1.4. Serie et distribution statistiques

Definition :
Une distribution statistique est lassociation entre les modalites xi dune va-
riable statistique et les effectifs ni ou les frequences fi correspondants. Elle
montre comment les effectifs ou les frequences sont distribues entre les mo-
dalites.

Exemples :

Distribution statistique des effectifs


xi 10 11 12 15 17 18
ni 2 1 2 1 2 2

Distribution statistique des frequences


xi 10 11 12 15 17 18
fi 0.2 0.1 0.2 0.1 0.2 0.2

27 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques

Sous section 2 : Typologie des variables statistiques

1.1.2.1. Variable statistique quantitative

1.1.2.2. Variable statistique qualitative

28 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.2. Typologie des variables statistiques

1.1.2.1. Variable statistique quantitative


Definitions :
I Une variable statistique est dite quantitative si elle peut etre mesuree et
representee par un nombre ayant un sens mathematique.

Une variable statistique quantitative est continue si elle peut prendre


toutes les valeurs possibles dun intervalle.

Une variable statistique quantitative est discrete si elle ne peut prendre


que des valeurs isolees mais pas necessairement entieres.

29 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.2. Typologie des variables statistiques
1.1.2.1. Variable statistique quantitative

Exemples de variable continue :

Poids en kilogrammes (20 kg, 22.5 kg...)

Taille en metres (1.70 m, 1.75 m...)

Age en annees (20 ans, 22.5 ans...)

Exemples de variable discrete :

Nombre denfants par famille (1, 2, 3...)

Nombre de vehicules par menage (0, 1, 2...)

Nombre dunites produites par une machine (100, 200, 300...)

30 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.2. Typologie des variables statistiques
1.1.2.1. Variable statistique quantitative

Definition :

Une classe est un intervalle semi-ferme [xi1 ; xi [ contenant les modalites dune
variable statistique continue comprises entre la valeur xi1 (borne inferieure)
et la valeur xi (borne superieure), la premiere etant incluse dans lintervalle
et la deuxieme en est exclue. La derniere classe est generalement un intervalle
ferme [xk 1 ; xk ].

Une classe [xi1 ; xi [ se caracterise par son amplitude ai = xi xi1 et par


son centre ci = (xi1 + xi )/2 et doit avoir un effectif au moins egal a 5.

On convient de donner a une classe le numero de sa borne superieure. Par


exemple, la classe [x3 ; x4 [ est la classe numero 4.

31 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.2. Typologie des variables statistiques
1.1.2.1. Variable statistique quantitative

Remarque :

La distinction entre une variable continue et une variable discrete nest pas
toujours aussi simple car, dune part, la precision dune variable continue est
souvent limitee a quelques decimales apres la virgule et rend donc ses valeurs
isolees et, dautre part, une variable discrete peut prendre une infinite de
valeurs quelles deviennent tres proches.

Ainsi, une variable statistique sera continue des que sont traitement necessite
le regroupement de ses modalites en classes. En revanche, si une variable
statistique ne prend que quelques valeurs, meme decimales, dont le traitement
ne necessite pas des regroupements en classes, alors la variable en question
est discrete.

32 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.2. Typologie des variables statistiques

1.1.2.2. Variable statistique qualitative


Definitions :
I Une variable statistique est dite qualitative si elle ne peut pas etre me-
suree ni representee par un nombre ayant un sens mathematique.

Une variable statistique qualitative est ordinale sil est possible detablir
un ordre universel entre ses modalites.

Une variable statistique qualitative est nominale sil nest pas possible
detablir un ordre universel entre ses modalites.

Les categories dune variables qualitatives designent simplement ses mo-


dalites. Par consequent, une variable qualitative sappelle aussi une va-
riable categorielle.

33 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.2. Typologie des variables statistiques
1.1.2.2. Variable statistique qualitative

Exemples de variable ordinale :

Niveaux detudes (licence, master...)

Niveaux de satisfaction (pas satisfait, satisfait, tres satisfait...)

Niveaux hierarchiques (ouvriers, PDG...)

Exemples de variable nominale :

Couleurs (rouge, bleu...)

Diplomes (litteraire, scientifique...)

Genre (homme ou femme)

34 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.2. Typologie des variables statistiques
1.1.2.2. Variable statistique qualitative
Remarques :

Il est parfois difficile de savoir si une variable statistique est ordinale ou


nominale, lexemple typique est celui des categories socioprofessionnelles
ou on a tendance a classer les ouvriers a un niveau inferieur a celui des
cadres. Ce classement est base sur le salaire que percoivent les uns et
les autres ou sur leur niveau de qualification, mais il sera inverse si lon
considerait plutot leur niveau de stress par exemple.

Les categories dune variable qualitative peuvent etre codees par des
nombres demunis de toute signification mathematique. On peut, par
exemple, donner a la couleur bleue le code 1, a la couleur rouge le code 2
et a la couleur verte le code 3. Ces codes nont pas de sens mathematique
car 1+2 = 3 ne signifie pas que melanger la couleur bleue avec la couleur
rouge produit la couleur verte !

35 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques

Sous section 3 : Operateurs statistiques et

1.1.3.1. Operateur statistique (sigma)

1.1.3.2. Operateur statistique (pi)

1.1.3.3. Applications

36 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et

1.1.3.1. Operateur statistique (sigma)

Definition :
Soit X une variable statistique quantitative prenant les valeurs x1 , x2 , ,xk
avec k N.

Loperateur permet decrire la somme x1 + x2 + + xk de facon plus


compacte :
X k
xi x1 + x2 + + xk
i=1

ou i est une variable muette representant lindice de sommation.

On lit : somme des xi avec i allant de 1 a k .

37 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.1. Operateur statistique (sigma)

Proprietes de loperateur :

Soient X et Y deux variables statistiques quantitatives prenant respective-


ment les valeurs x1 , x2 , ,xk et y1 , y2 , ,yk avec k N. Loperateur
verifie les proprietes suivantes :

k
X k
X
axi = a xi , a R
i=1 i=1
k
X k
X k
X
(xi + yi ) = xi + yi
i=1 i=1 i=1
k
X b
X k
X
xi = xi + xi , b N \ 1 < b < k
i=1 i=1 i=b+1
k
X
a = k .a , a R
i=1

38 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.1. Operateur statistique (sigma)

Demonstrations :
Propriete 1 :
k
X
axi = ax1 + ax2 + + axk
i=1

= a (x1 + x2 + + xk )
| {z }
Pk
i=1 xi

k
X
=a xi
i=1

39 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.1. Operateur statistique (sigma)

Demonstrations (suite) :
Propriete 2 :
k
X
(xi + yi ) = (x1 + y1 ) + (x2 + y2 ) + + (xk + yk )
i=1

= (x1 + x2 + + xk ) + (y1 + y2 + + yk )
| {z } | {z }
Pk Pk
i=1 xi i=1 yi

k
X k
X
= xi + yi
i=1 i=1

40 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.1. Operateur statistique (sigma)

Demonstrations (suite) :
Propriete 3 :
k
X
xi = x1 + x2 + + xb + xb+1 + xb+2 + + xk
i=1

= (x1 + x2 + + xb ) + (xb+1 + xb+2 + + xk )


| {z } | {z }
Pb Pk
i=1 xi i=b+1
xi

b
X k
X
= xi + xi
i=1 i=b+1

41 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.1. Operateur statistique (sigma)

Demonstrations (suite) :
Propriete 4 :
k
X
a = a + a + + a
| {z }
i=1
k fois

= k .a

42 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et

1.1.3.2. Operateur statistique (pi)


Definition :
Soit X une variable statistique quantitative prenant les valeurs x1 , x2 , ,xk
avec k N.

Loperateur permet decrire le produit x1 x2 xk de facon plus


compacte :
Y k
xi x1 x2 xk
i=1

ou i est une variable muette representant lindice de multiplication.

On lit : produit des xi avec i allant de 1 a k .

43 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.2. Operateur statistique (pi)

Proprietes de loperateur :

Soient X et Y deux variables statistiques quantitatives prenant respective-


ment les valeurs x1 , x2 , ,xk et y1 , y2 , ,yk avec k N. Loperateur
verifie les proprietes suivantes :

k
Y
a = a k , a R
i=1
k
Y k
Y k
Y
(xi yi ) = xi yi
i=1 i=1 i=1
k
Y b
Y k
Y
xi = xi xi , b N \ 1 < b < k
i=1 i=1 i=b+1
k
Y k
Y
axi = a k xi , a R
i=1 i=1

44 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.2. Operateur statistique (pi)

Demonstrations :
Propriete 1 :
k
Y
a = a a a
| {z }
i=1
k facteurs

= ak

45 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.2. Operateur statistique (pi)

Demonstrations (suite) :
Propriete 2 :
k
Y
(xi yi ) = (x1 y1 ) (x2 y2 ) (xk yk )
i=1

= (x1 x2 xk ) (y1 y2 yk )
| {z } | {z }
Qk Qk
i=1 xi i=1 yi

k
Y k
Y
= xi yi
i=1 i=1

46 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.2. Operateur statistique (pi)

Demonstrations (suite) :
Propriete 3 :
k
Y
xi = x1 x2 xb xb+1 xb+2 xk
i=1

= (x1 x2 xb ) (xb+1 xb+2 xk )


| {z } | {z }
Qb Qk
i=1 xi i=b+1
xi

b
Y k
Y
= xi xi
i=1 i=b+1

47 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.2. Operateur statistique (pi)

Demonstrations (suite) :
Propriete 4 :
k
Y
axi = ax1 ax2 axk
i=1

= (a a a) (x1 x2 xk )
| {z } | {z }
k facteurs
Qk
i=1 xi

k
Y
= ak xi
i=1

48 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et

1.1.3.3. Applications

Calculer les sommes suivantes :


k
X
(xi + a)
i=1
k
X
(xi + a)2
i=1
k
X
(xi + yi )2
i=1

Que vaut le logarithme dun produit ?


k
!
Y
log xi
i=1

49 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.3. Applications

Solutions :
k
X
(xi + a) = (x1 + a) + (x2 + a) + + (xk + a)
i=1

= x1 + a + x2 + a + + xk + a

= (x1 + x2 + + xk ) + (a + a + + a)
k
X k
X
= xi + a
i=1 i=1

k
X
= xi + ka
i=1

50 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.3. Applications
Solutions (suite) :
k
X
(xi + a)2 = (x1 + a)2 + (x2 + a)2 + + (xk + a)2
i=1

= x12 + 2ax1 + a 2 + x22 + 2ax2 + a 2 + + xk2 + 2axk + a 2


  

= x12 + 2ax1 + a 2 + x22 + 2ax2 + a 2 + + xk2 + 2axk + a 2

= (x12 + + xk2 ) + (2ax1 + + 2axk ) + (a 2 + + a 2 )

k
X k
X k
X
= xi2 + 2axi + a2
i=1 i=1 i=1

k
X k
X
= xi2 + 2a xi + k .a 2
i=1 i=1

51 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.3. Applications

Solutions (suite) :
k
X
(xi + yi )2 = (x1 + y1 )2 + (x2 + y2 )2 + + (xk + yk )2
i=1

= x12 + 2x1 y1 + y12 + + xk2 + 2xk yk + yk2


 

= x12 + 2x1 y1 + y12 + + xk2 + 2xk yk + yk2

= (x12 + + xk2 ) + (2x1 y1 + + 2xk yk ) + (y12 + + yk2 )


k
X k
X k
X
= xi2 + 2xi yi + yi2
i=1 i=1 i=1

k
X k
X k
X
= xi2 + 2 xi yi + yi2
i=1 i=1 i=1

52 / 1
1. Organisation des donnees
1.1. Vocabulaire et operateurs statistiques
1.1.3. Operateurs statistiques et
1.1.3.3. Applications

Rappel :
log (a b) = log (a) + log (b)

Solutions (suite) :

k
!
Y
log xi = log (x1 x2 xk )
i=1

= log (x1 ) + log (x2 ) + + log (xk )


k
X
= log (xi )
i=1

53 / 1
1. Organisation des donnees

Section 2 : Tableaux statistiques

Sous section 1 : Variables qualitatives nominales

Sous section 2 : Variables qualitatives ordinales

Sous section 3 : Variables quantitatives discretes

Sous section 4 : Variables quantitatives continues

54 / 1
1. Organisation des donnees
1.2. Tableaux statistiques

Definition :
Le tableau statistique est une representation synthetique dune distribution
statistique. Il fournit des informations sur chacune des modalites prises par
la variable statistique etudiee. Ces informations sont leffectif de chaque mo-
dalite, sa frequence, ses effectifs cumules, ses frequences cumulees ou toute
autre information utile telle que le centre ou lamplitude des classes.

55 / 1
1. Organisation des donnees
1.2. Tableaux statistiques

Sous section 1 : Variables qualitatives nominales

56 / 1
1. Organisation des donnees
1.2. Tableaux statistiques
1.2.1. Variables qualitatives nominales

Exemple :

Elections legislatives

Lors delections legislatives, 40 citoyens ont vote en choisissant la couleur cor-


respondant a lun des quatre partis politiques presentes dans leur commune.
Voici le resultat du vote :

B V R O R O R B R B

B V B R V B V B O R

V V R B R V O R O B

B B V B V R B B O R

ou les lettres B, V, R et O designent respectivement les couleurs bleue, verte,


rose et orange.

57 / 1
1. Organisation des donnees
1.2. Tableaux statistiques
1.2.1. Variables qualitatives nominales

Voici le tableau statistique relatif a la serie statistique des votes :

Categories ni fi
Vert 9 0.225
Bleu 14 0.350
Orange 6 0.150
Rose 11 0.275
Total 40 1.000

A partir de ce tableau, on peut facilement noter que le parti politique re-


presente par la couleur bleue a recueilli le maximum de voix et que le parti
associe a la couleur orange arrive en dernier dans ces elections.

58 / 1
1. Organisation des donnees
1.2. Tableaux statistiques

Sous section 2 : Variables qualitatives ordinales

59 / 1
1. Organisation des donnees
1.2. Tableaux statistiques
1.2.2. Variables qualitatives ordinales

Exemple :

Diplomes dune commune

On a recense les diplomes dune commune et lon a obtenu la serie


statistique ci-dessous :

B M L D B L M M B D L B
L B L B B L M B L B B B
B M B B L L B L B L L L
L M D B M B B L D B M M
B L B M L B M L D B M B

ou les lettres B, L, M et D correspondent respectivement au baccalaureat, a


la licence, au master et au doctorat.

60 / 1
1. Organisation des donnees
1.2. Tableaux statistiques
1.2.2. Variables qualitatives ordinales

Le tableau statistique associe a la serie des diplomes est le suivant :

Diplomes ni fi Ni+ Ni Fi+ Fi


Baccalaureat 25 0.42 25 60 0.42 1
Licence 18 0.30 43 35 0.72 0.58
Master 12 0.20 55 17 0.92 0.28
Doctorat 5 0.08 60 5 1 0.08
Total 60 1

Pour trouver le nombre de personnes ayant au moins une licence, il suffit de


se reporter a la cellule situee a lintersection de la ligne Licence et de la
colonne Ni . La reponse est 35.
Pour connatre la proportion dindividus ayant au plus un master, il faut lire
la reponse dans la cellule se trouvant au croisement de la ligne Master et
de la colonne Fi+ . La reponse est 0.92.

61 / 1
1. Organisation des donnees
1.2. Tableaux statistiques

Sous section 3 : Variables quantitatives discretes

62 / 1
1. Organisation des donnees
1.2. Tableaux statistiques
1.2.3. Variables quantitatives discretes

Exemple :

Nombre denfants par famille

Lors dune etude demographique, on a classe 100 familles selon leur nombre
denfants. Voici la serie statistique obtenue :

1111111111112222222222222

2222222222222222222222222

2233333333333333333333333

3333333334444444444444444

Notons que cette serie est ordonnee et en consequence son traitement est
legerement plus simple que celui dune serie brute. En particulier, on peut
aisement reperer les extrema (minimum et maximum) de la serie.

63 / 1
1. Organisation des donnees
1.2. Tableaux statistiques
1.2.3. Variables quantitatives discretes
Le tableau statistique relatif a la repartition des familles selon leur nombre
denfants se presente comme suit :

x(i) ni fi Ni+ Ni Fi+ Fi


1 12 0.12 12 100 0.12 1
2 40 0.40 52 88 0.52 0.88
3 32 0.32 84 48 0.84 0.48
4 16 0.16 100 16 1 0.16
Total 100 1

A laide de ce tableau, on peut par exemple facilement trouver le nombre de


familles qui ont au plus 4 enfants, la reponse se trouve a lintersection de la
ligne 4 et de la colonne Ni+ , a savoir, 100 familles.
On peut egalement trouver la proportion de familles ayant au moins un en-
fant, il suffit alors de se reporter a la cellule situee sur la ligne 1 et sur
la colonne Fi . La reponse est 1.

64 / 1
1. Organisation des donnees
1.2. Tableaux statistiques

Sous section 4 : Variables quantitatives continues

65 / 1
1. Organisation des donnees
1.2. Tableaux statistiques
1.2.4. Variables quantitatives continues

Exemple :

Tailles dindividus

On a mesure les tailles de 55 individus en centimetres et lon a trouve les


mesures suivantes :

161.2 162.4 162.7 163.8 163.5 166.4 166.8 166.4 167.1 167.3 168.2
168.7 169.1 169.4 169.4 171.4 171.6 171.4 171.8 171.8 171.2 171.8
171.1 171.5 172.9 172.7 172.4 173.4 173.6 173.6 173.3 173.1 174.4
174.4 174.7 177.4 177.6 177.4 177.6 178.4 178.4 178.1 178.2 179.8
179.4 179.1 179.0 179.4 179.4 179.3 181.1 181.3 182.1 183.1 183.3

Pour faciliter le traitement de cette serie statistique, les mesures obtenues


seront regroupees dans des classes.

66 / 1
1. Organisation des donnees
1.2. Tableaux statistiques
1.2.4. Variables quantitatives continues
La tableau statistique associe a la distribution des tailles est le suivant :

Tailles (cm) ai ci ni fi Ni+ Ni Fi+ Fi


[160 ; 165 [ 5 162.5 5 0.09 5 55 0.09 1
[165 ; 170 [ 5 167.5 10 0.18 15 50 0.27 0.91
[170 ; 175 [ 5 172.5 20 0.36 35 40 0.63 0.73
[175 ; 180 [ 5 177.5 15 0.28 50 20 0.91 0.37
[180 ; 185 ] 5 182.5 5 0.09 55 5 1 0.09
Total 55 1

Le nombre 15, par exemple, situe en face de la classe [165; 170[ et sur la
colonne Ni+ est la somme de deux nombres de la colonne ni : le nombre 5
correspondant a la classe [160; 165[ et le nombre 10 correspondant a la classe
[165; 170[. 15 est donc le nombre dindividus ayant des tailles comprises entre
160 cm et 170 cm ou tout simplement des tailles au plus egales a 170 cm (la
borne superieure de la classe [165; 170[).

67 / 1
1. Organisation des donnees

Section 3 : Representations graphiques

Sous section 1 : Diagramme en barres

Sous section 2 : Diagramme en batons

Sous section 3 : Histogramme

Sous section 4 : Courbes cumulatives

68 / 1
1. Organisation des donnees
1.3. Representations graphiques

Chacune des colonnes dun tableau statistique peut etre representee graphi-
quement et a chaque colonne correspond un type particulier de representation
graphique.

Une representation graphique est une visualisation de lallure generale de


la distribution statistique au moyen de points, de segments, de surfaces et
dautres symboles ou formes geometriques.

Les representations graphiques sont tres nombreuses, seules seront presentees


les plus utilisees.

69 / 1
1. Organisation des donnees
1.3. Representations graphiques

Sous section 1 : Diagramme en barres

70 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.1. Diagramme en barres

Definition :

Le diagramme en barres (ou en tuyaux dorgue) est un graphique compose


de rectangles (barres) disjoints associant a chaque categorie dune variable
qualitative (nominale ou ordinale) un rectangle de base constante et de hau-
teur egale a leffectif ou la frequence de cette categorie.

71 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.1. Diagramme en barres
Exemple :
Elections legislatives

Representation graphique des effectifs

Couleurs ni
Vert 9
Bleu 14
Orange 6
Rose 11

72 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.1. Diagramme en barres
Exemple :
Elections legislatives

Representation graphique des frequences

Couleurs fi
Vert 0.225
Bleu 0.350
Orange 0.150
Rose 0.275

73 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.1. Diagramme en barres
Exemple :
Diplomes dune commune

Representation graphique des effectifs

Diplomes ni
Baccalaureat 25
Licence 18
Master 12
Doctorat 5

74 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.1. Diagramme en barres
Exemple :
Diplomes dune commune

Representation graphique des frequences

Diplomes fi
Baccalaureat 0.42
Licence 0.30
Master 0.20
Doctorat 0.08

75 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.1. Diagramme en barres

Remarque :
Lordre des categories dune variable qualitative ordinale doit etre respecte
lors de la construction du diagramme en barres.

76 / 1
1. Organisation des donnees
1.3. Representations graphiques

Sous section 2 : Diagramme en batons

77 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.2. Diagramme en batons

Definitions :

Le diagramme en batons est un graphique qui associe a chaque modalite


dune variable quantitative discrete un segment (baton) de longueur egale a
son effectif ou a sa frequence.
Le polygone est un ensemble de segments de droites reliant les sommets des
batons. Il donne la forme de la distribution statistique.

78 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.3. Diagramme en batons

Exemple :

Nombre denfants par famille

Representation graphique des effectifs

xi ni
1 12
2 40
3 32
4 16

79 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.3. Diagramme en batons
Exemple :

Nombre denfants par famille

Representation graphique des frequences

xi fi
1 0.12
2 0.40
3 0.32
4 0.16

80 / 1
1. Organisation des donnees
1.3. Representations graphiques

Sous section 3 : Histogramme

81 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.3. Histogramme

Definition :

Lhistogramme est un diagramme compose de rectangles juxtaposes dont les


aires sont egales aux effectifs ni ou aux frequences fi et dont les bases sont
determinees par les classes damplitudes ai de la variable continue. La hauteur
de chaque rectangle est egale a la densite (deffectifs ou de frequences), notee
hi , donnee par :
ni fi
hi = ai
ou hi = ai

Le polygone est une droite segmentee reliant les points centraux des sommets
de chaque rectangle dun histogramme. Le polygone permet de donner lallure
de la distribution statistique.

82 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.3. Histogramme
Exemple :

Tailles dindividus

Representation graphique des effectifs

Tailles (cm) ni ai hi ci
[155 ; 160 [ 0 5 0 157.5
[160 ; 165 [ 5 5 1 162.5
[165 ; 170 [ 10 5 2 167.5
[170 ; 175 [ 20 5 4 172.5
[175 ; 180 [ 10 5 2 177.5
[180 ; 185 [ 10 5 2 182.5
[185 ; 190] 0 5 0 187.5

83 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.3. Histogramme
Exemple :
Tailles dindividus

Representation graphique des frequences

Tailles (cm) fi ai hi ci
[155 ; 160 [ 0 5 0 157.5
[160 ; 165 [ 0.090 5 0.018 162.5
[165 ; 170 [ 0.180 5 0.036 167.5
[170 ; 175 [ 0.360 5 0.072 172.5
[175 ; 180 [ 0.185 5 0.037 177.5
[180 ; 185 [ 0.185 5 0.037 182.5
[185 ; 190] 0 5 0 187.5

84 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.3. Histogramme

Remarques :

Si les classes ne sont pas de meme amplitude, il convient duniformiser


leurs amplitudes en fractionnant celles qui ont les amplitudes les plus
grandes.

Si en plus de lhistogramme on souhaite tracer un polygone, on ajoute


deux classes extremes vides dont les centres respectifs constitueront les
deux extremites du polygone.

85 / 1
1. Organisation des donnees
1.3. Representations graphiques

Sous section 4 : Courbes cumulatives

1.3.4.1. Variable statistique discrete

1.3.4.2. Variable statistique continue

86 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives

Definitions :

La courbe cumulative est un graphique qui associe a chaque modalite dune


variable quantitative son effectif cumule ou sa frequence cumulee.

Selon que leffectif et la frequence sont croissants ou decroissants, la courbe


cumulative correspondante est ascendante ou descendante.

87 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives

1.3.4.1. Variable statistique discrete

Effectifs cumules croissants : Courbe cumulative ascendante

xi Ni+
1 12
2 52
3 84
4 100

Nombre dindividus ayant au plus la modalite xi .

88 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives

1.3.4.1. Variable statistique discrete

Effectifs cumules croissants : Courbe cumulative ascendante

xi Ni+
1 12
2 52
3 84
4 100

Nombre dindividus ayant au plus la modalite xi .

89 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives

1.3.4.1. Variable statistique discrete

Effectifs cumules croissants : Courbe cumulative ascendante

xi Ni+
1 12
2 52
3 84
4 100

Nombre dindividus ayant au plus la modalite xi .

90 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.1. Variable statistique discrete

Effectifs cumules decroissants : Courbe cumulative


descendante

xi Ni
1 100
2 88
3 48
4 16

Nombre dindividus ayant au moins la modalite xi .

91 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.1. Variable statistique discrete

Effectifs cumules decroissants : Courbe cumulative


descendante

xi Ni
1 100
2 88
3 48
4 16

Nombre dindividus ayant au moins la modalite xi .

92 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.1. Variable statistique discrete

Effectifs cumules decroissants : Courbe cumulative


descendante

xi Ni
1 100
2 88
3 48
4 16

Nombre dindividus ayant au moins la modalite xi .

93 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.1. Variable statistique discrete

Frequences cumulees croissantes : Courbe cumulative


ascendante

xi Fi+
1 0.12
2 0.52
3 0.84
4 1

Proportion dindividus ayant au plus la modalite xi .

94 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.1. Variable statistique discrete

Frequences cumulees croissantes : Courbe cumulative


ascendante

xi Fi+
1 0.12
2 0.52
3 0.84
4 1

Proportion dindividus ayant au plus la modalite xi .

95 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.1. Variable statistique discrete

Frequences cumulees croissantes : Courbe cumulative


ascendante

xi Fi+
1 0.12
2 0.52
3 0.84
4 1

Proportion dindividus ayant au plus la modalite xi .

96 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.1. Variable statistique discrete

Frequences cumulees decroissantes : Courbe cumulative


descendante

xi Fi
1 1
2 0.88
3 0.48
4 0.16

Proportion dindividus ayant au moins la modalite xi .

97 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.1. Variable statistique discrete

Frequences cumulees decroissantes : Courbe cumulative


descendante

xi Fi
1 1
2 0.88
3 0.48
4 0.16

Proportion dindividus ayant au moins la modalite xi .

98 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.1. Variable statistique discrete

Frequences cumulees decroissantes : Courbe cumulative


descendante

xi Fi
1 1
2 0.88
3 0.48
4 0.16

Proportion dindividus ayant au moins la modalite xi .

99 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives

1.3.4.2. Variable statistique continue

Effectifs cumules croissants : Courbe cumulative ascendante

[xi1 .; xi [ Ni+
[160 ; 165 [ 5
[165 ; 170 [ 15
[170 ; 175 [ 35
[175 ; 180 [ 50
[180 ; 185] 55

Nombre dindividus ayant au plus la borne superieure de la classe [xi1 .; xi [ .

100 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives

1.3.4.2. Variable statistique continue

Effectifs cumules croissants : Courbe cumulative ascendante

[xi1 .; xi [ Ni+
[160 ; 165 [ 5
[165 ; 170 [ 15
[170 ; 175 [ 35
[175 ; 180 [ 50
[180 ; 185] 55

Nombre dindividus ayant au plus la borne superieure de la classe [xi1 .; xi [ .

101 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives

1.3.4.2. Variable statistique continue

Effectifs cumules croissants : Courbe cumulative ascendante

[xi1 .; xi [ Ni+
[160 ; 165 [ 5
[165 ; 170 [ 15
[170 ; 175 [ 35
[175 ; 180 [ 50
[180 ; 185] 55

Nombre dindividus ayant au plus la borne superieure de la classe [xi1 .; xi [ .

102 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.2. Variable statistique continue
Effectifs cumules decroissants : Courbe cumulative
descendante

[xi1 .; xi [ Ni
[160 ; 165 [ 55
[165 ; 170 [ 50
[170 ; 175 [ 40
[175 ; 180 [ 20
[180 ; 185] 5

Nombre dindividus ayant au moins la borne inferieure de la classe


[xi1 .; xi [ .
103 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.2. Variable statistique continue
Effectifs cumules decroissants : Courbe cumulative
descendante

[xi1 .; xi [ Ni
[160 ; 165 [ 55
[165 ; 170 [ 50
[170 ; 175 [ 40
[175 ; 180 [ 20
[180 ; 185] 5

Nombre dindividus ayant au moins la borne inferieure de la classe


[xi1 .; xi [ .
104 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.2. Variable statistique continue
Effectifs cumules decroissants : Courbe cumulative
descendante

[xi1 .; xi [ Ni
[160 ; 165 [ 55
[165 ; 170 [ 50
[170 ; 175 [ 40
[175 ; 180 [ 20
[180 ; 185] 5

Nombre dindividus ayant au moins la borne inferieure de la classe


[xi1 .; xi [ .
105 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.2. Variable statistique continue
Frequences cumulees croissantes : Courbe cumulative
ascendante

[xi1 .; xi [ Fi+
[160 ; 165 [ 0.09
[165 ; 170 [ 0.27
[170 ; 175 [ 0.63
[175 ; 180 [ 0.91
[180 ; 185] 1

Proportion dindividus ayant au plus la borne superieure de la classe


[xi1 .; xi [ .
106 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.2. Variable statistique continue
Frequences cumulees croissantes : Courbe cumulative
ascendante

[xi1 .; xi [ Fi+
[160 ; 165 [ 0.09
[165 ; 170 [ 0.27
[170 ; 175 [ 0.63
[175 ; 180 [ 0.91
[180 ; 185] 1

Proportion dindividus ayant au plus la borne superieure de la classe


[xi1 .; xi [ .
107 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.2. Variable statistique continue
Frequences cumulees croissantes : Courbe cumulative
ascendante

[xi1 .; xi [ Fi+
[160 ; 165 [ 0.09
[165 ; 170 [ 0.27
[170 ; 175 [ 0.63
[175 ; 180 [ 0.91
[180 ; 185] 1

Proportion dindividus ayant au plus la borne superieure de la classe


[xi1 .; xi [ .
108 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.2. Variable statistique continue
Frequences cumulees decroissantes : Courbe cumulative
descendante

[xi1 .; xi [ Fi
[160 ; 165 [ 1
[165 ; 170 [ 0.91
[170 ; 175 [ 0.73
[175 ; 180 [ 0.37
[180 ; 185] 0.09

Proportion dindividus ayant au moins la borne inferieure de la classe


[xi1 .; xi [ .
109 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.2. Variable statistique continue
Frequences cumulees decroissantes : Courbe cumulative
descendante

[xi1 .; xi [ Fi
[160 ; 165 [ 1
[165 ; 170 [ 0.91
[170 ; 175 [ 0.73
[175 ; 180 [ 0.37
[180 ; 185] 0.09

Proportion dindividus ayant au moins la borne inferieure de la classe


[xi1 .; xi [ .
110 / 1
1. Organisation des donnees
1.3. Representations graphiques
1.3.4. Courbes cumulatives
1.3.4.2. Variable statistique continue
Frequences cumulees decroissantes : Courbe cumulative
descendante

[xi1 .; xi [ Fi
[160 ; 165 [ 1
[165 ; 170 [ 0.91
[170 ; 175 [ 0.73
[175 ; 180 [ 0.37
[180 ; 185] 0.09

Proportion dindividus ayant au moins la borne inferieure de la classe


[xi1 .; xi [ .
111 / 1
Chapitre 2 : Series statistiques a une dimension

Section 1 : Mesures de position

Section 2 : Mesures de dispersion

Section 3 : Mesures de forme

112 / 1
2. Series statistiques a une dimension

Dans ce chapitre, seules seront considerees des variables statistiques quanti-


tatives etant donne que les variables qualitatives ne se pretent pas aux calculs
mathematiques qui seront presentes.

Les variables statistiques seront notees en lettres majuscules X , et leurs k mo-


dalites en lettres minuscules x indicees par i. Chaque modalite xi intervient
un nombre ni de fois dans la population formee dun nombre n dindividus.
Dans le cas dune variable statistique continue, les modalites seront regrou-
pees en classes [xi1 ; xi [ damplitudes respectives ai et de centres respectifs
ci .

113 / 1
2. Series statistiques a une dimension

Section 1 : Mesures de position

Sous section 1 : Mesures de tendance centrale ou de centre

Sous section 2 : Mesures de position relative ou quantiles

114 / 1
2. Series statistiques a une dimension
2.1. Mesures de position

Definition :

Une mesure de position, comme son nom lindique, est un indicateur dune
position particuliere dans une serie statistique. Cette position particuliere
peut etre le centre autour duquel les donnees sont reparties de facon equi-
libree (mesure de tendance centrale), ou au contraire une position telle que
les donnees se repartissent dans des proportions inegales de part et dautre
(mesure de position relative).

115 / 1
2. Series statistiques a une dimension
2.1. Mesures de position

116 / 1
2. Series statistiques a une dimension
2.1. Mesures de position

Sous section 1 : Mesures de tendance centrale ou de centre

2.1.1.1 Le mode

2.1.1.2 La mediane

2.1.1.3 La moyenne arithmetique

117 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre

2.1.1.1 Le mode

Definition :
Le mode dune distribution statistique, note Mo , est la modalite du caractere
la plus frequemment rencontree localement. Cest lequivalent du maximum
en analyse mathematique.

Une distribution statistique peut avoir un, deux ou plusieurs modes, on parle
alors respectivement de distributions unimodale, bimodale et multimodale.

118 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode

119 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode
Determination dans le cas discret :
A partir dun diagramme en batons :
Le mode est la modalite correspondant au baton le plus eleve localement.

Mo = 2
2 est le nombre denfants par famille
le plus frequemment observe.

120 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode
Determination dans le cas discret :
A partir dun tableau statistique :
Le mode est la modalite correspondant a leffectif (ou a la frequence)
maximal(e) localement.

Nombre denfants par famille

xi ni fi
Mo = 2 1 12 0.12
2 38 0.38
2 est le nombre denfants par famille
le plus frequemment observe. 3 22 0.22
4 18 0.18
5 10 0.10
100 1

121 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode
Determination dans le cas continu :
A partir dun histogramme :
1. Identifier la classe modale [xi1 ; xi [ :
Cest la classe correspondant au rectangle le plus eleve localement.

122 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode
Determination dans le cas continu :
A partir dun histogramme :
2. Identifier la valeur modale Mo graphiquement :
Le mode Mo est labscisse du point dintersection des segment joi-
gnant les coins superieurs du rectangle de la classe modale aux
coins superieurs les plus proches des rectangles adjacents :

123 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode

Determination dans le cas continu :


A partir dun tableau statistique :
1. Identifier la classe modale [xi1 ; xi [ :
Cest la classe correspondant a la densite la plus elevee
localement.

[xi1 ; xi [ ni ai hi
[160 ; 165 [ 5 5 1
[165 ; 170 [ 13 5 2.6
[170 ; 175 [ 20 5 4
[175 ; 185] 20 10 2
Total 58

124 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode

Determination dans le cas continu :


A partir dun tableau statistique :
2. Calculer la valeur modale Mo analytiquement :
La valeur modale Mo est egale a la borne inferieure de la classe
modale [xi1 ; xi [ plus une fraction d1d+d
1
2
de lamplitude xi xi1
de la classe modale :

d1
M0 = xi1 + (xi xi1 )
d1 + d2
avec :

d1 = hi hi1 d2 = hi hi+1

125 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode
I Demonstration : Triangles semblables

Deux triangles sont semblables si leurs


angles sont egaux deux a deux. Par
consequent, ils ont la meme forme mais
pas necessairement la meme taille.
Caracteristiques :

a b c
= =
A B C
h H
=
a A
ou h et H designent les hauteurs des
triangles.

126 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode
I Demonstration (suite) :
Les triangles ABE et CDE sont semblables, on a :

EH EH 0 Mo xi1 xi Mo
= =
AB DC d1 d2
d1
Mo xi1 = (xi Mo )
d2
d1
Mo xi1 = [(xi xi1 ) (Mo xi1 )]
d2
d1 d1
Mo xi1 = (xi xi1 ) (Mo xi1 )
d2 d2
 
d1 d1
(Mo xi1 ) 1 + = (xi xi1 )
d2 d2
d2 d1
Mo xi1 = (xi xi1 )
d1 + d2 d2
d1
Mo = xi1 + d1 +d2
(xi xi1 )
127 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode

Determination dans le cas continu :


I Exemple :

Tailles dindividus

Identification de la classe modale :

Mo [170 ; 175 [
Tailles (cm) hi
[160 ; 165 [ 1 Calcul du mode :
[165 ; 170 [ 2.6
4 2.6
[170 ; 175 [ 4 Mo = 170 + (175 170)
(4 2.6) + (4 2)
[175 ; 185] 2
172.06 cm
Total
La taille dindividus la plus frequemment
rencontree est 172.06 cm.

128 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode

Remarques :
Le mode est la mesure de centre adaptee aux caracteres qualitatifs.

129 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode

Remarques (suite) :
Les modes des distributions statistiques multimodales ne sont plus des me-
sures de centre mais une indication sur lheterogeneite de la population.

130 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1. Le mode

Remarques (suite) :
Le mode est sensible au decoupage des classes dune variable continue.

[xi1 ; xi [ ni ai hi [xi1 ; xi [ ni ai hi
[160 ; 165 [ 5 5 1 [160 ; 170 [ 15 10 1.5
[165 ; 170 [ 10 5 2 [170 ; 180 [ 35 10 3.5
[170 ; 175 [ 20 5 4 [180 ; 185 [ 5 5 1
[175 ; 180 [ 15 5 3
[180 ; 185 [ 5 5 1

42 3.5 1.5
Mo = 170 + 5 Mo = 170 + 10
(4 2) + (4 3) (3.5 1.5) + (3.5 1)
= 173.33 cm = 174.44 cm

131 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre

2.1.1.2 La mediane

Definition :
La mediane dune distribution statistique, notee Me , est la valeur du caractere
qui partage la serie statistique ordonnee en deux parties contenant chacune
la moitie des observations.

132 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

133 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

Exemples :

Serie 1 : 2 3 3 4 5 6 6 7 8

Serie 2 : 2 3 3 4 5 5 6 7 8 9

Serie 3 : 2 3 3 4 5 6 6 7 8 9

134 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

Exemples (suite) :

Serie 1 : 2 3 3 4 5 6 6 7 8

xi ni fi Fi+
Aucune frequence cumulee croissante nest
2 1 0.11 0.11
egale a 0.5.
3 2 0.22 0.33
4 1 0.11 0.44 La mediane correspond a la frequence cumulee
5 1 0.11 0.55 croissante immediatement superieure a 0.5.
6 2 0.22 0.77
7 1 0.11 0.88 La valeur 0.5 renvoie a la notion de moitie .
8 1 0.12 1
Somme 9 1

135 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

Exemples (suite) :

Serie 2 : 2 3 3 4 5 5 6 7 8 9

xi ni fi Fi+
2 1 0.1 0.1 Aucune frequence cumulee croissante nest
3 2 0.2 0.3
egale a 0.5.
4 1 0.1 0.4
5 2 0.2 0.6 La mediane correspond a la frequence cumulee
6 1 0.1 0.7 croissante immediatement superieure a 0.5.
7 1 0.1 0.8
8 1 0.1 0.9 La valeur 0.5 renvoie a la notion de moitie .
9 1 0.1 1
Somme 10 1

136 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

Exemples (suite) :

Serie 3 : 2 3 3 4 5 6 6 7 8 9

xi ni fi Fi+
2 1 0.1 0.1
Il y a une frequence cumulee croissante egale
3 2 0.2 0.3
4 1 0.1 0.4 a 0.5, on a un intervalle median.
5 1 0.1 0.5 Par convention, la mediane est egale au centre
6 2 0.2 0.7 de lintervalle median.
7 1 0.1 0.8
8 1 0.1 0.9 La valeur 0.5 renvoie a la notion de moitie .
9 1 0.1 1
Somme 10 1

137 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

Determination dans le cas discret :


I A partir du tableau statistique :

Si aucune frequence cumulee croissante nest egale a 0.5, alors la mediane


est la modalite dont la frequence cumulee croissante est immediatement
superieure a 0.5.
Sil y a une frequence cumulee croissante egale a 0.5, alors on a un in-
tervalle median dont les bornes sont les modalites correspondant aux
frequences cumulees croissantes respectivement egale et immediatement
superieure a 0.5. Dans ce cas, la valeur mediane est le centre de linter-
valle median.

138 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane
I A partir de la courbe cumulative ascendante :

Aucune frequence cumulee croissante nest egale a 0.5 :

Me = 2 enfants

La moitie des familles


ont moins de 2 enfants
et lautre moitie en ont
plus de 2.

139 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane
I A partir de la courbe cumulative ascendante :

Il y a une frequence cumulee croissante egale a 0.5 :

Me [2; 3]
2+3
Me = = 2.5
2
3 enfants

La moitie des familles


ont moins de 3 enfants
et la moitie ont en plus
de 3.

140 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane
Determination dans le cas continu :
I A partir de la courbe cumulative ascendante :
La mediane est labscisse du point associe a la frequence cumulee croissante
0.5.

141 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane
I A partir des courbes cumulatives ascendante et descendante :
La mediane est labscisse du point dintersection des courbes cumulatives
ascendante et descendante, ce point correspond a des frequences cumulees
(croissante et decroissante) egales a 0.5.

142 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

I A partir du tableau statistique :

Sil y a une frequence cumulee croissante egale a 0.5, alors la mediane


est egale a la borne superieure de la classe correspondant a la frequence
cumulee croissante egale a 0.5.
Si aucune frequence cumulee croissante nest egale a 0.5, alors la classe
mediane [xi1 ; xi [ est la classe dont la frequence cumulee croissante est
immediatement superieure a 0.5. Dans ce cas, la valeur mediane Me est
calculee par interpolation lineaire comme suit :
+
0.5 Fi1
Me = xi1 + (xi xi1 )
Fi+ Fi1
+

143 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

I Demonstration : Coefficient directeur dune droite

yB yA
a=
xB xA

144 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane
I Demonstration (suite) :
+
yB yA 0.5 Fi1
a= =
xB xA Me xi1
yC yA
+
F + Fi1
a= = i
xC xA xi xi1
+
0.5 Fi1 +
F + Fi1
= i
Me xi1 xi xi1
+
0.5 Fi1
Me xi1 = (xi xi1 )
Fi+ Fi1
+

+
0.5Fi1
Me = xi1 + (xi xi1 )
Fi+ Fi1
+

La mediane Me est egale a la borne inferieure de la classe mediane [xi1 ; xi [


+
0.5Fi1
plus une fraction de lamplitude xi xi1 de la classe mediane.
Fi+ Fi1
+

145 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

I Pratique : Etape 1

Identifier la classe mediane [xi1 ; xi [ et


situer la valeur mediane Me a linte-
rieur de cette classe.

146 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

I Pratique : Etape 2

Associer la frequence cumulee crois-


sante 0.5 a la valeur mediane Me .

147 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

I Pratique : Etape 3

Trouver dans la colonne des frequences


cumulees croissantes les valeurs qui en-
cadrent 0.5 et les associer aux bornes
de la classe mediane.

148 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

I Pratique : Etape 4

+
Me xi1 0.5 Fi1
= + +
xi xi1 Fi Fi1
+
0.5 Fi1
Me xi1 = (xi xi1 )
Fi+ Fi1
+

+
0.5Fi1
Me = xi1 + (xi xi1 )
Fi+ Fi1
+

149 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

Exemple 1 :

Tailles dindividus

0.5 0.27
Me = 170 + 5
Tailles (cm) Fi+ 0.63 0.27
[160 ; 165 [ 0.09 = 173.19 cm
[165 ; 170 [ 0.27
La moitie des individus ont une taille
[170 ; 175 [ 0.63
inferieure a 173.19 cm et lautre moitie
[175 ; 180 [ 0.91 ont une taille superieure a cette taille
[180 ; 185] 1 mediane.

150 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.2. La mediane

Exemple 2 :

Tailles dindividus

0.5 0.27
Me = 170 + 5
Tailles (cm) Fi+ 0.5 0.27
[160 ; 165 [ 0.09 = 175 cm
[165 ; 170 [ 0.27
La moitie des individus ont une taille
[170 ; 175 [ 0.5
inferieure a 175 cm et lautre moitie
[175 ; 180 [ 0.91 ont une taille superieure a cette taille
[180 ; 185] 1 mediane.

151 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre

2.1.1.3 La moyenne arithmetique


Definition :
La moyenne arithmetique dune variable statistique, notee x , est la valeur -
nappartenant pas necessairement a la serie statistique - qui concentre toute
linformation contenue dans la distribution statistique, cest lequivalent dun
centre de gravite en geometrie. Elle est donnee par la formule suivante :

k k
1X X
x = ni xi = fi xi
n i=1 i=1

152 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.3. La moyenne arithmetique

153 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.3. La moyenne arithmetique

Remarques :

Si n1 = n2 = = nk = 1, alors la moyenne arithmetique est dite


simple, sinon elle est dite ponderee ;

Si la variable statistique X est continue, la moyenne arithmetique


secrit :
k k
1X X
x = ni ci = fi ci
n i=1 i=1

ou ci designe le centre de la classe [xi1 ; xi [.

154 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.3. La moyenne arithmetique

Exemple 1 :

Nombre denfants par famille

4
xi ni ni xi 1X
x = ni xi
1 12 12 n i=1
2 40 80 252
=
3 32 96 100
4 16 64 = 2.52 3 enfants
100 252 Les familles concernees ont en
moyenne 3 enfants.

155 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.3. La moyenne arithmetique

Exemple 2 :

Tailles dindividus

Tailles (cm) ci ni ni ci 5
1X
[160 ; 165[ 162.5 5 812.5 x = ni ci
n i=1
[165 ; 170[ 167.5 10 1675
9512.5
[170 ; 175[ 172.5 20 3450 =
55
[175 ; 180[ 177.5 15 2662.5 = 172.95 cm
[180 ; 185] 182.5 5 912.5
55 9512.5 Les individus concernes ont une taille
moyenne egale a 172.95 cm.

156 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.3. La moyenne arithmetique

Proprietes :

Soit X et Y deux variables statistiques quantitatives prenant respectivement


les valeurs x1 , x2 , ,xn et y1 , y2 , ,yn avec n N et a et b deux constantes
reelles.

La moyenne arithmetique verifie les proprietes suivantes :

ax + by = ax + by
k
X
ni (xi x ) = 0
i=1

157 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.3. La moyenne arithmetique

Demonstrations :
k
1X
ax + by = ni (axi + byi )
n i=1
k
1X
= (ani xi + bni yi )
n i=1
k k
1X 1X
= ani xi + bni yi
n i=1 n i=1
k
! k
!
1X 1X
=a ni xi + b ni yi
n i=1 n i=1
= ax + by

158 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.3. La moyenne arithmetique

Exemples :

x +y =x +y

2x + y = 2x + y

3x y = 3x y

x 3y = x 3y

x + 2y = x + 2y

3x + 2 = 3x + 2

3 2y = 3 2y

159 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.3. La moyenne arithmetique

Demonstrations (suite) :
k
X k
X
ni (xi x ) = (ni xi ni x )
i=1 i=1
k
X k
X
= ni xi ni x
i=1 i=1
k k
1X X
=n ni xi x ni
n i=1 i=1

= nx x n
=0

160 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.3. La moyenne arithmetique

Remarque :

La moyenne arithmetique est sensible aux valeurs extremes contrairement a


la mediane qui nest pas influencee par de telles observations. La mediane
est, de ce fait, une mesure robuste du centre de la distribution statistique
notamment en presence dune forte asymetrie.

161 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.3. La moyenne arithmetique

Exemple :

Notes sur 20 de deux groupes detudiants

Groupe A Groupe B

15 15 15 15 15 1 15 15 15 15
x = 15 x = 12.2
Me = 15 Me = 15

162 / 1
2. Series statistiques a une dimension
2.1. Mesures de position

Sous section 2 : Mesures de position relative ou quantiles

2.1.1.1 Les quartiles

2.1.1.2 Les deciles

2.1.1.3 Les centiles

2.1.1.4 Generalisation

2.1.1.5 Mode de calcul

163 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles

Les quantiles ou les fractiles sont des valeurs qui partagent la serie statistique
ordonnee en un certain nombre de parties contenant chacune une meme pro-
portion dobservations. Ils constituent, de ce fait, une generalisation de la
notion de mediane qui partage la serie statistique en deux parties contenant
chacune la moitie des observations.
Les quantiles les plus connus sont les quartiles, les deciles et les centiles qui
divisent la serie statistique en respectivement 4, 10 et 100 parties de meme
effectif. Par consequent, les quantiles ne se trouvent pas necessairement au
centre de la distribution statistique mais dans des positions dites relatives.

164 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles

2.1.2.1 Les quartiles

Definition :
Les quartiles sont des valeurs qui partagent la serie statistique ordonnee en
4 parties contenant chacune 25% des observations. Ils sont au nombre de 3
et ils sont notes Q1 , Q2 et Q3 .

165 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.1. Les quartiles

166 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles

2.1.2.2 Les deciles

Definition :
Les deciles sont des valeurs qui partagent la serie statistique ordonnee en 10
parties contenant chacune 10% des observations. Ils sont au nombre de 9 et
ils sont notes D1 , D2 ... et D9 .

167 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.2. Les deciles

168 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles

2.1.2.3 Les centiles

Definition :
Les centiles sont des valeurs qui partagent la serie statistique ordonnee en
100 parties contenant chacune 1% des observations. Ils sont au nombre de 99
et ils sont notes C1 , C2 ... et D99 .

169 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.3. Les centiles

170 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles

2.1.2.4 Generalisation

Definition :
De facon generale, on definit les quantiles dordre , avec ]0; 1[, comme les
valeurs qui partagent la serie statistique ordonnee en 1/ parties contenant
chacune une proportion des observations et on les note q .
Ainsi, une proportion des observations est inferieure a q et une proportion
1 est superieure a cette valeur.

171 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.4. Generalisation

172 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles

2.1.2.5 Mode de calcul

Cas des variables discretes :

I A partir de la colonne des frequences cumulees croissantes :

Sil y a une frequence cumulee croissante egale a alors on a un


intervalle quantile delimite par la modalite associee a la valeur
et par la modalite suivante.
Si aucune frequence cumulee croissante nest egale a alors le
quantile recherche est la modalite ayant une frequence cumulee
croissante immediatement superieure a .

173 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul

Cas des variables discretes :


I A partir de la colonne des frequences cumulees croissantes :

xi Fi+ Mediane Quartiles Deciles Centiles


x1 0.12 D1 C1
x2 0.62 Me Q1 et Q2 D5 C55
x3 0.84 Q3
x4 1 D9 C99

174 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul

Cas des variables discretes :

Exemple :

Nombre denfants par famille

xi Fi+ Mediane Quartiles Deciles Centiles


1 0.12 D1 C1
2 0.62 Me Q1 et Q2 D5 C55
3 0.84 Q3
4 1 D9 C99

175 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul

Cas des variables discretes :

I A partir de la courbe cumulative ascendante :

Si la valeur est en face dun palier de la courbe cumulative ascen-


dante, alors on a un intervalle quantile delimite par les abscisses
des extremites du palier.
Si la valeur se situe entre deux paliers de la courbe cumulative
ascendante, alors le quantile recherche est labscisse commune aux
deux paliers.

176 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul

Cas des variables discretes :

I A partir de la courbe cumulative ascendante :

177 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul
Cas des variables discretes :
Exemple :

Nombre denfants par famille

178 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul

Cas des variables continues :

I A partir de la colonne des frequences cumulees croissantes :

Etape 1 : La classe [xi1 ; xi [ contenant le quantile dordre est dabord


identifiee, cest la classe ayant une frequence cumulee croissante imme-
diatement superieure ou egale a .

179 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul

Cas des variables continues :

I A partir de la colonne des frequences cumulees croissantes :

[xi1 ; xi [ Fi+ Mediane Quartiles Deciles Centiles


[x0 ; x1 [ 0.09 C1
[x1 ; x2 [ 0.27 Q1 D1
[x2 ; x3 [ 0.63 Me Q2 D5 C55
[x3 ; x4 [ 0.91 Q3 D9
[x4 ; x5 ] 1 C99

180 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul

Cas des variables continues :

I A partir de la colonne des frequences cumulees croissantes :

Etape 2 : Le quantile dordre est calcule par interpolation lineaire


selon la formule suivante :

+
Fi1
q = xi1 + (xi xi1 )
Fi+ Fi1
+

181 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul

Cas des variables continues :


I A partir de la colonne des frequences cumulees croissantes :

+
q xi1 Fi1
= + +
xi xi1 Fi Fi1
+
Fi1
q xi1 = (xi xi1 )
Fi+ Fi1
+

+
Fi1
q = xi1 + (xi xi1 )
Fi+ Fi1
+

182 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul

Cas des variables continues :

Exemple :

Tailles dindividus

Taille (cm) Fi+ Mediane Quartiles Deciles Centiles


[160 ; 165 [ 0.09 C1
[165 ; 170 [ 0.27 Q1 D1
[170 ; 175 [ 0.63 Me Q2 D5 C55
[175 ; 180 [ 0.91 Q3 D9
[180 ; 185] 1 C99

183 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul
Cas des variables continues :

Exemple (suite) :

Tailles dindividus

0.50 0.27 0.50 0.27


Me = 170 + 5 = 173.19 cm D5 = 170 + 5 = 173.19 cm
0.63 0.27 0.63 0.27
0.25 0.09 0.90 0.63
Q1 = 165 + 5 = 169.44 cm D9 = 175 + 5 = 179.82 cm
0.27 0.09 0.91 0.63
0.50 0.27 0.01 0
Q2 = 170 + 5 = 173.19 cm C1 = 160 + 5 = 160.56 cm
0.63 0.27 0.09 0
0.75 0.63 0.55 0.27
Q3 = 175 + 5 = 177.14 cm C55 = 170 + 5 = 173.19 cm
0.91 0.63 0.63 0.27
0.10 0.09 0.99 0.91
D1 = 165 + 5 = 165.28 cm C99 = 180 + 5 = 184.44 cm
0.27 0.09 1 0.91
184 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul
Cas des variables continues :

I A partir de la courbe cumulative ascendante :

Le quantile q est labscisse du point correspondant a la frequence cu-


mulee croissante .

185 / 1
2. Series statistiques a une dimension
2.1. Mesures de position
2.1.2. Mesures de position relative ou quantiles
2.1.2.5. Mode de calcul
Cas des variables continues :

Exemple :
Tailles dindividus

186 / 1
2. Series statistiques a une dimension

Section 2 : Mesures de dispersion

Sous section 1 : Distance entre deux valeurs particulieres

Sous section 2 : Distance par rapport a une valeur centrale

187 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion

Problematique :

Notes sur 20 de deux groupes detudiants

Groupe A Groupe B

15 15 15 15 15 13 14 15 16 17
x = 15 x = 15
Me = 15 Me = 15

Les mesures de tendance centrale ne donnent aucune idee sur la variabilite


ou la dispersion des donnees !

188 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion

Definition :

Une mesure de dispersion permet de decrire la variabilite des donnees dans


une serie statistique. Elle vient ainsi completer les mesures de position qui
passent sous silence cet aspect.

189 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion

Sous section 1 : Distance entre deux valeurs particulieres

2.2.1.1 Intervalle de variation et etendue dune serie

2.2.1.2 Intervalle interquartile et ecart interquartile

2.2.1.3 Intervalle interdecile et ecarts interdecile

2.2.1.4 Intervalle intercentile et ecarts intercentile

190 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres

2.2.1.1 Intervalle de variation et etendue dune serie

Definitions :
Lintervalle de variation dune serie statistique est lintervalle borne par la
valeur minimale xmin et la valeur maximale xmax de variable statistique X , il
est note IV = [xmin ; xmax ]. Cet intervalle contient la totalite des donnees.
Lamplitude de lintervalle de variation IV , notee E , est appelee etendue de
la serie. On a :
E = xmax xmin

191 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.1. Intervalle de variation et etendue dune serie

192 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.1. Intervalle de variation et etendue dune serie

Exemple 1 :

Nombre denfants par famille

1 2 3 4

IV = [xmin ; xmax ] = [1; 4]

E = 4 1 = 3 enfants

193 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.1. Intervalle de variation et etendue dune serie

Exemple 2 :

Tailles dindividus

[160 ; 165[ [165 ; 170[ [170 ; 175[ [175 ; 180 [ [180 ; 185 ]

IV = [xmin ; xmax ] = [160; 185]

E = 185 160 = 25 cm

194 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres

2.2.1.2 Intervalle interquartile et ecart interquartile

Definitions :
Lintervalle interquartile dune serie statistique est lintervalle borne par le
premier et le dernier quartiles de la variable X , il est note IQ = [Q1 ; Q3 ]. Cet
intervalle contient la moitie des donnees.
Lamplitude de lintervalle interquartile IQ, notee EIQ, est appelee ecart
interquartile ou etendue interquartile. On a :

EIQ = Q3 Q1

195 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.2. Intervalle interquartile et ecart interquartile

196 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.2. Intervalle interquartile et ecart interquartile

Exemple 1 :

Nombre denfants par famille

1 2 3 4

IQ = [Q1 ; Q3 ] = [2; 3]

EIQ = 3 2 = 1 enfant

197 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.2. Intervalle interquartile et ecart interquartile

Exemple 2 :

Tailles dindividus

[160 ; 165[ [165 ; 170[ [170 ; 175[ [175 ; 180 [ [180 ; 185 ]

IQ = [Q1 ; Q3 ] = [169.44; 177.14]

EIQ = 177.14 169.44 = 7.70 cm

198 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres

2.2.1.3 Intervalle interdecile et ecart interdecile

Definitions :
Lintervalle interdecile dune serie statistique est lintervalle borne par le
premier et le dernier deciles de la variable X , il est note ID = [D1 ; D9 ]. Cet
intervalle contient 80% des donnees.
Lamplitude de lintervalle interdecile ID, notee EID, est appelee ecart in-
terdecile ou etendue interdecile. On a :

EID = D9 D1

199 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.3. Intervalle interdecile et ecart interdecile

200 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.3. Intervalle interdecile et ecart interdecile

Exemple 1 :

Nombre denfants par famille

1 2 3 4

ID = [D1 ; D9 ] = [1; 4]

EID = 4 1 = 3 enfants

201 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.3. Intervalle interdecile et ecart interdecile

Exemple 2 :

Tailles dindividus

[160 ; 165[ [165 ; 170[ [170 ; 175[ [175 ; 180 [ [180 ; 185 ]

ID = [D1 ; D9 ] = [165.28; 179.82]

EID = 179.82 165.28 = 14.54 cm

202 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres

2.2.1.4 Intervalle intercentile et ecart intercentile

Definitions :
Lintervalle intercentile dune serie statistique est lintervalle borne par le
premier et le dernier centiles de la variable X , il est note IC = [C1 ; C99 ]. Cet
intervalle contient 98% des donnees.
Lamplitude de lintervalle intercentile IC , notee EIC , est appelee ecart in-
tercentile ou etendue intercentile. On a :

EIC = C99 C1

203 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.4. Intervalle intercentile et ecart intercentile

204 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.4. Intervalle intercentile et ecart intercentile

Exemple 1 :

Nombre denfants par famille

1 2 3 4

IC = [C1 ; C99 ] = [1; 4]

EIC = 4 1 = 3 enfants

205 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres
2.2.1.4. Intervalle intercentile et ecart intercentile

Exemple 2 :

Tailles dindividus

[160 ; 165[ [165 ; 170[ [170 ; 175[ [175 ; 180 [ [180 ; 185 ]

IC = [C1 ; C99 ] = [160.56; 184.44]

EIC = 184.44 160.56 = 23.88 cm

206 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.1. Distance entre deux valeurs particulieres

Remarque :
La dispersion dune distribution statistique peut etre resumee a laide dune
bote a moustaches. Il sagit dun diagramme representant simultanement
lintervalle de variation, lintervalle interquartile, la moyenne et la mediane
de la serie statistique.

207 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion

Sous section 2 : Distance par rapport a une valeur centrale

2.2.2.1 Ecart absolu moyen

2.2.2.2 Variance et ecart-type

2.2.2.3 Coefficient de variation

208 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale

Distance par rapport a la moyenne arithmetique

209 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale

Distance par rapport a la mediane

210 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.1 Ecart absolu moyen

Definition :
Lecart absolu moyen dune variable statistique, notee EAM , est la moyenne
arithmetique des valeurs absolues des ecarts des observations de la variable
par rapport a une mesure de centre qui est generalement la moyenne arith-
metique x :
k
1X
EAM = ni |xi x |
n i=1

Dans le cas dune variable continue, les modalites xi sont remplacees par les
centres des classes ci :

k
1X
EAM = ni |ci x |
n i=1

211 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.1. Ecart absolu moyen
Exemple 1 :

Nombre denfants par famille

xi ni ni xi |xi x | ni |xi x |
1 12 12 1.52 18.24
2 40 80 0.52 20.80
3 32 96 0.48 15.36
4 16 64 1.48 23.68
100 252 78.08

252
x = = 2.52 3 enfants
100
4
1X 78.08
EAM = ni |xi x | = = 0.7808 1 enfant
n i=1 100

212 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.1. Ecart absolu moyen
Exemple 2 :
Tailles dindividus

Tailles (cm) ci ni ni ci |ci x | ni |ci x |


[160; 165[ 162.5 5 812.5 10.45 52.25
[165; 170[ 167.5 10 1675 5.45 54.5
[170; 175[ 172.5 20 3450 0.45 9
[175; 180[ 177.5 15 2662.5 4.55 68.25
[180; 185] 182.5 5 912.5 9.55 47.75
55 9512.5 231.75

9512.5
x = = 172.95 cm
55
5
1X 231.75
EAM = ni |ci x | = = 4.21 cm
n i=1 55

213 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.2 Variance et ecart-type
Definitions :
La variance dune variable statistique X , notee x2 ou V (X ), est la moyenne
des carres des ecarts des observations de la variable par rapport a sa moyenne
arithmetique x :
k
1X
x2 = ni (xi x )2
n i=1
Dans le cas dune variable continue, les modalites xi sont remplacees par les
centres des classes ci :

k
1X
x2 = ni (ci x )2
n i=1

Lecart-type dune variable statistique X , note x , est la racine carree de la


variance :
p
x = x2
214 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.2. Variance et ecart-type

Remarque :
Il existe un ecriture alternative de la variance tres utilisee dans la pratique :

x2 = x 2 x 2

ou
k
1X
x2 = ni xi2
n i=1

et dans le cas dune variable continue :

k
1X
x2 = ni ci2
n i=1

215 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.2. Variance et ecart-type
Exemple 1 :
Nombre denfants par famille

xi ni ni xi xi2 ni xi2 (xi x )2 ni (xi x )2


1 12 12 1 12 2.31 27.72
2 40 80 4 160 0.27 10.82
3 32 96 9 288 0.23 7.37
4 16 64 16 256 2.19 35.05
100 252 716 80.96

4
1X 80.96 p
x2 = ni (xi x )2 = = 0.81 = x2 = 0.9 1 enfant
n i=1 100
716 p
x2 = x 2 x 2 = (2.52)2 = 0.81 = x2 = 0.9 1 enfant
100

216 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.2. Variance et ecart-type
Exemple 2 :

Tailles dindividus

Tailles (cm) ci ni ni ci ci2 ni ci2 (ci x )2 ni (ci x )2


[160; 165[ 162.5 5 812.5 26406.25 132031.25 109.3 546.49
[165; 170[ 167.5 10 1675 28056.25 280562.5 29.75 297.52
[170; 175[ 172.5 20 3450 29756.25 595125 0.21 4.13
[175; 180[ 177.5 15 2662.5 31506.25 472593.75 20.66 309.92
[180; 185] 182.5 5 912.5 33306.25 166531.25 91.12 455.58
55 9512.5 1646843.75 1613.64

5
1 X 1613.64 q
x2 = ni (ci x )2 = = 29.34 = x2 = 5.42 cm
n i =1
55
1646843.75 q
x2 = c 2 x 2 = (172.95)2 = 30.91 = x2 = 5.56 cm
55

217 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.2. Variance et ecart-type

Remarque :

La variance na pas de signification concrete, il sagit simplement dune etape


intermediaire dans le calcul de lecart-type. Neanmoins, elle peut etre utilisee
comme mesure de dispersion tout en prenant garde a bien interpreter lunite
de mesure transformee a la puissance 2 car ceci peut induire en erreur (par
exemple, le metre qui est une unite de mesure des longueurs se transforme en
metre carre qui est une unite de mesure des surfaces !) ou fournir une unite
de mesure nayant aucune signification (le litre au carre, par exemple, na pas
de sens).

218 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.2. Variance et ecart-type

Proprietes :
Soit X une variable statistique quantitative et a et b deux constantes
reelles. La variance verifie les proprietes suivantes :

V (aX ) = a 2 V (X )

V (X + b) = V (X )

V (aX + b) = a 2 V (X )

219 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.2. Variance et ecart-type

Demonstrations :
k
1X
V (aX ) = ni (axi ax )2
n i=1
k
1X X x1 x2 xk
= ni (axi ax )2 ni n1 n2 nk
n i=1
k
1X
= ni [a(xi x )]2
n i=1
k
1X
= ni a 2 (xi x )2 aX ax1 ax2 axk
n i=1
ni n1 n2 nk
k
1X
= a2 ni (xi x )2
n i=1
= a 2 V (X )

220 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.2. Variance et ecart-type

Demonstrations (suite) :
k
1X 2
V (X + b) = ni xi + b x + b
n i=1 X x1 x2 xk
k ni n1 n2 nk
1 X
= ni [xi + b (x + b)]2
n i=1
k
1X
= ni (xi + b x b)2
n i=1
k X +b x1 + b x2 + b xk + b
1X
= ni (xi x )2 ni n1 n2 nk
n i=1
= V (X )

221 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.2. Variance et ecart-type

Demonstrations (suite) :

X x1 x2 xk
ni n1 n2 nk

V (aX + b) = V (aX )
2
= a V (X )

aX + b ax1 + b ax2 + b axk + b


ni n1 n2 nk

222 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.2. Variance et ecart-type

Exemples :

V (2X ) = 4V (X )

V (X + 3) = V (X )

V (2X + 3) = 4V (X )

223 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale

2.2.2.3 Coefficient de variation

Le coefficient de variation, note CV , est une mesure de dispersion relative,


il est egal au rapport entre lecart-type et la moyenne arithmetique, cest un
nombre sans dimension :

CV =
x
Le coefficient de variation permet de comparer les dispersions de variables
quantitatives nayant pas la meme unite de mesure ou qui ont la meme unite
de mesure mais des moyennes differentes.

224 / 1
2. Series statistiques a une dimension
2.2. Mesures de dispersion
2.2.2. Distance par rapport a une valeur centrale
2.2.2.3. Coefficient de variation

Exemples :

Nombre denfants par famille Tailles dindividus en centimetres

x = 2.52 enfants x = 172.95 cm


x = 0.9 enfants x = 5.42 cm
0.9 
enfants
  5.42 
cm

CV = =  = 0.36 CV = = = 0.03
x 2.52 enfants
  x 172.95 
cm


La serie statistique des nombres denfants par famille est plus dispersee que
la serie des tailles dindividus.

225 / 1
2. Series statistiques a une dimension

Section 3 : Mesures de forme

Sous section 1 : Mesures dasymetrie

Sous section 2 : Mesures daplatissement

226 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme

Definition :
Une mesure de forme indique le niveau de devia-
tion dune distribution statistique par rapport a
une situation de reference - dite normale - re-
presentee par une courbe en cloche symetrique,
ni pointue ni aplatie. Le degre de deviation est
donne par une mesure dasymetrie et par une me-
sure daplatissement.

227 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme

Sous section 1 : Mesures dasymetrie

2.3.1.1 Coefficient de Fisher

2.3.1.2 Coefficient de Pearson

228 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.1.Mesures dasymetrie

Distribution symetrique :

Les modalites inferieures au mode


de la distribution statistique ont les
memes effectifs et les memes fre-
quences que celles qui sont superieures
au mode.

229 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.1.Mesures dasymetrie

Distribution symetrique :

Les modalites inferieures au mode


de la distribution statistique ont les
memes effectifs et les memes fre-
quences que celles qui sont superieures
au mode.

230 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.1.Mesures dasymetrie

Distribution asymetrique a droite :

Les modalites superieures au


mode de la distribution sta-
tistique ont des effectifs et
des frequences plus eleves que
celles qui sont inferieures au
mode.

231 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.1.Mesures dasymetrie

Distribution asymetrique a droite :

Les modalites superieures au


mode de la distribution sta-
tistique ont des effectifs et
des frequences plus eleves que
celles qui sont inferieures au
mode.

232 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.1.Mesures dasymetrie

Distribution asymetrique a gauche :

Les modalites inferieures au


mode de la distribution sta-
tistique ont des effectifs et
des frequences plus eleves que
celles qui sont superieures au
mode.

233 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.1.Mesures dasymetrie

Distribution asymetrique a gauche :

Les modalites inferieures au


mode de la distribution sta-
tistique ont des effectifs et
des frequences plus eleves que
celles qui sont superieures au
mode.

234 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.1. Mesures dasymetrie

2.3.1.1 Coefficient de Fisher (Sir Ronald)

Coefficient de skewness :
k  3
1X xi x
1 = ni
n i=1

Interpretation :
I 1 = 0 : la distribution est symetrique ;
I 1 > 0 : la distribution est asymetrique a droite ;
I 1 < 0 : la distribution est asymetrique a gauche.

235 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.1. Mesures dasymetrie

2.3.1.2 Coefficient de Pearson (Karl)

Coefficient de skewness normalise :


" k  3 #2
2 1X xi x
1 = 1 = ni
n i=1

Interpretation :
I 1 = 0 : la distribution est symetrique ;
I 1 > 0 : la distribution est asymetrique a droite ou a gauche :
I 3 > 0 : la distribution est asymetrique a droite ;
I 3 < 0 : la distribution est asymetrique a gauche.
avec
k
1X
3 = ni (xi x )3
n i=1

236 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.1. Mesures dasymetrie

Remarques :

Il existe un lien entre la symetrie dune distribution statistique et lordre de


ses mesures de tendance centrale, celles-ci sont egales entre elles dans le cas
dune distribution symetrique et differentes dans le cas dune distribution
asymetrique et respectent un ordre precis suivant la nature de lasymetrie
comme indique sur les figures ci-dessus.

237 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme

Sous section 2 : Mesures daplatissement

2.3.2.1 Coefficient de Pearson

2.3.2.2 Coefficient de Fisher

238 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.2. Mesures daplatissement

Distribution mesokurtique :

Les modalites voisines du


mode de la distribution statis-
tique ont des effectifs et des
frequences raisonnables.

239 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.2. Mesures daplatissement

Distribution mesokurtique :

Les modalites voisines du


mode de la distribution statis-
tique ont des effectifs et des
frequences raisonnables.

240 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.2. Mesures daplatissement

Distribution leptokurtique :

Les modalites voisines du


mode de la distribution sta-
tistique ont des effectifs et
des frequences plus eleves
que celles dune distribution
normale.

241 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.2. Mesures daplatissement

Distribution leptokurtique :

Les modalites voisines du


mode de la distribution sta-
tistique ont des effectifs et
des frequences plus eleves
que celles dune distribution
normale.

242 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.2. Mesures daplatissement

Distribution platykurtique :

Les modalites voisines du


mode de la distribution sta-
tistique ont des effectifs et
des frequences plus faibles
que celles dune distribution
normale.

243 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.2. Mesures daplatissement

Distribution platykurtique :

Les modalites voisines du


mode de la distribution sta-
tistique ont des effectifs et
des frequences plus faibles
que celles dune distribution
normale.

244 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.2. Mesures daplatissement

2.3.2.1 Coefficient de Pearson (Karl)

Coefficient de kurtosis :
k  4
1X xi x
2 = ni
n i=1

Interpretation :
I 2 = 3 : distribution mesokurtique (courbe normale) ;
I 2 > 3 : distribution leptokurtique (moins aplatie que la normale) ;
I 2 < 3 : distribution platykurtique (plus aplatie que la normale).

245 / 1
2. Series statistiques a une dimension
2.3. Mesures de forme
2.3.2. Mesures daplatissement

2.3.2.2 Coefficient de Fisher (Sir Ronald)

Coefficient dexces de kurtosis :


k  4
1X xi x
2 = 2 3 = ni 3
n i=1

Interpretation :
I 2 = 0 : distribution mesokurtique (aplatissement normal) ;
I 2 > 0 : distribution leptokurtique (moins aplatie que la normale) ;
I 2 < 0 : distribution platykurtique (plus aplatie que la normale).

246 / 1
Chapitre 3 : Series statistiques a deux dimensions

Section 1 : Presentation des donnees

Section 2 : Distributions marginales, conditionnelles et


jointe

Section 3 : Ajustement lineaire dun nuage de points

247 / 1
3. Series statistiques a deux dimensions

Letude des series statistiques a une dimension nest generalement quune


etape preliminaire avant dentamer une analyse plus approfondie des
possibles relations qui peuvent exister entre deux ou plusieurs variables
statistiques. Le modele devaluation des actif financiers, qui fera lobjet
dune application des outils developpes dans ce chapitre, est une for-
mulation lineaire de la relation qui peut exister entre la prime de risque
associee a un actif risque et la prime de risque associee a un portefeuille
de marche. Les parametres de cette relation jouent un role primordial
dans la prise de decision quant au type dactif a choisir, ils seront esti-
mes par la methode des moindres carres ordinaires qui sera egalement
presentee dans ce chapitre.

248 / 1
3. Series statistiques a deux dimensions

Section 1 : Presentation des donnees

Sous section 1 : Tableau de contingence ou a double entree

Sous section 2 : Nuage de points

249 / 1
3. Series statistiques a deux dimensions
3.1. Presentation des donnees
3.1.1. Tableau de contingence ou a double entree

3.1.1. Tableau de contingence ou a double entree

HH Y
H
y y2 yj yl Total
X HH 1
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 nij nil ni
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk 1 nk 2 nkj nkl nk
Total n1 n2 nj nl n

250 / 1
3. Series statistiques a deux dimensions
3.1. Presentation des donnees
3.1.2. Nuage de points
3.1.2. Nuage de points : aucune correlation lineaire

251 / 1
3. Series statistiques a deux dimensions
3.1. Presentation des donnees
3.1.2. Nuage de points
3.1.2. Nuage de points : une correlation quadratique

252 / 1
3. Series statistiques a deux dimensions
3.1. Presentation des donnees
3.1.2. Nuage de points
3.1.2. Nuage de points : une correlation lineaire

253 / 1
3. Series statistiques a deux dimensions

Section 2 : Distributions marginales, conditionnelles et


jointe

Sous section 1 : Distributions marginales

Sous section 2 : Distributions conditionnelles

Sous section 3 : Distribution jointe

Sous section 4 : Exemple

254 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe

Sous section 1 : Distributions marginales

3.2.1.1. Distribution marginale de X

3.2.1.1. Distribution marginale de Y

255 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.1. Distributions marginales

3.2.1.1. Distribution marginale de X

HH Y
H
y y2 yj yl Total
X HH 1
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 nij nil ni
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk 1 nk 2 nkj nkl nk
Total n1 n2 nj nl n

256 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.1. Distributions marginales

3.2.1.1. Distribution marginale de X

Effectifs marginaux ni , (i = 1,2, ,k )

Pk
Effectif total n = i=1 ni

ni
Frequences marginales fi = n

1
Pk
Moyenne marginale x= n i=1 ni xi

1
Pk 2
Variance marginale V(X ) = n i=1 ni xi x

257 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.1. Distributions marginales

3.2.1.2. Distribution marginale de Y

HH Y
H
y y2 yj yl Total
X HH 1
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 nij nil ni
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk 1 nk 2 nkj nkl nk
Total n1 n2 nj nl n

258 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.1. Distributions marginales

3.2.1.2. Distribution marginale de Y

Effectifs marginaux nj , (j = 1,2, ,l )

Pl
Effectif total n = j =1 nj

nj
Frequences marginales fj = n

1
Pl
Moyenne marginale y= n j =1 nj yj

1
Pl 2
Variance marginale V(Y ) = n j =1 nj yj y

259 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe

Sous section 2 : Distributions conditionnelles

3.2.2.1. Distribution de X conditionnellement a yj

3.2.2.1. Distribution de Y conditionnellement a xi

260 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.2. Distributions conditionnelles

3.2.2.1. Distribution de X conditionnellement a yj

HH Y
HH y1 y2 yj yl Total
X H
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 nij nil ni
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk 1 nk 2 nkj nkl nk
Total n1 n2 nj nl n

261 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.2. Distributions conditionnelles

3.2.2.1. Distribution de X conditionnellement a yj

Effectifs conditionnels nij , (i = 1,2, ,k )

Pk
Effectif conditionnel total nj = i=1 nij

nij
Frequences conditionnelles fi|j = nj

1
Pk
Moyenne conditionnelle xj = nj i=1 nij xi

1
Pk 2
Variance conditionnelle Vj (X ) = nj i=1 nij (xi x j )

262 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.2. Distributions conditionnelles

3.2.2.2. Distribution de Y conditionnellement a xi

HH Y
H
y y2 yj yl Total
X HH 1
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 nij nil ni
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk 1 nk 2 nkj nkl nk
Total n1 n2 nj nl n

263 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.2. Distributions conditionnelles

3.2.2.2. Distribution de Y conditionnellement a xi

Effectifs conditionnels nij , (j = 1,2, ,l )

Pl
Effectif conditionnel total ni = j =1 nij

nij
Frequences conditionnelles fj |i = ni

1
Pl
Moyenne conditionnelle yi = ni j =1 nij yj

1
Pl 2
Variance conditionnelle Vi (Y ) = ni j =1 nij (yj y i )

264 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe

Sous section 3 : Distribution jointe du couple (X ; Y )

265 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.3. Distribution jointe du couple (X ; Y )

3.2.3. Distribution jointe du couple (X ; Y )

HH Y
HH y1 y2 yj yl Total
X H
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 nij nil ni
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk 1 nk 2 nkj nkl nk
Total n1 n2 nj nl n

266 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.3. Distribution jointe du couple (X ; Y )
3.2.3. Distribution jointe du couple (X ; Y )

Effectifs joints nij , (i = 1,2, ,k et j = 1,2, ,l )

Pk Pl
Effectif total n = i=1 j =1 nij

nij
Frequences jointes fij = n

1
Pk Pl
Moyenne jointe xy = n i=1 j =1 nij xi yj

1
Pk Pl  
cov(X ; Y ) = n i=1 j =1 nij xi x yj y
Covariance

=xy x y
267 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe

Sous section 4 : Exemple

268 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3.2.4. Exemple

Table: Notes obtenues en mathematiques (X ) et en statistique (Y )


HH Y
HH 7 15 18
X H
8 12 10 2
11 6 4 5
14 2 6 3

1. Completer le tableau de contingence ;


2. Caracteriser les distributions marginales de X et de Y ;
3. Caracteriser les distributions conditionnelles de X |Y et de Y |X ;
4. Caracteriser la distribution jointe du couple (X ; Y ).

269 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

1. Tableau de contingence :

Table: Notes obtenues en mathematiques (X ) et en statistique (Y )


HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50

270 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

2. Distribution marginale des notes obtenues en mathematiques (X ) :

Table: Notes obtenues en mathematiques (X ) et en statistique (Y )


HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50

271 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

2. Distribution marginale des notes obtenues en mathematiques (X ) :

2
xi ni fi ni xi ni xi x
8 24 0.48 192 118.28
11 15 0.30 165 9.13
14 11 0.22 154 157.17
50 1 511 284.58

3
1 X 511
x= ni xi = = 10.22
n i=1 50
3
1 X 2 284.58
V (X ) = ni xi x = = 5.69
n i=1 50

272 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

2. Distribution marginale des notes obtenues en statistique (Y ) :

Table: Notes obtenues en mathematiques (X ) et en statistique (Y )


HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50

273 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

2. Distribution marginale des notes obtenues en statistique (Y ) :

2
yj nj fj nj yj nj yj y
7 20 0.40 140 583.2
15 20 0.40 300 135.2
18 10 0.20 180 313.6
50 1 620 1032

3
1 X 620
y= nj yj = = 12.4
n j =1 50
3
1 X 2 1032
V (Y ) = nj yj y = = 20.64
n j =1 50

274 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de X conditionnellement a Y = 7 :

Table: Notes obtenues en mathematiques (X ) et en statistique (Y )


HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50

275 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de X conditionnellement a Y = 7 :

2
xi ni1 fi1 ni xi ni1 (xi x 1 )
8 12 0.6 96 27
11 6 0.3 66 13.5
14 2 0.1 28 40.5
20 1 190 81

3
1 X 190
x1 = ni1 xi = = 9.5
n1 i=1 20
3
1 X 2 81
V1 (X ) = ni1 (xi x 1 ) = = 4.05
n1 i=1 20

276 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de X conditionnellement a Y = 15 :

Table: Notes obtenues en mathematiques (X ) et en statistique (Y )


HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50

277 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de X conditionnellement a Y = 15 :

2
xi ni2 fi2 ni2 xi ni2 (xi x 2 )
8 10 0.5 80 57.6
11 4 0.2 44 1.44
14 6 0.3 84 77.76
20 1 208 136.8

3
1 X 208
x2 = ni2 xi = = 10.4
n2 i=1 20
3
1 X 2 136.8
V2 (X ) = ni2 (xi x 2 ) = = 6.84
n2 i=1 20

278 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de X conditionnellement a Y = 18 :

Table: Notes obtenues en mathematiques (X ) et en statistique (Y )


HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50

279 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de X conditionnellement a Y = 18 :

2
xi ni3 fi3 ni3 xi ni3 (xi x 3 )
8 2 0.2 16 21.78
11 5 0.5 55 0.45
14 3 0.3 42 21.87
10 1 113 44.1

3
1 X 113
x3 = ni3 xi = = 11.3
n3 i=1 10
3
1 X 2 44.1
V3 (X ) = ni3 (xi x 3 ) = = 4.41
n3 i=1 10

280 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de Y conditionnellement a X = 8 :

Table: Notes obtenues en mathematiques (X ) et en statistique (Y )


HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50

281 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de Y conditionnellement a X = 8 :

2
yj n1j f1j n1j yj n1j (yj y 1 )
7 12 0.5 84 216.75
15 10 0.42 150 140.625
18 2 0.08 36 91.125
24 1 270 448.5

3
1 X 270
y1 = n1j yj = = 11.25
n1 j =1 24
3
1 X 2 448.5
V1 (Y ) = n1j (yj y 1 ) = = 18.69
n1 j =1 24

282 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de Y conditionnellement a X = 11 :

Table: Notes obtenues en mathematiques (X ) et en statistique (Y )


HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50

283 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de Y conditionnellement a X = 11 :

2
yj n2j f2j n2j yj n2j (yj y 2 )
7 6 0.40 42 201.84
15 4 0.27 60 19.36
18 5 0.33 90 135.2
15 1 192 356.4

3
1 X 192
y2 = n2j yj = = 12.8
n2 j =1 15
3
1 X 2 356.4
V2 (Y ) = n2j (yj y 2 ) = = 23.76
n2 j =1 15

284 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de Y conditionnellement a X = 14 :

Table: Notes obtenues en mathematiques (X ) et en statistique (Y )


HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50

285 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

3. Distribution de Y conditionnellement a X = 14 :

2
yj n3j f3j n3j yj n3j (yj y 3 )
7 2 0.18 14 108.34
15 6 0.55 90 2.46
18 3 0.27 54 39.75
11 1 158 150.55

3
1 X 158
y3 = n3j yj = = 14.36
n3 j =1 11
3
1 X 2 150.55
V3 (Y ) = n3j (yj y 3 ) = = 13.69
n3 j =1 11

286 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

4. Distribution jointe du couple (X ; Y ) :

Table: Notes obtenues en mathematiques (X ) et en statistique (Y )


HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50

287 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

4. Distribution jointe du couple (X ; Y ) :

Table: Frequences jointes du couple (X ; Y )


HH Y
H 7 15 18
X HH
8 0.24 0.20 0.04
11 0.12 0.08 0.10
14 0.04 0.12 0.06
1

288 / 1
3. Series statistiques a deux dimensions
3.2. Distributions marginales, conditionnelles et jointe
3.2.4. Exemple

4. Distribution jointe du couple (X ; Y ) :

Table: Produits nij xi yj

HH Y
H
7 15 18
X HH
8 672 1200 288
11 462 660 990
14 196 1260 756
6484

3 3
1 XX 6484
xy = nij xi yj = = 129.68
n i=1 j =1 50

cov (X ; Y ) = xy x y = 129.68 10.22 12.4 = 2.952

289 / 1
3. Series statistiques a deux dimensions

Section 3 : Ajustement lineaire dun nuage de points

Sous-section 1 : Methode des moindres carres ordinaires

Sous-section 2 : Modele devaluation des actifs financiers

Sous-section 3 : Mise en uvre sous EViews

290 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

Sous-section 1 : Methode des moindres carres ordinaires

291 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

3.3.1 Methode des moindres carres ordinaires


Lorsquune correlation lineaire est mise en evidence entre les deux va-
riables statistiques, il faut lui donner une expression analytique de type
Y = a + bX en estimant les parametres a et b de cette equation.
Il existe de nombreuses methodes permettant destimer ces parametres,
la plus repandue est la methode des moindres carres ordinaires (mco).
Cette methode, comme son nom laisse entendre, consiste a trouver la
droite qui passe le plus pres de lensemble des points du nuage en mi-
nimisant la somme des carres des distances entre chaque point (xi ; yj )
du nuage et la droite Y = a + bX . Cette operation est connue sous
lappellation ajustement lineaire dun nuage de points .

292 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.1 Methode des moindres carres ordinaires

293 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

3.3.1 Methode des moindres carres ordinaires


Principe :
k
X 2
b = arg min ni (yi a bxi )
b
i=1
k
X  2
a = arg min ni yi a bxi
a
i=1

Resultat :
cov (X ; Y )
b =
V (X )
a = y bx

294 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

Sous-section 2 : Modele devaluation des actifs financiers

295 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

3.3.2. Modele devaluation des actifs financiers


Lune des applications de la methode des moindres carres ordinaires en
finance est le modele devaluation des actifs financiers qui relie de facon
a
lineaire la prime de risque anticipee A associee a un actif risque A a
a
la prime de risque anticipee M associee a un portefeuille de marche M
comme suit :
a a
A = + M
ou le de Jensen est une sorte de prime gratuite et le est une mesure
du risque systemique du marche. Sous lhypothese defficience des mar-
ches financiers, il ne doit pas y avoir dopportunite darbitrage entre
les actifs et le parametre doit etre statistiquement nul. Quant au
parametre , il peut etre statistiquement inferieur, superieur ou egal
a lunite, lactif risque A est alors respectivement defensif, offensif ou
insensible au portefeuille de marche M .

296 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

3.3.2. Modele devaluation des actifs financiers (suite)


Ce sont les estimations des parametres et du modele devaluation
des actifs financiers qui nous guident dans le choix entre lactif A et
le portefeuille de marche M . Le parametre doit etre statistiquement
nul pour sassurer que les prix des actifs integrent toute linformation
disponible au moment de la prise de decision. Le choix entre lactif A et
le portefeuille de marche M depend principalement de lestimation du
parametre , si celle-ci est statistiquement egale a lunite alors lactif A
et le portefeuille de marche offrent les memes opportunites et on sera
indifferent entre les deux. En revanche, si ce parametre est statistique-
ment different de lunite, alors il faut opter pour lactif A si > 1 et
pour le portefeuille de marche M dans le cas contraire. Comme les deux
primes sont lineairement correlees, on peut les estimer par la methode
des moindres carres ordinaires comme suit :
cov (A ;M )
= V(M ) = A bM

297 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

3.3.2. Modele devaluation des actifs financiers


Exemple :
On considere les donnees journalieres sur les rentabilites de laction de Maroc
Telecom et celles du MASI entre le 6 janvier 2012 et le 31 decembre 2013. Le
tableau de contingence suivant represente la distribution jointe des primes de
risque associees a ces deux actifs calculees par rapport a un taux sans risque
annuel de 3% (le taux journalier equivalent est de 0.0081%) :

PP iam
PP
masi PP [-0.1 ;-0.05[ [-0.05 ;0[ [0 ;0.05[ [0.05 ;0.1[ Total
P
[0.02; 0.01[ 2 19 1 0 22
[0.01; 0[ 2 187 58 0 247
[0; 0.01[ 0 65 138 1 204
[0.01; 0.02[ 0 1 14 1 16
[0.02; 0.03[ 0 0 2 1 3
Total 4 272 213 3 492

298 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

3.3.2. Modele devaluation des actifs financiers


Exemple (suite) :
On souhaite estimer les parametres du modele devaluation des actifs
financiers suivant avec la methode des moindres carres ordinaires :
a a
iam = + masi

Selon les resultats precedents, on a :

cov (iam ; masi )


=
V (masi )
= iam bmasi

Il faut donc calculer les moyennes iam , masi , la variance V (masi ) et


la covariance cov (iam ; masi ).

299 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

3.3.2. Modele devaluation des actifs financiers


Exemple (suite) : Moyenne et variance de masi

masi ci ni ni ci ci2 ni ci2


[0.02; 0.01[ -0.015 22 -0.33 0.000225 0.0050
[0.01; 0[ -0.005 247 -1.235 0.000025 0.0062
[0; 0.01[ 0.005 204 1.02 0.000025 0.0051
[0.01; 0.02[ 0.015 16 0.24 0.000225 0.0036
[0.02; 0.03[ 0.025 3 0.075 0.000625 0.0019
Total 492 -0.23 0.0218
P5
ni ci 2
masi = i=1 V (masi ) = c 2 masi
n
0.23 0.0218 2
= = (0.0005)
492 492
= 0.0005 = 0.000044

300 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

3.3.2. Modele devaluation des actifs financiers


Exemple (suite) : Moyenne de iam

iam ci ni ni ci
[0.1; 0.05[ -0.075 4 -0.3
[0.05; 0[ -0.025 272 -6.8
[0; 0.05[ 0.025 213 5.325
[0.05; 0.1[ 0.075 3 0.225
Total 492 -1.55

P4
i=1 ni ci
iam =
n
1.55
=
492
= 0.00315

301 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.2. Modele devaluation des actifs financiers
Exemple (suite) : Covariance entre masi et iam

PP iam -0.075
PP
-0.025 0.025 0.075
masi PPP P
-0.015 2 19 1 0
-0.005 2 187 58 0
0.005 0 65 138 1
0.015 0 1 14 1
0.025 0 0 2 1

2 (0.015) (0.075) + + 1 0.025 0.075


masi iam =
492
= 0.00009

cov (iam ; masi ) = masi iam masi iam


= 0.00009
302 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

3.3.2. Modele devaluation des actifs financiers


Exemple (suite) :
Le calcul des moyennes, de la variance et de la covariance donne :

iam = 0.00315
masi = 0.0005
V (masi ) = 0.000044
cov (iam ; masi ) = 0.00009

dou :
cov (iam ; masi ) 0.00009
= = = 2.045
V (masi ) 0.000044
= iam bmasi = 0.00315 2.045 (0.0005) = 0.0021

303 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.2. Modele devaluation des actifs financiers
Exemple (suite) :
Finalement, le modele devaluation des actifs financiers estime secrit :

iam = 0.0021 + 2.045 masi


(0.7139) (0.0000)

Interpretation :
I Lestimation du coefficient de Jensen est egale a -0.0021, cette
valeur est statistiquement nulle avec une probabilite assez impor-
tante (0.7139>0.05). On conclut que lhypothese defficience des
marches est verifiee et subsequemment quil y absence dopportu-
nite darbitrage entre laction de Maroc Telecom et lindice MASI.
I Lestimation du coefficient est egale 2.045, la probabilite que
cette valeur soit egale a lunite est nulle. Par consequent, ce para-
metre est statistiquement superieur a 1 et lon conclut que laction
de Maroc Telecom est un actif offensif. Il faut donc orienter notre
choix dinvestissement vers ce dernier.
304 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

Sous-section 3 : Mise en uvre sous EViews

305 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

306 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

307 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

308 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

309 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

310 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

311 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

312 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

313 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

314 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

315 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

316 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points
3.3.3. Mise en uvre sous EViews

317 / 1
3. Series statistiques a deux dimensions
3.3. Ajustement lineaire dun nuage de points

3.3.3. Mise en uvre sous EViews


Remarque :

La legere difference entre les resultats obtenus avec le logiciel EViews et


les resultats obtenus manuellement est due au fait que la distribution
des donnees au sein dune chaque classe soit remplacee par le centre
qui est une sorte de moyenne des valeurs comprises dans chacune des
classes. Ce remplacement fait lhypothese que les donnees soient uni-
formement reparties a linterieur des classes et ne tient pas compte des
eventuelles asymetries. Dans ce cas, il faut faire confiance au logiciel
qui traite les donnees comme si elles etaient des valeurs discretes et
attribue a chaque modalite son vrai poids dans la distribution.

318 / 1