Principal

Statistique Appliquee a la finance
Jaouad Madkour
e-mail: jaouad.madkour@outlook.com
Master Finance, Banque et Marches
Faculte des sciences juridiques, economiques et sociales - Tanger
2016/2017
1/1
Introduction
I Quest ce que LA statistique ?
I Objectif pedagogique du cours
I Pre-requis necessaires
I Plan du cours
2/1
Introduction
I Quest ce que LA statistique ?
La statistique est une branche des mathematiques qui permet dextraire,

danalyser et dexploiter linformation contenue dans un ensemble de donnees.
Ces donnees sont appelees des statistiques .
On distingue deux sortes de statistiques :

La statistique descriptive : elle considere un ensemble de donnees dans sa
globalite et le synthetise dans des tableaux, des graphiques et des indicateurs.
La statistique inferentielle : elle se base sur un sous-ensemble de donnees pour
rendre des conclusions sur lintegralite des donnees.
3/1
Introduction
Statistique descriptive
4/1
Introduction
I Objectif pedagogique du cours
Taxonomie de Bloom
5/1
Introduction
I Pre-requis necessaires
Bien que la statistique descriptive soit une branche des mathematiques qui a
des applications dans dautres disciplines telles que la biologie, la demogra-
phie, leconomie, la finance, la gestion..., elle ne necessite que des connais-
sances en mathematiques de niveau college et les outils de la discipline a
laquelle elle sapplique.
6/1
Introduction
I Plan du cours
Chapitre 1 : Organisation des donnees
Chapitre 2 : Series statistiques a une dimension
Chapitre 3 : Series statistiques a deux dimensions
7/1
Chapitre 1 : Organisation des donnees
Section 1 : Vocabulaire et operateurs statistiques
Section 2 : Tableaux statistiques
Section 3 : Representations graphiques
8/1
1. Organisation des donnees
Section 1 : Vocabulaire et operateurs statistiques
Sous section 1 : Vocabulaire statistique
Sous section 2 : Typologie des variables statistiques
Sous section 3 : Operateurs statistiques et
9/1
1.1. Vocabulaire et operateurs statistiques
Sous section 1 : Vocabulaire statistique
1.1.1.1. Population, echantillon et unite statistique
1.1.1.2. Caractere et modalite
1.1.1.3. Effectifs et frequences
1.1.1.4. Serie et distribution statistiques
10 / 1
1.1.1. Vocabulaire statistique

Definitions :
Population : un ensemble de personnes ou dobjets.
Echantillon : une partie de la population.
Unite statistique ou individu : un element de la population.
11 / 1
12 / 1
Exemple 1 :
Population : Moyens de transport au Maroc.
Unites statistiques : Motocycles, trains, autocars...
Echantillon : Vehicules immatricules en 2016.
Exemple 2 :
Population : Production agricole au Maroc.
Unites statistiques : Ble, tomates, pommes, vaches...
Echantillon : Production de cereales dans la region Settat-Casablanca.
13 / 1

Definitions :
Caractere : lobjet selon lequel la population est etudiee.
Modalite : une valeur prise par le caractere etudie.
Remarques :
Un caractere est aussi appele variable statistique, il est note en lettres
majuscules X , Y , ...
Une modalite est egalement appelee observation, elle est notee en

lettre minuscule indicee par le numero de la modalite xi , yj , ...
Un caractere X peut avoir plusieurs modalites x1 , x2 , ..., xk .
14 / 1
Exemple 1 (suite) :
Population : Moyens de transport au Maroc.
Caractere : Carburant utilise.
Modalites : Diesel, essence...
Exemple 2 (suite) :
Population : Production agricole au Maroc.
Caractere : Volume de la production en millions de tonnes.
Modalites : 5, 10, 20...
15 / 1

Definitions :
Effectif ni dune modalite xi : nombre dindividus ayant la modalite xi .
Effectif total n : nombre dindividus composant la population.
Frequence fi dune modalite xi : proportion dindividus ayant la

modalite xi , elle est donnee par :
ni
fi =
n
16 / 1
Remarques :
Leffectif total n est egal a la somme de tous les effectifs ni :
n1 + n2 + + nk = n
La somme des frequences fi est egale a 1 car :

n1 n2 nk
f1 + f2 + + fk = + + +
n n n
n1 + n2 + + nk
=
n
n
=
n
=1
17 / 1
Remarque :
Il peut arriver que la somme des fre-

quences ne soit pas egale a un a cause
des problemes darrondis comme dans
xi ni fi
lexemple ci-contre, dans une telle si- x1 1 1/3 0.33 0.34
tuation il est dusage de manipuler le- x2 1 1/3 0.33 0.33
gerement lune des frequences de sorte x3 1 1/3 0.33 0.33
Somme 3 0.99 1
que la somme soit precisement egale a
un.
18 / 1
Exemple :
Moyennes obtenues au baccalaureat
10 13 12 14 10 13 11 12 11 10
11 14 10 13 12 10 12 13 12 10
13 16 14 11 13 15 10 13 12 14
10 15 11 14 12 15 12 11 13 10
12 15 14 10 13 11 16 13 11 15
12 11 13 10 14 16 15 11 15 12
13 11 14 11 14 12 15 13 12 13
11 12 10 16 11 14 14 13 14 10
19 / 1
Exemple (suite) :
i xi ni fi = ni /n
1 10 13 13/80 = 0.1625
2 11 14 14/80 = 0.1750
3 12 14 14/80 = 0.1750
4 13 15 15/80 = 0.1875
5 14 12 12/80 = 0.1500
6 15 08 08/80 = 0.1000
7 16 04 04/80 = 0.0500
Somme n = 80 1
20 / 1
Definitions (suite) :
Effectif cumule croissant Ni+ dune modalite xi : nombre dindividus
ayant des modalites au plus egales a la modalite xi :
Ni+ = n1 + n2 + + ni
Effectif cumule decroissant Ni dune modalite xi : nombre dindividus

ayant des modalites au moins egales a la modalite xi :
Ni = nk + nk 1 + + ni
21 / 1
Exemple (suite) :
i xi ni Ni+ Ni
1 10 13 13 67+13 = 80
2 11 14 13+14 = 27 53+14 = 67
3 12 14 27+14 = 41 39+14 = 53
4 13 15 41+15 = 56 24+15 = 39
5 14 12 56+12 = 68 12+12 = 24
6 15 08 68+08 = 76 04+08 = 12
7 16 04 76+04 = 80 04
Somme n = 80
22 / 1
Definitions (suite) :
Frequence cumulee croissante Fi+ dune modalite xi : proportion din-
dividus ayant des modalites au plus egales a la modalite xi :
Fi+ = f1 + f2 + + fi
Frequence cumulee decroissante Fi dune modalite xi : proportion din-

dividus ayant des modalites au moins egales a la modalite xi :
Fi = fk + fk 1 + + fi
23 / 1
Exemple (suite) :
i xi fi Fi+ Fi
1 10 0.1625 0.1625 0.8375+0.1625 = 1.0000
2 11 0.1750 0.1625+0.1750 = 0.3375 0.6625+0.1750 = 0.8375
3 12 0.1750 0.3375+0.1750 = 0.5125 0.4875+0.1750 = 0.6625
4 13 0.1875 0.5125+0.1875 = 0.7000 0.3000+0.1875 = 0.4875
5 14 0.1500 0.7000+0.1500 = 0.8500 0.1500+0.1500 = 0.3000
6 15 0.1000 0.8500+0.1000 = 0.9500 0.0500+0.1000 = 0.1500
7 16 0.0500 0.9500+0.0500 = 1.0000 0.0500
Somme 1.0000
24 / 1
Remarques :
Suivant la tradition anglo-saxonne, les effectifs ni sont aussi appeles

frequences absolues et les frequences fi sont appelees frequences relatives.
Il ne faut pas confondre frequence fi et pourcentage pi ; une
frequence est comprise entre 0 et 1 tandis quun pourcentage est compris
entre 0 et 100. On obtient un pourcentage en multipliant une frequence
par 100 et on le note a laide du symbole % :
pi = (fi 100) %
Lexpression au plus est equivalente a inferieur ou egal et lex-

pression au moins est equivalente a superieur ou egal .
Les effectifs et les frequences cumules nont de sens que lorsquil est pos-
sible de classer les observations dans un ordre croissant ou decroissant.
25 / 1
Definition :
Une serie statistique est une suite dobservations brutes ou ordonnees. Il
sagit, par exemple, des reponses collectees lors dune enquete, des notes
obtenues dans une epreuve ecrite...etc.
Exemples :
Serie brute : 12 18 10 17 11 15 12 17 18 10
Serie ordonnee : 10 10 11 12 12 15 17 17 18 18
26 / 1
Definition :
Une distribution statistique est lassociation entre les modalites xi dune va-
riable statistique et les effectifs ni ou les frequences fi correspondants. Elle
montre comment les effectifs ou les frequences sont distribues entre les mo-
dalites.
Exemples :
Distribution statistique des effectifs

xi 10 11 12 15 17 18
ni 2 1 2 1 2 2
Distribution statistique des frequences

xi 10 11 12 15 17 18
fi 0.2 0.1 0.2 0.1 0.2 0.2
27 / 1
Sous section 2 : Typologie des variables statistiques
1.1.2.1. Variable statistique quantitative
1.1.2.2. Variable statistique qualitative
28 / 1
1.1.2. Typologie des variables statistiques

Definitions :
I Une variable statistique est dite quantitative si elle peut etre mesuree et
representee par un nombre ayant un sens mathematique.
Une variable statistique quantitative est continue si elle peut prendre

toutes les valeurs possibles dun intervalle.
Une variable statistique quantitative est discrete si elle ne peut prendre

que des valeurs isolees mais pas necessairement entieres.
29 / 1
Exemples de variable continue :
Poids en kilogrammes (20 kg, 22.5 kg...)
Taille en metres (1.70 m, 1.75 m...)
Age en annees (20 ans, 22.5 ans...)
Exemples de variable discrete :
Nombre denfants par famille (1, 2, 3...)
Nombre de vehicules par menage (0, 1, 2...)
Nombre dunites produites par une machine (100, 200, 300...)
30 / 1
Definition :
Une classe est un intervalle semi-ferme [xi1 ; xi [ contenant les modalites dune
variable statistique continue comprises entre la valeur xi1 (borne inferieure)
et la valeur xi (borne superieure), la premiere etant incluse dans lintervalle
et la deuxieme en est exclue. La derniere classe est generalement un intervalle
ferme [xk 1 ; xk ].
Une classe [xi1 ; xi [ se caracterise par son amplitude ai = xi xi1 et par

son centre ci = (xi1 + xi )/2 et doit avoir un effectif au moins egal a 5.
On convient de donner a une classe le numero de sa borne superieure. Par

exemple, la classe [x3 ; x4 [ est la classe numero 4.
31 / 1
Remarque :
La distinction entre une variable continue et une variable discrete nest pas
toujours aussi simple car, dune part, la precision dune variable continue est
souvent limitee a quelques decimales apres la virgule et rend donc ses valeurs
isolees et, dautre part, une variable discrete peut prendre une infinite de
valeurs quelles deviennent tres proches.
Ainsi, une variable statistique sera continue des que sont traitement necessite
le regroupement de ses modalites en classes. En revanche, si une variable
statistique ne prend que quelques valeurs, meme decimales, dont le traitement
ne necessite pas des regroupements en classes, alors la variable en question
est discrete.
32 / 1

Definitions :
I Une variable statistique est dite qualitative si elle ne peut pas etre me-
suree ni representee par un nombre ayant un sens mathematique.
Une variable statistique qualitative est ordinale sil est possible detablir
un ordre universel entre ses modalites.
Une variable statistique qualitative est nominale sil nest pas possible
detablir un ordre universel entre ses modalites.
Les categories dune variables qualitatives designent simplement ses mo-

dalites. Par consequent, une variable qualitative sappelle aussi une va-
riable categorielle.
33 / 1
Exemples de variable ordinale :
Niveaux detudes (licence, master...)
Niveaux de satisfaction (pas satisfait, satisfait, tres satisfait...)
Niveaux hierarchiques (ouvriers, PDG...)
Exemples de variable nominale :
Couleurs (rouge, bleu...)
Diplomes (litteraire, scientifique...)
Genre (homme ou femme)
34 / 1
Remarques :
Il est parfois difficile de savoir si une variable statistique est ordinale ou

nominale, lexemple typique est celui des categories socioprofessionnelles
ou on a tendance a classer les ouvriers a un niveau inferieur a celui des
cadres. Ce classement est base sur le salaire que percoivent les uns et
les autres ou sur leur niveau de qualification, mais il sera inverse si lon
considerait plutot leur niveau de stress par exemple.
Les categories dune variable qualitative peuvent etre codees par des
nombres demunis de toute signification mathematique. On peut, par
exemple, donner a la couleur bleue le code 1, a la couleur rouge le code 2
et a la couleur verte le code 3. Ces codes nont pas de sens mathematique
car 1+2 = 3 ne signifie pas que melanger la couleur bleue avec la couleur
rouge produit la couleur verte !
35 / 1
Sous section 3 : Operateurs statistiques et
1.1.3.1. Operateur statistique (sigma)
1.1.3.2. Operateur statistique (pi)
1.1.3.3. Applications
36 / 1
1.1.3. Operateurs statistiques et
Definition :
Soit X une variable statistique quantitative prenant les valeurs x1 , x2 , ,xk
avec k N.
Loperateur permet decrire la somme x1 + x2 + + xk de facon plus

compacte :
X k
xi x1 + x2 + + xk
i=1
ou i est une variable muette representant lindice de sommation.
On lit : somme des xi avec i allant de 1 a k .
37 / 1
Proprietes de loperateur :
Soient X et Y deux variables statistiques quantitatives prenant respective-

ment les valeurs x1 , x2 , ,xk et y1 , y2 , ,yk avec k N. Loperateur
verifie les proprietes suivantes :
k
X k
X
axi = a xi , a R
i=1 i=1
k
X k
X k
X
(xi + yi ) = xi + yi
i=1 i=1 i=1
k
X b
X k
X
xi = xi + xi , b N \ 1 < b < k
i=1 i=1 i=b+1
k
X
a = k .a , a R
i=1
38 / 1
Demonstrations :
Propriete 1 :
k
X
axi = ax1 + ax2 + + axk
i=1
= a (x1 + x2 + + xk )
| {z }
Pk
i=1 xi
k
X
=a xi
i=1
39 / 1
Demonstrations (suite) :
Propriete 2 :
k
X
(xi + yi ) = (x1 + y1 ) + (x2 + y2 ) + + (xk + yk )
i=1
= (x1 + x2 + + xk ) + (y1 + y2 + + yk )
| {z } | {z }
Pk Pk
i=1 xi i=1 yi
k
X k
X
= xi + yi
i=1 i=1
40 / 1
Propriete 3 :
k
X
xi = x1 + x2 + + xb + xb+1 + xb+2 + + xk
i=1
= (x1 + x2 + + xb ) + (xb+1 + xb+2 + + xk )

| {z } | {z }
Pb Pk
i=1 xi i=b+1
xi
b
X k
X
= xi + xi
i=1 i=b+1
41 / 1
Propriete 4 :
k
X
a = a + a + + a
| {z }
i=1
k fois
= k .a
42 / 1

Definition :
Soit X une variable statistique quantitative prenant les valeurs x1 , x2 , ,xk
avec k N.
Loperateur permet decrire le produit x1 x2 xk de facon plus

compacte :
Y k
xi x1 x2 xk
i=1
ou i est une variable muette representant lindice de multiplication.
On lit : produit des xi avec i allant de 1 a k .
43 / 1
Proprietes de loperateur :
Soient X et Y deux variables statistiques quantitatives prenant respective-

ment les valeurs x1 , x2 , ,xk et y1 , y2 , ,yk avec k N. Loperateur
verifie les proprietes suivantes :
k
Y
a = a k , a R
i=1
k
Y k
Y k
Y
(xi yi ) = xi yi
i=1 i=1 i=1
k
Y b
Y k
Y
xi = xi xi , b N \ 1 < b < k
i=1 i=1 i=b+1
k
Y k
Y
axi = a k xi , a R
i=1 i=1
44 / 1
Demonstrations :
Propriete 1 :
k
Y
a = a a a
| {z }
i=1
k facteurs
= ak
45 / 1
Propriete 2 :
k
Y
(xi yi ) = (x1 y1 ) (x2 y2 ) (xk yk )
i=1
= (x1 x2 xk ) (y1 y2 yk )
| {z } | {z }
Qk Qk
i=1 xi i=1 yi
k
Y k
Y
= xi yi
i=1 i=1
46 / 1
Propriete 3 :
k
Y
xi = x1 x2 xb xb+1 xb+2 xk
i=1
= (x1 x2 xb ) (xb+1 xb+2 xk )

| {z } | {z }
Qb Qk
i=1 xi i=b+1
xi
b
Y k
Y
= xi xi
i=1 i=b+1
47 / 1
Propriete 4 :
k
Y
axi = ax1 ax2 axk
i=1
= (a a a) (x1 x2 xk )
| {z } | {z }
k facteurs
Qk
i=1 xi
k
Y
= ak xi
i=1
48 / 1
Calculer les sommes suivantes :

k
X
(xi + a)
i=1
k
X
(xi + a)2
i=1
k
X
(xi + yi )2
i=1
Que vaut le logarithme dun produit ?

k
!
Y
log xi
i=1
49 / 1
Solutions :
k
X
(xi + a) = (x1 + a) + (x2 + a) + + (xk + a)
i=1
= x1 + a + x2 + a + + xk + a
= (x1 + x2 + + xk ) + (a + a + + a)
k
X k
X
= xi + a
i=1 i=1
k
X
= xi + ka
i=1
50 / 1
Solutions (suite) :
k
X
(xi + a)2 = (x1 + a)2 + (x2 + a)2 + + (xk + a)2
i=1
= x12 + 2ax1 + a 2 + x22 + 2ax2 + a 2 + + xk2 + 2axk + a 2

= x12 + 2ax1 + a 2 + x22 + 2ax2 + a 2 + + xk2 + 2axk + a 2
= (x12 + + xk2 ) + (2ax1 + + 2axk ) + (a 2 + + a 2 )
k
X k
X k
X
= xi2 + 2axi + a2
i=1 i=1 i=1
k
X k
X
= xi2 + 2a xi + k .a 2
i=1 i=1
51 / 1
Solutions (suite) :
k
X
(xi + yi )2 = (x1 + y1 )2 + (x2 + y2 )2 + + (xk + yk )2
i=1
= x12 + 2x1 y1 + y12 + + xk2 + 2xk yk + yk2

= x12 + 2x1 y1 + y12 + + xk2 + 2xk yk + yk2
= (x12 + + xk2 ) + (2x1 y1 + + 2xk yk ) + (y12 + + yk2 )

k
X k
X k
X
= xi2 + 2xi yi + yi2
i=1 i=1 i=1
k
X k
X k
X
= xi2 + 2 xi yi + yi2
i=1 i=1 i=1
52 / 1
Rappel :
log (a b) = log (a) + log (b)
Solutions (suite) :
k
!
Y
log xi = log (x1 x2 xk )
i=1
= log (x1 ) + log (x2 ) + + log (xk )

k
X
= log (xi )
i=1
53 / 1
Section 2 : Tableaux statistiques
Sous section 1 : Variables qualitatives nominales
Sous section 2 : Variables qualitatives ordinales
Sous section 3 : Variables quantitatives discretes
Sous section 4 : Variables quantitatives continues
54 / 1
1.2. Tableaux statistiques
Definition :
Le tableau statistique est une representation synthetique dune distribution
statistique. Il fournit des informations sur chacune des modalites prises par
la variable statistique etudiee. Ces informations sont leffectif de chaque mo-
dalite, sa frequence, ses effectifs cumules, ses frequences cumulees ou toute
autre information utile telle que le centre ou lamplitude des classes.
55 / 1
Sous section 1 : Variables qualitatives nominales
56 / 1
1.2.1. Variables qualitatives nominales
Exemple :
Elections legislatives
Lors delections legislatives, 40 citoyens ont vote en choisissant la couleur cor-

respondant a lun des quatre partis politiques presentes dans leur commune.
Voici le resultat du vote :
B V R O R O R B R B
B V B R V B V B O R
V V R B R V O R O B
B B V B V R B B O R
ou les lettres B, V, R et O designent respectivement les couleurs bleue, verte,

rose et orange.
57 / 1
1.2.1. Variables qualitatives nominales
Voici le tableau statistique relatif a la serie statistique des votes :
Categories ni fi
Vert 9 0.225
Bleu 14 0.350
Orange 6 0.150
Rose 11 0.275
Total 40 1.000
A partir de ce tableau, on peut facilement noter que le parti politique re-

presente par la couleur bleue a recueilli le maximum de voix et que le parti
associe a la couleur orange arrive en dernier dans ces elections.
58 / 1
Sous section 2 : Variables qualitatives ordinales
59 / 1
1.2.2. Variables qualitatives ordinales
Exemple :
Diplomes dune commune
On a recense les diplomes dune commune et lon a obtenu la serie

statistique ci-dessous :
B M L D B L M M B D L B
L B L B B L M B L B B B
B M B B L L B L B L L L
L M D B M B B L D B M M
B L B M L B M L D B M B
ou les lettres B, L, M et D correspondent respectivement au baccalaureat, a

la licence, au master et au doctorat.
60 / 1
1.2.2. Variables qualitatives ordinales
Le tableau statistique associe a la serie des diplomes est le suivant :
Diplomes ni fi Ni+ Ni Fi+ Fi

Baccalaureat 25 0.42 25 60 0.42 1
Licence 18 0.30 43 35 0.72 0.58
Master 12 0.20 55 17 0.92 0.28
Doctorat 5 0.08 60 5 1 0.08
Total 60 1
Pour trouver le nombre de personnes ayant au moins une licence, il suffit de

se reporter a la cellule situee a lintersection de la ligne Licence et de la
colonne Ni . La reponse est 35.
Pour connatre la proportion dindividus ayant au plus un master, il faut lire
la reponse dans la cellule se trouvant au croisement de la ligne Master et
de la colonne Fi+ . La reponse est 0.92.
61 / 1
Sous section 3 : Variables quantitatives discretes
62 / 1
1.2.3. Variables quantitatives discretes
Exemple :
Nombre denfants par famille
Lors dune etude demographique, on a classe 100 familles selon leur nombre
denfants. Voici la serie statistique obtenue :
1111111111112222222222222
2222222222222222222222222
2233333333333333333333333
3333333334444444444444444
Notons que cette serie est ordonnee et en consequence son traitement est
legerement plus simple que celui dune serie brute. En particulier, on peut
aisement reperer les extrema (minimum et maximum) de la serie.
63 / 1
1.2.3. Variables quantitatives discretes
Le tableau statistique relatif a la repartition des familles selon leur nombre
denfants se presente comme suit :
x(i) ni fi Ni+ Ni Fi+ Fi

1 12 0.12 12 100 0.12 1
2 40 0.40 52 88 0.52 0.88
3 32 0.32 84 48 0.84 0.48
4 16 0.16 100 16 1 0.16
Total 100 1
A laide de ce tableau, on peut par exemple facilement trouver le nombre de

familles qui ont au plus 4 enfants, la reponse se trouve a lintersection de la
ligne 4 et de la colonne Ni+ , a savoir, 100 familles.
On peut egalement trouver la proportion de familles ayant au moins un en-
fant, il suffit alors de se reporter a la cellule situee sur la ligne 1 et sur
la colonne Fi . La reponse est 1.
64 / 1
Sous section 4 : Variables quantitatives continues
65 / 1
1.2.4. Variables quantitatives continues
Exemple :
Tailles dindividus
On a mesure les tailles de 55 individus en centimetres et lon a trouve les

mesures suivantes :
161.2 162.4 162.7 163.8 163.5 166.4 166.8 166.4 167.1 167.3 168.2
168.7 169.1 169.4 169.4 171.4 171.6 171.4 171.8 171.8 171.2 171.8
171.1 171.5 172.9 172.7 172.4 173.4 173.6 173.6 173.3 173.1 174.4
174.4 174.7 177.4 177.6 177.4 177.6 178.4 178.4 178.1 178.2 179.8
179.4 179.1 179.0 179.4 179.4 179.3 181.1 181.3 182.1 183.1 183.3
Pour faciliter le traitement de cette serie statistique, les mesures obtenues

seront regroupees dans des classes.
66 / 1
1.2.4. Variables quantitatives continues
La tableau statistique associe a la distribution des tailles est le suivant :
Tailles (cm) ai ci ni fi Ni+ Ni Fi+ Fi

[160 ; 165 [ 5 162.5 5 0.09 5 55 0.09 1
[165 ; 170 [ 5 167.5 10 0.18 15 50 0.27 0.91
[170 ; 175 [ 5 172.5 20 0.36 35 40 0.63 0.73
[175 ; 180 [ 5 177.5 15 0.28 50 20 0.91 0.37
[180 ; 185 ] 5 182.5 5 0.09 55 5 1 0.09
Total 55 1
Le nombre 15, par exemple, situe en face de la classe [165; 170[ et sur la
colonne Ni+ est la somme de deux nombres de la colonne ni : le nombre 5
correspondant a la classe [160; 165[ et le nombre 10 correspondant a la classe
[165; 170[. 15 est donc le nombre dindividus ayant des tailles comprises entre
160 cm et 170 cm ou tout simplement des tailles au plus egales a 170 cm (la
borne superieure de la classe [165; 170[).
67 / 1
Section 3 : Representations graphiques
Sous section 1 : Diagramme en barres
Sous section 2 : Diagramme en batons
Sous section 3 : Histogramme
Sous section 4 : Courbes cumulatives
68 / 1
1.3. Representations graphiques
Chacune des colonnes dun tableau statistique peut etre representee graphi-
quement et a chaque colonne correspond un type particulier de representation
graphique.
Une representation graphique est une visualisation de lallure generale de

la distribution statistique au moyen de points, de segments, de surfaces et
dautres symboles ou formes geometriques.
Les representations graphiques sont tres nombreuses, seules seront presentees

les plus utilisees.
69 / 1
Sous section 1 : Diagramme en barres
70 / 1
1.3.1. Diagramme en barres
Definition :
Le diagramme en barres (ou en tuyaux dorgue) est un graphique compose

de rectangles (barres) disjoints associant a chaque categorie dune variable
qualitative (nominale ou ordinale) un rectangle de base constante et de hau-
teur egale a leffectif ou la frequence de cette categorie.
71 / 1
Exemple :
Representation graphique des effectifs
Couleurs ni
Vert 9
Bleu 14
Orange 6
Rose 11
72 / 1
Exemple :
Representation graphique des frequences
Couleurs fi
Vert 0.225
Bleu 0.350
Orange 0.150
Rose 0.275
73 / 1
Exemple :
Diplomes ni
Baccalaureat 25
Licence 18
Master 12
Doctorat 5
74 / 1
Exemple :
Diplomes fi
Baccalaureat 0.42
Licence 0.30
Master 0.20
Doctorat 0.08
75 / 1
Remarque :
Lordre des categories dune variable qualitative ordinale doit etre respecte
lors de la construction du diagramme en barres.
76 / 1
Sous section 2 : Diagramme en batons
77 / 1
1.3.2. Diagramme en batons
Definitions :
Le diagramme en batons est un graphique qui associe a chaque modalite

dune variable quantitative discrete un segment (baton) de longueur egale a
son effectif ou a sa frequence.
Le polygone est un ensemble de segments de droites reliant les sommets des
batons. Il donne la forme de la distribution statistique.
78 / 1
Exemple :
xi ni
1 12
2 40
3 32
4 16
79 / 1
Exemple :
xi fi
1 0.12
2 0.40
3 0.32
4 0.16
80 / 1
Sous section 3 : Histogramme
81 / 1
1.3.3. Histogramme
Definition :
Lhistogramme est un diagramme compose de rectangles juxtaposes dont les

aires sont egales aux effectifs ni ou aux frequences fi et dont les bases sont
determinees par les classes damplitudes ai de la variable continue. La hauteur
de chaque rectangle est egale a la densite (deffectifs ou de frequences), notee
hi , donnee par :
ni fi
hi = ai
ou hi = ai
Le polygone est une droite segmentee reliant les points centraux des sommets
de chaque rectangle dun histogramme. Le polygone permet de donner lallure
de la distribution statistique.
82 / 1
1.3.3. Histogramme
Exemple :
Tailles dindividus
Tailles (cm) ni ai hi ci
[155 ; 160 [ 0 5 0 157.5
[160 ; 165 [ 5 5 1 162.5
[165 ; 170 [ 10 5 2 167.5
[170 ; 175 [ 20 5 4 172.5
[175 ; 180 [ 10 5 2 177.5
[180 ; 185 [ 10 5 2 182.5
[185 ; 190] 0 5 0 187.5
83 / 1
1.3.3. Histogramme
Exemple :
Tailles dindividus
Tailles (cm) fi ai hi ci
[155 ; 160 [ 0 5 0 157.5
[160 ; 165 [ 0.090 5 0.018 162.5
[165 ; 170 [ 0.180 5 0.036 167.5
[170 ; 175 [ 0.360 5 0.072 172.5
[175 ; 180 [ 0.185 5 0.037 177.5
[180 ; 185 [ 0.185 5 0.037 182.5
[185 ; 190] 0 5 0 187.5
84 / 1
1.3.3. Histogramme
Remarques :
Si les classes ne sont pas de meme amplitude, il convient duniformiser

leurs amplitudes en fractionnant celles qui ont les amplitudes les plus
grandes.
Si en plus de lhistogramme on souhaite tracer un polygone, on ajoute

deux classes extremes vides dont les centres respectifs constitueront les
deux extremites du polygone.
85 / 1
Sous section 4 : Courbes cumulatives
1.3.4.1. Variable statistique discrete
1.3.4.2. Variable statistique continue
86 / 1
1.3.4. Courbes cumulatives
Definitions :
La courbe cumulative est un graphique qui associe a chaque modalite dune

variable quantitative son effectif cumule ou sa frequence cumulee.
Selon que leffectif et la frequence sont croissants ou decroissants, la courbe

cumulative correspondante est ascendante ou descendante.
87 / 1
Effectifs cumules croissants : Courbe cumulative ascendante
xi Ni+
1 12
2 52
3 84
4 100
Nombre dindividus ayant au plus la modalite xi .
88 / 1
xi Ni+
1 12
2 52
3 84
4 100
89 / 1
xi Ni+
1 12
2 52
3 84
4 100
90 / 1
Effectifs cumules decroissants : Courbe cumulative

descendante
xi Ni
1 100
2 88
3 48
4 16
Nombre dindividus ayant au moins la modalite xi .
91 / 1

descendante
xi Ni
1 100
2 88
3 48
4 16
92 / 1

descendante
xi Ni
1 100
2 88
3 48
4 16
93 / 1
Frequences cumulees croissantes : Courbe cumulative

ascendante
xi Fi+
1 0.12
2 0.52
3 0.84
4 1
Proportion dindividus ayant au plus la modalite xi .
94 / 1

ascendante
xi Fi+
1 0.12
2 0.52
3 0.84
4 1
95 / 1

ascendante
xi Fi+
1 0.12
2 0.52
3 0.84
4 1
96 / 1
Frequences cumulees decroissantes : Courbe cumulative

descendante
xi Fi
1 1
2 0.88
3 0.48
4 0.16
Proportion dindividus ayant au moins la modalite xi .
97 / 1

descendante
xi Fi
1 1
2 0.88
3 0.48
4 0.16
98 / 1

descendante
xi Fi
1 1
2 0.88
3 0.48
4 0.16
99 / 1
[xi1 .; xi [ Ni+
[160 ; 165 [ 5
[165 ; 170 [ 15
[170 ; 175 [ 35
[175 ; 180 [ 50
[180 ; 185] 55
Nombre dindividus ayant au plus la borne superieure de la classe [xi1 .; xi [ .
100 / 1
[xi1 .; xi [ Ni+
[160 ; 165 [ 5
[165 ; 170 [ 15
[170 ; 175 [ 35
[175 ; 180 [ 50
[180 ; 185] 55
101 / 1
[xi1 .; xi [ Ni+
[160 ; 165 [ 5
[165 ; 170 [ 15
[170 ; 175 [ 35
[175 ; 180 [ 50
[180 ; 185] 55
102 / 1
descendante
[xi1 .; xi [ Ni
[160 ; 165 [ 55
[165 ; 170 [ 50
[170 ; 175 [ 40
[175 ; 180 [ 20
[180 ; 185] 5
Nombre dindividus ayant au moins la borne inferieure de la classe

[xi1 .; xi [ .
103 / 1
descendante
[xi1 .; xi [ Ni
[160 ; 165 [ 55
[165 ; 170 [ 50
[170 ; 175 [ 40
[175 ; 180 [ 20
[180 ; 185] 5

[xi1 .; xi [ .
104 / 1
descendante
[xi1 .; xi [ Ni
[160 ; 165 [ 55
[165 ; 170 [ 50
[170 ; 175 [ 40
[175 ; 180 [ 20
[180 ; 185] 5

[xi1 .; xi [ .
105 / 1
ascendante
[xi1 .; xi [ Fi+
[160 ; 165 [ 0.09
[165 ; 170 [ 0.27
[170 ; 175 [ 0.63
[175 ; 180 [ 0.91
[180 ; 185] 1
Proportion dindividus ayant au plus la borne superieure de la classe

[xi1 .; xi [ .
106 / 1
ascendante
[xi1 .; xi [ Fi+
[160 ; 165 [ 0.09
[165 ; 170 [ 0.27
[170 ; 175 [ 0.63
[175 ; 180 [ 0.91
[180 ; 185] 1

[xi1 .; xi [ .
107 / 1
ascendante
[xi1 .; xi [ Fi+
[160 ; 165 [ 0.09
[165 ; 170 [ 0.27
[170 ; 175 [ 0.63
[175 ; 180 [ 0.91
[180 ; 185] 1

[xi1 .; xi [ .
108 / 1
descendante
[xi1 .; xi [ Fi
[160 ; 165 [ 1
[165 ; 170 [ 0.91
[170 ; 175 [ 0.73
[175 ; 180 [ 0.37
[180 ; 185] 0.09
Proportion dindividus ayant au moins la borne inferieure de la classe

[xi1 .; xi [ .
109 / 1
descendante
[xi1 .; xi [ Fi
[160 ; 165 [ 1
[165 ; 170 [ 0.91
[170 ; 175 [ 0.73
[175 ; 180 [ 0.37
[180 ; 185] 0.09

[xi1 .; xi [ .
110 / 1
descendante
[xi1 .; xi [ Fi
[160 ; 165 [ 1
[165 ; 170 [ 0.91
[170 ; 175 [ 0.73
[175 ; 180 [ 0.37
[180 ; 185] 0.09

[xi1 .; xi [ .
111 / 1
Chapitre 2 : Series statistiques a une dimension
Section 1 : Mesures de position
Section 2 : Mesures de dispersion
Section 3 : Mesures de forme
112 / 1
2. Series statistiques a une dimension
Dans ce chapitre, seules seront considerees des variables statistiques quanti-

tatives etant donne que les variables qualitatives ne se pretent pas aux calculs
mathematiques qui seront presentes.
Les variables statistiques seront notees en lettres majuscules X , et leurs k mo-

dalites en lettres minuscules x indicees par i. Chaque modalite xi intervient
un nombre ni de fois dans la population formee dun nombre n dindividus.
Dans le cas dune variable statistique continue, les modalites seront regrou-
pees en classes [xi1 ; xi [ damplitudes respectives ai et de centres respectifs
ci .
113 / 1
Section 1 : Mesures de position
Sous section 1 : Mesures de tendance centrale ou de centre
Sous section 2 : Mesures de position relative ou quantiles
114 / 1
2.1. Mesures de position
Definition :
Une mesure de position, comme son nom lindique, est un indicateur dune
position particuliere dans une serie statistique. Cette position particuliere
peut etre le centre autour duquel les donnees sont reparties de facon equi-
libree (mesure de tendance centrale), ou au contraire une position telle que
les donnees se repartissent dans des proportions inegales de part et dautre
(mesure de position relative).
115 / 1
116 / 1
Sous section 1 : Mesures de tendance centrale ou de centre
2.1.1.1 Le mode
2.1.1.2 La mediane
2.1.1.3 La moyenne arithmetique
117 / 1
2.1.1. Mesures de tendance centrale ou de centre
2.1.1.1 Le mode
Definition :
Le mode dune distribution statistique, note Mo , est la modalite du caractere
la plus frequemment rencontree localement. Cest lequivalent du maximum
en analyse mathematique.
Une distribution statistique peut avoir un, deux ou plusieurs modes, on parle
alors respectivement de distributions unimodale, bimodale et multimodale.
118 / 1
2.1.1.1. Le mode
119 / 1
2.1.1.1. Le mode
Determination dans le cas discret :
A partir dun diagramme en batons :
Le mode est la modalite correspondant au baton le plus eleve localement.
Mo = 2
2 est le nombre denfants par famille
le plus frequemment observe.
120 / 1
2.1.1.1. Le mode
A partir dun tableau statistique :
Le mode est la modalite correspondant a leffectif (ou a la frequence)
maximal(e) localement.
xi ni fi
Mo = 2 1 12 0.12
2 38 0.38
2 est le nombre denfants par famille
le plus frequemment observe. 3 22 0.22
4 18 0.18
5 10 0.10
100 1
121 / 1
2.1.1.1. Le mode
Determination dans le cas continu :
A partir dun histogramme :
1. Identifier la classe modale [xi1 ; xi [ :
Cest la classe correspondant au rectangle le plus eleve localement.
122 / 1
2.1.1.1. Le mode
A partir dun histogramme :
2. Identifier la valeur modale Mo graphiquement :
Le mode Mo est labscisse du point dintersection des segment joi-
gnant les coins superieurs du rectangle de la classe modale aux
coins superieurs les plus proches des rectangles adjacents :
123 / 1
2.1.1.1. Le mode

1. Identifier la classe modale [xi1 ; xi [ :
Cest la classe correspondant a la densite la plus elevee
localement.
[xi1 ; xi [ ni ai hi
[160 ; 165 [ 5 5 1
[165 ; 170 [ 13 5 2.6
[170 ; 175 [ 20 5 4
[175 ; 185] 20 10 2
Total 58
124 / 1
2.1.1.1. Le mode

2. Calculer la valeur modale Mo analytiquement :
La valeur modale Mo est egale a la borne inferieure de la classe
modale [xi1 ; xi [ plus une fraction d1d+d
1
2
de lamplitude xi xi1
de la classe modale :
d1
M0 = xi1 + (xi xi1 )
d1 + d2
avec :
d1 = hi hi1 d2 = hi hi+1
125 / 1
2.1.1.1. Le mode
I Demonstration : Triangles semblables
Deux triangles sont semblables si leurs

angles sont egaux deux a deux. Par
consequent, ils ont la meme forme mais
pas necessairement la meme taille.
Caracteristiques :
a b c
= =
A B C
h H
=
a A
ou h et H designent les hauteurs des
triangles.
126 / 1
2.1.1.1. Le mode
I Demonstration (suite) :
Les triangles ABE et CDE sont semblables, on a :
EH EH 0 Mo xi1 xi Mo
= =
AB DC d1 d2
d1
Mo xi1 = (xi Mo )
d2
d1
Mo xi1 = [(xi xi1 ) (Mo xi1 )]
d2
d1 d1
Mo xi1 = (xi xi1 ) (Mo xi1 )
d2 d2

d1 d1
(Mo xi1 ) 1 + = (xi xi1 )
d2 d2
d2 d1
Mo xi1 = (xi xi1 )
d1 + d2 d2
d1
Mo = xi1 + d1 +d2
(xi xi1 )
127 / 1
2.1.1.1. Le mode

I Exemple :
Tailles dindividus
Identification de la classe modale :
Mo [170 ; 175 [
Tailles (cm) hi
[160 ; 165 [ 1 Calcul du mode :
[165 ; 170 [ 2.6
4 2.6
[170 ; 175 [ 4 Mo = 170 + (175 170)
(4 2.6) + (4 2)
[175 ; 185] 2
172.06 cm
Total
La taille dindividus la plus frequemment
rencontree est 172.06 cm.
128 / 1
2.1.1.1. Le mode
Remarques :
Le mode est la mesure de centre adaptee aux caracteres qualitatifs.
129 / 1
2.1.1.1. Le mode
Remarques (suite) :
Les modes des distributions statistiques multimodales ne sont plus des me-
sures de centre mais une indication sur lheterogeneite de la population.
130 / 1
2.1.1.1. Le mode
Remarques (suite) :
Le mode est sensible au decoupage des classes dune variable continue.
[xi1 ; xi [ ni ai hi [xi1 ; xi [ ni ai hi
[160 ; 165 [ 5 5 1 [160 ; 170 [ 15 10 1.5
[165 ; 170 [ 10 5 2 [170 ; 180 [ 35 10 3.5
[170 ; 175 [ 20 5 4 [180 ; 185 [ 5 5 1
[175 ; 180 [ 15 5 3
[180 ; 185 [ 5 5 1
42 3.5 1.5
Mo = 170 + 5 Mo = 170 + 10
(4 2) + (4 3) (3.5 1.5) + (3.5 1)
= 173.33 cm = 174.44 cm
131 / 1
2.1.1.2 La mediane
Definition :
La mediane dune distribution statistique, notee Me , est la valeur du caractere
qui partage la serie statistique ordonnee en deux parties contenant chacune
la moitie des observations.
132 / 1
2.1.1.2. La mediane
133 / 1
2.1.1.2. La mediane
Exemples :
Serie 1 : 2 3 3 4 5 6 6 7 8
Serie 2 : 2 3 3 4 5 5 6 7 8 9
Serie 3 : 2 3 3 4 5 6 6 7 8 9
134 / 1
2.1.1.2. La mediane
Exemples (suite) :
Serie 1 : 2 3 3 4 5 6 6 7 8
xi ni fi Fi+
Aucune frequence cumulee croissante nest
2 1 0.11 0.11
egale a 0.5.
3 2 0.22 0.33
4 1 0.11 0.44 La mediane correspond a la frequence cumulee
5 1 0.11 0.55 croissante immediatement superieure a 0.5.
6 2 0.22 0.77
7 1 0.11 0.88 La valeur 0.5 renvoie a la notion de moitie .
8 1 0.12 1
Somme 9 1
135 / 1
2.1.1.2. La mediane
Exemples (suite) :
Serie 2 : 2 3 3 4 5 5 6 7 8 9
xi ni fi Fi+
2 1 0.1 0.1 Aucune frequence cumulee croissante nest
3 2 0.2 0.3
egale a 0.5.
4 1 0.1 0.4
5 2 0.2 0.6 La mediane correspond a la frequence cumulee
6 1 0.1 0.7 croissante immediatement superieure a 0.5.
7 1 0.1 0.8
9 1 0.1 1
Somme 10 1
136 / 1
2.1.1.2. La mediane
Exemples (suite) :
Serie 3 : 2 3 3 4 5 6 6 7 8 9
xi ni fi Fi+
2 1 0.1 0.1
Il y a une frequence cumulee croissante egale
3 2 0.2 0.3
4 1 0.1 0.4 a 0.5, on a un intervalle median.
5 1 0.1 0.5 Par convention, la mediane est egale au centre
6 2 0.2 0.7 de lintervalle median.
7 1 0.1 0.8
9 1 0.1 1
Somme 10 1
137 / 1
2.1.1.2. La mediane

I A partir du tableau statistique :
Si aucune frequence cumulee croissante nest egale a 0.5, alors la mediane

est la modalite dont la frequence cumulee croissante est immediatement
superieure a 0.5.
Sil y a une frequence cumulee croissante egale a 0.5, alors on a un in-
tervalle median dont les bornes sont les modalites correspondant aux
frequences cumulees croissantes respectivement egale et immediatement
superieure a 0.5. Dans ce cas, la valeur mediane est le centre de linter-
valle median.
138 / 1
2.1.1.2. La mediane
I A partir de la courbe cumulative ascendante :
Aucune frequence cumulee croissante nest egale a 0.5 :
Me = 2 enfants
La moitie des familles

ont moins de 2 enfants
et lautre moitie en ont
plus de 2.
139 / 1
2.1.1.2. La mediane
Il y a une frequence cumulee croissante egale a 0.5 :
Me [2; 3]
2+3
Me = = 2.5
2
3 enfants
La moitie des familles

ont moins de 3 enfants
et la moitie ont en plus
de 3.
140 / 1
2.1.1.2. La mediane
La mediane est labscisse du point associe a la frequence cumulee croissante
0.5.
141 / 1
2.1.1.2. La mediane
I A partir des courbes cumulatives ascendante et descendante :
La mediane est labscisse du point dintersection des courbes cumulatives
ascendante et descendante, ce point correspond a des frequences cumulees
(croissante et decroissante) egales a 0.5.
142 / 1
2.1.1.2. La mediane
I A partir du tableau statistique :
Sil y a une frequence cumulee croissante egale a 0.5, alors la mediane

est egale a la borne superieure de la classe correspondant a la frequence
cumulee croissante egale a 0.5.
Si aucune frequence cumulee croissante nest egale a 0.5, alors la classe
mediane [xi1 ; xi [ est la classe dont la frequence cumulee croissante est
immediatement superieure a 0.5. Dans ce cas, la valeur mediane Me est
calculee par interpolation lineaire comme suit :
+
0.5 Fi1
Me = xi1 + (xi xi1 )
Fi+ Fi1
+
143 / 1
2.1.1.2. La mediane
I Demonstration : Coefficient directeur dune droite
yB yA
a=
xB xA
144 / 1
2.1.1.2. La mediane
I Demonstration (suite) :
+
yB yA 0.5 Fi1
a= =
xB xA Me xi1
yC yA
+
F + Fi1
a= = i
xC xA xi xi1
+
0.5 Fi1 +
F + Fi1
= i
Me xi1 xi xi1
+
0.5 Fi1
Me xi1 = (xi xi1 )
Fi+ Fi1
+
+
0.5Fi1
Fi+ Fi1
+
La mediane Me est egale a la borne inferieure de la classe mediane [xi1 ; xi [

+
0.5Fi1
plus une fraction de lamplitude xi xi1 de la classe mediane.
Fi+ Fi1
+
145 / 1
2.1.1.2. La mediane
I Pratique : Etape 1
Identifier la classe mediane [xi1 ; xi [ et

situer la valeur mediane Me a linte-
rieur de cette classe.
146 / 1
2.1.1.2. La mediane
Associer la frequence cumulee crois-

sante 0.5 a la valeur mediane Me .
147 / 1
2.1.1.2. La mediane
Trouver dans la colonne des frequences

cumulees croissantes les valeurs qui en-
cadrent 0.5 et les associer aux bornes
de la classe mediane.
148 / 1
2.1.1.2. La mediane
+
Me xi1 0.5 Fi1
= + +
xi xi1 Fi Fi1
+
0.5 Fi1
Me xi1 = (xi xi1 )
Fi+ Fi1
+
+
0.5Fi1
Fi+ Fi1
+
149 / 1
2.1.1.2. La mediane
Exemple 1 :
Tailles dindividus
0.5 0.27
Me = 170 + 5
Tailles (cm) Fi+ 0.63 0.27
[160 ; 165 [ 0.09 = 173.19 cm
[165 ; 170 [ 0.27
La moitie des individus ont une taille
[170 ; 175 [ 0.63
inferieure a 173.19 cm et lautre moitie
[175 ; 180 [ 0.91 ont une taille superieure a cette taille
[180 ; 185] 1 mediane.
150 / 1
2.1.1.2. La mediane
Exemple 2 :
Tailles dindividus
0.5 0.27
Me = 170 + 5
Tailles (cm) Fi+ 0.5 0.27
[160 ; 165 [ 0.09 = 175 cm
[165 ; 170 [ 0.27
La moitie des individus ont une taille
[170 ; 175 [ 0.5
inferieure a 175 cm et lautre moitie
[175 ; 180 [ 0.91 ont une taille superieure a cette taille
[180 ; 185] 1 mediane.
151 / 1
2.1.1.3 La moyenne arithmetique

Definition :
La moyenne arithmetique dune variable statistique, notee x , est la valeur -
nappartenant pas necessairement a la serie statistique - qui concentre toute
linformation contenue dans la distribution statistique, cest lequivalent dun
centre de gravite en geometrie. Elle est donnee par la formule suivante :
k k
1X X
x = ni xi = fi xi
n i=1 i=1
152 / 1
2.1.1.3. La moyenne arithmetique
153 / 1
Remarques :
Si n1 = n2 = = nk = 1, alors la moyenne arithmetique est dite

simple, sinon elle est dite ponderee ;
Si la variable statistique X est continue, la moyenne arithmetique

secrit :
k k
1X X
x = ni ci = fi ci
n i=1 i=1
ou ci designe le centre de la classe [xi1 ; xi [.
154 / 1
Exemple 1 :
4
xi ni ni xi 1X
x = ni xi
1 12 12 n i=1
2 40 80 252
=
3 32 96 100
4 16 64 = 2.52 3 enfants
100 252 Les familles concernees ont en
moyenne 3 enfants.
155 / 1
Exemple 2 :
Tailles dindividus
Tailles (cm) ci ni ni ci 5
1X
[160 ; 165[ 162.5 5 812.5 x = ni ci
n i=1
[165 ; 170[ 167.5 10 1675
9512.5
[170 ; 175[ 172.5 20 3450 =
55
[175 ; 180[ 177.5 15 2662.5 = 172.95 cm
[180 ; 185] 182.5 5 912.5
55 9512.5 Les individus concernes ont une taille
moyenne egale a 172.95 cm.
156 / 1
Proprietes :
Soit X et Y deux variables statistiques quantitatives prenant respectivement

les valeurs x1 , x2 , ,xn et y1 , y2 , ,yn avec n N et a et b deux constantes
reelles.
La moyenne arithmetique verifie les proprietes suivantes :
ax + by = ax + by
k
X
ni (xi x ) = 0
i=1
157 / 1
Demonstrations :
k
1X
ax + by = ni (axi + byi )
n i=1
k
1X
= (ani xi + bni yi )
n i=1
k k
1X 1X
= ani xi + bni yi
n i=1 n i=1
k
! k
!
1X 1X
=a ni xi + b ni yi
n i=1 n i=1
= ax + by
158 / 1
Exemples :
x +y =x +y
2x + y = 2x + y
3x y = 3x y
x 3y = x 3y
x + 2y = x + 2y
3x + 2 = 3x + 2
3 2y = 3 2y
159 / 1
k
X k
X
ni (xi x ) = (ni xi ni x )
i=1 i=1
k
X k
X
= ni xi ni x
i=1 i=1
k k
1X X
=n ni xi x ni
n i=1 i=1
= nx x n
=0
160 / 1
Remarque :
La moyenne arithmetique est sensible aux valeurs extremes contrairement a

la mediane qui nest pas influencee par de telles observations. La mediane
est, de ce fait, une mesure robuste du centre de la distribution statistique
notamment en presence dune forte asymetrie.
161 / 1
Exemple :
Notes sur 20 de deux groupes detudiants
Groupe A Groupe B
15 15 15 15 15 1 15 15 15 15
x = 15 x = 12.2
Me = 15 Me = 15
162 / 1
Sous section 2 : Mesures de position relative ou quantiles
2.1.1.1 Les quartiles
2.1.1.2 Les deciles
2.1.1.3 Les centiles
2.1.1.4 Generalisation
2.1.1.5 Mode de calcul
163 / 1
2.1.2. Mesures de position relative ou quantiles
Les quantiles ou les fractiles sont des valeurs qui partagent la serie statistique
ordonnee en un certain nombre de parties contenant chacune une meme pro-
portion dobservations. Ils constituent, de ce fait, une generalisation de la
notion de mediane qui partage la serie statistique en deux parties contenant
chacune la moitie des observations.
Les quantiles les plus connus sont les quartiles, les deciles et les centiles qui
divisent la serie statistique en respectivement 4, 10 et 100 parties de meme
effectif. Par consequent, les quantiles ne se trouvent pas necessairement au
centre de la distribution statistique mais dans des positions dites relatives.
164 / 1
2.1.2.1 Les quartiles
Definition :
Les quartiles sont des valeurs qui partagent la serie statistique ordonnee en
4 parties contenant chacune 25% des observations. Ils sont au nombre de 3
et ils sont notes Q1 , Q2 et Q3 .
165 / 1
2.1.2.1. Les quartiles
166 / 1
2.1.2.2 Les deciles
Definition :
Les deciles sont des valeurs qui partagent la serie statistique ordonnee en 10
parties contenant chacune 10% des observations. Ils sont au nombre de 9 et
ils sont notes D1 , D2 ... et D9 .
167 / 1
2.1.2.2. Les deciles
168 / 1
2.1.2.3 Les centiles
Definition :
Les centiles sont des valeurs qui partagent la serie statistique ordonnee en
100 parties contenant chacune 1% des observations. Ils sont au nombre de 99
et ils sont notes C1 , C2 ... et D99 .
169 / 1
2.1.2.3. Les centiles
170 / 1
2.1.2.4 Generalisation
Definition :
De facon generale, on definit les quantiles dordre , avec ]0; 1[, comme les
valeurs qui partagent la serie statistique ordonnee en 1/ parties contenant
chacune une proportion des observations et on les note q .
Ainsi, une proportion des observations est inferieure a q et une proportion
1 est superieure a cette valeur.
171 / 1
2.1.2.4. Generalisation
172 / 1
2.1.2.5 Mode de calcul
Cas des variables discretes :
I A partir de la colonne des frequences cumulees croissantes :
Sil y a une frequence cumulee croissante egale a alors on a un

intervalle quantile delimite par la modalite associee a la valeur
et par la modalite suivante.
Si aucune frequence cumulee croissante nest egale a alors le
quantile recherche est la modalite ayant une frequence cumulee
croissante immediatement superieure a .
173 / 1
2.1.2.5. Mode de calcul

xi Fi+ Mediane Quartiles Deciles Centiles

x1 0.12 D1 C1
x2 0.62 Me Q1 et Q2 D5 C55
x3 0.84 Q3
x4 1 D9 C99
174 / 1
Exemple :
xi Fi+ Mediane Quartiles Deciles Centiles

1 0.12 D1 C1
2 0.62 Me Q1 et Q2 D5 C55
3 0.84 Q3
4 1 D9 C99
175 / 1
Si la valeur est en face dun palier de la courbe cumulative ascen-

dante, alors on a un intervalle quantile delimite par les abscisses
des extremites du palier.
Si la valeur se situe entre deux paliers de la courbe cumulative
ascendante, alors le quantile recherche est labscisse commune aux
deux paliers.
176 / 1
177 / 1
Exemple :
178 / 1
Cas des variables continues :
Etape 1 : La classe [xi1 ; xi [ contenant le quantile dordre est dabord

identifiee, cest la classe ayant une frequence cumulee croissante imme-
diatement superieure ou egale a .
179 / 1
[xi1 ; xi [ Fi+ Mediane Quartiles Deciles Centiles

[x0 ; x1 [ 0.09 C1
[x1 ; x2 [ 0.27 Q1 D1
[x2 ; x3 [ 0.63 Me Q2 D5 C55
[x3 ; x4 [ 0.91 Q3 D9
[x4 ; x5 ] 1 C99
180 / 1
Etape 2 : Le quantile dordre est calcule par interpolation lineaire

selon la formule suivante :
+
Fi1
q = xi1 + (xi xi1 )
Fi+ Fi1
+
181 / 1

+
q xi1 Fi1
= + +
xi xi1 Fi Fi1
+
Fi1
q xi1 = (xi xi1 )
Fi+ Fi1
+
+
Fi1
q = xi1 + (xi xi1 )
Fi+ Fi1
+
182 / 1
Exemple :
Tailles dindividus
Taille (cm) Fi+ Mediane Quartiles Deciles Centiles

[160 ; 165 [ 0.09 C1
[165 ; 170 [ 0.27 Q1 D1
[170 ; 175 [ 0.63 Me Q2 D5 C55
[175 ; 180 [ 0.91 Q3 D9
[180 ; 185] 1 C99
183 / 1
Exemple (suite) :
Tailles dindividus
0.50 0.27 0.50 0.27

Me = 170 + 5 = 173.19 cm D5 = 170 + 5 = 173.19 cm
0.63 0.27 0.63 0.27
0.25 0.09 0.90 0.63
Q1 = 165 + 5 = 169.44 cm D9 = 175 + 5 = 179.82 cm
0.27 0.09 0.91 0.63
0.50 0.27 0.01 0
Q2 = 170 + 5 = 173.19 cm C1 = 160 + 5 = 160.56 cm
0.63 0.27 0.09 0
0.75 0.63 0.55 0.27
Q3 = 175 + 5 = 177.14 cm C55 = 170 + 5 = 173.19 cm
0.91 0.63 0.63 0.27
0.10 0.09 0.99 0.91
D1 = 165 + 5 = 165.28 cm C99 = 180 + 5 = 184.44 cm
0.27 0.09 1 0.91
184 / 1
Le quantile q est labscisse du point correspondant a la frequence cu-

mulee croissante .
185 / 1
Exemple :
Tailles dindividus
186 / 1
Section 2 : Mesures de dispersion
Sous section 1 : Distance entre deux valeurs particulieres
Sous section 2 : Distance par rapport a une valeur centrale
187 / 1
2.2. Mesures de dispersion
Problematique :
Notes sur 20 de deux groupes detudiants
Groupe A Groupe B
15 15 15 15 15 13 14 15 16 17
x = 15 x = 15
Me = 15 Me = 15
Les mesures de tendance centrale ne donnent aucune idee sur la variabilite

ou la dispersion des donnees !
188 / 1
Definition :
Une mesure de dispersion permet de decrire la variabilite des donnees dans

une serie statistique. Elle vient ainsi completer les mesures de position qui
passent sous silence cet aspect.
189 / 1
Sous section 1 : Distance entre deux valeurs particulieres
2.2.1.1 Intervalle de variation et etendue dune serie
2.2.1.2 Intervalle interquartile et ecart interquartile
2.2.1.3 Intervalle interdecile et ecarts interdecile
2.2.1.4 Intervalle intercentile et ecarts intercentile
190 / 1
2.2.1. Distance entre deux valeurs particulieres
2.2.1.1 Intervalle de variation et etendue dune serie
Definitions :
Lintervalle de variation dune serie statistique est lintervalle borne par la
valeur minimale xmin et la valeur maximale xmax de variable statistique X , il
est note IV = [xmin ; xmax ]. Cet intervalle contient la totalite des donnees.
Lamplitude de lintervalle de variation IV , notee E , est appelee etendue de
la serie. On a :
E = xmax xmin
191 / 1
2.2.1.1. Intervalle de variation et etendue dune serie
192 / 1
Exemple 1 :
1 2 3 4
IV = [xmin ; xmax ] = [1; 4]
E = 4 1 = 3 enfants
193 / 1
Exemple 2 :
Tailles dindividus
[160 ; 165[ [165 ; 170[ [170 ; 175[ [175 ; 180 [ [180 ; 185 ]
IV = [xmin ; xmax ] = [160; 185]
E = 185 160 = 25 cm
194 / 1
2.2.1.2 Intervalle interquartile et ecart interquartile
Definitions :
Lintervalle interquartile dune serie statistique est lintervalle borne par le
premier et le dernier quartiles de la variable X , il est note IQ = [Q1 ; Q3 ]. Cet
intervalle contient la moitie des donnees.
Lamplitude de lintervalle interquartile IQ, notee EIQ, est appelee ecart
interquartile ou etendue interquartile. On a :
EIQ = Q3 Q1
195 / 1
2.2.1.2. Intervalle interquartile et ecart interquartile
196 / 1
Exemple 1 :
1 2 3 4
IQ = [Q1 ; Q3 ] = [2; 3]
EIQ = 3 2 = 1 enfant
197 / 1
Exemple 2 :
Tailles dindividus
[160 ; 165[ [165 ; 170[ [170 ; 175[ [175 ; 180 [ [180 ; 185 ]
IQ = [Q1 ; Q3 ] = [169.44; 177.14]
EIQ = 177.14 169.44 = 7.70 cm
198 / 1
2.2.1.3 Intervalle interdecile et ecart interdecile
Definitions :
Lintervalle interdecile dune serie statistique est lintervalle borne par le
premier et le dernier deciles de la variable X , il est note ID = [D1 ; D9 ]. Cet
intervalle contient 80% des donnees.
Lamplitude de lintervalle interdecile ID, notee EID, est appelee ecart in-
terdecile ou etendue interdecile. On a :
EID = D9 D1
199 / 1
2.2.1.3. Intervalle interdecile et ecart interdecile
200 / 1
Exemple 1 :
1 2 3 4
ID = [D1 ; D9 ] = [1; 4]
EID = 4 1 = 3 enfants
201 / 1
Exemple 2 :
Tailles dindividus
[160 ; 165[ [165 ; 170[ [170 ; 175[ [175 ; 180 [ [180 ; 185 ]
ID = [D1 ; D9 ] = [165.28; 179.82]
EID = 179.82 165.28 = 14.54 cm
202 / 1
2.2.1.4 Intervalle intercentile et ecart intercentile
Definitions :
Lintervalle intercentile dune serie statistique est lintervalle borne par le
premier et le dernier centiles de la variable X , il est note IC = [C1 ; C99 ]. Cet
intervalle contient 98% des donnees.
Lamplitude de lintervalle intercentile IC , notee EIC , est appelee ecart in-
tercentile ou etendue intercentile. On a :
EIC = C99 C1
203 / 1
2.2.1.4. Intervalle intercentile et ecart intercentile
204 / 1
Exemple 1 :
1 2 3 4
IC = [C1 ; C99 ] = [1; 4]
EIC = 4 1 = 3 enfants
205 / 1
Exemple 2 :
Tailles dindividus
[160 ; 165[ [165 ; 170[ [170 ; 175[ [175 ; 180 [ [180 ; 185 ]
IC = [C1 ; C99 ] = [160.56; 184.44]
EIC = 184.44 160.56 = 23.88 cm
206 / 1
Remarque :
La dispersion dune distribution statistique peut etre resumee a laide dune
bote a moustaches. Il sagit dun diagramme representant simultanement
lintervalle de variation, lintervalle interquartile, la moyenne et la mediane
de la serie statistique.
207 / 1
Sous section 2 : Distance par rapport a une valeur centrale
2.2.2.1 Ecart absolu moyen
2.2.2.2 Variance et ecart-type
2.2.2.3 Coefficient de variation
208 / 1
2.2.2. Distance par rapport a une valeur centrale
Distance par rapport a la moyenne arithmetique
209 / 1
Distance par rapport a la mediane
210 / 1
2.2.2.1 Ecart absolu moyen
Definition :
Lecart absolu moyen dune variable statistique, notee EAM , est la moyenne
arithmetique des valeurs absolues des ecarts des observations de la variable
par rapport a une mesure de centre qui est generalement la moyenne arith-
metique x :
k
1X
EAM = ni |xi x |
n i=1
Dans le cas dune variable continue, les modalites xi sont remplacees par les
centres des classes ci :
k
1X
EAM = ni |ci x |
n i=1
211 / 1
2.2.2.1. Ecart absolu moyen
Exemple 1 :
xi ni ni xi |xi x | ni |xi x |
1 12 12 1.52 18.24
2 40 80 0.52 20.80
3 32 96 0.48 15.36
4 16 64 1.48 23.68
100 252 78.08
252
x = = 2.52 3 enfants
100
4
1X 78.08
EAM = ni |xi x | = = 0.7808 1 enfant
n i=1 100
212 / 1
2.2.2.1. Ecart absolu moyen
Exemple 2 :
Tailles dindividus
Tailles (cm) ci ni ni ci |ci x | ni |ci x |

[160; 165[ 162.5 5 812.5 10.45 52.25
[165; 170[ 167.5 10 1675 5.45 54.5
[170; 175[ 172.5 20 3450 0.45 9
[175; 180[ 177.5 15 2662.5 4.55 68.25
[180; 185] 182.5 5 912.5 9.55 47.75
55 9512.5 231.75
9512.5
x = = 172.95 cm
55
5
1X 231.75
EAM = ni |ci x | = = 4.21 cm
n i=1 55
213 / 1
2.2.2.2 Variance et ecart-type
Definitions :
La variance dune variable statistique X , notee x2 ou V (X ), est la moyenne
des carres des ecarts des observations de la variable par rapport a sa moyenne
arithmetique x :
k
1X
x2 = ni (xi x )2
n i=1
Dans le cas dune variable continue, les modalites xi sont remplacees par les
centres des classes ci :
k
1X
x2 = ni (ci x )2
n i=1
Lecart-type dune variable statistique X , note x , est la racine carree de la

variance :
p
x = x2
214 / 1
2.2.2.2. Variance et ecart-type
Remarque :
Il existe un ecriture alternative de la variance tres utilisee dans la pratique :
x2 = x 2 x 2
ou
k
1X
x2 = ni xi2
n i=1
et dans le cas dune variable continue :
k
1X
x2 = ni ci2
n i=1
215 / 1
Exemple 1 :
xi ni ni xi xi2 ni xi2 (xi x )2 ni (xi x )2

1 12 12 1 12 2.31 27.72
2 40 80 4 160 0.27 10.82
3 32 96 9 288 0.23 7.37
4 16 64 16 256 2.19 35.05
100 252 716 80.96
4
1X 80.96 p
x2 = ni (xi x )2 = = 0.81 = x2 = 0.9 1 enfant
n i=1 100
716 p
x2 = x 2 x 2 = (2.52)2 = 0.81 = x2 = 0.9 1 enfant
100
216 / 1
Exemple 2 :
Tailles dindividus
Tailles (cm) ci ni ni ci ci2 ni ci2 (ci x )2 ni (ci x )2

[160; 165[ 162.5 5 812.5 26406.25 132031.25 109.3 546.49
[165; 170[ 167.5 10 1675 28056.25 280562.5 29.75 297.52
[170; 175[ 172.5 20 3450 29756.25 595125 0.21 4.13
[175; 180[ 177.5 15 2662.5 31506.25 472593.75 20.66 309.92
[180; 185] 182.5 5 912.5 33306.25 166531.25 91.12 455.58
55 9512.5 1646843.75 1613.64
5
1 X 1613.64 q
x2 = ni (ci x )2 = = 29.34 = x2 = 5.42 cm
n i =1
55
1646843.75 q
x2 = c 2 x 2 = (172.95)2 = 30.91 = x2 = 5.56 cm
55
217 / 1
Remarque :
La variance na pas de signification concrete, il sagit simplement dune etape

intermediaire dans le calcul de lecart-type. Neanmoins, elle peut etre utilisee
comme mesure de dispersion tout en prenant garde a bien interpreter lunite
de mesure transformee a la puissance 2 car ceci peut induire en erreur (par
exemple, le metre qui est une unite de mesure des longueurs se transforme en
metre carre qui est une unite de mesure des surfaces !) ou fournir une unite
de mesure nayant aucune signification (le litre au carre, par exemple, na pas
de sens).
218 / 1
Proprietes :
Soit X une variable statistique quantitative et a et b deux constantes
reelles. La variance verifie les proprietes suivantes :
V (aX ) = a 2 V (X )
V (X + b) = V (X )
V (aX + b) = a 2 V (X )
219 / 1
Demonstrations :
k
1X
V (aX ) = ni (axi ax )2
n i=1
k
1X X x1 x2 xk
= ni (axi ax )2 ni n1 n2 nk
n i=1
k
1X
= ni [a(xi x )]2
n i=1
k
1X
= ni a 2 (xi x )2 aX ax1 ax2 axk
n i=1
ni n1 n2 nk
k
1X
= a2 ni (xi x )2
n i=1
= a 2 V (X )
220 / 1
k
1X 2
V (X + b) = ni xi + b x + b
n i=1 X x1 x2 xk
k ni n1 n2 nk
1 X
= ni [xi + b (x + b)]2
n i=1
k
1X
= ni (xi + b x b)2
n i=1
k X +b x1 + b x2 + b xk + b
1X
= ni (xi x )2 ni n1 n2 nk
n i=1
= V (X )
221 / 1
X x1 x2 xk
ni n1 n2 nk
V (aX + b) = V (aX )
2
= a V (X )
aX + b ax1 + b ax2 + b axk + b

ni n1 n2 nk
222 / 1
Exemples :
V (2X ) = 4V (X )
V (X + 3) = V (X )
V (2X + 3) = 4V (X )
223 / 1
2.2.2.3 Coefficient de variation
Le coefficient de variation, note CV , est une mesure de dispersion relative,

il est egal au rapport entre lecart-type et la moyenne arithmetique, cest un
nombre sans dimension :

CV =
x
Le coefficient de variation permet de comparer les dispersions de variables
quantitatives nayant pas la meme unite de mesure ou qui ont la meme unite
de mesure mais des moyennes differentes.
224 / 1
2.2.2.3. Coefficient de variation
Exemples :
Nombre denfants par famille Tailles dindividus en centimetres
x = 2.52 enfants x = 172.95 cm

x = 0.9 enfants x = 5.42 cm
0.9
enfants
5.42
cm

CV = = = 0.36 CV = = = 0.03
x 2.52 enfants
x 172.95
cm

La serie statistique des nombres denfants par famille est plus dispersee que
la serie des tailles dindividus.
225 / 1
Section 3 : Mesures de forme
Sous section 1 : Mesures dasymetrie
Sous section 2 : Mesures daplatissement
226 / 1
2.3. Mesures de forme
Definition :
Une mesure de forme indique le niveau de devia-
tion dune distribution statistique par rapport a
une situation de reference - dite normale - re-
presentee par une courbe en cloche symetrique,
ni pointue ni aplatie. Le degre de deviation est
donne par une mesure dasymetrie et par une me-
sure daplatissement.
227 / 1
Sous section 1 : Mesures dasymetrie
2.3.1.1 Coefficient de Fisher
2.3.1.2 Coefficient de Pearson
228 / 1
2.3.1.Mesures dasymetrie
Distribution symetrique :
Les modalites inferieures au mode

de la distribution statistique ont les
memes effectifs et les memes fre-
quences que celles qui sont superieures
au mode.
229 / 1
Distribution symetrique :
Les modalites inferieures au mode

de la distribution statistique ont les
memes effectifs et les memes fre-
quences que celles qui sont superieures
au mode.
230 / 1
Distribution asymetrique a droite :
Les modalites superieures au

mode de la distribution sta-
tistique ont des effectifs et
des frequences plus eleves que
celles qui sont inferieures au
mode.
231 / 1
Distribution asymetrique a droite :
Les modalites superieures au

celles qui sont inferieures au
mode.
232 / 1
Distribution asymetrique a gauche :
Les modalites inferieures au

celles qui sont superieures au
mode.
233 / 1
Distribution asymetrique a gauche :
Les modalites inferieures au

celles qui sont superieures au
mode.
234 / 1
2.3.1. Mesures dasymetrie
2.3.1.1 Coefficient de Fisher (Sir Ronald)
Coefficient de skewness :
k 3
1X xi x
1 = ni
n i=1
Interpretation :
I 1 = 0 : la distribution est symetrique ;
I 1 > 0 : la distribution est asymetrique a droite ;
I 1 < 0 : la distribution est asymetrique a gauche.
235 / 1
2.3.1.2 Coefficient de Pearson (Karl)
Coefficient de skewness normalise :

" k 3 #2
2 1X xi x
1 = 1 = ni
n i=1
Interpretation :
I 1 = 0 : la distribution est symetrique ;
I 1 > 0 : la distribution est asymetrique a droite ou a gauche :
I 3 > 0 : la distribution est asymetrique a droite ;
I 3 < 0 : la distribution est asymetrique a gauche.
avec
k
1X
3 = ni (xi x )3
n i=1
236 / 1
Remarques :
Il existe un lien entre la symetrie dune distribution statistique et lordre de

ses mesures de tendance centrale, celles-ci sont egales entre elles dans le cas
dune distribution symetrique et differentes dans le cas dune distribution
asymetrique et respectent un ordre precis suivant la nature de lasymetrie
comme indique sur les figures ci-dessus.
237 / 1
Sous section 2 : Mesures daplatissement
2.3.2.1 Coefficient de Pearson
2.3.2.2 Coefficient de Fisher
238 / 1
2.3.2. Mesures daplatissement
Distribution mesokurtique :
Les modalites voisines du

mode de la distribution statis-
tique ont des effectifs et des
frequences raisonnables.
239 / 1
Distribution mesokurtique :

mode de la distribution statis-
tique ont des effectifs et des
frequences raisonnables.
240 / 1
Distribution leptokurtique :

des frequences plus eleves
que celles dune distribution
normale.
241 / 1
Distribution leptokurtique :

des frequences plus eleves
normale.
242 / 1
Distribution platykurtique :

des frequences plus faibles
normale.
243 / 1
Distribution platykurtique :

des frequences plus faibles
normale.
244 / 1
2.3.2.1 Coefficient de Pearson (Karl)
Coefficient de kurtosis :
k 4
1X xi x
2 = ni
n i=1
Interpretation :
I 2 = 3 : distribution mesokurtique (courbe normale) ;
I 2 > 3 : distribution leptokurtique (moins aplatie que la normale) ;
I 2 < 3 : distribution platykurtique (plus aplatie que la normale).
245 / 1
2.3.2.2 Coefficient de Fisher (Sir Ronald)
Coefficient dexces de kurtosis :

k 4
1X xi x
2 = 2 3 = ni 3
n i=1
Interpretation :
I 2 = 0 : distribution mesokurtique (aplatissement normal) ;
I 2 > 0 : distribution leptokurtique (moins aplatie que la normale) ;
I 2 < 0 : distribution platykurtique (plus aplatie que la normale).
246 / 1
Chapitre 3 : Series statistiques a deux dimensions
Section 1 : Presentation des donnees
Section 2 : Distributions marginales, conditionnelles et

jointe
Section 3 : Ajustement lineaire dun nuage de points
247 / 1
3. Series statistiques a deux dimensions
Letude des series statistiques a une dimension nest generalement quune

etape preliminaire avant dentamer une analyse plus approfondie des
possibles relations qui peuvent exister entre deux ou plusieurs variables
statistiques. Le modele devaluation des actif financiers, qui fera lobjet
dune application des outils developpes dans ce chapitre, est une for-
mulation lineaire de la relation qui peut exister entre la prime de risque
associee a un actif risque et la prime de risque associee a un portefeuille
de marche. Les parametres de cette relation jouent un role primordial
dans la prise de decision quant au type dactif a choisir, ils seront esti-
mes par la methode des moindres carres ordinaires qui sera egalement
presentee dans ce chapitre.
248 / 1
Section 1 : Presentation des donnees
Sous section 1 : Tableau de contingence ou a double entree
Sous section 2 : Nuage de points
249 / 1
3.1. Presentation des donnees
3.1.1. Tableau de contingence ou a double entree
3.1.1. Tableau de contingence ou a double entree
HH Y
H
y y2 yj yl Total
X HH 1
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 nij nil ni
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk 1 nk 2 nkj nkl nk
Total n1 n2 nj nl n
250 / 1
3.1.2. Nuage de points
3.1.2. Nuage de points : aucune correlation lineaire
251 / 1
3.1.2. Nuage de points : une correlation quadratique
252 / 1
3.1.2. Nuage de points : une correlation lineaire
253 / 1
Section 2 : Distributions marginales, conditionnelles et

jointe
Sous section 1 : Distributions marginales
Sous section 2 : Distributions conditionnelles
Sous section 3 : Distribution jointe
Sous section 4 : Exemple
254 / 1
3.2. Distributions marginales, conditionnelles et jointe
Sous section 1 : Distributions marginales
3.2.1.1. Distribution marginale de X
3.2.1.1. Distribution marginale de Y
255 / 1
3.2.1. Distributions marginales
HH Y
H
y y2 yj yl Total
X HH 1
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
.. .. .. .. .. .. .. ..
. . . . . . . .
Total n1 n2 nj nl n
256 / 1
Effectifs marginaux ni , (i = 1,2, ,k )
Pk
Effectif total n = i=1 ni
ni
Frequences marginales fi = n
1
Pk
Moyenne marginale x= n i=1 ni xi
1
Pk 2
Variance marginale V(X ) = n i=1 ni xi x
257 / 1
HH Y
H
y y2 yj yl Total
X HH 1
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
.. .. .. .. .. .. .. ..
. . . . . . . .
Total n1 n2 nj nl n
258 / 1
Effectifs marginaux nj , (j = 1,2, ,l )
Pl
Effectif total n = j =1 nj
nj
Frequences marginales fj = n
1
Pl
Moyenne marginale y= n j =1 nj yj
1
Pl 2
Variance marginale V(Y ) = n j =1 nj yj y
259 / 1
Sous section 2 : Distributions conditionnelles
3.2.2.1. Distribution de X conditionnellement a yj
3.2.2.1. Distribution de Y conditionnellement a xi
260 / 1
3.2.2. Distributions conditionnelles
HH Y
HH y1 y2 yj yl Total
X H
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
.. .. .. .. .. .. .. ..
. . . . . . . .
Total n1 n2 nj nl n
261 / 1
Effectifs conditionnels nij , (i = 1,2, ,k )
Pk
Effectif conditionnel total nj = i=1 nij
nij
Frequences conditionnelles fi|j = nj
1
Pk
Moyenne conditionnelle xj = nj i=1 nij xi
1
Pk 2
Variance conditionnelle Vj (X ) = nj i=1 nij (xi x j )
262 / 1
HH Y
H
y y2 yj yl Total
X HH 1
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
.. .. .. .. .. .. .. ..
. . . . . . . .
Total n1 n2 nj nl n
263 / 1
Effectifs conditionnels nij , (j = 1,2, ,l )
Pl
Effectif conditionnel total ni = j =1 nij
nij
Frequences conditionnelles fj |i = ni
1
Pl
Moyenne conditionnelle yi = ni j =1 nij yj
1
Pl 2
Variance conditionnelle Vi (Y ) = ni j =1 nij (yj y i )
264 / 1
Sous section 3 : Distribution jointe du couple (X ; Y )
265 / 1
3.2.3. Distribution jointe du couple (X ; Y )
HH Y
HH y1 y2 yj yl Total
X H
x1 n11 n12 n1j n1l n1
x2 n21 n22 n2j n2l n2
.. .. .. .. .. .. .. ..
. . . . . . . .
.. .. .. .. .. .. .. ..
. . . . . . . .
Total n1 n2 nj nl n
266 / 1
Effectifs joints nij , (i = 1,2, ,k et j = 1,2, ,l )
Pk Pl
Effectif total n = i=1 j =1 nij
nij
Frequences jointes fij = n
1
Pk Pl
Moyenne jointe xy = n i=1 j =1 nij xi yj
1
Pk Pl
cov(X ; Y ) = n i=1 j =1 nij xi x yj y
Covariance
=xy x y
267 / 1
Sous section 4 : Exemple
268 / 1
3.2.4. Exemple
3.2.4. Exemple
Table: Notes obtenues en mathematiques (X ) et en statistique (Y )

HH Y
HH 7 15 18
X H
8 12 10 2
11 6 4 5
14 2 6 3
1. Completer le tableau de contingence ;

2. Caracteriser les distributions marginales de X et de Y ;
3. Caracteriser les distributions conditionnelles de X |Y et de Y |X ;
4. Caracteriser la distribution jointe du couple (X ; Y ).
269 / 1
3.2.4. Exemple
1. Tableau de contingence :

HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50
270 / 1
3.2.4. Exemple
2. Distribution marginale des notes obtenues en mathematiques (X ) :

HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50
271 / 1
3.2.4. Exemple
2. Distribution marginale des notes obtenues en mathematiques (X ) :
2
xi ni fi ni xi ni xi x
8 24 0.48 192 118.28
11 15 0.30 165 9.13
14 11 0.22 154 157.17
50 1 511 284.58
3
1 X 511
x= ni xi = = 10.22
n i=1 50
3
1 X 2 284.58
V (X ) = ni xi x = = 5.69
n i=1 50
272 / 1
3.2.4. Exemple
2. Distribution marginale des notes obtenues en statistique (Y ) :

HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50
273 / 1
3.2.4. Exemple
2. Distribution marginale des notes obtenues en statistique (Y ) :
2
yj nj fj nj yj nj yj y
7 20 0.40 140 583.2
15 20 0.40 300 135.2
18 10 0.20 180 313.6
50 1 620 1032
3
1 X 620
y= nj yj = = 12.4
n j =1 50
3
1 X 2 1032
V (Y ) = nj yj y = = 20.64
n j =1 50
274 / 1
3.2.4. Exemple
3. Distribution de X conditionnellement a Y = 7 :

HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50
275 / 1
3.2.4. Exemple
2
xi ni1 fi1 ni xi ni1 (xi x 1 )
8 12 0.6 96 27
11 6 0.3 66 13.5
14 2 0.1 28 40.5
20 1 190 81
3
1 X 190
x1 = ni1 xi = = 9.5
n1 i=1 20
3
1 X 2 81
V1 (X ) = ni1 (xi x 1 ) = = 4.05
n1 i=1 20
276 / 1
3.2.4. Exemple

HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50
277 / 1
3.2.4. Exemple
2
xi ni2 fi2 ni2 xi ni2 (xi x 2 )
8 10 0.5 80 57.6
11 4 0.2 44 1.44
14 6 0.3 84 77.76
20 1 208 136.8
3
1 X 208
x2 = ni2 xi = = 10.4
n2 i=1 20
3
1 X 2 136.8
V2 (X ) = ni2 (xi x 2 ) = = 6.84
n2 i=1 20
278 / 1
3.2.4. Exemple

HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50
279 / 1
3.2.4. Exemple
2
xi ni3 fi3 ni3 xi ni3 (xi x 3 )
8 2 0.2 16 21.78
11 5 0.5 55 0.45
14 3 0.3 42 21.87
10 1 113 44.1
3
1 X 113
x3 = ni3 xi = = 11.3
n3 i=1 10
3
1 X 2 44.1
V3 (X ) = ni3 (xi x 3 ) = = 4.41
n3 i=1 10
280 / 1
3.2.4. Exemple
3. Distribution de Y conditionnellement a X = 8 :

HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50
281 / 1
3.2.4. Exemple
2
yj n1j f1j n1j yj n1j (yj y 1 )
7 12 0.5 84 216.75
15 10 0.42 150 140.625
18 2 0.08 36 91.125
24 1 270 448.5
3
1 X 270
y1 = n1j yj = = 11.25
n1 j =1 24
3
1 X 2 448.5
V1 (Y ) = n1j (yj y 1 ) = = 18.69
n1 j =1 24
282 / 1
3.2.4. Exemple

HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50
283 / 1
3.2.4. Exemple
2
7 6 0.40 42 201.84
15 4 0.27 60 19.36
18 5 0.33 90 135.2
15 1 192 356.4
3
1 X 192
y2 = n2j yj = = 12.8
n2 j =1 15
3
1 X 2 356.4
V2 (Y ) = n2j (yj y 2 ) = = 23.76
n2 j =1 15
284 / 1
3.2.4. Exemple

HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50
285 / 1
3.2.4. Exemple
2
7 2 0.18 14 108.34
15 6 0.55 90 2.46
18 3 0.27 54 39.75
11 1 158 150.55
3
1 X 158
y3 = n3j yj = = 14.36
n3 j =1 11
3
1 X 2 150.55
V3 (Y ) = n3j (yj y 3 ) = = 13.69
n3 j =1 11
286 / 1
3.2.4. Exemple
4. Distribution jointe du couple (X ; Y ) :

HH Y
H 7 15 18
X HH
8 12 10 2 24
11 6 4 5 15
14 2 6 3 11
20 20 10 50
287 / 1
3.2.4. Exemple
Table: Frequences jointes du couple (X ; Y )

HH Y
H 7 15 18
X HH
8 0.24 0.20 0.04
11 0.12 0.08 0.10
14 0.04 0.12 0.06
1
288 / 1
3.2.4. Exemple
Table: Produits nij xi yj
HH Y
H
7 15 18
X HH
8 672 1200 288
11 462 660 990
14 196 1260 756
6484
3 3
1 XX 6484
xy = nij xi yj = = 129.68
n i=1 j =1 50
cov (X ; Y ) = xy x y = 129.68 10.22 12.4 = 2.952
289 / 1
Section 3 : Ajustement lineaire dun nuage de points
Sous-section 1 : Methode des moindres carres ordinaires
Sous-section 2 : Modele devaluation des actifs financiers
Sous-section 3 : Mise en uvre sous EViews
290 / 1
3.3. Ajustement lineaire dun nuage de points
Sous-section 1 : Methode des moindres carres ordinaires
291 / 1
3.3.1 Methode des moindres carres ordinaires

Lorsquune correlation lineaire est mise en evidence entre les deux va-
riables statistiques, il faut lui donner une expression analytique de type
Y = a + bX en estimant les parametres a et b de cette equation.
Il existe de nombreuses methodes permettant destimer ces parametres,
la plus repandue est la methode des moindres carres ordinaires (mco).
Cette methode, comme son nom laisse entendre, consiste a trouver la
droite qui passe le plus pres de lensemble des points du nuage en mi-
nimisant la somme des carres des distances entre chaque point (xi ; yj )
du nuage et la droite Y = a + bX . Cette operation est connue sous
lappellation ajustement lineaire dun nuage de points .
292 / 1
293 / 1

Principe :
k
X 2
b = arg min ni (yi a bxi )
b
i=1
k
X 2
a = arg min ni yi a bxi
a
i=1
Resultat :
cov (X ; Y )
b =
V (X )
a = y bx
294 / 1
Sous-section 2 : Modele devaluation des actifs financiers
295 / 1
3.3.2. Modele devaluation des actifs financiers

Lune des applications de la methode des moindres carres ordinaires en
finance est le modele devaluation des actifs financiers qui relie de facon
a
lineaire la prime de risque anticipee A associee a un actif risque A a
a
la prime de risque anticipee M associee a un portefeuille de marche M
comme suit :
a a
A = + M
ou le de Jensen est une sorte de prime gratuite et le est une mesure
du risque systemique du marche. Sous lhypothese defficience des mar-
ches financiers, il ne doit pas y avoir dopportunite darbitrage entre
les actifs et le parametre doit etre statistiquement nul. Quant au
parametre , il peut etre statistiquement inferieur, superieur ou egal
a lunite, lactif risque A est alors respectivement defensif, offensif ou
insensible au portefeuille de marche M .
296 / 1
3.3.2. Modele devaluation des actifs financiers (suite)

Ce sont les estimations des parametres et du modele devaluation
des actifs financiers qui nous guident dans le choix entre lactif A et
le portefeuille de marche M . Le parametre doit etre statistiquement
nul pour sassurer que les prix des actifs integrent toute linformation
disponible au moment de la prise de decision. Le choix entre lactif A et
le portefeuille de marche M depend principalement de lestimation du
parametre , si celle-ci est statistiquement egale a lunite alors lactif A
et le portefeuille de marche offrent les memes opportunites et on sera
indifferent entre les deux. En revanche, si ce parametre est statistique-
ment different de lunite, alors il faut opter pour lactif A si > 1 et
pour le portefeuille de marche M dans le cas contraire. Comme les deux
primes sont lineairement correlees, on peut les estimer par la methode
des moindres carres ordinaires comme suit :
cov (A ;M )
= V(M ) = A bM
297 / 1

Exemple :
On considere les donnees journalieres sur les rentabilites de laction de Maroc
Telecom et celles du MASI entre le 6 janvier 2012 et le 31 decembre 2013. Le
tableau de contingence suivant represente la distribution jointe des primes de
risque associees a ces deux actifs calculees par rapport a un taux sans risque
annuel de 3% (le taux journalier equivalent est de 0.0081%) :
PP iam
PP
masi PP [-0.1 ;-0.05[ [-0.05 ;0[ [0 ;0.05[ [0.05 ;0.1[ Total
P
[0.02; 0.01[ 2 19 1 0 22
[0.01; 0[ 2 187 58 0 247
[0; 0.01[ 0 65 138 1 204
[0.01; 0.02[ 0 1 14 1 16
[0.02; 0.03[ 0 0 2 1 3
Total 4 272 213 3 492
298 / 1

Exemple (suite) :
On souhaite estimer les parametres du modele devaluation des actifs
financiers suivant avec la methode des moindres carres ordinaires :
a a
iam = + masi
Selon les resultats precedents, on a :
cov (iam ; masi )

=
V (masi )
= iam bmasi
Il faut donc calculer les moyennes iam , masi , la variance V (masi ) et

la covariance cov (iam ; masi ).
299 / 1

Exemple (suite) : Moyenne et variance de masi
masi ci ni ni ci ci2 ni ci2

[0.02; 0.01[ -0.015 22 -0.33 0.000225 0.0050
[0.01; 0[ -0.005 247 -1.235 0.000025 0.0062
[0; 0.01[ 0.005 204 1.02 0.000025 0.0051
[0.01; 0.02[ 0.015 16 0.24 0.000225 0.0036
[0.02; 0.03[ 0.025 3 0.075 0.000625 0.0019
Total 492 -0.23 0.0218
P5
ni ci 2
masi = i=1 V (masi ) = c 2 masi
n
0.23 0.0218 2
= = (0.0005)
492 492
= 0.0005 = 0.000044
300 / 1

Exemple (suite) : Moyenne de iam
iam ci ni ni ci
[0.1; 0.05[ -0.075 4 -0.3
[0.05; 0[ -0.025 272 -6.8
[0; 0.05[ 0.025 213 5.325
[0.05; 0.1[ 0.075 3 0.225
Total 492 -1.55
P4
i=1 ni ci
iam =
n
1.55
=
492
= 0.00315
301 / 1
Exemple (suite) : Covariance entre masi et iam
PP iam -0.075
PP
-0.025 0.025 0.075
masi PPP P
-0.015 2 19 1 0
-0.005 2 187 58 0
0.005 0 65 138 1
0.015 0 1 14 1
0.025 0 0 2 1
2 (0.015) (0.075) + + 1 0.025 0.075

masi iam =
492
= 0.00009
cov (iam ; masi ) = masi iam masi iam

= 0.00009
302 / 1

Exemple (suite) :
Le calcul des moyennes, de la variance et de la covariance donne :
iam = 0.00315
masi = 0.0005
V (masi ) = 0.000044
cov (iam ; masi ) = 0.00009
dou :
cov (iam ; masi ) 0.00009
= = = 2.045
V (masi ) 0.000044
= iam bmasi = 0.00315 2.045 (0.0005) = 0.0021
303 / 1
Exemple (suite) :
Finalement, le modele devaluation des actifs financiers estime secrit :
iam = 0.0021 + 2.045 masi

(0.7139) (0.0000)
Interpretation :
I Lestimation du coefficient de Jensen est egale a -0.0021, cette
valeur est statistiquement nulle avec une probabilite assez impor-
tante (0.7139>0.05). On conclut que lhypothese defficience des
marches est verifiee et subsequemment quil y absence dopportu-
nite darbitrage entre laction de Maroc Telecom et lindice MASI.
I Lestimation du coefficient est egale 2.045, la probabilite que
cette valeur soit egale a lunite est nulle. Par consequent, ce para-
metre est statistiquement superieur a 1 et lon conclut que laction
de Maroc Telecom est un actif offensif. Il faut donc orienter notre
choix dinvestissement vers ce dernier.
304 / 1
Sous-section 3 : Mise en uvre sous EViews
305 / 1
3.3.3. Mise en uvre sous EViews
306 / 1
307 / 1
308 / 1
309 / 1
310 / 1
311 / 1
312 / 1
313 / 1
314 / 1
315 / 1
316 / 1
317 / 1

Remarque :
La legere difference entre les resultats obtenus avec le logiciel EViews et

les resultats obtenus manuellement est due au fait que la distribution
des donnees au sein dune chaque classe soit remplacee par le centre
qui est une sorte de moyenne des valeurs comprises dans chacune des
classes. Ce remplacement fait lhypothese que les donnees soient uni-
formement reparties a linterieur des classes et ne tient pas compte des
eventuelles asymetries. Dans ce cas, il faut faire confiance au logiciel
qui traite les donnees comme si elles etaient des valeurs discretes et
attribue a chaque modalite son vrai poids dans la distribution.
318 / 1

Principal

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Principal

Transféré par

Droits d'auteur :

Formats disponibles

Statistique Appliquee a la finance

Master Finance, Banque et Marches

Faculte des sciences juridiques, economiques et sociales - Tanger

I Quest ce que LA statistique ?

I Objectif pedagogique du cours

I Quest ce que LA statistique ?

La statistique est une branche des mathematiques qui permet dextraire,

On distingue deux sortes de statistiques :

Chapitre 1 : Organisation des donnees

Chapitre 2 : Series statistiques a une dimension

Chapitre 3 : Series statistiques a deux dimensions

Section 1 : Vocabulaire et operateurs statistiques

Section 2 : Tableaux statistiques

Section 3 : Representations graphiques

Section 1 : Vocabulaire et operateurs statistiques

Sous section 1 : Vocabulaire statistique

Sous section 2 : Typologie des variables statistiques

Sous section 3 : Operateurs statistiques et

Sous section 1 : Vocabulaire statistique

1.1.1.1. Population, echantillon et unite statistique

1.1.1.2. Caractere et modalite

1.1.1.3. Effectifs et frequences

1.1.1.4. Serie et distribution statistiques

1.1.1.1. Population, echantillon et unite statistique

Population : un ensemble de personnes ou dobjets.

Echantillon : une partie de la population.

Unite statistique ou individu : un element de la population.

1.1.1.2. Caractere et modalite

Modalite : une valeur prise par le caractere etudie.

Une modalite est egalement appelee observation, elle est notee en

Un caractere X peut avoir plusieurs modalites x1 , x2 , ..., xk .

1.1.1.3. Effectifs et frequences

Effectif total n : nombre dindividus composant la population.

Frequence fi dune modalite xi : proportion dindividus ayant la

La somme des frequences fi est egale a 1 car :

Il peut arriver que la somme des fre-

Moyennes obtenues au baccalaureat

Moyennes obtenues au baccalaureat

Effectif cumule decroissant Ni dune modalite xi : nombre dindividus

Moyennes obtenues au baccalaureat

Frequence cumulee decroissante Fi dune modalite xi : proportion din-

Moyennes obtenues au baccalaureat

Suivant la tradition anglo-saxonne, les effectifs ni sont aussi appeles

Lexpression au plus est equivalente a inferieur ou egal et lex-

1.1.1.4. Serie et distribution statistiques

Distribution statistique des effectifs

Distribution statistique des frequences

Sous section 2 : Typologie des variables statistiques

1.1.2.1. Variable statistique quantitative

1.1.2.2. Variable statistique qualitative

1.1.2.1. Variable statistique quantitative

Une variable statistique quantitative est continue si elle peut prendre

Une variable statistique quantitative est discrete si elle ne peut prendre

Exemples de variable continue :

Poids en kilogrammes (20 kg, 22.5 kg...)

Taille en metres (1.70 m, 1.75 m...)

Age en annees (20 ans, 22.5 ans...)

Exemples de variable discrete :

Nombre denfants par famille (1, 2, 3...)

Nombre de vehicules par menage (0, 1, 2...)

Nombre dunites produites par une machine (100, 200, 300...)

Une classe [xi1 ; xi [ se caracterise par son amplitude ai = xi xi1 et par

On convient de donner a une classe le numero de sa borne superieure. Par

1.1.2.2. Variable statistique qualitative