Note de Statistiques

Louv9x
Les principes de la finance

Catherine D’Hondt - Isabelle Platten
Notes sur les statistiques
Objectif
Parmi la communauté des apprenants engagés dans ce MOOC, certains n’ont peut-être plus
que de vagues souvenirs des mathématiques du secondaire (ce que nous indiquons comme
prérequis de ce cours), mis à part l’arithmétique usuelle utilisée dans la vie
quotidienne. L’objet de cette note est de rappeler les éléments minimaux nécessaires à la
bonne compréhension du cours, pour les éléments de probabilité et statistique qui sont
évoqués dans le troisième bloc de Louv9x !
1. Probabilité
La probabilité d’un événement est un nombre réel, compris entre 0 et 1, qui quantifie le degré
de certitude que l’événement se réalise. Si A est l’événement et que P(A)=1, l’événement est
certain, il y a toutes les chances qu’il se réalise. Si P(A)=0, l’événement n’a aucune chance de
se réaliser.
Si une expérience a trois réalisations (états) possibles, la probabilité p de chaque réalisation
doit être comprise entre 0 et 1 ( 0≤p≤1), et la probabilité que l’état 1 ou 2 ou 3 se réalise doit
être égale à 1.
2. Statistiques descriptives ou statistiques inférentielles
On parle de statistiques descriptives quand on considère une petite population et qu’on se
sert de l’ensemble des données de cette population. Sur base de toutes les données, on
calcule des paramètres qui décrivent la population (à notre niveau, des paramètres de position
et de dispersion). Exemple : on veut décrire la taille des enfants d’une classe de primaire (taille
de la population N=19). On peut mesurer la taille de tous les enfants et calculer les paramètres
statistiques.
On parle de statistiques inférentielles quand on a une grande population, et qu’on estime les
paramètres qui décrivent la population à partir d’un échantillon (un sous-ensemble de la
1
population). On « estime », on « extrapole » la vraie valeur des paramètres à partir d’un
échantillon. Exemple : on veut décrire l’âge des belges (taille de la population N=11 millions).
On constitue un échantillon et on extrapole l’âge des belges à partir des données de
l’échantillon.
3. La Moyenne / l’Espérance
Dans le langage courant, la moyenne correspond à la notion de moyenne arithmétique ou
encore moyenne empirique ou observée. Si on dispose d’une série de N observations
x1, x2 , , xN , la moyenne est :
1
x  x1  x2   xN 
N
Quand on veut estimer la moyenne µ inconnue d’une variable X d’une population à partir d’un
échantillon de taille N et d’observations x1, x2 , , xN , on utilise la moyenne arithmétique.
En probabilité, si X est une variable aléatoire, qui peut prendre des valeurs x1, x2 , , xN avec
probabilité p1, p2 , , pN , l’espérance de la variable aléatoire est :
E ( X )  p1 x1  p2 x2   p N xN
La moyenne ou l’espérance est un des paramètres qui permet de caractériser une série ou
une variable aléatoire ; c’est un indicateur de position.
4. La Variance / l’Ecart-type
La variance est un indicateur de dispersion d’une variable aléatoire ou d’une série
d’observations autour de l’espérance ou de la moyenne. Une variance nulle indique que
toutes les valeurs sont identiques.
Pour calculer la variance d'une variable aléatoire ou d'une série statistique, on calcule les
écarts entre la variable ou la série, et son espérance ou sa moyenne, puis on prend l'espérance
ou la moyenne des carrés des écarts. La racine carrée de la variance correspond à l'écart type.
Ces deux paramètres permettent de caractériser une variable aléatoire ou une série.
La variance observée s 2 d’une série d’observations x1, x2 , , xN est donnée par :
s2 
1
N

 x1  x    x2  x  
2 2
  xN  x 
2

x12  x2 2   xN 2
  x2
N
En probabilité, si X est une variable aléatoire, qui peut prendre des valeurs x1, x2 , , xN avec
probabilité p1, p2 , , pN et d’espérance E(X), la variance est donnée par :
var ( X )  p1  x1  E ( X )   p2  x2  E ( X )    p N  xN  E ( X ) 
2 2 2
2
En statistique inférentielle, on estime la variance d'une population entière à partir de la
variance mesurée sur un échantillon de taille N. On corrige la variance mesurée sur
l’échantillon par un facteur N , afin d’obtenir la variance estimée (encore appelée
( N  1)
variance non biaisée).
5. La Covariance / La Corrélation
La covariance permet de mesurer les variations conjointes de deux variables aléatoires ou de

deux séries de données par rapport à leur moyenne respective.
Si deux variables sont indépendantes, leur covariance est nulle. La réciproque n’est pas vraie.
La corrélation est une forme normalisée de la covariance ; par rapport à cette dernière, elle
est sans dimension et comprise entre -1 et 1.
Si on dispose de deux séries de données x1, x2 , , xN et y1, y2 , , yN ,de moyenne respective x

et y , la covariance est définie comme suit :
cov  X , Y  
1
N
 x1  x  y1  y    x2  x  y2  y     xN  x  yN  y  
En statistique inférentielle, on estime la covariance d'une population entière à partir de la

covariance mesurée sur un échantillon de taille N. On corrige la covariance mesurée sur
N
l’échantillon par un facteur ( N  1) , afin d’obtenir la covariance estimée (exactement
comme pour la variance ; d’ailleurs la covariance entre deux variables identiques correspond
à la variance).
En probabilité, si X et Y sont deux variables aléatoires, la covariance correspond à :

cov  X , Y   E  X  E  X   Y  E Y   
Ce qui équivaut à :
cov  X , Y   E  XY   E  X  E Y 
Dans le cas de variables aléatoires X et Y discrètes présentant des états x1, x2 , , xN et

y1, y2 , , yN , de moyenne x et y , avec pij  Prob  X  xi et Y  y j  représentant la
probabilité jointe, la covariance se calcule comme suit :
cov  X , Y    pij  xi  x   y j  y 
N N
i 1 j 1
3
Le coefficient de corrélation est égal à la covariance divisée par le produit non nul des écart-
types :
cov  X , Y 
 XY 
var  X  var Y 
L’estimateur du coefficient de corrélation est calculé à partir des estimateurs de la covariance

et des variances.

Note de Statistiques

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Note de Statistiques

Transféré par

Droits d'auteur :

Formats disponibles

Louv9x

Les principes de la finance

Notes sur les statistiques

La variance observée s 2 d’une série d’observations x1, x2 , , xN est donnée par :

La covariance permet de mesurer les variations conjointes de deux variables aléatoires ou de

Si on dispose de deux séries de données x1, x2 , , xN et y1, y2 , , yN ,de moyenne respective x

En statistique inférentielle, on estime la covariance d'une population entière à partir de la

En probabilité, si X et Y sont deux variables aléatoires, la covariance correspond à :

Dans le cas de variables aléatoires X et Y discrètes présentant des états x1, x2 , , xN et

L’estimateur du coefficient de corrélation est calculé à partir des estimateurs de la covariance

Vous aimerez peut-être aussi