Académique Documents
Professionnel Documents
Culture Documents
Objectif
Parmi la communauté des apprenants engagés dans ce MOOC, certains n’ont peut-être plus
que de vagues souvenirs des mathématiques du secondaire (ce que nous indiquons comme
prérequis de ce cours), mis à part l’arithmétique usuelle utilisée dans la vie
quotidienne. L’objet de cette note est de rappeler les éléments minimaux nécessaires à la
bonne compréhension du cours, pour les éléments de probabilité et statistique qui sont
évoqués dans le troisième bloc de Louv9x !
1. Probabilité
La probabilité d’un événement est un nombre réel, compris entre 0 et 1, qui quantifie le degré
de certitude que l’événement se réalise. Si A est l’événement et que P(A)=1, l’événement est
certain, il y a toutes les chances qu’il se réalise. Si P(A)=0, l’événement n’a aucune chance de
se réaliser.
Si une expérience a trois réalisations (états) possibles, la probabilité p de chaque réalisation
doit être comprise entre 0 et 1 ( 0≤p≤1), et la probabilité que l’état 1 ou 2 ou 3 se réalise doit
être égale à 1.
2. Statistiques descriptives ou statistiques inférentielles
On parle de statistiques descriptives quand on considère une petite population et qu’on se
sert de l’ensemble des données de cette population. Sur base de toutes les données, on
calcule des paramètres qui décrivent la population (à notre niveau, des paramètres de position
et de dispersion). Exemple : on veut décrire la taille des enfants d’une classe de primaire (taille
de la population N=19). On peut mesurer la taille de tous les enfants et calculer les paramètres
statistiques.
On parle de statistiques inférentielles quand on a une grande population, et qu’on estime les
paramètres qui décrivent la population à partir d’un échantillon (un sous-ensemble de la
1
population). On « estime », on « extrapole » la vraie valeur des paramètres à partir d’un
échantillon. Exemple : on veut décrire l’âge des belges (taille de la population N=11 millions).
On constitue un échantillon et on extrapole l’âge des belges à partir des données de
l’échantillon.
3. La Moyenne / l’Espérance
Dans le langage courant, la moyenne correspond à la notion de moyenne arithmétique ou
encore moyenne empirique ou observée. Si on dispose d’une série de N observations
x1, x2 , , xN , la moyenne est :
1
x x1 x2 xN
N
Quand on veut estimer la moyenne µ inconnue d’une variable X d’une population à partir d’un
échantillon de taille N et d’observations x1, x2 , , xN , on utilise la moyenne arithmétique.
En probabilité, si X est une variable aléatoire, qui peut prendre des valeurs x1, x2 , , xN avec
probabilité p1, p2 , , pN , l’espérance de la variable aléatoire est :
E ( X ) p1 x1 p2 x2 p N xN
La moyenne ou l’espérance est un des paramètres qui permet de caractériser une série ou
une variable aléatoire ; c’est un indicateur de position.
4. La Variance / l’Ecart-type
La variance est un indicateur de dispersion d’une variable aléatoire ou d’une série
d’observations autour de l’espérance ou de la moyenne. Une variance nulle indique que
toutes les valeurs sont identiques.
Pour calculer la variance d'une variable aléatoire ou d'une série statistique, on calcule les
écarts entre la variable ou la série, et son espérance ou sa moyenne, puis on prend l'espérance
ou la moyenne des carrés des écarts. La racine carrée de la variance correspond à l'écart type.
Ces deux paramètres permettent de caractériser une variable aléatoire ou une série.
s2
1
N
x1 x x2 x
2 2
xN x
2
x12 x2 2 xN 2
x2
N
En probabilité, si X est une variable aléatoire, qui peut prendre des valeurs x1, x2 , , xN avec
probabilité p1, p2 , , pN et d’espérance E(X), la variance est donnée par :
var ( X ) p1 x1 E ( X ) p2 x2 E ( X ) p N xN E ( X )
2 2 2
2
En statistique inférentielle, on estime la variance d'une population entière à partir de la
variance mesurée sur un échantillon de taille N. On corrige la variance mesurée sur
l’échantillon par un facteur N , afin d’obtenir la variance estimée (encore appelée
( N 1)
variance non biaisée).
5. La Covariance / La Corrélation
Si deux variables sont indépendantes, leur covariance est nulle. La réciproque n’est pas vraie.
La corrélation est une forme normalisée de la covariance ; par rapport à cette dernière, elle
est sans dimension et comprise entre -1 et 1.
cov X , Y
1
N
x1 x y1 y x2 x y2 y xN x yN y
cov X , Y E X E X Y E Y
Ce qui équivaut à :
cov X , Y E XY E X E Y
cov X , Y pij xi x y j y
N N
i 1 j 1
3
Le coefficient de corrélation est égal à la covariance divisée par le produit non nul des écart-
types :
cov X , Y
XY
var X var Y