Académique Documents
Professionnel Documents
Culture Documents
1. Introduction :
La statistique désigne à la fois un ensemble de données, d’observations portant sur un
ou plusieurs phénomènes ainsi que leurs traitements et leurs interprétations.
Les ensembles étudiés sont appelés populations, leurs éléments sont appelés
individus. L’étude porte, sur ce qu’on appelle caractère ou variable statistique. Ce
caractère peut être qualitatif ou quantitatif.
2. Echantillon statistique :
On considère une population P contenant N individus, que l’on veut étudier
relativement à un caractère quantitatif réel X .
S’il est possible d’étudier X sur tous les individus de la population, les propriétés de
X seraient parfaitement connues. Mais cette situation est très très rare.
L’étude de X sera donc réalisée sur un échantillon de taille n N .
Soit xi la valeur du caractère X sur l’individu "i " .
x1 , x2 , ..., xn Cette suite est appelée échantillon statistique.
Notons, pour chaque expérience, on pose X i : la réponse de l’individu i au caractère
X . X i se comporte comme X , c'est-à-dire, a la même loi de probabilité que X .
x1 , x2 , ..., xn est une réalisation de l’échantillon, c’est-dire: X 1 , X 2 , ..., X n
est un vecteur aléatoire, tel que, les variables aléatoires X i sont indépendantes et de
même loi que X .
La moyenne arithmétique :
La moyenne arithmétique associée à un échantillon X 1 , X 2 , ..., X n , est la quantité
réelle définie par :
1 n
Xn X i
n i 1
Proposition :
E X n m
E X m
Soit X une variable aléatoire telle que : Alors 2
Var X 2 Var X n
n
Démonstration :
1 n
E X n E X i
n i 1
1 n 1 n 1 n
E X i E X i E X n E X E X
1
n i 1 n i 1 n i 1 n
Rappel :
V aX b a 2 V X , X variable aléatoire et a R et b R .
La variance est invariante par translation.
1 n
V X n V X i
n i 1
n
1 n 1
V X i V X i 2 covX i , X
j
n 2 i 1 n 2 i 1 i j
1 n 1 n 2 2
V X i
2 i 1 2 i 1 n
n n
Car : i j cov X i , X j 0 puisque les variables aléatoires X i sont indépendantes.
4. Comportement asymptotique de X n :
a- Lois faible des grands nombres :
X n converge vers m en probabilité, c’est-à-dire :
0, P X n m 0
b- Lois forte des grands nombres :
X n converge vers m presque surement, c’est-à-dire :
P / lim X n m 1
c- Théorème central limite :
Xn m
La variable aléatoire Z . n N 0,1
X m
Pour n assez grand : P n . n z z .
Avec est la fonction de répartition de la loi N 0,1 .
Propriété :
2
X i X n X i2 X n2 .
1 n 1 n
Sn2
n i 1 n i 1
Démonstration :
2
X i X n X i2 2 X i X n X n2
1 n 1 n
S n2
n i 1 n i 1
1 n 2 1 n 1
n i 1
X i
n
2 X n Xi n Xn
n
2
i 1
X i X n nX n X n2
1 n 2 2
n i 1 n
1 n 2 2 2
Xi 2 Xn Xn
n i 1
1 n 2 2
Xi Xn
n i 1
2
Proposition : E S n
n 1 2
, où
n
2 Var X .
Démonstration :
1 2
X i X n
n
E S n2 E
n
i 1
1 n 2
E X i X n2
n i 1
1 n
E X i2 E X n2
n i 1
1 n
E X i2 E X n2
n i 1
E X E X
i
2 2
n
Comme : E X m et Var X E X E X
i i
2
i
2
i
2
donc : E X i m
2 2 2
De même : E X n m et Var X n
2
n
E X n2 E X n 2 donc : E X n2
2
n
m2
Alors :
E S n2 E X i2 E X n2
m
2
2 2
m 2
n
2 1 n 1 2
2
1 2
n n n
Remarque :
-
Lim E S n : pour n assez grand, la variance empirique se
2 2
C’est pour cette raison, on préfère utiliser dans la pratique Sn au lieu de S n .
2 2
0 si x X 1
1 si X 1 x X 2
n
2
si X 2 x X 3
Fn x n
.
n 1 si X
n n 1 x X n
1 si x X n
1 si X i x
1 i n : IX i x suit la loi de Bernoulli Ber p
0 si non
Avec p P X i x F x
IX i x Ber p
n
IX i x Bn , p B n , F x
i 1
Car les variables aléatoires yi IX i x sont indépendantes et de même loi
Ber p .
n n
Comme Fn x IX i x alors : n Fn x IX i x Bn , F x
1
n i 1 i 1
Donc :
E n Fn x n F x E Fn x F x
V n Fn x n F x 1 F x n 2 V Fn x
F x 1 F x
1
V Fn x
n
Conclusion :
E Fn x F x
V Fn x F x 1 F x
1
n
7. Echantillons Gaussiens :
On considère un échantillon d’une variable aléatoire de X , tel que X suit la loi
normale de paramètres m et
2 : N m, 2 , alors le vecteur aléatoire
X1 m
X m
Z 2 N M , Avec M R
n
: :
X
n m
2 0 ...... 0
0 ... 0
2
Et 2 In
0 0 0
2
0 0 0 .... 2
2
Dans le cas Gaussien, on peut connaitre explicitement les lois de X n et de S n , mais
dans le cas général les lois ne sont pas connues.
7-1 : loi de X n :
1 n
Xn
n
Xi : C’est une combinaison linéaire des coordonnées d’un vecteur
i 1
gaussien. Donc X n est une variable gaussienne de paramètres :
2 2
E X n m et V X n
: Xn N m ,
n n
2
7-2 : Indépendance entre X n et S n :
1 n
Xn
n
Xi
i 1
X i Xn
1 n 1 n 2
2
Sn2 X i X n2
n i 1 n i 1
Théorème :
1 i n : les variables aléatoires X i X n et X n sont gaussiennes et
indépendantes.
Démonstration :
2
Xn N m ,
n
1 i n :
1 n
Xi Xn Xi X j
n j 1
1 1 1 1 1 1
X 1 X 2 ... X i 1 1 X i X i 1 ... X n
n n n n n n
Donc X i X n est une variable gaussienne car c’est une combinaison linéaires des
coordonnées d’un vecteur gaussien.
E X i X n E X i E X n m m 0
1 1
V X i X n V X 1 X 2 ... X i 1 1 X i X i 1 ... X n
1 1 1 1
n n n n n n
2
1 1 1 1 1 1
2 V X 1 2 V X 2 ... 2 V X i 1 1 V X i .. 2 V X i 1 ... 2 V X n
n n n n n n
n 1 2 1 2
1
2
n2 n
n 1 2
n
n 1 2
1 i n , X i X n N 0 ,
n
Le couple X n , X i X n s’écrit sous la forme :
Xn
AZ b
X X
i n
Avec :
1 1 1 1
.... ...........
0
A
n n n n
et b
1 1 1 1 0
.....1 .......
n n n n
Le couple X n , X i X n est un vecteur gaussien :
2 , ?
Xn
m n
N ,
X X n 1 2
i n 0 ?
n
Rappel :
Si U N M , Alors
V AU b N AM b , AAt
La matrice de variance covariance du couple X n , X i X n s’obtient par :
Mme Laboudi Bouarroudj.F Page 7
Chapitre 1 :Echantillonnage
1 1
n n
1 1 1 1 1 1
.... ...........
A At 2I n
n n n n n
1 1 1 1 1
.....1 ....... : 1
n n n n n
1
1
n n
1
n 1 1 1 1 1
n 2 0
n n 2
n n 2 n
2
n 1 1 1 1 n 1 1 1 2
0
n 1
n
n
2
n n n2 n
Donc
cov X n , X i X n 0
2
7-3 Loi de S n :
Rappel :
- Si X sui la loi normale centrée et réduite N 0,1 alors X 2
suite la loi de khi-deux à 1 degré de
liberté 12 .
- Si X suit la loi de khi deux à n 1 degré de liberté : 2
n1
2 .
n 1 n 2
1 i n : X i N m, 2 Zi
Xi m
N 0 ,1
2
n n
X m n
X i m
1
R i 2 2n
2
Z i2
i 1 i 1 i 1
2
X i X n X n m
1 n 1 n
X i m
2
2 i 1 2 i 1
1
2
i 1
X i X n X n m 2X i X n X n m
n
2 2
X i X n X n m 2 X n m X i X n
1 n n n
2 2
2 i 1 2 i 1
2
n S n2 X n m n
n 2 X n m X i n X n
2
2
i 1
n n
alors 2 X n m X i n X n 0
2
Comme X i n X n 0
i 1 i 1
2 2
n
Xi m n S n2 X n m
Donc : Z n 2n
i 1 2
A retenir :
2
n
X m
i 2n
i 1
2
Xn m
n 21
n S n2
E 2 n 1
n S n2 n S n2
n1 V 2 2 n 1
2
2
2 n 1 2
V S n2
n2
8. Statistique et vraisemblance :
Soit X 1 , X 2 , ..., X n un n échantillon d’une variable aléatoire X , toute fonction de
X 1 , X 2 , ..., X n est appelée statistique ou statistique d’échantillonnage .
Exemple :
X n , S n2 , min X i , max X i ...... sont des statistiques.
Dans toute la suite du cours, on suppose que X est une variable aléatoire, de loi de
probabilité dépendant d’un paramètre R d avec d 1 .
P x P x, est la fonction de masse dans le cas discret.
f x f x, est la fonction densité dans le cas continu.
Exemples :
1. X : suit la loi de Bernoulli
X Ber :
si x 1
P x P X x x 1 1 x , x 0 , 1
1 si x 0
n n
L x1, x2 ,...xn , P X i xi xi 1 1 xi I0 , 1 xi
i 1 i 1
n
xi n n
i 1 1
n xi
i 1
I0 , 1 xi
i 1
n n
L x1 , x2 ,...xn , P X i xi 1 x 1 I xi
N*
i 1 i 1
n n
n 1 xi n I xi
i 1 N*
i 1
xi
n n
L x1, x2 ,...xn , P X i xi x ! e
i 1 i 1 i
n
xi
i 1
e n n
xi !
i 1
n n
L x1, x2 ,...xn , f xi e xi
i 1 i 1
n
xi
n e i 1
5. X N m, 2
: m , R xR 2 *
xm 2
f x
1 2 2
e , x R
2
n
L x1, x2 ,...xn , m, 2 f xi
i 1
n
2
xi m
1 1
exp xi R
n
2
n
2
2
i 1
Définition :
Une loi de probabilité P R de densité f ., est dite appartient à la famille
d
de lois exponentielle d’ordre 1, S’il existe des fonctions réelles a, b, c et d tel que
Exemples :
1. X Ber
si x 1
P x P X x x 1 1 x I0 ,1x
1 si x 0
Avec :
a 1
b x I0 ,1
c log
1
d x x
La loi de Bernoulli appartient à la famille de lois exponentielle d’ordre 1 .
Avec :
a e
1
b x I N x
x!
c log
d x x
3. X N m, 1 : m R
xm 2
f x
1
e 2 , x R
2
x 2 m2 2 xm
1
1
e 2 , x R
2
1 2 1 2
1 2 x 2 m xm
e e e
2
Avec :
1 2
1 2 m
am e
2
1
x2
b x e 2
cm m
d x x
f x
1
, x R , 0
1 x 2