Vous êtes sur la page 1sur 18

Échantillonnage Aléatoire

Abdallah BENABDALLAH
Université de Sfax
Institut Supérieur d’Informatique et de Multimédia de Sfax

Décembre 2019

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
Plan du Chapitre 5

1. Introduction

2. La moyenne d’échantillon aléatoire

3. Le Théorème de limite central

4. La Variance d’échantillon aléatoire

5. Lois des échantillons aléatoires normaux

6. Conclusion

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
1. Introduction
La science de la statistique consiste à tirer des conclusions à partir
des données observées.
Considérons n observations d’un échantillon d’une population de
moyenne µ et d’écart type σ, les deux inconnus:
x1 , x2 , ...., xn .

Définition 1 :
La moyenne de l’échantillon est définie par
n
1X
x= xk .
n
k=1

La variance de l’échantillon est définie par


n
2 1 X
s = (xk − x)2 .
n−1
k=1
Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique
Échantillonnage
et de
Aléatoire
Multimédia de Sfax
Exemple 1 : Les nombres des accidents de voiture en dix jours
consécultifs sont
3, 4, 1, 0, 3, 5, 1, 0, 2, 3.
Déterminer la moyenne de l’échantillon x et la variance de
l’échantillon s 2 .
Exemple 2 : On lance un dé cubique 40 fois, on a obtienu

Valeur 1 2 3 4 5 6
Apparition 9 8 5 5 6 7

Déterminer la moyenne de l’échantillon x et la variance de


l’échantillon s 2 .
Définition 2 :
Si X1 , ..., Xn sont des variables aléatoires indépendantes ayant la
même loi qu’une variable X , alors nous disons qu’ils constituent
un échantillon aléatoire de X .

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
Il y a deux branches des statistiques :
La statistique descriptive: les méthodes pour récapituler et
analyser les données observées sur un échantillon.
La statistique inférenrielle: les méthodes qui permettent
de tirer des conclusions au sujet de la variable X à partir des
valeurs observées sur un échantillon.

Exemple 3 : On tire 10 fois successivement et avec remise une


boule d’une urne contenant des boules bleus avec une proportion
p ∈]0, 1[ et des boules rouges on obtient

B, R, R, R, B, B, R, R, B, R.

Déterminer la proportion p des boules bleus.

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
Il y a deux types des problèmes statistique
1 Problème paramétrique: Ceci lorsqu’on connait que la
variable X suit une certaine loi (Poisson, Normale, ...). Dans
ce cas, on veut tirer des conclusions sur les paramètres de la
loi (λ, µ et σ, ...)
2 Problème non paramètrique: Ceci lorsqu’on ne connait rien
sur la variable X . Dans ce cas, on veut tirer des conclusions
sur la loi elle même ou un sujet faisant intervenir X .
2. La moyenne d’un échantillon aléatoire

Définition 3 : Moyenne d’un échantillon aléatoire


Soit X = (X1 , X2 , ..., Xn ) un échantillon aléatoire de taille n d’une
v.a. X . La moyenne d’échantillon aléatoire est la variable
aléatoire
X1 + X2 + ... + Xn
X = .
n

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
Proposition :
Soit X = (X1 , X2 , ..., Xn ) un échantillon aléatoire de taille n d’une
v.a. X d’espérance µ et d’écart-type σ. On a

σ2
E(X ) = µ et V(X ) = .
n

Exercice 1 : On prend 100 échantillons chacun de taille n = 25


d’une population de loi exponentielle d’ésperance λ = 10. La
moyenne de l’échantillon x est calculer pour chaque échantillon.
On trouve
la moyenne des 100 moyennes d’échantillons est m = 10, 24
la variance des 100 moyennes d’échantillons est v = 2, 17.
Soit X la moyenne de l’échantillon aléatoire.
1 Donner E(X ) et V(X ).
2 Justifier alors les valeurs de m et v .

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
3. Théorème de limite central

On remarque que la loi de la moyenne d’un échantillon aléatoire


d’une population de loi quelconque tend vers une loi normale
lorsque la taille de l’échantillon n devient grand.
Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique
Échantillonnage
et de
Aléatoire
Multimédia de Sfax
C’est le Théorème de limite central.
Le Théoréme de limite central affirme que lorsque la taille de
l’échantillon est grande, alors la moyenne d’échantillon X suit
approximativement une loi normale.

Théoréme de limite central


Soit X = (X1 , X2 , ..., Xn ) un échantillon aléatoire de taille n d’une
v.a. X d’espérance µ et d’écart-type σ. Pour n assez grand
(n ≥ 30), la moyenne d’échantillon aléatoire X suit
approximativement la loi normale N (µ, √σn ).

Ainsi, pour n assez grand, la v.a.

X −µ
Z= √
σ/ n

suit approximativement la loi normale centrée réduite N (0, 1).

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
En pratique, pour n ≥ 30, on a
 
X −µ
P a≤ √ ≤ b ' φ(b) − φ(a), ∀(a, b) ∈ R2 .
σ/ n

Exercice 2 : On prend un échatillon aléatoire de taille n = 25, 50


et 100 d’une population de loi exponentielle d’ésperance 10.
Déterminer un intervalle [a, b] tel que

P(a ≤ X ≤ b) = 0, 95.

On donne

P(−1, 96 ≤ Z ≤ 1, 96) = φ(1, 96) − φ(−1, 96) = 0, 95

où Z est variable aléatoire de loi normale centrée réduite N (0, 1).

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
Corollaire :(Théorème de Moivre-Laplace )

Soit X une v.a. de loi Binomial B(n, p). Pour n assez grand
(n ≥ 30), la v.a.
X − np
Z=p
np(1 − p)
suit approximativement la loi normale N (0, 1).

Remarque 1: En pratique l’approximation de loi Binomial par la


loi normale est utilisée lorsque
np ≥ 5 et n(1 − p) ≥ 5.

Exercice 3 : Soit X une v.a. de loi Binomial B(50, 0.3).


1 Calculer P(13 ≤ X ≤ 14).

2 Calculer P(13 ≤ X ≤ 14) en utilisant l’approximation normale.

On utilisera la correction continue


P(13 ≤ X ≤ 14) = P(12, 5 ≤ X ≤ 14, 5).
Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique
Échantillonnage
et de
Aléatoire
Multimédia de Sfax
3. La Variance d’échantillon aléatoire
Soit X = (X1 , X2 , ..., Xn ) un échantillon aléatoire de taille n d’une
v.a. X .

Définition 4:
La variance d’échantillon aléatoire de X est la variable aléatoire
n
1 X
S2 = (Xk − X )2 .
n−1
k=1

Proposition
Soit X = (X1 , X2 , ..., Xn ) un échantillon aléatoire de taille n d’une
v.a. X d’espérance µ et d’écart-type σ. On a

E(S 2 ) = σ 2 .

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
5. Les lois des échantillons normaux

Théorème
Soit X = (X1 , X2 , ..., Xn ) un échantillon aléatoire de taille n d’une
v.a. X de loi normale N (µ, σ). Alors,
X −µ
1 Z= √ , suit la loi normale centrée réduite N (0, 1).
σ/ n
X −µ
2 Tn−1 = √ , suit la loi Student de degré de liberté n − 1.
S/ n
(n − 1)S 2
3 χ2n−1 = , suit la loi Khi deux de degré de liberté
σ2
n − 1.

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
Exercice 4: Le temps que prend une unité centrale pour traiter
un certain type de travail est normalement distribué de moyenne
µ = 20 secondes et écart type σ = 3 secondes. Si un échantillon
de 15 emplois est observée, quelle est la probabilité que la variance
de l’échantillon sera supérieur à 12?
Exercice 5: On connait que la concentration d’une certaine type
de protéine dans le sang de l’homme suit une loi normale N (µ, σ),
où les deux valeurs µ et σ sont inconnues. On fait 30 analyses du
sang au même homme, on obtient la moyenne de l’échantillon
m = 3.1 et la variance s 2 = 0.3. On sait que si µ ∈
/ [2.7, 2.9] alors
l’homme est malade. Quelle est la probabilité pour que l’homme
soit malade?

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
7. Conclusion

Un échantillon aléatoire de taille n d’une v.a. X


(généralement inconnue) d’epérance µ et d’écart type σ est la
v.a.
X = (X1 , X2 , ..., Xn )
où X1 , ..., Xn sont n v.a. indépendantes ayant même loi que X .

La moyenne d’échantillon aléatoire est la v.a. définie par


n
1X
X = Xk .
n
k=1

Elle vérifie les propriétés


E(X ) = µ,
2
V(X ) = σn .

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
Théorème 2: (Le Théorème de limite central)
Soit X = (X1 , X2 , ..., Xn ) un échantillon aléatoire de taille n d’une
v.a. X d’espérance µ et d’écart-type σ. Pour n assez grand
(n ≥ 30), la moyenne de l’échantillon X suit approximativement la
loi normale N (µ, √σn ).

Ainsi,
 
X −µ
P a≤ √ ≤ b ' φ(b) − φ(a), ∀(a, b) ∈ R2 .
σ/ n

Corollaire :(Théorème de Moivre-Laplace)


Soit X une v.a. de loi Binomiale B(n, p). Pour n p
assez grand et
np ≥ 5 et n(1 − p) ≥ 5, la v.a. Z = (X − np)/( np(1 − p)) suit
approximativement la loi normale N (0, 1).

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
La Variance d’échantillon X est la variable aléatoire
n
1 X
S2 = (Xk − X )2 .
n−1
k=1

On a E(S 2 ) = σ 2 .
Soit X = (X1 , X2 , ..., Xn ) un échantillon aléatoire d’une v.a. X
de loi normale N (µ, σ).

Propriété 1: La v.a. Z = (X − µ)/(σ/ n), suit la loi
normale N (0, 1).
Propriété 2: La v.a. K = (n − 1)S 2 /σ 2 , suit la loi Khi2 de
degré de liberté n − 1.

Propriété 3: La v.a. T = (X − µ)/(S/ n) suit la loi de
Student de degré de liberté n − 1.

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax
Bibliographie

R. L. Scheaffer, M. S. Mulekar and J. T. McClave


Probability and Statistics for Engineers .
Brooks/Cole, Cengage Learning, (fifth edition) 2011.

Sheldon M. Ross
Introduction to Probability and Statistics for Engineers and
Scientists.
Elsevier Academic Press, 2004.

Douglas C. Montgomery, George C. Runger


Applied Statistics and Probability for Engineers.
John Wiley & Sons, 2003.

Abdallah BENABDALLAH Université de Sfax Institut Supérieur d’Informatique


Échantillonnage
et de
Aléatoire
Multimédia de Sfax

Vous aimerez peut-être aussi