Vous êtes sur la page 1sur 29

Échantillonnage

Échantillonnage et estimation

N. RIANE
Faculté des sciences économiques, juridiques et sociales de Rabat

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sommaire

1 Échantillonnage

Vocabulaire

Probabilité d'inclusion

Méthodes d'échantillonnage

Méthodes empiriques

Méthodes probabilistes

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sommaire

1 Échantillonnage

Vocabulaire

Probabilité d'inclusion

Méthodes d'échantillonnage

Méthodes empiriques

Méthodes probabilistes

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Vocabulaire
Recensement : une collecte exhaustive de l'information.
Sondage : une collecte de l'information sur un échantillon de
la population.
Plan de sondage : c'est une procédure permettant de
sélectionner un échantillon dans une population.
Base de sondage : c'est une liste des unités de la population.
Information auxiliaire : une information connue sur
l'ensemble de la population, sous forme détaillée ou
synthétique, qui permet de partitionner la population et
d'obtenir un plan de sondage.
Algorithme d'échantillonnage : une méthode automatique
permettant de sélectionner un échantillon selon le plan de
sondage choisi.
N. RIANE Échantillonnage et estimation
Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sommaire

1 Échantillonnage

Vocabulaire

Probabilité d'inclusion

Méthodes d'échantillonnage

Méthodes empiriques

Méthodes probabilistes

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Probabilité d'inclusion
Dénition
On appelle :
1 probabilité d'inclusion de l'unité i , de la population U dans
l'échantillon S , la probabilité que l'unité i soit retenue dans
l'échantillon S , c'est à dire : P(i ∈ S).
2 poids d'échantillonnage Wi le nombre moyen d'unités de la
population que chaque unité échantillonnée représente, il est
l'inverse de sa probabilité d'inclusion dans l'échantillon.
3 taille moyenne la somme des probabilités d'inclusion :
X
P(i ∈ S) = E (n)
i∈U

où n = n(S) est la taille de l'échantillon S .


N. RIANE Échantillonnage et estimation
Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sommaire

1 Échantillonnage

Vocabulaire

Probabilité d'inclusion

Méthodes d'échantillonnage

Méthodes empiriques

Méthodes probabilistes

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Méthodes d'échantillonnage

On distingue deux grandes catégories de méthodes :


1 Les méthodes probabilistes : sont des méthodes qui
permettent de calculer à priori les probabilités d'inclusions.
2 Les méthodes empiriques : sont des méthodes qui ne
permettent pas de calculer à priori les probabilités d'inclusions.

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sommaire

1 Échantillonnage

Vocabulaire

Probabilité d'inclusion

Méthodes d'échantillonnage

Méthodes empiriques

Méthodes probabilistes

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Les méthodes empiriques

Il est souvent employé lorsqu'il y a absence de base de sondage. On


peut citer :
1 La méthode des quotas : l'échantillon est généré selon la
même structure de la population par rapport à un critère, les
individus sont choisit à la convenance de l'enquêteur.
2 La méthode des itinéraires : On impose à l'enquêteur un
itinéraire (localisations géographiques) à suivre.
3 La méthode des unités-types : On choisit un individu
représentatif de chaque groupe.
4 Échantillonnage de volontaires.
5 ...

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sommaire

1 Échantillonnage

Vocabulaire

Probabilité d'inclusion

Méthodes d'échantillonnage

Méthodes empiriques

Méthodes probabilistes

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Plan de sondage avec/sans remise

Dénition
Un plan de sondage est dit avec remise si un même individu peut
apparaître plusieurs fois dans l'échantillon et si l'ordre dans lequel
apparaissent les individus compte. Sinon il est dit sans remise.

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Plan de sondage aléatoire simple

Dénition
Un plan de sondage aléatoire est dit simple si chaque échantillon a
la même probabilité qu'un autre d'être tiré au sort.

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Plan de sondage aléatoire simple

Dénition
Une population U est dite stratiée quand les unités peuvent être
partitionnées en H sous-populations disjointes Uh , . . . , UhH
1

appelées strates.

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Plan de sondage aléatoire simple

Dénition
Un plan de sondage aléatoire est dit stratié quand des
échantillons indépendants sont sélectionnés dans chaque strate.

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Le tirage de Bernoulli

Principe : On lance une pièce de monnaie pour chaque individu de


la population, si le résultat est "Pile", l'individu est sélectionné
dans l'échantillon. Le tirage se fait indépendamment d'un individu à
l'autre.

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Le tirage de Bernoulli

1
Probabilité d'inclusion : P(i ∈ S) = p avec p = si la pièce est
2
équilibrée.
1
Poids d'échantillonnage : Wi = .
p
Taille moyenne : E(n) = pN .
.

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sondage aléatoire simple avec remise

Principe : On choisit de façons aléatoires, avec remise et


indépendantes n individus de la population, où n est xé d'avance.

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sondage aléatoire simple avec remise

Probabilité d'inclusion :
N −1
 n
P(i ∈ S) = 1 − P(i ̸∈ S) = 1 −
N

Taille moyenne : E(n) = n (xé d'avance).

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sondage aléatoire simple sans remise

Principe : On choisit de façons aléatoires sans remise n individus


de la population, où n est xé d'avance.

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sondage aléatoire simple sans remise

Probabilité d'inclusion :
N −1N −2 N −n n
P(i ∈ S) = 1 − P(i ̸∈ S) = 1 − ··· =
N N −1 N −n+1 N
Taille moyenne : E(n) = n (xée d'avance).

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sondage aléatoire simple stratié avec remise

Principe : La population est décomposée en N = Nh + . . . + NhH .


1

On choisit les tailles nh , . . . , nhH des sous-échantillons à


1

sélectionner dans chaque strate telles que n = nh + . . . + nhH .


1

nhi tirages aléatoires simples avec remise sont eectués dans


chaque strates hi .

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sondage aléatoire simple stratié avec remise

Probabilité d'inclusion :
Nhi − 1 nhi
 
P(i ∈ S) = 1 − P(i ̸∈ S) = 1 − où hi est la strate de
Nh i
l'individu i .
Taille moyenne : E(n) = nh + . . . + nhH = n (xée d'avance).
1

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sondage aléatoire simple stratié sans remise

Principe : La population est décomposée en N = Nh + . . . + NhH .


1

On choisit les tailles nh , . . . , nhH des sous-échantillons à


1

sélectionner dans chaque strate telles que n = nh + . . . + nhH .


1

nhi tirages aléatoires simples sans remise sont eectués dans


chaque strates hi .

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Sondage aléatoire simple stratié sans remise

n
Probabilité d'inclusion : P(i ∈ S) = hi où hi est la strate de
N
l'individu i .
Taille moyenne : E(n) = nh + . . . + nhH = n (xée d'avance).
1

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Le problème de l'indépendance des tirages

Attention ! dans le cas du tirage aléatoire sans remise, la propriété


de l'indépendance des tirages est perdue.

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Taille de l'échantillon

Problème : On considère un échantillon aléatoire S oû les tirages


sont indépendants.
Quelle taille n l'échantillon doit-il avoir pour que la probabilité que
la moyenne de l'échantillon se situe à moins de ε de la moyenne de
la distribution en valeur absolue, soit d'au moins 1 − α ?

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Taille de l'échantillon - Inégalité Bienaymé-Tchebychev

Solution :
σ2
P(|X̄ − µ| < ε) = 1 − P(|X̄ − µ| ⩾ ε) ⩾ 1 − =1−α
nε2
σ2
n=
αε2

N. RIANE Échantillonnage et estimation


Vocabulaire
Probabilité d'inclusion
Échantillonnage Méthodes d'échantillonnage
Méthodes empiriques
Méthodes probabilistes

Taille de l'échantillon - Loi central limite

Solution : grand échantillon n ≫ 1


−ε X̄ − µ ε
√ <
P(|X̄ − µ| < ε) = P(−ε < X̄ − µ < ε) = P( √ < √ )
σ/ n σ/ n σ/ n
L ε ε ε
−→ Φ( √ ) − Φ(− √ ) = 2Φ( √ ) − 1
σ/ n σ/ n σ/ n
=1−α
σ 2 −1 α
n≈ Φ (1 − )
ε 2
2
où Φ est la fonction de répartition d'une loi normale centré réduite.

N. RIANE Échantillonnage et estimation

Vous aimerez peut-être aussi