Vous êtes sur la page 1sur 59

1

Cours de Probabilité et Statistique pour la


deuxième année des conseillers en planication et
en orientation
C.O.P.E.

CHIKHI EL MOKHTAR

1er décembre 2020

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.

Deuxième partie : Statistique Inférentielle

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Chapitre 3 : Estimation et Échantillonnage
Introduction

I L'estimation et l'échantillonnage forment avec les tests


d'hypothèses, la partie dite statistique inférentielle.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Chapitre 3 : Estimation et Échantillonnage
Introduction

I C'est quoi l'estimation ? et c'est quoi l'échantillonnage ?

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Chapitre 3 : Estimation et Échantillonnage
Introduction

I L'estimation est une opération qui permet d'induire, à partir


des résultats observés sur un échantillon, des informations sur
la population totale.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Chapitre 3 : Estimation et Échantillonnage
Introduction

I L'échantillonnage est une opération qui consiste, à partir


d'informations relatives à la loi d'une variable X pour une
population donnée, on en déduit le comportement
d'échantillons aléatoires relatifs à cette variable.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Population à caractère quantitatif Echantillon de taille n
μ : la moyenne de la population ̅ : la moyenne de l’échantillon
σ : l’écart type de la population : l’écart type de l’échantillon

Echantillonnage

cv Echantillon aléatoire

Estimation

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I Estimation ponctuelle

Soit X une variable aléatoire étudiée sur une population dont la loi
de probabilité dépend d'un (ou plusieurs) paramètre θ inconnu
(paramètre d'intérêt).
θ peut-être égal :
I µ la moyenne de la population à caractère quantitatif ;

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I Estimation ponctuelle

Soit X une variable aléatoire étudiée sur une population dont la loi
de probabilité dépend d'un (ou plusieurs) paramètre θ inconnu
(paramètre d'intérêt).
θ peut-être égal :

I σ l'écart-type de la population à caractère quantitatif ;

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I Estimation ponctuelle

Soit X une variable aléatoire étudiée sur une population dont la loi
de probabilité dépend d'un (ou plusieurs) paramètre θ inconnu
(paramètre d'intérêt).
θ peut-être égal :

I p la proportion d'un caractère dans la population à caractère


qualitatif ;

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Objectif de l'estimation ponctuelle

L'objectif de l'estimation ponctuelle est de chercher à donner une


valeur approchée du paramètre d'intérêt θ à partir des résultats
obtenus sur un échantillon aléatoire extrait de la population.
Dénition : Estimateur et estimation
Soit X une variable aléatoire dont la loi de probabilité dépend d'un
paramètre θ inconnu, (X1 , . . . , Xn ) est un échantillon aléatoire
d'eectif n de même loi que X. L'estimateur de θ noté Θ b n est la
statistique dénie par :

b n = hn (X 1, . . . , Xn)
Θ

où hn est une fonction dénie sur Rn

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Estimation

Une fois l'échantillon est prélevé, nous disposons de n valeurs


observées x1 , . . . , xn , ce qui nous fournit une valeur hn (x1 , . . . , xn )
qui est une réalisation de Θ b n qui est notée θbn et que nous appelons
estimation de θ.
Remarque 1
• À priori l'estimateur Θ
b n est à valeurs dans un ensemble Θ,
contenant l'ensemble des valeurs possibles du paramètre θ.
b n est une v.a. de loi de probabilité qui dépend du paramètre
• Θ
θ.
b n peut être univarié ou multivarié.
• Θ

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Remarque 2
• Nous distinguons la variable aléatoire Θ
b n de sa valeur
observée, notée θn .
b
• Nous utiliserons les notations suivantes :
(i) (X1 , . . . , Xn ) désigne l'échantillon aléatoire de
taille n et les n observations ne sont pas encore à
disposition.
(ii) (x1 , . . . , xn ) désigne une réalisation de
l'échantillon aléatoire et les n observations sont à
disposition
• Il faut systématiquement se demander :  suis-je entrain de
manipuler une variable aléatoire ou l'une de ses réalisations ?


Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• D'après la dénition d'un estimateur d'un paramètre θ qui est :

b n = hn (X 1, . . . , Xn)
Θ

Il existe plusieurs fonctions hn , donc il existe plusieurs estimateurs


du même paramètre θ.
Exemple :
b n = hn (X 1, . . . , Xn) = X1 est un estimateur de θ.
I Θ

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• D'après la dénition d'un estimateur d'un paramètre θ qui est :

b n = hn (X 1, . . . , Xn)
Θ

Il existe plusieurs fonctions hn , donc il existe plusieurs estimateurs


du même paramètre θ.
Exemple :

b n = hn (X 1, . . . , Xn) = X1 + X2 .X3 est un estimateur de θ.


I Θ

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• D'après la dénition d'un estimateur d'un paramètre θ qui est :

b n = hn (X 1, . . . , Xn)
Θ

Il existe plusieurs fonctions hn , donc il existe plusieurs estimateurs


du même paramètre θ.
Exemple :

b n = hn (X 1, . . . , Xn) = X1 + X2 + ... + Xn est un estimateur


I Θ
de θ.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Propriétés d'un estimateur

Il existe plusieurs estimateur d'un même paramètre θ. Un


estimateur est ecace s'il vérie les propriétés suivantes :
I Bias d'un estimateur
Le biais de Θb n se dénit par b(n, θ) = E (Θ
b n) − θ

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Propriétés d'un estimateur

Il existe plusieurs estimateur d'un même paramètre θ. Un


estimateur est ecace s'il vérie les propriétés suivantes :

I Estimateur sans biais


b n est un estimateur sans biais (ou non biaisé) du paramètre θ
Θ
si b(n, θ) = 0 c'est-à-dire si E (Θ
b n) = θ

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Propriétés d'un estimateur

Il existe plusieurs estimateur d'un même paramètre θ. Un


estimateur est ecace s'il vérie les propriétés suivantes :

I Estimateur asymptotiquement sans biais


Un estimateur Θ
b n est asymptotiquement sans biais pour θ si
lim E (Θ
b n) = θ
n→+∞

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• Écart quadratique moyen
Si Θ
b n est un estimateur de θ, nous mesurons la précision de
b n par l'écart quadratique moyen, noté EQM :
Θ

b n − θ)2 = V (Θ

EQM (Θ b n ) = E (Θ b n ) + b(n, θ)2

Remarque
(i) Si Θ
b n est un estimateur sans biais, c'est-à-dire si
b(n, θ) = 0, alors :EQM (Θ b n ) = V (Θ
b n );
(ii) Entre deux estimateurs de θ, nous choisissons
celui dont l'écart quadratique moyen ou le risque
est le plus faible.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• Estimateur relativement plus ecace
Un estimateur Θb 1 est relativement plus ecace qu'un
n
b 2 s'il est plus précis que le second, c'est-à-dire si :
estimateur Θ n
 
b1
 
EQM Θ ≤ EQM Θ b2
n n

• Estimateur sans biais optimal


Nous appelons estimateur sans biais optimal parmi les
estimateurs sans biais, un estimateur Θ
b n préférable à tout
autre au sens de la variance (variance minimale) c'est-à-dire
l'estimateur le plus ecace parmi tous les estimateurs sans
biais.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• Estimateur convergent
Un estimateur Θ b n est un estimateur convergent s'il converge
en probabilité vers θ quand n tend vers l'inni.
i.e.
lim p(| Θb n − θ |< ) = 1 ∀ > 0
n→+∞

• Si un estimateur est sans biais et que sa variance tend vers zéro


quand n tend vers l'inni, alors cet estimateur est convergent.
En général pour déterminer un estimateur d'un paramètre θ , on
utilise soit :
(i) La méthode des moments ;
(ii) La méthode du maximum de vraisemblance ;
(iii) La méthode bayésienne.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I.1 Estimation ponctuelle de la moyenne µ et de l'écart-type
σ de la population
Soit X une variable aléatoire étudiée sur une population de moyenne
µ et de variance σ 2 . X1 , . . . , Xn un n− échantillon aléatoire tiré de
la population de même loi que X . et x1 , . . . , xn sa réalisation.
• µ inconnue (paramètre d'intérêt)
•• Estimateur de la moyenne µ de la population
(i) L'estimateur de µ est X n qu'est égal à :
n
1X
Xn = Xi
n
i=1

(ii) L'estimation de µ est la réalisation de X n :


n
1X
xn = xi
n
i=1

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• σ inconnu (paramètre d'intérêt)
•• Estimateur de l'écart-type σ de la population
• • • Cas où µ est connue
(i) l'estimateur de σ 2 est :
n
1X
Sn2 = (Xi − µ)2
n
i=1

• • • Cas où µ est inconnue


(i) l'estimateur de σ 2 est :
n
1 X
Sn2 = (Xi − X n )2
n−1
i=1

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Exemple :
Lors d'un contrôle d'une chaîne de médicaments, on s'intéresse au
nombre de comprimés défectueux dans un lot. L'étude de 200 lots a
donné les résultats suivants :

nombre de comprimés défectueux par lot xi 0 1 2 3 4 5


nombre de lots ni 75 53 39 23 9 1

1) Calculer la moyenne x 200 et l'écart type se de cet échantillon ;


2) déduire l'estimation ponctuelle de la moyenne µ et de l'écart
type σ du nombre de comprimés défectueux sur l'ensemble de
la production.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Réponse :
I Calcul de la moyenne x 200 de l'échantillon :
1 241
x 200 = {0∗75+1∗53+2∗39+3∗23+4∗9+5∗1} = = 1.205
200 200

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Réponse :

I Calcul de l'écart type se de l'échantillon : on a :


6
2 1 X
se = ni xi2 − x 2200
200
i=1
avec
6
ni xi2 = 02 ∗ 75 + 12 ∗ 53 + 32 ∗ 23 + 42 ∗ 9 + 52 ∗ 1 = 585
X

i=1
alors
585
q
2
se = − 1.2052 = 1, 473 ⇒ se = se2 = 1.214
200
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I L'estimation ponctuelle de la moyenne µ est la moyenne x 200
b = x 200 = 1.205
de l'échantillon,i.e µ

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I L'estimation ponctuelle de l'écart type σ est s t.q.
6
1 200
s2 = ni xi2 − x 2 = 1.48
X
200 − 1 200 − 1 200
i=1

alors s = s 2 = 1.217 et σ
b = 1.217

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I Remarque,on a :
n 2
s2 = s
n−1 e

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I.2 Estimation ponctuelle de la proportion p inconnue d'un
caractère dans une population

Soit p la proportion d'un caractère A dans une population. Soient


X1 , . . . , Xn un n-échantillon aléatoire tel que,Xi = 1 si la i eme unité
ait le caractère A et Xi = 0 sinon, alors l'estimateur de p est
n
1X
F = Xi
n
i=1

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Estimation par intervalle de conance

L'estimation ponctuelle d'un parmètre θ dépend de l'échantillon


choisi. Les paramètres estimés de la population ne sont pas exacts,
on voudrait connaitre leur degré de précision.
Pour cela, on aime avoir les résultats sous forme d'intervalle dont
lequel doit se trouver le vrai parmtre que l'on cherche à estimer
avec une probabilité.
Objectif : L'estimation par intervalle de conance consiste à
donner autour de la valeur estimée un intervalle dont on a de forte
chance qu'il contient la vraie valeur du paramètre recherché.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Dénition

On appelle intervalle de conance à (1 − α) (ou on dit aussi


intervalle de conance à risque α) d'un paramètre θ, l'intervalle
[a; b] dont lequel ce paramètre a une probabilité (1 − α) de se
trouver.
i.e.
p (θ ∈ [a; b]) = 1 − α.
On prend souvent α = 1%, 5%, ou 10%.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Remarque

• si la loi de probabilité de la variable aléatoire X étudiée est


symétrique on prend
h i
[a; b] = θb − ; θb + 

• si la loi n'est pas symétrique, on préféra de ne pas centrer


l'intervalle autour de la valeur estimée mais center la
probabilité i.e. chercher a et b tels que :

p (θ < a) = p (θ > b) = α/2

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Intervalle de conance pour la moyenne µ
Soit X une variable aléatoire de moyenne µ inconnue et
d'écart-type σ. X1 , . . . , Xn un échantillon indépendants et de même
loi que X . x n est l'estimation ponctuelle de µ
1) Cas des petits échantillons (n < 30)
on suppose que X suit une loi normale
(i) Cas où σ est connu
L'intervalle de conance de µ à 1 − α est :
 
σ σ
IC1−α (µ) = x n − zα/2 √ , x n + zα/2 √
n n
avec n est la taille de l'échantillon et zα/2 est le fractile de la
loi N (0, 1) tel que :
p Z < zα/2 = 1 − α/2


Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
(ii) Cas où σ est inconnu
L'intervalle de conance de µ à 1 − α est :
 
s s
IC1−α (µ) = x n − tα/2,n−1 √ , x n + tα/2,n−1 √
n n

avec s 2 est l'estimation ponctuelle de σ 2 et tα/2,n−1 est le fractile


de la loi de Student de degré de liberté n − 1 d'ordre 1 − α/2 i,e.

p Tn−1 < tα/2,n−1 = 1 − α/2




Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
2) Cas des grands échantillons (n ≥ 30)
La loi de X est supposée quelconque
(i) σ connu
 
σ σ
IC1−α (µ) = x n − zα/2 √ , x n + zα/2 √
n n

(ii) σ inconnu
 
s s
IC1−α (µ) = x n − zα/2 √ , x n + zα/2 √
n n

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
On donne les valeurs de zα/2 pour quelque valeurs de α

Valeur de α 0.01 0.05 0.1


α/2 0.005 0.025 0.05
zα/2 2.58 1.96 1.65

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Intervalle de conance de la proportion p

Soit X une variable aléatoire qui suit une loi de Bernoulli de


paramètre p qui est inconnu. Soit un échantillon X1 , . . . , Xn des
variables indépendantes et de même loi que X dont la taille n ≥ 30.
L'intervalle de conance à 1 − α est
" r r #
f (1 − f ) f (1 − f )
IC1−α (p) = f − zα/2 , f + zα/2
n n

où f est l'estimation ponctuelle de p.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Exercices
Exercice 1 :
Cent patients ont reçu un nouveau traitement contre la migraine. A
la n du traitement, le médecin leur a demandé s'ils avaient perçu
une amélioration de leur état migraineux.La proportion de réponses
favorables était de 57%. Quel est l'intervalle de conance au risque
de 5% du proportion des patients satisfaits par ce nouveau
traitement ?
Exercice 2 :
Soit X le poids du nouveau-né. On suppose que X suit une loi
normale. Un échantillon des nouveau-nés de taille 20 donne :
xi = 62 kg et xi2 = 202.2.
P P
1) donner l'estimation ponctuelle de la moyenne et l'écart-type de
la population.
2) donner l'intervalle de conance à 95% de la moyenne de la
population.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
III Détermination de la taille de l'échantillon

Le nombre n'est pas une garantie absolue de représentativité.


La détermination de la taille de l'échantillon dépend essentiellement
de deux facteurs :

1) la precision souhaitée : plus on souhaite des résultats


précis, plus l'échantillon nécessaire est important.

2) le budget disponible : plus on augmente la taille, plus


le coût de l'enquête s'accroit.

Pour déterminer la taille de l'échantillon, on utilisera soit l'inégalité


de Bienaymé Tchebyche soit la loi normale.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
1. Utilisation de l'inégalité de Bienaymé Tchebyche (I.B.T)
Cette inégalité n'est utilisée que si la loi de la variable aléatoire
étudiée est complètement inconnue. Cette méthode aboutit à des
échantillons de tailles élevés.

1.1 Taille d'échantillon pour estimer une moyenne.

La precision représente la largeur de l'intervalle de conance de la


moyenne.
I.B.T. dans le cas de la moyenne s'écrit :

σ2
p(| X n − µ |< ) ≥ 1 −
n2

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I n : taille de l'échantillon ;

I  : precision souhaitée ;

I X n : moyenne de l'échatillon ;

I µ : moyenne de la population ;

I σ : écart-type de la population, il est souvent inconnu. IL faut avoir


des informations antérieurs ou il faut l'estimer à partir d'un
échantillon auxiliaire.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
En pratique :
I On se xe la precision souhaitée  (une marge d'erreur) ;

I On se xe un seuil de conance 1 − α qui représente la probabilité


minimale pour que la moyenne calculée ne s'écarte pas de la
moyenne de la population de plus de , alors on a :

p(| X n − µ |< ) ≥ 1 − α

σ2
1− = 1 − α;
n2
σ2
n=
α2

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
1.2 Taille d'échantillon pour estimer une proportion.

Soit p la proportion inconnue, F son estimateur. on a d'après


I.B.T :
p(1 − p)
p(| F − p |< ) ≥ 1 −
n2

I n : taille de l'échantillon ;

I  : precision souhaitée ;

I F : estimateur de p calculé à partir de l'échatillon ;

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I p : proportion de la population ; elle est souvent inconnue. IL faut
avoir des informations antérieurs ou il faut l'estimer à partir d'un
échantillon auxiliaire ou on utilise une proportion de 50%.

p(1 − p)
1− = 1 − α,
n2
p(1 − p)
n=
α2

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
2. Utilisation de la loi normale
On applique cette méthode si la variable suit la loi normale ou si
elle peut être approchée une loi normale.
2.1 Taille d'échantillon pour estimer une moyenne

a) cas des prélèvements dans une population nie


avec remise ou dans une population de grande
taille sans remise
 
σ σ
IC1−α (µ) = x n − zα/2 √ , x n + zα/2 √
n n
donc la marge d'erreur  est telle que :  = zα/2 √n
σ

2 σ2
n = zα/2
2

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Si σ est inconnu , il faut le remplacer son estimation calculée à
partir d'un échantillon auxiliaire.
Remarque :
Si n ≥ 30 et n
N ≤ 5% on peut considérer ESAR ∼
= ESSR.
I ESAR : échantillon aléatoire simple avec remise ;

I ESSR : échantillon aléatoire simple sans remise.

b) cas des prélèvements dans une population nie


sans remise
N−n σ 2
dans ce cas on a : E (X n ) = µ et V (X n ) = N−1 n

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
un calcul assez long nous donne

2 σ2N
zα/2
n= 2 σ2
2 N + zα/2

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
2.2 Taille d'échantillon pour estimer une proportion

a) cas des prélèvements dans une population nie


avec remise ou dans une population de grande
taille sans remise
" r r #
f (1 − f ) f (1 − f )
IC1−α (p) = f − zα/2 , f + zα/2
n n
q
donc la marge d'erreur  est telle que :  = zα/2 f (1n−f )

2 f (1 − f )
n = zα/2
2

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
b) cas des prélèvements dans une population nie
sans remise
N−n p(1−p)
dans ce cas on a : E (F ) = p et V (F ) = N−1 n
un calcul assez long nous donne

2 p(1 − p)N
zα/ 2
n= 2 p(1 − p)
2 N + zα/2

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
III Quelques méthodes d'échantillonnages
Terminologie
• Population : ensemble des unités sur lesquelles porte l'étude
(notons N la taille de la population).
• Échantillon : sous-ensemble d'unités de population (notons n la
taille de l'échantillon).
• Sondage : toute forme d'échantillonnage qui permet de constituer
un échantillon à partir de la population.
• Taux de sondage : rapport entre la taille de l'échantillon et la taille
de la population.
• Estimation : résultat estimé à partir des données observées dans
l'échantillon qui représente la valeur vraie du phénomène dans la
population, avec un certain degré d'incertitude.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
On distingue deux types d'échantillonnages :

1) Échantillonnage probabiliste basé sur les probabilités


i.e chaque unité échantillonnée (sélectionnée) a une
probabilité non nulle de gurer dans l'échantillon.

2) Échantillonnage non probabiliste ou empirique non


basé sur les probabilités

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
3.1 Quelques méthodes d'échantillonnages probabilistes
a) Échantillon aléatoire simple EAS.
Un échantillon est aléatoire simple si tous les individus de la
population ont la même probabilité de gurer dans l'échantillon.
I Pour prélever un échantillon aléatoire simple dans une population
nie,il faut procéder les démarches suivantes :
1) constituer la base de sondage qui correspond à la liste
complète et sans répétition des éléments de la
population ;
2) numéroter ces éléments de 1 à N;
3) procéder à l'aide d'un générateur de nombres
aléatoires à la sélection des unités diérentes qui
constitueront l'échantillon.

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
3.1 Quelques méthodes d'échantillonnages probabilistes
b) Échantillonnage stratié.
On utilise ce type d'échantillonnage, lorsque la population est très
hétérogène, cette procédure permet d'améliorer la précision des
estimateurs retenus à partir d'un sondage aléatoire. La stratication
consiste à découper la population étudiée en groupes homogènes
(i.e variance interne est petite ; variance externe est grande) ,
appelés strates, et à tirer indépendamment un échantillon aléatoire
dans chaque strate.
I Avantages : Il est peu probable de choisir un échantillon absurde
puisqu'on s'assure de la présence proportionnelle de tous les divers
sous-groupes composant la population.
I Désavantages : La méthode suppose l'existence d'une liste de la
population. Il faut aussi connaître comment cette population se
répartit selon certaines strates.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Principe
I On divise la population en k strates Si , i = 1; . . . ; k;

I La taille de la strate Si est Ni avec ki=1 Ni = N;


P

I On choisit un échantillon aléatoire simple dans chaque strate Si de


taille ni avec ki=1 ni = n; où n est la taille de léchantillon global ;
P

On distingue deux méthodes pour calculer ni :


1) Répartition proportionnelle :

Soit ωi = Ni
N le poids de la strate Si par rapport au population. donc
n
ni = ωi ∗ n = ∗ Ni
N

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
2) Répartition optimale :

Cette deuxième méthode consiste à répartir l'eort


d'échantillonnage de façon inégale dans les diérentes strates. Elle
tient des facteurs suivants :

- Budget total de l'enquête G ;

- Poids de la strate Si , ωi ;

- Coût de la collecte de l'information dans la strate Si , Ci ;

- Dispersion à l'intérieur de la strate Si mesurée par l'écart type σi

Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
On choisit dans chaque strate ni individus tels que :
ni = k ∗ ω√i Cσi avec k = P ω Gσ √C
i i i i
c) Échantillonnage par grappe : Si la population est constituée
de plusieurs groupes hétérogène (i.e variance intra-groupe est
grande et variance inter-groupes est petite), on utilise dans ce cas
l'échantillonnage par grappe. Le sous-groupe de la population
dénit une grappe. Ce sont les grappes qui sont tirées au sort dans
la population et l'ensemble des sujets d'une grappe tirée au sort
sera enquêté.
I Avantages : il n'est pas nécessaire de disposer d'une base de
sondage des individus, une liste des grappes sut ce qui permet de
réduire les coûts de déplacement, de suivi et de supervision.
I Désavantages : le sondage est moins précis que le sondage aléatoire
simple et l'analyse doit prendre en compte l'eet grappe, ce qui est
plus complexe.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
d) Échantillonnage systématique :
Sondage systématique : est une méthode qui exige aussi l'existence
d'une liste de la population où chaque individu est numéroté de 1
jusqu'à N . L'entier voisin de N/n sera noté r et appelé raison de
sondage ou pas de sondage.
Pour constituer l'échantillon, on choisit au hasard un entier naturel
i entre 1 et r (cet entier sera le point de départ). L'individu dont le
numéro correspond à i est le premier individu, pour sélectionner les
autres, il sut d'ajouter à i la raison de sondage : les individus
choisis seront alors ceux dont les numéros correspondent à i + r ,
i + 2r , i + 3r ,...,i + (n − 1)r .
I Avantages : facile à sélectionner parce qu'un seul individu est choisi
au hasard, ainsi on peut obtenir une bonne précision parce que la
méthode permet de répartir l'échantillon dans l'ensemble de la liste.
I Désavantages : Les données peuvent être biaisées à cause de la
périodicité.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.

Vous aimerez peut-être aussi