Vous êtes sur la page 1sur 6

FORMULAIRE

C. Formulaire

1. Concepts de base : formalisation



Notation Expression (définition) math.

Population 𝑈 = 𝑢! , 𝑢! , … , 𝑢! = 1, 2, … , 𝑁

Taille de la population 𝑁

Individu/unité statistique 𝑢! ou 𝑖
n° 𝑖

Variable d’intérêt Y

Valeur de la variable 𝑦!
d’intérêt sur l’unité stat.
(l’individu) n° 𝑖

Total-population 𝜏 = 𝑦!
(total de la variable
!∈!
d’intérêt dans la
population)

Moyenne-population 1 𝜏
𝜇 = 𝑦! =
(moyenne de la variable 𝑁 𝑁
!∈!
d’intérêt dans la
population)

Proportion-population 𝜋
(proportion d’unités stat.
de la population chez qui
l’on observe une certaine
caractéristique)

1

FORMULAIRE


Echantillon 𝑆

Taille de l’échantillon 𝑛! ou 𝑛

Estimateur/Estimation du 𝜏
total-population

Estimateur/Estimation de 𝜇
la moyenne-population

Estimateur/Estimation de 𝜋
la proportion-population

Ensemble de tous les 𝕊
échantillons qu’il est
possible de sélectionner
avec la méthode choisie

Probabilité de sélection 𝑝 𝑆 Propriétés des probabilités de sélection :


(d’un échantillon)
• 𝑝 𝑆 > 0 pour tout 𝑆 ∈ 𝕊
• !∈𝕊 𝑝 𝑆 = 1

Probabilité d’inclusion 𝑝! Calcul d’une probabilité d’inclusion à partir du


(d’un individu) plan de sondage :

𝑝! = P 𝑖 ∈ 𝑆 = 𝑝 𝑆
! ∈𝕊 tel que !∈!

2

FORMULAIRE

2. Sondage aléatoire simple (PESR)


2.1 Tirage PESR de 𝒏 unités statistiques dans une population 𝑼 de taille 𝑵
a) Plan de sondage
• Ensemble 𝕊 des échantillons possibles :
𝕊 = ensemble des sous-ensembles S de la population 𝑈 constitués de 𝑛
individus distincts

• Taux de sondage :
𝑛
𝑓=
𝑁

• Nombre 𝑀 d’échantillons possibles :
𝑁!
𝑀 = 𝐶!! =
𝑛! 𝑁 − 𝑛 !
(nombre de combinaisons de 𝑛 éléments parmi 𝑁)

• Probabilités de sélection :
1
𝑝 𝑆 = pour tout 𝑆 ∈ 𝕊
𝑀

b) Probabilités d’inclusion
𝑛
𝑝! = 𝑓 = pour tout 𝑖 ∈ 𝑈
𝑁

3

FORMULAIRE

2.2 Estimation de la proportion 𝝅 d’individus de la population présentant une


certaine caractéristique
• Variable d’intérêt :
Y = variable indicatrice de la présence de la caractéristique chez un individu
'
𝑦! = 1 si l individu 𝑖 présente la caractéristique
0 sinon

• Proportion-population 𝜋 :
1 nombre d' individus de 𝑈 qui présentent la caractéristique
𝜋= 𝑦! =
𝑁 nombre total d' individus dans 𝑈
!∈!
= moyenne de Y dans la population 𝑈

• Estimateur (sans biais) de 𝜋 :
1 nombre d' individus de 𝑆 qui présentent la caractéristique
𝜋= 𝑦! =
𝑛 nombre total d' individus dans 𝑆
!∈!
= proportion d' individus de l' échantillon présentant la caractéristique
= moyenne de Y dans l'échantillon 𝑆

• Variance de l’estimateur de 𝜋 :
𝑁 − 𝑛 𝜋(1 − 𝜋)
V 𝜋 =
𝑁−1 𝑛
𝜋 1−𝜋
≅ 1−𝑓 si 𝑁 est grand
𝑛

• Variance estimée de l’estimateur de 𝜋 :
𝜋(1 − 𝜋)
V 𝜋 = 1−𝑓
𝑛−1

Facteurs de précision de l’estimateur de 𝜋 : (Explicitez en quelques mots ci-dessous
de quelle manière chaque facteur joue sur la variance, et donc sur la précision, de
l’estimateur de 𝜋)
• La taille 𝑛 de l’échantillon et le taux de sondage 𝑓 = 𝑛/𝑁 :
si 𝑛 ↗ 𝑁, donc que 𝑓 ↗ 1, alors V 𝜋 ↘ 0 et donc la précision de 𝜋 ↗.
• La valeur exacte de la proportion 𝜋 dans la population :
plus 𝜋 a une valeur proche de 0 ou de 1, plus V 𝜋 est faible et plus 𝜋 est
précis ;
à 𝑛 fixé, V 𝜋 atteint sa valeur maximale (et donc 𝜋 est le moins précis)
lorsque 𝜋 = 0,5.

4

FORMULAIRE

2.3 Estimation de la moyenne 𝝁 de la variable d’intérêt quantitative Y dans la


population
• Moyenne-population 𝜇 :
1 𝜏
𝜇= 𝑦! =
𝑁 𝑁
!∈!

• Variance (classique)-population 𝜎 ! :
1
𝜎! = 𝑦! − 𝜇 !
𝑁
!∈!

!
• Variance corrigée-population 𝜎corr :
!
1 𝑁
𝜎corr = 𝑦! − 𝜇 ! = 𝜎!
𝑁−1 𝑁−1
!∈!

• Estimateur (sans biais) de 𝜇 :
1
𝜇=𝑦= 𝑦! = moyenne de Y dans l'échantillon 𝑆
𝑛
!∈!

!
• Estimateur (sans biais) de 𝜎!"## :
! !
1 !
𝜎corr = 𝑠corr = 𝑦! − 𝑦
𝑛−1
!∈!
= 𝑣ariance corrigée de Y dans l' échantillon 𝑆

• Variance de l’estimateur de 𝜇 :
!
𝜎corr
V 𝜇 = 1−𝑓
𝑛

• Variance estimée de l’estimateur de 𝜇 :
!
𝑠corr
V 𝜇 = 1−𝑓
𝑛

2.4 Estimation du total 𝝉 de la variable d’intérêt quantitative Y dans la population


• Total-population 𝜏 :
𝜏= 𝑦! = 𝑁𝜇
!∈!

• Estimateur (sans biais) de 𝜏 :
𝜏 = 𝑁𝜇 = 𝑁𝑦

• Variance de l’estimateur de 𝜏 :
!
!
𝜎corr !
V 𝜏 =𝑁 V 𝜇 =𝑁 1−𝑓
𝑛

5

FORMULAIRE


• Variance estimée de l’estimateur de 𝜏 :
!
! !
𝑠corr
V 𝜏 =𝑁 V 𝜇 =𝑁 1−𝑓
𝑛

Facteurs de précision de l’estimateur de 𝜇 (et de l’estimateur de 𝜏) : (Explicitez en
quelques mots ci-dessous de quelle manière chaque facteur joue sur la variance, et
donc sur la précision, de l’estimateur de 𝜇)
• La taille 𝑛 de l’échantillon et le taux de sondage 𝑓 = 𝑛/𝑁 :
si 𝑛 ↗ 𝑁, donc que 𝑓 ↗ 1, alors V 𝜇 ↘ 0 et donc la précision de 𝜇 ↗.
!
• La variance corrigée 𝜎corr de Y dans la population :
!
§ plus 𝜎corr est petite (plus la population est homogène, c’est-à-dire
plus la dispersion des valeurs de Y dans la population est faible),
plus V 𝜇 est petite, plus la précision de 𝜇 est grande ;
!
§ plus 𝜎corr est grande (plus la population est hétérogène, c’est-à-dire
plus la dispersion des valeurs de Y dans la population est grande),
plus V 𝜇 est élevée, plus la précision de 𝜇 est faible.