Estimation 22

1
Cours de Probabilité et Statistique pour la

deuxième année des conseillers en planication et
en orientation
C.O.P.E.
CHIKHI EL MOKHTAR
1er décembre 2020
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
•
Deuxième partie : Statistique Inférentielle
Chapitre 3 : Estimation et Échantillonnage
Introduction
I L'estimation et l'échantillonnage forment avec les tests

d'hypothèses, la partie dite statistique inférentielle.
Introduction
I C'est quoi l'estimation ? et c'est quoi l'échantillonnage ?
Introduction
I L'estimation est une opération qui permet d'induire, à partir

des résultats observés sur un échantillon, des informations sur
la population totale.
Introduction
I L'échantillonnage est une opération qui consiste, à partir

d'informations relatives à la loi d'une variable X pour une
population donnée, on en déduit le comportement
d'échantillons aléatoires relatifs à cette variable.
Population à caractère quantitatif Echantillon de taille n
μ : la moyenne de la population ̅ : la moyenne de l’échantillon
σ : l’écart type de la population : l’écart type de l’échantillon
Echantillonnage
cv Echantillon aléatoire
Estimation
I Estimation ponctuelle
Soit X une variable aléatoire étudiée sur une population dont la loi
de probabilité dépend d'un (ou plusieurs) paramètre θ inconnu
(paramètre d'intérêt).
θ peut-être égal :
I µ la moyenne de la population à caractère quantitatif ;
I σ l'écart-type de la population à caractère quantitatif ;
I p la proportion d'un caractère dans la population à caractère

qualitatif ;
Objectif de l'estimation ponctuelle
L'objectif de l'estimation ponctuelle est de chercher à donner une

valeur approchée du paramètre d'intérêt θ à partir des résultats
obtenus sur un échantillon aléatoire extrait de la population.
Dénition : Estimateur et estimation
Soit X une variable aléatoire dont la loi de probabilité dépend d'un
paramètre θ inconnu, (X1 , . . . , Xn ) est un échantillon aléatoire
d'eectif n de même loi que X. L'estimateur de θ noté Θ b n est la
statistique dénie par :
b n = hn (X 1, . . . , Xn)
Θ
où hn est une fonction dénie sur Rn
Estimation
Une fois l'échantillon est prélevé, nous disposons de n valeurs

observées x1 , . . . , xn , ce qui nous fournit une valeur hn (x1 , . . . , xn )
qui est une réalisation de Θ b n qui est notée θbn et que nous appelons
estimation de θ.
Remarque 1
• À priori l'estimateur Θ
b n est à valeurs dans un ensemble Θ,
contenant l'ensemble des valeurs possibles du paramètre θ.
b n est une v.a. de loi de probabilité qui dépend du paramètre
• Θ
θ.
b n peut être univarié ou multivarié.
• Θ
Remarque 2
• Nous distinguons la variable aléatoire Θ
b n de sa valeur
observée, notée θn .
b
• Nous utiliserons les notations suivantes :
(i) (X1 , . . . , Xn ) désigne l'échantillon aléatoire de
taille n et les n observations ne sont pas encore à
disposition.
(ii) (x1 , . . . , xn ) désigne une réalisation de
l'échantillon aléatoire et les n observations sont à
disposition
• Il faut systématiquement se demander : suis-je entrain de
manipuler une variable aléatoire ou l'une de ses réalisations ?

• D'après la dénition d'un estimateur d'un paramètre θ qui est :
b n = hn (X 1, . . . , Xn)
Θ
Il existe plusieurs fonctions hn , donc il existe plusieurs estimateurs

du même paramètre θ.
Exemple :
b n = hn (X 1, . . . , Xn) = X1 est un estimateur de θ.
I Θ
b n = hn (X 1, . . . , Xn)
Θ

Exemple :
b n = hn (X 1, . . . , Xn) = X1 + X2 .X3 est un estimateur de θ.

I Θ
b n = hn (X 1, . . . , Xn)
Θ

Exemple :
b n = hn (X 1, . . . , Xn) = X1 + X2 + ... + Xn est un estimateur

I Θ
de θ.
Propriétés d'un estimateur
Il existe plusieurs estimateur d'un même paramètre θ. Un

estimateur est ecace s'il vérie les propriétés suivantes :
I Bias d'un estimateur
Le biais de Θb n se dénit par b(n, θ) = E (Θ
b n) − θ

I Estimateur sans biais

b n est un estimateur sans biais (ou non biaisé) du paramètre θ
Θ
si b(n, θ) = 0 c'est-à-dire si E (Θ
b n) = θ

I Estimateur asymptotiquement sans biais

Un estimateur Θ
b n est asymptotiquement sans biais pour θ si
lim E (Θ
b n) = θ
n→+∞
• Écart quadratique moyen
Si Θ
b n est un estimateur de θ, nous mesurons la précision de
b n par l'écart quadratique moyen, noté EQM :
Θ

b n − θ)2 = V (Θ

EQM (Θ b n ) = E (Θ b n ) + b(n, θ)2
Remarque
(i) Si Θ
b n est un estimateur sans biais, c'est-à-dire si
b(n, θ) = 0, alors :EQM (Θ b n ) = V (Θ
b n );
(ii) Entre deux estimateurs de θ, nous choisissons
celui dont l'écart quadratique moyen ou le risque
est le plus faible.
• Estimateur relativement plus ecace
Un estimateur Θb 1 est relativement plus ecace qu'un
n
b 2 s'il est plus précis que le second, c'est-à-dire si :
estimateur Θ n

b1

EQM Θ ≤ EQM Θ b2
n n
• Estimateur sans biais optimal

Nous appelons estimateur sans biais optimal parmi les
estimateurs sans biais, un estimateur Θ
b n préférable à tout
autre au sens de la variance (variance minimale) c'est-à-dire
l'estimateur le plus ecace parmi tous les estimateurs sans
biais.
• Estimateur convergent
Un estimateur Θ b n est un estimateur convergent s'il converge
en probabilité vers θ quand n tend vers l'inni.
i.e.
lim p(| Θb n − θ |< ) = 1 ∀ > 0
n→+∞
• Si un estimateur est sans biais et que sa variance tend vers zéro

quand n tend vers l'inni, alors cet estimateur est convergent.
En général pour déterminer un estimateur d'un paramètre θ , on
utilise soit :
(i) La méthode des moments ;
(ii) La méthode du maximum de vraisemblance ;
(iii) La méthode bayésienne.
I.1 Estimation ponctuelle de la moyenne µ et de l'écart-type
σ de la population
Soit X une variable aléatoire étudiée sur une population de moyenne
µ et de variance σ 2 . X1 , . . . , Xn un n− échantillon aléatoire tiré de
la population de même loi que X . et x1 , . . . , xn sa réalisation.
• µ inconnue (paramètre d'intérêt)
•• Estimateur de la moyenne µ de la population
(i) L'estimateur de µ est X n qu'est égal à :
n
1X
Xn = Xi
n
i=1
(ii) L'estimation de µ est la réalisation de X n :

n
1X
xn = xi
n
i=1
• σ inconnu (paramètre d'intérêt)
•• Estimateur de l'écart-type σ de la population
• • • Cas où µ est connue
(i) l'estimateur de σ 2 est :
n
1X
Sn2 = (Xi − µ)2
n
i=1
• • • Cas où µ est inconnue

(i) l'estimateur de σ 2 est :
n
1 X
Sn2 = (Xi − X n )2
n−1
i=1
Exemple :
Lors d'un contrôle d'une chaîne de médicaments, on s'intéresse au
nombre de comprimés défectueux dans un lot. L'étude de 200 lots a
donné les résultats suivants :
nombre de comprimés défectueux par lot xi 0 1 2 3 4 5

nombre de lots ni 75 53 39 23 9 1
1) Calculer la moyenne x 200 et l'écart type se de cet échantillon ;

2) déduire l'estimation ponctuelle de la moyenne µ et de l'écart
type σ du nombre de comprimés défectueux sur l'ensemble de
la production.
Réponse :
I Calcul de la moyenne x 200 de l'échantillon :
1 241
x 200 = {0∗75+1∗53+2∗39+3∗23+4∗9+5∗1} = = 1.205
200 200
Réponse :
I Calcul de l'écart type se de l'échantillon : on a :

6
2 1 X
se = ni xi2 − x 2200
200
i=1
avec
6
ni xi2 = 02 ∗ 75 + 12 ∗ 53 + 32 ∗ 23 + 42 ∗ 9 + 52 ∗ 1 = 585
X
i=1
alors
585
q
2
se = − 1.2052 = 1, 473 ⇒ se = se2 = 1.214
200
I L'estimation ponctuelle de la moyenne µ est la moyenne x 200
b = x 200 = 1.205
de l'échantillon,i.e µ
I L'estimation ponctuelle de l'écart type σ est s t.q.
6
1 200
s2 = ni xi2 − x 2 = 1.48
X
200 − 1 200 − 1 200
i=1
√
alors s = s 2 = 1.217 et σ
b = 1.217
I Remarque,on a :
n 2
s2 = s
n−1 e
I.2 Estimation ponctuelle de la proportion p inconnue d'un
caractère dans une population
Soit p la proportion d'un caractère A dans une population. Soient

X1 , . . . , Xn un n-échantillon aléatoire tel que,Xi = 1 si la i eme unité
ait le caractère A et Xi = 0 sinon, alors l'estimateur de p est
n
1X
F = Xi
n
i=1
Estimation par intervalle de conance
L'estimation ponctuelle d'un parmètre θ dépend de l'échantillon

choisi. Les paramètres estimés de la population ne sont pas exacts,
on voudrait connaitre leur degré de précision.
Pour cela, on aime avoir les résultats sous forme d'intervalle dont
lequel doit se trouver le vrai parmtre que l'on cherche à estimer
avec une probabilité.
Objectif : L'estimation par intervalle de conance consiste à
donner autour de la valeur estimée un intervalle dont on a de forte
chance qu'il contient la vraie valeur du paramètre recherché.
Dénition
On appelle intervalle de conance à (1 − α) (ou on dit aussi

intervalle de conance à risque α) d'un paramètre θ, l'intervalle
[a; b] dont lequel ce paramètre a une probabilité (1 − α) de se
trouver.
i.e.
p (θ ∈ [a; b]) = 1 − α.
On prend souvent α = 1%, 5%, ou 10%.
Remarque
• si la loi de probabilité de la variable aléatoire X étudiée est

symétrique on prend
h i
[a; b] = θb − ; θb +
• si la loi n'est pas symétrique, on préféra de ne pas centrer

l'intervalle autour de la valeur estimée mais center la
probabilité i.e. chercher a et b tels que :
p (θ < a) = p (θ > b) = α/2
Intervalle de conance pour la moyenne µ
Soit X une variable aléatoire de moyenne µ inconnue et
d'écart-type σ. X1 , . . . , Xn un échantillon indépendants et de même
loi que X . x n est l'estimation ponctuelle de µ
1) Cas des petits échantillons (n < 30)
on suppose que X suit une loi normale
(i) Cas où σ est connu
L'intervalle de conance de µ à 1 − α est :

σ σ
IC1−α (µ) = x n − zα/2 √ , x n + zα/2 √
n n
avec n est la taille de l'échantillon et zα/2 est le fractile de la
loi N (0, 1) tel que :
p Z < zα/2 = 1 − α/2

(ii) Cas où σ est inconnu
L'intervalle de conance de µ à 1 − α est :

s s
IC1−α (µ) = x n − tα/2,n−1 √ , x n + tα/2,n−1 √
n n
avec s 2 est l'estimation ponctuelle de σ 2 et tα/2,n−1 est le fractile

de la loi de Student de degré de liberté n − 1 d'ordre 1 − α/2 i,e.
p Tn−1 < tα/2,n−1 = 1 − α/2

2) Cas des grands échantillons (n ≥ 30)
La loi de X est supposée quelconque
(i) σ connu

σ σ
IC1−α (µ) = x n − zα/2 √ , x n + zα/2 √
n n
(ii) σ inconnu

s s
IC1−α (µ) = x n − zα/2 √ , x n + zα/2 √
n n
On donne les valeurs de zα/2 pour quelque valeurs de α
Valeur de α 0.01 0.05 0.1

α/2 0.005 0.025 0.05
zα/2 2.58 1.96 1.65
Intervalle de conance de la proportion p
Soit X une variable aléatoire qui suit une loi de Bernoulli de

paramètre p qui est inconnu. Soit un échantillon X1 , . . . , Xn des
variables indépendantes et de même loi que X dont la taille n ≥ 30.
L'intervalle de conance à 1 − α est
" r r #
f (1 − f ) f (1 − f )
IC1−α (p) = f − zα/2 , f + zα/2
n n
où f est l'estimation ponctuelle de p.
Exercices
Exercice 1 :
Cent patients ont reçu un nouveau traitement contre la migraine. A
la n du traitement, le médecin leur a demandé s'ils avaient perçu
une amélioration de leur état migraineux.La proportion de réponses
favorables était de 57%. Quel est l'intervalle de conance au risque
de 5% du proportion des patients satisfaits par ce nouveau
traitement ?
Exercice 2 :
Soit X le poids du nouveau-né. On suppose que X suit une loi
normale. Un échantillon des nouveau-nés de taille 20 donne :
xi = 62 kg et xi2 = 202.2.
P P
1) donner l'estimation ponctuelle de la moyenne et l'écart-type de
la population.
2) donner l'intervalle de conance à 95% de la moyenne de la
population.
III Détermination de la taille de l'échantillon
Le nombre n'est pas une garantie absolue de représentativité.

La détermination de la taille de l'échantillon dépend essentiellement
de deux facteurs :
1) la precision souhaitée : plus on souhaite des résultats

précis, plus l'échantillon nécessaire est important.
2) le budget disponible : plus on augmente la taille, plus

le coût de l'enquête s'accroit.
Pour déterminer la taille de l'échantillon, on utilisera soit l'inégalité

de Bienaymé Tchebyche soit la loi normale.
1. Utilisation de l'inégalité de Bienaymé Tchebyche (I.B.T)
Cette inégalité n'est utilisée que si la loi de la variable aléatoire
étudiée est complètement inconnue. Cette méthode aboutit à des
échantillons de tailles élevés.
1.1 Taille d'échantillon pour estimer une moyenne.
La precision représente la largeur de l'intervalle de conance de la

moyenne.
I.B.T. dans le cas de la moyenne s'écrit :
σ2
p(| X n − µ |< ) ≥ 1 −
n2
I n : taille de l'échantillon ;
I : precision souhaitée ;
I X n : moyenne de l'échatillon ;
I µ : moyenne de la population ;
I σ : écart-type de la population, il est souvent inconnu. IL faut avoir

des informations antérieurs ou il faut l'estimer à partir d'un
échantillon auxiliaire.
En pratique :
I On se xe la precision souhaitée (une marge d'erreur) ;
I On se xe un seuil de conance 1 − α qui représente la probabilité

minimale pour que la moyenne calculée ne s'écarte pas de la
moyenne de la population de plus de , alors on a :
p(| X n − µ |< ) ≥ 1 − α
σ2
1− = 1 − α;
n2
σ2
n=
α2
1.2 Taille d'échantillon pour estimer une proportion.
Soit p la proportion inconnue, F son estimateur. on a d'après

I.B.T :
p(1 − p)
p(| F − p |< ) ≥ 1 −
n2
I n : taille de l'échantillon ;
I : precision souhaitée ;
I F : estimateur de p calculé à partir de l'échatillon ;
I p : proportion de la population ; elle est souvent inconnue. IL faut
avoir des informations antérieurs ou il faut l'estimer à partir d'un
échantillon auxiliaire ou on utilise une proportion de 50%.
p(1 − p)
1− = 1 − α,
n2
p(1 − p)
n=
α2
2. Utilisation de la loi normale
On applique cette méthode si la variable suit la loi normale ou si
elle peut être approchée une loi normale.
2.1 Taille d'échantillon pour estimer une moyenne
a) cas des prélèvements dans une population nie

avec remise ou dans une population de grande
taille sans remise

σ σ
IC1−α (µ) = x n − zα/2 √ , x n + zα/2 √
n n
donc la marge d'erreur est telle que : = zα/2 √n
σ
2 σ2
n = zα/2
2
Si σ est inconnu , il faut le remplacer son estimation calculée à
partir d'un échantillon auxiliaire.
Remarque :
Si n ≥ 30 et n
N ≤ 5% on peut considérer ESAR ∼
= ESSR.
I ESAR : échantillon aléatoire simple avec remise ;
I ESSR : échantillon aléatoire simple sans remise.
b) cas des prélèvements dans une population nie

sans remise
N−n σ 2
dans ce cas on a : E (X n ) = µ et V (X n ) = N−1 n
un calcul assez long nous donne
2 σ2N
zα/2
n= 2 σ2
2 N + zα/2
2.2 Taille d'échantillon pour estimer une proportion
a) cas des prélèvements dans une population nie

avec remise ou dans une population de grande
taille sans remise
" r r #
f (1 − f ) f (1 − f )
IC1−α (p) = f − zα/2 , f + zα/2
n n
q
donc la marge d'erreur est telle que : = zα/2 f (1n−f )
2 f (1 − f )
n = zα/2
2
b) cas des prélèvements dans une population nie
sans remise
N−n p(1−p)
dans ce cas on a : E (F ) = p et V (F ) = N−1 n
un calcul assez long nous donne
2 p(1 − p)N
zα/ 2
n= 2 p(1 − p)
2 N + zα/2
III Quelques méthodes d'échantillonnages
Terminologie
• Population : ensemble des unités sur lesquelles porte l'étude
(notons N la taille de la population).
• Échantillon : sous-ensemble d'unités de population (notons n la
taille de l'échantillon).
• Sondage : toute forme d'échantillonnage qui permet de constituer
un échantillon à partir de la population.
• Taux de sondage : rapport entre la taille de l'échantillon et la taille
de la population.
• Estimation : résultat estimé à partir des données observées dans
l'échantillon qui représente la valeur vraie du phénomène dans la
population, avec un certain degré d'incertitude.
On distingue deux types d'échantillonnages :
1) Échantillonnage probabiliste basé sur les probabilités

i.e chaque unité échantillonnée (sélectionnée) a une
probabilité non nulle de gurer dans l'échantillon.
2) Échantillonnage non probabiliste ou empirique non

basé sur les probabilités
3.1 Quelques méthodes d'échantillonnages probabilistes
a) Échantillon aléatoire simple EAS.
Un échantillon est aléatoire simple si tous les individus de la
population ont la même probabilité de gurer dans l'échantillon.
I Pour prélever un échantillon aléatoire simple dans une population
nie,il faut procéder les démarches suivantes :
1) constituer la base de sondage qui correspond à la liste
complète et sans répétition des éléments de la
population ;
2) numéroter ces éléments de 1 à N;
3) procéder à l'aide d'un générateur de nombres
aléatoires à la sélection des unités diérentes qui
constitueront l'échantillon.
3.1 Quelques méthodes d'échantillonnages probabilistes
b) Échantillonnage stratié.
On utilise ce type d'échantillonnage, lorsque la population est très
hétérogène, cette procédure permet d'améliorer la précision des
estimateurs retenus à partir d'un sondage aléatoire. La stratication
consiste à découper la population étudiée en groupes homogènes
(i.e variance interne est petite ; variance externe est grande) ,
appelés strates, et à tirer indépendamment un échantillon aléatoire
dans chaque strate.
I Avantages : Il est peu probable de choisir un échantillon absurde
puisqu'on s'assure de la présence proportionnelle de tous les divers
sous-groupes composant la population.
I Désavantages : La méthode suppose l'existence d'une liste de la
population. Il faut aussi connaître comment cette population se
répartit selon certaines strates.
Principe
I On divise la population en k strates Si , i = 1; . . . ; k;
I La taille de la strate Si est Ni avec ki=1 Ni = N;

P
I On choisit un échantillon aléatoire simple dans chaque strate Si de

taille ni avec ki=1 ni = n; où n est la taille de léchantillon global ;
P
On distingue deux méthodes pour calculer ni :

1) Répartition proportionnelle :
Soit ωi = Ni
N le poids de la strate Si par rapport au population. donc
n
ni = ωi ∗ n = ∗ Ni
N
2) Répartition optimale :
Cette deuxième méthode consiste à répartir l'eort

d'échantillonnage de façon inégale dans les diérentes strates. Elle
tient des facteurs suivants :
- Budget total de l'enquête G ;
- Poids de la strate Si , ωi ;
- Coût de la collecte de l'information dans la strate Si , Ci ;
- Dispersion à l'intérieur de la strate Si mesurée par l'écart type σi
On choisit dans chaque strate ni individus tels que :
ni = k ∗ ω√i Cσi avec k = P ω Gσ √C
i i i i
c) Échantillonnage par grappe : Si la population est constituée
de plusieurs groupes hétérogène (i.e variance intra-groupe est
grande et variance inter-groupes est petite), on utilise dans ce cas
l'échantillonnage par grappe. Le sous-groupe de la population
dénit une grappe. Ce sont les grappes qui sont tirées au sort dans
la population et l'ensemble des sujets d'une grappe tirée au sort
sera enquêté.
I Avantages : il n'est pas nécessaire de disposer d'une base de
sondage des individus, une liste des grappes sut ce qui permet de
réduire les coûts de déplacement, de suivi et de supervision.
I Désavantages : le sondage est moins précis que le sondage aléatoire
simple et l'analyse doit prendre en compte l'eet grappe, ce qui est
plus complexe.
d) Échantillonnage systématique :
Sondage systématique : est une méthode qui exige aussi l'existence
d'une liste de la population où chaque individu est numéroté de 1
jusqu'à N . L'entier voisin de N/n sera noté r et appelé raison de
sondage ou pas de sondage.
Pour constituer l'échantillon, on choisit au hasard un entier naturel
i entre 1 et r (cet entier sera le point de départ). L'individu dont le
numéro correspond à i est le premier individu, pour sélectionner les
autres, il sut d'ajouter à i la raison de sondage : les individus
choisis seront alors ceux dont les numéros correspondent à i + r ,
i + 2r , i + 3r ,...,i + (n − 1)r .
I Avantages : facile à sélectionner parce qu'un seul individu est choisi
au hasard, ainsi on peut obtenir une bonne précision parce que la
méthode permet de répartir l'échantillon dans l'ensemble de la liste.
I Désavantages : Les données peuvent être biaisées à cause de la
périodicité.

Estimation 22

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Estimation 22

Transféré par

Droits d'auteur :

Formats disponibles

1

Cours de Probabilité et Statistique pour la

1er décembre 2020

Deuxième partie : Statistique Inférentielle

I L'estimation et l'échantillonnage forment avec les tests

I C'est quoi l'estimation ? et c'est quoi l'échantillonnage ?

I L'estimation est une opération qui permet d'induire, à partir

I L'échantillonnage est une opération qui consiste, à partir

I σ l'écart-type de la population à caractère quantitatif ;

I p la proportion d'un caractère dans la population à caractère

L'objectif de l'estimation ponctuelle est de chercher à donner une

où hn est une fonction dénie sur Rn

Une fois l'échantillon est prélevé, nous disposons de n valeurs

Il existe plusieurs fonctions hn , donc il existe plusieurs estimateurs

Il existe plusieurs fonctions hn , donc il existe plusieurs estimateurs

b n = hn (X 1, . . . , Xn) = X1 + X2 .X3 est un estimateur de θ.

Il existe plusieurs fonctions hn , donc il existe plusieurs estimateurs

b n = hn (X 1, . . . , Xn) = X1 + X2 + ... + Xn est un estimateur

Il existe plusieurs estimateur d'un même paramètre θ. Un

Il existe plusieurs estimateur d'un même paramètre θ. Un

I Estimateur sans biais

Il existe plusieurs estimateur d'un même paramètre θ. Un

I Estimateur asymptotiquement sans biais

• Estimateur sans biais optimal

• Si un estimateur est sans biais et que sa variance tend vers zéro

(ii) L'estimation de µ est la réalisation de X n :

• • • Cas où µ est inconnue

nombre de comprimés défectueux par lot xi 0 1 2 3 4 5

1) Calculer la moyenne x 200 et l'écart type se de cet échantillon ;

I Calcul de l'écart type se de l'échantillon : on a :

Soit p la proportion d'un caractère A dans une population. Soient

L'estimation ponctuelle d'un parmètre θ dépend de l'échantillon

On appelle intervalle de conance à (1 − α) (ou on dit aussi

• si la loi de probabilité de la variable aléatoire X étudiée est

• si la loi n'est pas symétrique, on préféra de ne pas centrer

p (θ < a) = p (θ > b) = α/2

avec s 2 est l'estimation ponctuelle de σ 2 et tα/2,n−1 est le fractile

p Tn−1 < tα/2,n−1 = 1 − α/2

Valeur de α 0.01 0.05 0.1

Soit X une variable aléatoire qui suit une loi de Bernoulli de

où f est l'estimation ponctuelle de p.

Le nombre n'est pas une garantie absolue de représentativité.

1) la precision souhaitée : plus on souhaite des résultats

2) le budget disponible : plus on augmente la taille, plus

Pour déterminer la taille de l'échantillon, on utilisera soit l'inégalité

1.1 Taille d'échantillon pour estimer une moyenne.

La precision représente la largeur de l'intervalle de conance de la

I σ : écart-type de la population, il est souvent inconnu. IL faut avoir

I On se xe un seuil de conance 1 − α qui représente la probabilité

Soit p la proportion inconnue, F son estimateur. on a d'après

I F : estimateur de p calculé à partir de l'échatillon ;

a) cas des prélèvements dans une population nie

I ESSR : échantillon aléatoire simple sans remise.

b) cas des prélèvements dans une population nie

a) cas des prélèvements dans une population nie

1) Échantillonnage probabiliste basé sur les probabilités

2) Échantillonnage non probabiliste ou empirique non

I La taille de la strate Si est Ni avec ki=1 Ni = N;

I On choisit un échantillon aléatoire simple dans chaque strate Si de

On distingue deux méthodes pour calculer ni :

Cette deuxième méthode consiste à répartir l'eort

- Budget total de l'enquête G ;

- Coût de la collecte de l'information dans la strate Si , Ci ;

où hn est une fonction dénie sur Rn

On appelle intervalle de conance à (1 − α) (ou on dit aussi

La precision représente la largeur de l'intervalle de conance de la

I On se xe un seuil de conance 1 − α qui représente la probabilité

a) cas des prélèvements dans une population nie

b) cas des prélèvements dans une population nie

a) cas des prélèvements dans une population nie

Cette deuxième méthode consiste à répartir l'eort