Vous êtes sur la page 1sur 5

227

Estimation et chantillonnage

10

ESTIMATION ET ECHANTILLONNAGE
Rien

nest plus difficile rfuter que


ce qui est entirement faux.
Andr MAUROIS

MARCHE DAPPROCHE
1. GENERALITES
1. 1. Mthodologie
Pour tudier un caractre C dans une population P on dispose de deux mthodes :
La mthode exhaustive qui consiste recenser tous les individus de la population.
Cette mthode, en raison de son cot et de sa dure, est fort peu employe.
La mthode des sondages qui consiste ntudier quun chantillon E, extrait de la
population-mre, et induire, partir des rsultats observs sur cet chantillon des rsultats concernant la population entire. La difficult est dobtenir un chantillon reprsentatif de la population. Nous admettrons quen ralisant un tirage au sort, cette condition est ralise.
etc....

233

Estimation et chantillonnage

3. ETUDE DES FREQUENCES


Considrons une population P deffectif N, trs grand, dans laquelle nous nous proposons dtudier un caractre qualitatif C.
Dsignons par X la variable alatoire qui, tout lment de P associe la valeur 1 si cet
lment possde le caractre C et la valeur 0 sil ne le possde pas. Soit p la frquence
ou le pourcentage du caractre C dans la population.
1. 2. Constitution dun chantillon
Prlevons, dans la population P, un chantillon alatoire de taille n et dsignons par K la
variable alatoire qui, cet chantillon, associe le nombre des lments qui possdent le
caractre C et par F la variable alatoire qui, cet chantillon, associe la frquence f du
K
caractre C. Alors F = . On suppose n petit par rapport N donc K suit la loi binon
miale B(n, p).
3. 2. Distribution dchantillonnage des frquences
Soit lensemble de tous les chantillons de taille n, issus de la population. Les
frquences f1, f2,.... fi,...constituent une srie statistique appel distribution des
frquences.
Puisque K suit la loi binomiale B(n, p) nous savons que : E(K) = np et V(K) = npq o
1
np
1
npq pq
q = 1 p. alors E ( F ) = E ( K ) =
= p et V ( F ) = V ( K ) =
=
.
2
n
n
n
n2
n
Le thorme de la limite centre permet alors dnoncer le rsultat suivant, not (P6):
Si on prlve des chantillons alatoires deffectifs n, o n 30, dans une population
non ncessairement normale, dans laquelle la frquence du caractre tudi est p, la
distribution des frquences, note F, de ces chantillons suit approximativement la loi

F
GH

normale N p,

pq
n

I
JK

3. 3. Estimation ponctuelle
Le biais sur la frquence du caractre est lerreur commise quand on remplace la
frquence, p, du caractre dans la population par la frquence f du caractre observ sur
un chantillon. Cest la variable alatoire, note , dfinie par = p F
Alors, E() = p E(F). Or E(F) = p daprs (P6) donc E() = 0.
Par suite f est un estimateur sans biais de p.
3. 4. Intervalle de confiance
La variable alatoire F qui, chaque chantillon de taille n, associe la frquence f du

F
GH

caractre C dans cet chantillon, suit la loi normale N p,

I
JK

pq
.
n

234

Chapitre 10

Fp
suit la loi normale centre rduite.
pq
n
Si lon fixe un seuil de risque (donc un seuil de confiance 1 ), il existe un rel

Alors la variable alatoire T =

unique t (que lon dtermine laide de la table de la loi normale centre rduite) tel
pq
pq
que : p(< t) =1 do P F t
p F + t
= 1 .
n
n
Or, p est inconnu et intervient au niveau des bornes de son propre encadrement.

F
GH

etc...

I
JK

238

Chapitre 10

EN CORDE
2. ESTIMATION DUNE MOYENNE
etc...

3. ESTIMATION DUNE FREQUENCE


3. 1. Pommes, pom, pom, pom...
Lentreprise POMINGOLD, spcialise dans la commercialisation de pommes de
qualit, adresse lun de ses clients un envoi massif de fruits. Au pralable, un contrle
de qualit portant sur un chantillon de 1000 pommes a permis de dnombrer 80 fruits
dfectueux. On se propose de calculer, au seuil de confiance 95%, entre quelles limites
est compris le pourcentage de fruits dfectueux dans lenvoi.
1) Premire mthode
Soit respectivement p et f les frquences de fruits dfectueux dans lenvoi et dans
lchantillon (p est videmment inconnu). On sait que la variable alatoire F qui, tout
chantillon de taille n, associe la frquence de fruits dfectueux dans lchantillon suit la

F
GH

loi normale N p,

I
JK

p(1 p)
.
n

a) Dmontrer que, au risque 5%, on a f p 2

p(1 p)
n
2

b) En dduire que p vrifie linquation : (n + 4) p 2(nf + 2)p + n f 0.


c) Appliquer ce rsultat lchantillon ci-dessus et conclure.
2) Deuxime mthode.
Dans le cours nous avons vu quune estimation ponctuelle non biaise de p est f et nous
p(1 p)
avons crit que : f p 2
.
n 1
b) En dduire lintervalle de confiance 5%, obtenu en arrondissant les bornes 2
chiffres aprs la virgule.
c) Que peut-on en conclure quant lutilisation de f comme estimateur de p ?
! ! q Suivez le guide
1) Premire mthode
80
soit f = 0,08.
1000
La variable alatoire F qui, tout chantillon de taille 1000, associe la frquence de
a) Dans lchantillon le pourcentage de fruits dfectueux est f =

F
GH

fruits dfectueux dans lchantillon, suit la loi normale N p,

p(1 p)
n

I
JK

donc la

239

Estimation et chantillonnage
Fp
suit la loi normale centre rduite.
p(1 p)
n

variable T dfinie par T =

On sait que p(T 1,96) = 0,95, donc, au risque 5%, on a :


p(1 p)
p(1 p)
f p 1,96
, soit en majorant 1,96 par 2 : f p 2
n
n
b) En levant au carr les deux membres de lingalit prcdente il vient
2
2
(n + 4) p 2(n f + 2) p + n f 0.
c) Pour lchantillon initial on a f = 0,08 et n = 1000. Alors linquation prcdente
2
2
scrit : 1004 p 2(82) p + 6,4 0 ou encore 251 p 41 p + 1,6 0
Les valeurs approches au millime prs des solutions de lquation
2
251 p 41 p + 1,6 = 0 sont p 0,064 et p 0,099. Alors p [0,06; 0,10].
2) Deuxime mthode.
b) En utilisant le rsultat du cours, on a f p 2

LM
N

f (1 f )
. Alors lintervalle de
n 1

OP
Q

f (1 f )
f (1 f )
; f +2
.
n 1
n 1
Dans le cas de lchantillon initial, des valeurs approches des bornes, arrondies au millime le plus proche, sont 0,063 et 0,097... ce qui conduit I = [0,06; 0,10].
c) On obtient les mmes rsultats en utilisant les deux mthodes proposes. Il est clair
que la facilit dutilisation de la seconde mthode justifie son emploi systmatique.
confiance de p est :

I = f 2