Vous êtes sur la page 1sur 2

Echantillonnage et estimation

Dans cette che,


X
n
dsigne une variable alatoire suivant une loi binomiale B(n, p) o n N

et p ]0, 1[.
F
n
=
X
n
n
est la variable alatoire frquence associe X
n
.
Z
n
=
X
n
np
_
np(1 p)
est la variable centre et rduite associe la variable X
n
.
I. Rappels.
1) Thorme de Moivre-Laplace. Pour tous rels a et b tels que a < b
lim
n+
P(a Z
n
b) =

b
a
1

2
e

t
2
2
dt.
ou aussi
lim
n+
P
_
p + a
_
p(1 p)

n
F
n
p + b
_
p(1 p)

n
_
=

b
a
1

2
e

t
2
2
dt.
2) Intervalle associ une probabilit pour N (0, 1)
Thorme. Soit X une variable alatoire rgie par la loi normale centre rduite N (0, 1).
Pour tout rel ]0, 1[, il existe un rel strictement positif u

et un seul tel que P(u

X u

) = 1 .
On doit connatre en particulier u
0,05
= 1, 96 et u
0,01
= 2, 58 10
2
prs par dfaut.
3) Consquences. Si on combine les rsultats prcdents, on obtient le rsultat suivant :
Pour tout entier naturel non nul n, on considre une variable alatoire X
n
qui suit une loi binomiale B(n, p) puis
on considre la variable alatoire frquence F
n
=
X
n
n
. Alors :
lim
n+
P
_
p u

_
p(1 p)

n
F
n
p + u

_
p(1 p)

n
_
= 1 ,
et en particulier,
lim
n+
P
_
p 1, 96
_
p(1 p)

n
F
n
p + 1, 96
_
p(1 p)

n
_
0, 95.
II. Intervalle de uctuation. Echantillonnage
Dans ce paragraphe, on tudie un caractre C dune population et on suppose que ce caractre apparat dans la population
avec une probabilit p. On extrait un chantillon et on veut avoir une ide de la frquence f dapparition du caractre
dans lchantillon. La variable alatoire qui un chantillon de taille n associe la frquence f dapparition du caractre C
dans lchantillon est la variable F
n
.
Situation o on utilise un intervalle de uctuation :
Quand on connait la probabilit p (ou quand on fait une hypothse sur la valeur de p)
et que lon veut estimer la frquence f.
A - Intervalle de uctuation
1) Lintervalle de la classe de terminale.
Lintervalle I
n
=
_
p u

_
p(1 p)

n
, p + u

_
p(1 p)

n
_
est appel intervalle de uctuation asymptotique
au seuil 1 :
lim
n+
P (F
n
I
n
) = lim
n+
P
_
p u

_
p(1 p)

n
F
n
p + u

_
p(1 p)

n
_
= 1 .
c Jean-Louis Rouget, 2012. Tous droits rservs. 1 http ://www.maths-france.fr
En particulier, lintervalle J
n
=
_
p 1, 96
_
p(1 p)

n
, p + 1, 96
_
p(1 p)

n
_
est un intervalle de uctuation
asymptotique au seuil 0, 95 :
lim
n+
P (F
n
J
n
) = lim
n+
P
_
p 1, 96
_
p(1 p)

n
F
n
p + 1, 96
_
p(1 p)

n
_
0, 95.
Consquence. Pour n grand, la probabilit de lvnement p 1, 96
_
p(1 p)

n
F
n
p +1, 96
_
p(1 p)

n
vaut
envirion 0, 95. Dans la pratique, on fait cette approximation quand n 30, np 5, n(1 p) 5 : sous ces conditions,
la frquence f a environ 95% de chances (mais pas au moins 95% de chances) dtre dans lintervalle J
n
.
Thorme. Pour tout p ]0, 1[, il existe n
0
N

tel que
pour tout n n
0
, P
_
p 1, 96
_
p(1 p)

n
F
n
p + 1, 96
_
p(1 p)

n
_
0, 95.
2) Lintervalle de la classe de seconde.
Thorme. Pour tout rel p ]0, 1[ et tout entier naturel non nul n, intervalle
_
p
1

n
, p +
1

n
_
contient lintervalle
_
p 1, 96
_
p(1 p)

n
F
n
p + 1, 96
_
p(1 p)

n
_
.
Thorme. Pour tout p ]0, 1[, il existe n
0
N

tel que pour tout n n


0
, P
_
p
1

n
F
n
p +
1

n
_
0, 95.
Thorme. Pour tout n 30, np 5 et n(1 p) 5, P
_
p
1

n
F
n
p +
1

n
_
vaut environ 0, 95.
B - Prise de dcision
On cherche savoir si la probabilit p dapparition du caractre C dans la population est gale un certain nombre
p
0
ou pas partir dun chantillon de taille n. On fait donc lhypothse que p = p
0
.
On vrie dabord que n 30, np
0
5 et n(1 p
0
) 5.
On calcule lintervalle I =
_
p
0
1, 96
_
p
0
(1 p
0
)

n
, p
0
+ 1, 96
_
p
0
(1 p
0
)

n
_
.
On dtermine la frquence f du caractre C dans lchantillon.
Si f / I, on rejette lhypothse p = p
0
au risque de se tromper dau plus 5%. Si f I, on ne peut pas rejeter
lhypothse p = p
0
.
III. Intervalle de conance.
Situation o on utilise un intervalle de conance :
Quand on connait la frquence f et que lon veut estimer la probabilit p.
On rappelle que pour n grand, P
_
F
n

_
p
1

n
, p +
1

n
__
0, 95. Puisque
p
1

n
F
n
p +
1

n
F
n

1

n
p F
n
+
1

n
:
Thorme.
Pour tout rel p ]0, 1[, il existe un entier n
0
N

tel que pour tout n n


0
, P
_
p
_
F
n

1

n
, F
n
+
1

n
__
0, 95.
Si on choisit explicitement un chantillon et que le caractre tudi apparat dans cet chantillon avec une frquence
f, lintervalle
_
f
1

n
, f +
1

n
_
est une ralisation de lintervalle alatoire
_
F
n

1

n
, F
n
+
1

n
_
.
Quand n est grand, dans au moins 95% des choix dchantillon, on aura p
_
f
1

n
, f +
1

n
_
.
On dit que lintervalle
_
f
1

n
, f +
1

n
_
est un intervalle de conance de p au niveau de conance 0, 95 (pour n
grand). Dans la pratique, on utilise ce rsultat quand n 30, nf 5 et n(1 f) 5.
c Jean-Louis Rouget, 2012. Tous droits rservs. 2 http ://www.maths-france.fr

Vous aimerez peut-être aussi