Vous êtes sur la page 1sur 3

Chapitre 19 : Intervalle de confiance : pour estimer une

proportion

I°) Propriété et définition


On cherche à déterminer la proportion 𝑝 inconnue d’un certain caractère dans une population.
Pour des raisons de coûts ou de faisabilité, on ne peut pas étudier toute la population pour
déterminer 𝑝. On va donc choisir différents échantillons et calculer la fréquence observée 𝑓obs du
caractère. Cette fréquence va varier d’un échantillon à l’autre du fait de la fluctuation
d’échantillonnage → il est donc nécessaire d’apprécier cette incertitude en fournissant une
estimation par un intervalle.

On suppose que l’on a les conditions d’approximation usuelles : 𝑛 ≥ 30, 𝑛𝑝 ≥ 5 et 𝑛(1 − 𝑝) ≥ 5 .

𝑋𝑛
Théorème : Soit 𝑋𝑛 une variable aléatoire suivant une loi binomiale ℬ(𝑛; 𝑝) et 𝐹𝑛 = 𝑛
la
fréquence associée à 𝑋𝑛 . Alors, pour 𝑛 suffisamment grand, 𝑝 appartient à l’intervalle
𝟏 𝟏
[𝑭𝒏 − ; 𝑭𝒏 + ] avec une probabilité supérieure ou égale à 0,95.
√𝒏 √𝒏

Démonstration :
1 1
L’intervalle de fluctuation au seuil de 95% associé à 𝑝 (vu en Seconde) est : 𝐼 = [𝑝 − ;𝑝 + ]
√𝑛 √𝑛
donc :

1 1
𝑃 (𝑝 − ≤ 𝐹𝑛 ≤ 𝑝 + ) ≥ 0,95
√𝑛 √𝑛
1 1 1 1 1 1
Or, 𝑝 − ≤ 𝐹𝑛 ≤ 𝑝 + ⟺− ≤ 𝐹𝑛 − 𝑝 ≤ ⟺ −𝐹𝑛 − ≤ −𝑝 ≤ −𝐹𝑛 +
√𝑛 √𝑛 √𝑛 √𝑛 √𝑛 √𝑛
1 1
⟺ 𝐹𝑛 + ≥ 𝑝 ≥ 𝐹𝑛 − (on a multiplié par -1)
√𝑛 √𝑛

1 1
⟺ 𝐹𝑛 − ≤ 𝑝 ≤ 𝐹𝑛 +
√𝑛 √𝑛

1 1 1 1
Donc : 𝑃 (𝐹𝑛 − ≤ 𝑝 ≤ 𝐹𝑛 + ) ≥ 0,95 ; c’est-à-dire 𝑃 (𝑝 ∈ [𝐹𝑛 − ; 𝐹𝑛 + ]) ≥ 0,95
√𝑛 √𝑛 √𝑛 √𝑛

Définition : On réalise l’expérience aléatoire de 𝑛 tirages au hasard, et on appelle 𝑓𝑜𝑏𝑠 la


fréquence observée d’apparition du caractère.
𝟏 𝟏
L’intervalle [𝒇𝒐𝒃𝒔 − ; 𝒇𝒐𝒃𝒔 + ] est appelé intervalle de confiance de 𝒑 au niveau de confiance
√𝒏 √𝒏
0,95, où 𝑝 est la proportion (inconnue) d’apparition du caractère dans la population.

Remarques :
1) La fréquence observée varie d’un échantillon à l’autre (phénomène de fluctuation
d’échantillonnage), mais la proportion théorique 𝑝 se trouve effectivement dans
1 1
[𝑓𝑜𝑏𝑠 − ; 𝑓𝑜𝑏𝑠 + ] dans au moins 95% des cas. Donc cet intervalle de confiance permet de
√𝑛 √𝑛
donner un encadrement de la proportion théorique 𝑝 au seuil de 95%.
√𝑓𝑜𝑏𝑠 (1−𝑓𝑜𝑏𝑠 ) √𝑓𝑜𝑏𝑠 (1−𝑓𝑜𝑏𝑠 )
2) On admet que l’intervalle [𝑓𝑜𝑏𝑠 − 1,96 ; 𝑓𝑜𝑏𝑠 + 1,96 ] est aussi un
√𝑛 √𝑛
intervalle de confiance de 𝑝 au niveau de confiance 95% (mais il est impossible à justifier en TS
et ne sera pas utilisé !!)

Exemple :
On dispose d’une urne contenant un très grand nombre de boules rouges et bleues. On ignore
quelle est la proportion p de boules rouges dans l’urne, et rien ne permet de faire une hypothèse
sur la valeur de p.
L’ « estimation » consiste à chercher, à « deviner, estimer », avec un certain niveau de confiance,
quelle valeur peut prendre p, en s’appuyant sur les informations recueillies en procédant à des
tirages au sort aléatoires.
On cherche à estimer 𝑝 à partir d’un échantillon de taille 𝑛 = 100.

On réalise un tirage de 100 boules ; on obtient 59 rouges et 41 bleues.

1. Quelle est la fréquence observée de boules rouges ?


2. En déduire un intervalle de confiance de la proportion théorique 𝑝. Interpréter.

Correction :
59
1) 𝑓𝑜𝑏𝑠 = 100 = 0,59. Il y a 59 % de boules rouges dans l’échantillon.
2) Taille de l’échantillon : 𝑛 = 100
Proportion théorique : 𝑝 ?
L’intervalle de confiance (au seuil de 95 %) est :
1 1 1 1
𝐼𝐶 = [𝑓𝑜𝑏𝑠 − ; 𝑓𝑜𝑏𝑠 + ] = [0,59 − ; 0,59 + ] = [0,49; 0,69]
√𝑛 √𝑛 √100 √100
Cela signifie qu’il y a de très fortes chances (95 %) que la proportion de boules rouges dans
l’urne soit comprise entre 49 % et 69 %.

II°) Précision d’une estimation et taille de l’échantillon.


On a vu ci-dessus qu’en tirant 100 boules de l’urne, l’intervalle de confiance obtenu est
d’d’amplitude 0,2 (= 0,69 − 0,49) ; on peut trouver cet intervalle trop grand.

En procédant à un tirage de 400 boules, si 𝑓𝑜𝑏𝑠 est la fréquence observée de sortie du rouge, on
obtient un intervalle de confiance au niveau 95% égal à :

1 1
[𝑓𝑜𝑏𝑠 − ; 𝑓𝑜𝑏𝑠 + ] = [𝑓𝑜𝑏𝑠 − 0,05; 𝑓𝑜𝑏𝑠 + 0,05].
√400 √400

Son amplitude, égale à 0,1 (= 𝑓𝑜𝑏𝑠 + 0,05 − (𝑓𝑜𝑏𝑠 − 0,05)), est deux fois plus petite que la
précédente.

Plus généralement, on retiendra :

2
Un intervalle de confiance au niveau 95% est d’amplitude . Plus la taille de l’échantillon est
√𝑛
grande, plus les intervalles de confiance obtenus sont précis.
1 1 2
En effet : l’amplitude de l’intervalle de confiance vaut : 𝑓𝑜𝑏𝑠 + − (𝑓𝑜𝑏𝑠 − ) =
√𝑛 √𝑛 √𝑛

Exemple : Avec l’urne ci-dessus, déterminer le nombre 𝑛 de boules qu’il faudrait tirer pour que
l’intervalle de confiance ait une amplitude inférieure à 0,05. Puis une amplitude inférieure à
0,01.
2
Correction : On souhaite que soit inférieur à 0,05.
√𝑛
2 2 2 2
≤ 0,05 ⟹ ≤ √𝑛 ⟹ 𝑛 ≥ ( ) = 402 = 1600
√𝑛 0,05 0,05
Il faudrait tirer au moins 𝑛 = 1600 boules pour estimer la proportion de boules rouges de l’urne
avec une précision inférieure ou égale à 0,05 (5%).

Vous aimerez peut-être aussi