Académique Documents
Professionnel Documents
Culture Documents
proportion
𝑋𝑛
Théorème : Soit 𝑋𝑛 une variable aléatoire suivant une loi binomiale ℬ(𝑛; 𝑝) et 𝐹𝑛 = 𝑛
la
fréquence associée à 𝑋𝑛 . Alors, pour 𝑛 suffisamment grand, 𝑝 appartient à l’intervalle
𝟏 𝟏
[𝑭𝒏 − ; 𝑭𝒏 + ] avec une probabilité supérieure ou égale à 0,95.
√𝒏 √𝒏
Démonstration :
1 1
L’intervalle de fluctuation au seuil de 95% associé à 𝑝 (vu en Seconde) est : 𝐼 = [𝑝 − ;𝑝 + ]
√𝑛 √𝑛
donc :
1 1
𝑃 (𝑝 − ≤ 𝐹𝑛 ≤ 𝑝 + ) ≥ 0,95
√𝑛 √𝑛
1 1 1 1 1 1
Or, 𝑝 − ≤ 𝐹𝑛 ≤ 𝑝 + ⟺− ≤ 𝐹𝑛 − 𝑝 ≤ ⟺ −𝐹𝑛 − ≤ −𝑝 ≤ −𝐹𝑛 +
√𝑛 √𝑛 √𝑛 √𝑛 √𝑛 √𝑛
1 1
⟺ 𝐹𝑛 + ≥ 𝑝 ≥ 𝐹𝑛 − (on a multiplié par -1)
√𝑛 √𝑛
1 1
⟺ 𝐹𝑛 − ≤ 𝑝 ≤ 𝐹𝑛 +
√𝑛 √𝑛
1 1 1 1
Donc : 𝑃 (𝐹𝑛 − ≤ 𝑝 ≤ 𝐹𝑛 + ) ≥ 0,95 ; c’est-à-dire 𝑃 (𝑝 ∈ [𝐹𝑛 − ; 𝐹𝑛 + ]) ≥ 0,95
√𝑛 √𝑛 √𝑛 √𝑛
Remarques :
1) La fréquence observée varie d’un échantillon à l’autre (phénomène de fluctuation
d’échantillonnage), mais la proportion théorique 𝑝 se trouve effectivement dans
1 1
[𝑓𝑜𝑏𝑠 − ; 𝑓𝑜𝑏𝑠 + ] dans au moins 95% des cas. Donc cet intervalle de confiance permet de
√𝑛 √𝑛
donner un encadrement de la proportion théorique 𝑝 au seuil de 95%.
√𝑓𝑜𝑏𝑠 (1−𝑓𝑜𝑏𝑠 ) √𝑓𝑜𝑏𝑠 (1−𝑓𝑜𝑏𝑠 )
2) On admet que l’intervalle [𝑓𝑜𝑏𝑠 − 1,96 ; 𝑓𝑜𝑏𝑠 + 1,96 ] est aussi un
√𝑛 √𝑛
intervalle de confiance de 𝑝 au niveau de confiance 95% (mais il est impossible à justifier en TS
et ne sera pas utilisé !!)
Exemple :
On dispose d’une urne contenant un très grand nombre de boules rouges et bleues. On ignore
quelle est la proportion p de boules rouges dans l’urne, et rien ne permet de faire une hypothèse
sur la valeur de p.
L’ « estimation » consiste à chercher, à « deviner, estimer », avec un certain niveau de confiance,
quelle valeur peut prendre p, en s’appuyant sur les informations recueillies en procédant à des
tirages au sort aléatoires.
On cherche à estimer 𝑝 à partir d’un échantillon de taille 𝑛 = 100.
Correction :
59
1) 𝑓𝑜𝑏𝑠 = 100 = 0,59. Il y a 59 % de boules rouges dans l’échantillon.
2) Taille de l’échantillon : 𝑛 = 100
Proportion théorique : 𝑝 ?
L’intervalle de confiance (au seuil de 95 %) est :
1 1 1 1
𝐼𝐶 = [𝑓𝑜𝑏𝑠 − ; 𝑓𝑜𝑏𝑠 + ] = [0,59 − ; 0,59 + ] = [0,49; 0,69]
√𝑛 √𝑛 √100 √100
Cela signifie qu’il y a de très fortes chances (95 %) que la proportion de boules rouges dans
l’urne soit comprise entre 49 % et 69 %.
En procédant à un tirage de 400 boules, si 𝑓𝑜𝑏𝑠 est la fréquence observée de sortie du rouge, on
obtient un intervalle de confiance au niveau 95% égal à :
1 1
[𝑓𝑜𝑏𝑠 − ; 𝑓𝑜𝑏𝑠 + ] = [𝑓𝑜𝑏𝑠 − 0,05; 𝑓𝑜𝑏𝑠 + 0,05].
√400 √400
Son amplitude, égale à 0,1 (= 𝑓𝑜𝑏𝑠 + 0,05 − (𝑓𝑜𝑏𝑠 − 0,05)), est deux fois plus petite que la
précédente.
2
Un intervalle de confiance au niveau 95% est d’amplitude . Plus la taille de l’échantillon est
√𝑛
grande, plus les intervalles de confiance obtenus sont précis.
1 1 2
En effet : l’amplitude de l’intervalle de confiance vaut : 𝑓𝑜𝑏𝑠 + − (𝑓𝑜𝑏𝑠 − ) =
√𝑛 √𝑛 √𝑛
Exemple : Avec l’urne ci-dessus, déterminer le nombre 𝑛 de boules qu’il faudrait tirer pour que
l’intervalle de confiance ait une amplitude inférieure à 0,05. Puis une amplitude inférieure à
0,01.
2
Correction : On souhaite que soit inférieur à 0,05.
√𝑛
2 2 2 2
≤ 0,05 ⟹ ≤ √𝑛 ⟹ 𝑛 ≥ ( ) = 402 = 1600
√𝑛 0,05 0,05
Il faudrait tirer au moins 𝑛 = 1600 boules pour estimer la proportion de boules rouges de l’urne
avec une précision inférieure ou égale à 0,05 (5%).