Vous êtes sur la page 1sur 26

Squence 9

Intervalles de fluctuation,estimation
Objectifs de la squence
Dans

le chapitre 2, on tudie des intervalles de uctuation des variables alatoires


Xn
Fn =
, frquences des variables alatoires binomiales X n de paramtres n et p. On
n
tudie quelques exemples de prise de dcision.

Dans

le chapitre 3, on aborde lestimation dune proportion inconnue partir de celle


dun chantillon.

Sommaire
1. Pr-requis
2. Intervalles de fluctuation
3. Estimation
4. Synthse de la squence
5. Exercices de synthse

Squence 9 MA01

Cned - Acadmie en ligne

1 Pr-requis
chantillonnage
En statistiques, un chantillon de taille n est la liste des n rsultats obtenus par
n rptitions indpendantes de la mme exprience alatoire. Ici lexprience
rpte est une preuve de Bernoulli, cest--dire quelle ne prend que deux
valeurs : chec / russite, oui / non, homme / femme, 0 / 1
Par exemple, un chantillon de taille 100 du lancer dune pice dans lequel on
compte le nombre de fois o on obtient Pile est la liste des rsultats obtenus en
lanant effectivement 100 fois la pice.
Le nombre de russites dans un chantillon de taille n suit la loi binomiale
(n ; p ).
On appelle f la frquence du nombre de russites dans lchantillon.
Dfinition
Un intervalle de uctuation au seuil de 95%, relatif aux chantillons de taille

n, est un intervalle o se situe la frquence f observe dans un chantillon


de taille n avec une probabilit suprieure 0,95.

On a vu en Seconde que :
Lintervalle p 1 ; p + 1 est un intervalle de uctuation approch au

n
n

seuil de 95%, relatif aux chantillons de taille n.


Commentaire :

dans certains cas, la probabilit que la frquence appartienne lintervalle


1
1 est trs proche de 0,95 mais en tant infrieure, cest

;p+
p

n
n

pourquoi on dit que ce sont des intervalles de uctuation approchs .


1
1

Dans la pratique, on utilise lintervalle p


;p+
pour des probabilits p
n
n

comprises entre 0,2 et 0,8 et des chantillons de taille n suprieure ou gale 25.

Squence 9 MA01

Cned - Acadmie en ligne

Remarque

Tout intervalle qui contient un intervalle de uctuation au seuil de 95%, est


lui aussi un intervalle de uctuation ce mme seuil.
Lintervalle [ 0 ; 1] contient toutes les frquences, il vrie la condition de la
dnition prcdente, mais il est sans intrt. On cherchera des intervalles
de uctuation correspondant des probabilits suprieures 0,95 et aussi
trs proches de 0,95 en particulier dans les prises de dcision.

Remarque

Il y a plusieurs sortes dintervalle de uctuation. On peut choisir des


intervalles de uctuation centrs en p comme ceux vus en Seconde, o pour
lesquels la probabilit que la frquence soit lextrieur de lintervalle
gauche soit gale la probabilit que la frquence soit lextrieur de
lintervalle droite comme ceux vus en Premire, ou
Par exemple, pour p = 0,2 et n = 100, lintervalle de uctuation vu en
Seconde est [ 0,1; 0,3] et celui obtenu en Premire est [ 0,12 ; 0,28 ].

 Exercice

On utilisera ici les intervalles de uctuation au seuil de 95% de la forme


1
1

;p+
p
.
n
n

 On dispose dun d bien quilibr, on gagne quand on obtient 1 ou 6. Dter-

miner un intervalle de fluctuation au seuil de 95%, de la frquence des lancers


gagnants dans les chantillons de taille 100.
 On sait quen moyenne 51% des nouveau-ns sont des garons. Dtermi-

ner un intervalle de fluctuation au seuil de 95% de la frquence des garons


nouveau-ns dans des chantillons de taille 25. Que peut-on en dduire pour le
nombre de garons parmi 25 nouveau-ns ?
 Utilisation

Prise de dcision
On a dcouvert une pice ancienne et on se demande si elle est bien quilibre.
Comment faire ?
On lance n fois la pice et on note la frquence f dapparition de Pile.
On dtermine un intervalle de fluctuation I n au seuil de 95%, de la frquence
dapparition de Pile dans des chantillons de taille n.

Cned - Acadmie en ligne

Squence 9 MA01

Rgle de dcision : si f appartient lintervalle I n , on dcide que la pice est quilibre, si f nappartient pas lintervalle I n on dcide que la pice nest pas quilibre.
Dans chacun des deux cas suivants, quelle est la dcision prise ?
 n = 100 et f = 0,56
 n = 1000 et f = 0,560.

Squence 9 MA01

Cned - Acadmie en ligne

2 Intervalles de fluctuation
A

Objectifs du chapitre
Quand on ralise une exprience alatoire, on observe bien sr que les rsultats
obtenus ne sont pas toujours les mmes, cest la fluctuation dchantillonnage.
Mais on observe aussi que, plus on rpte une exprience un grand nombre de
fois, plus la rgularit de la frquence des rsultats est grande.
On dfinit les intervalles de fluctuation asymptotique et on en donne un exemple.
On peut alors dcider si on considre que des rsultats obtenus lors dune exprience sont dus au hasard (cest--dire la fluctuation dchantillonnage), ou
si on considre quils sont statistiquement significatifs dune diffrence avec le
modle choisi.

B
Activit 1

Pour dbuter
Sur le tableur Open Office, on a simul 100 chantillons de n lancers dun d
ttradrique bien quilibr.
On a dtermin les frquences o la face marque 1 est la face cache ( p = 0,25),
elles sont indiques en ordonnes sur le graphique.
Dans chacun des trois cas, dterminer :
 Le pourcentage des frquences appartenant lintervalle p 1 ; p + 1 ,

 Le pourcentage des frquences appartenant

p (1 p )
p (1 p )
; p + 1,96
p 1,96
.
n
n

Cned - Acadmie en ligne

Squence 9 MA01

Premier cas

Fluctuation 100 chantillons


0,4

n = 50

p = 0,25

40

60

0,35

frquence

0,3
0,25
0,2
0,15
0,1
0,05
0
0

20

80

100

Deuxime cas

Fluctuation 100 chantillons


n = 100

frquence

0,4

p = 0,25

0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0

20

40

60

80

100

Squence 9 MA01

Cned - Acadmie en ligne

Troisime cas

Fluctuation 100 chantillons


n = 200

frquence
0,35

p = 0,25

0,3
0,25
0,2
0,15
0,1
0,05
0
0

20

40

60

80

100

Cours
1. Intervalles de fluctuation asymptotique
Dans ce qui suit, on considre des variables alatoires X n suivant chacune une
loi binomiale (n ; p ).
(exemple : on lance n fois une pice quilibre, X n est le nombre de Pile obtenus, X n suit la loi (n ; 0,5)).

X
La variable alatoire Fn = n donne donc la frquence du nombre de sucn
cs (attention : il sagit dune utilisation du mot frquence diffrente de ce qui
est fait en statistique lorsquon parle de frquence dun caractre, ici la frquence
est une variable alatoire).

Cned - Acadmie en ligne

Squence 9 MA01

Proprit 1

X
La variable alatoire Fn = n :
n
n
1
2
 prend n + 1 valeurs : 0, , , ...,
;
n n
n
X
 a pour esprance le nombre p : E n = p .
n
 Dmonstration

La variable alatoire X n prenant les n + 1 valeurs : 0, 1, 2, , n, on en dduit


celles de Fn .
On sait que E ( X n ) = np , et, daprs la linarit de lesprance, quand on divise
la variable alatoire par n, lesprance est aussi divise par n. On obtient donc
X
E n = p.
n
Les frquences Fn ont donc pour esprance le nombre p qui ne dpend pas de n.
Les rsultats observs ont tendance se resserrer autour de lesprance p quand
n augmente. Cest cette concentration des valeurs les plus probables autour de p
qui permet damliorer la prise de dcision partir des observations.
Dfinition 1

X
Un intervalle de fluctuation asymptotique de la variable alatoire Fn = n
n
au seuil de 95 % , est un intervalle dtermin partir de p et de n et qui
contient Fn avec une probabilit dautant plus proche de 95 % que n est
grand.

 Exemple 1

1
1

On montrera plus loin que lintervalle p


;p+
est un intervalle de
n
n

X
fluctuation asymptotique de la variable alatoire Fn = n au seuil de 95%. En
n
classe de seconde, ceci a t nonc sous forme simplifie, le caractre asymptotique ne pouvant pas tre introduit. Des exemples dutilisation ont t donns
dans les pr-requis.

Squence 9 MA01

Cned - Acadmie en ligne

Rsultat admis savoir

p (1 p )
p (1 p )
Lintervalle I n = p 1,96
; p + 1,96
est un intervalle
n
n

X
de uctuation asymptotique de la variable alatoire Fn = n au seuil de
n
95%.

Dans lactivit 1, on a pu faire des observations cohrentes avec ces rsultats. Mais, la dfinition dun intervalle de fluctuation est exprime avec une
probabilit. Si vous faites dautres simulations avec le fichier qui est sur le
site, il se peut que quelques observations donnent des pourcentages ventuellement infrieurs 95%.

Remarque

Les intervalles I n sont des intervalles de uctuation asymptotique car il


y a la condition dautant plus proche de que n est grand . On peut
considrer que les I n sont des intervalles de uctuation approchs , la
probabilit que les Fn appartienne I n nest pas forcment suprieure
0,95 (condition de la dnition dun intervalle de uctuation au seuil de
95%) mais si elle nest pas suprieure cette valeur, elle en est proche.
En pratique dans les exercices, la taille n de lchantillon est xe,
lintervalle de uctuation asymptotique I n correspondant sera lintervalle
de uctuation utilis.

Remarque

Conditions dutilisation
Les exigences habituelles de prcision pour utiliser cette approximation
sont : n 30, np 5 et n (1 p ) 5.
 Exemple 2

Dterminer un intervalle de uctuation asymptotique au seuil de 95% lorsque

n = 100 et p = 0,5.
 Solution

On a np = 50 et n (1 p ) = 50 donc les trois conditions sont ralises et on peut


utiliser lintervalle I n . On obtient :

10

Cned - Acadmie en ligne

Squence 9 MA01


0,5 0,5
0,5 0,5
I100 = 0,5 1,96
; 0,5 + 1,96
soit [ 0,402 ; 0,598 ].
100
100

Cet exemple modlise 100 lancers dune pice quilibre. On peut donc dire que,
pour environ 95 % des sries de 100 lancers, la frquence du nombre de Pile
obtenus se situe dans lintervalle [ 0,402 ; 0,598 ].
Remarque

Ces intervalles de uctuation asymptotique sont plus faciles dterminer


que ceux du cours de Premire qui ncessitaient lutilisation dalgorithmes
ou de tableurs, certains tableurs dailleurs ne pouvant pas dpasser certaines
valeurs pour n.

2. Exemple dutilisation : prise de dcision


On utilise un intervalle de uctuation lorsque lon veut dterminer si la
proportion f observe dans un chantillon est compatible ou non avec un modle
de Bernoulli, cest--dire si elle peut tre un rsultat obtenu par une variable
X
alatoire Fn = n , o X n suit une loi binomiale de paramtres n et p, la valeur
n
p tant connue ou suppose connue dans la population.
Quand X n suit une loi binomiale de paramtres n et p, un intervalle de uctuation
asymptotique I n au seuil de 95% est un intervalle o se situe la frquence

X
Fn = n avec une probabilit dautant plus proche de 0,95 que n est grand.
n
Lintervalle I n contient donc environ 95% des frquences observes dans les
chantillons de taille n sufsamment grande. Des frquences (environ 5%) de
certains chantillons ne sont pas dans I n , cest la uctuation dchantillonnage.
En fonction de lappartenance ou non de la frquence observe f lintervalle

I n , on dcide si lchantillon est conforme ou non au modle.

La rgle de dcision adopte est la suivante :


 si la frquence observe f dans un chantillon appartient un intervalle de

uctuation asymptotique au seuil de 95 % on considre que lchantillon


est compatible avec le modle ;
 sinon, on

considre que lchantillon nest pas compatible avec le modle.


Squence 9 MA01

11

Cned - Acadmie en ligne

Remarque

Avec cette rgle, la uctuation dchantillonnage amne rejeter, tort, les


5% (environ) dchantillons qui suivent le modle de Bernoulli et qui ne
sont pas dans I n .
Dans les exemples, les tirages sont effectus sans remise. La taille des chantillons considrs tant faible par rapport la taille de la population totale, on
assimile les tirages raliss des tirages avec remise et on peut alors appliquer
les rsultats prcdents.
 Exemple 3

Le responsable de la maintenance des machines sous dun casino doit vrifier


quun certain type de machines est bien rgl sur une frquence de succs de 0,06.
Il dcide de rgler chaque machine pour laquelle il aura observ, dans lhistorique
des jeux, une frquence de succs se situant en dehors dun intervalle de fluctuation au seuil de 95 %.
Lors du contrle dune machine, le technicien constate quelle a fourni 9 succs
sur 85 jeux.
 Dterminer la frquence observe f de succs de cette machine.
 Dterminer daprs le cours un intervalle de fluctuation asymptotique au seuil

de 95%.
 Le technicien va-t-il modifier le rglage de la machine ?
 Quelle aurait t sa dcision sil y avait eu 21 succs sur 200 jeux ?
 Solution

 On a f =

9
0,106.
85

 On a n = 85, p = 0,06, np = 5,1 et n (1 p ) = 79,9, donc les conditions

sont remplies pour utiliser lintervalle de fluctuation asymptotique du cours

0,06 0,94
0,06 0,94 Comme 0,009 est une
; p + 1,96
0,06 1,96
.
85
85

valeur approche par dfaut de 0,06 1,96

0,06 0,94
et 0,111 est une
85

0,06 0,94
, alors [ 0,009 ; 0,111]
85

0,06 0,94
0,06 0,94
; 0,06 + 1,96
et [ 0,009 ; 0,111]
contient 0,06 1,96

85
85

valeur approche par excs de 0,06 + 1,96

est donc un intervalle de fluctuation lgrement plus large que celui du cours.

12

Cned - Acadmie en ligne

Squence 9 MA01

 La frquence observe f se situe dans lintervalle de fluctuation donc le rglage

de la machine nest pas modifi.


 Dans ce deuxime cas, la frquence observe est f = 21 = 0,105 et linter-

200

valle de fluctuation est environ gal [ 0,027 ; 0,093]. La frquence f du nombre


de succs observe nest pas dans lintervalle car elle est trop grande, donc le
technicien va modifier le rglage de la machine. On remarque que, dans les deux
cas, les frquences f sont presque les mmes mais les dcisions prises sont diffrentes car les intervalles de fluctuation sont diffrents.
Remarque

Lamplitude de lintervalle de fluctuation asymptotique au seuil de 95% du


cours est gale 2 1,96

p (1 p )
n

. Pour une valeur de p donne, cette

amplitude diminue quand la taille n de lchantillon augmente.

3. Complment sur les intervalles

1
1

;p+
p

n
n

On peut retrouver lintervalle de fluctuation qui a t donn en classe de Seconde.


1
1

On montre pour cela que lintervalle p


;p+
contient lintervalle
n
n

p (1 p )
p (1 p )
I n = p 1,96
; p + 1,96
.
n
n

Pour tout p dans ]0 ; 1[ , lingalit p (1 p )

1
est vrifie (la fonction poly4

2
nme du second degr p  p (1 p ) = p + p admet un maximum car le coef-

ficient de p 2 est ngatif, ce maximum est atteint pour p =

1
et il vaut donc
2

1 1 1
1 = ).
2 2 4
On en dduit que 1,96 p (1 p ) 1,96

1
1.
4

Squence 9 MA01

13

Cned - Acadmie en ligne

On obtient :

p (1 p )
p (1 p )
1
1
.
p 1,96
p + 1,96
p+
n
n
n
n

1
1

Donc lintervalle I n est inclus dans lintervalle p


;p+
ce qui
n
n

X
1
1
X

entrane que P n I n P p
.
n p+
n

n
n
n
1
1

;p+
Donc lintervalle p
contient Fn avec une probabilit supn
n

rieure celle obtenue avec I n .


1
1

;p+
Donc lintervalle p
contient Fn avec une probabilit dautant
n
n

plus sre de dpasser 95 % que n est grand.

Conclusion

1
1

Lintervalle p
;p+
est bien un intervalle de uctuation asymptotique
n
n

de X n un seuil au moins gal celui de I n , cest--dire 95%.


n

D
Exercice 1

Exercices dapprentissage
(daprs ressources Education nationale)
Les enfants sont dits prmaturs lorsque la dure gestationnelle est infrieure
ou gale 259 jours. La proportion de ces naissances est de 6%. Des chercheurs
suggrent que les femmes ayant eu un travail pnible pendant leur grossesse
sont plus susceptibles davoir un enfant prmatur que les autres. Il est dcid
de raliser une enqute auprs dun chantillon alatoire de 400 naissances correspondant des femmes ayant eu pendant leur grossesse un travail pnible. Les
chercheurs dcident a priori que si la proportion denfants ns prmaturs dans
cet chantillon est suprieure la borne suprieure dun intervalle de fluctuation
asymptotique au seuil de 0,95 alors leur hypothse sera accepte. Finalement le
nombre denfants prmaturs est de 50. Quelle est donc la conclusion ?

14

Cned - Acadmie en ligne

Squence 9 MA01

Exercice 2

Dans le monde, la proportion de gauchers est 12 %.


Dans un club de tennis, il y a 21 gauchers parmi les 103 licencis.
 Dterminer la frquence de gauchers dans ce club.
 Dterminer un intervalle de fluctuation asymptotique au seuil de 95 %.
 Peut-on dire que ce club est reprsentatif de la proportion de gauchers

dans le monde ?

Exercice 3

On

souhaite

utiliser

lintervalle

de

fluctuation

asymptotique

p (1 p )
p (1 p )
I n = p 1,96
; p + 1,96
.
n
n

 Pour p = 0,02, dterminer la plus petite valeur de n vrifiant les conditions

dutilisation : n 30, np 5 et n (1 p ) 5.
 Dterminer ensuite la plus petite valeur de n pour laquelle lamplitude de

lintervalle de fluctuation est infrieure 0,1.

Squence 9 MA01

15

Cned - Acadmie en ligne

3 Estimation
A

Objectifs du chapitre
On souhaite connatre dans une population, la valeur dune proportion p (proportion des pices dfectueuses parmi les pices fabriques par une usine, proportion des gauchers en France, intentions de vote pour un rfrendum, )
Pour des raisons matrielles, financires ou autres (par exemple, on ne peut pas
tester le bon fonctionnement de toutes les allumettes dune production car dans
ce cas tester une allumette amne la dtruire !), on ne peut pas toujours runir
les donnes concernant la population tout entire.
On va donc estimer la proportion p que lon cherche partir de la frquence f
observe dans un chantillon.
Mais on sait que cette frquence observe va varier dun chantillon lautre,
cest la fluctuation dchantillonnage autour de p.
Il est donc ncessaire de tenir compte de cette fluctuation en donnant un rsultat
sous forme dun intervalle, appel intervalle de confiance en prcisant aussi le
niveau de confiance que lon accorde cette rponse.
Dans ce chapitre, on montre comment on peut dterminer un intervalle de
confiance au niveau 0,95.
Cet intervalle dpendant de la taille de lchantillon, on dtermine la taille de
lchantillon qui est suffisante pour obtenir une prcision donne (qui dpend
de lamplitude de lintervalle de confiance), le niveau de confiance tant toujours
0,95.

Pour dbuter
Dans ce chapitre, on montrera comment rpondre des questions analogues
celles qui suivent.
On considre une urne contenant un trs grand nombre de petites billes de couleur blanche ou noire, la proportion p de billes noires est inconnue. On cherche
estimer p partir dun chantillon de taille n.
 On effectue 100 tirages successifs avec remise et on obtient 71 billes noires et
29 billes blanches, combien peut-on estimer p ?
 Mme question sachant quon a effectu 1000 tirages et obtenu 693 billes
noires et 307 billes blanches.

16

Cned - Acadmie en ligne

Squence 9 MA01

Cours
1. Rsultat prliminaire
Dmontrer que, pour tous rels x et y et pour tout rel r positif, on a :

x r y x +r y r x y +r .
 Solution

x r y x y + r
x r y x +r

y r x y +r .
y x + r
y r x
Remarque

La double ingalit x r y x + r quivaut r y x r qui signifie que lcart entre les deux nombres x et y est compris entre r et r, les
deux nombres x et y jouant le mme rle.

2. Exemple de rfrence
Avant daborder les dfinitions et les proprits bien mises en forme mais un peu
difficiles au premier abord, nous allons tudier un exemple.
On considre une urne contenant un trs grand nombre de petites billes de couleur blanche ou noire, la proportion p de billes noires est inconnue. On cherche
estimer p partir dun chantillon de taille n.
La probabilit dobtenir une bille noire quand on fait un tirage au hasard est
gale la proportion p.
On sait donc que, parmi tous les chantillons de taille n quon peut obtenir, environ 95% dentre eux ont une frquence f qui appartient lintervalle de fluctuation p 1 ; p + 1 . Le rsultat prliminaire du  prouve que :

n
n

1
1
1
1
ce qui permet de dduire que :
f p +
f
p f +
p
n
n
n
n
1
1

1
1 est quivalent

" p f
;f +
"f p
;p+
"
n
n
n
n

".

Donc, parmi tous les chantillons de taille n quon peut obtenir, environ 95%
1
1

;f +
sont tels que lintervalle associ f
contient le nombre p que
n
n

lon cherche estimer.

Squence 9 MA01

17

Cned - Acadmie en ligne

On ralise donc un chantillon de taille n en effectuant n tirages indpendants


(tirages au hasard avec remise). On calcule la frquence f de billes noires dans
lchantillon obtenu et on dtermine lintervalle
1
1

;f +
f
.
n
n

1
1

On dit alors que p appartient f


;f +
avec un niveau de confiance
n
n

1
1

de 95% et que lintervalle f


;f +
est un intervalle de confiance au
n
n

niveau 0,95.
 Exemple 4

 On effectue 100 tirages indpendants et on obtient 71 billes noires et 29 billes

blanches. Donner un intervalle de confiance au niveau 95% pour la proportion


p de billes noires.
 Mme question sachant quon a effectu 1000 tirages et obtenu 693 billes

noires.
 Solution

 On trouve f = 0,71. Comme n = 100, lintervalle f

1
1
lintervalle 0,71
; 0,71+
, soit [ 0,61; 0,81].
100
100

1
1
;f +
est
n
n

La proportion p de billes noires appartient [ 0,61; 0,81] avec un niveau de


confiance de 95%.
On dit aussi que la proportion de billes noires est estime 0,71 avec lintervalle
de confiance de [ 0,61; 0,81] au niveau 0,95.
 On a ici f = 0,693.

Un

intervalle

de

confiance

au

niveau

95%

est

donc

1
1
; 0,693 +
0,693
.
1000
1000

Pour donner un intervalle dont les bornes sont des nombres dcimaux ayant trois
chiffres aprs la virgule, on dtermine une valeur approche par excs de la borne
de droite et une valeur approche par dfaut de la borne de gauche : on obtient

[0,661; 0,725].
La proportion de billes noires est estime 0,693 avec lintervalle de confiance
de [ 0,661; 0,725] au niveau 0,95.
1
1

;f +
Une fois lchantillon ralis, lintervalle f
est dtermin et il
n
n

ny a alors que deux possibilits : p appartient ou nappartient pas cet intervalle

18

Cned - Acadmie en ligne

Squence 9 MA01

(de mme quand on a lanc une pice, on a obtenu Pile ou on a obtenu Face).
Cest pourquoi on ne sexprime plus en termes de probabilit. Pour exprimer
lide quon a obtenu un intervalle et quenviron 95% des intervalles quon peut
obtenir ainsi contiennent la proportion cherche, on a choisi le mot confiance .

3. Dfinition
Comme dans le chapitre prcdent, on considre une suite de variables alatoires

( X n ) o chaque variable alatoire X n

suit la loi binomiale (n ; p ) (exemple :

on lance n fois une pice et X n est le nombre de Pile obtenus). La variable alaX
toire Fn = n donne donc la frquence du nombre de succs .
n
On dit quun intervalle est alatoire lorsque ses bornes sont dfinies par des
variables alatoires.
La ralisation dun intervalle alatoire est lintervalle obtenu aprs avoir ralis lexprience alatoire (aprs avoir lanc 500 fois une pice, interrog 1000 personnes).

Dfinition 2
Un intervalle de confiance pour une proportion p un niveau de
confiance 95% est la ralisation, partir dun chantillon, dun intervalle alatoire contenant la proportion p avec une probabilit suprieure
ou gale 95%.

Proprit 2 admise
1
1

; Fn +
Pour une valeur de p fixe, lintervalle alatoire Fn

n
n

contient, pour n assez grand, la proportion p avec une probabilit au moins


gale 0,95.
 Consquence

La proportion p dans une population est lment de lintervalle


1
1

;f +
f
avec un niveau de confiance dau moins 0,95, o f dsigne
n
n

la frquence observe dans un chantillon de taille n.

Squence 9 MA01

19

Cned - Acadmie en ligne

A savoir

On se place dans le cas o lchantillon contient au moins 30 lments, n 30. Si la frquence f observe est telle que nf 5 et

n (1 f ) 5, on convient que f est une estimation de p et que linter1


1

;f +
valle f
est un intervalle de confiance au niveau 0,95
n
n

pour la proportion p.
Cet intervalle est aussi appel fourchette de sondage .

4. Taille de lchantillon pour obtenir une prcision donne au niveau de confiance 0,95
La prcision de lestimation est donne par lamplitude de lintervalle
1
1 qui est gale

;f +
f

n
n

lchantillon.

2 et dpend donc de la taille n de


n

On observe que cette amplitude ne dpend pas de la taille de la population


totale, ce qui peut tonner. Mais pour goter un plat, il suffit den goter une
petite quantit, cette quantit ne dpend pas de la taille du rcipient (mais il faut
nanmoins avoir bien mlang) ! (Explication donne daprs une ide de JeanLouis Boursin dans son livre Les structures du hasard .)
On peut donc choisir la taille n de lchantillon pour obtenir la prcision souhai2
te. En notant a la prcision souhaite, on cherche un entier n tel que
a,
n
4
soit n 2 .
a

20

Cned - Acadmie en ligne

Prcision a

0,06

0,04

0,02

0,01

Taille minimale de lchantillon n

1112

2500

10000

40000

Squence 9 MA01

Les sondages sont souvent faits avec des chantillons denviron 1000 personnes,
la prcision obtenue est donc denviron 0,06.
Ainsi, questionner 1112 personnes suffit pour avoir une fourchette de sondage
damplitude 0,06, quil sagisse dun sondage pour un rfrendum local concernant 100000 lecteurs ou pour le deuxime tour dune lection prsidentielle
concernant 35 millions dlecteurs.
Il faut bien sr savoir cela quand on reoit des informations o les sondages sont
un lment important.

5. Exemple : sondages et lections


 Exemple 5

Dans cet exercice, la population est suffisamment grande pour que les sondages
soient assimils des tirages avec remise. On ne tient compte que des rponses
exprimes, cest--dire quon ne tient pas compte des prvisions dabstentions
ou des intentions de vote nul. Les sondages sont faits auprs de 1112 personnes.
Au deuxime tour de llection prsidentielle, le dernier sondage de linstitut A
indique 52,5% dintentions de vote pour le candidat X et 47,5% pour le candidat Y.
Linstitut B indique 50,5% dintentions de vote pour le candidat X et 49,5%
pour le candidat Y.
 Y-a-t-il une contradiction entre les rsultats de ces deux instituts de sondage ?
 Le candidat X peut-il tre totalement rassur ?

 Solution

 Lintervalle de confiance la fourchette de sondage f

1
1
;f +

n
n

obtenu partir des rsultats de linstitut A qui donne f = 0,525 pour le candidat
X est environ gal [ 0,495 ; 0,555]. En utilisant les rsultats de linstitut B qui
donne f = 0,505, on obtient environ [ 0,475 ; 0,535]. Les deux fourchettes de
sondage ont une partie commune, donc les rsultats de ces deux instituts de
sondage ne sont pas en contradiction.
 Le candidat X ne peut pas tre totalement rassur car les deux fourchettes de

sondage contiennent des nombres infrieurs 0,5, correspondants un chec de


sa candidature.

6. Simulation
Pour mieux voir ce quest un intervalle de confiance, une fourchette de sondage,
on a ralis 20 sries de 200 tirages de 0 et de 1 au hasard.

Squence 9 MA01

21

Cned - Acadmie en ligne

Pour chaque srie, on obtient un intervalle de confiance.


Dans les 200 colonnes de A GR on a crit les rsultats des tirages.
Dans la colonne GS, on a dtermin pour chaque ligne la frquence avec laquelle
on a obtenu 1. Dans les colonnes GT et GU sont calcules les bornes de lintervalle de confiance du cours au niveau 0,95. La slection des colonnes GT et GU
et le choix de XY dispersion dans type de diagramme dans Open Office donne
un diagramme analogue celui-ci.

On constate ici que 19 dentre eux contiennent p = 0,5 qui est la proportion
relle dans cet exemple de tirage au hasard. Un seul intervalle ne contient pas

p = 0,5.
Dans dautres simulations, on peut bien sr trouver plusieurs intervalles de
confiance qui ne contiennent pas p ou aucun.
Quand on veut estimer une proportion, on utilise un seul intervalle de confiance.
La simulation permet de voir quenviron 95% des intervalles de confiance
contiennent p.

7. Autre intervalle de confiance


Comme il existe diffrents intervalles de fluctuation, il existe diffrents intervalles
de confiance.

22

Cned - Acadmie en ligne

Squence 9 MA01

Par exemple, lintervalle f 1,96 f (1 f ) ; f + 1,96 f (1 f ) est aussi un


n
n

intervalle de confiance qui est utilis dans certains cas. On ne le justifiera pas ici.

D
Exercice 4

Exercices dapprentissage
 Une usine vient dinstaller une chane de fabrication pour fabriquer une nou-

velle pice. Aprs un bref temps de fonctionnement, on prlve 100 pices. La


fabrication est assez importante pour que ce prlvement soit assimil un
tirage avec remise. On trouve 23 pices dfectueuses. Dterminer un intervalle
de confiance de la proportion de pices sans dfaut avec un niveau de confiance
0,95.
 Des modifications ont t apportes. On prlve de nouveau 100 pices et on

en trouve 9 dfectueuses.
Dterminer lintervalle de confiance correspondant.
 Conclure.

Exercice 5

Dans une grande ville, un nouveau cinma va tre construit. La municipalit propose un terrain proximit du centre ancien.
 Un premier sondage est effectu auprs de 100 personnes choisies de faon
alatoire et indique 53 avis favorables. Peut-on dire que la majorit de la population est favorable cet emplacement ?
 Un deuxime sondage effectu auprs de 500 personnes indique la mme

proportion davis favorables. La conclusion est-elle diffrente ?


 Un sondage effectu auprs de n personnes indique la mme proportion davis

favorables. A partir de quelle valeur de n peut-on estimer, au seuil de confiance


0,95, que la majorit de la population est favorable cet emplacement ?

Squence 9 MA01

23

Cned - Acadmie en ligne

4 Synthse de la squence
Intervalle de fluctuation asymptotique
Dfinition
Un intervalle de fluctuation asymptotique de la variable alatoire

X
Fn = n au seuil de 95% est un intervalle dtermin partir de p et de
n
n et qui contient Fn avec une probabilit dautant plus proche de 95% que

n est grand.

p (1 p )
p (1 p )
I n = p 1,96
; p + 1,96
est un intervalle de
n
n

fluctuation asymptotique au seuil de 95 %.


 Lintervalle

Conditions dutilisation
Les exigences habituelles de prcision pour utiliser cette approximation sont :
n 30, np 5 et n (1 p ) 5.
faut savoir utiliser un intervalle de fluctuation pour prendre une dcision.
La rgle de dcision adopte tant la suivante :
 Il

dans un chantillon, la frquence observe f appartient un intervalle de


fluctuation asymptotique au seuil de 95 % on considre que lchantillon est
compatible avec le modle ;

 si,

 sinon, on

considre que lchantillon nest pas compatible avec le modle.

Intervalle de confiance
Dfinition
Un intervalle de confiance pour une proportion p un niveau de confiance
0,95 est la ralisation, partir dun chantillon, dun intervalle alatoire
contenant la proportion p avec une probabilit suprieure ou gale 95%.

24

Cned - Acadmie en ligne

Squence 9 MA01

faut savoir estimer une proportion inconnue p grce un chantillon : la


proportion p est estime par la frquence f, lintervalle f 1 ; f + 1 tant

n
n

un intervalle de confiance au niveau 0,95.


 Il

Conditions dutilisation
On se place dans le cas o lchantillon contient au moins 30 lments et o la
frquence f observe est telle que nf 5 et n (1 f ) 5.
z La prcision de lestimation est donne par lamplitude de lintervalle
1
1 qui est gale 2 et dpend donc de la taille n de

;f +
f

n
n
n

lchantillon.

Squence 9 MA01

25

Cned - Acadmie en ligne

5 Exercices de synthse
Exercice I

Intervalle de uctuation (daprs ressources Education nationale)


Les personnes qui achtent un billet pour un voyage en avion ne se prsentent
pas toutes lembarquement. Les compagnies ariennes cherchent donc optimiser le remplissage dun avion en vendant ventuellement un nombre de billets
suprieur la capacit de lavion (on dit que les places sont vendues en surrservation ou en surbooking). Les compagnies ariennes veulent bien sr maitriser le
risque d cette pratique.
On considre un avion de 300 places, soit n le nombre de billets vendus, soit p
la probabilit quun client ayant achet un billet se prsente lembarquement
et soit X n la variable alatoire dsignant le nombre dacheteurs dun billet se
prsentant lembarquement.
On cherche valuer n, n > 300, tel que P ( X n > 300) 0,05, cest--dire tel
que la probabilit que le nombre de passagers se prsentant lembarquement
soit suprieur 300 soit environ de 0,05.
Pour modliser cette situation on suppose que les comportements des clients
sont indpendants les uns des autres.
 Dterminer la loi de X n .
 On suppose que p = 0,85. crire lintervalle de fluctuation asymptotique I n

du cours pour X n au seuil de 95 %.


n
300
 Montrer que si I n  0 ;
, alors la probabilit que le nombre de pas
n
sagers se prsentant lembarquement excde 300 est infrieur une valeur
proche de 0,05.
 On cherche dterminer la valeur de n maximale permettant de satisfaire la

300
condition I n  0 ;
.

n
300
a) Montrer que, si I n  0 ;
, alors 0,85n + 1,96 0,1275 n 300 0.

n
b) On dfinit sur [1; + [ la fonction f par f ( x ) = 0,85x + 1,96 0,1275 x 300.

26

Cned - Acadmie en ligne

Squence 9 MA01

Montrer que la fonction f est strictement croissante sur [1; + [ et dterminer le


plus grand entier n0 pour lequel la fonction f prend une valeur ngative.
300
c) Vrier que, pour cette valeur n0 , on a bien I n  0 ;
. Conclure.
0
n0
 Appliquer la mme dmarche lorsque p = 0,9 puis lorsque p = 0,95.

Commenter.

Exercice II

Intervalle de confiance
Pour estimer dans une population la proportion p des individus possdant le
caractre A, on interroge au hasard 80 lments de cette population. On observe
que 18 individus possdent le caractre A.
 Donner pour p un intervalle de confiance au niveau 0,95.
 Donner une condition sur le nombre n dindividus interrogs, pour que la prcision obtenue par lintervalle de confiance au niveau 0,95 soit infrieure 0,05.
 Donner une condition sur le nombre n dindividus interrogs, pour quavec

la mme frquence observe lintervalle de confiance au niveau 0,95 soit inclus


dans [ 0 ; 0,25].
 Dterminer un entier n vrifiant les deux conditions. Quel serait alors, avec la

mme frquence observe, lintervalle de confiance au niveau 0,95 ?




Squence 9 MA01

27

Cned - Acadmie en ligne