Vous êtes sur la page 1sur 8

Stage Nouveaux programmes de Terminale S - Ho Chi Minh-Ville Novembre 2012 chantillonnage et estimation Partie C - Frdric Barme page 1

chantillonnage et estimation
Partie C :
Capacits et exercices-types

1.

Rappelons tout d'abord les trois principales capacits mises en uvre :


Capacit A : Utiliser un intervalle de fluctuation pour dcider oui ou non dune conformit.
Capacit B : Utiliser un intervalle de confiance pour estimer une proportion (ou une probabilit) inconnue.
Capacit C : Dcider oui ou non de la fiabilit dune proportion annonce.

2.

Rappelons ensuite les outils disposition.


Les trois modes de calcul d'un intervalle de fluctuation :
Niveau 2de : Si n 25 et 0,2 p 0,8 , alors un intervalle de fluctuation est [ p
Niveau 1re : Un intervalle de fluctuation est [

;p+

].

a b
a est le plus petit entier tel que P( X a ) > 2,5 %
; ] avec
b est le plus petit entier tel que P( X b ) 97,5 % .
n n

np 5
Niveau Tale : Si n 30 et
, alors un intervalle de fluctuation est [ p 1,96
n (1p )5

p(1p)
p(1p)
; p + 1,96
].
n
n

Pour les intervalles de confiance, un seul mode de calcul :


nf 5
1
1
Niveau Tale : Si n 30 et
, alors un intervalle de confiance est [ f
;f+
].
n (1f)5
n
n
son propos :
Programme de Seconde :
Sensibiliser les lves la fluctuation dchantillonnage, aux notions dintervalle de fluctuation et dintervalle de confiance et lutilisation qui
peut en tre faite.
Aucune mention dans les Programmes de Premire
Programme de Terminale :
Estimer par intervalle une proportion inconnue partir dun chantillon.

Stage Nouveaux programmes de Terminale S - Ho Chi Minh-Ville Novembre 2012 chantillonnage et estimation Partie C - Frdric Barme page 2

3.

Voici maintenant une srie d'exercices-types.


Attention, ce ne sont pas des exercices destination des lves !
Ils ont t rdigs de faon minimaliste pour travailler le reprage de la capacit en uvre.
Pour chacun, classer en fonction de la capacit mise en uvre (A , B ou C ) et du niveau minimal requis (2de, 1re ou Tale).
Puis, proposer une rdaction-type de la rponse.
Remarque : propos de la Capacit A :
- on pourra choisir ou non de rdiger en utilisant lhypothse de conformit H0 ,
- dans le cas o f IF , on choisira entre trois types de rponses :
1) lincapacit juger la non-conformit,
2) le jugement de conformit avec risque derreur inconnu (ou non matris).
3) le jugement de conformit sans parler de l'erreur commise.

Niveau

Capacit

2de

Exercice 1
Dans une population, la proportion d'un certain caractre est 0,45 .
Dans un groupe de 150 personnes de cette population, on en compte 60 qui possdent le caractre.
Peut-on penser que le caractre est mal reprsent (*) dans ce groupe ?

La rdaction suivante est le minimum attendu (et suffisant...).


Ne pas oublier de faire vrifier les conditions d'utilisation.
p = 0,45 et n = 150

{ n0,2 25p 0,8

donc, les conditions dutilisation dun intervalle de fluctuation sont respectes.

0,45

0,45 +

1
0,368
150

1
0,532
150
donc, un intervalle de fluctuation est IF = [ 0,368 ; 0,532 ] .
f=

60
= 0,4 IF
150

Trois types de rponse seront accepts :


1)

donc, on ne peut pas penser que le caractre est mal reprsent.

2)

donc, on peut penser que le caractre nest pas mal reprsent, avec un risque d'erreur non matris.

3)

donc, on peut penser que le caractre nest pas mal reprsent.

On propose ici une version enrichie de la notion d'hypothse H0 : trs utilise dans le milieu professionnel, il faut
habituer les lves la frquenter.
Mais c'est peut tre prmatur en 2de, cela n'apporte rien l'objectif essentiel : comprendre le mode de raisonnement.
Cela peut mme gner en ajoutant une tche.
Posons lhypothse H0 : le caractre est conforme dans ce groupe,
i.e. le caractre nest pas sous reprsent.
p = 0,45 et n = 150

{ n0,2 25p 0,8

donc, les conditions dutilisation dun intervalle de fluctuation sont respectes.

0,45

0,45 +

1
0,368
150
1
0,532
150

donc, un intervalle de fluctuation est IF = [ 0,368 ; 0,532 ] .


f=

60
= 0,4 IF
150

donc, on accepte lhypothse H0 avec un risque derreur non matris : on peut penser que le caractre
nest pas mal reprsent.

Stage Nouveaux programmes de Terminale S - Ho Chi Minh-Ville Novembre 2012 chantillonnage et estimation Partie C - Frdric Barme page 3

Exercice 2
Dans une population, la proportion d'un certain caractre est 0,45 .
Dans un groupe de 500 personnes de cette population, on en compte 195 qui possdent le caractre.
Peut-on penser que le caractre est mal reprsent dans ce groupe ?

p = 0,45 et n = 150

{ n0,2 25p 0,8

donc, les conditions dutilisation dun intervalle de fluctuation sont respectes.

0,45

0,45 +

1
0,405
500
1
0,495
500

donc, un intervalle de fluctuation est IF = [ 0,405 ; 0,495 ] .


f=

195
= 0,39 IF
500

donc, on peut penser que le caractre est mal reprsent, avec un risque derreur de 5 %.
Version enrichie de la notion d'hypothse H0 :

2de

Tale

Posons lhypothse H0 : le caractre est conforme dans ce groupe,


i.e. le caractre nest pas sous reprsent.
p = 0,45 et n = 150

{ n0,2 25p 0,8

donc, les conditions dutilisation dun intervalle de fluctuation sont respectes.

0,45

0,45 +

1
0,405
500
1
0,495
500

donc, un intervalle de fluctuation est IF = [ 0,405 ; 0,495 ] .


f=

195
= 0,39 IF
500

donc, on rejette lhypothse H0 avec un risque derreur d'au plus 5 % : on peut penser que le caractre
est mal reprsent.
Exercice 3
Dans une population, on veut estimer la proportion d'un caractre.
Dans un groupe de 250 personnes issues de cette population, on en compte 170 qui possdent le caractre.
Donner une estimation de la proportion de ce caractre dans la population.

f=

170
et n = 250
250

170

250
170
250 +

1
0,617
250
1
0,743
250

donc, un intervalle de confiance au seuil 95% est IC = [ 0,617 ; 0,743 ] .


Donc on peut estimer la proportion entre 61,7 % et 74,3 % , avec un risque d'erreur d'au plus 5 %.
L'utilisation de l'intervalle de confiance en tant que sujet d'valuation n'apparat qu'en Tale.

Stage Nouveaux programmes de Terminale S - Ho Chi Minh-Ville Novembre 2012 chantillonnage et estimation Partie C - Frdric Barme page 4

Exercice 4
On annonce que, dans une population, 45 % des individus possdent un certain caractre.
Dans un groupe de 1 000 personnes issues de cette population, on en compte 360 qui possdent le
caractre.
Peut-on penser que cette proportion annonce est fausse ?

Supposons que p est 0,45 .


p = 0,45 et n = 1 000

{ n0,2 25p 0,8

donc, les conditions dutilisation dun intervalle de fluctuation sont respectes.

0,45

0,45 +

1
0,418
1 000
1
0,482
1 000

2de

Tale

1re

Alors un intervalle de fluctuation serait IF = [ 0,418 ; 0,482 ] .


et alors 95 % des frquences appartiendraient IF .
Or, la frquence du caractre f =

360
= 0,36 IF .
1 000

Donc, avec un risque derreur de 5 % , lhypothse que p est 0,4 est fausse : on peut penser que cette
proportion annonce est fausse.
C'est de l'hypothse du raisonnement par l'absurde dont on parle, pas de H0 ...
Noter l'utilisation du conditionnel.
Exercice 5
On annonce que, dans une population, 45 % des individus possdent un certain caractre.
Dans un groupe de 800 personnes issues de cette population, on en compte 376 qui possdent le caractre.
Peut-on penser que cette proportion annonce est fausse ?

376
et n = 800
800
1
376

0,435
800
800
f=

376
800 +

1
0,505
800

donc, un intervalle de confiance au seuil 95% est IC = [ 0,435 ; 0,505 ] .

Donc on peut estimer la proportion entre 43,5 % et 50,5 %, avec un risque d'erreur d'au plus 5 %.
Donc, il ny a pas de doute sur la proportion 45 % annonce.
Mme nonc que l'Exercice 4, mais l'utilisation de l'intervalle de confiance le place en T ale.
Exercice 6
Dans une population normale, la proportion d'un certain caractre est 0,85 .
Dans un groupe de 70 personnes, on en compte 50 qui possdent le caractre.
l'aide de la loi binomiale, dterminer si on peut penser que le caractre est mal reprsent dans ce
groupe.

On utilise la loi binomiale de paramtres p = 0,85 et n = 70 .


Le plus petit entier a tel que P( X a ) > 2,5 % est 53 .
Le plus petit entier b tel que P( X b ) 97,5 % est 65 .

53
0,757
70
65
70 0,929
donc, un intervalle de fluctuation est IF = [ 0,757 ; 0,929 ]
f=

50
0,714 IF
70

donc, on peut penser que le caractre est sous reprsent, avec un risque derreur de 5 %.
Aucun changement de fond, seule la technique de calcul est modifie et est impose par l'nonc.

Stage Nouveaux programmes de Terminale S - Ho Chi Minh-Ville Novembre 2012 chantillonnage et estimation Partie C - Frdric Barme page 5

Exercice 7
Dans une population normale, la proportion d'un certain caractre est 0,05 .
Dans un groupe de 200 personnes, on en compte 19 qui possdent le caractre.
Peut-on penser que le caractre est mal reprsent dans ce groupe ?

n 30
p = 0,05 et n = 200 donc np = 10 5
n(1 p) = 114 5
donc, les conditions dutilisation dun intervalle de fluctuation asymptotique sont respectes.

0,05 1,96
0,05 + 1,96

0,050,95
0,0197
200

Tale

0,050,95
0,0802
200

donc, un intervalle de fluctuation asymptotique est [ 0,0197 ; 0,0802 ] .


f=

19
= 0,095 IF
200

donc, on peut penser que le caractre est sous reprsent, avec un risque derreur de 5 %.
Aucun changement de fond, seule la technique de calcul est modifie et est impose par les conditions ( p trs faible).

(*) On entend par " mal reprsent " le fait de ne pas tre conforme la proportion de 0,45 de la population.
Il faut comprendre " sous reprsent ou sur reprsent ".
Attention bien conserver la nature bilatrale de la rpartition en cloche.
N'envisager que la sous reprsentation, par exemple, ne permettrait d'tudier que la moiti de la non-conformit et serait de nature
unilatrale.

4.

Extrait des Programmes de Terminale :


[AP] Prise de dcision lors de la comparaison de deux proportions (par exemple lors dun essai thrapeutique).
Sans ncessairement traiter les exercices suivants, retrouver la capacit concerne.
Pour les trois exercices suivants, la capacit concerne est la mme :
Capacit B : Utiliser un intervalle de confiance pour estimer une proportion (ou une probabilit) inconnue.
L'Exercice 8 est un classique, le procd mathmatique est d'ailleurs parfois repris dans certaines presses objectives pour prvenir de conclusions
htives la lecture de sondages.
L'Exercice 9 est un intermdiaire : il utilise le mme ressort logique que l'Exercice 8 mais sur deux candidats.
Il prpare l'Exercice 10, pour lequel le contexte est diffrent : on veut choisir entre deux mdicaments.
Il illustre l'extrait des programmes :
(AP) Prise de dcision lors de la comparaison de deux proportions (par exemple lors dun essai thrapeutique).
Exercice 8
Juste avant le second tour d'une lection, un dernier sondage auprs de 1 000 personnes reprsentatives donne une cote de
popularit de 52 % lun des deux candidats.
Peut-on prvoir qui va tre lu ?

Traitement :

0,52

0,52 +

1
0,488
1 000
1
0,551
1 000

La frquence de confiance 0,52 donne l'intervalle de confiance [ 0,488 ; 0,551 ] .


Donc, la proportion d'lecteurs de M se trouve entre 48, 8 % et 55, 1 % avec un risque d'erreur de moins de 5 %.
Il est possible que M runisse moins de 50 % des voix et ne soit pas lu.
Exercice 9
Avant un premier tour d'lections, on a effectu un sondage sur 500 personnes.
Un candidat A et un candidat B ont t crdits respectivement de 22,8 % et 18,9 % des intentions de vote.
Montrer qu'on ne peut prvoir l'ordre d'arrive de ces deux candidats.

Stage Nouveaux programmes de Terminale S - Ho Chi Minh-Ville Novembre 2012 chantillonnage et estimation Partie C - Frdric Barme page 6

Exercice 10
On compare l'efficacit de deux mdicaments.
Sur 100 malades, le premier donne 63 gurisons et le second 67 gurisons.
Le second est-il meilleur que le premier, ou bien ses meilleurs rsultats sont-ils dus aux fluctuations de l'chantillon ?

Traitement :

0,63

0,63 +

1
0,53
100
1
0,73
100
La frquence du 1er mdicament donne l'intervalle de confiance [ 0,53 ; 0,73 ] .
Donc, la probabilit de gurir avec ce 1er mdicament est entre 53 % et 73 % avec un risque d'erreur de moins de 5 %.

0,67

0,67 +

1
0,57
100

1
0,77
100
La frquence du 2me mdicament donne l'intervalle de confiance [ 0,57 ; 0,77 ] .
Donc, la probabilit de gurir avec le 2me mdicament est entre 57 % et 77 % avec un risque d'erreur de moins de 5 %.

On en dduit quil est possible que le taux de gurison du 1er mdicament soit le meilleur : on ne peut pas dcider du
mdicament le plus efficace avec cette enqute.

Remarque : Suite cet exercice, on peut demander un critre permettant de comparer lefficacit de deux mdicaments.
La comparaison est possible lorsque les deux intervalles de confiance sont disjoints.

5.

Les situations suivantes dcrivent des cas historiques.


On les retrouve facilement sur Internet et peuvent ventuellement faire lobjet dune recherche et dexpos.
Exercice 11
Claudio CASTANEDA, Sheriff, Petitioner, v. Rodrigo PARTIDA
En Novembre 1976 dans un comt du sud du Texas, Rodrigo Partida tait condamn huit ans de prison. Il attaqua ce
jugement au motif que la dsignation des jurs de ce comt tait discriminante lgard des Amricains dorigine mexicaine. Alors
que 79,1% de la population de ce comt tait dorigine mexicaine, sur les 870 personnes convoqus pour tre jurs lors dune
certaine priode de rfrence, il ny eut que 339 personnes dorigine mexicaine.
Devant la Cour Suprme, un expert statisticien produisit des arguments pour convaincre du bien fond de la requte de laccus.
En vous situant dans le rle de cet expert, pouvez-vous dcider si les Amricains dorigine mexicaine taient alors sous-reprsents
dans les jurys de ce comt ?

Exercice 12
The Aamjiwnaang First Nation is a First Nations community of about 850 Chippewa (Ojibwe) Aboriginal peoples.
They live on the shores of the St. Clair River in southwestern Ontario, Canada.
The people of the Aamjiwnaang First Nation are concerned that an abnormal birth rate is due to adverse effects of maternal and fetal
exposure to the effluent and emissions of the nearby chemical plants.
A review of birth records found there aren't very many boys being born in the southwestern Ontario community, and the number is
dropping.
According to a study published in the American journal Environmental Health Perspectives, only about a third of babies born on the
reserve between 1999 and 2003 were male. Going back to include another five years, only 41 per cent of babies born in the decade
were boys. The ratio is normally something closer to 50:50.
Residents of the 850-member Chemical Valley native group started asking questions in 2003 when they realized there were three allgirl softball teams and only one for boys.
Is it what we're breathing in on a daily basis? Is it where we played as kids? Is it something our parents did? Is it these small
exposures or is it because we've been living here our whole lives? asked Ada Lockridge, a member of the band's environmental
committee.
Is it really worrying? Or could it be due to chance?

Remarque : Voir aussi ltude des cas de leucmie chez des moins de 15 ans Woburn, Massachussetts, durant les annes 70,
qui a permis de dcouvrir le syndrome du trichlorthylne.

Stage Nouveaux programmes de Terminale S - Ho Chi Minh-Ville Novembre 2012 chantillonnage et estimation Partie C - Frdric Barme page 7

6.

Les exercices suivants n'valuent pas l'une des capacits A, B ou C.


Pour chacun, vous pouvez ventuellement traiter l'exercice et vous devez nommer la capacit requise.
Exercice 13
Un magasin estime que dans son bassin d'influence il peut compter environ 10 000 clients rguliers.
L'objectif de qualit est d'avoir un taux de satisfaction entre 90 % et 98 %.
On commande alors un institut de sondage une enqute auprs de ces clients rguliers pour mesurer le taux de satisfaction rel.
Par souci de prcision, le magasin exige un rsultat fiable plus ou moins 2 % avec un risque d'erreur d'au plus 5 %.
Combien de personnes au minimum doit-on interroger ?

Remarque : Les 90 % et 95 % sont des leurres.


Remarque : Ne pas confondre l'amplitude et le risque d'erreur.
La nouvelle capacit est exigible au niveau T ale :
Capacit : Dterminer une taille dchantillon suffisante pour obtenir, avec une prcision donne, une estimation dune proportion au niveau de
confiance 0,95.
Traitement :
Le sondage fournira une frquence de confiance f puis un intervalle de confiance [ f
La longueur de cet intervalle est donc 2

1
1
;f+
].
n
n

1
et doit tre infrieure ou gale celle demande par le magasin 2 2 % .
n

1
22%
n
1

0,02
n
1
n
0,022
n 2 500

On en dduit : 2

On doit interroger au minimum 2 500 personnes.


Exercice 14
En France, il y a environ 43 % de la population dont le groupe sanguin est O .
Sur une base militaire franaise, un hpital manque de sang de ce groupe. Il a besoin de 120 L.
On organise une collecte sur 800 personnes de la base en prlevant 450 mL de sang sur chaque donneur.
Donner un encadrement de la quantit de sang du groupe O qu'on peut attendre avec au plus 5 % derreur ?

Remarque : Plus concrtement, on peut demander la quantit minimale de sang attendue pour rpondre au besoin de 120 L.
Mais, on est alors dans une situation d'unilatralit.
Capacit : Utiliser un intervalle de fluctuation pour donner un encadrement de frquence, deffectif ou autre.
Traitement :
p = 0,43 et n = 800 donc n 25 et 0,2 p 0,8
donc, les conditions dutilisation dun intervalle de fluctuation sont respectes.

0,43

0,43 +

1
0,39
800
1
0,47
800

donc, un intervalle de fluctuation est IF = [ 0,39 ; 0,47 ] .


Donc, avec un risque d'erreur de 5%, :
- la frquence des donneurs O pour cette collecte est entre 0,39 et 0,47 ,
- le nombre de donneurs O pour cette collecte est entre 0,39800 = 312 et 0,47800 = 376 ,
- la quantit de sang O est entre 312450 mL = 140,4 L et 376450 mL = 150,4 L .

Stage Nouveaux programmes de Terminale S - Ho Chi Minh-Ville Novembre 2012 chantillonnage et estimation Partie C - Frdric Barme page 8

Exercice 15
Une entreprise livre des objets sujets une certaine fragilit.
On compte en gnral 3,5 % des objets casss la livraison.
Combien faut-il en commander pour tre sr 95 % den avoir 420 non casss ?

Capacit : Utiliser un intervalle de fluctuation pour donner un encadrement de frquence, deffectif ou autre.
Traitement :

n 30
p = 0,035 et n 420 donc np 14,7 5
n ( 1 p ) 405,3 5
donc, les conditions dutilisation dun intervalle de fluctuation asymptotique sont respectes.

0,035 1,96
0,035 + 1,96

0,035 ( 1 0,035 )
0,36
0,035
n
n
0,035 ( 1 0,035 )
0,36
0,035 +
n
n

donc, un intervalle de fluctuation asymptotique est [ 0,035

0,36
0,36
; 0,035 +
],
n
n

donc, on peut penser que, pour un chantillon de taille n , la frquence maximale fmax dobjets casss sera de 0,035 +
Alors : n n fmax = 420
0,36
) = 420
n
n ( 0,965 n 0,36 ) = 420

n ( 1 0,035

0,965 ( n ) 0,36 n 420 = 0


= (0,36) 40,965(420) = 1621,3296
donc :

n =

0,36 1621,3296
20,6765 (impossible) ou
20,965

n =

0,36 + 1621,3296
21,0496
20,965

et donc : n 21,0496 443,1


On en dduit quil faut commander 444 objets pour en avoir 420 non casss, avec un risque derreur de 5 %.

0,36
.
n