Vous êtes sur la page 1sur 66

duSCOL

Ressources pour le lyce gnral et technologique

Ressources pour la classe de premire


gnrale et technologique

Statistiques et probabilits

Ces documents peuvent tre utiliss et modifis librement dans le cadre des activits
d'enseignement scolaire, hors exploitation commerciale.
Toute reproduction totale ou partielle dautres fins est soumise une autorisation
pralable du Directeur gnral de lenseignement scolaire.
La violation de ces dispositions est passible des sanctions dictes larticle L.335-2
du Code la proprit intellectuelle.

fvrier 2012

MENJVA/DGESCO eduscol.education.fr/prog
Introduction
La place des probabilits et des statistiques dans lenseignement des mathmatiques en collge
et en lyce sest considrablement accrue depuis ces dernires annes. Pour les lves entrant en classe
de premire, lapprentissage des probabilits dbute dsormais ds la classe de troisime.
Au collge, lobjectif de cet enseignement est de dvelopper une rflexion sur lalatoire en gnral et
de sensibiliser les lves au fait que les situations alatoires peuvent faire lobjet dun traitement
mathmatique. Un vocabulaire spcifique est introduit et quelques rgles du calcul des probabilits
sont mises en place.
La classe de seconde est loccasion pour llve dapprofondir la formalisation de ces notions en
dgageant notamment la notion de modle probabiliste, et dtre sensibilis, travers des situations de
prise de dcision ou destimation dune proportion, aux premiers lments de statistique infrentielle
comme la notion dintervalle de fluctuation et celle dintervalle de confiance, introduites sous des
conditions de validit qui les rendent rapidement oprationnelles.
Avec la notion de variable alatoire et la dcouverte de la loi binomiale, le programme de Premire
fournit les outils mathmatiques qui permettent, en prenant appui sur la rflexion initie en Seconde
autour de la prise de dcision, de construire un intervalle de fluctuation et dtablir une dmarche de
prise de dcision valables en toute gnralit pour une proportion et une taille dchantillon
quelconques. Ce thme se prte en particulier la mise en uvre dalgorithmes et de raisonnements
logiques et, au-del, une adaptation de ces raisonnements au domaine de lalatoire et de lincertain.
En Terminale, la problmatique de prise de dcision sera travaille nouveau, et la rflexion initie en
Seconde sur lestimation sera approfondie avec lintroduction doutils mathmatiques
supplmentaires.
Dans ce document ressource, le professeur trouvera des complments thoriques et un ensemble de
situations dveloppes dans le cadre du programme officiel. Laccent est surtout mis sur les notions
nouvelles par rapport aux prcdents programmes de Premire : rptition dexpriences identiques et
indpendantes, loi gomtrique tronque, loi binomiale, chantillonnage et prise de dcision avec la loi
binomiale.
Les exemples dapplication ont t choisis pour montrer la varit, la richesse et lactualit des
applications possibles des probabilits et de la statistique. Ils ne prtendent pas lexhaustivit et ne
sont pas conus comme des activits pdagogiques cl en main , tout comme le plan adopt pour
les exposer ne se veut pas une progression pdagogique. Ces situations visent plutt ouvrir des pistes
de travail susceptibles dtre exploites par le professeur ; cest pourquoi elles sont traites de faon
suffisamment dtaille afin de permettre au professeur de sen inspirer pour laborer, partir de la
connaissance de sa classe et de sa pratique professionnelle, des activits pdagogiques ajustes au
niveau de ses lves.
Enfin les points prsents dans les annexes du document ne sont pas des attendus du programme. Ils
doivent tre considrs comme des complments dinformation lattention du professeur sur les
notions introduites. Ils permettent de mieux situer le cadre mathmatique plus gnral dans lequel
sinscrivent les notions au programme.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 1 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Tabledesmatires
I. Statistique descriptive, analyse de donnes...................................................................................... 4
II. Variables alatoires discrtes ..................................................................................................... 5
III. Utilisation des arbres pondrs................................................................................................... 7
A. Exemple dexprience alatoire deux preuves....................................................................... 7
B. Justification de larbre des probabilits...................................................................................... 9
1. tape 1 ................................................................................................................................... 9
2. tape 2 ................................................................................................................................... 9
3. tape 3 ................................................................................................................................. 10
C. Gnralisation et exploitation en Premire............................................................................... 11
IV. Loi gomtrique tronque ........................................................................................................ 12
A. tude de la loi gomtrique tronque....................................................................................... 12
1. Approche de la loi gomtrique tronque ............................................................................ 12
2. Dfinition de la loi gomtrique tronque ........................................................................... 13
3. Expression de la loi gomtrique tronque .......................................................................... 13
4. Algorithme de simulation .................................................................................................... 13
5. Reprsentation graphique..................................................................................................... 15
6. Esprance de la loi gomtrique tronque ........................................................................... 16
B. Exemples dactivits ................................................................................................................ 17
1. Limitation des naissances .................................................................................................... 17
2. Le paradoxe de Saint-Ptersbourg ....................................................................................... 19
V. Loi binomiale ........................................................................................................................... 22
A. Dfinitions................................................................................................................................ 22
1. Approche de la loi binomiale ............................................................................................... 22
2. Dfinition de la loi binomiale .............................................................................................. 24
3. Coefficients binomiaux ........................................................................................................ 24
B. Proprits.................................................................................................................................. 25
1. Expression de la loi binomiale ............................................................................................. 25
2. Proprits des coefficients binomiaux ................................................................................. 25
3. Reprsentation graphique..................................................................................................... 27
4. Esprance et cart-type ........................................................................................................ 27
C. Exemples dactivits ................................................................................................................ 30
1. Avec la loi de probabilit..................................................................................................... 30
2. Avec lesprance mathmatique .......................................................................................... 31
VI. chantillonnage et prise de dcision ........................................................................................ 32
A. Intervalle de fluctuation avec la loi binomiale ......................................................................... 32
B. Aspect gnral de la prise de dcision avec la loi binomiale ................................................... 34
C. Dtermination de lintervalle de fluctuation laide dun algorithme ..................................... 34
D. Exemples dactivits ................................................................................................................ 36
1. Exemple 1 : politique dans un pays lointain ........................................................................ 36
2. Exemple 2 : discrimination .................................................................................................. 37
3. Exemple 3 : scurit au carrefour ........................................................................................ 38
4. Exemple 4 : gauchers ........................................................................................................... 38

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 2 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
5. Exemple 5 : sgrgation sexiste lembauche..................................................................... 39
6. Exemple 6 : gnrateur de nombres alatoires..................................................................... 39
E. Lien avec lintervalle de fluctuation exploit en classe de Seconde ........................................ 39
VII. Annexes.................................................................................................................................... 42
A. Couple dindicateurs et problmes de minimisation ................................................................ 42
1. Position du problme ........................................................................................................... 42
2. tude des trois fonctions d1 , d 2 et d ............................................................................... 42
B. Loi faible des grands nombres.................................................................................................. 44
C. Esprance de la loi gomtrique tronque : approches exprimentales ................................... 45
1. Calculatrice .......................................................................................................................... 45
2. Algorithme modifi sur Algobox......................................................................................... 45
3. Point de vue numrique ....................................................................................................... 46
4. Point de vue graphique......................................................................................................... 46
D. Loi gomtrique ....................................................................................................................... 47
1. Quelques proprits de la loi gomtrique........................................................................... 47
2. Prcautions en classe de Premire ....................................................................................... 47
3. Une approche laide de lalgorithmique............................................................................ 47
4. Langage naturel.................................................................................................................... 47
5. Sur calculatrice..................................................................................................................... 47
6. Sous Algobox....................................................................................................................... 48
7. Sous Scilab........................................................................................................................... 48
E. Quelques outils de calcul avec la loi binomiale ....................................................................... 48
1. Tableur ................................................................................................................................. 48
2. Un logiciel : Scilab............................................................................................................... 49
3. Deux modles de calculatrice .............................................................................................. 50
F. Coefficients binomiaux et quadrillage ..................................................................................... 51
1. De larbre au quadrillage ..................................................................................................... 51
2. Interprtation des coefficients binomiaux............................................................................ 53
3. Formule de Pascal ................................................................................................................ 53
4. Application : le problme des pilules................................................................................... 53
5. Simulation de lexprience sur Algobox.............................................................................. 54
6. Traitement mathmatique .................................................................................................... 54
G. Complments sur la prise de dcision ...................................................................................... 56
1. Laffaire Woburn ................................................................................................................. 56
2. Radioactivit ou bruit de fond ?........................................................................................... 61
3. Cartes de contrle ................................................................................................................ 63

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 3 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
I. Statistique descriptive, analyse de donnes
Ltude et la comparaison de sries statistiques menes en classe de seconde se poursuivent avec la
mise en place de nouveaux outils. Dans un premier temps, les caractristiques de dispersion (variance,
cart-type) sont dtermines laide de la calculatrice ou dun tableur. Afin dutiliser de faon
approprie les deux couples dindicateurs usuels (moyenne/cart-type et mdiane/cart interquartile)
qui permettent de rsumer une srie statistique, il semble utile de rappeler le lien entre ces couples
(position/dispersion) et un problme de minimisation (voir annexe 1). Il convient aussi de rappeler que
lutilisateur dun outil statistique doit prendre en compte la situation relle et les objectifs viss pour
effectuer le choix des indicateurs de faon pertinente.
Les exemples de sries statistiques amnent utiliser lun des deux couples notre disposition. Ils
suscitent une rflexion sur le choix dun rsum statistique. Dans les exemples proposs en classe, il
est important de faire remarquer que deux sries de mme cart-type (et de mme moyenne et
mdiane) peuvent avoir une distribution trs diffrente. Cest alors loccasion de rappeler lintrt dun
graphique, qui peut tre plus parlant quun simple rsum numrique.
Il nexiste pas de rgle (au sens mathmatique) qui indiquerait quel type dindicateur statistique
utiliser par rapport une situation donne. Le choix des indicateurs dpend de ce quon veut en faire et
de la ralit de la situation. On peut juste proposer quelques remarques qui conduisent privilgier tel
couple plus que tel autre. Le couple (mdiane, cart interquartile), sans apporter les mmes
renseignements que le couple (moyenne, cart-type), est peu sensible aux valeurs extrmes. Dans de
nombreux domaines il est privilgi et souvent associ une reprsentation graphique en bote
moustaches. De manire gnrale, la moyenne arithmtique est peu significative quand linfluence des
valeurs extrmes est trop forte. Quant la mdiane, elle ne se prte pas aux calculs algbriques, cest
pourquoi, dans le cas o la srie statistique est forme de divers sous-ensembles homognes, on lui
prfre la moyenne.
Le diagramme en bote (ou bote moustaches) est une reprsentation graphique qui permet davoir
une bonne vision dune srie statistique. En effet, beaucoup dinformations sont disponibles sur ce
diagramme (mdiane, cart interquartile et valeurs extrmes), ce qui en fait un trs bon outil pour
comparer deux sries statistiques. Il faut noter quil nexiste pas de dfinition commune (au sens
mathmatiques du terme) du diagramme en bote, mais il semble assez rpandu dutiliser les
conventions suivantes :
o la bote est un rectangle limit par le premier et le troisime quartile o figure la mdiane ;
o les moustaches en revanche peuvent sachever aux valeurs extrmes (le minimum et le maximum
de la srie) ou aux premier et neuvime dciles1. Dautres conventions sont quelquefois utilises.
On obtient alors un diagramme comme suit :

xmin Q1 Me Q3 xmax

25 % 50 % 75 %

Au-del de la ralisation dun diagramme en bote, il est surtout important de savoir interprter et
dutiliser ces diagrammes pour des comparaisons pertinentes de deux sries statistiques.

1
Dfinition du dcile Dk : pour k de l 9, le ke dcile not Dk est la plus petite valeur dune srie statistique telle quau
moins (k 10) % des valeurs de la srie sont infrieures ou gales Dk .
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 4 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
II. Variables alatoires discrtes
Afin dinterprter lesprance comme la valeur moyenne dans le cas dun grand nombre de
rptitions, on considre lexprience alatoire consistant lancer un d suppos quilibr six faces
et noter le numro observ. On considre ensuite la variable alatoire discrte note X qui prend la
valeur 1 si on observe 1, la valeur 2 si on observe 2, 3 ou 4 et enfin la valeur 4 si on observe 5 ou 6.
Son esprance est
E ( X ) = 1 P( X = 1) + 2 P ( X = 2) + 4 P( X = 4) = 1 1 / 6 + 2 (1 / 6 + 1 / 6 + 1 / 6) + 4 (1 / 6 + 1 / 6) = 15 / 6
,soit E ( X ) = 2,5 .

laide dune simulation, on rpte un grand nombre de fois cette exprience alatoire lidentique et
on peut ainsi observer un grand nombre de ralisations de la variable alatoire X. Le graphique suivant
montre lvolution de la moyenne observe en fonction du nombre n de rptitions.

3,40

3,20
MoyenneobserveetesprancedeX

3,00

2,80

2,60

2,40

2,20

2,00

1,80
0 200 400 600 800 1000

Valeurden

On remarque que les moyennes observes se stabilisent autour de lesprance mathmatique de la


variable alatoire X. On peut aussi reprsenter lvolution de la variance des observations et remarquer
que lorsque le nombre de lancers augmente, la variance observe se stabilise vers la variance de la
variable alatoire X qui vaut 1,25.

1,80

1,60
VarianceobserveetvariancedeX

1,40

1,20

1,00

0,80

0,60
0 200 400 600 800 1000

Valeurden

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 5 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Ces observations constituent une approche heuristique de la loi des grands nombres 2 . Celle-ci permet de
justifier le phnomne de stabilisation des frquences autour de la probabilit dun vnement.
Plus gnralement, on se place dans un modle probabiliste ; on considre un vnement A de probabilit
P(A) et la variable alatoire X qui prend la valeur 1 si on observe A et 0 sinon. La variable alatoire X suit
la loi de Bernoulli de paramtre p qui est gale P(A). Une simulation permet dobserver le phnomne
de stabilisation de la suite des frquences 3 observes f n de ralisation de lvnement A, lors de n
rptitions de la mme exprience alatoire, vers lesprance de X qui est gale P(A).
La simulation qui a donn le graphique suivant a t ralise pour un vnement A de probabilit p=1/3.

0,50
FrquenceobserveetprobabilitdeA

0,40

0,30

0,20

0,10
0 100 200 300 400 500 600 700 800 900 1000

Valeurden

Ainsi le phnomne de stabilisation (expression du registre du langage courant pour dire quune suite
de rels converge) est lillustration de la loi des grands nombres et ce phnomne nest justifiable
que lorsque le modle probabiliste est donn.

2
Un nonc et une preuve de la loi faible des grands nombres sont proposs dans lannexe 2.
3
Ces frquences peuvent tre interprtes comme des moyennes, cest--dire la moyenne des valeurs observes.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 6 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
III. Utilisation des arbres pondrs
A. Exemple dexprience alatoire deux preuves
On se donne :
o une urne contenant quatre boules indistinguables au toucher dont trois boules bleues, notes b1, b2 et
b3, portant respectivement les numros 1, 2 et 3, et une boule rouge unique, note r.
o un jeu de six cartes identiques portant chacune un chiffre en couleur : une carte avec un chiffre 1 en
vert, une carte avec un chiffre 2 en rouge, une carte avec un chiffre 2 en bleu, une carte avec un
chiffre 2 en vert, une carte avec un chiffre 3 en rouge, une carte avec un chiffre 3 en bleu.
On considre lexprience alatoire suivante : on prlve de faon quiprobable une boule dans lurne
puis une carte du jeu. On note, dans lordre, la couleur de la boule extraite et le numro inscrit sur la
carte.
On rappelle quun modle associ cette exprience alatoire est dfini par la donne :
o de lensemble de toutes les issues possibles de lexprience ;
o dune probabilit P dtermine par ses valeurs pour chacun des vnements lmentaires dfinis
par ces issues.
La liste de toutes les issues possibles peut tre trouve en utilisant larbre des possibles ci-dessous. Les
issues possibles pour cette exprience alatoires sont les couples (R,1) ; (R,2) ; (R,3) ; (B,1) ; (B,2) ;
(B,3) o B dsigne la couleur Bleu et R la couleur Rouge .

1 (R, 1)

R 2 (R, 2)

3 (R, 3)

1 (B, 1)

B 2 (B, 2)

3 (B, 3)
Figure 1
Une fois les issues toutes identifies, il sagit de trouver la probabilit des vnements lmentaires
dtermins par chacune des issues. Il est clair que lquiprobabilit nest pas une rponse possible. En
effet, on a des raisons de penser que la couleur Bleu sera plus probable que la couleur Rouge et
que le chiffre 2 a plus de chances de sortir que les autres ; en consquence, lissue (B,2) a plus de
chances de sortir que lissue (R,1).
Pour affecter une probabilit chacune des issues, nous allons considrer un autre modle (qualifi par
la suite de modle intermdiaire) qui prend en compte, pour la boule extraite, sa couleur et aussi son
numro ventuel, et pour la carte, le chiffre mentionn mais aussi sa couleur. On peut recenser tous les
rsultats par larbre reprsentant les issues possibles ci-aprs.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 7 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
1 (r, 1)
2 (r, 2)
2 (r, 2)
r (r, 2)
2
3 (r, 3)
3 (r, 3)
1 (b1, 1)
2 (b1, 2)
2 (b1, 2)
b1
2 (b1, 2)
3 (b1, 3)
3 (b1, 3)

1 (b2, 1)
2 (b2, 2)
2 (b2, 2)
b2
2 (b2, 2)
3 (b2, 3)
3 (b2, 3)

1 (b3, 1)
2 (b3, 2)
2 (b3, 2)
b3 (b3, 2)
2
3 (b3, 3)
3 (b3, 3)

Figure 2
On obtient 4 6 rsultats possibles. On peut les noter de la faon suivante : (r,1) ; (r,2) ; (r,2) ; (r,2) ;
(r,3) ; (r,3) ; ( b1 ,1) ; ( b1 ,2) ; ( b1 ,2) ; ( b1 ,2) ; ( b1 ,3) ; ( b1 ,3) ; ( b2 ,1) ; ( b2 ,2) ; ( b2 ,2) ; ( b2 ,2) ; ( b2 ,3) ;
( b2 ,3) ; ( b3 ,1) ; ( b3 ,2) ; ( b3 ,2) ; ( b3 ,2) ; ( b3 ,3) ; ( b3 ,3).

Chaque branche de larbre reprsente une issue, et compte tenu des conditions du tirage quiprobable
de la boule, puis du tirage quiprobable de la carte, il ny a pas de raison de penser quune branche de
larbre ait plus de chances dtre parcourue quune autre. On peut donc considrer que chacune des
1
issues prcdentes a la mme probabilit, gale , dtre ralise.
24
Dans le modle intermdiaire, par exemple, lvnement Tirer une boule bleue puis une carte
portant le chiffre 2 se reprsente mathmatiquement par le sous-ensemble des issues {( b1 ,2) ;
( b1 ,2) ; ( b1 ,2) ; ( b2 ,2) ; ( b2 ,2) ; ( b2 ,2) ; ( b3 ,2) ; ( b3 ,2) ; ( b3 ,2)}. Par suite, la probabilit de cet
9
vnement sera gale . Revenant alors au premier modle o lvnement Tirer une boule
24
bleue puis une carte portant le chiffre 2 se reprsente mathmatiquement par lvnement
9
lmentaire {(B,2)}, on prendra pour la probabilit dobtenir lissue (B,2). On peut faire de mme
24
pour les cinq autres issues : (R,1) ; (R,3) ; (B,1) ; (B,2) ; (B,3).

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 8 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Ce qui conduit au tableau ci-dessous donnant les probabilits affectes chaque issue du premier
modle :

(R,1) (R,2) (R,3) (B,1) (B,2) (B,3)


1 3 2 3 9 6
P({})
24 24 24 24 24 24

B. Justification de larbre des probabilits


Si on revient larbre (cf. figure 2) utilis pour trouver toutes les issues possibles du modle
intermdiaire, on constate que cet arbre est trs fastidieux dessiner. Dans la mesure o on ne
sintresse qu la couleur de la boule et au chiffre inscrit sur la carte, on peut allger sa construction,
moyennant quelques conventions de lecture, pour retrouver larbre (cf. figure 1) des issues possibles
du premier modle pondr par les probabilits et justifier la rgle des produits de la faon suivante :
1. tape 1
Partant de larbre de la figure 2, dans la mesure o on ne sintresse qu la couleur de la boule (et non
son numro ventuel) et quau chiffre inscrit sur la carte (et non sa couleur) on peut convenir de
reprsenter chaque branche de larbre de la figure 2 aboutissant la mme couleur de boule, par une
seule branche comprenant autant de traits parallles quil y a de boules physiques de cette mme
couleur. On procde de mme en reprsentant chaque branche de larbre de la figure 2 aboutissant un
mme chiffre de carte, par une seule branche comprenant autant de traits parallles quil y a de cartes
physiques avec ce mme chiffre inscrit avec des couleurs diffrentes. On obtient ainsi larbre plus
simple de la figure 3 ci-aprs qui contient cependant autant de branches que celui de la figure 2 tout se
rapprochant de lallure de larbre de la figure 1.

1 (R, 1)

R 2 (R, 2)

3 (R, 3)

1 (B, 1)

B 2 (B, 2)

3 (B, 3)

Figure 3
2. tape 2
On peut alors simplifier davantage larbre de la figure 3, en reprsentant chaque branche par un seul
trait pondr par le nombre de traits composant la branche correspondante dans larbre de la figure 3.
On obtient alors larbre pondr de la figure 4 qui suit :

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 9 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
1 1 (R, 1) 1 1

3
R 2 (R, 2) 1 3
1
2
3 (R, 3) 1 2

1 (B, 1) 3 1
3 1

3
B 2 (B, 2) 3 3
2

3 (B, 3) 3 2

Figure 4
On remarque alors que le produit des nombres rencontrs le long dun chemin reprsentant une issue
du premier modle est gal au nombre de chemins de larbre de la figure 2 qui ralisent lvnement
correspondant dans le modle intermdiaire. Ainsi, pour lvnement Tirer une boule bleue puis une
carte portant le chiffre 2 , cest--dire (B, 2), le produit 3 3 est gal au nombre de chemins dans le
modle intermdiaire, soit 9.
3. tape 3
Cette tape consiste pondrer chaque branche de larbre, non plus avec le nombre de traits
composant la branche correspondante dans larbre de la figure 3, mais avec le quotient de ce nombre
par le nombre total de branches dun mme niveau. On obtient ainsi larbre pondr suivant :

1 1 1 1
1 (R, 1) =
6 4 6 24
3
1 1 3 3
R 6 2 (R, 2) =
4 4 6 24
2 1 2 2
3 (R, 3) =
6 4 6 24
3 1 (B, 1) 3 1 3
1 =
4 6 4 6 24
3
3 3 9
B 6 2 (B, 2) =
4 6 24
2
3 2 6
6 3 (B, 3) =
4 6 24

Figure 5
On remarque alors que le produit des quotients affects aux diverses branches dun chemin aboutissant
3 3
une issue donne du premier modle, par exemple pour (B,2) le produit , est gal la
4 6
9
probabilit, dans cet exemple , que cette issue se ralise. Cette remarque est valable pour toutes les
24
branches de larbre. Au final, on peut constater que larbre de la figure 5 nest rien dautre que larbre
de probabilits associ larbre des possibles de la figure 1.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 10 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
C. Gnralisation et exploitation en Premire
La mthode utilise plus haut peut se gnraliser aisment au cas de la succession de n expriences
alatoires. Considrons n expriences alatoires, E1, E2, E3, , En, comportant chacune un nombre fini
dissues (non ncessairement le mme pour chaque exprience). Considrons lexprience alatoire E
obtenue par la ralisation successive (dans cet ordre) de ces n expriences alatoires. On peut alors
dessiner larbre de probabilits de lexprience E dont chaque chemin reprsente une issue 4 (indique
en bout de branche) de lexprience E. La probabilit quune issue se ralise est gale au produit des
probabilits rencontres le long du chemin reprsentant cette issue.
En classe de troisime et de seconde, on sest intress la succession de deux expriences
(ventuellement trois), pas ncessairement identiques. Ces activits ont permis llve de se
familiariser avec les arbres de probabilits construits intgralement.
En Premire, on sintresse surtout la rptition dune mme exprience alatoire, un certain nombre
n de fois. Contrairement aux classes prcdentes, ce nombre n peut alors tre ventuellement grand,
notamment lorsquil sagit de rinvestir les arbres de probabilits dans le cadre de la loi binomiale.
Un exemple dactivit sur la rptition dune mme exprience alatoire trois issues est propos ci-
dessous. Il permettra llve de rinvestir ses connaissances acquises dans les classes prcdentes et
de le prparer manipuler des arbres de probabilits, non ncessairement construits intgralement du
fait du grand nombre de rptitions de la mme exprience alatoire, lorsquil abordera ltude des
proprits des coefficients binomiaux.
La justification propose prcdemment pour les rgles de calcul sur les arbres ne fonctionne que pour
des valeurs rationnelles des probabilits et lon admet que ces rgles restent valables pour des valeurs
relles quelconques.
Exemple : rptition dune exprience trois issues
On fait tourner la roue de loterie prsente ci-contre : on obtient la couleur
Rouge avec la probabilit 0,5, la couleur Bleu avec la probabilit 0,25 et bleu
la couleur Blanc avec la probabilit 0,25. Ensuite, on fait tourner une
deuxime fois, puis une troisime fois la mme roue dans des conditions
rouge
identiques, et on note les couleurs obtenues.
1. Un joueur est gagnant lorsquil obtient dans cet ordre les couleurs
Bleu , Blanc , Rouge . Quelle est la probabilit de gagner ce jeu ?
2. Quelle est la probabilit que le joueur obtienne dans le dsordre les couleurs Bleu ,
Blanc , Rouge ?
La ralisation dun arbre pondr permet de visualiser les calculs de probabilit demands.
Pour la premire question, il suffit de considrer le seul chemin Bleu-Blanc-Rouge qui a donc pour
probabilit 0,25 0,25 0,5.
Pour la deuxime question, il reste considrer les 5 chemins qui comportent les trois couleurs dans le
dsordre. La probabilit de chaque chemin est 0,25 0,25 0,5 donc la rponse est 5 0,25 0,25
0,5.
travers cette activit on rencontre ainsi des chemins de mme probabilit, situation qui sera reprise
au moment de lintroduction de la loi binomiale.

4
Une issue de lexprience E est une suite ( 1 , 2 ,, k ,, n ) o k est une issue de lexprience E k .
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 11 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
IV. Loi gomtrique tronque
Les situations de rptition dune mme exprience alatoire, reproduite dans des conditions
identiques constituent un lment fort du programme de Premire.
Lintroduction de la loi gomtrique tronque prsente de nombreux avantages :

travailler des rptitions dune exprience de Bernoulli ;


envisager ces rptitions sous langle algorithmique ;
prsenter une situation darbre pour lequel tous les chemins nont pas la mme longueur ;
exploiter hors de lanalyse les proprits des suites gomtriques ;
exploiter hors du cadre habituel des rsultats relatifs la drivation ;
travailler les variables alatoires.

A. tude de la loi gomtrique tronque


1. Approche de la loi gomtrique tronque
La probabilit quun atome se dsintgre par unit de temps est 0,07. On dcide dobserver cette
dsintgration en limitant le temps dattente 100 units de temps, et lon convient de noter 0 lorsque,
aprs 100 units de temps, latome nest pas encore dsintgr. On distingue ainsi cette situation de la
dsintgration lors de la 100e unit de temps.
On peut concevoir un algorithme qui affiche une srie de 200 temps dattente avant la dsintgration,
ainsi que le temps moyen dattente calcul partir de ces 200 valeurs.
On constate que les temps dattente avant dsintgration sont, individuellement, extrmement
imprvisibles. En revanche, la moyenne sur 200 expriences est relativement stable avec des valeurs
autour de 13, 14 ou 15. Il est donc sans doute intressant dtudier de plus prs la loi de la variable
alatoire temps dattente . On montre que lesprance de cette variable alatoire vaut
100
7
[ ]
1 8 0,93100 , soit environ 14,2.

On a relev ci-dessous, sur tableur, 10 sries de 200 temps dattente. La moyenne et lcart-type de
chaque srie sont affichs. Cela permet de constater combien la dispersion des valeurs individuelles
est grande alors que celle des moyennes est petite.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 12 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
2. Dfinition de la loi gomtrique tronque
Soit p un rel de lintervalle ]0,1[ et n un entier naturel non nul. On considre lexprience alatoire
qui consiste rpter dans des conditions identiques une exprience de Bernoulli de paramtre p avec
au maximum n rptitions et arrt du processus au premier succs.
On appelle loi gomtrique tronque de paramtres n et p la loi de la variable alatoire X dfinie par :
X = 0 5 si aucun succs na t obtenu ;
pour 1 k n , X = k si le premier succs est obtenu ltape k.
1p E EEEE
1p E
p
1p E S EEES
p S
1p E EES
p
S ES
p
S S
3. Expression de la loi gomtrique tronque
Larbre permet de dterminer la loi de la variable alatoire X dcrite ci-dessus, cest--dire la loi
gomtrique tronque de paramtres n et p, o n un entier naturel non nul et p un rel de lintervalle ]0,1[.

si aucun succs na t obtenu, X = 0 et P(X = 0) = (1 p)n ;


pour 1 k n, le premier succs est obtenu ltape k pour le chemin qui prsente dans
lordre k 1 checs et un succs, do : P(X = k) = (1 p)k 1p.
n
On vrifie facilement que P( X = k ) = 1 (exploitation des sommes de suites gomtriques).
k =0

4. Algorithme de simulation
Le processus li la loi gomtrique tronque est ais mettre en uvre avec un algorithme. Il suffit
de remarquer que linstruction ent(NbrAlat + p) gnre un nombre alatoire entier qui vaut 1 avec la
probabilit p, et 0 avec la probabilit 1 p.

a) En langage naturel
Entres : valeur de n
valeur de p
Initialisations : a prend la valeur 0
k prend la valeur 0
Traitement : Tant que a = 0 et k < n
a prend la valeur ent(NbrAlat + p)
k prend la valeur k + 1
Fin de la boucle "tant que"
Sortie : Si a = 0
Alors afficher message "X = "
valeur de a
Sinon afficher message "X = "
valeur de k
Fin de linstruction conditionnelle

5
La convention, X = 0 si aucun succs na t obtenu, permet dassurer les mmes valeurs pour P(X = k) et
P(Y = k) pour k [ 1 , n1 ] si X suit la loi gomtrique tronque de paramtres n1 et p, Y la loi gomtrique
tronque de paramtres n2 et p, avec n1 < n2.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 13 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
b) Avec une calculatrice (modle TI 84+)
Linstruction "et" se trouve dans le catalogue.

c) Avec le logiciel Algobox

d) Avec le logiciel Scilab

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 14 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Il est possible de modifier cet algorithme pour obtenir une srie de valeurs de la variable X (voir
annexe 3). Grce ces donnes, on peut alors visualiser une reprsentation graphique de la distribution
de la loi gomtrique tronque.
5. Reprsentation graphique
Les diagrammes ci-dessous sont obtenus pour des sries de 1000 valeurs avec dune part p = 0,3 et
dautre part p = 0,8. Il est frappant de noter que lorsque n devient grand les histogrammes ont des
allures semblables.

Ltude de lexpression de la loi gomtrique tronque va permettre dexpliquer en partie ces


observations.
La suite de terme gnral p(1 p)k 1 est dcroissante, donc lallure gnrale des diagrammes (hormis
le bton correspondant k = 0) se trouve confirme.
Pour p = 0,3 , on obtient en fonction de n :
P(X = 0) = (0,7)n et pour 1 k n, P(X = k) = 0,3 (0,7)k 1.
Il est facile de vrifier avec une calculatrice que :
(0,7)n < 0,005 pour n > 14 et 0,3 (0,7)k 1. (0,7) n < 0,005 pour k > 12.

Ainsi, pour les diagrammes correspondant aux valeurs n = 30 et n = 60, il nest pas surprenant de ne
voir figurer aucune ralisation de la valeur 0. De mme, les btons correspondant aux valeurs de k
suprieures ou gales 13 ont une hauteur pratiquement nulle.
Pour p = 0,8 , on obtient en fonction de n :
P ( X = 0) = (0,2) n et pour 1 k n , P( X = k ) = 0,8 (0,2) k 1 .
(0,2) n < 0,002 pour n > 3 et 0,8 (0,2) k 1 < 0,0005 pour k > 5 .

Les diagrammes correspondants sont compatibles avec ces valeurs seuil. En particulier, pour n = 5, on
nobserve pas de ralisation de la valeur 0.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 15 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
6. Esprance de la loi gomtrique tronque
Au niveau de la classe de Premire, la dtermination de lesprance de la loi gomtrique tronque de
paramtres n et p mobilise la fois les suites gomtriques et la drivation.
Sans tre exigible, cette activit peut faire lobjet dun travail de recherche.
Activit :
Pour tout lexercice, X dsigne une variable alatoire de loi gomtrique tronque de paramtres n et p.
On pose : q = 1 p .

[ ]
n n
1. Montrer que E ( X ) = p
k =1
k (1 p ) k 1 = p kq
k =1
k 1
= p 1 + 2q + 3q 2 + L + nq n 1 .

2. Soit f la fonction dfinie sur lintervalle ] 0 , 1 [ par : f ( x) = 1 + x + x 2 + L + x n .

a. Pour tout rel x de lintervalle ] 0 , 1 [ , crire f ( x) sous la forme dun quotient.

b. Vrifier que la fonction f est drivable sur lintervalle ] 0 ,1 [ et calculer deux expressions
diffrentes de f ( x) pour tout rel x lment de lintervalle ] 0 ,1 [ .
n
c. En dduire le calcul de la somme 1 + 2 x + 3x 2 + L + nx n 1 = k x
k =1
k 1
pour tout rel x de

lintervalle ] 0 ,1 [ .

3. Prouver lgalit E ( X ) =
1
p
[
1 (1 + np )(1 p) n . ]
4. Utiliser un outil numrique ou graphique pour mettre une conjecture sur la limite de E ( X ) lorsque
n tend vers linfini.
Remarque :

1
La limite de E ( X ) semble tre gale (voir les illustrations en annexe 3).
p

Pour dmontrer ce rsultat, la principale difficult est de calculer la limite en + de la suite (u n ) de


terme gnral u n = n(1 p) n .

u n +1
Pour cela, on peut considrer la suite (v n ) dfinie par v n = . Elle converge vers 1 p qui est
un
strictement infrieur 1. On obtient la limite de la suite (u n ) par comparaison avec une suite
gomtrique de limite nulle.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 16 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
B. Exemples dactivits
1. Limitation des naissances
(Daprs Claudine ROBERT, Contes et dcomptes de la statistique, d. Vuibert. Voir aussi le
document ressource de 2000 rdig par Claudine ROBERT.)

a) nonc
Pour limiter le nombre de filles dans un pays (imaginaire ?), on dcide que :
chaque famille aura au maximum 4 enfants ;
chaque famille arrtera de procrer aprs la naissance dun garon.
On considre que chaque enfant a une chance sur deux dtre un garon ou une fille et que, pour
chaque couple de parents, le sexe dun enfant est indpendant du sexe des prcdents.
Ce choix a-t-il la consquence attendue, savoir de diminuer le nombre de filles dans la population ?
Il nest pas inintressant de solliciter dabord une rponse a priori, cest une faon dentrer dans le
problme et de motiver son tude.

b) Simulation de lexprience sur un tableur


Les naissances dune famille se simulent sur une ligne. On passe facilement la simulation pour 1000
familles en recopiant les formules.

On entre en A4 : =ENT(ALEA()+0,5)

et en B4 : =SI(OU(A4=1;A4="");"";A4+ENT(ALEA()+0,5)), que lon recopie jusqu D4.

On dcompte le nombre denfants en E4 : =NB(A4:D4) et le nombre de garons en F4 :


=NB.SI(A4:D4;1).

Il reste recopier les formules de la ligne 4 jusqu la ligne 1003. Le calcul de N, G et P est alors
immdiat.

La simulation montre clairement que la proportion de garons semble bien rester voisine de 0,5. La
politique nataliste mise en place naurait donc aucun effet sur la modification de cette proportion.
On observerait la mme chose lorsque la probabilit de naissance dun garon est gale p.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 17 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
c) Reprsentation laide dun arbre
Le traitement mathmatique laide de larbre permet de valider les conjectures mises avec le tableur.

1/2 F famille FFFF

1/2 F

F 1/2 G famille FFFG


1/2
F 1/2 G famille FFG
1/2
1/2 G famille FG

1/2 G famille G

15 15 E (G ) 1
E(N ) = , E (G ) = , donc = .
8 16 E(N ) 2

Nombre total denfants N 4 4 3 2 1


Nombre total de garons G 0 1 1 1 1
Probabilit 1/16 1/16 1/8 1/4 1/2

Cette situation peut se prter une diffrenciation pdagogique selon que lon envisage la valeur
p = 0,5 ou p quelconque, selon que lon sen tienne 4 enfants au plus ou que lon gnralise n
enfants au plus.

d) Gnralisation
On considre lexprience alatoire qui consiste rpter dans des conditions identiques une exprience
de Bernoulli de paramtre p avec au maximum n rptitions et arrt du processus au premier succs. On
note toujours X la variable alatoire qui reprsente le rang du 1er succs et qui vaut 0 si aucun succs na
t obtenu. La variable alatoire X suit la loi gomtrique tronque de paramtres n et p.
On considre les variables alatoires A, nombre de succs et B, nombre dtapes du processus
alatoire.
La loi de la variable alatoire A est trs simple, elle ne prend que deux valeurs 0 et 1 avec :
P ( A = 0) = P ( X = 0) = (1 p) n
k =n
P ( A = 1) = P( X = k ) = 1 (1 p)
k =1
n

Lesprance de la variable alatoire A est donc : E ( A) = 1 (1 p ) n .

La variable alatoire B prend des valeurs entre 1 et n avec :


- pour 1 k n 1 , P ( B = k ) = P ( X = k ) = (1 p) k 1 p ;
- pour k = n , P ( B = n) = P( X = 0) + P ( X = n) = (1 p ) n + (1 p ) n 1 p .

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 18 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Lesprance de la variable alatoire B est donc :

[ ]
n 1
E ( B) = k p(1 p)
k =1
k 1
+ n p(1 p) n 1 + (1 p) n ,

n
soit E ( B) = k p(1 p)
k =1
k 1
+ n (1 p) n , ou encore E ( B) = E ( X ) + n (1 p) n .

On obtient aprs simplification E ( B) =


1
p
[
1 (1 p) n . ]
Conclusion : si lon rpte un grand nombre de fois ce processus de n tapes au maximum (ceci quelle
que soit la valeur de lentier n), on obtient en moyenne un nombre de succs gal 1 (1 p) n pour

un nombre moyen dtapes gal


1
p
[ ]
1 (1 p ) n . Ainsi, en moyenne, la proportion de succs est

gale p. Il est remarquable de retrouver cette probabilit de succs, quel que soit le nombre maximal
dtapes du processus.
2. Le paradoxe de Saint-Ptersbourg
Formul par Nicolas Bernoulli en 1713, ce problme a t approfondi par son cousin Daniel Bernoulli
dans louvrage Les transactions de lAcadmie de Saint-Ptersbourg, ce qui lui a valu son nom.

a) nonc
Un joueur joue contre la banque au jeu de pile ou face , en misant toujours sur face . Il adopte la
stratgie suivante : il mise un euro au premier coup, et sil perd, double la mise au coup suivant, tant
que face ne sort pas. Sil gagne, il rcupre sa mise augmente dune somme quivalente cette
mise. Le joueur dispose dune fortune limite, qui lui permet de perdre au maximum n coups
conscutifs et, si pile sort n fois de suite, le joueur ne peut plus miser et arrte le jeu. La fortune de
la banque, elle, nest pas limite.
Une partie consiste pour le joueur jouer, si sa fortune le lui permet, jusqu ce que face sorte.
Il sagit de dterminer la probabilit qua le joueur de gagner une partie, son gain algbrique moyen
par partie, et danalyser lintrt pour le joueur de jouer ce jeu.

b) Traitement mathmatique
Pour modliser la situation, on suppose que le joueur lance la pice n fois : si face sort avant le n-
ime coup, le joueur ne mise rien les coups suivants. Lorsquil joue n fois de suite pile ou face ,
on note :

An lvnement le joueur obtient n piles ; G = An lvnement : le joueur gagne la


partie ;
X la variable alatoire qui comptabilise le rang de la premire face, et lon convient que ce
rang est gal 0 si face ne sort pas ;
Y la variable alatoire qui donne le gain algbrique du joueur.
On envisage dabord le cas o le joueur dispose dune fortune limite, par exemple 1000 .
Le joueur double sa mise tant quil perd. Sa fortune lui permet de tenir n coups, o il mise
successivement (en euro) 1, 2, 22 , , 2n 1 , tant que 1 + 2 + ... + 2n1 1000 . La formule sommatoire
sur les suites gomtriques simplifie cette ingalit en : 2n 1 1000 . Do n = 9 .

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 19 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
1 1
On obtient P ( A 9 ) = 9
0,002 , do P (G ) = 1 P( A 9 ) = 1 9 0,998 .
2 2

1
La variable alatoire X suit la loi gomtrique tronque de paramtres 9 et . Elle prend les valeurs
2
1
entires de 0 9, avec P ( X = 0) = P ( A 9 ) = et, pour k compris entre 1 et 9 :
29
1 1 1
P( X = k ) = k 1
1 = k .
2 2 2
9
1 1 1 1
On vrifie bien que P( X = k ) = 2 + 2
k =0
2
+ ... + + =1.
29 29

Dterminons les valeurs de Y.


Si face sort pour la premire fois au k-ime coup (avec 1 k n ), le joueur a mis au total une
somme en euro gale 1 + 2 + ... + 2k 1 , il gagne le double de sa dernire mise, soit 2 2k 1 . Son gain
algbrique est donc gal 2k (1 + 2 + ... + 2k 1 ) , cest--dire 1 .

Si face ne sort pas, le joueur a perdu toutes ses mises, soit (en euro) 1 + 2 + ... + 28 = 29 1 = 511 .

On en tire la loi de la variable alatoire Y et son esprance mathmatique :

Valeurs de Y +1 (29 1)

1 1
Probabilits 1
29 29
1 1
E (Y ) = 1 1 9 (2 1) 9 = 0 .
9

2 2

c) Simulation de 1000 parties en 9 coups au plus sur un tableur


On code la sortie de face par 1 , celle de pile par 0 .

On place en A1 la formule =ENT(2*ALEA()) ,

puis en B1 la formule =SI(OU(A1=1;A1="");"";ENT(2*ALEA())) , que lon recopie jusquen I1 ;

enfin on place en K1 la formule =SI(SOMME(A1:I1)=0;"PERDU";"GAGNE") .

Les formules prcdentes sont recopies jusqu la ligne 1000.


Il reste alors en dcompter en M1 le nombre de parties perdues, avec la formule :
=NB.SI(K1:K1000;"PERDU") .

Quoique faible, la probabilit de perdre nest pas ngligeable. Sur la simulation prcdente, on
saperoit que le joueur perd effectivement 6 parties sur 1000. Il perd donc six fois 511 , soit 3066 .
Il a gagn 994 parties qui lui rapportent chacune 1 , soit un gain total de 994 . Il a donc perdu 2972
euros sur 1000 parties, soit environ 3 euros par partie en moyenne.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 20 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
d) Conclusions de ltude : deux paradoxes
Chaque partie gagne rapporte 1 au joueur. Si sa fortune tait illimite (ou simplement trs grande),
1
la probabilit de gagner, gale 1 n , aurait pour limite 1, et permettrait au joueur de gagner chaque
2
partie. Il semble donc que la stratgie du joueur constitue une martingale infaillible. Le jeu semble
favorable au joueur.

Cependant, puisque E (Y ) = 0 , le jeu est honnte. La stratgie mise en place donne une esprance de
gain identique celle du simple jeu de pile ou face. Cest un premier paradoxe.
Par ailleurs, ce problme montre la limite de la notion desprance pour juger si un jeu est favorable.
En effet, la simulation prcdente a rvl que la perte est importante, et quelle se produit plusieurs
fois sur 1000 parties. Peu de joueurs saventureraient dans un jeu pourtant honnte o lon risque de
perdre gros, mme si ce risque est faible, alors que lon gagne peu. Cest l le deuxime paradoxe.
La notion de risque, lie celle de la dispersion de la variable alatoire gain , est un lment dcisif
dapprciation dun jeu. Le paradoxe de Saint-Ptersbourg est lun des problmes ayant donn
naissance la thorie de la dcision en conomie. Dans cette thorie, on formalise en particulier la
notion de fonction dutilit, qui mesure le degr de satisfaction dun consommateur.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 21 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
V. Loi binomiale
A. Dfinitions
1. Approche de la loi binomiale
Les exemples suivants proposent, en sappuyant sur les outils dj disponibles, une dcouverte de la
loi binomiale avant sa formalisation mathmatique. Ces activits sont conues de faon faciliter une
formalisation progressive de ces notions.
Exemple 1 : mise en place du vocabulaire
On fait tourner la roue de loterie prsente ci-contre : on obtient la couleur rouge
avec la probabilit 0,75 et la couleur bleu avec la probabilit 0,25. bleu

Le joueur est gagnant lorsque la flche sarrte sur la zone bleue comme sur la figure
ci-contre. rouge

On dcide de noter S (comme succs) cette ventualit et de noter E (comme chec) lventualit
contraire cest--dire la flche tombe sur la zone rouge .

Une exprience deux issues, succs ou chec, est appele preuve de Bernoulli . La loi de
Bernoulli de paramtre p est la loi de la variable alatoire qui prend la valeur 1 en cas de succs
et 0 en cas dchec, o p dsigne la probabilit du succs.

Consigne aux lves : on joue trois fois de suite dans des conditions identiques et on dsigne par X la
variable alatoire qui donne le nombre de succs obtenus. Raliser un arbre pondr reprsentant cette
situation et en dduire la loi de la variable alatoire X puis son esprance mathmatique.

On parlera de schma de Bernoulli lorsquon effectue une rptition dpreuves de Bernoulli


identiques et indpendantes.

Exemple 2 : schma de Bernoulli pour un paramtre p quelconque


On fait maintenant tourner la roue de loterie prsente ci-contre : on obtient la
couleur Bleu avec une probabilit qui dpend de langle indiqu sur la bleu
figure et qui est note p. On obtient donc la couleur Rouge avec une
probabilit de 1 p .
rouge
On dcide encore de noter S (comme succs) cette ventualit et de noter E
(comme chec) lventualit contraire cest--dire la flche tombe sur la
zone rouge .
1) On rpte quatre fois cette preuve de Bernoulli de paramtre p. Reprsenter cette rptition par un
arbre pondr quatre niveaux.
2) On dfinit alors la variable alatoire X gale au nombre de succs obtenus lissue des quatre
rptitions.
En utilisant larbre, dterminer la probabilit des vnements suivants :

{X = 0} {X = 4} {X = 1} {X = 2}.
Il faut observer que les probabilits P ( X = 1) et P ( X = 2) sobtiennent en comptant les chemins qui
conduisent respectivement 1 et 2 succs.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 22 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
4 4
On note et on lit 1 parmi 4 le nombre de chemins qui conduisent 1 succs exactement. Ici, = 4 .
1 1
4 4
On note et on lit 2 parmi 4 le nombre de chemins qui conduisent 2 succs exactement. Ici, = 6 .
2 2

S
S
E
S S
E
E
S S
S E
E S
E E
S
S E
S S
E
E
E S
S
E
E S
E
E

Exemple 3 : utiliser une reprsentation mentale de larbre pondr


On dcide maintenant de rpter cinq fois cette preuve de Bernoulli et on note toujours X le nombre
de succs obtenus lissue des cinq rptitions. La ralisation de larbre pondr devient fastidieuse.
1) Sans raliser larbre, mais en sinspirant de ce qui a dj t fait, dterminer la probabilit des
vnements {X = 0} et {X = 5} .
2) On sintresse dan s cette question la probabilit de lvnement {X = 2} .
a) Quelle est la probabilit dun chemin conduisant exactement deux succs ?
5
b) On note et on lit 2 parmi 5 le nombre de chemins qui conduisent 2 succs.
2
Dterminer ce nombre en utilisant larbre dj ralis pour 4 rptitions.
Il y a deux faons dobtenir 2 succs selon qu la dernire tape on obtient un succs ou un chec.
o Si la dernire tape donne un chec, il faut compter les chemins qui au niveau prcdent
conduisaient dj 2 succs. Avec larbre dj ralis, on sait que 6 chemins sont dans ce cas.
o Si la dernire tape donne un succs, il faut compter les chemins qui au niveau prcdent
conduisaient un seul succs. Avec larbre dj ralis, on sait que 4 chemins sont dans ce cas.
En conclusion, 6 + 4 = 10 chemins de larbre des 5 rptitions conduisent 2 succs, soit avec les
5 4 4
notations introduites : = + .
2 2 1
5
Enfin la rponse attendue est : P ( X = 2 ) = 10 p 2 (1 p )3 ou P ( X = 2 ) = p 2 (1 p )3 .
2
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 23 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
2. Dfinition de la loi binomiale
On considre une preuve de Bernoulli de paramtre p. Un schma de Bernoulli associ n rptitions
de cette preuve peut tre reprsent par un arbre pondr qui comporte n niveaux.

Par dfinition, la loi binomiale de paramtres n et p, note B(n, p), est la loi de la variable alatoire
X qui donne le nombre de succs dans la rptition de n preuves de Bernoulli de paramtre p.

Quelques cas particuliers


Calcul de P ( X = 0) et de P ( X = n)

Lvnement {X = 0} est ralis sur lunique chemin de larbre qui ne comporte que des checs, cest-
-dire le dernier chemin de larbre qui est constitu de n branches qui ont toutes la probabilit 1 p .

Do le rsultat : P ( X = 0) = (1 p) n .

Lvnement {X = n} est ralis sur lunique chemin de larbre qui ne comporte que des succs, cest-
-dire le premier chemin de larbre qui est constitu de n branches qui ont toutes la probabilit p.

Do le rsultat : P ( X = n) = p n .

Calcul de P ( X = 1) et de P ( X = n 1)

Lvnement {X = 1} est ralis sur les chemins de larbre qui comportent exactement un succs et
n 1 checs. La probabilit de chacun de ces chemins est : p (1 p) n 1 .

Il reste dterminer combien de chemins de ce type figurent dans larbre pondr. Cette question est
assez simple dans la mesure o il suffit de reprer quel niveau de larbre figure lunique succs. Il y
a donc n possibilits et ainsi n chemins qui ralisent lvnement {X = 1} .

Do le rsultat : P ( X = 1) = n p (1 p) n 1 .

Lvnement {X = n 1} est ralis sur les chemins de larbre qui comportent exactement n 1
succs et 1 chec. La probabilit de chacun de ces chemins est : p n 1 (1 p ) .

Il reste dterminer combien de chemins de ce type figurent dans larbre pondr. Comme
prcdemment, il suffit de reprer quel niveau de larbre figure lunique chec. Il y a donc encore n
possibilits et ainsi n chemins qui ralisent lvnement {X = n 1} .

Do le rsultat : P ( X = n 1) = n p n 1 (1 p ) .

3. Coefficients binomiaux
Pour dterminer par exemple, P ( X = 2) on procderait de la mme faon : la probabilit de chaque
chemin qui ralise exactement deux succs est : p 2 (1 p )
n2
. Il faut ensuite multiplier cette
n
probabilit par le nombre de chemins qui prsentent exactement deux succs. Ce nombre est not
2
et on lit 2 parmi n . Il peut tre obtenu avec une calculatrice ou avec un tableur.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 24 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Plus gnralement :

n
Si n est un entier naturel et si k est un entier compris entre 0 et n, on note et on lit
k
k parmi n le nombre de chemins qui ralisent exactement k succs dans larbre n niveaux,
associ un schma de Bernoulli. Ces nombres sont appels coefficients binomiaux.

n
Ces nombres sont par construction des entiers et ltude prcdente nous fournit quelques valeurs :
k
n n
quel que soit n, entier naturel : = 1 ; = 1 ,
0 n
n n
quel que soit n, entier naturel non nul : = n ; = n ,
1 n 1
4 4 5
= 4 ; = 6 ; = 10 .
1 2 2

B. Proprits
1. Expression de la loi binomiale

La probabilit de chacun des chemins qui ralisent exactement k succs est p k (1 p )


nk
. On obtient
donc :

Soient un entier naturel n et un rel p de lintervalle [ 0 , 1]


La variable alatoire X gale au nombre de succs dans la rptition de n preuves de Bernoulli de
paramtre p suit la loi binomiale B(n, p), avec pour tout entier k compris entre 0 et n :
n
P ( X = k ) = p k (1 p ) n k
k

n
Remarque : les coefficients binomiaux interviennent comme coefficients dans la formule
k
gnrale ci-dessus, mais aussi dans la formule du binme de Newton qui donne le dveloppement de
(a + b ) n pour tous rels a et b.
2. Proprits des coefficients binomiaux
Symtrie

Le nombre de chemins ralisant n k succs est aussi le nombre de chemins ralisant k checs. Par
symtrie, on obtient autant de chemins ralisant k succs que de chemins ralisant k checs.

n n
Si n est un entier naturel et si k est un entier compris entre 0 et n, alors = .
k n k

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 25 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Formule de Pascal
Il sagit ici de calculer un coefficient binomial associ n + 1 rptitions partir des coefficients
calculs sur larbre ralis au niveau n.

n + 1
Le coefficient binomial donne le nombre de chemins qui ralisent exactement k + 1 succs.
k + 1

Il y a deux faons dobtenir k + 1 succs suivant qu la dernire tape on obtient un succs ou un


chec.
- Si la dernire tape donne un chec, il faut compter les chemins qui au niveau prcdent
n
conduisaient dj k + 1 succs. On sait que chemins sont dans ce cas.
k + 1

- Si la dernire tape donne un succs, il faut compter les chemins qui au niveau prcdent
n
conduisaient exactement k succs. On sait que chemins sont dans ce cas.
k

n n
En conclusion, + chemins de larbre des n + 1 rptitions conduisent k + 1 succs, do
k k + 1
le rsultat :

n + 1 n n
Si n est un entier naturel et si k est un entier compris entre 0 et n 1, alors = + .
k + 1 k k + 1

Deux faons dobtenir k + 1 succs en n + 1 tapes

n premires tapes (n + 1)-ime tape


n
chemins
k
k succs Succs

n
chemins
k + 1
k + 1 succs chec

Somme des coefficients binomiaux


En ajoutant tous les coefficients binomiaux obtenus sur un arbre de n rptitions, on obtient le nombre
total de chemins de larbre. Or cet arbre comporte n niveaux et chaque niveau on multiplie le nombre
de chemins existants par 2. Le nombre total de chemins est donc 2n. On obtient la relation :
n
n n n n
k = 0 + 1 + L n = 2
k =0
n
.

On pourra se reporter lannexe 5 pour lutilisation de quelques outils de calcul avec la loi binomiale.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 26 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
3. Reprsentation graphique
Dans ce document, on parle de grande binomiale si n 25 et 0,2 < p < 0,8 - conditions nonces
dans le programme de la classe de seconde , et dans le cas contraire, on parle de petite binomiale .
Petites binomiales

n = 10 ; p = 0,15 n = 15 ; p = 0,85
Grandes binomiales

n = 40 ; p = 0,25 n = 80 ; p = 0,85
Lobservation des diffrentes reprsentations graphiques permet de constater les comportements suivants :
dplacement vers la droite du diagramme n fix en fonction de la croissance de p ;
constatation analogue si p est fix et n augmente ;
allure symtrique en cloche des grandes binomiales ; il est facile de dmontrer lexacte
symtrie de la reprsentation lorsque p = 0,5 ;
dispersion maximale lorsque p = 0,5 .
4. Esprance et cart-type
Il sagit ici de proposer une activit conduisant une conjecture sur lexpression de lesprance et de
lcart-type dune loi binomiale.
On utilisera le tableur pour calculer, laide de linstruction SOMMEPROD, lesprance et la variance
de la loi B(n, p) pour diffrentes valeurs de n et p. La variance est obtenue partir de la relation
V ( X ) = E ( X 2 ) E ( X ) 2 (cette formule nest pas un attendu du programme).

Pour la copie dcran ci-dessous la valeur de p est 0,2 et les valeurs de n vont de 5 50 avec un pas de
5 units.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 27 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
La feuille de calcul est conue pour admettre des valeurs de n entre 0 et 100.
Dans les cellules de B3 K3 on a saisi : =$B1.
Dans la cellule B7 on a saisi : =SI($A7<=B$4;LOI.BINOMIALE($A7;B$4;B$3;0);" ") pour
demander laffichage de la probabilit de {X = k } , uniquement lorsque k n et une cellule vide dans
lautre alternative.
Dans la cellule B110 on a saisi : =SOMMEPROD($A7:$A107;B7:B107) pour obtenir lesprance de
la variable alatoire X de loi binomiale de paramtres n et p. Ladressage absolu sur la premire
colonne autorise la recopie vers la droite de cette formule.
Dans la cellule B112 on a saisi : =SOMMEPROD(($A7:$A107)^2;B7:B107) pour obtenir
lesprance de la variable X 2 .
La variance sobtient alors en B116 avec la formule =B112-B113.
On peut aussi obtenir la variance de X comme esprance de ( X E ( X ) ) en saisissant dans la cellule
2

B116 la formule : =SOMMEPROD(($A7:$A107B110)^2;B7:B107).

Observations pour p fix :

E (X ) en fonction de n pour p = 0,2 V (X ) en fonction de n pour p = 0,2


3,5 3

3 2,5
2,5
2
2
1,5
1,5
1
1
0,5 0,5

0 0
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16

E (X ) en fonction de n pour p = 0,7 V (X ) en fonction de n pour p = 0,7


12 3,5

10 3

8 2,5
2
6
1,5
4
1
2
0,5
0 0
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 28 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Lorsque la valeur de p est fixe, on observe que lesprance de la loi binomiale, aussi bien que sa
variance, semblent tre des fonctions linaires de n.
Observations pour n fix :

E (X ) en fonction de p pour n =15 V (X ) en fonction de p pour n =15

16 4
14 3,5
12 3
10 2,5
8 2
6 1,5
4 1
2 0,5
0 0
0 0,2 0,4 0,6 0,8 1 1,2 0 0,2 0,4 0,6 0,8 1 1,2

E (X ) en fonction de p pour n = 80 V (X ) en fonction de p pour n = 80


90 25
80
70 20
60
15
50
40
10
30
20 5
10
0 0
0 0,2 0,4 0,6 0,8 1 1,2 0 0,2 0,4 0,6 0,8 1 1,2

Lorsque la valeur de n est fixe, on observe que lesprance de la loi binomiale semble aussi tre une
fonction linaire de p. De plus, on peut noter que la valeur obtenue avec le cas particulier p = 1
correspond la valeur de n qui a t fixe. Do la conjecture E ( X ) = n p que le professeur validera
dans le cours.
En revanche, la variance se comporte comme une fonction du second degr en p. On peut noter aussi
que la variance semble bien tre maximale pour p = 0,5 comme lobservation des reprsentations
graphiques le laissait prvoir.
Un rinvestissement des notions danalyse permet, par exemple, de dterminer les fonctions
polynmes du second degr qui sont maximales en 0,5 et qui sannulent en 0 et 1. La linarit selon la
variable n incite chercher un coefficient multiple de n et quelques essais permettent daboutir
lexpression V ( X ) = np (1 p ) que le professeur validera dans le cours.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 29 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
C. Exemples dactivits
1. Avec la loi de probabilit

a) Appariement
On a reprsent ci-dessous la distribution de probabilit de quatre variables alatoires suivant les lois
binomiales B (30 ; 0,1), B (30 ; 0,5), B (30 ; 0,9), B (29 ; 0,5).

Associer chaque loi son graphique.

b) Le quorum
Une association comprenant 30 adhrents organise chaque anne une assemble gnrale. Les
statistiques montrent que chaque adhrent assiste lassemble avec la probabilit 80 %. Les dcisions
prises par lassemble nont de valeur lgale que lorsque plus de la moiti des adhrents assiste
lassemble.
Quelle est la probabilit que, lors de la prochaine assemble, le quorum soit atteint ?

c) Paradoxe ?
Paul affirme : Avec un d rgulier, on a autant de chance dobtenir au moins un six en 4 lancers que
dobtenir au moins deux six avec 8 lancers .
Sara objecte : Pas du tout. Dans le premier cas, la probabilit est suprieure 0,5, dans le deuxime
cas, elle est infrieure 0,5. .
Qui a raison ?

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 30 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
d) Le tir larc
chaque tir, un archer atteint sa cible avec une probabilit gale 0,7.
Combien de tirs doit-il effectuer pour que, avec une probabilit suprieure ou gale 0,99, il atteigne la
cible au moins deux fois ? Au moins trois fois ?

e) Lancers de pice
On lance une pice quilibre n fois. On sintresse la probabilit dobtenir face dans 60 % des
cas ou plus.
Envisager les cas n = 10 , puis n = 100 , puis n = 1000 .

Donner dabord, sans calcul, une estimation spontane du rsultat, puis solliciter la calculatrice
( n = 10 ) ou un algorithme de calcul ( n = 100 et n = 1000 ).

2. Avec lesprance mathmatique

a) Contrle de production
Une entreprise fabrique chaque jour 10 000 composants lectroniques. Chaque composant prsente un
dfaut avec la probabilit 0,002. Si le composant est repr comme tant dfectueux, il est dtruit par
lentreprise, et chaque composant dtruit fait perdre 1 lentreprise.
a) Les composants sont contrls un un, et chaque contrle cote 0,1 . Quel est le cot moyen
journalier pour lentreprise (contrles et destruction des composants dfectueux) ?
b) Les composants sont regroups par lots de 10, et on effectue un unique contrle automatique
de chaque lot, qui cote lui aussi 0,1 . lissue de ce contrle, le lot est accept si tous les
composants sont sains, et globalement dtruit si lun au moins des 10 composants prsente un
dfaut. Quel est le cot moyen journalier pour lentreprise de ce nouveau dispositif (contrles
et destruction des composants dfectueux) ?

b) Le QCM
Un QCM comporte 20 questions. Pour chaque question, quatre rponses sont proposes dont une seule
est juste. Chaque rponse juste rapporte un point et il ny a pas de pnalit pour une rponse fausse.
Un candidat rpond au hasard chaque question.
Quel nombre total de points peut-il esprer ?
Quelle pnalit doit-on attribuer une rponse fausse pour que le total espr, en rpondant
entirement au hasard, soit gal 2 sur 20 ?

c) Correction de fautes
Un texte contient n erreurs. Lors dune relecture, on considre que chaque erreur a 80 % de chances
dtre corrige.
Peut-on prvoir, en moyenne, le nombre derreurs restantes aprs une relecture, , aprs k relectures,
k tant un entier suprieur 1 ?

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 31 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
VI. chantillonnage et prise de dcision
La prise de dcision apparat pour la premire fois dans le programme de Seconde. La dmarche
sappuie sur la notion dintervalle de fluctuation dont une dfinition est donne et une expression
propose sous rserve de satisfaire aux conditions de validit, n > 25 et 0,2 < p < 0,8 (n est la taille de
lchantillon prlev et p est la proportion dans la population du caractre tudi). Avec la notion de
variable alatoire et la dcouverte de la loi binomiale, le programme de Premire fournit les premiers
outils qui permettent, en prenant appui sur la rflexion initie en Seconde autour de la prise de
dcision, de construire lintervalle de fluctuation dtermin laide de la loi binomiale, et une
dmarche de prise de dcision, valable en toute gnralit pour une proportion p et une taille n
dchantillon.
La partie A synthtise les dfinitions, la partie B prsente la problmatique de la prise de dcision.
La partie C dveloppe une approche possible en classe.

A. Intervalle de fluctuation avec la loi binomiale


Lintervalle de fluctuation dune frquence au seuil de 95% a t dfini dans le programme de Seconde de
la faon suivante :
Lintervalle de fluctuation au seuil de 95%, relatif aux chantillons de taille n, est lintervalle centr
autour de p, proportion du caractre dans la population, o se situe, avec une probabilit gale 0,95, la
frquence observe dans un chantillon de taille n.
La loi binomiale permet de calculer trs exactement les probabilits des diffrentes frquences observables
k
dans un chantillon de taille n, savoir les valeurs , avec 0 k n , probabilits qui peuvent tre
n
reprsentes laide dun diagramme en btons. On peut galement calculer, laide dun tableur, les
probabilits (cumules) des vnements suivants : La frquence observe dans lchantillon prlev de
k k
taille n est comprise entre 0 et , vnement quon peut aussi crire 0 F , si F dsigne la
n n
variable alatoire qui tout chantillon de taille n associe la frquence observe dans lchantillon prlev.
En faisant varier les paramtres n et p, on observe que le diagramme nest pas toujours symtrique, et non
exactement centr sur p. Par ailleurs, le caractre discret de la loi binomiale fait quil nest pas possible de
dterminer prcisment un intervalle o la frquence observe se situe avec une probabilit gale 0,95. La
dfinition donne en seconde pour lintervalle de fluctuation suppose en effet, de manire implicite, que la
frquence suit une loi continue.
Pour ces diffrentes raisons, on est amen construire un intervalle qui approxime lintervalle de
fluctuation dfini plus haut en adoptant la dfinition suivante :
Lintervalle de fluctuation au seuil de 95 % dune frquence F, correspondant la ralisation,
sur un chantillon alatoire de taille n, de la variable alatoire X gale nF et de loi binomiale de
a b
paramtres n et p, est lintervalle , dfini par le systme de conditions suivant :
n n

a est le plus grand entier tel que P(X < a) 0,025,


b est le plus petit entier tel que P(X > b) 0,025.
ou encore par le systme de conditions quivalent :

a est le plus petit entier tel que P(X a) > 0,025,


b est le plus petit entier tel que P(X b) 0,975.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 32 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Dtermination de a

Il existe une valeur k de X telle que P ( X k ) = 0, 025 P( X k ) < 0, 025 et P( X k + 1) > 0, 025

k k
2,5 % a = k +1 2,5 % a = k +1
a a

Valeurs entires croissantes prises par X Valeurs entires croissantes prises par X

Dtermination de b

Il existe une valeur k de X telle que P ( X k ) = 0,975 P( X k ) < 0,975 et P( X k + 1) > 0,975
a a

97,5 % k 97,5 % k

b=k b = k +1

Valeurs entires croissantes de X Valeurs entires croissantes de X

Remarques :
1. Ce jeu sur les ingalits strictes est d au caractre discret de la variable alatoire X considre
(on pourra sen convaincre dans la partie C).
2. Les entiers a et b dpendent de la taille n de lchantillon.
La connaissance de la loi binomiale de la variable alatoire X rend maintenant possible le calcul de la
a b
probabilit P F = P(a X b ) .
n n
a b
On remarque que lintervalle , est quasiment centr sur p ds que n est assez grand et que
n n
a b 1 1
lintervalle , est quasiment le mme que lintervalle p ,p+ donn dans le
n n n n
programme de seconde pour les grandes binomiales ( n > 25 et 0,2 < p < 0,8 o n est la taille de
lchantillon prlev et p est la proportion dans la population du caractre tudi, conditions nonces
dans le programme de seconde).
On trouvera des exemples dans le sous-paragraphe C ci-aprs.
a b a b
Lintrt de lintervalle , (quil conviendrait de noter n , n pour tre prcis), calcul
n n n n
partir de la loi binomiale, est de fournir un intervalle convenable pour toutes les valeurs de n et de p,
1 1
alors que lintervalle p ,p+ nest pas adapt pour les petites binomiales .
n n

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 33 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
B. Aspect gnral de la prise de dcision avec la loi binomiale
On considre une population dans laquelle on suppose
que la proportion dun certain caractre est p. Pour
juger de cette hypothse, on y prlve, au hasard et Hypothse :
avec remise, un chantillon de taille n sur lequel on la proportion est p.
observe une frquence f du caractre.
On rejette lhypothse selon laquelle la proportion
dans la population est p lorsque la frquence f chantillon taille n
observe est trop loigne de p, dans un sens ou dans Observation :
lautre. On choisit de fixer le seuil 95 % de sorte que
frquence f
la probabilit de rejeter lhypothse, alors quelle est
vraie, soit infrieure 5 %.
Lorsque la proportion dans la population vaut p, la variable alatoire X correspondant au nombre de
fois o le caractre est observ dans un chantillon alatoire de taille n, suit la loi binomiale de
paramtres n et p.
La rgle de dcision adopte est la suivante :
a b
si la frquence observe f appartient lintervalle de fluctuation au seuil de 95 % , ,
n n
on considre que lhypothse selon laquelle la proportion est p dans la population nest
pas remise en question et on laccepte ;
sinon, on rejette lhypothse selon laquelle cette proportion vaut p.
Cette prise de dcision repose sur le raisonnement suivant : si la proportion vaut p on a, en gros, au
moins 95 % de chances que le prlvement dun chantillon de taille n conduise une frquence f du
a b
caractre dans cet chantillon situe dans , . On sait bien que dans ce cas, compte tenu du
n n
hasard, la frquence rellement observe f nest pas ncessairement gale p, mais quelle fluctue
dans un voisinage de p, appel justement intervalle de fluctuation. Un intervalle de fluctuation est
donc un intervalle o lon sattend trouver la frquence observe f, si lhypothse que la
proportion est p est la bonne.
En consquence, si la proportion vaut p, il y a trs peu de chances (environ au plus 5% des
a b
chantillons) que cette frquence observe f soit hors de lintervalle de fluctuation , . Donc si
n n
a b
elle est lextrieur de lintervalle , , il est cohrent de penser que ce nest plus le seul fait du
n n
hasard cette fois-ci, mais que cest bien plutt le signe que lhypothse que la proportion est p nest
pas la bonne.

C. Dtermination de lintervalle de fluctuation laide dun algorithme


Considrons lexemple suivant. Un mdecin de sant publique veut savoir si, dans sa rgion, le
pourcentage dhabitants atteints dhypertension artrielle est gal la valeur de 16 % rcemment
publie pour des populations semblables. En notant p la proportion dhypertendus dans la population
de sa rgion, le mdecin formule lhypothse p = 0,16. Pour vrifier cette hypothse, le mdecin
constituera un chantillon de n = 100 habitants de la rgion ; il dterminera la frquence f
dhypertendus (lchantillon est prlev au hasard et la population est suffisamment importante pour
considrer quil sagit de tirages avec remise).

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 34 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Lorsque la proportion dans la population vaut p = 0,16, la variable alatoire X correspondant au
nombre dhypertendus observ dans un chantillon alatoire de taille n = 100, suit la loi binomiale de
paramtres n = 100 et p = 0,16 .

On cherche partager lintervalle [ 0 ;100] , o X prend ses valeurs, en trois intervalles [0 , a 1] ,


[ a , b] et [b + 1, 100] de sorte que la variable alatoire X prenne ses valeurs dans chacun des
intervalles extrmes avec une probabilit proche de 0,025, sans dpasser cette valeur. On recherche
donc le plus grand entier a tel que P( X < a) 0,025 et le plus petit entier b tel que P ( X > b) 0,025 .

X suit la loi B (100 ; 0,16)

0,12
0,1
Intervalle de
0,08 fluctuation :
0,06 au moins
95 %
0,04
0,02
0
0 5 10 15 20 25 30 35 40

Zone de rejet a b Zone de rejet


gauche : au droite : au
plus 2,5 % plus 2,5 %

Dun point de vue algorithmique, il est plus efficace de travailler avec les probabilits cumules
croissantes, que la calculatrice ou le tableur fournissent facilement. En tabulant les probabilits
cumules P ( X k ) , pour k allant de 0 100, il suffit de dterminer le plus petit entier a tel que
P( X a ) > 0,025 et le plus petit entier b tel que P(X b) 0,975.

a b
Le calcul, laide de la loi binomiale, de lintervalle de fluctuation au seuil de 95 %, , , de la
n n
frquence des chantillons alatoires de taille n, correspondant la zone dacceptation dune
hypothse sur une proportion, peut ainsi faire lobjet dune recherche dalgorithme.
On peut, par exemple, procder sur un tableur comme le montre limage dcran ci-dessous.
La cellule B3 contient la valeur de n, taille de lchantillon. La cellule D3 contient la valeur de p,
proportion suppose dans la population.
On a entr en B6 la formule =SI(A6<=B$3;LOI.BINOMIALE(A6;B$3;D$3;VRAI);"")
pour tabuler les probabilits P(X k) lorsque X suit la loi binomiale de paramtres n et p.
On a entr en C6 la formule =SI(B6>0,025;A6/B$3;"")
pour afficher les valeurs de k telles que P(X k) dpasse strictement 0,025.
On a entr en D6 la formule =SI(B6>=0,975;A6/B$3;"")
pour afficher les valeurs de k telles que P(X k) gale ou dpasse 0,975.
Ces trois formules ont t ici recopies vers le bas jusqu la ligne 1 006 (lalgorithme fonctionne pour
une valeur maximale de n gale 1 000, mais on peut, en cas de besoin, recopier plus bas).
Lintervalle de fluctuation au seuil de 95 % est affich en cellules F8 et G8 contenant les formules
=MIN(C6:C1006) et =MIN(D6:D1006).

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 35 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
a b
Dans le cas de lexemple choisi, on a n = 100 et p = 0,16. Lalgorithme fournit = 0,09 et = 0,23 .
n n
La rgle de dcision, pour le mdecin, sera la suivante :

si la frquence observe f appartient lintervalle de fluctuation [0,09 ; 0,23], on considre


que lhypothse selon laquelle la proportion dhypertendus dans la population est p = 0,16
nest pas remise en question et on laccepte ;
sinon, on rejette lhypothse selon laquelle cette proportion vaut p = 0,16.

D. Exemples dactivits
1. Exemple 1 : politique dans un pays lointain
Monsieur Z, chef du gouvernement dun pays lointain, affirme que 52 % des lecteurs lui font confiance.
On interroge 100 lecteurs au hasard (la population est suffisamment grande pour considrer quil sagit
de tirages avec remise) et on souhaite savoir partir de quelles frquences, au seuil de 95 %, on peut
mettre en doute le pourcentage annonc par Monsieur Z, dans un sens, ou dans lautre.
1. On fait lhypothse que Monsieur Z dit vrai et que la proportion
des lecteurs qui lui font confiance dans la population est 0,52. k P(X k)
Montrer que la variable alatoire X, correspondant au nombre 40 0,0106
dlecteurs lui faisant confiance dans un chantillon de 100 41 0,0177
lecteurs, suit la loi binomiale de paramtres n = 100 et p = 0,52.
42 0,0286
2. On donne ci-contre un extrait de la table des probabilits 43 0,0444
cumules P(X k) o X suit la loi binomiale de paramtres n = 100 ... ...
et p = 0,52.
61 0,9719
a. Dterminer a et b tels que : 62 0,9827
a est le plus petit entier tel que P(X a) > 0,025 ; 63 0,9897
b est le plus petit entier tel que P(X b) 0,975. 64 0,9941
b. Comparer lintervalle de fluctuation au seuil de 95 %,
a b 1 1
n , n , ainsi obtenu grce la loi binomiale, avec lintervalle p , p+ .
n n

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 36 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
3. noncer la rgle dcision permettant de rejeter ou non lhypothse que la proportion des lecteurs
qui font confiance Monsieur Z dans la population est 0,52, selon la valeur de la frquence f des
lecteurs favorables Monsieur Z obtenue sur lchantillon.
4. Sur les 100 lecteurs interrogs au hasard, 43 dclarent avoir confiance en Monsieur Z. Peut-on
considrer, au seuil de 95 %, laffirmation de Monsieur Z comme exacte ?
lments de rponse
2. a. On lit a = 42 et b = 62.
b. Les intervalles sont identiques.
3. Si f appartient lintervalle [0,42 ; 0,62], lhypothse que la proportion des lecteurs qui font
confiance Monsieur Z dans la population est 0,52 est acceptable, sinon, lhypothse est rejete, au
seuil de 95 %.
4. On considre que laffirmation de Monsieur Z est exacte.

X suit la loi B (100 ; 0,52)

0,09
0,08 Intervalle de
0,07 fluctuation :
0,06 au moins
0,05 95 %
0,04
0,03
0,02
0,01
0
25 30 35 40 45 50 55 60 65 70 75 80

Zone de rejet a = 42 b = 62 Zone de rejet


gauche : au droite : au
plus 2,5 % plus 2,5 %

Remarque : la recherche de lintervalle de fluctuation peut-tre illustre par le diagramme en btons de


la loi binomiale de paramtres n = 100 et p = 0,52.
2. Exemple 2 : discrimination
(daprs le document ressource mathmatiques pour les baccalaurats professionnels)
En Novembre 1976 dans un comt du sud du Texas, Rodrigo Partida est condamn huit ans de
prison. Il attaque ce jugement au motif que la dsignation des jurs de ce comt est, selon lui,
discriminante lgard des Amricains dorigine mexicaine. Alors que 80 % de la population du
comt est dorigine mexicaine, sur les 870 personnes convoques pour tre jurs lors des annes
prcdentes, il ny a eu que 339 personnes dorigine mexicaine.
Devant la Cour Suprme, un expert statisticien produit des arguments pour convaincre du bien fond
de la requte de laccus. En vous situant dans le rle de cet expert, pouvez-vous dcider si les
Amricains dorigine mexicaine sont sous-reprsents dans les jurys de ce comt ?

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 37 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
lments de rponse
On suppose que les 870 jurs sont tirs au sort dans la population du comt (la population tant trs
importante, on peut considrer quil sagit de tirages avec remise). Sous cette hypothse, la variable
alatoire X correspondant au nombre de jurs dorigine mexicaine suit la loi binomiale de paramtres
n = 870 et p = 0,8 .

On peut alors rechercher, en utilisant la loi binomiale, lintervalle de fluctuation au seuil de 95 %


correspondant.
Une tabulation de la loi binomiale de paramtres n = 870 et p = 0,8 fournit les rsultats suivants :

k P(X k) frquence k / n
672 0,0245 0,772
673 0,0296 0,774
... ... ...
718 0,9733 0,825
719 0,9783 0,826

Lintervalle de fluctuation au seuil de 95 % de la frquence des jurs dorigine mexicaine est :


[0,774 ; 0,826] .
339
La frquence observe est f = 0,39 . Cette valeur ne se situe pas dans lintervalle de fluctuation.
870
La diffrence est significative au seuil de 95 % et lhypothse p = 0,8, avec un titrage alatoire des
jurs, est rejete.
De fait, laccus a obtenu gain de cause et a t rejug par un autre jury.
3. Exemple 3 : scurit au carrefour
Un groupe de citoyens demande la municipalit dune ville la modification dun carrefour en
affirmant que 40 % des automobilistes tournent en utilisant une mauvaise file.
Un officier de police constate que sur 500 voitures prises au hasard, 190 prennent une mauvaise file.
1. Dterminer, en utilisant la loi binomiale sous lhypothse p = 0,4, lintervalle de fluctuation au seuil
de 95 %.
2. Daprs lchantillon, peut-on considrer, au seuil de 95 %, comme exacte laffirmation du groupe
de citoyens ?
lments de rponse
1. [0,358 ; 0,444].
2. f = 0,38. Laffirmation est considre comme exacte.
4. Exemple 4 : gauchers
Dans le monde, la proportion de gauchers est 12 %.
Soit n le nombre dlves dans votre classe.
1. Dterminer, laide de la loi binomiale, lintervalle de fluctuation au seuil de 95 % de la frquence
des gauchers sur un chantillon alatoire de taille n.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 38 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
2. Votre classe est-elle reprsentative de la proportion de gauchers dans le monde ?
lments de rponse
1. En prenant n = 30, lintervalle de fluctuation au seuil de 95 % est [0,033 ; 0,233] (entre 1 et 7
gauchers).
En prenant n = 25, lintervalle de fluctuation au seuil de 95 % est [0 ; 0,24] (entre 0 et 6 gauchers).
2. Cela revient situer la frquence observe dans la classe par rapport lintervalle de fluctuation.
5. Exemple 5 : sgrgation sexiste lembauche
(daprs document ressource pour la classe de Seconde. Ce problme peut tre revisit laide de la
loi binomiale.)
Deux entreprises recrutent leur personnel dans un vivier comportant autant dhommes que de femmes.
Voici la rpartition entre hommes et femmes dans ces deux entreprises :

Hommes Femmes Total

Entreprise A 57 43 100

Entreprise B 1350 (54%) 1150 (46%) 2500

Peut-on suspecter lune des deux de ne pas respecter la parit hommes-femmes lembauche ?
6. Exemple 6 : gnrateur de nombres alatoires

1. Sur un tableur, on entre dans la cellule A1 la formule = ENT(ALEA()*2), que lon recopie vers le
bas jusquen A100. On dnombre alors que le nombre 1 apparat 58 fois dans la plage de cellules A1 :
A100. Au seuil de 95 %, peut-on rejeter lhypothse selon laquelle le gnrateur de nombres alatoires
du tableur fonctionne bien ?
2. Mme question si lon recopie la formule vers le bas jusquen A1000, et que lon dnombre 580
occurrences du nombre 1 dans la plage de cellules A1 : A1000.

E. Lien avec lintervalle de fluctuation exploit en classe de Seconde


On considre une population o la proportion dun caractre est p, dans laquelle on prlve, au hasard
et avec remise, un chantillon de taille n. La variable alatoire X correspondant au nombre
dobservations du caractre sur un chantillon suit la loi binomiale de paramtres n et p.
On peut calculer laide de la loi binomiale, notamment laide de lalgorithme du paragraphe VII-C-
a b
1, lintervalle n , n de fluctuation au seuil de 95 % de la frquence observe sur un chantillon de
n n
taille n, o a n est le plus petit entier tel que P( X a n ) > 0,025 et bn est le plus petit entier tel que
P( X bn ) 0,975 .

a b
La notation n , n retenue ici rappelle que les entiers a n et bn dpendent de lentier n.
n n

Les programmes demandent de comparer, pour une taille de lchantillon importante, cet intervalle
1 1
avec lintervalle de fluctuation p ,p+ exploit en classe de seconde. Ce dernier
n n

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 39 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
intervalle, plus facilement calculable, rsulte dapproximations 6 , alors que la loi binomiale est la loi
exacte correspondant la situation.
En fixant diffrentes valeurs de n, il est possible de calculer les deux types dintervalles pour p variant
de 0 1. Les graphiques suivants ont t raliss pour n = 30, n = 100 et n = 1 000, en faisant varier,
dans chaque cas, p de 0 1 avec un pas de 0,05.

Intervalle de fluctuation au seuil de 95 % pour des chantillons de taille 30


1

0,9

0,8
Frquence f observe

0,7
a/n
0,6
b/n
0,5
p - 1/rac(30)
0,4 p + 1/rac(30)
0,3

0,2

0,1

0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Proportion p dans la population

Intervalle de fluctuation au seuil de 95 % pour des chantillons de taille 100


1
0,9
0,8
Frquence f observe

0,7
0,6 a /n
0,5
b /n
p - 1/rac(100)
0,4
p + 1/rac(100)
0,3
0,2
0,1
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Proportion p dans la population

6
Voir lannexe 8.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 40 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Intervalle de fluctuation au seuil de 95 % pour des chantillons de taille 1 000

1
0,9
0,8
Frquence f observe

0,7
0,6 a /n
0,5
b /n
p - 1/rac(1000)
0,4
p + 1/rac(1000)
0,3
0,2
0,1
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Proportion p dans la population

a b
On observe que lintervalle de fluctuation n , n est sensiblement le mme que lintervalle
n n
1 1
p ,p+ lorsque n est assez grand et p ni trop petit ni trop grand : pour n = 30 , cest le cas
n n
lorsque p est compris entre 0,3 et 0,7 ; pour n = 100 , cest le cas lorsque p est compris entre 0,2 et 0,8 ;
pour n = 1000 , cest le cas lorsque p est compris entre 0,05 et 0,95.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 41 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
VII. Annexes
A. Couple dindicateurs et problmes de minimisation
Le but de cette annexe est de prsenter le lien entre un indicateur de position et un indicateur de
dispersion qui lui est associ.
1. Position du problme

On se donne une srie statistique quantitative x1 , x 2 , K , x n , que lon veut rsumer par un couple
dindicateurs donnant un renseignement sur la position et sur la dispersion de la srie.
Supposons dabord que n = 2 pour dgager lide.

La srie constitue de deux valeurs est identifie au point y=x


A( x1 , x2 ) du plan muni dun repre.
M ( x, x )
On sintresse au point M de la droite dquation y = x qui A( x1 , x2 )
est le plus proche de A, si toutefois ce point existe.
Si n est quelconque, on identifie la srie au point
A( x1 ,..., xn ) de Rn et on sintresse, de la mme manire,
au point M ( x,..., x) qui est le plus proche de A. Ce point
M, sil existe, ralise la plus courte distance de A la
r r
droite (O, R u ), avec u (1,...,1) .

Si le point M ( x,..., x) prcdemment dcrit existe, nous convenons de nommer indicateur de position
de la srie le nombre x, et indicateur de dispersion associ la distance d ( A, M ) .

Il existe plusieurs distances dans Rn. Recherchons les couples dindicateurs correspondant trois
distances classiques :
n n
1 1
d1 ( A, M ) =
n
x
i =1
i x , d 2 ( A, M ) =
n
(x
i =1
i x) ,
2
d ( A, M ) = max x i x .
i =1,K, n

Ces trois expressions dpendent uniquement de la variable relle x. Dans la suite, nous les notons plus
simplement d1 ( x) , d 2 ( x) et d (x) .

2. tude des trois fonctions d1 , d 2 et d

Commenons par tudier la fonction d 2 . Si x dsigne la moyenne arithmtique des valeurs


x1 , x 2 , K , x n , alors on a :

(( x ) 1n ( x x)(2 x
n n
1
x x ) = (x x ) 0 .
2
d 2 ( x) d 2 ( x ) = i x) 2 ( xi x ) 2 = i
n i =1 i =1

Donc d 2 ( x) d 2 ( x ) 0 .

Ainsi pour tout x, d 2 ( x) d 2 ( x ) . La valeur minimale de la fonction d 2 est atteinte en x = x et est


gale la variance 2 de la srie statistique. La moyenne x est donc associe assez naturellement
lcart-type via cette proprit. On aurait pu aussi tudier les variations de la fonction d 2 et montrer
quelle admet un unique minimum au point x = x .

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 42 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Conclusion : avec la distance d 2 , le couple dindicateurs associ la srie est le couple (moyenne,
cart-type).

Le cas de la fonction d1 est moins courant dans la littrature. On commence par ordonner par ordre
croissant les observations, et on suppose donc dsormais que x1 x 2 K x n . Un calcul un peu plus
fastidieux amne distinguer deux cas :

si n est impair (gal 2 p + 1 ), d1 a un unique minimum atteint en x = x p +1 ;


si n est pair (gal 2 p ), d 1 admet tout point de lintervalle [ x p ; x p +1 ] comme minimum.

Dans les deux cas, une valeur qui minimise d1 est une mdiane Me de la srie statistique. Comme on
lavait dj not dans les classes du collge, dans le cas dune srie comportant un nombre pair
dobservations, une mdiane nest pas dfinie de manire univoque et il appartient donc de choisir une
convention si on veut dfinir "la" mdiane. Nanmoins, on peut remarquer que la valeur minimale de
1 n
d 1 obtenue est d1 (Me ) =
n i =1
xi Me qui est lcart absolu moyen la mdiane. Ainsi une mdiane

est associe naturellement cet cart moyen. Bien entendu, cet indicateur de dispersion est bien moins
utilis que lcart interquartile Q 3 Q1 .

Conclusion : avec la distance d1 , le couple dindicateurs associ la srie est le couple (mdiane,
cart moyen la mdiane).

1
La fonction d admet un unique minimum en x = (x1 + x n ) , milieu des deux valeurs extrmes.
2
Cest un indicateur de position qui nest pas rpandu, mais il est associ un paramtre de dispersion
qui, lui, est plus connu : la valeur minimale de d obtenue en x est gale la moiti de ltendue
x n x1 .

Conclusion : avec la distance d , le couple dindicateurs associ la srie est le couple (milieu des
extrmes, demi-tendue).

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 43 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
B. Loi faible des grands nombres

Pour une suite ( X k )k 1 de variables alatoires indpendantes et de mme loi admettant comme
esprance commune m et comme variance 2 , la loi faible des grands nombres tablit que pour tout
1 n
> 0 , la probabilit que la moyenne empirique
n k =1

X k scarte de m dau moins tend vers 0

quand n tend vers linfini, ce qui scrit formellement :

1
> 0, lim P
n n
X k m = 0.

k =1

On propose de montrer ce rsultat dans le cas particulier dun schma de Bernoulli et on note S n la
variable alatoire comptant le nombre de succs. La variable alatoire S n suit la loi binomiale B(n, p)
o p est la probabilit dobtenir un succs.
On se donne > 0 et on majore :

1 n 1 n
P X k m = P S n p = P ( S n np n ) = P ( S n E ( S n ) n ) o S n = X
n n
k
k =1 k =1

1 n
[
Var(S n ) E (S n E ( S n ) )2 ]
P
n Xk m
n 2 2
=
n 2 2
k =1

o on a utilis lingalit de Tchebychev qui stipule que pour une variable alatoire Z admettant une
variance, on a pour tout nombre rel a > 0 : P ( Z E ( Z ) a )
Var( Z )
.
a2
Comme la variance dune loi binomiale de paramtres n et p est gale np(1 p) et que son
esprance est np , on en dduit que :

1 np (1 p )
lim P
n n
X k p lim
n n 2 2
=0.
k =1

1 n
On dit aussi que
n k =1
X k converge en probabilit 7 vers p quand n tend vers linfini. Ceci prouve la

loi faible des grands nombres dans le schma de Bernoulli.


La preuve du cas gnral pour une suite quelconque de variables alatoires indpendantes et de mme
loi se fait de manire analogue en utilisant le fait que la variance dune somme de variables alatoires
indpendantes est gale la somme des variances.
Le thorme central-limit (terminologie anglo-saxonne) ou thorme de la limite centre donne des
1 n
prcisions sur la convergence de la moyenne empirique
n k =1

X k vers la moyenne commune m. Ce

thorme indique comment se comporte, lorsque n tend vers linfini, la probabilit que lerreur
1 n
X k m appartienne un intervalle [a , b] quelconque.
n k =1

7
Il existe une loi forte qui correspond un autre type de convergence, la convergence presque sre.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 44 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
C. Esprance de la loi gomtrique tronque : approches exprimentales
1. Calculatrice

2. Algorithme modifi sur Algobox

1
On peut faire tablir lgalit E ( X ) =
p
[ ]
1 (1 + np )(1 p) n , puis utiliser un outil numrique ou

graphique pour mettre une conjecture sur la limite de E ( X ) lorsque n tend vers linfini.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 45 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
3. Point de vue numrique
On construit une feuille de calcul donnant les valeurs de E ( X ) pour une valeur de p, en fonction de n.

4. Point de vue graphique


On construit (ici sur goplan) la reprsentation graphique de la suite dfinie par
1
[ ]
u n = 1 (1 + np )(1 p ) n et on observe une stabilisation pour de grandes valeurs de n.
p

Pour p = 0,2 par exemple, il semble que les valeurs se stabilisent autour de 5, do lide de tracer la
1
droite dquation y = .
p

p = 0,15 p = 0,25

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 46 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
D. Loi gomtrique
On rpte dans des conditions identiques une preuve de Bernoulli de paramtre p et on arrte le
processus au premier succs obtenu. La loi gomtrique de paramtre p est par dfinition la loi de la
variable alatoire X, rang du premier succs.
1. Quelques proprits de la loi gomtrique

La variable X prend ses valeurs dans N* et pour tout entier naturel k non nul : P ( X = k ) = (1 p ) k 1 p .

On vrifie facilement que : P( X = k ) = 1 (somme dune srie gomtrique)


k 1

1 1 p
On montre que : E ( X ) = (en utilisant la drive dune srie gomtrique) et que V ( X ) = 2 (en
p p
utilisant entre autre la drive seconde dune srie gomtrique).
Il est noter que lesprance de la loi gomtrique de paramtre p est la limite de lesprance de la loi
gomtrique tronque de paramtres n et p.
2. Prcautions en classe de Premire
La variable X prend toutes les valeurs entires sauf 0. Lunivers associ nest donc pas fini et ne figure
pas aux programmes du lyce.
3. Une approche laide de lalgorithmique
Le processus au cours duquel on rpte dans des conditions identiques une preuve de Bernoulli de
paramtre p et que lon arrte au premier succs obtenu, est trs facile mettre en uvre avec un
algorithme. Linstruction ent(NbrAlat + p) gnre un nombre alatoire entier qui vaut 1 avec une
frquence de p et 0 avec une frquence de (1 p) . On notera que, dans la pratique, le programme
correspondant sarrte toujours.
4. Langage naturel
Entre : valeur de p
Initialisation : X prend la valeur 0
k prend la valeur 0
Traitement : tant que k = 0
k prend la valeur ent(NbrAlat p)
X prend la valeur X + 1
Fin du "while"
Sortie : valeur de X
5. Sur calculatrice

modle TI 84+

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 47 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
6. Sous Algobox

7. Sous Scilab

E. Quelques outils de calcul avec la loi binomiale


1. Tableur
La syntaxe LOI.BINOMIALE(k ; n ; p ; FAUX) ou LOI.BINOMIALE(k ; n ; p ; 0) renvoie la
probabilit P ( X = k ) , pour une variable alatoire X de loi binomiale de paramtres n et p.

La syntaxe LOI.BINOMIALE(k ; n ; p ; VRAI) ou LOI.BINOMIALE(k ; n ; p ; 1) renvoie la


probabilit cumule P ( X k ) .

n
La syntaxe COMBIN(n; k) donne la valeur du coefficient binomial .
k

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 48 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
2. Un logiciel : Scilab
Calcul des coefficients binomiaux :

n
Lalgorithme ci-dessus affiche les coefficients pour k compris entre 0 et n, la valeur de n tant
k
celle introduite au dpart. (Les colonnes dune matrice sont repres partir de 1, ce qui explique la
prsence du n + 1 ).

Lalgorithme ci-aprs affiche le triangle de Pascal.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 49 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
3. Deux modles de calculatrice

a) Modles TI (84, mais aussi 83 et 82 avec des modifications mineures)

Calcul de probabilits avec une loi binomiale

- Probabilit de lvnement {X = k }
Instruction DISTR (touches 2ND VARS ) puis slectionner .binomFdp( .

Syntaxe : (nombre dessais, probabilit de succs, valeur dsire pour la probabilit).

- Probabilit de lvnement {X k }
Instruction DISTR (touches 2ND VARS ) puis slectionner .binomFRp( .

Syntaxe : (nombre dessais, probabilit de succs, valeur dsire pour la probabilit).

Valeur des coefficients binomiaux

Touche MATH puis PRB et instruction Combinaison.. Syntaxe n, combinaison, k .

b) Modle Casio (graph 35+)

Calcul de probabilits dans le cadre dune loi binomiale

- Probabilit de lvnement {X = k }
Icne STAT, choisir DIST (touche F5 ) et BINM (touche F5 ). Enfin, Bpd (touche F1 ) et Var
(touche F2 ).

Renseigner la bote de dialogue :


Data : variable ; x : valeur dsire pour la probabilit ; Numtrial : nombre dessais ; p : probabilit de succs

- Probabilit de lvnement {X k }
Icne STAT puis saisir dans la liste 1 les valeurs prises par k : 0, 1, , n.

Choisir DIST (touche F5 ) et BINM (touche F5 ). Enfin, Bcd (touche F2 ).

Renseigner la bote de dialogue :


Data : List ; x : List1 ; Numtrial : nombre dessais ; p : probabilit de succs

Pour chaque valeur de k, la valeur de la probabilit de lvnement { X k } est affiche dans une liste.

Valeur des coefficients binomiaux

Touche OPTN puis PRB et instruction nCr.. Syntaxe : n nCr k .

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 50 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
F. Coefficients binomiaux et quadrillage
P
Lobjectif est de donner une reprsentation des P
coefficients binomiaux partir des trajets sur un F
nord-est
quadrillage. Ce travail peut tre un sujet dtude pour
la srie S. P
1. De larbre au quadrillage P
F P
On lance trois fois une pice de monnaie quilibre. F
Il est dusage de schmatiser les huit issues de cette P
exprience alatoire par les huit trajets dans un arbre
P
tel que celui reprsent ci-contre. F
Sur le schma, et pour chaque lancer, on a cod P
pour pile et F pour face . F
sud-est
P
On peut convenir dorienter la branche de larbre vers
F
le nord-est pour chaque rsultat pile , vers le sud-
F
est pour chaque rsultat face .
On peut envisager une simplification, toujours avec la mme
convention : chaque dplacement vers le nord-est schmatise nord-est 3 piles
un rsultat pile , chaque dplacement vers le sud-est
schmatise un rsultat face .
Larbre obtenu pour la mme exprience alatoire na plus 1 face, 2 piles
que 4 terminaisons au lieu de 8. Toutes les issues donnant le
mme nombre de pile et de face correspondent en
effet plusieurs trajets qui aboutissent une unique 2 faces, 1 pile
terminaison.
On retrouve ainsi, par exemple, quil y a trois trajets donnant
1 face et 2 pile , les trajets tant limits aux deux sud-est 3 faces
directions prcdentes.
Gnralisons cela n lancers ( n 1 ).

La variable X qui comptabilise le nombre de face suit une loi binomiale de paramtres n et 0,5.
Larbre correspondant aura n + 1 terminaisons correspondant au rsultat k faces, n k piles , cest-
-dire lvnement { X = k } , pour tout k tel que 0 k n .
n n
n 1 1
On sait que P ( X = k ) = et que chaque trajet a pour probabilit . Il en rsulte que,
k 2 2
n
pour 0 k n , le nombre de trajets aboutissant la terminaison { X = k } est gal .
k

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 51 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
n n
0 face, n piles : = 1 trajet
n-1 0

n
1 face, n 1 piles : = n trajets
1
Pile

n-k

1 n
k faces, n k piles : trajets
k

Face
k n
n 1 faces, 1 pile : = n trajets
n 1
n-1
n
n faces, 0 pile : = 1 trajet
n n

Faisons tourner la figure de 45 dans le sens trigonomtrique : les nuds du schma prcdent
deviennent des points coordonnes entires dans un repre orthogonal naturel .

n
= 1 trajet
0 n
= n trajets
1
n

n-1

n
trajets
k
n-k
n
= n trajets
n 1
1
n
= 1 trajet
0 k n n
1 n-1

Les trajets considrs sont ceux partant de lorigine et aboutissant aux points de coordonnes
(k , n k ) , en suivant toujours les directions vers la droite ou vers le haut (lun dentre eux est
reprsent sur la figure).
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 52 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
2. Interprtation des coefficients binomiaux
Retenons le rsultat suivant : n

n k
Le nombre reprsente le nombre de trajets
n-k
k
reliant lorigine au point de coordonnes
(k , n k ) , en suivant toujours les directions vers la
droite ou vers le haut. 1
Lun de ces trajets est reprsent ci-contre.
0 1 k
3. Formule de Pascal
Cette interprtation fournit une dmonstration gomtrique simple de la formule de Pascal.

n 1

k 1
n

k
n-k n 1

n-k-1 k

0 1 k-1 k

Supposons que 1 k n 1 .

Les trajets joignant lorigine au point de coordonnes (k , n k ) se subdivisent en deux catgories :

n 1
ceux passant par le point de coordonnes (k , n k 1) , qui sont au nombre de ;
k

n 1
ceux passant par le point de coordonnes (k 1, n k ) , qui sont au nombre de .
k 1

n n 1 n 1
On en dduit que, pour 1 k n 1 : = + (formule de Pascal).
k k k 1

Remarque
Cette interprtation des coefficients binomiaux permet lobtention de plusieurs formules sommatoires
classiques. Le dveloppement de ce point de vue nest pas un objectif du programme.
4. Application : le problme des pilules
Argan se croit malade, il doit prendre 2n pilules dans la journe. Il dispose de deux botes identiques
A et B et, chaque matin, il place n pilules dans chacune de ses deux botes. chaque prise, il choisit
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 53 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
une des deux botes de faon quiprobable, puis prend tant que cest possible une pilule dans la bote
choisie. Au bout dun certain temps lune des botes est vide.
Combien lautre bote contient-elle de pilules en moyenne ce moment-l ?
5. Simulation de lexprience sur Algobox
Voici un algorithme simulant 1000 expriences, avec n = 10 .

6. Traitement mathmatique
On peut dabord envisager un traitement exhaustif pour une petite valeur de n ( n = 3 par exemple).

Pour une valeur plus leve ( n = 10 ), il est intressant de visualiser chaque exprience comme une
marche alatoire sur un carr. Un bord est atteint ( droite ou en haut) lorsquune bote est vide.
Ainsi une exprience pour laquelle il ne reste plus aucune pilule dans la bote A et 10 pilules dans la
bote B correspond lunique marche alatoire aboutissant au point de coordonnes (10, 0).
Si 1 k 9 , une exprience pour laquelle il ne reste plus aucune pilule dans la bote A et 10 k
pilules dans la bote B correspond une marche aboutissant au point de coordonnes (10, k), sans
passer par le point de coordonnes (10, k 1) .

10 + k
Nombre de trajets :
10

(10, k)

9+ k
Nombre de trajets :
10

Cest loccasion de rinvestir linterprtation gomtrique des coefficients binomiaux.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 54 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Pour 1 k 9 , le nombre de chemins allant de lorigine au point de coordonnes (10, k ) sans passer
10 + k 9 + k 9 + k
par le point de coordonnes (10, k 1) est gal , soit encore daprs la
10 10 9
formule de Pascal.
Puisquune telle exprience correspond la consommation de 10 + k pilules, la probabilit de
9 + k

9
lvnement correspondant est donc gale 10+ k .
2
Notons X la variable alatoire correspondant au nombre de pilules restant dans une bote ds que
lautre est vide. Les deux botes jouent un rle symtrique ; on en dduit que :

1 1
P ( X = 10) = 2 = ;
210 29

9 + k 9 + k

9 9
pour 1 k 9 , P ( X = 10 k ) = 2 10+ k = 9 + k .
2 2
Remarquons que la dernire galit englobe la premire pour k = 0 .

9 + k

9 9
9
On peut utiliser un logiciel de calcul formel pour vrifier que : P ( X = 10 k ) = 9 + k = 1 .
k =0 k =0 2

9 + k

9
9
Il en est de mme pour le calcul de lesprance E ( X ) =
k =0

(10 k ) 9 + k 3,524 .
2

La simulation prcdemment effectue est en accord avec le rsultat.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 55 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
G. Complments sur la prise de dcision
Les complments portent sur deux points :
la notion dintervalle de fluctuation unilatral ;
la notion derreur attache la prise de dcision.
Ces complments ne sont pas des attendus du programme.
1. Laffaire Woburn
[Daprs DUCEL Y., SAUSSEREAU B. : La prise de dcision de la Seconde la Premire ,
Repres IREM, 85, octobre 2011, Topiques ditions, Nancy ( paratre)]
Le document ressource des programmes de mathmatiques de lyce professionnel propose la situation
suivante :

Une petite ville des tats-Unis, Woburn, a connu 9 cas de leucmie parmi les 5969 garons de moins
de 15 ans sur la priode 1969-1979. La frquence des leucmies pour cette tranche dge aux tats-
Unis est gale 0,00052. (Source : Massachussetts Department of Public Health).
Les autorits concluent quil ny a rien dtrange dans cette ville. Quen pensez-vous ?

De faon plus prcise, on peut reformuler la question sous la forme suivante : le nombre de cas
observs est-il significatif dune situation anormale pour cette ville ou bien peut-on considrer quil
est simplement le fruit du hasard ?
Pour mieux faire comprendre le contexte dexprience alatoire sous-jacent cette situation, on la
transpose en termes de schma durne : la population des garons de moins de 15 ans sur la priode
1969-1979 des tats-Unis sera assimile une urne contenant 100 000 boules rouges ou vertes o

les boules rouges, au nombre de 52, reprsentent les personnes atteintes de leucmie,
les boules vertes reprsentent les personnes non atteintes.
On peut considrer, en premire approximation, que la population des 5969 garons de moins de 15
ans sur la priode 1969-1979 Woburn est assimilable lobservation dun chantillon (au sens de la
dfinition donne en Seconde) de 5969 boules, prleves de faon quiprobable et avec remise dans
lurne.
La question pose relve alors dun problme de prise de dcision. Nous ne pouvons pas utiliser la
dmarche prconise dans le programme de Seconde car les conditions de sa validit ne sont pas
satisfaites. En effet ici n vaut 5969, n > 25 , mais p vaut 0,00052, valeur trs infrieure 0,2.

Daprs le schma durne adopt, lexprience alatoire de dpart E : Extraire une boule de lurne et
noter sa couleur , est une exprience de Bernoulli de paramtre p = 0,00052 . Lexprience alatoire
attache la situation est lexprience alatoire obtenue par 5969 rptitions lidentique de E. On
associe cette nouvelle exprience alatoire un modle probabiliste (, P ) et la variable alatoire X
qui, toute issue de lexprience fait correspondre le nombre (entier), not X ( ) , de boules rouges
obtenues dans lissue . La variable alatoire X suit la loi binomiale B (n ; p) o n vaut 5969 et o p
est inconnu.

a) La situation est-elle normale Woburn ?


Se poser la question de savoir si la situation est normale Woburn, revient se demander si
lchantillon observ peut tre considr comme issu dune population pour laquelle la proportion de

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 56 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
cas de leucmie est p = 0,00052 comme dans tout le pays. Dans le cas contraire on sera amen
considrer que p 0,00052 .

La figure 1 reprsente le diagramme 8 en btons de la loi binomiale B(n; p) avec n = 5969 et


p = 0,00052 , car on raisonne sous lhypothse de travail que la situation est normale Woburn, cest-
-dire que p = 0,00052 .

Fig. 1 : Diagramme en btons et probabilits cumules de la loi binomiale pour n=5969 et p=0,00052
Un raisonnement analogue celui fait pour les exemples prcdents de prise de dcision conduit un
intervalle de fluctuation, que nous qualifierons par la suite de bilatral, au seuil de 95% gal [0 ; 7]
pour la variable de dcision X. On pourrait de mme dfinir en adaptant les raisonnements prcdents
un intervalle de fluctuation bilatral au seuil de 90% : cest lintervalle [1 ; 6]. Les frquences
correspondantes sont donnes dans le tableau de la figure 2 :
Seuil de 95 %

IF bilatral Effectif Frquence


Borne inf 0 0,0000
Borne sup 7 0,0012
p-1/racine n -0,0124
p+1/racine n 0,0135

Seuil de 90 %

IF bilatral Effectif Frquence


Borne inf 1 0,0002
Borne sup 6 0,0010

Fig. 2 : Intervalles de fluctuations bilatraux aux seuils de 95% et de 90%


On remarque que lintervalle de fluctuation bilatral [0 ; 0,0012] au seuil de 95% trouv ici est
extrmement diffrent de lintervalle de fluctuation donn par la formule de la classe de seconde :

1 1 1 1
p0 , p0 + = 0,00052 ,0,00052 + = [ 0,0124 ; 0,0135]
n n 5969 5969

8
Ce diagramme (Fig. 1) nest pas obtenu par simulation mais par calcul en utilisant la fonctionnalit
LOI.BINOMIALE du tableur.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 57 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Il est clair, comme on la dj not, que la formulation donne en seconde nest pas du tout adapte au
contexte de cette situation, ni aux conditions de lobservation, pour prendre la dcision.
Les rgles de dcision correspondant chacun des intervalles de fluctuation aux seuils respectifs de
95% et de 90% sont reprsentes dans les deux figures 3 et 4 :

IF bilatral au seuil de 95 %

Probabilit Probabilit
infrieure ou infrieure ou
gale 2,5 % gale 2,5 %

On dcide que la On dcide que la On dcide que la


situation est situation est situation est
anormale normale anormale

p 0,00052 p = 0,00052 p 0,00052

Fig. 3 : Rgle de dcision avec lintervalle de fluctuation bilatral au seuil de 95 %

IF bilatral au seuil de 90 %

Probabilit Probabilit
infrieure ou infrieure ou
gale 5 % gale 5 %

On dcide que la On dcide On dcide que la


situation est que la situation est
anormale situation est anormale
normale
p 0,00052 p 0,00052
p = 0,00052

Fig. 4 : Rgle de dcision avec lintervalle de fluctuation bilatral au seuil de 90 %


Dans les deux cas, comme leffectif observ est x = 9 , on est conduit dcider que le nombre de cas
de leucmie observ est anormal pour une proportion de rfrence p = 0,00052 valable pour tout le
pays.
Le traitement mathmatique est analogue aux exemples traits prcdemment comme nous lavons
remarqu. Cependant si on prend en compte la signification relle du contexte de laffaire Woburn,
nous sommes amens modifier le regard que nous avons sur cette situation. Dans les exemples traits
jusqu prsent la logique conduit mettre sur le mme plan, lorsque la proportion p nest pas p 0 , le

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 58 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
cas o la proportion est suprieure strictement p 0 (valeur thorique retenue) et celui o la
proportion est infrieure strictement p 0 .

Il en est tout autrement dans la situation de Woburn o il sagit dun problme qui touche la sant
publique. En cas de rejet de lhypothse p = p 0 , le cas p < p 0 signifie, certes que la situation est
anormale, mais concrtement quil y a, toute proportion garde, moins de cas de leucmie que dans le
reste du pays. Ce qui est une bonne chose en soi et peut rendre la ville de Woburn agrable vivre et
attractive. En revanche le cas p > p 0 signifie galement que la situation est anormale, mais
concrtement quil y a, toute proportion garde, plus de cas de leucmie que dans le reste du pays. Ce
qui rend la ville de Woburn plus dangereuse habiter quailleurs.
On voit ainsi que les enjeux ne sont pas les mmes des deux cts de lintervalle de fluctuation. Aussi,
plutt que de se demander si la situation est normale, ce qui formellement revient trancher entre les
hypothses p = p 0 et p p 0 , il vaut mieux se demander si la situation Woburn ne serait pas, au vu
du nombre de cas observ, plutt dangereuse pour la sant publique.

b) La situation est-elle dangereuse pour la sant Woburn ?


Compte tenu des enjeux, cest plutt la question sur la dangerosit de la situation qui est pertinente
dans le cas de Woburn. Il sagit de trancher entre lhypothse La situation nest pas dangereuse ce
qui formellement scrira p p 0 et lhypothse La situation est dangereuse ce qui formellement
scrira p > p 0 , avec p 0 = 0,00052 .

Pour statuer, on trace le diagramme en btons de la variable alatoire X qui suit la loi binomiale pour
n = 5969 et p = 0,00052 . Si le nombre de cas observ x est faible, il ny aura pas lieu de penser un
danger. En revanche, si le nombre de cas observ x est trs lev, il y aura lieu de penser un danger.
Mais on sait que si p = 0,00052 , on peut quand mme avoir des chantillons pour lesquels la valeur
observe x de X est relativement leve. La question est de dterminer une valeur b au-del de
laquelle on estimera que la valeur leve de x nest plus le fruit de la fluctuation due au hasard,
mais est plutt rvlatrice dune situation dangereuse.
Lide est de partager laxe de valeurs de la variable de dcision X seulement en deux intervalles,
[0 , b] et ]b , n], au lieu de trois comme dans les prises de dcision prcdentes. Tant que la valeur x
observe sera proche de 0 (i.e. dans [0 , b]), il ny aura pas lieu de dclarer la situation dangereuse.
Au-del de b, cest--dire si x est dans ]b , n], on dclarera la situation dangereuse. Dans cette
approche, [0 , b] sera lintervalle de fluctuation. On parlera alors dintervalle de fluctuation unilatral
pour le distinguer de lintervalle de fluctuation utilis en classe quon a qualifi de bilatral. Si on fixe
le seuil 95 %, b sera choisi pour que [0 , b] soit le plus petit intervalle tel que P( X > b) 0,05) .

La lecture des probabilits cumules de la loi binomiale pour n = 5969 et p = 0,00052 de la figure 1
donne b = 6 . Ce qui conduit, comme x = 9 , dcider que la situation est dangereuse pour la sant
Woburn.
De plus, par construction de lintervalle de fluctuation [0 , 6], on peut affirmer quen prenant cette
dcision on a moins de 5 % de chances de se tromper. Plus prcisment, la probabilit de dcider que
la situation est dangereuse, alors quelle ne lest pas, est gale P ( X > 6) = 1 P ( X 6) 1 0,9610 ,
soit environ 4,9 %.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 59 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
La rgle de dcision est reprsente graphiquement par la figure 5 :

IF unilatral droit au seuil de 95 %

Probabilit
infrieure ou
gale 5 %

Intervalle de fluctuation Zone de rejet

On dcide que la On dcide que la


situation nest pas situation est
dangereuse dangereuse
p 0,00052 p > 0,00052

Fig. 5 : Rgle de dcision avec lintervalle de fluctuation unilatral au seuil de 95%


Les bornes des intervalles de fluctuation bilatraux et celles de lintervalle de fluctuation unilatral au
seuil de 95% sont rassembles dans le tableau de la figure 6 :
Seuil de 95 %

IF bilatral Effectif Frquence


Borne inf 0 0,0000
Borne sup 7 0,0012
p-1/racine n -0,0124
p+1/racine n 0,0135

Seuil de 90 %

IF unilatral Effectif Frquence


Borne inf 0 0,0000
Borne sup 6 0,0010

Fig. 6 : Comparaison du cas bilatral et du cas unilatral au seuil de 95%

c) Commentaires
Alors que les autorits locales et les experts gouvernementaux ont conclu, dans un premier temps,
quil ny avait rien dtrange dans le nombre de cas de leucmie observs, la suite dactions et
dtudes entreprises par les familles avec leurs propres experts, le Dpartement de Sant Publique du
Massachusetts a officiellement confirm en avril 1980 que le taux de leucmie constat tait
anormalement lev. La recherche des causes a conduit souponner leau de la ville pollue par le
trichlorthylne. Cette petite histoire illustre bien les enjeux de la dmarche statistique.
On a vu dans cet exemple quune mme situation peut donner lieu plusieurs questionnements
possibles et, en consquence, des traitements mathmatiques diffrents :

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 60 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
soit on souhaite dcider entre La situation est normale (i.e. p = 0,00052 ) et La situation nest
pas normale (i.e. p 0,00052 ) : le risque est prendre en compte des deux cts de lintervalle
de fluctuation, ce qui conduit un intervalle de fluctuation bilatral.
soit on souhaite dcider entre La situation prsente un danger pour la sant (i.e. p > 0,00052 )
et La situation ne prsente pas un danger pour la sant (i.e. p 0,00052 ) : le risque est
prendre en compte dun seul ct de lintervalle de fluctuation, ce qui conduit un intervalle de
fluctuation unilatral.
Dans les deux cas les calculs sont effectus avec p = 0,00052 et la variable de dcision utilise,
X = n F , suit la loi binomiale B(n; p) avec n = 5969 et p = 0,00052 .

Concernant par exemple la situation Woburn, comme lobservation donne x = 9 , on dcidera que la
situation est, avec le mme seuil de 95 %, anormale en utilisant lintervalle de fluctuation bilatral, et
dangereuse en utilisant lintervalle de fluctuation unilatral. Mais si lobservation avait donn x = 0
ou x = 7 , on aurait t amen dclarer la situation anormale avec lintervalle de fluctuation bilatral
au seuil de 90 %, mais normale avec lintervalle de fluctuation bilatral au seuil de 95 %. De mme,
avec le mme seuil de 95 %, si lobservation avait donn x = 7 , on aurait t amen dclarer la
situation normale en utilisant lintervalle de fluctuation bilatral, mais dangereuse en utilisant
lintervalle de fluctuation unilatral.
On voit bien que le choix de la question poser (La situation est-elle normale ? La situation prsente-
t-elle un danger pour la sant ?), le choix du seuil (90 % ou 95 % par exemple), la forme de
lintervalle de fluctuation (bilatral ou unilatral) vont influer sur la rgle de dcision adopter, et par
consquent sur la dcision elle-mme.
Dans une dmarche de prise de dcision, il est donc ncessaire de clarifier en premier lieu le choix des
hypothses pour formaliser un questionnement qui, lui-mme, dpend des proccupations du dcideur
lies aux enjeux (conomiques, sociaux, sanitaires, politiques, ) de la situation. Le seuil devra
galement tre dfini en amont de la mise en forme mathmatique. Ce choix des hypothses
dterminera ensuite la forme de lintervalle de fluctuation utiliser. Il est donc ncessaire de veiller
ce que la forme de lintervalle de fluctuation utilis soit toujours en cohrence avec le questionnement
naturellement induit par la situation concrte, mme si pour des raisons pdagogiques on se limite en
classe aux intervalles de fluctuation bilatraux.
Dans la ralit, toute prise de dcision statistique suppose, en prliminaire la mise en uvre
mathmatique, une analyse approfondie de la signification concrte des risques encourus qui ne peut
tre que le fruit dune concertation interdisciplinaire entre les divers acteurs professionnels (dont le
statisticien nest quun des lments) concerns par cette prise de dcision.

d) Bibliographie
Ministre ducation nationale-DGESCO : Ressources pour la classe en baccalaurat professionnel
extrait : Probabilits et statistiques, Document de travail, avril 2009.
Ministre ducation nationale-DGESCO : Ressources pour la classe de Seconde extrait :
Probabilits et statistiques, 2009.
2. Radioactivit ou bruit de fond ?
Lactivit suivante est inspire 9 de prsentations effectues par Monsieur Alain VIVIER, enseignant-
chercheur lINSTN 10 , institut dpendant du Commissariat lnergie atomique Saclay. Convaincu
de lintrt pdagogique des exprimentations sur tableur, Monsieur VIVIER dclare : pour ma part
je naurais jamais approfondi ces aspects [de statistique et probabilits], indispensables en physique,

9
Avec laimable autorisation de Monsieur Alain Vivier.
10
Institut national des sciences et techniques nuclaires.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 61 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
sans le tableur. Cela ma t utile non seulement pour des aspects denseignement, mais aussi de
recherche, notamment dans le domaine de la problmatique du seuil de dcision, qui peut savrer
parfois difficile .
Une activit sur le thme de la radioactivit, consistant rechercher un seuil de diffrence significative
avec le modle binomial, peut se prsenter comme suit.

On mesure en laboratoire, avec un compteur Geiger, un objet pouvant tre radioactif . Le compteur
est rgl selon une certaine sensibilit et on effectue une mesure un mtre de lobjet, pendant dix
secondes. Linstrument compte 37 dsintgrations ou coups . Cependant, avec ce rglage et dans
ces conditions, une mesure de bruit de fond (correspondant lenvironnement du laboratoire)
donne en moyenne un comptage de 30 coups. La question qui se pose est de savoir si la diffrence
observe est assez importante pour considrer lobjet comme radioactif .
On suppose que dans le laboratoire, durant chaque centime de seconde, le compteur est alatoirement
susceptible de compter un coup de bruit de fond avec une probabilit 0,03, ce que lon simulera
laide dun tableur avec linstruction =ENT(ALEA()+0,03).
1. a. Simuler en colonne A un comptage de bruit de fond pendant 10 secondes, puis recopier vers la
droite pour obtenir la simulation de 100 comptages.
b. Calculer la moyenne des 100 comptages simuls. Est-elle proche de 30 coups ? (Faire F9 pour
obtenir dautres simulations.)
c. Un comptage suprieur ou gal 37 coups vous semble-t-il exceptionnel ?
2. a. Dterminer les paramtres n et p de la loi binomiale suivie par la variable alatoire X modlisant
un comptage de bruit de fond pendant dix secondes.
b. Sur une nouvelle feuille, calculer une table fournissant P(X k) pour k allant de 0 1 000.
3. Soit N est le plus petit entier tel que : P(X N) 0,95. On dira quil y a radioactivit significative si
le nombre de coups est suprieur ou gal N + 1.
a. Dterminer la valeur de N.
b. On observe un comptage de 37 coups. Peut-on considrer que la radioactivit est significative ?
c. Quelle est la probabilit de considrer que la radioactivit est significative alors que cest un bruit de
fond ?
4. On considre un objet radioactif pour lequel, durant chaque centime de seconde, le compteur est
alatoirement susceptible de compter un coup avec la probabilit 0,05. On considre la variable
alatoire Y modlisant le comptage des dsintgrations pendant dix secondes.
a. Donner les paramtres de la loi binomiale suivie par Y.
b. Dterminer la probabilit de ne pas dtecter comme radioactif lobjet considr.

lments de rponse
3. a. N = 39.

k P(X k)
37 0,9142
38 0,9381
39 0,9563
40 0,9698

b. Un comptage de 37 coups nest pas significatif. On considre quil y a radioactivit partir dun
comptage de 40 coups.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 62 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
c. La probabilit cherche correspond P ( X 40) o X suit la loi binomiale de paramtres n = 1000
et p = 0,03 . On a choisi un seuil de 95 % de faon rendre cette erreur peu probable, infrieure 5 %.

4. a. n = 1000 et p = 0,05 .

b. Lobjet nest pas dtect comme radioactif correspond lvnement {Y 39 } dont la probabilit
vaut environ 0,06.
Remarques :
On a deux faons de se tromper :

dclarer quun objet est radioactif alors que cest un bruit de fond (cest lobjet de la question 3) ;
dclarer quil ny a que du bruit de fond alors que lobjet est radioactif (cest lobjet de la question 4).
Il est utile dappuyer le raisonnement sur lobservation des diagrammes en btons des lois binomiales
B (1 000 ; 0,03) et B (1 000 ; 0,05).

B (1 000 ; 0,03) et B (1 000 ; 0,05)


0,08
0,07
0,06
X
0,05
0,04
Y
0,03
0,02
0,01
0
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80

3. Cartes de contrle 11

Dans lindustrie automobile, certains vhicules, aprs leur passage en peinture, prsentent un dfaut de type
grains ponctuels . Ce dfaut est pratiquement imperceptible, mais constitue un tmoin de la qualit du
processus de peinture.
On dit que le processus est sous contrle lorsque 20 % des capots produits ont ce type de dfaut. Des
modifications apportes au processus de fabrication sont susceptibles de modifier ce pourcentage, dans un
sens ou dans lautre.
On contrle la production en prlevant des chantillons de 50 capots. La production est suffisamment
importante pour considrer quil sagit de tirages au hasard avec remise.
On choisit de fixer le seuil de dcision de sorte que la probabilit de rejeter lhypothse tort soit infrieure
5 %.
On accepte lhypothse selon laquelle la proportion dans la production est p = 0,2, lorsque la frquence f
observe sur lchantillon se situe dans lintervalle de fluctuation au seuil de 95 %.

11
Mises au point en 1924 la Bell Telephone Company par Walter Shewhart (1891-1967), les cartes de
contrle sont la base de la matrise statistique des procds . Toujours utilises en raison de leur simplicit
(on reporte les valeurs observes sur le graphique de la carte), elles dfinissent des limites de contrle de certains
paramtres de la production, comme la frquence, la moyenne ou lcart-type, telles que si ces limites sont
dpasses, des actions de correction puissent tre menes.

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 63 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Les limites de contrle sont les bornes de lintervalle de fluctuation au seuil de 95 %, calcules en
considrant la variable alatoire X correspondant au nombre de capots prsentant le dfaut sur un
chantillon de taille 50. Sous lhypothse p = 0,2, cette variable alatoire suit la loi binomiale de paramtres
n = 50 et p = 0,2.
1. Calculer les limites de contrle .
2. Simuler le fonctionnement de cette carte de contrle lorsque le processus est sous contrle.
3. Le processus est sous contrle, quelle est la probabilit de commettre une erreur de dcision partir dun
chantillon ?
4*12 . En ralit, la proportion de capots prsentant le dfaut dans la production est 0,3. On considre la
variable alatoire Y correspondant au nombre de capots prsentant le dfaut sur un chantillon de taille 50.
a. Donner les paramtres de la loi binomiale suivie par Y.
b. Quelle est la probabilit de dcider que le processus est sous contrle ?

lments de rponse
1. Les limites de contrle sont 0,1 et 0,32 correspondant des effectifs de 5 et 16 capots prsentant le
dfaut.
2.

3. Si X suit la loi binomiale de paramtres n = 50 et p = 0,2 , on a P ( X 4) 0,0185 et


P ( X 17) 0,0144 . La probabilit de commettre une erreur de dcision lorsque p = 0,2
correspond la probabilit de la zone de rejet soit environ 3,3 %.
4. a. n = 50 et p = 0,3 .
b. On est dans une situation o lhypothse p = 0,2 ayant permis la construction de la carte de
contrle est fausse. En dcidant que le processus est sous contrle, on commet une erreur. La
probabilit de commettre cette erreur, partir de lobservation dun seul chantillon, est
P(5 Y 16) o Y suit la loi binomiale de paramtres n = 50 et p = 0,3 . On trouve environ 68,4 %.

12
Le questionnement sur les erreurs nest pas un attendu du programme. Aucune connaissance ce propos nest
donc exigible. Cette question peut cependant tre pose dans un cadre de rflexion ou de recherche.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 64 sur 65
Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog
Remarques :
On peut, dans un premier temps, observer par simulation la frquence des erreurs (points
situs entre les lignes de contrle alors que p 0,2 ) en introduisant la valeur 0,3 en cellule C1
et en actionnant de nombreuses fois la touche F9.
Il est difficile de distinguer p = 0,2 et p = 0,3 avec un seul chantillon de taille 50. La
procdure de dcision a tendance tre conservatrice et privilgie lhypothse p = 0,2 qui
nest rejete que si la diffrence observe est rellement significative. Il est utile dappuyer le
raisonnement sur lobservation des diagrammes en btons des lois binomiales B (50 ; 0,2) et
B (50 ; 0,3).

b (50 ; 0,2) et b (50 ; 0,3)


B (50 ; 0,2) et B (50 ; 0,3)
0,16
0,14
0,12
0,1
0,08
X
Y
0,06
0,04
0,02
0
0 5 10 15 20 25 30

Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 65 sur 65


Mathmatiques Statistiques et probabilits
http://eduscol.education.fr/prog