Vous êtes sur la page 1sur 38

6

5
4
3
2
1
MATHMATIQUES
VIVANTES
pufc
PRESSES UNIVERSITAIRES FRANC-COMTOISES
Bulletin de lIREM
de BESANON
n
o
67 juin 2002
c _ Presses Universitaires Franc-Comtoises 2002
ISSN 1141-913X
Mathmatiques
vivantes
Bulletin IREM
n
o
67, juin 2002
dit par Franois PTIARD
Presses Universitaires Franc-Comtoises 2002
Dius par lIREM de Franche-Comt
Institut de Recherche sur lEnseignement des
Mathmatiques de Franche-Comt (IREM)
Directrice Claude MERKER
Cette brochure a t ralise en L
A
T
E
X2

.
Table des matires.
Table des matires (Franois Ptiard) ici mme
Des lois continues en Terminale S, pourquoi et pour quoi faire ? (Michel
Henry) 1
Le petit Bac (Groupe (( Statistiques et probabilits ))) 25
propos du programme de statistique en Seconde : remarques sur la
simulation informatique (Michel Henry) 29
Bulletin IREM n
o
67
ii
Des lois continues en Terminale S,
pourquoi et pour quoi faire ?
Michel HENRY
IREM de Franche-Comt
Sommaire
I Expriences alatoires et modles probabilistes : du discret
au continu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1 Lancer dun d, loi des faces . . . . . . . . . . . . . . . . . . . . . 2
2 Paradoxe des 3 bancs : quel modle ? . . . . . . . . . . . . . . . . 3
3 Le jeu de Franc-Carreau : une loi continue (( naturelle )) . . . . . 4
4 Laiguille de Buon : un modle surprenant . . . . . . . . . . . . 6
5 Le paradoxe de Bertrand, autres modles ? . . . . . . . . . . . . . 7
II Du discret au continu : attente dun vnement . . . . . . . . 10
1 Attente dun vnement fortuit, hypothses de travail . . . . . . 10
2 Modlisation du temps dattente (cas discret) . . . . . . . . . . . 11
3 Du discret au continu : de la loi gomtrique la loi exponentielle 12
4 Hypothses heuristiques pour un processus de Poisson : la loi
exponentielle simpose simplement . . . . . . . . . . . . . . . . . 14
5 De la loi binomiale la loi de Poisson . . . . . . . . . . . . . . . 15
III La loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1 Phnomnes gaussiens, observations statistiques, contexte naturel
de la loi normale . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2 Modle probabiliste de la loi normale . . . . . . . . . . . . . . . . 16
3 Le thorme de la limite centre (TLC) . . . . . . . . . . . . . . 17
4 Exemple historique de base : le thorme de MoivreLaplace . . . 19
5 Intervalle de conance pour une proportion (sondages) . . . . . . 20
IV Conclusion : Des lois continues pour quoi faire en Terminale S ? 21
1 La notion de loi dans les classes de Premire . . . . . . . . . . . . 21
2 Des lois continues en Terminale S . . . . . . . . . . . . . . . . . . 22
3 Notion de densit, prolongements des outils probabilistes pour des
modles performants . . . . . . . . . . . . . . . . . . . . . . . . . 24
1
Bulletin IREM n
o
67
I Expriences alatoires et modles probabilistes : du
discret au continu
1 Lancer dun d, loi des faces
Dans lesprit des programmes des annes 2000, sparons lexprience concrte, ventuel-
lement rpte de nombreuses fois pour permettre dobserver les eets du hasard sur les
uctuations des frquences dapparition des direntes faces, du modle probabiliste trs
simple, introduit en classe de premire, cens la dcrire thoriquement.
Nous sommes alors amens distinguer les (( hypothses de travail )) et les (( hypoth-
ses de modle )) qui en dcoulent :
Hypothses de travail : le d est correctement construit dans une matire susamment
homogne pour bien accepter les symtries en jeu plaant les 6 faces dans des conditions
quivalentes, il est lanc dans des conditions reproductibles assez ouvertes pour quaucune
prvision mcanique ne puisse tre avance pour connatre par avance la face qui se
prsentera, etc.
Hypothse de modle : il y a 6 issues possibles, toutes quiprobables de probabilit
1/6. Si on dsigne ces issues par les points ports par les faces du d, la probabilit est
distribue sur cet ensemble not suivant une loi que lon peut reprsenter par le tableau :
=
_
q
, q
q
, q
q
q
, q
q q
q , q
q
q
q
q , q
q q
q
q
q
_
, loi sur :

i
q
q
q
q
q
q
q
q q
q q
q
q
q
q q
q q
q
q
q
p
i
1/6 1/6 1/6 1/6 1/6 1/6
Dans le modle probabiliste, on peut numriser ces issues en introduisant une variable
alatoire X : 1, 2, 3, 4, 5, 6 dont la loi est donne par le tableau :
x
i
1 2 3 4 5 6
p
i
1/6 1/6 1/6 1/6 1/6 1/6
Loi de X
Cette loi est note P
X
et les valeurs p
i
des probabilits lmentaires associes aux
vnements (( X = x
i
)) sont notes indiremment :
p
i
= P(X = x
i
) = P
X
(x
i
)
La loi de X est appele loi uniforme discrte sur 1, 2, 3, 4, 5, 6.
Cette distinction entre hypothses de travail et hypothses de modle sera omniprsente
chaque fois quil sagira de comprendre le processus de modlisation qui permettra
2
Des lois continues en Terminale S, pourquoi et pour quoi faire? (Michel Henry)
danalyser les situations alatoires de la ralit partir de connaissances probabilistes
thoriques. Cela devient incontournable pour comprendre le passage dune situation
alatoire concrte, o lensemble des issues possibles est naturellement discret, un modle
probabiliste continu. Elle savre aussi trs utile pour lever certains paradoxes qui peuvent
se prsenter quand les situations relles ne sont pas dcrites avec susamment de prcision,
comme le montre le petit exemple bien connu qui suit.
2 Paradoxe des 3 bancs : quel modle ?
Voici ce problme des trois bancs :
Dans un square il y a trois bancs deux places. et vont sasseoir (( au
hasard )). Quelles chances ont-ils de se retrouver sur le mme banc ?

c

c
C

@
@
@
@
@
@
a
a

A
@
@
@
@
@
@
@ @

b
B
La manire dont le hasard intervient dans cette situation (dcole) nest pas prcise. La
locution (( au hasard )), nous dit-on, suppose implicitement lquiprobabilit des issues.
Mais quel est lensemble des issues considr : les bancs ou les places ? Cela nest pas non
plus prcis. Cette imprcision est dailleurs la source de nombreux paradoxes du calcul
des probabilits, quand plusieurs modles peuvent tre invoqus pour dcrire une mme
situation. Analysons ce problme en prcisant nos hypothses de travail et de modle.
Hypothses de travail 1 : va sasseoir en a. Peu importe sa manire de choisir sa
place. tire un banc (( au hasard )) parmi A, B et C, et va sasseoir. Lvnement E est
ralis par le choix du banc A.
Hypothses de modle 1 : On prend un modle 3 lments, = A, B, C pour
reprsenter le choix de parmi les 3 bancs. Lhypothse de travail suggre de rpartir la
probabilit de manire uniforme sur . On a donc la loi :
A B C
1/3 1/3 1/3
Lvnement E est ralis par le choix de A : P(E) = 1/3.
3
Bulletin IREM n
o
67
Hypothses de travail 2 : va sasseoir en a. tire une place (( au hasard )) parmi
les 5 restantes a

, b, b

, c et c

, et va sasseoir. Lvnement E est ralis par le choix de la


place a

.
Hypothses de modle 2 : On prend un modle 5 lments, = a

, b, b

, c, c

pour
reprsenter le choix de parmi les 5 places. Lhypothse de travail suggre de rpartir la
probabilit de manire uniforme sur . On a donc la loi :
a

b b

c c

1/5 1/5 1/5 1/5 1/5


E est ralis par le choix de a

: P(E) = 1/5.
Quelle conclusion tirer ? Que lnonc ne dcrit pas susamment prcisment une vritable
exprience alatoire : quel choix alatoire pour ? Dans ces conditions deux modles aussi
pertinents lun que lautre peuvent tre proposs. Il nest pas surprenant quils conduisent
deux rsultats dirents.
3 Le jeu de Franc-Carreau : une loi continue (( naturelle ))
Ce jeu, trs en vogue la Cour, a t tudi par Georges Louis Leclerc, comte de
Buon en 1733. Pour la premire fois, un point de vue probabiliste sappliquait une
situation o les issues thoriques considres forment un ensemble continu, gomtrique en
loccurrence (do le nom de (( probabilits gomtriques )) que lon donne parfois ce type
de problmes). Nous allons voir que le point de vue de Buon peut se ramener au concept
lmentaire de probabilit tel quil se prsentait lpoque, dni alors par la formule que
Laplace rigera en 1812 en premier principe :
nombre de cas favorables
nombre de cas possibles

Le jeu consiste jeter un cu (pice de monnaie en forme de disque) sur un carrelage
rgulier. Les joueurs parient sur la position nale de lcu : cheval sur un ou plusieurs
joints entre les carreaux ou entirement dans un seul carreau (position de franc-carreau).
Comment dterminer la probabilit de faire franc-carreau ?
Si on dsigne par ABCD le carreau de ct c dans lequel le centre O de lcu est tomb,
la condition (( franc-carreau )) est gomtriquement lmentaire : elle est ralise si et
seulement si le centre du disque tombe lintrieur du carr A

de ct c 2r,
homothtique du carr ABCD par rapport son centre.
A B
C D
A

-
c 2r
-
c
y
O

r
4
Des lois continues en Terminale S, pourquoi et pour quoi faire? (Michel Henry)
Hypothse de travail : lcu est lanc (( au hasard )) et tous les points lintrieur du
carr ABCD ont (( la mme chance )) dtre atteints par le centre O.
Hypothse de modle continu : lensemble des issues est lensemble des points
intrieurs au carr ABCD. Mais quelle loi proposer pour reter lhypothse de travail ?
Remarquons que si lon cherchait aecter une mme probabilit chacun de ces
points, celle-ci ne pourrait tre strictement positive en vertu de laxiome dadditivit, vu
linnitude de ces points. Elle ne peut tre nulle, car la probabilit de tomber dans le carr
ABCD vaut 1. Cette situation probabiliste ne peut tre aborde lmentairement, elle
suppose lintroduction de nouveaux outils dans la thorie.
On va ramener ce problme un problme lmentaire par le biais dun modle approch.
Pour cela, on (( discrtise )) le carr ABCD :
A B
C D
A

On tapisse ABCD par un quadrillage de petits


carrs unit u
i
de ct c/1000 par exemple. Pour
xer les ides, prenons c = 10 cm, r = 1 cm, et u
i
de ct 0, 01 cm. Laire de ABCD est 100 cm
2
et
celle de A

vaut 64 cm
2
.
Hypothse de modle discret : on prend alors comme ensemble

des issues possibles


lensemble des petits carrs u
i
. Ils sont au nombre de 10
6
. On traduit lhypothse de travail
en posant quils sont quiprobables : i, P(ui) = 1/10
6
.
Lvnement (( franc-carreau )) (FC) est ralis si O tombe dans lun des u
i
qui tapissent
A

(exactement avec nos hypothses numriques). Par dnition de la probabilit


dun vnement, P(FC) =

{i/u
i
A

}
P(u
i
) = [(c 2r) 100]
2
P(ui) = 0, 64.
Par dnition lmentaire de la mesure de laire dune gure comme nombre de carrs
units qui peuvent la recouvrir, on a obtenu : P(FC) =
aire de A

aire de ABCD

Cette remarque nous permet de complter et gnraliser notre
Hypothse de modle continu : pour tout domaine A (daire mesurable) inclus dans
ABCD, si E est lvnement : (( le centre O est tomb dans A )), on pose que la probabilit
de E est proportionnelle laire de A : P(E) =
aire de A
aire de ABCD

La proprit de sous-additivit de laire (laire de la runion de deux parties disjointes est


la somme des aires de ces parties) donne P les proprits dune loi de probabilit, cest
la loi uniforme continue sur le carr ABCD.
5
Bulletin IREM n
o
67
On retrouve le fait ncessaire que dans ce modle, la probabilit que O tombe sur une
gure rduite un point (ou un ensemble dnombrable de points) est nulle.
Ce point de vue des (( probabilits gomtriques )) semble satisfaisant dans le cas trs simple
trait ici o les vnements considrs peuvent snoncer en termes daires. Ce nest pas
toujours le cas. Prenons celui dun jeu de franc-carreau o lon a remplac lcu par une
plaque en forme de triangle quilatral.
A B
C D
o a
b
c
On peut prendre pour paramtres alatoires les
coordonnes x et y du centre o du triangle et
langle polaire du vecteur

oa .
Il ny a pas dinterprtation gomtrique simple
de lvnement (( franc-carreau )).
On peut reprsenter cet vnement dans un re-
pre en 3 dimensions comme une partie du pav
[0 , c] [0 , c] [0 , 2] muni dune loi uniforme
continue. Cest ce que fera Buon pour rsoudre
son fameux problme de laiguille, comme nous
allons le voir.
En classe, ce problme du triangle peut tre simul sur ordinateur et la probabilit de
(( franc-carreau )) peut tre value par une approche frquentiste, mettant en uvre une
forme nave (vulgarise !) de la loi des grands nombres.
Mais quelles loi introduire dans cette simulation pour les paramtres x, y et ? En gros,
quel modle implanter dans la machine ?
4 Laiguille de Buon : un modle surprenant
Sur un parquet form de planches de largeur 2a, spares par des rainures droites, parallles
et quidistantes, on jette une aiguille de longueur 2, avec < a.
Quelle est la probabilit que laiguille coupe lune des rainures (vnement A) ?

6
?
2a
2
x
Soit x la distance du milieu de laiguille la rai-
nure la plus proche. x prend une valeur alatoire
quelconque dans [0, a].
Soit langle des droites formes par cette rai-
nure et laiguille. prend une valeur alatoire
quelconque dans [0, ].
Dans une reprsentation cartsienne du pav = [0, ][0, a] (rectangle gris), lvnement
A est reprsent par la partie hachure dlimite par la courbe dquation x = sin().
6
Des lois continues en Terminale S, pourquoi et pour quoi faire? (Michel Henry)
-
6
O
x

Dans cette reprsentation, on prend pour modle


probabiliste la loi uniforme sur le rectangle .
On a donc :
P(A) =
aire hachure
aire grise
=
1
a

_
0
sin() d =
2
a

Pour la premire fois, le nombre intervenait


dans lexpression dune probabilit, conue au
dpart comme un rapport dentiers !
5 Le paradoxe de Bertrand, autres modles ?
Dans les situations o interviennent des variables continues, le choix explicite dune loi de
probabilit devient incontournable. Le paradoxe de Bertrand en est un bel exemple.
Bertrand posait en 1899 le problme en ces termes :
Soit un cercle de rayon R. Jen prends une corde au hasard. Quelle est la
probabilit que sa longueur soit suprieure celle du ct du triangle quilatral
inscrit dans le cercle (vnement A) ?
Et il proposait au moins trois solutions, suivant linterprtation que lon peut donner du
(( choix au hasard )) dune corde parmi linnit de celles-ci :
O
s
s
M
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
s
N

1
s I
R
P
P
P
P
Pi
R/2
1. Choisir une corde ralisant A, cest choisir sa distance au centre infrieure R/2.
La rpartition uniforme de la probabilit sur [0, R], quinduit le (( choix au hasard )),
conduit la probabilit P(A) = 1/2.
7
Bulletin IREM n
o
67
2. Choisir une corde ralisant A, cest xer lune de ses extrmits, puis, partir de
ce point, partageant le cercle en trois arcs gaux, cest choisir lautre extrmit sur
larc oppos. Le choix (( au hasard )) de cette deuxime extrmit induit la rpartition
uniforme sur le cercle et conduit la probabilit P(A) = 1/3.
3. Choisir une corde ralisant A, cest choisir son milieu lintrieur du disque (d)
concentrique de rayon R/2. Le choix de ce point (( au hasard )) dans le disque (D) de
rayon R induit la rpartition uniforme de la probabilit sur tout le disque ; les aires
des deux disques sont dans le rapport 1/4, do P(A) = 1/4.
Levons ce paradoxe :
Comme dans le problme des trois bancs, rien dans lnonc de Bertrand ne permet de
choisir une loi plutt quune autre pour modliser le (( choix au hasard )) de la corde, do
lambigut paradoxale. Celle-ci est si forte que certains proposent de raliser lexprience
un grand nombre de fois pour vrier statistiquement si la frquence des cordes ralisant
A que lon prlverait ainsi, se (( stabiliserait )) au voisinage de lune des probabilits
annonces.
Le problme reste entier car il y a de nombreux dispositifs qui pourraient tre invents
pour (( tirer une corde au hasard )), chacun donnant une valeur dirente cette frquence.
Choisir un de ces dispositifs revient en fait choisir la loi de probabilit qui complterait
la description insusante de cette pseudo-exprience alatoire.
Voici quelques exemples de lois et de probabilits de A associes qui sont autant de solutions
au problme de Bertrand :
Convenons que choisir une corde, cela revient choisir son milieu (la correspondance corde-
milieu est bijective, si lon exclut les diamtres et le centre du cercle qui sont ngligeables
pour notre problme).
Imaginons que le disque (D) est une cible et que lon cone le choix de ce milieu des
tireurs larc, limpact dune che sur le disque-cible de rayon R tant considr comme
ponctuel (on est dj en train de modliser !).
On peut aussi supposer que tous les tireurs atteignent la cible tous les coups (sinon le
tir est annul, ce qui ne change pas la loi de rpartition des autres impacts).
Chaque tireur a ses caractristiques propres : pour le dbutant dont les ches vont
nimporte o, pour le tireur de club qui atteindra le rond central (d) de rayon R/2 avec
une faible probabilit, autant que pour le champion olympique qui, bien que champion,
ne peut garantir que ses tirs chappent aux alas, le hasard interviendra diversement pour
guider la che jusqu son impact, milieu de la corde recherche.
Proposons des modles possibles pour les trois tireurs :
1. Le dbutant tire au jug : proposons la loi uniforme sur le disque (D) de rayon R
(cela est bien sr une hypothse de modle, le dbutant peut sen tirer mieux que
cela !). Cette loi a une densit constante gale 1/(R
2
) sur (D), nulle en dehors.
Cette hypothse conduit la probabilit de lvnement A : (( limpact est dans le
disque (d) de rayon R/2 )) propose par Bertrand :
P(A) =
aire de (d)
aire de (D)
=
_
(d)
1
R
2
dx dy =
1
4
8
Des lois continues en Terminale S, pourquoi et pour quoi faire? (Michel Henry)
2. Le tireur de club est aect dun strabisme divergent : il tire systmatiquement trop
droite. Statistiquement, ses impacts se rpartissent en moyenne autour du point de
coordonnes (R/2, 0). Mais il tire assez dlement : les carts-types de ses rsultats
par rapport ce point moyen sont respectivement
x
= R/4 et
y
= R/4. Pour le
reste, une dviation alatoire horizontale de son tir naecte pas systmatiquement
la hauteur et rciproquement.
On pourrait imaginer bien dautres hypothses trs varies, notamment sur la
corrlation possible entre les coordonnes (X, Y ) du point dimpact de la che.
Comme dans de nombreuses situations de rpartition alatoire autour dune valeur
centrale, on peut proposer un modle gaussien en dimension 2 pour calculer la
probabilit demande.
Les hypothses faites conduisent une densit de probabilit pour les coordonnes
(X, Y ) de la forme :
f(x, y) =
1
2
x

y
e

1
2
_
_
xR/2

x
_
2
+
_
y

y
_
2
_
et tenant compte des donnes numriques, on obtient la probabilit de A :
P(A) =
_
(d)
f(x, y) dx dy = 0, 4
(ne cherchez pas calculer cette intgrale par primitives, demandez plutt un
ordinateur !).
3. Mme hypothse de modle gaussien pour le champion olympique ; seulement, il vise
juste, le point moyen de ses tirs est au centre. De plus, les coordonnes (X, Y ) ne
sont pas corrles, enn, les carts-types des abscisses et ordonnes des impacts sont

x
= R/4 et
y
= R/4. Dans ce cas, la probabilit quil atteigne le disque (d) est :
P(A) =
_
(d)
1
2
x

y
e

1
2
_
_
x

x
_
2
+
_
y

y
_
2
_
= 0, 86
Ainsi, les concepts de loi continue et de densit de probabilit permettent-ils de mieux poser
ce type de problme de modlisation o interviennent des variables continues. Lors de la
modlisation, ils permettent de formuler des hypothses prcises quant la description de
lexprience alatoire. Le choix dun type de loi, comme ici le modle gaussien, relve alors
de considrations heuristiques.
Les lois de probabilits ne sont pas inscrites dans la nature, elles ont t inventes pour
dcrire les cas les plus simples, au sein dune thorie mathmatique (celle de la mesure).
Leur utilisation pour traiter des problmes concrets conduira des approximations qui
peuvent tre nes et dont le contrle est une partie importante de la statistique. La
dtermination des paramtres des lois en jeu (moyennes, carts-types, corrlations) peut
alors faire intervenir des procdures dajustement mettant en uvre des tests statistiques.
9
Bulletin IREM n
o
67
II Du discret au continu : attente dun vnement
1 Attente dun vnement fortuit, hypothses de travail
Un vnement A peut survenir inopinment et se rpter fortuitement : panne dun
appareillage complexe, arrive dun client dans une le dattente, accident de voiture dans
la rgion, rupture du l dans un mtier tisser, rayon cosmique, radioactivit etc.
On sintresse au temps dattente alatoire avant la prochaine manifestation de A. Cette
situation se caractrise par un paramtre qui peut tre valu partir dune statistique :
on peut observer que, dans des conditions analogues, A se produit en moyenne c fois dans
un intervalle de temps unit (par exemple, si c = 7, 2 fois par heure, c est la cadence horaire
du phnomne).
Quelle loi attribuer cette attente ? Sous quelles hypothses de modle ?
On ne peut pas douter de lintrt de ce problme. Les informations de nature probabiliste
quun tel modle peut apporter seront utiles pour (( grer )) ces situations : mobilisation de
personnels, budgtisation, contrle de qualit. . .
Dans la foule de ce qui prcde, dcomposons le processus de modlisation en hypothses
de travail et hypothses de modle.
Hypothses de travail :
Il ny a pas de moments o A apparat plus souvent : le phnomne est homogne
dans le temps.
Les (( chances )) de voir A se produire entre deux instants donns t et t + t ne
dpendent pas de ce qui sest pass auparavant : le phnomne est sans mmoire.
Plus t est petit, moins il y a de chance de voir A entre t et t +t. De plus A ne se
produit pas 2 fois presque en mme temps : A est un vnement (( rare )).
Nous allons transformer ces hypothses de nature heuristique en termes mathmatiques
adapts aux outils probabilistes :
Hypothses de modle : On considre comme ensemble des issues possibles lensemble
continu de tous les instants o A peut se produire : =]0, +[. Posons comme hypothses :
1. La probabilit que A se produise dans un intervalle de temps ]t, t + t] ne dpend
que de t (phnomne homogne et sans mmoire).
2. Soit P(t) cette probabilit. On suppose que P(t) t quand t 0, o > 0
est une constante : A est rare.
3. Si t
1
, t
2
, t
3
, t
4
sont 4 instants successifs, les vnements (( A se produit entre t
1
et t
2
))
et (( A se produit entre t
3
et t
4
)) sont indpendants (A est sans mmoire).
Soit Z le temps alatoire quil faut attendre pour observer le premier A partir dun
instant initial quelconque t
0
. Quelle est la loi de Z ?
Nous verrons plus loin que les hypothses proposes susent pour rsoudre directement ce
problme, modulo une hypothse technique de rgularit de la densit de cette loi.
10
Des lois continues en Terminale S, pourquoi et pour quoi faire? (Michel Henry)
Mais il est plus intressant et plus porteur de sens de considrer la variable continue Z
comme limite de variables discrtes, comme on la fait pour le jeu de franc-carreau.
2 Modlisation du temps dattente (cas discret)
On fait une observation par minute pour voir si A sest produit. On note les instants
dobservation : 1, 2, 3, . . . , k 1, k, . . . , spars par lintervalle t = 1 mn.
Soit [0, T] lintervalle dtude du phnomne pendant lequel on a observ un nombre
(alatoire) N de manifestations de A.
On note aussi t
1
, . . . , t
N
, . . . les instants o A se produit, et Z
k
= t
k
t
k1
les variables
dattentes successives.
On peut reprsenter les notations utilises par le schma suivant que nous appellerons
(( schma de Poisson )).
-
t
1 2 3 . . . k1 k
-
X
0 Z t
1
Z
2
t
2
Z
3
t
3
. . . t
N
t
N+1
T
A
1
A
2
A
3
. . . A
N
A
N+1
- -
t
Soit e
k
lvnement (( A sest produit pendant la k
ime
minute )) (i.e. entre les instants k 1
et k) et
k
lvnement contraire. Les e
k
et
l
(k ,= l) sont des vnements indpendants
en vertu de la troisime hypothse de modle.
Pour tout k, la probabilit que A se produise pendant la k
ime
minute ne dpend pas de k
(premire hypothse). Posons P(e
k
) = P(t) = p. On a donc P(
k
) = 1 p.
Soit X le temps dattente discrtis de A (X est un nombre alatoire de minutes). X est
valeurs dans N

. Soit E
k
lvnement : (( A apparat pour la premire fois la k
ime
minute )).
Dterminons la loi P
X
de X. Elle est entirement donne par les probabilits lmentaires :
p
k
= P(E
k
) = P(X = k) = P
X
(k).
Calcul de p
k
: E
k
est la conjonction de e
k
et des
i
pour i < k. Ces vnements sont
indpendants, do p
k
= P(e
k
).

P(
i
) = p.(1 p)
k1
. La loi de X est donc donne par :
P(X = k) = p.(1 p)
k1
Cest la loi gomtrique G(p) de paramtre p. On a bien

k=1
p
k
= p

k=1
(1 p)
k1
=
p
1 (1 p)
= 1.
La probabilit p est dtermine par la cadence c. En eet, on peut voir que E(X) =
1
p

11
Bulletin IREM n
o
67
[Pour cela, par dnition de lesprance mathmatique, il faut calculer la somme de la srie
E(X) =

k=1
k.p
k
. Celle-ci est obtenue par un artice. On crit :

k=1
k.p
k
= p

k=1
k.(1 p)
k1
= p
_

k=1
(1 p)
k
_

en considrant p comme une variable relle, avec les prcautions dusage : la srie entire
est uniformment convergente puisque quavec p < 1 on est lintrieur de son intervalle de
convergence. La srie gomtrique obtenue livre son secret, remplaant p dans le

par la
variable relle x :
E(X) =

k=1
k.p
k
= p
_

1 x
1 (1 x)
_

= p
1
x
2
=
1
p
]
E(X) reprsente le nombre moyen de minutes quil faut attendre pour avoir A.
Il y a en moyenne c vnements A par heure. Il faut donc attendre en moyenne 1/c heure
ou 60/c minutes pour observer le premier A. On a donc avec ces units, p = c/60, si dans
notre modlisation, c est assez petit (< 60) pour justier le fait que A est un vnement
rare.
Exemple numrique : si c = 7, 2/heure, la probabilit de navoir pas de A dans le
premier quart dheure est (1 p)
15
=
_
1
7, 2
60
_
15
= 0, 147.
3 Du discret au continu : de la loi gomtrique la loi exponen-
tielle
On rapproche les temps dobservations, eectues chaque instant multiple de 1/n minute
(par ex. toutes les secondes).
La probabilit que A se produise dans un intervalle donn de dure t =
1
n
est :
P
_
1
n
_


n
(car A est homogne et rare et par hypothse de modle : P(t) t).
Soit Z la variable continue du temps dattente de A, et F
Z
sa fonction de rpartition :
F
Z
(t) = P(Z t). On a, daprs le thorme des accroissements nis, si F
Z
de classe (
1
,
P(t < Z t +) = F
Z
(t +) F
Z
(t) = F

Z
(), avec t < < t +.
Soit Y
n
le nombre de fractions de minutes attendre avant que A se produise, avec
= t =
1
n
Daprs le paragraphe prcdent, la loi de Y
n
est une loi gomtrique de
paramtre p = P
_
1
n
_
On a P(Y
n
= k
n
) = P
_
1
n
__
1 P
_
1
n
__
k
n
1

Supposons que A se produise linstant t (en minutes), compris entre (k


n
1)t
_
=
k
n
1
n
_
et k
n
t =
k
n
n
(avec ces notations, on a
k
n
n
t quand n ).
12
Des lois continues en Terminale S, pourquoi et pour quoi faire? (Michel Henry)
Si Y
n
= k
n
, on a
k
n
1
n
< Z <
k
n
n
et P
_
k
n
1
n
< Z
k
n
n
_
= P(Y
n
= k
n
) =
1
n
F

Z
(
n
),
o
k
n
1
n
<
n

k
n
n
On obtient donc F

Z
(
n
) = n.P
_
1
n
__
1 P
_
1
n
__
k
n
1

Quand n ,
n
t avec
k
n
n
,
do F

Z
(
n
) F

Z
(t), et dans le second membre,
n.P
_
1
n
_
, et
_
1 P
_
1
n
__
k
n
1
=
_
1 P
_
1
n
__
n
k
n
1
n
e
t
,
car n. ln
_
1 P
_
1
n
__
n.
_
P
_
1
n
__
.
Do la densit de la loi de Z :
F

Z
(t) = f
Z
(t) = e
t
, pour t > 0.
Cest la densit de la loi exponentielle de paramtre .
La fonction de rpartition de cette loi est F
Z
(t) = P(Z t) =
t
_
0
e

d = 1 e
t
, car
F
Z
(0) = 0. On peut calculer son esprance mathmatique :
E(Z) =

_
0
e

d =
1

De mme que dans le cas discret, E(Z) est le temps moyen dattente de A,
1

=
60
c
,
si Z
en mesur en minutes et si c est la cadence horaire du phnomne.
Exemple de la dsintgration radioactive
Une matire ssile contient N atomes radioactifs. La dsintgration de lun ou lautre de
ces atomes (vnement A) vrie (en gros) les hypothses heuristiques prcdentes.
Soit P(t) la probabilit dobserver une dsintgration pendant un petit intervalle de
temps de dure t, et soit la limite de P(t)/t quand t tend vers 0.
Le paramtre caractrise cette radioactivit, cest la constante de dsintgration.
La priode T de llment radioactif considr est la dure pendant laquelle la moiti de
la masse ssile sest dsintgre. La frquence des atomes non encore dsintgrs dans la
masse N est alors 1/2.
Un raisonnement frquentiste permet de trouver simplement la relation entre T et .
Dans le cas de la radioactivit naturelle, on peut considrer que les dsintgrations des
atomes sont indpendantes. De plus, pour un intervalle de temps donn, chaque atome
a la mme probabilit dtre dsintgr. Soit p cette probabilit de dsintgration entre
0 et T. Un atome tant considr, on lui associe lexprience de Bernoulli qui consiste
voir sil est dsintgr au bout du temps T. Cet vnement est donc de probabilit p. On
13
Bulletin IREM n
o
67
recommence cette exprience avec les N atomes de la masse radioactive. Le thorme de
Bernoulli, forme lmentaire de la loi des grands nombres, indique que la frquence des
atomes dsintgrs linstant T tend (en probabilit) vers p quand le nombre dpreuves
tend vers linni. N tant trs grand, on peut conclure quil y a une probabilit inme que
p soit notablement dirente de cette frquence 1/2.
T est donc la dure au bout de laquelle un atome donn a la probabilit 1/2 dtre (ou ne
pas tre) dsintgr.
Dans cette situation, on retrouve le passage dun modle discret un modle continu.
Soit un intervalle de temps t trs petit. Soit k (trs grand) tel que T = kt.
Soit X le temps dattente (mesur discrtement en nombre de t) de la dsintgration
dun atome donn. Si au bout du temps T cet atome nest pas dsintgr, on a X > k, et
cet vnement est de probabilit 1/2. Mais P(X > k) (1 t)
k
puisque P(t) t,
et (1 t)
k
=
_
1
T
k
_
k

t0
e
T
. On a donc e
T
=
1
2
et on obtient =
ln(2)
T

La loi exponentielle de Z, temps dattente de la dsintgration de latome (modle continu),
fournit directement ce rsultat :
P(Z T) =
1
2
= 1 e
T
, do T =
ln(2)

Par exemple T = 1580 ans pour le radium, T/ ln(2) = 2280 est la cadence annuelle de
dsintgration des atomes de radium.
4 Hypothses heuristiques pour un processus de Poisson : la loi
exponentielle simpose simplement
On reprend la variable Z du temps continu dattente de lvnement A partir de linstant
t
0
= 0 (Z > 0), et sa fonction de rpartition F
Z
(t) = P(Z t), que lon suppose assez
rgulire (de classe (
1
).
Soit g(t) = 1 F
Z
(t) = P(Z > t). g est dcroissante (car F
Z
est croissante) et g(0) = 1.
(( Z > t )) est lvnement (( A ne se produit pas avant t )). g(t +s) est donc la probabilit
que A ne se produise pas avant t + s, cest--dire ni avant t, ni entre t et t + s. Ces deux
vnements sont indpendants, en vertu de la troisime hypothse de modle, puisque [0, t]
et ]t, t +s] sont disjoints : A est sans mmoire.
Le premier vnement est de probabilit g(t).
Le deuxime a pour probabilit 1 P(t < Z t +s) = 1 P(Z s) = g(s) puisque cette
probabilit ne dpend que de la dure s considre (phnomne homogne).
On obtient donc pour tout t et s positifs :
g(t +s) = g(t).g(s),
relation fonctionnelle qui permet de dterminer la fonction g.
On peut le voir simplement en utilisant lhypothse que g est de classe (
1
, rgularit qui
sera vrie a posteriori. En eet, en drivant cette galit par rapport s ( t constant),
14
Des lois continues en Terminale S, pourquoi et pour quoi faire? (Michel Henry)
on a pour tout t > 0 et tout s > 0 : g

(t + s) = g(t).g

(s). Pour s 0, g

tant suppose
continue, g

(t) = g(t).g

(0). En posant g

(0) = > 0 et sachant que g(0) = 1, on obtient


g(t) = e
t
pour t > 0.
On retrouve donc la fonction de rpartition de la loi de Z : F
Z
(t) = 1 e
t
, pour t > 0.
Sa densit est obtenue par drivation : f
Z
(t) = e
t
.
De cette loi exponentielle, on peut dduire (cela nest pas immdiat) la loi du nombre N
alatoire des vnements A qui se produisent entre les instants 0 et T donns : N N et
P(N = k) =
(T)
k
k !
e
T
Cest la loi de Poisson de paramtre note P(T). On a E(N) = T et Var(N) = T.
Cette loi peut aussi tre considre comme loi limite de la loi binomiale, comme le montre
le paragraphe suivant.
5 De la loi binomiale la loi de Poisson
On part des mmes hypothses heuristiques dun processus de Poisson. On tudie le
phnomne sur un intervalle de temps [0, ] x.
Soit N le nombre (alatoire) dapparitions de lvnement A dans cet intervalle de temps.
Quelle est la loi de N ?
nouveau, discrtisons le problme. Dcoupons [0, ] en n intervalles de dure t :
= nt. La probabilit que A apparaisse dans lun quelconque de ces intervalles est
p = P(t) t =

n

Pour chacun de ces intervalles, lapparition de A ralise une preuve de Bernoulli
de paramtre p. Ces preuves sont indpendantes (troisime hypothse de modle).
Lvnement (( N = k )) est ralis si A apparat dans k quelconques de ces intervalles,
pris parmi les n. N suit donc une loi binomiale B(n, p) :
P(N = k) =
_
n
k
_
p
k
(1 p)
nk
=
1
_
1
1
n
_

_
1
k 1
n
_
k !
n
k
p
k
(1 p)
nk
.
Lentier k tant x, quand n tend vers linni le numrateur tend vers 1, np tend vers
et comme ln(1 p)
nk
(n k).(p) (n k)

n
, il vient :
P(N = k)
()
k
k !
e

.
La loi de N tend donc vers la loi de Poisson de paramtre .
De plus, E(N) = np , esprance de cette loi, ainsi que Var(N) = np(1 p) .
15
Bulletin IREM n
o
67
III La loi normale
1 Phnomnes gaussiens, observations statistiques, contexte na-
turel de la loi normale
La loi normale (ou de Laplace-Gauss, appele (( normale )) par Pearson en 1893) est
la loi de certains phnomnes continus qui uctuent autour dune valeur moyenne ,
de manire alatoire, rsultante dun grand nombre de causes algbriquement additives
et indpendantes. Cest une illustration du thorme le plus important du calcul des
probabilits, le thorme de la limite centre (TLC, appel aussi (( thorme central
limite )), traduction de (( the central limit theorem )), dnomination introduite par G. Polya
en 1920).
La dispersion des valeurs observes dun mme caractre gaussien est reprsente par un
cart type . Lobservation statistique de ces phnomnes conduit la remarque que 95 %
environ des observations se situent dans lintervalle ] 2 ; + 2[, dit (( plage de
normalit )). (Doc. GEPS daccompagnement du programme de 1
re
L).
La loi normale est, entre autres, la loi des erreurs de mesure dun phnomne physique.
Historiquement, cest par ltude du comportement de ces erreurs que Laplace (1777, 1812)
puis Gauss (1821) ont mis en vidence lexpression mathmatique de cette loi.
Mais tout le mrite revient Moivre (1718), qui, en appliquant la formule de son ami
Stirling, en a obtenu lexpression en cherchant des quivalents des probabilits binomiales
pour amliorer le contrle de lcart [F
n
p [ entre frquence observe et probabilit limite
dans le problme de Bernoulli (thorme de Moivre-Laplace).
2 Modle probabiliste de la loi normale
Comme prcdemment, pour modliser un phnomne gaussien, nous allons distinguer sa
description heuristique du modle probabiliste que lon peut proposer pour la reprsenter.
Hypothse de travail : on tudie un caractre alatoire continu (en dimension 1), pou-
vant prendre nimporte quelle valeur relle, symtriquement autour dune valeur centrale .
Une tude statistique montre que pour un grand nombre dobservations, 95 % dentre elles
se situent dans un intervalle centr en et de demi-longueur 2.
Pratiquement, dans beaucoup dapplications, les valeurs possibles du caractre sont nces-
sairement positives (mesures de grandeurs, quantits, . . . ). Nous verrons quil ny a pas de
gros inconvnient proposer un modle continu sur tout R, si la probabilit est surtout
concentre autour de . Cette proprit du modle rendra compte du fait que la quasi
totalit des valeurs observes se concentrent autour de cette valeur centrale.
Hypothse de modle : on prend donc comme ensemble rfrentiel, = R.
Soit X une v.a. dnie sur valeurs dans R reprsentant les occurrences possibles
du caractre tudi. La loi P
X
dune variable continue X de densit f
X
est entirement
16
Des lois continues en Terminale S, pourquoi et pour quoi faire? (Michel Henry)
dtermine par les probabilits
P
X
(]a, b]) = P(X (]a, b]) =
b
_
a
f
X
(x) dx.
Sa fonction de rpartition permet le calcul de toutes les probabilits des vnements lies
X :
F
X
(x) = P(X x) =
x
_

f
X
(t) dt.
X est une variable normale si sa densit f
X
est donne par :
f
X
(x) =
1

2
e

1
2
_
x

_
2
, pour x rel.
Cette loi est dsigne par N(, ). On ramne toutes les lois normales un mme type de
base, N(0, 1), en rduisant la variable X : on pose U =
x

La densit de la loi de U
est alors : f
U
(u) =
1

2
e

1
2
u
2
. La reprsentation graphique de f
U
est la fameuse courbe
en cloche dite (( courbe de Gauss )) :
-
6
O
x
y
1 2 2,6 1 2 2,6
-
-
-
Probabilit : 68 %
Probabilit : 95 %
Probabilit : 99 %
Valeurs prcises : P([U[ 1, 65) = 0, 9 ; P([U[ 1, 96) = 0, 95 ; P([U[ 2, 58) = 0, 99.
3 Le thorme de la limite centre (TLC)
Nous allons voir pourquoi cette loi simpose (( naturellement )). Reprenons la question
historique des erreurs de mesure. Mesurer une grandeur consiste mettre en uvre un
phnomne physique quun instrument de mesure est susceptible denregistrer sous la forme
dune donne numrique, dont la prcision dpend de la sensibilit de lappareil et des alas
17
Bulletin IREM n
o
67
qui accompagnent inluctablement toute procdure de mesure. Soit X la variable alatoire
qui une telle opration fait correspondre la valeur ache par lappareil.
Remarque de physicien : si on recommence n fois la mme mesure, on obtient n valeurs
entaches des (( erreurs de mesure )). En prenant leur moyenne, on obtient une valeur plus
prcise, ayant amlior virtuellement la sensibilit des appareils en rduisant la dispersion
des rsultats. Cette proprit, connue depuis longtemps, peut tre explique simplement
par un petit raisonnement probabiliste.
En eet, si on dsigne par X
i
les direntes v.a. reprsentant les mesures successives, ces
X
i
sont des rpliques indpendantes de la v.a. X. La valeur retenue pour la grandeur
mesurer sera donc :
X =
1
n
n

i=1
X
i
.
On peut faire deux remarques :
Si on suppose que les X
i
se rpartissent alatoirement autour de la valeur mesurer
(on suppose quil ny a pas derreur systmatique : E(X
i
) = ), il en est de mme
pour X dont la valeur moyenne est : E
_
X
_
=
1
n
n

i=1
E(X
i
) =
n.
n
= .
Mais, tenant compte de lindpendance des X
i
, on a daprs une proprit de base
de la variance : Var
_
X
_
=
1
n
2
n

i=1
Var(X
i
) =
1
n
2
n.
2
=

2
n

La dispersion de X est reprsente par lcart type /

n. X est donc plus concentre


autour de que chacune des X
i
, et ceci dautant plus que n est grand : avec n = 100,
on gagne un ordre de grandeur sur la sensibilit des instruments.
Un thorme (facile) dit que si X et les X
i
sont des variables normales de loi N(, ), alors
X est aussi une variable normale, mais sa loi est X N(, /

n).
Le thorme de la limite centre, thorme beaucoup plus fort, dit que :
Si (X
n
)
nN
est une suite de v.a. indpendantes et de mme loi, telle que
E(X
n
) = et Var(X
n
) =
2
, alors la suite des variables (( moyennes rduites ))
Z
n
=
X
n

n (( converge en loi )) vers une variable normale U centre


rduite : U N(0, 1).
La loi commune des X
n
peut-tre tout fait quelconque, la seule condition est que son
esprance et sa variance existent. Dans cet nonc du TLC, X =
1
n
n

i=1
X
i
et (( converge
en loi )) veut dire que la suite des fonctions de rpartition des Z
n
converge simplement vers
celle de U : pour tout z rel, P(Z
n
z) P(U z).
Mme si on ne sait rien sur le comportement des X
i
, le TLC dit que pour n assez grand (en
pratique, on a une assez bonne prcision ds que n > 50), on connat approximativement
la loi de X : cest presque une loi normale N(, /

n).
On peut alors calculer des probabilits telles que P
_

<
_
, permettant par exem-
ple :
18
Des lois continues en Terminale S, pourquoi et pour quoi faire? (Michel Henry)
de dterminer des intervalles de conance : pour un niveau de conance 1 donn :
trouver tel que P
_
X ] , +
_
> 1. En prenant le risque de se tromper,
on peut alors armer que
_
X , X +
_
.
ou de faire un test dhypothses : si sous une certaine hypothse H
0
tester, la
probabilit = P
_

>
_
est trs petite, et si on observe X en-dehors de
lintervalle ] , +[, on rejette H
0
en prenant le risque de se tromper.
Le TLC est un outil puissant de contrle de phnomnes qui sont des moyennes arith-
mtiques. La loi normale simpose dans son nonc. Sa dmonstration fait intervenir des
objets mathmatiques de haut niveau accompagnant les lois continues (transformation de
Fourier).
4 Exemple historique de base : le thorme de MoivreLaplace
Plaons-nous dans la situation du problme de Bernoulli : on rpte n fois une mme
preuve de Bernoulli (exprience alatoire 2 issues, succs de probabilit p ou chec de
probabilit (1 p)).
On sait (thorme de Bernoulli) que les frquences F
n
des succs (( tendent se stabiliser ))
vers p quand n devient trs grand. Plus prcisment, P([F
n
p[ < ) 1 quand n .
Mais comment contrler cette (( stabilisation )), cest--dire le degr de prcision obtenu
quand on value p par la valeur observe de la frquence F
n
?
La technique consiste construire un intervalle de conance pour p, dont les bornes
dpendent de la valeur observe de la frquence des succs pour un n donn.
Modlisons cela : chaque preuve on associe la v.a. de Bernoulli : X
i
= 1 si succs (de
probabilit p), 0 si chec ((1 p)). On a E(X
i
) = p et Var(X
i
) = p (1 p).
Or, F
n
= X
n
=
1
n
n

i=1
X
i
, puisque ce

est gal au nombre de succs obtenus en n


preuves. On a E(F
n
) = p et Var(F
n
) =
p(1 p)
n

On peut donc appliquer le TLC F
n
, ce qui donne le thorme de Moivre-Laplace :
Si n est assez grand, la loi de F
n
est (( proche )) de la loi normale
N
_
p ,
_
p(1 p)
n
_

Pratiquement, cette approximation est acceptable quand n > 50 et si p nest pas trop
voisin de 0 ou 1.
Comme nF
n
est gal au nombre de succs en n preuves de Bernoulli, cest une variable
binomiale de loi B(n, p). Le thorme de Moivre-Laplace donne lapproximation en loi de
la loi binomiale : B(n, p) N
_
np ,
_
np (1 p)
_
ds que n > 50 et p pas trop voisin de 0
ou de 1.
19
Bulletin IREM n
o
67
On peut aussi noncer cette proprit en considrant la frquence rduite sous la forme :
Z
n
=
F
n
p
_
p (1 p)

n N(0, 1),
La connaissance de la loi normale centre rduite permet alors le contrle souhait :
P(p ]F
n
; F
n
+[) = P
_
[F
n
p[
_
p (1 p)

n <

n
_
p (1 p)
_

= P
_
[U[ <

n
_
p (1 p)
_
1
Le niveau de conance 1 tant x (par exemple 0,95), la prcision de lestimation est
la plus petite valeur vriant cette dernire ingalit. Elle peut donc tre obtenue partir
du fractile correspondant de la loi N(0, 1). Cest la dmarche de base pour dterminer les
intervalles de conance pour les sondages alatoires.
5 Intervalle de conance pour une proportion (sondages)
On a donc obtenu P(p ]F
n
; F
n
+[) = P
_
[U[ <

n
_
p (1 p)
_
1 , condition de
conance, o U N(0, 1).
Dsignons par u
/2
le fractile dordre /2 de cette loi : P(U u
/2
) = 1 /2. Avec cette
notation, on a P([U[ u
/2
) = 1 . Par exemple (lecture dans la table), pour = 0, 05,
on trouve u
/2
= 1, 96.
La condition de conance est donc ralise avec u
/2
=

n
_
p (1 p)
,
do =
u
/2
_
p (1 p)

n
,
variant comme
1

n
Mais p est inconnu, cest justement la
proportion estimer ! On peut cependant majorer
_
p (1 p), car si on augmente , on
largit lintervalle de conance et la probabilit P(p ]F
n
; F
n
+ [) augmente, la
condition de conance est alors dautant mieux vrie.
Or p (1 p) 1/4 est acceptable si p est assez voisin de 1/2. (entre 0, 3 et 0, 7). De plus,
si = 0, 05 on a u
/2
= 1, 96 < 2, do <
1
_
n
est une majoration acceptable dans
ces conditions. On obtient donc la formule simplie de lintervalle de conance propos
comme fourchette dchantillonnage dans un thme dtudes du programme de seconde :
P
_
p
_
F
n

n
; F
n
+
1

n
__
0, 95
De manire plus gnrale, on peut voir que
F
n
p
_
F
n
(1 F
n
)

n converge aussi en loi vers U


(application dun lemme sur la convergence en loi, en remarquant que
F
n
(1 F
n
)
p (1 p)
p.s.
1
20
Des lois continues en Terminale S, pourquoi et pour quoi faire? (Michel Henry)
daprs la loi forte des grands nombres). On en tire une forme plus prcise de lintervalle
de conance pour la proportion p au niveau 1 :
P
_
p
_
F
n

u
/2
_
F
n
(1 F
n
)

n
; F
n
+
u
/2
_
F
n
(1 F
n
)

n
__

= 1
Do la (( fourchette de sondage )) thorique pour estimer p au niveau de conance 1 ,
partir dun chantillon de taille n pour lequel la valeur observe de F
n
est f
n
:
_
f
n

u
/2
_
f
n
(1 f
n
)

n
; f
n
+
u
/2
_
f
n
(1 f
n
)

n
_
IV Conclusion : Des lois continues pour quoi faire en
Terminale S ?
1 La notion de loi dans les classes de Premire
Les programmes des premires S, ES et L introduisent les probabilits demble par la
notion de loi (ou de distribution) de probabilits, cest--dire une rpartition de la certitude
en un ensemble ni de valeurs associes aux vnements lmentaires qui reprsentent les
issues dune exprience alatoire. La notion mme de probabilit nest pas objet dtude,
le programme se limitant aux calculs portant sur des probabilits dvnements.
La dnition propose dans le document daccompagnement est qu(( une loi de probabilits
est un objet mathmatique ayant les mmes proprits quune distribution de frquences )).
Cela signie simplement que les lments de cette loi (les probabilits lmentaires) sont
des nombres compris entre 0 et 1 et dont la somme est gale 1.
Mais le terme d(( objet mathmatique )) a son importance : il signie clairement que la
probabilit nest pas une grandeur de la ralit, elle fait partie des notions mathmatiques
qui contribuent la modlisation de cette ralit.
Ce point de vue est en rupture avec celui de lancien programme de Premire, qui faisait
de la probabilit une sorte de limite de frquence stabilise. Du coup elle appartenait au
mme paradigme, celui de la description de la ralit et non de sa modlisation. Nous nous
associons rsolument ce point de vue, car il va permettre dintroduire en Terminale S les
lois continues dans cette cohrence pistmologique.
Le programme prcise : (( Le lien entre loi de probabilit et distribution de frquences sera
clair par un nonc vulgaris de la loi des grands nombres )).
Concernant la loi (( faible )), notamment le thorme de Bernoulli, ce lien nest pas simple
expliciter. En eet, comme nous lavons vu, il fait intervenir deux sortes de probabilits :
la probabilit p, aecte une issue dune mme exprience alatoire rpte n fois, et la
probabilit que la frquence observe de cette issue ne scarte pas de p de plus quun .
Historiquement, lassimilation de ces deux notions de probabilit ne sest pas faite sans
dicults. Laplace lui-mme dans son Essai philosophique sur les probabilits (1814),
utilise le terme de (( possibilit )) lgard de la deuxime.
21
Bulletin IREM n
o
67
Dans lesprit du programme, il conviendrait dinstaller un (( mta-modle )) pour reprsen-
ter cette convergence (en probabilit) de la frquence, qui fait lobjet de la loi faible des
grands nombres. Bien videmment, cela est exclu au niveau secondaire, ce qui explique
pourquoi lnonc (( vulgaris )) propos par le programme est trs vague :
(( Pour une exprience donne, dans le modle dni par une loi de probabilit
P, les distributions des frquences calcules sur des sries de taille n se
rapprochent de P quand n devient grand )).
Pour expliciter cet nonc sans soulever cette dicult pistmologique, le document
daccompagnement sappuie sur la loi (( forte )), thorme d mile Borel (1909) : dans
certaines conditions, la suite des frquences de ralisation dune issue en n preuves dune
mme exprience alatoire, converge (presque srement, i.e. avec probabilit 1) vers la
probabilit de cette issue. Lensemble des k issues considres tant ni, il en est de
mme pour la suite des distributions de ces frquences qui converge (presque srement
dans R
k
) vers la loi de probabilit qui devra tre admise pour un modle pertinent de cette
exprience.
Notons que pour tous les exemples proposs, invitant la modlisation dexpriences de
rfrence ventuellement simules dans un environnement informatique, les lois de base
envisages sont toutes fondes sur lhypothse dquiprobabilit. Cette hypothse de modle
est suppose dcouler (( naturellement )) de symtries admises en hypothse de travail (ds,
pices, urnes, cartes, chires au hasard quirpartis, . . . ). On peut comprendre cette option
qui permet dchapper la question de lestimation statistique des probabilits lmentaires
introduire dans un modle o lquiprobabilit ne serait pas acceptable. Il ne peut donc
tre question de modliser le lancer dune punaise . . .
En Premire S, un modle de non quiprobabilit pourra tre conu comme un modle
image par une variable alatoire dont les valeurs regroupent diverses issues dune loi de
probabilit quirpartie. Ce sera notamment le cas en Terminale de la loi binomiale.
2 Des lois continues en Terminale S
Deux lois discrtes de base sont aux programmes des terminales S et ES : la loi de Bernoulli
et la loi binomiale. Leurs applications des exemples concrets permettent de mettre en
vidence leur statut de modles standards, applicables de nombreuses situations. Elles
permettent aussi dexpliciter les paramtres qui les dterminent entirement, respective-
ment la probabilit p du (( succs )) et le couple (n, p). Cette rfrence des modles de base
devrait favoriser la comprhension en termes de modles des deux lois continues introduites
ensuite en terminale S : la loi uniforme sur [0, 1] et la loi exponentielle.
Il y a l, cependant, un saut conceptuel majeur. Si une loi de probabilits a les proprits
dune distribution de frquences relatives un ensemble ni dissues, comment ce concept
peut-il tre tendu un ensemble continu de valeurs possibles ?
Une variable alatoire, au sens de la classe de premire, est une application dnie sur
un ensemble ni reprsentatif des issues. Elle ne peut donc avoir comme ensemble image
quun ensemble ni de valeurs numriques. Comment expliquer son plongement dans un
ensemble numrique continu ?
22
Des lois continues en Terminale S, pourquoi et pour quoi faire? (Michel Henry)
La probabilit dun vnement a t dnie comme la somme des probabilits des vne-
ments lmentaires le constituant. Transposes au cas continu, ces probabilits sont nces-
sairement toutes nulles, comme nous lavons vu. Comment donner un sens probabiliste
la notion de densit ?
On voit que le pari dintroduire des lois continues en terminale est pour le moins audacieux.
Le point de vue de la modlisation est ici incontournable. Les lois continues sont alors des
outils mathmatiques permettant, dans les modles considrs, de calculer les probabilits
de certains types dvnements. Ces modles continus sont choisis et leurs paramtres
sont dtermins (hypothses de modle) pour coller assez bien une ralit discrte
dcrite (hypothses de travail), cela partir de considrations heuristiques et destimations
statistiques. Les valeurs des probabilits ainsi calcules se rvlent alors assez proches des
frquences stabilises des vnements associs, obtenues par lobservation statistique.
On a vu comment introduire la loi uniforme en termes de proportionnalit. Dans lexemple
du jeu de franc-carreau, la ralit est dcrite dans un cadre gomtrique faisant naturelle-
ment intervenir des grandeurs continues.
La discrtisation en dimension 2 a permis de relier la distribution uniforme continue sur
un carr, o les probabilits sexpriment en termes de rapports daires, lquiprobabilit
de base. Cette dmarche peut tre transfre facilement des exemples conduisant une
loi uniforme sur [0, 1], les probabilits sexprimant en termes de rapports de longueurs
(dommage que celle de [0, 1] soit gale 1 !).
Il nest donc nul besoin pour le modle uniforme de recourir des calculs dintgrales, et
la notion de densit ne semble pas simposer.
La loi exponentielle est dsigne dans le programme par (( loi de dure de vie sans vieillisse-
ment )), par rfrence aux conditions heuristiques qui conduisent ce modle continu, telles
que nous les avons proposes.
La discrtisation et le passage par la loi gomtrique, qui permettent de comprendre
pourquoi la densit de probabilits intervenant dans ce modle est de type exponentiel,
sont hors datteinte en terminale.
La dtermination directe de la fonction de rpartition de cette loi pourrait tre accessible,
bien que de bon niveau pour des lves de terminale (indpendance dvnements, quation
fonctionnelle et intgration dune quation direntielle).
On peut se limiter prsenter le rsultat en armant que la relation :
P(a < X < b) =
b
_
a
e
x
dx ,
o X est la dure de vie et un paramtre positif caractrisant le phnomne (la
cadence), est un moyen mathmatique pratique pour calculer les probabilits de cette sorte
dvnements dans un modle continu assez bien adapt ce type de situations concrtes.
Les exemples sont nombreux : pannes, les dattente, . . .
Lexemple de la dsintgration radioactive permet une bonne illustration de cette loi,
mettant en uvre les connaissances acquises en analyse. En marge du programme (en
TER ?), il permet aussi un srieux travail de synthse et de prolongements. Dune part
il met en uvre de manire non vidente le thorme de Bernoulli comme exemple
dapplication de la loi des grands nombres (non vulgarise), pour relier la priode dun
23
Bulletin IREM n
o
67
lment radioactif au paramtre de la loi exponentielle qui modlise la dure de vie
dun atome. Dautre part il permet de manipuler lapproximation en loi avec le cas de
lapproximation de la loi binomiale par une loi de Poisson.
3 Notion de densit, prolongements des outils probabilistes pour
des modles performants
Au-del du programme de terminale S, les exemples simples des lois uniformes et des lois
exponentielles permettront de dgager la notion fondamentale de densit de probabilit.
Elle donnera lieu une utilisation intensive du calcul intgral et un srieux investissement
des outils de lanalyse.
Cest bien sr par sa densit que le modle gaussien peut tre introduit. Malgr son
importance, il ne la pas (encore ?) t au niveau des Terminales S (il faut bien faire
des choix, et la manipulation de lintgrale de Gauss nest pas aussi vidente que celle de
la fonction exponentielle). La loi normale gure dans certains programmes de BTS comme
exemple de base, pour ses multiples applications la statistique infrentielle notamment :
sondages, estimations, tests dhypothses, . . .
Les modles ni ne concernent que les situations pas trop vastes, avec quiprobabil-
it quelque part. Le passage aux modles continus permet une meilleure apprhension de
classes de phnomnes inaccessibles aux modles discrets. Mais il suppose le dveloppement
doutils de calcul performants (intgrales), dans des cadres thoriques nouveaux (axioma-
tique de Kolmogorov, 1933), dans lesquels peuvent tre obtenus des thormes puissants
(TLC, loi forte, . . . ), permettant de rsoudre de nouveaux problmes.
Lintroduction de lois continues en Terminale, outre la rsolution de problmes plus
intressants que les problmes traditionnels de combinatoire propos de jeux de hasard, a
pour importance essentielle de rendre incontournable la notion de modle. La simulation
informatique de situations simples y concourt aussi.
Le bnce quen tireront les lves sera sans doute une comprhension plus claire du
statut du calcul des probabilits comme un outil mathmatique des plus performants pour
matriser les problmes concrets issus de la complexit de la ralit, aussi bien dans les
domaines des sciences de la nature que dans les sciences conomiques ou dans les sciences
humaines.
24
Le petit Bac
Groupe (( Statistiques et probabilits ))
IREM de Franche-Comt
Sommaire
I Le document original . . . . . . . . . . . . . . . . . . . . . . . . 25
II Le document propos par le groupe de travail. . . . . . . . . . 25
1 lments de rponses de lexercice page 71. . . . . . . . . . . . . 25
2 Prolongement possible pour des lves de Terminale . . . . . . . 26
III nonc de lexercice propos aux lves de Terminale. . . . . 27
Cest lhistoire dun exercice extrait du (( document daccompagnement des nouveaux
programmes de premire )).
Aprs lanalyse de ce document par le groupe (( Statistiques et probabilits )) de lIREM de
Besanon, une extension de cet exercice fut propos au cours du stage sur les probabilits.
Ce travail repris par un stagiaire devient un joli problme propos aux lves de terminale.
I Le document original : Exercice page 71 du document.
(( Un petit bac peut, en plus des voyageurs, transporter une seule voiture la fois pour
aller dans une le.
Il faut rserver et payer la veille.
En cas de dsistement, le propritaire du bac ne rembourse que la moiti du prix du billet.
On estime quen priode estivale, une proportion stable p des rservations donne lieu un
dsistement. Comme il y a toujours au moins deux demandes de rservation par trajet, le
propritaire se demande sil naurait pas intrt prendre deux rservations pour chaque
trajet : sil ny a pas de dsistement, il prend une voiture et fait transporter ses frais
lautre par un confrre dont le prix de passage est double du sien.
Pour quelles valeurs de p a-t-il intrt, long terme, prendre ce systme de surrserva-
tion ?
Ce problme pourra tre repris en terminale, dans des cas plus complexes, quand les lves
auront vu la loi binomiale. ))
II Le document propos par le groupe de travail.
1 lments de rponses de lexercice page 71.
Comme il y a toujours au moins 2 demandes de rservation par trajet et que le dsistement
aprs rservation est un vnement de probabilit p, le chire daaire journalier est une
variable alatoire, note C. Notons b le prix du passage dune voiture.
25
Bulletin IREM n
o
67
Sil naccepte quune rservation.
vnements Dsistement : d Non dsistement : nd
Probabilits p 1 p
Chire daaire C
b
2
b
E(C) = p
b
2
+ (1 p) b =
_
1
p
2
_
b
Sil accepte deux rservations, son chire daaire est une variable alatoire note C

.
vnements d1 et d2 d1 et nd2 nd1 et d2 nd1 et nd2
Probabilits p p p(1 p) (1 p)p (1 p)(1 p)
Crdit la veille b +b b +b b +b b +b
Dbit le jour du passage 0, 5b 0, 5b 0, 5b 0, 5b 2b
Chire daaire C

b
3b
2
3b
2
0
E(C

) = b p
2
+ 3b(p p
2
) = (2p
2
+ 3p)b
E(C

) > E(C) si 2p
2
+3p > 1
p
2
ou 4p
2
+7p 2 > 0. Posons p
0
=
7 +

17
8
0, 36
Donc si p > p
0
le systme de surrservation est rentable.
2 Prolongement possible pour des lves de Terminale
Supposons quil y ait toujours au moins 3 demandes de rservation par trajet.
Si le propritaire accepte trois rservations, le nombre de dsistements parmi ces demandes
est une variable alatoire D qui suit une loi binomiale et son chire daaire est une variable
alatoire note C

.
Le nombre de dsistements D 3 2 1 0
Probabilits p
3
3p
2
(1 p) 3p(1 p)
2
(1 p)
3
Crdit la veille 3b 3b 3b 3b
Dbit le jour du passage
3b
2
b
5b
2
4b
Chire daaire C

3b
2
2b
b
2
b
E(C

) = b
_
3
2
p
3
+ 2 3p
2
(1 p) +
3
2
p(1 p)
2
(1 p)
3
_
= b
_
2p
3
+
9
2
p 1
_
26
Le petit Bac (Groupe (( Statistiques et probabilits )))
E(C

) > E(C

) si 2p
3
+
9
2
p 1 > 2p
2
+3p ce qui donne : 2p
3
+2p
2
+
3
2
p 1 > 0 avec
p =
1
2
comme racine vidente ce qui permet une factorisation.
(2p + 1)(2p
2
p 2) > 0
(2p
2
p 2) < 0 entre
1

17
4
0, 78 et
1 +

17
4
1, 28, donc sur [0; 1].
pour p >
1
2
le 3
e
procd est plus rentable que le 2
e
.
Conclusion :
Pour p > 0, 5 le meilleur choix est
daccepter trois rservations.
Pour p
0
< p < 0, 5 le meilleur choix est
daccepter deux rservations.
Pour p < p
0
le meilleur choix est de
naccepter quune rservation.
O
p
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
1.6
1.7
E
(C
)/
b
E
(
C
)
/
b
E
(
C

)
/
b
III nonc de lexercice propos aux lves de Termi-
nale.
Un petit bac peut, en plus des pitons, transporter une seule voiture la fois pour aller
sur une le. Il faut rserver et payer la veille. Le prix du billet est 5 .
En cas de dsistement, le propritaire du bac ne rembourse que la moiti du prix du billet.
On estime quen priode estivale, une proportion stable p de rservations donne lieu un
dsistement.
Soit X la variable alatoire gale au chire daaire journalier du propritaire du bac
concernant le passage des voitures.
Partie A :
Le propritaire du bac prend une seule rservation par jour.
1. Donner la distribution de X sous forme de tableau.
2. Calculer lesprance E
A
en fonction de p.
27
Bulletin IREM n
o
67
Partie B :
Comme il y a toujours au moins 2 demandes de rservation par trajet, le propritaire
se demande sil naurait pas intrt prendre 2 rservations pour chaque trajet : sil
ny a pas de dsistement, il prend une voiture et fait transporter ses frais lautre
voiture par un confrre dont le prix de passage est double du sien.
1. Donner dans ce cas la nouvelle distribution de X sous forme de tableau.
2. Calculer lesprance E
B
en fonction de p.
3. Daprs les expressions de E
A
et E
B
, pour quelles valeurs de p a-t-il intrt,
long terme, adopter ce systme de surrservation ?
Partie C :
Le propritaire du bac est certain denregistrer au moins 3 demandes de rservation
par trajet. Il dcide alors de prendre 3 rservations par jour, au risque de supporter
le cot du passage par son collgue des voitures quil ne peut transporter (dans les
mmes conditions que ci-dessus).
1. Donner dans ce cas la nouvelle distribution de X sous forme de tableau.
2. Calculer lesprance E
C
en fonction de p.
3. Sur une calculatrice graphique, tracer les 3 fonctions E
A
, E
B
et E
C
pour p sur
[0; 1] Pour quelle valeur de p les 2 fonctions E
B
et E
C
semblent-elles gales ?
Vrier par le calcul.
4. Rsoudre E
C
> E
B
.
Pour quelles valeurs de p le propritaire du bac a-t-il intrt, long terme,
adopter ce systme de surrservation pour 3 voitures ?
Michel Vendrely
28
propos du programme de
statistique en Seconde : remarques
sur la simulation informatique
Michel HENRY
IREM de Franche-Comt
Une dnition :
La simulation est lexprimentation sur un modle. Cest une procdure de recherche
scientique qui consiste raliser une reproduction articielle (modle) du phnomne
que lon dsire tudier, observer le comportement de cette reproduction lorsque lon fait
varier exprimentalement les actions que lon peut exercer sur celle-ci, et en induire ce
qui se passerait dans la ralit sous linuence dactions analogues.
(Encyclopdie Universalis)
Lordinateur est-il un vritable gnrateur de hasard ? En principe, pas pour le moment,
tant que des phnomnes physiques, comme lexploitation du bruit lectronique par
exemple, ne sont pas introduits cette n. Actuellement, les nombres pseudo-alatoires
que lordinateur (ou la calculatrice) fournit sont dtermins, ds lors quil a commenc leur
calcul sur la base dune initialisation (randomization) qui, en principe, dtermine chaque
fois des suites direntes.
Mais la complexit de leur dtermination, supposant un calcul lourd, rend impossible
leur prvision par tout autre moyen humain. (( On a alors le phnomne fortuit )) selon
lexpression de Poincar. Tout se passe donc comme si les chires fournis par la
fonction Random de lordinateur taient issus dun tirage alatoire de boules numrotes
de 0 9 dans une urne. La condition est que cette gnration pseudo-alatoire vrie
dirents tests duniformit. En tout cas, les moyens de contrle notre disposition ne
permettent pas dinvalider cette hypothse, et nous pouvons dclarer que lordinateur
simule les tirages (( au hasard )) successifs de ces boules de lurne. Le problme dobtenir
un tel comportement de lordinateur est un problme de spcialiste : on sait que la suite
(( alatoire )) de ces chires gnrs est en fait priodique sur une trs longue priode, mais
pour notre simulation, nous limitant un nombre raisonnable de donnes, ce problme ne
se pose pas.
Mais, par exemple, en (( simulant )) un sondage sur Excel, ayant prcis notre modle
probabiliste sous-jacent (loi de Bernoulli B(1, p) pour la variable parente X
0
, o p est la
proportion dans la population P estimer), ayant introduit la valeur p dans lordinateur,
avons-nous rellement simul quelque chose ? Ou avons-nous seulement vri que le
rsultat de la simulation (conforme ce qui tait donc attendu), conrme que le fabricant
de lordinateur et le concepteur du logiciel ont bien rempli leurs cahiers des charges ? Sans
doute, en ralit cest ce que nous avons fait.
Cependant, ne ngligeons pas lintrt de loutil informatique. Il permet une approche
exprimentale des situations de sondages, et si la proportion p est cache aux lves, nous
avons un outil de rsolution de problmes jouant le mme rle que les calculettes graphiques
29
Bulletin IREM n
o
67
quand elles tracent des courbes reprsentatives de fonctions donnes, ce qui suppose
une bonne dose de conance (parfois mal place car trahie dans certaines conditions
particulires) dans le bon fonctionnement de cet outil.
Mais notre question est plus fondamentalement didactique. Lordinateur nous permet
dabord de travailler sur de vastes sries statistiques, ce qui donne aux rsums statistiques
toute leur importance. Il nous permet ensuite une prsentation anime du fonctionnement
et de linteraction des notions de frquence et de probabilit, introduites auparavant, soit
thoriquement, soit au travers dexpriences pratiques en nombre trop limit pour pouvoir
dboucher valablement sur une bonne comprhension de la loi des grands nombres.
Mme si, dans son fonctionnement rel, lordinateur ne fait pas intervenir de notion
de probabilit. Il se limite exhiber les eets sur les frquences aches du principe
dquirpartition des chires pseudo-alatoires quil gnre, principe qui entre dans ses
spcications), lusage que nous en faisons dans la classe, comme pseudo-gnrateur
de hasard, permet de faire comprendre en actes ces notions de frquence, de uctuations
dchantillonnages et de probabilit.
Mais on ne peut se satisfaire de la seule exploitation de la puissance et la rapidit de
lordinateur pour gnrer des nombres alatoires, permettant de prsenter aux lves une
grande richesse de nouvelles expriences alatoires, car cela naurait quun intrt limit.
Son intrt didactique, en tant quoutil de simulation, tient plus essentiellement en ce
quil nous oblige analyser la situation alatoire en jeu et mettre des hypothses de
modle. Ces hypothses portent notamment sur la loi de probabilit idoine pour reprsenter
lintervention du hasard dans lexprience relle, par exemple sur le choix de la valeur
de la probabilit de Bernoulli implanter. Il reste alors traduire ces hypothses en
instructions informatiques pour que lordinateur nous permette de rsoudre des problmes
ventuellement inaccessibles par le calcul a priori. De ce point de vue, cela suppose de
comprendre le processus de modlisation et dinterprter les rsultats obtenus, rapports
aux hypothses de modle introduites. Simulant ainsi une exprience alatoire rellement
eectue, au-del de lexploration statistique, lordinateur devient un outil didactique
majeur pour lapprentissage de la modlisation en probabilits.
30
Presses Universitaires Franc-Comtoises
Universit de Franche-Comt
25030 BESANCON CEDEX
Maquette et mise en page Franois Ptiard (IREM)
Imprimerie : Reprographie du
Dpartement de Mathmatiques
Dpt lgal 2
e
trimestre 2002
Institut de Recherche sur
lEnseignement des Mathmatiques
de Franche-Comt
Dpartement de Mathmatiques. UFR Sciences et Techniques.
16 route de Gray. 25030 BESANCON CEDEX
Tl. : 03 81 66 62 25 - Fax : 03 81 66 62 34
Ml : iremfc@math.univ-fcomte.fr
Site web : http ://www-irem.univ-fcomte.fr
IREM
Bulletin n
o
67. 2002 ISSN 1141-913X