Probabilits et statistique
Ces documents peuvent tre utiliss et modifis librement dans le cadre des activits
d'enseignement scolaire, hors exploitation commerciale.
Toute reproduction totale ou partielle dautres fins est soumise une autorisation
pralable du Directeur gnral de lenseignement scolaire.
La violation de ces dispositions est passible des sanctions dictes larticle L.335-2
du Code la proprit intellectuelle.
Fvrier 2012
MENJVA/DGESCO eduscol.education.fr/prog
Introduction
Le document ressource pour la partie du programme de la classe terminale Probabilits et
statistique donne des lments dtaills permettant aux professeurs de construire leur propre cours. Il
ne sagit pas dun modle reproductible tel quel mais dun support thorique sur les notions introduites
pour la premire fois dans les programmes du secondaire.
Ces notions sont enseignes dans diffrents cursus de lenseignement suprieur mais le point de vue
adopt dans le programme de la classe terminale est assez diffrent.
Les fondements de thorie des probabilits indispensables pour comprendre les notions de statistique
infrentielle prsentes dans le programme sont dvelopps aussi prcisment que possible ce niveau
denseignement.
La loi normale est introduite en terminale S comme loi-limite dune suite de variables alatoires grce
au thorme de Moivre-Laplace. Bien quadmis, ce thorme se visualise facilement grce des
animations avec un logiciel de gomtrie dynamique ou sur tableur et cest sous cette forme que la loi
normale doit tre introduite en terminale ES.
La notion dintervalle de fluctuation dune variable alatoire a t introduite en seconde et dveloppe
en premire dans le cadre de la loi binomiale laide de calculs sur tableur. Elle est enrichie par la
notion dintervalle de fluctuation asymptotique dune variable alatoire frquence qui prsente
lintrt de pouvoir se dterminer par un simple calcul.
La notion dintervalle de confiance pour une proportion est introduite grce lintervalle de
fluctuation asymptotique.
Tous les nouveaux items sont prsents avec des activits. Celles-ci sont souvent mises en uvre sur
calculatrices ou avec un algorithme. Des exemples dexercices sont galement proposs.
Un complment sur les lois uniforme et exponentielles est propos, leur approche ayant t modifie.
1
lexception dun changement de variable (linaire) incontournable....
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Fvrier 2012
Mathmatiques Probabilits et statistique
http://eduscol.education.fr/prog
Tabledesmatires
Introduction ........................................................................................................................... 1
A. Gnralits............................................................................................................................. 10
B. Exemples dexercices ............................................................................................................ 12
A. Cas binomial.......................................................................................................................... 18
B. Activit : recherche et utilisation dun intervalle de fluctuation laide dun algorithme .... 18
C. Intervalle de fluctuation asymptotique .................................................................................. 20
D. Exemples dutilisation ........................................................................................................... 22
1. Prise de dcision ............................................................................................................................. 22
2. Problme de la surrservation (surbooking)................................................................................... 23
3. Echantillon reprsentatif dune population pour un sondage......................................................... 24
E. Intervalle de fluctuation simplifie donn en seconde ............................................................ 25
Exemples dexercices ................................................................................................................................ 28
V. Intervalle de confiance 30
A. Introduction ........................................................................................................................... 30
Activit ...................................................................................................................................................... 31
B. Principe gnral de lintervalle de confiance ........................................................................ 33
C. Dfinition .............................................................................................................................. 33
D. Intervalle de fluctuation ou intervalle de confiance : lequel utiliser ?................................... 34
E. Autre intervalle de confiance................................................................................................. 35
F. tude de la longueur de lintervalle de fluctuation et consquence pour lintervalle de
confiance ........................................................................................................................................ 35
G. Dtermination de la taille minimale de lchantillon pour avoir une prcision donne ........ 36
H. Applications........................................................................................................................... 37
1. Exemple de dtermination dun intervalle de confiance ................................................................. 37
2. Simulations...................................................................................................................................... 37
Exemples dexercices ................................................................................................................................ 39
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 2 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
VI. Complments sur les lois uniforme et exponentielle 42
A. Loi uniforme.......................................................................................................................... 42
B. Lois exponentielles................................................................................................................ 44
Soit X une variable alatoire discrte desprance E(X) = m, de variance V(X) et dcart type
V( X ) non nul.
La variable alatoire ( X m) a une esprance nulle
X m
La variable alatoire Z a une esprance nulle et une variance
gale 1, donc un cart type gal 1.
Attention
Lcart-type dune variable alatoire suivant une loi binomiale ne fait pas partie des contenus
mentionns dans le programme des classes de premire ES et L. Il convient donc, avant daborder le
chapitre sur la loi normale en terminale, de lintroduire en lien avec lcart-type dune srie statistique
et den faire percevoir les effets dans le cadre dune activit de simulation.
Si une variable X prend ses valeurs entre 0 et n, ( X m) les prend entre m et n m donc
X m m nm
Z les prend entre et . Si la variable alatoire X est reprsente par un
diagramme en btons, on obtient la reprsentation de la variable ( X m) par translation de vecteur
m i de ce diagramme. Puis on obtient la reprsentation de la variable alatoire Z par rduction
du nouveau diagramme. Les abscisses sur lesquelles sont construits les btons sont les valeurs de
X m
et les hauteurs des btons sont les mmes que celles obtenues pour la variable X, cela conduit
une concentration si 1 . Sur le graphique ci-dessous, on a droite le diagramme en bton dune
variable X, gauche en clair le diagramme de ( X m) et en plus fonc celui de Z.
Rappel
Une variable alatoire qui suit la loi binomiale B (n, p) peut sinterprter comme un nombre de succs
lors de la rptition de n expriences de Bernoulli indpendantes.
Soit Xn une variable alatoire suivant la loi binomiale B (n, p) ; on a :
Figure 3 : Visualisation de P( a Z n b )
Document associ : binomiale et normale.ggb
Les bords suprieurs des rectangles font apparatre une courbe rgulire et symtrique dlimitant une
aire qui est voisine de celle de la runion des rectangles.
Le mathmaticien Abraham de Moivre, protestant franais migr en Angleterre aprs la rvocation de
ldit de Nantes (1685), a dcouvert que cette courbe est la courbe reprsentative de la fonction
x
1 2
x e . Le cours de terminale sur lintgration permet dcrire que laire situe sous cette
2
x
2 1 2
courbe vaut 1 2
e dx . Pour comparer laire de la runion des rectangles et celle sous la courbe,
k 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
( X k ) 0,048 0,058 0,067 0,073 0,078 0,080 0,078 0,073 0,067 0,058 0,048 0,039 0,030 0,022 0,016 0,010
Lorsque n devient grand, p fix, la largeur des rectangles est de plus en plus petite car elle
1 1
vaut .
np(1 p)
Laire correspondant P ( Z n a, b ) se rapproche de laire entre a et b sous une courbe fixe,
x
1 2
qui est la courbe reprsentative de la fonction x e .
2
Exercice (TS)
x
Soit la fonction g dfinie par g ( x) e 2 .
1. Montrer que la fonction drive g ' est minimale pour x 1 .
2. Montrer que la fonction x x g ( x ) est croissante sur [0, [ .
3. En dduire que si 0 a b alors a b g (b ) g ( a ) 0 et que si a b 0 alors
0 g (b ) g ( a ) b a .
4. En dduire que pour tous rels a et b on a : g (b) g (a) b a .
B. Thorme de Moivre-Laplace
Le rsultat suivant est au programme de la classe de terminale S uniquement et il est admis.
Thorme
On suppose que, pour tout entier n, la variable alatoire X n suit une loi binomiale B (n, p).
X n np
On pose Z n , variable centre et rduite associe X n .
np(1 p)
x
b 1
Alors, pour tous rels a et b tels que a b , on a : lim ( a Z n b )
n
a 2
e 2 dx .
2
Ce rsultat est la loi des grands nombres. En seconde, on a donn une forme simplifie de la loi des grands
nombres, savoir : la probabilit que la variable frquence scarte de p diminue quand le nombre
dobservations augmente.
1. Premires proprits
f est continue sur IR .
Laire totale sous la courbe de f est gale 1, elle reprsente la probabilit P ( X , ).
La fonction f est paire ; sa courbe reprsentative est donc symtrique par rapport laxe des
ordonnes.
1
Laire sous la courbe sur [0, [ est gale .
2
Pour tout rel u, P(X u ) = 1 P(X u ) .
Sur la figure, o u 0 , les aires grises sont gales en raison de la symtrie de la courbe
reprsentative.
3
Cette loi est galement nomme "loi normale standard", en particulier dans les tableurs courants, mais cette
dnomination ne figure pas au programme.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 8 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
Daprs la symtrie de la courbe, on a pour tout rel u positif,
u
(u X u ) 2(0 X u ) 2 f ( x)dx = 2H(u),
0
o H est la primitive de f sur IR qui sannule en 0. La fonction H est donc continue et strictement
1
croissante sur 0, . On a lim H (u ) puisque cela correspond laire sous la courbe pour
u 2
u 0, , c'est--dire P( X 0) .
La fonction 2H admet donc le tableau de variations et la courbe reprsentative ci-dessous :
t 0
1
2H(t)
Pour tout rel compris strictement entre 0 et 1, le rel (1 ) est galement compris strictement
entre 0 et 1 et donc, daprs le corollaire du thorme des valeurs intermdiaires, il existe un unique
rel u strictement positif tel que 2 H (u ) 1 c'est--dire tel que u X u 1 .
u0,05 est le rel pour lequel (u0.05 X u0.05 ) 0,95 et on a donc : ( 1, 96 X 1, 96) 0, 95
de mme, ( 2, 58 X 2, 58) 0, 99 .
Cela donne une ide de la rpartition des valeurs de X. Environ 95% des ralisations de X se trouvent
entre 1,96 et 1,96.
(on fera le lien avec ce qui est vu avec les lois uniformes et exponentielles).
Lesprance dune variable alatoire X suivant la loi N (0,1) est nulle. En effet :
y y 1
t
1 y
t
1
y
0
t f ( t )dt = 0
2
t e 2 dt =
2
0
t e 2 dt
2
1 e 2
0 1 x2
De mme, x
t f ( t )dt = e 1
2
Par passage la limite, on obtient E(X) = 0.
La variance de X est dfinie par lesprance du carr de lcart entre X et son esprance soit
E(( X E( X )) 2 ) et on admet quelle vaut 1.
On peut proposer le calcul de la variance en exercice, selon une mthode analogue celle utilise pour
le calcul de lesprance dune loi exponentielle.
A. Gnralits
On dispose dun chantillon de 50 000 tailles (en cm) dhommes adultes dont voici un rsum
statistique et un histogramme 4 :
Moyenne cart type Nombre Minimum Maximum Mdiane Interquartile
Tailles 175,0 8,0 50 000 145,1 208,5 175,0 10,8
Si on centre et rduit la variable taille , lhistogramme obtenu prsente une analogie vidente avec
la figure 3 5 ; cela motive la dfinition suivante.
4
Cet exemple est emprunt au document daccompagnement publi en 2002.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 10 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
X
Une variable alatoire X suit une loi N (, 2) si la variable alatoire suit la loi normale
N (0,1).
Remarque
Il sagit dune loi densit c'est--dire quil existe une fonction g dfinie sur IR telle que, pour tous
b
rels a et b vrifiant a b, on a P( a X b) a
g (t )dt . Lexpression de la fonction de densit de X
nest pas au programme.
6
On peut constater que est la fois lesprance et la mdiane de X.
Exemple
La masse en kg des nouveaux ns la naissance est une variable alatoire qui peut tre modlise par
une loi normale 7 de moyenne = 3,3 et dcart type = 0,5. La probabilit quun nouveau n pse
X 3,3
moins de 2,5 kg la naissance est donc : P(X < 2,5). La variable Z = suit la loi N (0,1).
0,5
2,5 3,3
On a alors : P(X < 2,5) = P(Z < ) = P(Z < 1,6) = 1 P(Z < 1,6) 0,055.
0,5
La probabilit cherche est donc gale 0,055 103 prs.
On peut aussi obtenir directement la valeur de P(X < 2,5).
On donne dans le paragraphe B la mthode pour obtenir cette valeur la calculatrice.
5
Il faut noter quil sagit ici dun histogramme car la variable taille est continue alors que sur la figure 3 les
rectangles ne sont pas ceux dun histogramme car la variable binomiale nest pas continue.
6
Un rel m est une mdiane dune variable alatoire si X m 0 , 5
7
Le poids dun nouveau n ne prend pas de valeurs ngatives mais on peut vrifier que P(X < 0) est ngligeable
de mme que P(X > 5).
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 11 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
Reprsentations graphiques montrant limportance de la valeur de lcart type
Courbes reprsentatives des densits de la loi normale N (0,1/4) en rouge (maximum voisin de 0,8), de
la loi normale N (0,1) en bleu et de la loi normale N (0,4) en vert.
B. Exemples dexercices
2. La slection chez les vaches laitires de race Franaise Frisonne Pis Noir
La production laitire annuelle en litres des vaches laitires de la race FFPN peut tre modlise par
une variable alatoire densit X, de loi normale de moyenne = 6000 et dcart-type = 400. La
fonction g dsigne la fonction de densit de cette loi normale.
1 Afin de grer au plus prs son quota laitier (production maximale autorise), en dterminant la taille
optimale de son troupeau, un leveur faisant natre des vaches de cette race souhaite disposer de
certaines probabilits.
a) Calculer la probabilit qu'une vache quelconque de cette race produise moins de 5800 litres par an.
Solution
Attention !
Les calculatrices ne fournissent pas X x mais seulement a X b .
Pour le calcul de X x dans le cas o X suit une loi N (, 2), la rgle pratique est donc la
suivante :
Si x , on utilise X x 0,5 X x
Si x , on utilise X x 0,5 x X .
Pour entrer les paramtres, il faut saisir les valeurs de et de (et non ).
R TEXAS(83Plus) et + CASIO(35+) et +
rpartition normale rpartition normale pr programme rpartition normale pr
pr programme 0.5 - programme
pnorm(5800, mean = normalFRp(5800,6000,6000,400) menu stat dist NORM
6000, 0.3085375 Ncd Lower : 5800 ; Upper
sd = 400, lower.tail : 6000
= TRUE) ou : 400 ; : 6000.
Complment pour lenseignant :
ou pnorm(5800, 6000, intgration numrique aprs changement de
Normal C.D. prob = 0.19147
400) variable pour se ramener la loi normale .5 - .19147
[1] 0.3085375 centre rduite. .30853
intgrFonct(1/(2)*e^(- t/2), t,-5,(5800 -
ou 6000)/400) ou
Complment pour 0.3085373 Complment pour lenseignant :
lenseignant : intgration numrique aprs
intgration numrique de la changement de variable pour se
densit dune loi normale ramener la loi normale centre
de paramtres mu sigma. rduite
(-Inf signifie moins SET UP Integration : Simpson
l'infini et Inf plus menu RUN OPTN CALC dx(
l'infini. $value signifie 1/(2)*e^(- x/2), -5, (5800 -
que l'on ne prend que la 6000)/400)
valeur numrique de l'objet 0.3085372
rsultat de la fonction
integrate. La fonction
gauss est la densit d'une
loi de Gauss d'esprance mu
et d'cart type sygma, g en
est un cas particulier)
gauss <- function(x, mu =
moy, sigma = et){dnorm(x,
mu, sigma)}
moy <- 6000 ; et <- 400
integrate(gauss, -Inf,
5800)$value
[1] 0.3085375
b) Calculer la probabilit qu'une vache quelconque de cette race produise entre 5900 et 6100 litres de
lait par an.
Solution : P(5900 < X < 6100) 0,1974.
c) Calculer la probabilit qu'une vache quelconque de cette race produise plus de 6250 litres par an.
Solution : P(X > 6250) 0,2660.
R TEXAS(83Plus) et + CASIO(35+) et +
rpartition normale rpartition normale rpartition normale
rciproque pr programme rciproque pr programme rciproque pr programme
qnorm(.30, 6000, 400) FracNormale(.30,6000,400) menu stat dist NORM
[1] 5790.24 5790.24 InvN Area :.3
: 400 ; : 6000.
Inverse Normal x = 5790.2
b) la production minimale prvisible des 20% des vaches les plus productives.
Il sagit de dterminer la valeur x de X telle que P(X > x) = 0,20.
Rponse : x 6336 litres de lait par an.
3. Processus industriel 8
On a mesur cette cote sur 40 ensembles poulie-pompe issus du processus de fabrication en srie. Les
variations sont reprsentes sur le graphique suivant :
1. Ce type de processus industriel induit la modlisation de la variable alatoire cote par une
variable suivant une loi normale N (, 2) 9 .
Donner par lecture graphique une valeur estime 10 de lesprance et de lcart-type partir
de la srie des 40 valeurs. (Rponse : environ 39,9 et 0,05)
8
Cet exemple est emprunt la brochure IREM n 112: Enseigner la statistique au lyce.
9
On peut vrifier la validit dun tel modle par des tests de normalit, mais cest hors de propos ici.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 14 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
2. Lintervalle de tolrance pour cette cote est de 39,9 0,15.
Donner, laide des 40 mesures effectues, une valeur approche de la probabilit que la variable
cote soit dans cet intervalle. (Rponse : environ 0,997).
La bote est juge conforme si sa masse est comprise entre 496,2 g et 503,8 g (soit environ 500 3 ).
Solution
X 500
Notons Z = . Z suit une loi normale centre rduite donc nous savons que
1,6
P( 2,58 < Z < 2,58) 0,99. Il ne reste plus, pour trouver h et + h, qu' rsoudre
h 500 h 500
2,58 et 2,58 ce qui donne h 503,3 et h 496,7 .
1,6 1,6
Grce des chantillons prlevs en sortie de chaine ces masses dalerte permettent de dceler des
anomalies en temps rel.
Solution
Il sagit dterminer la valeur de telle que P(X < 100) < 0,001. On dtermine d'abord la valeur z (on
dit aussi quantile) de la loi normale centre rduite, telle que P(Z < z) = 0,001. On trouve (logiciels ou
calculettes) z 3,09. Comme Z = (X ) / 2, il ne reste plus, pour trouver , qu' rsoudre
3,09 = (100 ) / 2. On trouve 106,18 .
10
Il existe des mthodes destimation par intervalle de confiance de ces paramtres, mais ici il sagit simplement
dune valeur empirique.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 15 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
R TEXAS(83Plus) et + CASIO(35+) et +
qnorm(p) est la FracNormale() est la
fonction qui permet de fonction qui permet de InvN est le menu qui permet de
trouver t tel que trouver t tel que P(T<t)p, trouver t tel que P(T<t)p T
P(T<t)p, T tant de T tant de loi normale tant de loi normale (cest la
loi normale (cest la (cest la rpartition rpartition normale rciproque
rpartition normale normale rciproque pr pr programme)
rciproque pr programme) menu stat dist NORM InvN
programme) FracNormale(.001,0,1) Area :.001
qnorm(.001) -3.0902323 : 1 ; : 0.
[1] -3.090232 Inverse Normal x = -3.0902
2 La contenance des bouteilles tant de 110 cL, quelle est alors la probabilit qu'une bouteille dborde
lors du remplissage?
Solution : Avec 106,18, on obtient P(X > 110) 0,028.
4 Le directeur de la cooprative veut qu'il y ait moins de 1% de bouteilles qui dbordent au risque de
ne plus suivre la lgislation.
a) Quelle est alors la valeur de ?
Solution
Il sagit cette fois de dterminer tel que P(X > 110) < 0,01. On trouve 105,34 .
b) Quelle est dans les conditions de la question a) la probabilit que la bouteille contienne moins d'un
litre?
Solution
Avec cette valeur de , on obtient P(X < 100) 0,0038, ce qui est plus lev que dans le cas
prcdent.
c) Dterminer et afin quil y ait moins de 0,1% de bouteilles de moins d'un litre ET moins de 1%
de bouteilles qui dbordent.
Solution
On cherche donc dterminer les valeurs de et de de sorte que :
P(X < 100) < 0,001 et P(X > 110) < 0,01.
Les deux contraintes sur les probabilits fournissent les deux conditions suivantes.
On dtermine d'abord la valeur zsup de la loi normale centre rduite telle que P(Z > zsup ) = 0,01. On
trouve (logiciels ou calculettes) zsup 2,33.
On dtermine ensuite la valeur zinf telle que P(Z < zinf ) = 0,001. On trouve zinf 3,09.
Les deux contraintes se traduisent donc par les deux ingalits suivantes :
110 100
2,33 et 3,09 .
On obtient donc un domaine de solutions et une discussion pourra tre mene quant aux choix
pertinents que le directeur de cooprative pourrait faire.
La dure de vie d'un certain type dappareil est modlise par une variable alatoire suivant une loi
normale de moyenne et dcart-type inconnus. Les spcifications impliquent que 80 % de la
production des appareils ait une dure de vie entre 120 et 200 jours et que 5% de la production ait une
dure de vie infrieure 120 jours.
1. Quelles sont les valeurs de et 2 ?
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 16 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
2. Quelle est la probabilit davoir un appareil dont la dure de vie soit comprise entre 200 jours
et 230 jours ?
Solution
1. On note X la variable dure de vie. Les spcifications se traduisent par :
P(120 X 200) 0,8 et P( X 120) 0,05 .
X
En notant toujours Z la variable centre rduite, on obtient :
120 200 120
P( Z ) 0,8 et P( Z ) 0,05
En utilisant logiciel ou calculatrice, on obtient : = 120 + 1,65 et = 200 1,04 .
La rsolution du systme donne : 169 et 884 .
A. Cas binomial
Soit X une variable suivant une loi B (n, p) et un rel dans lintervalle ]0, 1[.
Dans un cadre gnral, tout intervalle a, b tel que : P ( X a, b ) 1 peut tre considr comme
un intervalle de fluctuation de X au seuil 1 .
Ainsi lintervalle 0, n est un intervalle de fluctuation vident au seuil 1 mais il est de toute vidence
sans intrt.
On peut chercher :
celui qui a lamplitude minimale (IF1)
le plus petit intervalle centr autour de lesprance np comme dans le thorme de Moivre-
Laplace (IF2)
celui qui symtrise les probabilits que X soit lextrieur, comme propos dans le
document ressource de premire (IF3)
Dans le programme de seconde, on donne un intervalle de fluctuation approch au seuil
X
Fn n
0,95, valable sous certaines conditions, de la variable frquence n :
1 1
p ,p
n n (IF4)
titre dexemple voici les intervalles obtenus pour n = 100 et p =0,3 au seuil 0,95.
IF (1) le plus petit : [22, 39] de probabilit 0,9502
IF (2) centr sur 30 : [21, 39] de probabilit 0,9625
IF(3) (premire) : [21, 39] avec une probabilit infrieure 0,025 que X soit gauche et
infrieure 0,025 que X soit droite de lintervalle.
IF(4) (seconde) : [20, 40] de probabilit 0,9710.
On peut vrifier que, pour une mme valeur de p, ces diffrents intervalles sont de plus en plus
proches lorsque n augmente.
Si le mme pourcentage de succs (0,12, kobs = 12) avait t observ sur 100 jeux, l'intervalle de
fluctuation aurait t de [0,02 ; 0,11], ce qui aurait conduit remettre en question le rglage de la
machine. Le technicien aurait pris la dcision de rgler la machine.
#----------Application et rsultats:----
IFexact2(n = 50, p = 1/2, kobs = 19)
IFexact2(n = 65, p = .06, kobs = 8)
L'IF exact des comptages symtrique en proba
est :
[ 1 , 8 ] de probabilit : 0.9668145
L'IF exact des proportions symtrique en proba
est :
[ 0.01538462 , 0.1230769 ]
Hypothse p thorique = 0.06 : confronte
f observ = 0.1230769 : ACCEPTE
Xn p(1 p ) p(1 p)
lim P I n 1 , o I n dsigne lintervalle p u , p u
n
n n n
X n np
o Z n .
np (1 p)
Or :
P(u Z n u ) P np u np(1 p) X n np u np(1 p)
p(1 p) Xn p (1 p )
= P p u p u .
n n n
Application
Quand on sait quune suite converge vers une limite L, on peut considrer que pour n assez grand le
terme de rang n constitue une approximation de L.
Ici, on inverse les rles. On connat la limite, mais pas les valeurs des termes de la suite.
On admet donc que, sous certaines conditions, on peut approcher le terme de rang n de la suite
X
n I n par sa limite 1 .
n
Ces conditions communment admises pour pratiquer lapproximation sont :
n 30, np 5, n (1 p ) 5 .
p (1 p ) p (1 p )
Lintervalle I n p u , p u est un intervalle de fluctuation
n n
Xn
approch de la variable frquence au seuil 1 .
n
Xn
La suite de terme gnral P( I n ) ntant pas monotone, on ne peut pas savoir si la probabilit de
n
lintervalle est suprieure ou infrieure la limite 1 (cf note 11 ). Cette situation peut tre illustre
1
laide dun tableur ou du logiciel R. Voici un exemple dans le cas o p et 0,05 . Pour les
2
X
valeurs de n entre 0 et 2000, on calcule la probabilit que la variable n appartienne lintervalle I n .
n
11
Dans la pratique on parle de seuil 1 , les carts par rapport cette limite tant minimes (voir fig 10).
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 20 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
On peut constater que le nuage de points obtenu a un aspect symtrique autour de la droite dquation
y = 0,95 et que lorsque n est grand les points se rapprochent de cette droite.
Xn
Figure 9: visualisation de la probabilit P( In )
n
Lien vers : exploration intervalle de fluctuation asymptotique.xls
Dfinition
Xn
Un intervalle de fluctuation asymptotique de la variable alatoire Fn = au seuil 1 est un
n
intervalle dtermin partir de p et de n et qui contient Fn avec une probabilit dautant plus proche
de 1 que n est grand. Lintervalle In du thorme prcdent est donc un intervalle de fluctuation
asymptotique de Fn au seuil 1 .
Seul lintervalle de fluctuation asymptotique au seuil de 95% est au programme des classes de
terminale autre que la terminale S ; cest celui qui est mis en uvre dans lexemple 1 ci-dessous.
Remarque
Quand n 30, np 5, n (1 p ) 5 , il est courant de faire les calculs impliquant une variable
binomiale en la remplaant par une variable suivant une loi normale de mmes esprance et variance.
Seul le programme de STI2D-STL mentionne cette pratique, qui ne doit donc pas tre mise en uvre
dans les autres filires o tous les calculs de probabilits se font la calculatrice en utilisant la loi
exacte (au programme), quelle quelle soit.
Les calculs dintervalles de fluctuation et dintervalles de confiance se font avec les formules donnes
dans le programme.
1400
1200
effectif
1000
800
600
400
200
0
0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,2
borne superieure
Une compagnie arienne possde des A340 (longs courriers) dune capacit de 300 places.
Cette compagnie a vendu n billets pour le vol 2012.
La probabilit pour quun acheteur se prsente lembarquement est p et les comportements des acheteurs sont
indpendants les uns des autres.
On note X n la variable alatoire dsignant le nombre dacheteurs dun billet se prsentant
lembarquement.
La compagnie cherche optimiser le remplissage de lavion en vendant ventuellement plus de places
que la capacit totale de lavion (surrservation ou surbooking) soit ici n > 300.
Comme il y a videmment un risque que le nombre de passagers munis dun billet se prsentant
lembarquement excde 300, la compagnie veut matriser ce risque.
1. Dterminer la loi de X n .
Xn
2. On suppose que 0,5 p 0,95 . crire lintervalle de fluctuation asymptotique In de au
n
seuil de 0,95.
300
3. Montrer que si I n 0, alors la probabilit que le nombre de passagers se prsentant
n
lembarquement excde 300 est proche de 0,05.
4. On cherche dterminer la valeur de n maximale permettant de satisfaire la condition de
300
linclusion I n 0, .
n
300
a. Montrer que I n 0, pn 1,96 n p(1 p) 300 0.
n
b. On pose f ( x) px 1,96 x p(1 p) 300 .
Montrer quil existe un entier n0 unique tel que si n n0 alors f ( n) 0 et si n n0
alors f (n) 0 .
c. Tracer la courbe reprsentative de f pour les valeurs p = 0,85 ; p = 0,9 ; p = 0,95.
d. Dterminer la calculatrice les valeurs de n0 pour p = 0,85 ; p = 0,9 ; p = 0,95.
300 p (1 p) 300
4. a. I n 0, p 1,96 np 1,96 n p (1 p) 300 0
n n n
b. En posant y x , on se ramne une inquation du second degr que lon rsout pour
x 300 .
Les solutions de linquation f ( x ) 0 sont donc les rels de lintervalle 300, x0 o
2
1,96 p (1 p ) 1200 p 1, 96 p (1 p )
x0 .
2p
Lentier n0 cherch est la partie entire de x0 .
c. p 0,85 en bleu, p 0, 9 en rouge, p 0, 95 en vert.
1 1
Compte tenu du caractre asymptotique de lintervalle de fluctuation p ,p , il serait
n n
Xn
inexact daffirmer que la probabilit que la variable alatoire prenne ses valeurs dans cet
n
intervalle est suprieure 0,95 pour toute valeur de n, mme lorsque les conditions usuelles
dapproximation sont vrifies. Ce point a dj t clairement explicit dans le document ressource de
la classe de premire. Nous le reprenons ici.
Xn 1 1
On peut visualiser ci-dessous les valeurs des probabilits P( p p ) suivant les
n n n
valeurs de p et de n et constater que le rsultat nonc en classe de seconde, sil nest pas tout fait
exact, fournit nanmoins en gnral une probabilit trs proche de 0,95, ce qui justifie son utilisation
dans la pratique.
Thorme
Si la variable alatoire X n suit la loi B (n, p) alors, pour tout p dans ]0, 1[, il existe un entier
1 X 1
n0 tel que si n n0 alors P( p n p ) 0,95 .
n n n
Dmonstration
Pour une variable binomiale X n de paramtres n et p, le thorme de Moivre-Laplace prouve que, en
notant Zn la variable centre rduite associe X n , la limite de an (2 Z n 2) est gale
2 P ( Z 2) 1 o Z suit une loi N (0,1).
Or on a L 2 P( Z 2) 1 0,9544 .
Donc, pour 0, 004 , si on considre lintervalle ouvert L , L contenant L, il existe un
entier n0 tel que si n n0 , on a : a n L , L donc an 0,95 puisque L 0,9504 .
2 Xn 2
Or an p p(1 p) p
p(1 p) ce qui donne, en majorant p (1 p ) par
n n n
1/4, un intervalle de fluctuation plus large donc de probabilit suprieure ou gale an .
1 X 1
Donc pour tout entier n n0 , on a : p n p 0,95 .
n n n
Exemple dactivit
Selon la valeur de p, la valeur de n0 peut varier considrablement.
Il est dailleurs difficile de dterminer avec certitude cette valeur de n0 . On peut cependant donner des
valeurs de n0 grce un algorithme de calcul.
P 0,35 0,36 0,37 0,38 0,39 0,4 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,5
On peut remarquer que la plus grande valeur de n0 est atteinte pour p 1 2 . Cest effectivement
pour cette valeur que la fluctuation est la plus importante puisque la variance est maximale pour cette
valeur de p.
Exemples dexercices
1. Les enfants sont dits prmaturs lorsque la dure gestationnelle est infrieure ou gale 259 jours.
La proportion de ces naissances est de 6%. Des chercheurs suggrent que les femmes ayant eu un
travail pnible pendant leur grossesse sont plus susceptibles davoir un enfant prmatur que les
autres. Il est dcid de raliser une enqute auprs dun chantillon alatoire de 400 naissances
correspondant des femmes ayant eu pendant leur grossesse un travail pnible. Les chercheurs
dcident a priori que si la proportion denfants ns prmaturs dans cet chantillon est suprieure la
borne suprieure de lintervalle de fluctuation asymptotique au seuil de 0,95 alors leur hypothse sera
accepte. Finalement le nombre denfants prmaturs est de 50. Quelle est donc la conclusion ?
Solution : Sous lhypothse que la proportion de prmaturs dans lchantillon est la mme que dans la
population gnrale, on dtermine lintervalle de fluctuation asymptotique au seuil 0,95.
0 ,06 0,94 0 ,06 0 ,94
0 ,06 1,96 ; 0,06 1,96 0 ,037; 0,083
400 400
On calcule la valeur observe de proportion de prmaturs dans lchantillon et on obtient 0,125. Cette
valeur nappartient pas lintervalle de fluctuation asymptotique au seuil de 95%, donc avec la rgle
de dcision choisie, on rejette lhypothse pose. Les chercheurs concluent donc que la proportion
denfants prmaturs est plus leve chez les femmes ayant eu un travail pnible pendant leur
grossesse.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 28 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
2. 1) Vrifier que lintervalle [2,576 , 1,696] peut tre considr comme un intervalle de fluctuation
au seuil de 95% dune variable X suivant une loi N (0,1) (c'est--dire que P(X I) 0,95).
2) Montrer quil existe une valeur a minimale telle que lintervalle a, a soit un intervalle de
fluctuation au seuil de 95% de X. En donner une valeur approche 102 prs.
3) Montrer quil existe un unique rel b tel que ( 2 X 2 b ) 0, 95 .
Prouver que b a 2 o a est la valeur de la question 2).
Dterminer une valeur approche de b 102 prs.
4) Montrer quil nexiste aucun rel c tel que ( 1 X 1 c ) 0, 95 .
Solution
1. Avec une calculatrice : P(2,576 < X < 1,696) 0,95006 > 0,95
a
2. (a X a) 2 f (t )dt = F(a)
0
1
2 2 x
On tudie la fonction F. Sa drive est F '( x ) e 0
2
Donc F est strictement croissante de 0, vers 0,1 . Il existe donc un rel a unique tel que
F ( a ) 0, 95 .
Daprs ce qui a dj t vu, a vaut environ 1,96.
2 x
3. ( 2 X 2 x ) = f (t )dt H ( x) .
2
1
1 2 ( x 2)
Cette fonction est strictement croissante car sa drive est gale e .
2
2
Comme H (4) 2 f (t )dt F (1,96) , il existe b unique tel que H (b) 0, 95 .
a 2b 2 b a
On a 0, 95 H (b) f (t )dt 0,95 f (t )dt donc f (t )dt f (t )dt 0
2 a a 2
donc a 2 b .
A laide de la calculatrice, en utilisant la fonction qui x fait correspondre ( 2 X 2 x ) ,
on trouve 3,92 < b < 3,93.
On peut vrifier que lintervalle a, a est plus court que lintervalle 2,2 b .
1 c 0 1 c 0 1
4. 1 f (t )dt f (t )dt
1 0
f (t )dt f (t )dt
1 2
.
0 1 c
Or 1 f (t )dt 0,35 donc 1 f (t )dt 0,85 pour tout c.
Remarque
On peut dmontrer plus gnralement que lintervalle de fluctuation au seuil de 95% centr en 0
est celui damplitude minimale.
A. Introduction
Il est souvent difficile pour des raisons la fois financires et logistiques de pouvoir recueillir des
donnes sur la population toute entire. Le plus souvent, on se contente de travailler sur un
chantillon, cest dire une fraction ou sous-ensemble de cette population. Ceci prsente bien sr des
avantages en termes de faisabilit et de cot, mais impose des contraintes pour que linformation
recueillie au niveau de lchantillon (estimation) soit la plus proche possible de celle de la population
entire (paramtre). La dmarche pratique est donc la suivante :
on slectionne un chantillon de la population que lon tudie, on appelle cela
lchantillonnage.
On vrifie, selon les cas, partir dintervalles de fluctuation que lchantillon ainsi obtenu est
reprsentatif de la population pour des critres qui sont connus dans la population.
Population Echantillon
1) On calcule la frquence de
femmes f.
On connait par exemple
- la proportion p de femmes Si f est dans lintervalle de
fluctuation de p, lchantillon
est dit reprsentatif de la
On ne connait pas
- la proportion pM de personnes ayant la population pour ce critre au
maladie M. seuil 1 .
2) On calcule la
frquence de
personnes ayant la
maladie M, note fM.
Activit
On souhaite estimer la prvalence du surpoids dans une ville V, c'est--dire la proportion de personnes
ayant une masse trop importante par rapport leur taille. Pour cela 460 personnes ont t slectionnes
de manire alatoire partir de la liste des logements connue par la municipalit, c'est--dire que le
fait davoir t slectionn pour participer ltude est uniquement d au hasard. On admet que cette
procdure permet dassimiler la slection des personnes interroges un schma de Bernoulli.
Un enquteur sest dplac au sein de chaque logement aprs avoir convenu dun rendez-vous afin de
recueillir les informations ncessaires lenqute.
1 Dans un premier temps, lenquteur va sassurer que lchantillon est reprsentatif de la population
quon tudie sur des informations quon peut vrifier et qui sont en lien avec le critre tudi. Dans le
cas prsent on peut connatre par exemple la proportion dhommes et de femmes dans la population de
la ville, ainsi que la rpartition selon lge en demandant la municipalit qui se rfrera aux
informations du recensement. Paralllement on peut comptabiliser le nombre dhommes et de femmes
dans lchantillon ainsi que la rpartition selon lge.
On sait que, dans la population, il y a 46% dhommes et 20% de personnes de plus de 60 ans.
Solution :
1 a) Lintervalle de fluctuation asymptotique au seuil de 95% est dtermin par :
p (1 p) p (1 p)
p 1,96 ; p 1,96 0,49 ; 0,59 .
n n
b) La proportion de femmes dans lchantillon est gale 56,5%, cette valeur appartient lintervalle
de fluctuation calcul ci-dessus.
d) La proportion de plus de 60 ans dans lchantillon est gale 23,4%, cette valeur appartient
lintervalle de fluctuation calcule ci-dessus.
e) On considre que lchantillon observ est reprsentatif de la population pour les deux critres
retenus (genre et ge).
La reprsentativit sur deux critres ne signifie videmment pas la reprsentativit sur tous les critres
et dans tous les cas, il est peu vraisemblable quun chantillon de 460 sujets soit reprsentatif pour
tous les critres. Les rsultats obtenus sur un chantillon ne peuvent pas remplacer les rsultats exacts
dun recensement. Cependant la vrification prcdente sur des critres importants permet de
considrer que lchantillon retenu est structur comme la population tudie, au regard de certains
critres.
tant donn un paramtre p, ici une proportion inconnue, dune population, la procdure destimation
consiste utiliser les informations recueillies dans un chantillon slectionn de manire alatoire
X
pour obtenir une valeur de la variable alatoire frquence Fn n destine fournir une estimation
n
de p. Mais on sait que cette estimation va varier dun chantillon lautre, de par la fluctuation
dchantillonnage, autour de p. Il est donc ncessaire dapprcier lincertitude en fournissant une
estimation par intervalle, appel intervalle de confiance de p. Cet intervalle est obtenu en fonction
dun coefficient li au niveau de confiance que lon accorde cette estimation.
1 1
Lorsque n 30 et np 5 et n(1p) 5, la formule p ,p fournit un intervalle de
n n
X
fluctuation de Fn n au seuil 0,95.
n
Supposons que p soit inconnu . On peut approcher p par la proportion f obtenue par les donnes de
lchantillon et dterminer un intervalle de confiance de p au niveau de confiance 0,95.
Selon le thorme du paragraphe IV-C, on sait que, pour n suffisamment grand, on a :
1 Xn 1
P( p p ) 0,95 .
n n n
1 1 1 1
Comme p Fn p quivaut Fn p Fn , on peut galement
n n n n
1 1
crire P( Fn p Fn ) 0,95 , ce qui peut se traduire en disant que :
n n
1 1
lintervalle alatoire Fn , Fn a une probabilit au moins gale 0,95 de contenir p.
n n
1 1
partir de lintervalle alatoire Fn , Fn on obtient, en effectuant le tirage dun
n n
chantillon, une ralisation de cet intervalle qui fournit alors un intervalle numrique de la forme
1 1
f ,f .
n n
Si lon fait un trs grand nombre de tirages, on sait que thoriquement on devrait 12 avoir pour au plus
5% dentre eux des intervalles ne contenant pas la proportion inconnue p.
C. Dfinition
Un intervalle de confiance pour une proportion p un niveau de confiance 1 est la ralisation,
partir dun chantillon, dun intervalle alatoire contenant la proportion p avec une probabilit
suprieure ou gale 1 . Cet intervalle alatoire est dtermin partir de la variable alatoire
Xn
Fn qui, tout chantillon de taille n, associe la frquence.
n
12
Il sagit toujours dun nombre fini de ralisations et il peut y avoir plus de 5% dentre elles qui ne contiennent
pas p.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 33 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
Remarque 1
En ralisant le tirage dun chantillon, on obtient un intervalle de confiance de la forme
1 1
f ,f de la proportion inconnue p un niveau de confiance de 0,95.
n n
Ainsi, chaque tirage dun chantillon, on obtient un intervalle de confiance diffrent.
Remarque 2
Un intervalle de confiance tant un intervalle numrique, il est incorrect de conclure la dtermination
1
dun intervalle de confiance par une phrase du type p a une probabilit de 0,95 dtre entre f
n
1
et f car il ny a plus dalatoire ce stade. Il est en revanche convenable dcrire :
n
1 1
Lintervalle f ,f est un intervalle de confiance de la proportion inconnue p au niveau
n n
de confiance 0,95 .
Exemple 1
Test de conformit dune proportion : on veut dterminer si la proportion observe dans un
chantillon est conforme une valeur de rfrence connue dans la population.
Sous lhypothse que lchantillon est issu dun tirage alatoire correspondant un schma de
Bernoulli (tirage avec remise ou sy apparentant), la variable frquence Fn appartient un intervalle
de fluctuation avec une probabilit dtermine.
En fonction de lappartenance ou non de la frquence observe cet intervalle, on peut prendre une
dcision concernant la conformit de lchantillon.
Si les conditions dutilisation sont runies, on dtermine lintervalle de fluctuation asymptotique, sinon
on a recours un intervalle de fluctuation calcul avec la loi binomiale.
Exemple 2
Estimation dune proportion inconnue p grce un chantillon alatoire
On se place dans le cas o lchantillon comporte au moins 30 lments afin de pouvoir utiliser
lintervalle de confiance au programme.
Si la frquence observe f est telle que nf 5 et n(1 f ) 5 , on considre quon peut conclure quun
1 1
intervalle de confiance de p au niveau de confiance 0,95 est f ,f .
n n
Exemple
Pour un niveau de confiance de 0,95, on a u 1,96 . Si sur un chantillon de taille 100 on observe
une valeur de la frquence gale 0,44, lintervalle de confiance de p au niveau 0,95 obtenu avec la
formule prcdente est [0,343 ; 0,537].
1 1
Lintervalle f ,f donne [0,34 ; 0,54].
n n
On constate sur le tableau prcdent que, n tant fix, laugmentation du niveau de confiance
augmente simultanment la longueur de lintervalle de confiance, ce qui est un rsultat gnral facile
justifier (et concevoir).
Consquence pour la taille de lchantillon ncessaire pour obtenir une amplitude de lintervalle
de confiance fixe
1 X 1 X 1 X 1
On a : p n p 0,95 n p n 0,95
n n n n n n n
Lamplitude de lintervalle de fluctuation est videmment la mme que celle de lintervalle de
confiance.
Donc, avec un niveau de confiance de 0,95, pour obtenir un intervalle de confiance damplitude 0,06,
il faut un chantillon de taille 1112 au moins.
p (1 p ) p (1 p )
2) Avec lintervalle asymptotique I n p u , p u
n n
p(1 p) 4u2 p (1 p)
On cherche n tel que 2u a ce qui quivaut n .
n a2
Donnons quelques valeurs :
Pour p = 0,5
2. Simulations
Le graphique ci-dessous donne 100 intervalles de confiance simuls au niveau de confiance 0,95
obtenus partir de 100 chantillons de 50 individus extraits de la mme population.
Figure 14
Document associ : intervalles de confiance simuls.r
13
On peut consulter le site www.ipsos.fr/faq pour des dtails sur les mthodes utilises par cet institut.
14
Pour chaque candidat, on applique la mthode prcdente pour dterminer un intervalle de confiance de la
proportion dlecteurs lui tant favorables.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 37 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
On peut constater sur la figure 14 une fluctuation importante des bornes des intervalles de confiance
numriques obtenus chaque simulation.
Remarque : Les chantillons tant de taille 50, il y a exactement 51 valeurs possibles de la frquence
ce qui explique que lon retrouve plusieurs fois les mmes intervalles de confiance ds quon fait plus
de 51 simulations.
La mme simulation (figure 15) avec 100 intervalles de confiance simuls au seuil 0,95 obtenus
partir de 100 chantillons de 1000 individus extraits de la mme population (la proportion inconnue
est choisie alatoirement chaque srie de 100 chantillons) fait apparatre une moindre fluctuation
des bornes des intervalles.
Figure 15
Exemples dexercices
1. Diagnostic de la jaunisse
Un test de diagnostic rapide effectu sur des sujets ictriques (coloration jaune de la peau, des
muqueuses -couche de cellules de protection recouvrant les organes creux en contact avec lextrieur-
et du blanc de lil sclrotique-) doit permettre destimer si lictre est dorigine virale ou non, sans
avoir besoin de faire des analyses longues et compliques. Cependant il est important de pouvoir
sassurer que ce test est de bonne qualit c'est--dire quil doit pouvoir indiquer correctement si
lictre est viral ou non. Il doit tre capable didentifier correctement le type dictre : il est positif
chez les sujets dont lictre est viral et ngatif sinon.
Une tude est effectue sur 100 personnes ayant un ictre viral et 100 personnes ayant un ictre
dorigine non virale.
15
Auteur du fichier : Stphane Keller, LEGTA Louis Pasteur
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 39 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
a) Dterminer la proportion de sujets ayant un test positif parmi ceux ayant un ictre viral.
b) Dterminer un intervalle de confiance 95% de la proportion de tests positifs lorsque lictre est
viral. Cette proportion est appele sensibilit du test diagnostic, c'est--dire la probabilit quune
personne ayant un ictre viral ragisse au test. Un test diagnostic sera dautant meilleur que la
sensibilit est importante. (rponse : [0,75 ; 0,95]).
c) Dterminer la proportion de sujets ayant un test ngatif parmi celles ayant un ictre non viral.
d) Dterminer un intervalle de confiance 95% de la proportion de tests ngatifs lorsque lictre est
non viral. Cette proportion est appele spcificit du test diagnostic, c'est--dire la probabilit
quune personne ayant un ictre non viral ne ragisse pas au test. Un test diagnostic sera dautant
meilleur que la spcificit est importante.(rponse : [0,7 ; 0,9]).
2. Dpistage de la bronchiolite
Dans le but dvaluer la prise en charge de la bronchiolite du nourrisson dans un hpital de la rgion
Aquitaine, une tude rtrospective a t mise en place.
1) Il est recommand de coucher lenfant de manire trs incline (couchage en proclive) dans le
cadre de la prise en charge de la bronchiolite. On value cette pratique partir dun chantillon de
134 dossiers. 106 des enfants ont t couchs en proclive.
Dterminer un intervalle de confiance au niveau de confiance de 95% de la proportion denfants
dont le couchage respecte la recommandation.
Solution
106 1 106 1
134 ; 0,70 ;0,88
134 134 134
2) Une tude plus fine permet de comparer les pratiques entre les diffrents services ayant admis des
enfants (cf. tableau 1).
Tableau 1 : Rpartition des cas suivant le type de services et le respect de la recommandation de
couchage en proclive ; valuation de la prise en charge de la bronchiolite en Aquitaine, une anne
donne.
Couchage En service des En service
Total
proclive urgences hospitalier
Oui 45 52 97
Non 29 8 37
Total 74 60 134
Il est intressant de noter que, sans connatre pa et pb, on dispose d'une mthode pour dcider au
niveau de confiance 95% que, si les intervalles de confiance sont disjoints, alors pa et pb sont
diffrents.
Il existe dautres mthodes destimation, mais quelle que soit la mthode utilise, si elle est issue
d'un chantillonnage alatoire, la dcision sera toujours entache d'un risque d'erreur. Les mthodes
utilises assurent seulement la matrise de certains risques de se tromper.
16
Ltude de cette problmatique est suggre en AP.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 41 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
VI. Complments sur les lois uniforme et exponentielle
A. Loi uniforme
Le nouveau programme propose de dfinir la loi uniforme sur un intervalle a, b quelconque.
Aprs avoir dfini la loi uniforme sur 0,1 partir, par exemple, du choix au hasard dun rel entre 0
et 1, on peut dfinir la loi uniforme sur a, b en remarquant que pour que laire sous la courbe soit
1
gale 1, il faut et il suffit que la valeur de la constante soit .
ba
Une variable alatoire X suit une loi uniforme sur lintervalle a, b si sa densit est la fonction f
1
dfinie sur a, b par : f (x) = .
ba
Lesprance dune variable alatoire X suivant une loi uniforme sur a, b est donne par :
b b x ab
E(X) =
a
xf ( x)dx =
a ba
dx =
2
.
b
On peut observer que la dfinition de lesprance par la formule E(X) =
a
xf ( x)dx prolonge celle de
lesprance dune variable alatoire discrte.
En effet, le terme f (x)dx peut sinterprter comme laire dun rectangle de cts dx et f (x), fournissant
en quelque sorte la probabilit que la variable X prenne la valeur x. Dans ces conditions,
b
lintgrale xf ( x)dx correspond une somme de produits x f (x)dx.
a
Figure 16
Document associ : esprance d'une variable uniforme.ggb
1 k
On a reprsent les rectangles de base et de hauteur , avec k entier variant de 1 n.
n n
Exemples dexercices
1. A partir de 7 heures le matin, les bus passent toutes les quinze minutes un arrt prcis. Un usager
se prsente cet arrt entre 7h et 7h30. On fait lhypothse que lheure exacte de son arrive cet
arrt, reprsente par le nombre de minutes aprs 7h, est la variable alatoire uniformment rpartie
sur lintervalle [0, 30].
1) Quelle est la probabilit que lusager attende moins de cinq minutes le prochain bus ?
2) Quelle est la probabilit quil attende plus de dix minutes ?
2. Partie A
Olivier vient tous les matins entre 7h et 7h 45 chez Karine prendre un caf.
1) Sachant quOlivier ne vient jamais en dehors de la plage horaire indique et quil peut arriver
tout instant avec les mmes chances, quelle densit peut-on attribuer la variable alatoire
heure darrive dOlivier ?
2) Calculer la probabilit quOlivier sonne chez Karine :
Aprs 7h30 Avant 7h10 Entre 7h20 et 7h22 A 7h30 exactement.
2. Partie B
Olivier et Karine dcident de se retrouver au caf de lHtel de Ville entre 7h et 8h. Les instants
darrive dOlivier et Karine sont assimils des variables alatoires de loi uniforme sur 0,1 .
Chacun attend un quart dheure mais jamais au-del de 8h. Quelle est la probabilit quils se
rencontrent ?
lments de solution
Pour la partie B, si on note O la variable alatoire instant darrive dOlivier et K celle de Karine.
1
La probabilit cherche est P( O K ) ; en utilisant une reprsentation graphique, cette probabilit
4
est laire de la zone grise ci-dessous, ensemble des points de coordonnes (x, y) du carr tels que
7
x y 0,25 . (On trouve ).
16
Une variable alatoire densit X suit la loi exponentielle de paramtre > 0 si sa densit est la
fonction f dfinie sur 0, par : f ( x) e x .
d
Pour tout intervalle c, d 17
, on obtient : P( X c, d ) e t dt e c e d .
c
En particulier, on obtient P( X a) 1 e a .
x t 1
Lesprance de X est la limite quand x tend vers de 0 t e dt , on obtient E ( X )
.
Expliquer ventuellement sur cet exemple le principe de lintgration par parties, bien quil ne
soit plus dans les capacits exigibles du programme.
On dmontre quune variable alatoire X suivant une loi exponentielle vrifie la proprit de dure de
vie sans vieillissement, c'est--dire que, pour tous rels t et h positifs, X t X t h X h .
La rciproque de cette proprit nest pas au programme.
17
Cette notation dsigne ici tous les types intervalles dextrmits c et d o c d .
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 44 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
Annexe 1 Introduction au thorme de Moivre-Laplace
Lobjet de cette annexe 1 est de situer le thorme de Moivre-Laplace dans une perspective historique.
Celle-ci permet de montrer lvolution de la pense probabiliste depuis Jacques BERNOULLI jusqu
Pierre-Simon de LAPLACE qui donnera la preuve complte de ce thorme avec la rigueur possible
son poque.
La motivation commune Bernoulli, Moivre et Laplace est de dterminer le plus finement possible la
fluctuation 18 des valeurs prises par une variable alatoire suivant une loi binomiale autour de son
esprance. Il sagissait ensuite dutiliser lintervalle de fluctuation obtenu pour estimer une probabilit
inconnue, ce qui est la problmatique moderne de lintervalle de confiance.
On voit que le concept dintervalle de confiance dduit dun intervalle de fluctuation est
dj prsent dans luvre de Bernoulli.
Le thorme de Bernoulli est gnralis au dix-neuvime sicle par lingalit de Bienaym-
Tchebychev, aprs que les notions desprance et de variance auront t dgages.
Ingalit de Bienaym-Tchebychev
Soit ( , P) un univers probabilis et X une variable alatoire dfinie sur possdant une
variance V(X). On note E(X) son esprance. Alors pour tout > 0 on a :
18
Les termes en italiques ntaient pas utiliss par les mathmaticiens de cette poque.
19
Jacques Bernoulli , Ars Conjectandi, traduction de Robert Meunier, Irem de Rouen, 1987.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 45 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
V( X )
X E( X ) .
Cette ingalit est intressante pour donner tout son sens la notion de variance dans un cadre plus
gnral que celui du thorme de Bernoulli. Daprs cette ingalit il apparat clairement que plus la
variance est petite, plus les fluctuations de X autour de son esprance sont faibles.
Remarque
Fondamentale du point de vue thorique, cette ingalit est insuffisante du point de vue des
applications numriques car linformation sur la probabilit que Fn appartienne lintervalle de
fluctuation p , p est peu prcise.
Exemple
p 0, 5 0,1 n 100 donnent un majorant de ( Fn p 0,1) gal 0,25.
1 1
Or on sait que Fn 0,5 ; 0,5 est voisin de 0,95 c'est--dire que
100 100
( Fn p 0,1) est voisin de 0,05.
Cest la recherche dune meilleure prcision qui a motiv le travail de Moivre puis de Laplace.
20
La loi des grands nombres, le thorme de De Moivre-Laplace, D.Lanier, D.Trotoux,.
http://www.math.ens.fr/culturemath/histoire%20des%20maths/pdf/LoidesGrandsNombres.pdf
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 46 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
bien que le Hasard produise des Irrgularits, cependant les Rapports de Probabilits seront
infiniment grands, et que avec lavancement du Temps, ces Irrgularits nauront aucune proportion
avec le retour de lOrdre qui rsulte naturellement du DESSEIN ORIGINEL.
En sens inverse, il retrouve le concept dintervalle de confiance dj esquiss par Bernoulli :
inversement, si partir dObservations innombrables, nous trouvons que le Rapport des Evnements
converge vers une quantit dtermine, comme le Rapport de P Q ; alors nous concluons que ce
Rapport exprime la Loi dtermine suivant laquelle lEvnement se produit.
Et enfin comme souvent cette poque, il dduit de ce rsultat mathmatique une conviction
religieuse :
Et ainsi, si nous ne nous aveuglons pas nous-mmes avec de la poussire mtaphysique, nous seront
conduits, dune manire rapide et vidente, la reconnaissance du grand CREATEUR et MAITRE de
toutes choses ; Lui-mme toute sagesse, toute puissance et bont.
On peut assez facilement comprendre comment apparat la fameuse fonction dont la courbe a une
forme de cloche . On a juste besoin de la formule dite de Stirling .
n
1 n 1
Prenons le cas o p et donc P( X n k ) , pour tout entier k compris entre 0 et n.
2 k 2
n
Xn
On pose Z n 2 et on cherche le comportement de Z x quand n est grand, x tant fix.
n
1
n
2
1 n
On a : ( Z n x) P ( X n x n ).
2 2
1 n
Comme X n ne prend que des valeurs entires, k x n doit tre entier.
2 2
On fixe x entier et on sintresse la suite extraite de la suite Z n x correspondant aux entiers n
1
de la forme n (2m) . On a alors k x 2m 2m xm 2m qui est bien entier pour tout entier m.
2
n n!
On a et quand m on a k et n k .
k !(n k )!
k
1
n
Daprs la formule de Stirling, quand n est grand, n! est quivalent n 2 e n 2 ce qui signifie que
n!
le quotient de 1
a pour limite 1 lorsque n tend vers +.
n
n 2 en 2
n, k et n k tant grands, on peut considrer que :
1
n
1 n 2 1
( Z n x) ~
2 n 1
x n n 1 x n n 1 2n
n x 2 x 2
1 1
2 n n
n 1 x n x n
x2 x2 x2
x 2 x 2 x 2
Or : 1 e 2
1 e 2
1 e 2
n n n n n n
Remarque 1
Dans le cas de la suite extraite, on peut constater que Z n x tend vers 0 quand n tend vers linfini.
Il reste justifier que le rsultat est valable pour tout x et pour la suite complte.
Remarque 2
2
Deux valeurs conscutives de Z n sont distantes de donc sur un intervalle de cette longueur ne se
n
x
1
trouve quune valeur prise par Z n . Si on pose f ( x) e , lquivalent trouv peut scrire
2
2
f ( x ) x et donc sinterprter gomtriquement comme laire dun petit rectangle de base x et de
longueur f ( x) . Cela illustre la notion de densit.
Remarque 3
Numriquement pour n 100 et x 1 , on obtient k 55 .
Z100 1 0,04847 et lquivalent vaut environ 0,04839.
Remarque 4
Laide apporte Moivre par Stirling est la valeur de la constante gale 2 dans lquivalent de n !.
D. Le thorme de Moivre-Laplace
Pierre-Simon de Laplace a t le premier crire un ouvrage exposant ltat des connaissances dans le
domaine des probabilits. Il sagit de la thorie analytique des probabilits 21 (1812). Dans ce texte,
Laplace expose dabord une srie de rsultats danalyse (fonctions gnratrices, transforme de
Laplace...) qui lui permettent de dmontrer des rsultats de probabilits, et en particulier le thorme
de Moivre-Laplace.
Laplace a des ides trs prcises sur les probabilits. Contrairement Moivre, il ne cherche pas
prouver lexistence dun Grand crateur, mais il cherche approcher au mieux les lois qui rgissent le
monde dans lequel nous vivons. Il dveloppe une vision trs dterministe :
21
Texte intgral disponible ladresse
http://books.google.fr/books?id=6MRLAAAAMAAJ&printsec=frontcover&dq=Th%E9orie+analytique+des+pr
obabilit%E9s+Laplace#v=onepage&q&f=false
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 48 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
Nous devons donc envisager ltat prsent de lunivers comme leffet de son tat antrieur, et
comme la cause de celui qui va suivre. Une intelligence qui pour un instant donn connatrait toutes
les forces dont la nature est anime et la situation respective des tres qui la composent, si dailleurs
elle tait assez vaste pour soumettre ses donnes lanalyse , embrasserait dans la mme formule les
mouvements des plus grands corps de lunivers et ceux du plus lger atome : rien ne serait incertain
pour elle, et lavenir comme le pass, serait prsent ses yeux.
Ce nest quau cours du vingtime sicle que cette vision dterministe sera remise en cause, en
particulier par la physique quantique.
Concernant le thorme de Bernoulli, voici ce quil crit :
Ce thorme indiqu par le bon sens tait difficile dmontrer par lAnalyse. Aussi lillustre
gomtre Jacques Bernoulli, qui sen est occup le premier, attachait-il une grande importance la
dmonstration quil en a donne. Le calcul des fonctions gnratrices appliqu cet objet, non
seulement dmontre avec fiabilit ce thorme, mais de plus il donne la probabilit que le rapport des
vnements observs ne scarte que dans certaines limites du vrai rapport de leurs possibilits
respectives.
Moivre a repris dans son ouvrage [The Doctrine of Chances] le thorme de Bernoulli sur la
probabilit des rsultats dtermins par un grand nombre dobservations. Il ne se contente pas de
faire voir, comme Bernoulli, que le rapport des vnements qui doivent arriver approche sans cesse de
leurs possibilits respectives, il donne de plus une expression lgante et simple de la probabilit que
la diffrence de ces deux rapports est contenues dans des limites donnes.
E. Convergence en loi
Ce paragraphe peut tre rserv une seconde lecture, son contenu dpassant nettement le niveau de la
classe terminale.
Dfinition
Soient une suite de variables alatoires relles (Xn) et une variable alatoire relle X.
On note FX (respectivement FX n ) la fonction dfinie sur IR par FX (x) = P(X < x) (respectivement
FX n ( x) P( X n x) ) appele fonction de rpartition de X (respectivement de Xn).
La suite (Xn) converge en loi vers X si, pour tout rel x o FX est continue, on a :
lim FX n ( x) FX ( x) .
n
abus de langage, mais il est universellement pratiqu. En fait, si la suite ( X n ) converge en loi vers X,
alors elle converge en loi vers nimporte quelle variable alatoire ayant la mme loi que X.
Cas particulier
Dans le cas o toutes les variables sont valeurs dans IN, la convergence en loi sexprime par :
k IN , lim P( X n k ) P( X k ) .
n
Exemple
On considre une suite de variables alatoires ( X n ) suivant une loi binomiale B (n, 1/n).
k nk
n 1 1 1
On dmontre que : k IN , lim P( X n k ) lim 1 e 1 .
n n k n n k!
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 49 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
La loi limite est appele loi de Poisson 22 de paramtre 1.
Comme pour la loi normale centre rduite, cette loi est apparue comme loi limite.
Elle a ensuite t utilise comme modle dans divers domaines ; elle est appele galement loi des
vnements rares.
Annexe 2 Complments sur les lois normales
A. Loi normale centre rduite
Thorme
Laire situe entre la courbe reprsentative de la fonction f sur IR dfinie
t
1
par f ( t ) e 2 et laxe des abscisses est gale 1.
2
On dit quune variable alatoire X suit une loi normale centre rduite N (0,1) si sa densit est la
t2
1
fonction f (t ) e 2 .
2
On note sa fonction de rpartition c'est--dire la fonction dfinie sur IR par :
x
( x ) P( X x )
f (t )dt .
Reprsentations graphiques :
t
1 x
Figure 1 : f ( t )
2
e 2 Figure 2 : ( x ) ( X x ) f (t )dt
Remarque : Il faut noter que la fonction f na pas de primitive explicite , cest dire quil est
impossible de lexprimer algbriquement avec les fonctions usuelles (polynmes, exponentielle,
logarithme...). Pour cette raison, il a t tabli des tables numriques (comme les tables de
logarithmes). Avec les calculatrices, ces tables ont aujourdhui perdu leur intrt.
Quelques proprits
P1. ( x ) 1 ( x ) .
Visible graphiquement sur la figure 4 on peut aussi dmontrer cette formule par changement de
variable.
22
Simon-Denis Poisson (1781-1840) Recherches sur la probabilit des jugements en matire criminelle et en
matire civile
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 50 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
1
On en dduit que (0) ( X 0) ( X 0) .
2
Une variable suivant la loi N (0,1) a donc 0 pour mdiane.
P2. ' f .
0 x 1 x
Il suffit dcrire ( x) f (t )dt 0 f (t )dt
2 0
f (t )dt pour constater que est de classe
B. Lois normales
X
Une variable alatoire X suit une loi N (, 2) si suit la loi normale N (0,1).
Lobservation dun chantillon ne permet pas de dcrire avec certitude une population mais seulement
destimer par intervalles de confiance les valeurs de certaines caractristiques que lon souhaite
connatre dans cette population.
23
En utilisant la dfinition dune intgrale gnralise convergente.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 51 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
Voir invoquer la reprsentativit dans un rapport denqute pour justifier de la qualit dun
sondage peut presque coup sr laisser souponner que ltude a t ralise dans une
mconnaissance totale de la thorie de lchantillonnage. Le concept de reprsentativit est
aujourdhui ce point galvaud quil est dsormais porteur de nombreuses ambivalences. Cette
notion, dordre essentiellement intuitif, est non seulement sommaire mais encore fausse et, bien des
gards, invalide par la thorie 24
La premire chose prciser cest quavec un chantillon on ne peut pas tre reprsentatif de
lensemble de la population sur toutes les caractristiques, il est donc important de dfinir les
caractristiques qui intressent les responsables de lenqute.
Pour un statisticien, lchantillon sera dit reprsentatif si on peut correctement estimer les paramtres
dintrt de la population partir de lchantillon. Dans le cas contraire on parlera de biais
dchantillonnage. Pour pouvoir correctement estimer les paramtres, le statisticien na pas
ncessairement besoin que lchantillon soit une reproduction miniature de la population, par contre il
a besoin que tous les profils de la population importants pour lobjectif de lenqute soient reprsents
dans lchantillon. Cela signifie donc que le plan dchantillonnage utilis dpendra de lobjectif de
ltude mme si la population est la mme.
La reprsentativit dun chantillon ncessite que la procdure dchantillonnage permette la
constitution dun sous-groupe recouvrant les caractristiques qui peuvent influencer la valeur des
paramtres que lon veut estimer. La non-reprsentativit dun chantillon peut par exemple tre due
la slection dans une base de sondage ne couvrant pas correctement la population.
Par exemple, supposons quon souhaite raliser une enqute de prvalence dune maladie A dans la
population gnrale et quon slectionne un chantillon partir de la liste tlphonique (lenqute
devant se drouler par appel tlphonique). Dans ce cas lchantillon ne couvre pas correctement la
population il y a un biais dchantillonnage car les personnes qui rpondront lenqute auront un
tlphone et seront prsentes leur domicile, pour cette raison toutes les personnes qui seront
hospitalises la date de lenqute ne seront pas interroges. Si les personnes atteintes de la maladie
tudie sont plus susceptibles de se rendre lhpital, on risque de sous-estimer la prvalence de la
maladie ou proportion de malades, en ralisant un chantillon comme propos ci-dessus.
Dans tous les cas de figures on souhaite enquter sur un nombre suffisant de sujets afin de pouvoir
estimer correctement le paramtre de la population.
En principe la taille de lchantillon est indpendante de la taille de la population que lon veut tudier.
Il faut interroger autant de personnes pour estimer avec la mme prcision le rsultat de llection
prsidentielle en France, que llection du maire de Bordeaux.
La taille est en revanche fonction de la marge derreur (amplitude de lintervalle de confiance) que
lon accepte de prendre et qui rsulte inluctablement du fait que lestimation est issue dun
chantillon.
Un sondage peut tre effectu de multiples faons que lon regroupe en deux grandes familles : les
sondages alatoires, dits aussi probabilistes, et les sondages non alatoires, dits aussi empiriques ou
informels.
Pour ce type de sondage la slection des individus nobit plus au hasard mais est dfinie selon
des critres de faisabilit, de ressemblance la population et de critres subjectifs dpendant du choix
des enquteurs.
Les types de sondage satisfaisant aux critres de faisabilit ou de simplicit sont par exemple les
chantillons de sujets volontaires (par exemple les enqutes publiques pralables la dclaration
24
Y. Till (2001), Thorie des sondages : chantillonnage et estimation en populations finies : cours et exercices, 284 pages, Paris,
Dunod
La date cruciale pour lhistoire de lchantillonnage est le mardi 3 novembre 1936, jour de la
publication des rsultats de llection prsidentielle aux tats-Unis. Le journal Literary Digest
avait ralis des sondages pr-lectoraux, comme leur habitude, par consultation individuelle
dlecteurs (appels votes de paille cette poque). Cette mthode ne fait appel aucune notion de
reprsentativit, mais est ralise sur un nombre important dlecteurs et jusquen 1936 elle donne des
rsultats tout fait satisfaisants. Ce journal comme bien dautres prdit alors llection de Lanton,
mais finalement F.D. Roosevelt est lu. Seuls trois sondages lavaient donn gagnant, tous raliss par
une mthode empirique appele la mthode des quotas. Ce fut le dbut des grandes structures de
sondages telles que la socit de sondage Gallup aux Etats-Unis.
C. Echantillonnage probabiliste
Dans un plan dchantillonnage alatoire, tous les individus de la population ont une probabilit
connue et non nulle d'tre slectionns pour faire partie de lchantillon. La slection des individus
constituant lchantillon seffectue par un plan dchantillonnage un ou plusieurs degrs et chaque
degr une procdure de tirage au sort est spcifie ; il peut sagir dune procdure de sondage alatoire
simple, ou systmatique, ou dune procdure stratifie, avec slection quiprobable ou probabilit
proportionnelle la taille. Logiquement seuls les sondages alatoires permettent de fournir des
estimations avec une prcision donne, cest- -dire avec un intervalle de confiance.
Les slections alatoires partir dune liste dindividus peuvent seffectuer de diffrentes faons.
Prenons lexemple dune enqute que linspection acadmique souhaiterait raliser auprs des lves
des lyces dun dpartement afin dtudier les difficults scolaires rencontres par ceux-ci. Il est
impossible dinterroger la totalit des lves et le souhait est de pouvoir obtenir des informations sur
un chantillon reprsentatif de 500 lves. Pour cette dernire raison il est dcid de slectionner
alatoirement les lves, mais plusieurs mthodes peuvent tre proposes.
1) si la liste de tous les lves est accessible de manire lectronique on peut slectionner 500
lves dans la liste en utilisant par exemple un tableur, il y a plusieurs mthodes pour cela :
a. crer pour chaque lve un nombre alatoire suivant une loi uniforme, puis choisir de
trier la liste en fonction de ce nombre alatoire cr, cela revient mlanger de faon
alatoire la liste. On slectionne finalement les 500 premiers noms qui sont dans la
liste trie. Cette mthode permet de raliser une slection simple sans remise.
b. Numroter tous les lves de la liste, puis utiliser la fonction alatoire du tableur pour
slectionner uniquement 500 nombres, les lves correspondant ces nombres seront
slectionns. En appliquant cette mthode un nombre peut tre slectionn plusieurs
fois. Cela revient donc raliser un chantillon avec remise.
c. On peut aussi utiliser la mthode de slection systmatique, c'est--dire que si le
nombre dlves est gale N on tire au sort un nombre, not d, entre 1 et N puis on
2) On peut souhaiter effectuer une enqute en face face, c'est--dire quun enquteur doit se
dplacer pour interroger llve, il est donc important dessayer de grer le nombre de
dplacements. Dans les mthodes proposes prcdemment rien nest contrl et lenquteur
peut devoir traverser le dpartement pour interroger un et un seul lve. Afin damliorer cela
on peut dcider de slectionner un certain nombre dtablissements et de slectionner un
certain nombre dlves dans chaque tablissement. On parlera alors de sondage plusieurs
degrs. Dans ce cas la slection nest pas toujours quiprobable.
Exemple : supposons que 10 des 70 lyces soient slectionns et dans chaque lyce
slectionn on slectionne 30 lves. Dans ce cas la probabilit que llve A soit
slectionn est environ gale 10/70 * 30/(nb dlves du lyce dappartenance de llve
A) , on remarque que cette probabilit dpend de la taille du lyce et donc non
quiprobable.
Utilisation directe : simulation de 100 nombres distribus selon la loi normale centr rduite et on
fait afficher les 10 premires valeurs de la srie simule "EchantillonsNormaux".
b Lancer la console R (Rgui pour Graphic User Interface) partir des menus Tinn-R.
c Copier coller les lignes de commande de Tinn-R dans la console R. Les lignes de commandes sont
excutes automatiquement et les rsultats affichs, dans la console pour les rsultats numriques,
dans une ou plusieurs fentres graphiques, pour les graphiques.
#**LIGNES DE COMMANDE pile ou face pas forcment quiprobable ** <- est la commande d'affectation. C()
piece1 <- sample(c("Pile", "Face"), size = 1000, cr un vecteur (au sens informatique).
prob = c(.4, .6), replace = TRUE) sample tire size(1000) fois avec remise
(distpiece1 <- table(piece1)) dans l'ensemble {"Pile", "Face"}, avec
barplot(distpiece1 / 1000) une probabilit de 0,4 pour "Pile" et de
sum(piece1 == "Pile") / 1000 0,6 pour "Face". Les n(1000) rsultats
obtenus sont mis dans le vecteur piece1.
table(piece1) effectue le tri plat
(tableau des effectifs) de la srie
obtenue.
barplot effectue le diagramme en barre.
sum(piece1 == "Pile") compte le nombre
de "Pile".
#**LIGNES DE COMMANDE pile ou face avec 2 pices diffrentes **
piece1 <- sample(c("Pile", "Face"), size = 1000, La pice 1 est dsquilibre, la pice 2
prob = c(.4, .6), replace = T) non.
piece2 <- sample(c("Pile", "Face"), size = 1000,
prob = c(.5, .5), replace = T) paste runi deux deux chacun des 1000
deuxpieces <- paste(piece1,piece2, sep = "") rsultats de piece1 et piece2, par
table(deuxpieces) exemple PileFace ...
barplot(table(deuxpieces) / 1000)
Exemple
On peut voir sur la figure 17 ci-dessous le rsultat graphique dans le cas de la fonction
2
f ( x) ( x3 x 1) .
3
1
Avec N 10000 points, une excution de lalgorithme donne une valeur approche de 0
f ( x)dx
gale 0,6056.
11
La valeur exacte est 0,6111 .
18
25
Ce paragraphe peut tre rserv une seconde lecture : son contenu nest pas au programme mais peut tre
trait dans le cadre de laccompagnement personnalis en TS.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 66 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
Voici ce que donne lalgorithme pour la fonction
f ( x) Ent (10 x) / 10 o Ent dsigne la partie entire.
On voit que la mthode fonctionne mme avec des fonctions
prsentant des discontinuits. Cest son avantage sur les
mthodes de calcul approch classiques (trapzes,
Simpson,...).
Document associ : monte carlo.alg
Justification
On considre deux variables indpendantes X et Y suivant la loi uniforme sur [0,1].
On admet que Y f ( X ) p . Lexemple ci-dessous permet de vrifier cette proprit sur un cas
particulier.
Si on considre X1 , Y1 ,......, X n , Yn n couples de variables alatoires indpendantes suivant la loi
uniforme sur [0,1], on a Yk f ( X k ) p pour tout k 1,.., n .
Si S n reprsente le nombre de couples X k , Yk tels que Yk f ( X k ) , alors S n suit une loi binomiale
S
de paramtres n et p. La loi des grands nombres 26 permet daffirmer que la suite n converge en
n
S
probabilit vers p c'est--dire que pour tout 0 , n p 0 quand n tend vers linfini.
n
Si on gnre avec un ordinateur un grand nombre de couples alatoires X k ,Yk , la proportion f de
ces couples pour lesquels Yk f ( X k ) fournit donc une valeur approche de p.
1 1
De plus si n 30 et nf 5 et n(1 f ) 5 alors lintervalle f ,f est un intervalle de
n n
confiance de p au niveau 0,95.
Avec n 10000 on obtient une prcision de 0,01 avec une confiance de 0,95.
Exemple
On prend ici la fonction f dfinie par f ( x) x et on pose Z f ( X ) Y X Y o les deux
variables indpendantes X et Y suivent la loi uniforme sur [0,1].
On a p Y X Z 0 .
g ( x) x 1 si x 1,0
On admet que la densit de Z est la fonction g dfinie sur [-1,1] par
g ( x) 1 x si x 0,1
1 1
Alors Z 0
0
g ( x)dx
3
.
26
Voir annexe 1.
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 67 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
B. Mthode de lesprance
On admet le rsultat suivant :
Si X est une variable alatoire suivant une loi uniforme sur [0,1] et si f est une fonction continue sur
1
[0,1] alors la variable alatoire Y f ( X ) possde une esprance gale p 0
f ( x)dx . 27
f (X
k 1
k)
variable converge en probabilit vers p.
n
Exemple
On prend ici la fonction f dfinie par f ( x) ln(1 x) pour x [0,1[ et on pose
Y f ( X ) ln(1 X ) o X suit une loi uniforme sur [0,1].
On a Y x X 1 e x 1 e x pour x [0, [ .
2 3
Avec N=10000 et la fonction f ( x ) ( x x 1) , une excution
3
de lalgorithme donne une valeur approche de 0,6101.
Il peut tre intressant de comparer lefficacit des deux mthodes.
On peut constater que la mthode de lesprance est en gnral un
peu plus prcise.
Remarque
La mthode de Monte-Carlo est couramment utilise pour calculer des aires ou des volumes. Elle est
plus aise mettre en uvre que des mthodes dterministes.
27
Cest un cas particulier dun thorme de probabilit connu sous le nom de thorme du transfert .
Ministre de lducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 68 sur 70
Mathmatiques - Probabilits et statistique
http://eduscol.education.fr/prog
Annexe 6 Comparaison de deux frequences et difference significative
Une situation trs frquente dans les dmarches exprimentales est davoir comparer deux sries de
mesures, ou deux frquences, pour tudier par exemple linfluence dun facteur. On peut alors utiliser
un test de comparaison (mais il sagit alors dune bote noire dont on ne peut que difficilement
justifier le fonctionnement au niveau des classes de terminales) ou, ce qui est souvent pratiqu dans les
autres disciplines, comparer deux intervalles de confiance ou barres derreurs .
Le paragraphe qui suit, bien que sappuyant sur un certain nombre de rsultats admis, a pour objectifs
de donner des lments de justification du critre retenu en terminale STI2D-STL pour juger dune
diffrence significative de deux proportions.
On souhaite comparer les proportions p1 et p2 d'un mme caractre, dans deux populations distinctes,
partir de lobservation des frquences f1 et f2 observes sur un chantillon de chacune des deux
populations. La question pose est de savoir si la diffrence f1 f2 est significative.
On suppose que les proportions des deux populations sont les mmes : p1 p2.
Sous cette hypothse dgalit des proportions des deux populations, la variable alatoire F1 F2, qui
chaque paire d'chantillons de taille n1 et n2, respectivement issus de chacune des deux populations,
associe la diffrence f1 f2 des frquences observes, suit approximativement pour n1 et n2 assez
f (1 f1 ) f 2 (1 f 2 )
grands, la loi normale N (0, 1 ).
n1 n2
Remarque
Lesprance de la variable F F2 gale la diffrence p 1 p 2 est nulle compte tenu de lhypothse.
La variance de la variable F F2 est gale la somme des variances car les variances s'ajoutent si l'on
suppose les variables F1 et F2 indpendantes.
On conclut en disant que lobservation dune diffrence f1 f2, obtenue partir des frquences
f (1 f1 ) f 2 (1 f 2 )
observes, vrifiant f1 f 2 1,96 1 remet en question lhypothse p1 p2
n1 n2
puisque avec lhypothse p1 p2 cette situation na que 5% de chances de se produire.