Académique Documents
Professionnel Documents
Culture Documents
STATISTIQUE
ET PROBABILITS
70%
APPLICATIONS
4e 30%
COURS
dition
Statistique
et probabilits
TRAVAUX DIRIGS
JEAN-PIERRE LECOUTRE
Matre de confrences luniversit
Panthon-Assas (Paris II)
Statistique
et probabilits
Rappels de cours
QCM et questions de rflexion
Exercices corrigs
Sujets dannales
4e dition
Dunod, Paris, 2008
Dunod, Paris, 2005 pour la prcdente dition
ISBN 978-2-10-054431-8
Sommaire
Avant-propos VII
TD 1 Notion de probabilit 1
Lessentiel du cours 1
Pouvez-vous rpondre? 5
Questions de rflexion 6
Entranement 6
Solutions 11
TD 5 Notions de convergence 71
Lessentiel du cours 71
Pouvez-vous rpondre ? 75
Questions de rflexion 75
Entranement 76
Solutions 79
TD 6 Estimation ponctuelle 85
Lessentiel du cours 85
Pouvez-vous rpondre ? 89
Questions de rflexion 90
Entranement 90
Solutions 93
1. Ensemble fondamental
Le rsultat dune exprience alatoire sappelle un vnement lmentaire. Len-
semble des rsultats possibles sappelle ensemble fondamental (ou univers) et est
not traditionnellement . Chaque lment de reprsente donc un vnement
lmentaire, et toute partie A (ou A P ()) sera un vnement. Parfois on dit
que est lensemble des ventualits possibles et les vnements lmentaires sont
Dunod. La photocopie non autorise est un dlit.
alors les singletons, cest--dire les ensembles rduits un seul lment {}, qui
sont effectivement en toute rigueur des vnements, puisquappartenant P (),
ce qui nest pas le cas du point .
A et A
n
Aj A
j=1
n
Aj A
j=1
An A
n=0
Cette condition exprime que toute union dnombrable dvnements est encore
un vnement. Lensemble A auquel on impose les conditions C1 et C3 sappelle
alors une -algbre ou tribu dvnements.
Le couple form de lensemble fondamental et de la tribu dvnements associe
A sappelle un espace probabilisable.
TD 1 Notion de probabilit 3
3. Probabilit
Dfinition. On appelle probabilit P sur (, A) une application P : A [0, 1] telle
que :
(i) P() = 1;
(ii) pour toute suite An dvnements incompatibles, soit An A avec Am An =
pour m = n :
P An = P(An )
n=0 n=0
Proprits
P1 Lvnement impossible est de probabilit nulle :
P() = 0
P(A) = 1 P(A)
A B P(A) P(B)
4. Probabilits conditionnelles
On considre lespace probabilis (, A, P) et un vnement particulier B de A
tel que P(B) > 0. La connaissance de la ralisation de B modifie la probabilit de
ralisation dun vnement lmentaire, puisque lensemble des rsultats possibles
est devenu B et non plus . Cette nouvelle probabilit, note P(.|B), est dfinie sur
la tribu conditionnelle :
A|B = {A B/A A}
4 TD Statistique et probabilits
par :
P(A B)
P(A|B) =
P(B)
Elle sappelle parfois formule des probabilits composes et se gnralise par rcur-
rence :
5. Thorme de Bayes
n
n
P(B) = P(Ai B) = P(Ai )P(B|Ai )
i=1 i=1
Ceci va nous permettre de calculer les probabilits a posteriori P(Ai |B), aprs rali-
sation dun vnement B, partir des probabilits a priori P(Ai ), 1 i n :
6. Indpendance en probabilit
Dfinition. Deux vnements A et B sont dits indpendants, relativement la probabilit
P, si :
P(A B) = P(A)P(B)
Indpendance mutuelle
Si lon considre n vnements Ai , avec n > 2, il y a lieu de distinguer lindpen-
dance deux deux qui impose :
P(Ai Aj ) = P(Ai )P(Aj ) 1 i = j n
de lindpendance mutuelle, condition plus forte qui scrit :
P(Ai1 Ai2 . . . Aik ) = P(Ai1 )P(Ai2 ) . . . P(Aik ) 2 k n
pour tous les sous-ensembles {i1 , . . . , ik } de {1, 2, . . . , n}.
Vrai Faux
1. On peut associer deux ensembles fondamentaux diffrents
une mme exprience.
2. Lgalit P(A B) = P(A) + P (B) implique que les vnements
Dunod. La photocopie non autorise est un dlit.
A et B sont incompatibles.
3. Linformation apporte par la connaissance de la ralisation
dun vnement B augmente la probabilit dun autre vnement
A, i.e. P(A|B) P(A).
4. Si deux vnements sont incompatibles, alors ils sont indpen-
dants.
5. Si deux vnements sont indpendants, alors leurs compl-
mentaires le sont aussi.
6. Soit = {a, b, c, d} avec quiprobabilit des vnements l-
mentaires sur P (). Les vnements A = {a, b} et B = {a, c} sont
dpendants car ils sont raliss simultanment quand lvnement
lmentaire a est ralis.
6 TD Statistique et probabilits
Ensemble fondamental
12. On lance six boules dans quatre cases distinctes. Reprsenter lensemble
fondamental dans les deux cas suivants.
a) Les boules sont numrotes de 1 6.
b) Les boules sont identiques.
Atomes
14. Soit A, B et C trois vnements quelconques lis une mme preuve alatoire.
Dcomposer les vnements E = (A B)C et F = A (BC) en une runion
dvnements incompatibles deux deux et indcomposables, appels atomes.
Dans quel cas les vnements E et F sont-ils confondus?
Algbre dvnements
15. Soit = {a, b, c, d}. Dterminer lalgbre A contenant les vnements {c} et {d}.
Analyse de lnonc et conseils. Ce sont les proprits gnrales dune algbre qui
vont permettre de dterminer celle qui est demande.
16.
Soit = {a, b, c,d, e}. Dterminer lalgbre A engendre par la partition
= {a}, {b, c}, {d} , {e} de .
Analyse de lnonc et conseils. Lalgbre demande doit contenir tous les lments
de la partition et donc aussi toutes leurs runions.
8 TD Statistique et probabilits
17. Dterminer toutes les algbres dvnements dfinies sur les ensembles
suivants.
a) = {a}.
b) = {a, b}.
c) = {a, b, c}.
Tribu dvnements
Calcul de probabilits
1 2 1
20. Soit A et B deux vnements tels que P(A) = , P(B) = et P(A B) = .
4 3 8
Calculer les probabilits de E = au moins lun de ces vnements se produit et
F = un seul de ces vnements se produit .
21. On considre un lot de 100 bulletins sur lesquels figurent les rponses oui
ou non trois questions. Aprs dpouillement, les nombres de rponses oui aux
questions 1, 2 et 3 sont respectivement 60, 40 et 30. Les nombres de rponses oui
associes aux questions 1 et 2, 1 et 3 et 2 et 3 sont respectivement 24, 15 et 12. Enfin,
sur 10 bulletins il est rpondu oui aux trois questions. On dsigne par Ei , 1 i 3,
TD 1 Notion de probabilit 9
Problmes de dnombrement
25. On tire au hasard et sans remise cinq cartes dun jeu de trente deux. Calculer
la probabilit dobtenir : une paire (rsultat de la forme aabcd), deux paires (aabbc),
un full (aaabb).
26. Un tiroir contient n paires de gants diffrentes. En raison dune panne dlec-
tricit, Achille Talon prend au hasard 2r gants dans ce tiroir, avec r < n. Quelle est
la probabilit quil nait obtenu aucune paire de gants appareills?
Analyse de lnonc et conseils. Il faut dabord dnombrer tous les rsultats possibles
quiprobables. Ensuite, on doit examiner comment les gants doivent tre choisis pour
quil ny ait aucune paire appareille, en noubliant pas quune paire est constitue de
deux gants, un droit et un gauche !
Probabilits conditionnelles
27. On cherche une lettre qui a la probabilit p de se trouver dans lun des quatre
tiroirs dun secrtaire. Quelle est la probabilit quelle se trouve dans le quatrime
tiroir, sachant quon ne la pas trouve dans les trois premiers?
29. Une lection a lieu au scrutin majoritaire deux tours. Deux candidats A
et B sont en prsence. Au premier tour 40 % des voix vont A et 45 % B, le
reste tant constitu dabstentions. Aucun candidat nayant la majorit absolue,
un second tour est organis. Tous les lecteurs ayant vot la premire fois voteront
nouveau. Un sondage indique par ailleurs que 5 % des voix de A se reporteront
sur B et que 10 % des voix de B iront A. On estime de plus que les deux tiers des
lecteurs nayant pas vot au premier tour voteront, raison de 60 % pour A et
40 % pour B.
TD 1 Notion de probabilit 11
Thorme de Bayes
30. On classe les grants de portefeuille en deux catgories : ceux qui sont bien
informs et ceux qui ne le sont pas. Lorsquun grant bien inform achte une
valeur boursire pour son client, la probabilit que le cours de celle-ci monte est
de 0,8 ; dans le cas dun grant mal inform, cette probabilit ne vaut que 0,5. Si
on choisit au hasard un grant dans un annuaire professionnel, la probabilit quil
soit bien inform est de 0,2. Calculer la probabilit que le grant ainsi choisi soit
mal inform, sachant que la valeur quil a achete a mont.
8 Pour que le produit soit impair, il faut que chacun des nombres soit impair. Le
1 1 1 1
sujet qui connat le calcul des probabilits sait donc que P(impair) = =
2 2 2 8
et il choisira donc dtre pendu (vnement not PE) si le rsultat est impair. Dans
le cas contraire, le choix pair (P) ou impair (I) se fait au hasard, la probabilit dtre
pendu tant alors calcule par la formule de la probabilit totale :
1 7 1 1 1
P(PE) = P(P)P(PE|P) + P(I)P(PE|I) = + =
2 8 2 8 2
Do lintrt parfois de connatre le calcul des probabilits !
TD 1 Notion de probabilit 13
P(FF) 1/4 1
P(FF|A) = = =
P(A) 3/4 3
P(FF) 1/4
P(FF|B) = = = 1/2 > P(FF|A)
P(B) 2/4
E = (A B C) (A B C) (A B C) (A B C)
F = (A B C) (A B C) (A B C)
(A B C) (A B C) (A B C)
A B A B
E C C F
Figure 1.1
TD 1 Notion de probabilit 15
On voit ainsi que F = E (A C), donc pour que F soit identique E il faut que
A C = , cest--dire que A et C soient incompatibles.
15 Lalgbre A contenant {c} et {d} doit contenir aussi leur union {c, d} et
leurs complmentaires {a, b, d} et {a, b, c}. La fermeture pour lintersection implique
quelle contienne aussi {a, b, d} {a, b, c} = {a, b}. Au total on obtient :
A = , {c}, {d} , {c, d} , {a, b} , {a, b, d} , {a, b, c} ,
16 Lalgbre A engendre par la partition est constitue par les 24 runions des
ensembles de cette partition, soit :
17 Tous les ensembles tant finis, les algbres que nous allons construire
seront aussi des -algbres.
b) Il ny
a que lalgbre
lmentaire A = {, } et lalgbre la plus complte
P () = , {a}, {b} , .
A = , A, B, A, B, A B, A B, A B, A B,
A B, A B, A B, A B, AB, AB,
19
P(E) = P(A B) = P(A) + P(B) P(A B) =
24
2
P(F) = P(A B) + P(A B) = P(E) P(A B) =
3
Soit :
24 10 15 10 12 10 21
P(A) = + + =
100 100 100 100 100 100 100
Soit :
60 40 30 24 15 12 10 58
P(B) = + + 2 + + +3 =
100 100 100 100 100 100 100 100
11
P(C) = 1 P(A) P(B) P(E1 E2 E3 ) =
100
q2
P(B) = 1 P(A) =
p2 + q2
A 1
p
A
p q
B P(A)
P(A)
A P(A)
q p
B
Dunod. La photocopie non autorise est un dlit.
q
B 0
Figure 1.2
b) Il sagit cette fois dun vnement de la forme aab, avec six choix pour le chiffre
a, cinq choix pour b et trois possibilits pour la place du rsultat b, donc :
65 15
P(aab) = 3 =
63 36
654 20
P(abc) = =
63 36
24 192 108
P(aabbc) = = = 0,120
201 376 899
4
Enfin, il y a 8 choix de hauteurs pour a avec = 4 choix de couleurs, 7 choix
3
4
de la hauteur de la paire et = 6 choix pour la couleur, soit un total de
2
8 4 7 6 = 1 344 fulls. On obtient donc :
1 344 6
P(aaabb) = = = 0,006 7
201 376 899
TD 1 Notion de probabilit 19
2
Pour n = 2 et r = 1 par exemple, cette probabilit vaut
3
27 On note A lvnement la lettre est dans le quatrime tiroir et B lv-
nement la lettre nest pas dans les trois premiers tiroirs . La dfinition de la
probabilit conditionnelle conduit :
P(A B)
P(A|B) =
P(B)
Chaque tiroir a la mme probabilit de contenir la lettre, si celle-ci est dans lun
1
dentre eux, donc P(A B) = p . On calcule ensuite P(B) = P(A B) + P(A B)
4
avec bien sr P(A B) = 1 p. Ainsi :
p/4 p
P(A|B) = =
p/4 + 1 p 4 3p
P(U1 |U1 U3 ) = = =
P(U1 ) + P(U3 ) 1/3 + 1/3 2
On voit ainsi que les deux probabilits sont distinctes. Linformation du tirage
dune boule noire implique bien sr la prsence dune boule noire mais ne se
confond pas avec cette dernire information. Ceci dmontre la ncessit dune trs
grande rigueur dans la dfinition dun vnement et laide que peut apporter la
formalisation dans le calcul dune probabilit.
20 TD Statistique et probabilits
2
P(A2 |O1 ) = P(O2 |O1 )P(A2 |O1 O2 ) = 0,60 = 0,40
3
2 4
P(B2 |O1 ) = P(O2 |O1 )P(B2 |O1 O2 ) = 0,40 =
3 15
P(A2 ) = P(A1 )P(A2 |A1 ) + P(B1 )P(A2 |B1 ) + P(O1 )P(A2 |O1 )
= 0,95 0,40 + 0,10 0,45 + 0,40 0,15 = 0,485
On obtient de la mme faon P(B2 ) = 0,465, ce qui montre que les abstentionnistes
apporteront la victoire au candidat A.
30 Notons MI (resp. BI) lvnement le grant est mal (resp. bien) inform et
M lvnement la valeur a mont . Les hypothses formules se traduisent par
les probabilits P(BI) = 0,2, P(M|BI) = 0,8 et P(M|MI) = 0,5. On obtient alors par
application de la formule de Bayes :
P(MI M) P(MI)P(M|MI)
P(MI|M) = =
P(M) P(MI)P(M|MI) + P(BI)P(M|BI)
0,8 0,5 5
= =
0,8 0,5 + 0,2 0,8 7
P(A G) P(A)P(G|A) p 2p
P(A|G) = = = =
P(G) P(A)P(G|A) + P(A)P(G|A) (1 p)/2 + p p+1
Chaque rsultat dune exprience alatoire est cod au moyen dune application qui, si
elle permet dassocier une probabilit chacune de ses valeurs numriques discrtes, sera
appele variable alatoire discrte. La loi de cette variable alatoire est alors dtermine
par les probabilits de toutes ses valeurs possibles. Elle est souvent caractrise par les
deux premiers moments qui sont lesprance, caractristique de valeur centrale, et la
variance, caractristique de dispersion autour de cette valeur centrale. Nous prsenterons
les principales lois de probabilit discrtes.
Esprance mathmatique
Dfinition. On appelle esprance mathmatique de la v.a. X la quantit, si elle existe :
E(X) = pi xi
iN
Proprits. Si on ajoute une constante une v.a., il en est de mme pour son
esprance :
E(X + a) = E(X) + a a R
Si on multiplie une v.a. par une constante, il en est de mme pour son esprance :
E(aX) = aE(X) a R
On rsume ces trois proprits en disant que loprateur esprance est linaire :
Variance
Il sagit dun indicateur mesurant la dispersion des valeurs xi autour de E(X) :
V(X) = pi [xi E(X)]2
iN
On note encore cette quantit V(X) = 2X , X dsignant alors lcart type de la v.a. X.
Proprits. Par dfinition :
V(X) 0
TD 2 Variable alatoire discrte 23
V(X + a) = V(X)
V(aX) = a2 V(X)
Le moment centr dordre r N est :
r (X) = pi [xi E(X)]r = E [X E(X)]r
iN
Soit a R un point fix. On appelle loi de Dirac la loi de la v.a. certaine X, cest--dire
qui est constante, avec X() = a quel que soit le rsultat de lpreuve. Ainsi :
On effectue n tirages sans remise dans une urne contenant N objets dont NA objets
A et on note X le nombre dobjets A tirs. Pour tout k tel que 0 k n :
NA N NA
k nk
PX (X = k) =
N
n
La loi hypergomtrique scrit symboliquement X H(N, n, NA ), de moments :
Nn
E(X) = np, V(X) = npq
N1
ayant pos p = P(A) = NA /N et q = 1 p = 1 NA /N.
Une v.a. X suit une loi de Poisson de paramtre > 0 si cest une variable valeurs
entires, X() = N, avec pour k N :
k
PX (X = k) = e
k!
On utilise lcriture symbolique X P () et le calcul des moments donne
E(X) = V(X) = . Si deux variables suivent des lois de Poisson et sont indpen-
dantes, X P () et Y P (), alors leur somme suit aussi une loi de Poisson :
X + Y P ( + ).
PX (X = k) = (1 p)k1 p
1 q
o p = P(A) avec E(X) = et V(X) = 2 , q = 1 p.
p p
TD 2 Variable alatoire discrte 25
Vrai Faux
1. Une variable alatoire est une valeur numrique.
2. Toute application de P () dans N est une variable alatoire
discrte.
3. Lesprance mathmatique dune v.a. discrte est la valeur
quelle prend le plus frquemment.
8. Si X et Y sont deux v.a. indpendantes qui admettent une variance, on sait que
V(X + Y) = V(X) + V(Y). Dans quel cas peut-on avoir la relation V(X Y) =
V(X) V(Y)?
9. Un examen comporte n questions quun candidat tire au hasard dans le pro-
gramme, avec remise. On note X la v.a. qui reprsente le nombre de questions
tires dont il connat la rponse et Y celle qui reprsente le nombre de celles dont
il ignore la rponse. Si p est la proportion de questions du programme que ce
candidat connat, calculer V(X), V(Y) puis V(X + Y). Que remarque-t-on?
Loi de probabilit
10. On considre une urne contenant une boule blanche et deux boules noires
identiques. On effectue deux tirages successifs dans cette urne, la premire
boule tire tant remplace par une boule de couleur diffrente. On demande
de construire lensemble fondamental associ cette preuve alatoire, si on
tient compte de lordre des tirages, et de dterminer la probabilit de chacun des
vnements lmentaires. En dduire la loi de probabilit de la v.a. X qui reprsente
le nombre de boules noires tires.
11. Une urne contient six boules dont quatre blanches et deux noires. On extrait
une boule de lurne, puis on la remet et on effectue ensuite des tirages sans remise
jusqu obtention dune boule de mme couleur. Dterminer la loi de probabilit
du nombre X de tirages aprs remise de la boule tire initialement.
Esprance mathmatique
12. Un joueur paie une mise de cent francs pour participer un jeu o il doit
obtenir deux rsultats pile successifs en quatre lancers au plus dune pice de
monnaie. Son gain est alors G = 20 4 X pour un nombre alatoire X de lancers.
Calculer son esprance de gain.
Analyse de lnonc et conseils. Lexpression des deux premiers moments non centrs
laide des probabilits individuelles va nous fournir deux relations qui lient ces trois
valeurs. La troisime permettant de les dterminer sobtient partir de la condition
gnrale relative une loi de probabilit.
Dunod. La photocopie non autorise est un dlit.
15. Un jouet se trouve cach dans lune des N botes fermes o un enfant le
cherche. Celui-ci ouvre une bote au hasard et recommence jusqu ce quil trouve
le jouet. On suppose qu chaque tentative il a oubli le rsultat de toutes les
prcdentes. Dterminer la loi de probabilit de la v.a. X gale au nombre de
tentatives effectues jusqu la dcouverte du jouet, puis calculer son esprance.
Prciser le nombre N0 de botes si lenfant a environ trois chances sur quatre de
trouver le jouet lissue de ses trois premires tentatives.
Loi du maximum
16. Dans une urne qui contient N boules numrotes de 1 N, on en extrait avec
remise n. Dterminer la loi de probabilit de la v.a. X gale au plus grand des n
numros tirs.
Analyse de lnonc et conseils. Les tirages tant avec remise sont indpendants. Il est
facile de voir que X peut prendre toutes les valeurs entires de 1 N. Pour dterminer
la probabilit dun entier k donn, il est conseill de calculer dabord la probabilit de
lvnement X k puis de remplacer k par k 1.
17. La v.a. X reprsente le chiffre obtenu aprs le lancer dun d six faces
numrotes de 1 6. Dterminer la loi de probabilit de la v.a. Y = X (7 X) puis
calculer E(Y) et V(Y). On dsigne par Y1 , . . . , Yn les valeurs observes lissue de
n lancers indpendants. Dterminer la loi de probabilit de la v.a. Mn gale la
plus grande de ces valeurs.
Lois usuelles
18. On dsigne par X la v.a. qui reprsente le nombre de boules rouges obtenues
aprs cinq tirages avec remise dans une urne qui contient deux boules rouges et
six boules blanches. Dterminer sa loi de probabilit puis calculer E(X) et V(X).
Analyse de lnonc et conseils. Il est facile de reconnatre ici une loi usuelle dont les
moments sont donns par le cours.
19. On dsigne par X la v.a. qui reprsente le nombre de boules blanches obtenues
aprs trois tirages sans remise dans une urne qui contient deux boules noires et
huit boules blanches. Dterminer sa loi de probabilit puis calculer E(X) et V(X).
1 Faux. Une variable alatoire est une application qui un vnement fait
correspondre un nombre.
2 Vrai. Si on prend comme tribu A = P (), toute application X est une v.a.
puisque X1 (x) P () pour tout x rel.
3 Faux. Cest simplement la moyenne en probabilit de toutes ses valeurs pos-
sibles et ne correspond dailleurs pas forcment lune des valeurs quelle peut
prendre. Par exemple, si X est la v.a. qui code 0 le rsultat pile et 1 le rsultat face
dun lancer de pice de monnaie :
1 1 1
E(X) = 0 PX (X = 0) + 1 PX (X = 1) = 0 +1 =
2 2 2
La valeur moyenne en probabilit de X est 1/2, bien que X ne prenne jamais cette
valeur.
4 Vrai. La seule condition est bien sr que lesprance de chacune de ces deux
variables existe.
5 Faux. Une esprance commune na aucune incidence sur la valeur de la
variance. Considrons par exemple les deux distributions suivantes :
X 4 8 12 Y 8 6 66
1/4 1/4 1/2 1/2 1/3 1/6
Elles ont comme valeurs moyennes :
E(X) = 1 + 2 + 6 = 9 et E(Y) = 4 + 2 + 11 = 9
donc mme centre de distribution. Par contre :
E X2 = 4 + 16 + 72 = 92 et E Y2 = 32 + 12 + 726 = 770
do V(X) = 11 et V(Y) = 689, valeur trs suprieure qui indique une dispersion
de Y autour de sa moyenne beaucoup plus grande que celle de X.
Dunod. La photocopie non autorise est un dlit.
7
P (X = 1) = P (BN) + P (NB) =
9
2
P (X = 2) = P (NN) =
9
4 10
P (X = 1|B0 ) = P (B1 ) = =
6 15
2 4 4
P (X = 2|B0 ) = P (N1 B2 ) = =
6 5 15
2 1 4 1
P (X = 3|B0 ) = P (N1 N2 B3 ) = =
6 5 4 15
TD 2 Variable alatoire discrte 31
Notons au passage que la somme de ces probabilits conditionnelles est bien gale
1.
Si la boule tire initialement est noire, il peut y avoir cette fois jusqu cinq tirages
avant dobtenir une noire, puisquil y a quatre blanches. La loi conditionnelle est
dfinie par :
2 5
P (X = 1|N0 ) = P (N1 ) = =
6 15
4 2 4
P (X = 2|N0 ) = P (B1 N2 ) = =
6 5 15
4 3 2 3
P (X = 3|N0 ) = P (B1 B2 N3 ) = =
6 5 4 15
4 3 2 2 2
P (X = 4|N0 ) = P (B1 B2 B3 N4 ) = =
6 5 4 3 15
4 3 2 1 2 1
P (X = 5|N0 ) = P (B1 B2 B3 B4 N5 ) = =
6 5 4 3 2 15
2 10 1 5 5 2 4 1 4 4
soit P (X = 1) = + = , P (X = 2) = + = ,
3 15 3 15 9 3 15 3 15 15
2 1 1 3 1 1 2 2
P (X = 3) = + = , P (X = 4) = = et P (X = 5) =
3 15 3 15 9 3 15 45
1 1 1
= . On vrifie nouveau que la somme de ces probabilits est gale 1.
3 15 45
1 1 2 21
E(G) = 2
2042 + 3 2043 + 4 2044 100 =
2 2 2 8
N1
E (G) = aNP (X N) + [ax b (N x)] P (X = x)
x=0
32 TD Statistique et probabilits
Tous les entiers x de {0, 1, . . . , n} ont la mme probabilit, cest--dire que X suit
une loi uniforme discrte, avec P (X = x) = 1/ (n + 1). On obtient donc :
n
1 (a + b) x bN
N1
E (G) = aN +
x=N
n+1 n+1
x=0
aN (n N + 1) N (N 1) bN2
= + (a + b)
n+1 2 (n + 1) n+1
N [(2n + 1) a b (a + b) N]
=
2 (n + 1)
Cette valeur est maximum quand le numrateur h (N) est maximum, avec h (N) =
(2n + 1) a b
(2n + 1) a b 2 (a + b) N qui sannule pour N = et une drive
2 (a + b)
seconde h (N) = 2 (a + b) < 0. La commande optimum correspond donc bien
cette valeur de N.
Pour n = 3, on doit donc trouver une valeur de N telle que (1 1/N)3 soit proche
de 0,25, ce qui correspond N voisin de 2,7, donc le nombre de botes est lentier
le plus proche N0 = 3.
X 1 2 3 4 5 6
Y 6 10 12 12 10 6
La loi de X tant la loi uniforme discrte sur les entiers {1, 2, 3, 4, 5, 6}, il en est de
mme de la loi de Y sur les entiers {6, 10, 12}. On obtient alors aisment :
1 28
E (X) =(6 + 10 + 12) =
3 3
2 1 280 56
E X = (36 + 100 + 144) = V(X) =
3 30 9
La variable Mn peut prendre aussi les valeurs 6, 10 ou 12. Pour que Mn soit gale
6, il faut que toutes les variables Yi aient pris la valeur 6, do :
n
n
1
P (Mn = 6) = P (Yi = 6) =
3
i=1
Si Mn est gale 12, cest que lun des vnements Yi = 12 est ralis, le compl-
mentaire tant tous les vnements Yi < 12 sont raliss, soit :
n
n
n
2
P (Mn = 12) = P (Yi = 12) = 1 P (Yi 10) = 1
3
i=1 i=1
18 Les tirages tant avec remise sont indpendants et donc X suit une loi
de paramtres n = 5 et p = 2/8 avec E (X) = np = 5/4 et V(X) =
binmiale
np 1 p = 15/16.
34 TD Statistique et probabilits
1 7
P (X = 0) = 0 , P (X = 1) = , P (X = 2) = P (X = 3) =
15 15
8 12 8 2 7 28
avec E (X) = 3 = et V(X) = 3 =
10 5 10 10 9 75
Variable
alatoire
continue 3
On associe aux rsultats dune exprience alatoire un ensemble de valeurs qui forment un
(ou plusieurs) intervalle(s) rel(s). Si on peut calculer la probabilit de tous les intervalles
qui sont inclus dans cet ensemble, lapplication qui ralise ce codage se nomme variable
alatoire (v.a.) continue. Sa loi de probabilit est gnralement dfinie par une densit qui
sera la drive de la fonction de rpartition. Le calcul des moments seffectue laide de
cette densit par une intgration.
On appelle v.a. relle dfinie sur (, A) une application X : R telle que pour
Dunod. La photocopie non autorise est un dlit.
X1 (I) = { /X() I} A
Elle est dtermine par la fonction de rpartition (f.r.) F, dfinie pour tout x rel
par :
F(x) = PX (X < x) = P X1 (], x[) = P { /X() < x}
36 TD Statistique et probabilits
Si la fonction F est continue, on dit que X est une variable alatoire relle continue.
Dans ce cas, pour tout rel x, PX (X = x) = 0, et on dit que la loi est diffuse.
Dans le cas o la fonction F admet une drive f , celle-ci est appele densit
de probabilit de la v.a. X, de loi qualifie dabsolument continue. La f.r. est alors
dtermine par lintgrale :
x
F(x) = f (t) dt
Esprance mathmatique
Elle est dfinie par :
+
E(X) = xf (x) dx
Variance
Elle est dfinie par :
+
V(X) = E [X E(X)]2 = [x E(X)]2 f (x) dx = E X2 E2 (X) = 2 (X)
Une v.a. X suit une loi uniforme si sa densit est constante sur un intervalle [a, b] :
1 si x [a, b]
f (x) = b a
0 sinon
Dunod. La photocopie non autorise est un dlit.
b+a (b a)2
E(X) = et V(X) =
2 12
38 TD Statistique et probabilits
La loi exponentielle de paramtre > 0 est celle dune variable positive de densit :
ex si 0 x
f (x) =
0 si x < 0
1 (x m)2
f (x) = exp
2 22
Une v.a. X de loi gamma de paramtres p > 0 et > 0 est positive, de densit :
p x p1
f (x) = e x si x 0
( p)
On crit X ( p, ), de moments :
p p
E(X) = et V(X) =
2
La v.a. Y = X est de loi ( p, 1), note ( p), de moments E(Y) = V(Y) = p.
Si X ( p, ) et Y (q, ) sont des v.a. indpendantes, alors X + Y ( p + q, ).
TD 3 Variable alatoire continue 39
La loi du khi-deux n degrs de libert, note 2n , est la loi (n/2, 1/2) o n est un
entier positif. Ses moments se dduisent de ceux de la loi gamma :
n/2 n/2
E 2n = = n et V 2n = = 2n
1/2 1/4
Si X 2n et Y 2m sont des v.a. indpendantes, alors X + Y 2n+m .
Notons une proprit importante qui peut servir de dfinition de cette loi : si
X1 , . . . , Xn sont des v.a. indpendantes et de mme loi N(0, 1), alors X12 + + Xn2
suit une loi du khi-deux n degrs de libert.
Vrai Faux
1. La f.r. dune loi absolument continue est strictement croissante
sur lensemble des nombres rels x tels que F (x) > 0.
Dunod. La photocopie non autorise est un dlit.
7. Comment dterminer si la loi de probabilit dune v.a. relle X est continue (ou
diffuse), mixte ou absolument continue, connaissant sa fonction de rpartition F?
8. Si une loi est dfinie par une densit, indiquer comment on peut tudier
lexistence de ses moments centrs.
Fonction de rpartition
Dterminer la constante k pour que f soit la densit dune loi dont on prcisera la
fonction de rpartition.
Analyse de lnonc et conseils. Pour quune fonction soit une densit, il faut quelle
soit positive et dintgrale gale 1. Cest cette dernire condition qui va permettre de
calculer prcisment la valeur de la constante k. On dtermine ensuite la f.r. en intgrant
la densit de x, en choisissant x dans chacun des intervalles o lexpression de
cette densit reste la mme.
Loi de Pareto
10. Une v.a. X suit une loi de Pareto de densit f dfinie par :
k si x x0
f (x) = x3
0 sinon
o x0 est une constante positive. Dterminer la constante k pour que f soit bien une
densit et prciser la fonction de rpartition de X.
Loi symtrique
Dterminer la f.r. de X, puis indiquer sans calculs les valeurs de P (X > 1) et E (X).
Calcul de moments
Analyse de lnonc et conseils. Le calcul des moments se fait par intgration, sans
difficults particulires dans le cas dune densit finie sur un intervalle
fini. Pour le
calcul de la variance, il est presque toujours prfrable de calculer E X2 puis dutiliser
la formule dveloppe.
Dunod. La photocopie non autorise est un dlit.
Loi de Laplace
Analyse de lnonc et conseils. Le principe est le mme que dans lexercice prc-
dent mais il sagit ici dintgrales gnralises dont il faut examiner la convergence,
puisquon intgre sur tout R. On pourra ici simplifier le calcul par la recherche dun
centre de symtrie de la loi.
42 TD Statistique et probabilits
Analyse de lnonc et conseils. La loi est ici dfinie par sa f.r. dont on peut remarquer
quelle est drivable partout. Il sagit donc dune loi absolument continue dont on
dterminera la densit en drivant F et le calcul des moments seffectuera alors comme
dans les exercices prcdents.
15. a) Si X suit une loi N (35, 5), calculer P (X < 25), P (37,5 < X < 40) et
P (32,5 < X < 37,5).
b) Calculer lesprance et la variance dune v.a. Y de loi normale, telle que
P (Y > 3) = 0,691 5 et P (Y < 2) = 0,977 2.
Analyse de lnonc et conseils. La table 1, page 194, fournit les probabilits asso-
cies la loi normale centre et rduite. Il faut donc dans le cas gnral centrer la
variable normale, cest--dire retrancher son esprance, et la rduire, cest--dire la
diviser ensuite par son cart type. Les valeurs de F (u) ne sont fournies que pour
u 0 ; la valeur de F (u) est obtenue en prenant le complment 1 de celle de
F (u). Dans la seconde question, cest partir de la table 2, page 195, des fractiles que
lon devrait pouvoir dterminer les valeurs de la variable centre-rduite associes
aux probabilits donnes. Cependant ici ces probabilits figurent dans la table 1,
ce qui permet de dterminer sans interpolation les valeurs exactes de la variable.
17. a) Dterminer les fractiles dordres 0,8 et 0,2 de la loi de Student 12 degrs
de libert.
b) Dterminer le fractile dordre 0,05 de la loi de Fisher-Snedecor 30 et 10 degrs
de libert.
Analyse de lnonc et conseils. On utilise les tables 6, page 200, et 7, page 201, des
fractiles, en utilisant les proprits de ces lois.
Loi du maximum
Dunod. La photocopie non autorise est un dlit.
Changement de variable
Loi de Gumbel
1 Faux. La densit f est une fonction positive qui peut trs bien sannuler sur
certains intervalles o la f.r. sera alors constante. Considrons par exemple la
densit dfinie par :
x 1
si 4 < x < 2
4 2
f (x) = x 1 si 2 < x < 4
4 2
0 sinon
Pour 2 < x 2 la densit est nulle et F (x) = F (2) = 1/2 reste constante.
TD 3 Variable alatoire continue 45
2 Faux. On
peut donner comme contre-exemple la loi de Cauchy de densit
1/ 1 + x2 et qui pourtant nadmet pas desprance. Cependant, si lintgrale
+
gnralise xf (x) dx existe, alors on a bien E (X) = 0.
3 Faux. La variable Y = X suit une loi normale, comme X, et X + Y = 0, donc
cette variable suit une loi de Dirac (que lon pourrait envisager comme cas limite
dune loi normale dcart type nul). Bien sr lnonc devient vrai si on ajoute la
condition dindpendance des variables X et Y.
4 Vrai. Lexistence dun moment dun certain ordre implique celle de tous les
moments dordres infrieurs.
5 Faux. La loi est continue, la f.r. est continue et strictement croissante mais pas
forcment drivable. On peut trouver des exemples assez complexes o la loi est
continue mais pas absolument continue, cest--dire nadmettant pas de densit.
6 Vrai. Prenons lexemple de la fonction g dfinie par g (x) = |x|. Elle nest pas
injective et pourtant on peut dterminer la loi de Y = |X|. En effet, pour tout
y > 0 lvnement Y < y est quivalent y < X < y, dont on peut calculer la
probabilit. Cependant, si g nest pas injective on na pas la certitude de pouvoir
toujours dterminer la loi de Y.
7 Si la fonction F est drivable, on peut conclure que sa drive est la densit
de la loi, qui est alors absolument continue. Sinon, on tudie la continuit de F
sur son domaine de dfinition. Si elle est continue partout, la loi est continue, ou
diffuse, cest--dire quil ny a aucune masse de probabilit en aucun point. Par
contre, sil existe au moins un point x0 o F est discontinue, on a alors F (x0 + 0) =
lim F (x0 + h) = F (x0 ) ; la loi est mixte, comportant une partie continue et une
h0+
partie discrte, car il y a au moins un point de masse non nulle : P (X = x0 ) =
F (x0 + 0) F (x0 ).
8 Lexistence dun moment centr dordre entier r est quivalente celle du
moment non centr de mme ordre, qui stablit en tudiant la convergence de
+
lintgrale gnralise xr f (x) dx. Si cette intgrale existe pour tout r, cest que
la loi admet des moments de tous ordres. Si on tablit lexistence dun moment
dordre r0 , tous les moments dordres infrieurs r0 existent.
9 Lintgrale de f sur ], +[ se rduit :
1
Dunod. La photocopie non autorise est un dlit.
k
k (1 x) dx =
0 2
qui vaut 1 pour k = 2.
Pour x 0, la densit est nulle et donc F (x) = 0. Pour 0 < x 1, on dcompose
lintervalle dintgration de f en deux :
x 0 x
F (x) = f (t) dt = 0 dt + 2 (1 t) dt = 2x x2
0
Enfin, pour x > 1 on dcompose en trois intgrales qui correspondent aux trois
intervalles o f conserve la mme expression :
x 0 1 x
F (x) = f (t) dt = 0 dt + 2 (1 t) dt + 0 dt = 1
0 1
46 TD Statistique et probabilits
11 Pour x 0, la densit est nulle, donc son intgrale aussi et F (x) = 0. Pour
0 < x 2, le calcul de la f.r. F se rduit :
3 x 3x2 x3
F (x) = 2t t2 dt =
4 0 4 4
Pour x 2, on intgre la densit sur tout lintervalle o elle est non nulle, donc
son intgrale vaut 1 et F (x) = F (2) = 1. On peut remarquer ici que f (2 x) = f (x)
et cette symtrie de la densit implique la symtrie de la loi par rapport au centre
1
x = 1 de lintervalle, qui est donc la mdiane, avec P (X < 1) = P (X > 1) = , et
2
aussi la moyenne, avec E (X) = 1, puisque lintgrale seffectue sur un intervalle
de longueur finie.
12 On obtient aisment :
0 si x < 0
2
F (x) = x si 0 x
2
1 si x >
On calcule lesprance :
+
2 2 x3 2
E (X) = xf (x) dx = 2 x dx = 2
2
=
0 3 0 3
2
Et enfin V(X) = E X2 E2 (X) =
18
TD 3 Variable alatoire continue 47
13 Tous les moments de cette loi existent, daprs le thorme des croissances
compares, en raison de la prsence de lexponentielle qui lemporte sur toutes
+
les puissances de x. Cela assure donc la convergence des intgrales xr f (x) dx
pour tous les entiers r. Si on remarque que f (2x ) = f (x), on en conclut que est
centre de symtrie de cette loi, donc la mdiane, mais aussi la moyenne puisque
nous savons que celle-ci existe : E (X) = . Pour le calcul du moment dordre deux,
il sera donc judicieux de faire le changement u = x :
+
1 +
E X2 = (u + )2 e|u| du
x2 f (x) dx =
2
+ +
= u2 eu du + 2 eu du = 2 + 2
0 0
et V(X) = E X 2
E2 (X) = 2.
1 2
et V(X) = E X2 E2 (X) = e + 4e 3 .
2
15 a) On retranche 35 puis on divise par 5 pour pouvoir ensuite utiliser la
table 1, page 194 :
X 35
P (X < 25) = P < 2 = (2) = 1 (2) = 0,022 8
5
et :
3 m 2m
= 0,5 et =2
de solution m = 2 et = 2.
16 a) La lecture de la table 1, page 194, permet dobtenir :
Xm 2m
P < = 0,308 5 = 1 0,691 5 = 1 (0,5) = (0,5)
o est la f.r. de laloi N (0, 1) et ayant pos m = E (X) et = V(X). De mme,
Xm 8m
P < = 0,993 8 = (2,5), ce qui donne les quations :
2m 8m
= 0,5 et = 2,5
et :
Ym 3,5 m
P < = 0,841 3 = (1)
soit :
2m 3, 5 m
= 2 et =1
de solution m = 3 et = 1/2. La loi de 4(X 3)2 est une loi du khi-deux un degr
de libert, donc 4a est le fractile dordre 0,975 de cette loi, lu dans la table 5, soit
4a = 5,02 et a = 1,255.
17 a) La lecture de la table 6, page 200, fournit la valeur 0,873 du fractile dordre
0,8. En raison de la symtrie de cette loi par rapport lorigine, le fractile dordre
0,2 est donc 0,873.
b) La table 7, page 201, ne comporte pas le couple de degrs de libert (30, 10),
mais le couple (10, 30), qui fournit le fractile 2,16, soit P(X < 2,16) = 0,95 avec
X F(10, 30). Linverse de X suit une loi F(30, 10), donc P(1/X > 1/2,16) = 0,95
et le fractile dordre 0,05 de la loi F(30, 10) est donc 1/2,16 = 0,46.
TD 3 Variable alatoire continue 49
n
(mn > x) = (Xi > x)
i=1
Ainsi :
soit :
0 si x
G (x) =
1 en(x) si x >
Et par drivation :
0 si x
g (x) = G (x) = nf (x) [1 F (x)] n1
=
nen(x) si x >
x
1 x3 x 1
F (x) = 9 t2 dt = + +
36 3 108 4 2
Lvnement (Mn < x) est quivalent toutes les variables de lchantillon sont
infrieures x et comme toutes les v.a. sont indpendantes et de mme loi que X,
on obtient :
n
n
G (x) = P (Mn < x) = P (Xi < x) = P (Xi < x) = Fn (x)
i=1 i=1
La densit tant :
1
g( y) = G ( y) = ey f ey = ey/
On reconnat la loi exponentielle de paramtre 1/.
1
g( y) = f ln y = ey
y
qui est la densit dune loi exponentielle ou loi (1). La variable Sn est donc la
somme de v.a. indpendantes qui suivent la mme loi (1) et suit donc une loi
(n).
Couple
et vecteur
alatoires 4
Un couple de v.a. discrtes est constitu de deux v.a. discrtes X et Y dont les
ensembles de valeurs possibles sont {xi }iI et {yj }jJ , avec I, J N, de loi dfinie
Dunod. La photocopie non autorise est un dlit.
par :
pij = P X = xi , Y = yj
1.4 Indpendance
Si h : R2 R est une application continue, elle dfinit une v.a. h (X, Y) desprance
qui se calcule par :
E [h (X, Y)] = pij h xi , yj
iI jJ
Cov(X, Y)
= Corr(X, Y) =
V(X) V(Y)
Si X et Y sont deux v.a. continues, la loi de (X, Y) est dtermine par sa f.r. :
F x, y = P X < x, Y < y
Si la loi du couple est dfinie par sa densit, les densits marginales sont :
+ +
fX (x) = f (x, y) dy et fY ( y) = f (x, y) dx
Pour une loi de densit f , les lois conditionnelles sont dfinies par les densits :
f (x, y) f (x, y)
fX x|Y = y = et fY y|X = x =
fY ( y) fX (x)
2.4 Indpendance
Dunod. La photocopie non autorise est un dlit.
f (x, y) = fX (x)fY ( y)
Si h : R2 R est une application continue, elle dfinit une v.a. h (X, Y) dont
lesprance se calcule par lintgrale double :
E [h (X, Y)] = h(x, y)f (x, y) dx dy
R2
54 TD Statistique et probabilits
2.6 Rgression
Elle peut se calculer, dans le cas o ce couple admet une densit f , par :
G(z) = f (x, y) dx dy
D
o D = x, y /x + y < z . Dans le cas particulier o X et Y sont indpendantes :
+ z z
G(z) = fX (x)fY (s x) ds dx = g(s) ds
3. Vecteur alatoire
n! n n
P (N1 = n1 , . . . , Nk = nk ) = p 1 . . . pk k
n1 ! . . . nk ! 1
o kj=1 pj = 1. Si on pose t p = p1 , . . . , pk , on crit N M(n; p) desprance
E(N) = np et de matrice de variances-covariances :
' ( )*
V(N) = n pi ij pj
1i,jk
Dfinition. Un vecteur alatoire X valeurs dans Rn suit une loi normale si toute
combinaison linaire de ses composantes suit une loi normale dans R :
n
X Nn a Rn , t
aX = ai Xi N1
i=1
1 1
f (x) = ( )n exp t (x ) 1 (x )
2 det 2
n
1 1 xi i 2
f (x) = n exp
( )n 2 i
i=1
2 i
i=1
56 TD Statistique et probabilits
Vrai Faux
10. Comment lexamen du tableau donnant la loi dun couple de v.a. discrtes
permet-il de conclure facilement la dpendance de ces deux variables?
11. Indiquer le moyen gnralement le plus simple pour obtenir les densits
marginales dun couple de v.a. continues dont on connat la fonction de rpartition.
12. Si X est une v.a. relle de loi N (, ), on lui associe la variable centre-
rduite U = 1 (X ), notamment pour pouvoir utiliser les tables. Dans le cas
dun vecteur alatoire X de loi Nn (, ), indiquer la transformation qui permet
dobtenir un vecteur de loi normale centre-rduite Nn (0, I).
TD 4 Couple et vecteur alatoires 57
Esprance conditionnelle
16. La loi de probabilit du couple (X, Y) est indique dans le tableau suivant, les
valeurs tant exprimes en dizimes :
X 1 2 3 4
Y
1 1 1 2 1
2 0 1 1 0
3 1 0 0 2
Analyse de lnonc et conseils. Lexpression E (Y|X) est bien celle dune variable
alatoire puisquil sagit dune fonction de X, qui est elle-mme une v.a. Pour une
ralisation telle que X prend la valeur X () = x, cette variable prend la valeur de
la rgression en x, cest--dire que E (Y|X) () = E (Y|X = x). Il faut donc calculer les
diffrentes valeurs de cette fonction de rgression, qui seront les valeurs possibles de
cette v.a. On peut ensuite calculer lesprance de cette v.a. par rapport la loi de X.
17. Le montant de lindemnit verse une entreprise qui a souscrit une police
dassurance incendie, aprs un sinistre, est une v.a. X de loi connue. Le nombre
annuel dincendies est une v.a. N qui suit une loi de Poisson de paramtre .
Dterminer la loi de probabilit de la v.a. Kx qui reprsente le nombre annuel
dincendies dun montant suprieur une valeur x positive donne. Dterminer
ensuite la loi conditionnelle de N pour Kx = k.
18. Soit (X, Y) un couple de v.a. dont la loi est dfinie par la densit :
4x 1 y si 0 x 1, 0y1
f x, y =
0 sinon
TD 4 Couple et vecteur alatoires 59
19. Soit (X, Y) un couple de v.a. dont la loi est dfinie par la densit :
2e(x+y) si 0 y x
f x, y =
0 sinon
Analyse
de lnonc et conseils. Pour dterminer la f.r. du couple en un point
M x0 , y0 , il faut intgrer la densit sur le domaine E =] , x0 [] , y0 [. Il faudra
alors distinguer plusieurs cas selon la position du point M par rapport au domaine D
o cette densit est non nulle. Ayant dtermin cette f.r., on en dduit aisment les f.r.
marginales en faisant tendre successivement y0 et x0 vers plus linfini. Cest la mthode
ici la plus simple pour obtenir ensuite les densits marginales par drivation de ces f.r.
Dunod. La photocopie non autorise est un dlit.
marginales.
20. Soit X1 , . . . , Xn des v.a. indpendantes et de mme loi uniforme sur [0, 1].
Dterminer la loi de probabilit du couple de valeurs extrmes (mn , Mn ), ayant
pos mn = min {X1 , . . . , Xn } et Mn = max {X1 , . . . , Xn }.
Fonction de rgression
21. Soit (X, Y) un couple de v.a. dont la loi est dfinie par la densit :
3y si x, y D
f x, y =
0 sinon
Loi multinomiale
22. On effectue n tirages avec remise dans une urne qui contient une boule noire,
deux blanches et trois vertes. Dterminer la loi de probabilit du vecteur N dont les
composantes N1 , N2 et N3 dsignent respectivement le nombre de boules noires,
blanches et vertes tires. Calculer ensuite E (N) et V(N).
23. Si X1 , X2 et X3 sont trois v.a. indpendantes de mme loi N (0, 1), dterminer
la loi de probabilit du vecteur Y dont les composantes sont dfinies par :
1 1 1
Y1 = (X1 + X2 ) , Y2 = (X1 + X2 X3 ) , Y3 = (X1 + X2 + 2X3 )
2 3 6
1 Faux. Dans le cas gnral, la connaissance des lois marginales ne permet pas
de dterminer la loi du couple. Par contre, dans le cas particulier o les variables
sont indpendantes, la loi du couple sobtient comme produit des lois marginales.
2 Vrai. Il sagit dune variable alatoire car cest une fonction de X, qui est une
variable alatoire. Pour un vnement lmentaire tel que X prend la valeur
X () = x, cette v.a. aura comme ralisation la valeur de la fonction de rgression
au point x, cest--dire E (Y|X) () = E (Y|X = x). On peut donc calculer lesprance
de cette variable par rapport la loi de X et on tablit que E [E (Y|X)] = E (Y).
3 Vrai. Si deux v.a. X et Y sont indpendantes, alors E (XY) = E (X) E (Y), ce
qui implique que Cov (X, Y) = 0. Par contre, la rciproque est fausse dans le cas
gnral, cest--dire que deux variables peuvent avoir une covariance nulle et tre
dpendantes.
4 Faux. Pour que lnonc devienne vrai en gnral, il faut ajouter la condition
dindpendance des deux lois. Si par exemple X suit une loi binmiale, X + X = 2X
ne suit pas une loi binmiale.
5 Faux. Il est ncessaire, dans le cas gnral, de connatre la loi du couple (X, Y)
pour pouvoir dterminer celle de X + Y, puisquelle implique ces deux variables
simultanment. Cependant, si les deux variables sont indpendantes, lnonc
devient vrai.
6 Vrai. Cette proprit, qui tait vraie en unidimensionnel, subsiste dans le cas
multidimensionnel, cest--dire que si X et Y sont
deux vecteurs alatoires n
composantes et A, B deux matrices de format p, n , alors :
11 Connaissant les valeurs F x, y de la f.r. du couple, en faisant tendre succes-
sivement y et x vers plus linfini, on obtient les f.r. marginales FX (x) et FY y . Il
suffit alors de driver pour obtenir les densits marginales :
dFX (x) dFY y
fX (x) = et fY y =
dx dy
car S2 = I.
13 La loi du couple (X, Y) sobtient sans difficults. Elle est indique dans le
tableau suivant :
X 1 2 3 4 5 6
Y
0 1/6 0 1/6 0 1/6 0 1/2
1 0 1/6 0 1/6 0 1/6 1/2
X+Y 1 3 5 7
Puis on calcule :
1 1 1 1
E (X + Y) = 1+ 3+ 5+ 7=4
6 3 3 6
et :
1 1 1 1 59
E (X + Y)2 = 1 + 32 + 52 + 72 =
6 3 3 6 3
11
soit enfin V(X + Y) = . Le calcul de V(X) = 35/12 et V(Y) = 1/4 confirme que
3
V(X) + V(Y) = V(X + Y) et donc que X et Y ne peuvent pas tre indpendantes.
TD 4 Couple et vecteur alatoires 63
X 1 2 3 4
Y
1 0(2) 1(3) 1(4) 1(5) 3
2 1(3) 0(4) 1(5) 1(6) 3
3 1(4) 1(5) 0(6) 1(7) 3
4 1(5) 1(6) 1(7) 0(8) 3
3 3 3 3 12
X+Y 3 4 5 6 7
X 2 3 4 5 6 7 8 9 10 11 12
Y
1 1 0 0 0 0 0 0 0 0 0 0 1
2 0 2 1 0 0 0 0 0 0 0 0 3
3 0 0 2 2 1 0 0 0 0 0 0 5
4 0 0 0 2 2 2 1 0 0 0 0 7
5 0 0 0 0 2 2 2 2 1 0 0 9
6 0 0 0 0 0 2 2 2 2 2 1 11
1 2 3 4 5 6 5 4 3 2 1 36
64 TD Statistique et probabilits
Y|X = 6 3 4 5
1 2 2 21
E (Y|X = 6) = 3+ 4+ 5=
5 5 5 5
1 1
E(Y|X = 1) = 1+ 3=2
2 2
2 2 3 3 4 3 7 9
E [E (Y|X)] = 2+ + + =
10 10 2 10 3 10 3 5
1 1 3 9
E (Y) = 1+ 2+ 3=
2 5 10 5
On remarque ainsi que E [E (Y|X)] = E (Y), rsultat qui est dailleurs toujours
vrifi.
TD 4 Couple et vecteur alatoires 65
P (Kx = k) = P {(Kx = k) (N = n)} = P (N = n) P (Kx = k|N = n)
n=k n=k
Lorsque le nombre annuel dincendies est fix n, chacun deux est dun montant
suprieur x avec une probabilit connue px = P (X > x). La loi conditionnelle de
Kx |N = n est donc une loi binmiale de paramtres n et px . Ainsi :
n
k
nk 1 px nk
n k px
P (Kx = k) = e px 1 px =e
n! k k! (n k)!
n=k n=k
k k
px px
= e e(1px ) = epx
k! k!
zj
ayant utilis le rsultatj=0 = ez . Lexpression de cette probabilit montre que
j!
Kx suit une loi de Poisson de paramtre px . Pour Kx = k fix, la v.a. N ne peut
prendre que les valeurs entires n k, avec :
nk
P {(N = n) (Kx = k)} e n pkx 1 px
P (N = n|Kx = k) = = k
P (Kx = k) (n k)!epx px
nk
(1px ) 1 px
=e
(n k)!
0 0 81
x+y=1 y=x
1/2
AD
Figure 4.1
TD 4 Couple et vecteur alatoires 67
On voit donc quil est prfrable dintgrer dabord par rapport x sur une
horizontale, pour ne pas avoir distinguer deux cas, soit :
1/2 + 1y , 1/2
x y
y
P (X + Y < 1) = 2 e dx e dy = 2 e e y1 ey dy
0 y 0
1/2
= e2y 2e1 y 0 = 1 2e1
b) La f.r. F du couple (X, Y) est dfinie au point M x0 , y0 par :
F x0 , y0 = P (X < x0 ) Y < y0 = f x, y dx dy
E
y
M1 (x0 , y1 ) y=x
x0 D
Dunod. La photocopie non autorise est un dlit.
M(x0 , y0 )
0 x0 x
Figure 4.2
point situ sur la premire bissectrice, qui est la frontire de D. Cela veut dire que
lon peut calculer la valeur de F au point M1 partir de lexpression prcdente
qui est encore valable sur la frontire, soit :
F x0 , y1 = F (x0 , x0 ) = 1 2ex0 + e2x0
c) On pourrait avoir ici la tentation dcrire f x, y = 2ex ey et den conclure
que les variables X et Y sont indpendantes, la densit scrivant comme produit
de deux fonctions positives. Ceci est faux, car lexpression de f nest celle-ci que sur
le domaine D o 0 y x et il faudrait donc ajouter le terme 1D , qui lui ne peut
pas se factoriser. Cette impossibilit de factorisation montre donc, au contraire,
que ces variables sont dpendantes. Nous allons le vrifier partir de lexpression
des densits marginales, que nous allons obtenir partir des f.r. marginales. Pour
y tendant vers plus linfini, on obtient celle de X, soit pour x > 0 :
FX (x) = F (x, +) = 1 2ex + e2x
La densit marginale est donc, par drivation :
fX (x) = 2ex 1 ex
De mme, on obtient les f.r. et densit marginales de Y, soit pour y > 0 :
FY y = F +, y = 1 e2y
fY y = 2e2y
Le produit de fX et fY ne redonne pas f , donc on retrouve bien le fait que X et Y ne
sont pas indpendantes.
20 La f.r. du couple (mn , Mn ) est dfinie par :
F x, y = P (mn < x) Mn < y = P Mn < y P (mn x) Mn < y
Les vnements qui apparaissent au second membre peuvent sexprimer facile-
ment laide des v.a. X1 , . . . , Xn :
n
n
Mn < y = Xi < y et (mn x) Mn < y = x Xi < y
i=1 i=1
Les v.a. Xi tant indpendantes, il en est de mme des vnements quelles dfi-
nissent, donc :
n
n
F x, y = P Xi < y P x Xi < y
i=1 i=1
Dautre part, toutes ces variables ont la mme loi, de f.r. dfinie pour 0 u 1 par
P (X1 < u) = u, do :
n
F x, y = yn y x
pour 0 x y 1. En drivant deux fois par rapport x et y, on en dduit la
densit du couple :
n2
f x, y = n (n 1) y x
TD 4 Couple et vecteur alatoires 69
y =1+x y =1x
D
1 0 x 1 x
Figure 4.3
3
On peut donc crire la densit de X sous la forme g (x) = (1 |x|)2 pour |x| 1
2
et la densit conditionnelle de Y|X = x scrit donc, pour 0 < y < 1 |x| :
Dunod. La photocopie non autorise est un dlit.
2y
h y|X = x =
(1 |x|)2
n! 2n2 3n3
P (N1 = n1 , N2 = n2 , N3 = n3 ) =
n1 !n2 !n3 ! 6n
70 TD Statistique et probabilits
et la matrice de variances-covariances :
5 2 3
n
V(N) = 2 8 6
36
3 6 9
1 1 2
f (x1 , x2 , x3 ) = exp x1 + x22 + x23
(2) 3/2 2
Toute combinaison linaire des composantes de Y est une combinaison linaire des
composantes de X, qui par dfinition est une variable alatoire relle. Le vecteur
Y est donc normal et ses caractristiques vont se dduire de celles de X par :
1. Convergence en probabilit
1.1 Ingalit de Markov
Dunod. La photocopie non autorise est un dlit.
Si X est une v.a. positive dont lesprance existe, lingalit de Markov tablit que
pour tout > 0 :
1 E(X)
P {X E(X)} ou P (X )
Si X est une v.a. dont la variance existe, pour tout > 0 fix :
V(X)
P (|X E(X)| )
2
72 TD Statistique et probabilits
On dit que la suite de v.a. (Xn ) converge en probabilit vers une v.a. X si, pour tout
>0:
On crit :
Xn X
p
Xn X f (Xn ) f (X)
p p
1.5 Thorme
f (Xn , Yn ) f (X, Y)
p
Xn + Yn X + Y
p
Xn Yn XY
p
Xn X
condition que P (Y = 0) = 0
Yn p Y
Si (Xn ) est une suite de v.a. mutuellement indpendantes qui admettent les mmes
moments dordres un et deux, cest--dire avec pour tout entier n, E(Xn ) = m et
V(Xn ) = 2 , alors quand n :
1
n
Xn = Xi m
n p
i=1
TD 5 Notions de convergence 73
2. Convergence en loi
On dit que la suite de v.a. (Xn ), de f.r. Fn , converge en loi vers une v.a. X de f.r. F si la
suite {Fn (x)} converge vers F (x) en tout point x o F est continue. On crit alors :
Xn X
loi
2.1 Thorme
Xn X Xn X
p loi
2.2 Proprit
Xn X et Yn a
loi p
Xn + Yn X + a
loi
Xn Yn aX
loi
Xn X
si a = 0
Yn loi a
Xn X g(Xn ) g(X)
Dunod. La photocopie non autorise est un dlit.
loi loi
i I , P (Xn = ai ) P (X = ai ) Xn X , n
loi
x R , fn (x) f (x) Xn X , n
loi
74 TD Statistique et probabilits
Si (Xn ) est une suite de v.a. indpendantes et de mme loi, admettant des moments
dordres un et deux nots m = E (Xn ) et 2 = V(Xn ), alors :
Xn m
n N (0, 1)
loi
an (Xn m) N (0, ) , n
loi
avec an et > 0, alors si g est une application relle drivable, la suite g (Xn )
converge aussi en loi avec :
- -
an g(Xn ) g(m) N 0, -g (m)- , n
loi
On dit que la suite de v.a. (Xn ) converge en moyenne dordre p, avec 0 < p < , vers
la v.a. X si :
On crit :
Xn X
Mp
qui est la somme de deux termes positifs, on retrouve les deux conditions suffi-
santes de convergence en probabilit (cf. exercice 7, page 76) comme conditions
ncessaires de convergence en moyenne quadratique :
E (Xn X) 0
Xn X
m.q. V(Xn X) 0
TD 5 Notions de convergence 75
3.2 Proprit
Pour toute valeur de p > 0, la convergence en moyenne dordre p est plus forte
que la convergence en probabilit, au sens o :
Xn X Xn X
Mp p
Donc, en particulier :
Xn X Xn X
m.q. p
Vrai Faux
1. Les majorants des probabilits dans les ingalits de Markov et
de Bienaym-Tchebychev ont des valeurs toujours infrieures 1.
gence en loi.
6. Si X est une v.a. de signe quelconque, telle que E |X|k existe pour k entier positif
fix, montrer que lingalit de Markov peut se gnraliser sous la forme suivante :
E|X|k
P (|X| )
k
76 TD Statistique et probabilits
7. Si (Xn ) est une suite de v.a. telle que E (Xn ) a et V(Xn ) 0 quand n ,
alors on en dduit aisment que cette suite converge en probabilit vers a, par
application de lingalit de Bienaym-Tchebychev. Montrer quen fait, on peut
noncer un rsultat plus gnral que celui-ci, qui tablit que E (Xn X) 0 et
V(Xn X) 0 sont des conditions suffisantes de convergence en probabilit de
la suite (Xn ) vers la v.a. X.
8. Si X suit une loi de Poisson de paramtre , tel que tend vers linfini, on
sait que (X ) / converge en loi vers une v.a. U de loi N (0, 1). (
On peut donc
)
approximer la probabilit P (X k) par P (Y k) o Y suit une loi N , , pour
tout entier k. Peut-on de la mme faon approximer P (X = k) par P (Y = k)?
9. Soit (Xn ) une suite de v.a. indpendantes qui suivent la mme loi de Cauchy,
1
symtrique par rapport lorigine, de densit f (x) = . Sachant que
1 + x2
1 n
Xn = Xi suit aussi une loi de Cauchy, peut-on en dduire de la loi des
n i=1 ( )
grands nombres la convergence en probabilit de la suite Xn ?
Ingalit de Bienaym-Tchebychev
Ingalit de Markov
11. Soit X1 , . . . , Xn des v.a. indpendantes et de mme loi que la v.a. X de densit :
e(x) si x
f (x) =
0 sinon
Convergence en probabilit
13. Soit X1 , . . . , Xn des v.a. indpendantes et de mme loi que la v.a. X de loi
normale N (0, ), o est un nombre rel positif donn. Montrer que la suite (Tn )
dfinie par :
1
n
Tn = |Xi |
n
i=1
1
n
Tn = |Xi |
n
i=1
15. Soit X1 , . . . , Xn des v.a. indpendantes et de mme loi N (0, 1). tudier, quand
n devient infini, la convergence en probabilit de la suite :
1 2
n
S2n = Xi
n
i=1
et en dduire la loi limite dune v.a. qui suit une loi de Student n degrs de libert.
Analyse
2 de lnonc et conseils. La loi des grands nombres sapplique la suite
Sn . En utilisant ce rsultat et la dfinition de la loi de Student on peut tablir quelle
converge vers la loi normale.
o est un nombre rel positif donn. tudier la convergence en loi de la suite (Tn )
de v.a. dfinie par :
1 (Xi )
n
Tn = e
n
i=1
Variance infinie
17. Soit (Xn ) une suite de v.a. mutuellement indpendantes dont la loi est dfinie
par :
1 1
P (Xn = 0) = 1 et P (Xn = n) = P (Xn = n) =
n 2n
18. Soit X1 , . . . , Xn des v.a. indpendantes et qui suivent la mme loi exponentielle
de paramtre > 0. tudier la convergence en loi de la suite (Tn ) de v.a. dfinie
par :
n
Tn =
n
Xi
i=1
Yn 0 Xn X
p p
La condition impose, qui scrit P (|X| l) 0,75, est quivalente P (|X| > l)
0,25 et lingalit de Bienaym-Tchebychev permet dobtenir pour tout l > 0 fix :
V(X)
P (|X| > l)
l2
En choisisssant l tel que V(X) 0,25l2 , la condition sera bien vrifie. Cela donne ici
l2 28/15, soit l 1,37. Comme X prend ses valeurs dans [1, 1], cest lintervalle
que lon retient, qui est de probabilit exacte gale 1, valeur qui est bien suprieure
0,75. Lapplication de lingalit de Bienaym-Tchebychev na donc pas permis
ici de rduire lintervalle demand, par rapport lensemble des valeurs possibles
TD 5 Notions de convergence 81
ayant not F la f.r. commune des v.a. Xi . La f.r. de la v.a. mn est donc dfinie par :
et sa densit par :
Il faut donc dterminer aussi la f.r. de X, qui est nulle pour x < , et qui a comme
valeur pour x :
x
x
F (x) = e(u) du = e(u) = 1 e(x)
g (x) = nen(x)
E (mn ) = n
+ +
1
= ueu du + nen(x) dx
n 0
ayant pos u = n (x ) dans la premire intgrale que lon calcule par une
intgration par parties. La seconde intgrale vaut 1 (on intgre la densit) et donc :
1
E (mn ) = +
n
On en conclut donc que :
1
E (|mn |) = E (mn ) = 0
n
82 TD Statistique et probabilits
mn
p
car les v.a. Di sont indpendantes et de mme loi, de f.r. F dfinie par F (x) = 0
pour x 0, et pour 0 x t :
x
du x
F (x) = =
0 t t
avec F (x) = 1 pour x t. On peut donc calculer, pour tout > 0 fix, la probabilit :
Mn t
p
1
n
1
V(Tn ) = V (|Xi |) = V (|X|)
n2 n
i=1
TD 5 Notions de convergence 83
2
V (|X|) = E |X|2 E2 (|X|) = 2 2
car E |X|2 = E X2 = V (X) = 2 . Ainsi :
2 2
V(Tn ) = 1 0
n
et V (|X|) = 1/2 . La v.a. Tn tant la moyenne des v.a. |Xi | indpendantes, la loi des
grands nombres permet dobtenir :
1
Tn
p
S2n 1
p
On sait par ailleurs que la v.a. Yn = nS2n suit une loi du khi-deux n degrs de libert,
comme somme de n carrs de v.a. indpendantes, de mme loi normale centre-
rduite. Si U est une v.a. de loi N (0, 1) indpendante
de Yn , on sait galement par
dfinition de la loi de Student que la v.a. Tn = U/ Yn /n suit une loi de Student n
degrs de libert. Le numrateur est indpendant de n et nous venons de voir que
le terme sous le radical converge en probabilit vers 1. Daprs une proprit du
cours, le rapport se comporte donc comme le numrateur, cest--dire que cette loi
de Student converge vers la loi N (0, 1), ce que lon peut crire sous la forme :
Tn N (0, 1)
loi
84 TD Statistique et probabilits
probabilit nulle pour y 0 et qui a pour valeur, obtenue par passage au logarithme
pour y > 0 :
G y = P (X ) < ln y = P X > ln y = 1 F ln y
o F est la f.r. de X. La densit est donc nulle pour y 0 et a pour valeur, pour
y>0:
1
g y = f ln y = ey
y
qui est la densit dune loi exponentielle ou loi (1). Daprs le cours, ses moments
sont donc E (Y) = V(Y) = 1 et le thorme central limite permet donc dobtenir :
n (Tn 1) N (0, 1)
loi
Xn 1/
n N (0, 1)
1/ loi
les plus frquents sont la moyenne et la variance de la loi, qui sont respectivement estims
par la moyenne et la variance empiriques. Dans le cas o il ny a pas destimateur vident,
on en cherche un par la mthode du maximum de vraisemblance, qui consiste maxi-
miser la densit de lchantillon, ou par la mthode des moments, qui consiste galer
moment thorique et moment empirique correspondant.
bn () = E (Tn )
Dfinitions. Un estimateur Tn de est dit sans biais si pour tout de et tout entier
positif n :
E (Tn ) =
E (Tn ) quand n
P (|Tn | > ) 0
Dans le cas particulier dun estimateur sans biais, cette erreur quadratique se
confond avec la variance de lestimateur. Si dans lerreur totale destimation on
privilgie lerreur structurelle, mesure par b2n (), on fera le choix dun estimateur
sans biais et lerreur destimation se rduira lerreur statistique mesure par
la variance de lestimateur. Si on se place donc dornavant dans la classe des
estimateurs sans biais, on pourra comparer deux estimateurs Tn et Tn de cette classe
par leur variance, qui mesure alors leur dispersion par rapport au paramtre, qui
est leur esprance commune. Nous dirons que lestimateur Tn est plus efficace que
Tn si pour tout de et pour une taille dchantillon n > N :
V (Tn ) V Tn
Ingalit de Frchet-Darmois-Cramer-Rao
Dfinitions. On appelle vraisemblance (likelihood) de lchantillon (X1 , . . . , Xn ) la
loi de probabilit de ce n-uple, note L (x1 , . . . , xn ; ), et dfinie par :
n
L (x1 , . . . , xn ; ) = P (Xi = xi |)
i=1
Estimateur efficace
Dfinition. Un estimateur sans biais Tn est dit efficace si sa variance est gale la
borne infrieure de FDCR :
1
V (Tn ) =
In ()
88 TD Statistique et probabilits
L
=0
2L
qui vrifie aussi < 0. Cependant, la vraisemblance se calculant partir dun
2
produit, on prfre remplacer ce dernier problme par le problme quivalent pour
la log-vraisemblance :
ln L
=0
2 ln L
avec < 0.
2
1
n
Xn = Xi
n
i=1
1
n
2
S 2
n = Xi Xn
n
i=1
TD 6 Estimation ponctuelle 89
(la variance empirique modifie S2n est obtenue en divisant par n 1 au lieu de n).
Plus gnralement, si lun des moments dordre k N , non centr mk = E Xk =
mk (), ou centr k = E (X m1 )k = k (), dpend de , nous allons chercher un
estimateur par rsolution de lquation en obtenue en galant moment thorique
et moment empirique correspondant, soit :
1 k 1
n n
k
mkn = Xi = mk () ou kn = Xi Xn = k ()
n n
i=1 i=1
La solution de lquation retenue, si elle existe et est unique, sera appele estimateur
obtenu par la mthode des moments.
Vrai Faux
ne peut pas tre un estimateur sans biais de lcart type dune loi.
10. partir de deux estimateurs T1 et T2 du paramtre , sans biais et indpen-
dants, on construit lestimateur T3 = T1 + (1 ) T2 , o ]0, 1[. Dterminer
, en fonction des variances V1 = V(T1 ) et V2 = V(T2 ), de faon que T3 soit un
estimateur sans biais de variance minimale. Les estimateurs T1 et T2 peuvent-ils
tre efficaces tous les deux?
Loi de Poisson
12. Le nombre daccidents mortels par mois, un carrefour dangereux, est une v.a.
X qui suit une loi de Poisson de paramtre , que lon cherche estimer partir dun
chantillon X1 , . . . , Xn de cette loi. tudier les proprits de lestimateur naturel de
ce paramtre et vrifier que cest aussi lestimateur du maximum de vraisemblance.
13. Chaque jour ouvrable, le nombre de clients qui entrent dans un grand magasin
est une v.a. X qui suit une loi de Poisson de paramtre connu. Une fois entr, il y
a une probabilit p quun client fasse des achats pour un montant suprieur 1 000
francs. Pour pouvoir estimer p on dispose dun chantillon sur n jours ouvrables
de v.a. Y1 , . . . , Yn de mme loi que la v.a. Y, qui reprsente le nombre journalier
de clients ayant effectu plus de 1 000 francs dachats. Proposer un estimateur
de p, tudier ses proprits et donner une estimation partir de lobservation
100
i=1 yi = 360, sachant que = 18.
k
P (X = k) =
(1 + )k+1
Loi de Pareto
15. Soit X une v.a. qui suit une loi de Pareto de densit :
1 si x 1
f (x) = x
0 sinon
Loi uniforme
16. Soit X1 , . . . , Xn un chantillon dune v.a. X qui suit une loi uniforme sur
lintervalle [0, ], o est un paramtre positif inconnu. On demande de dterminer
un estimateur sans biais de construit partir de lemv et de comparer sa variance
la quantit 1/In ().
Analyse de lnonc et conseils. On remarque ici que lensemble des valeurs possibles
pour la variable dpend du paramtre estimer et donc que les conditions de lingalit
FDCR ne sont pas remplies. Par ailleurs, lexpression de la vraisemblance ne permet
pas de dterminer lemv par ltude des drives et il faut donc rsoudre directement
ce problme de la recherche du maximum.
Comparaison destimateurs
17. Soit X une v.a. qui suit une loi normale desprance et de variance (1) o
est un paramtre inconnu tel que 0 < < 1. partir dun chantillon X1 , . . . , Xn
de cette loi, on construit les estimateurs :
1 1 2
n n
Tn = Xi et Sn = Xi
n n
i=1 i=1
1 Vrai. Pour toute loi qui admet une esprance, la moyenne Xn de lchantillon
est un estimateur sans biais de E (X).
2 Faux. Si S et T sont deux estimateurs sans biais dun mme paramtre, S + T
ne sera aussi sans biais que si + = 1.
3 Faux. La variance empirique S 2n est seulement un estimateur asymptotique-
ment sans biais de la variance dune loi. Pour obtenir un estimateur sans biais, il
2
faut diviser ni=1 Xi Xn par le nombre de variables indpendantes, soit n 1,
et
non pas par le nombre n de termes. En effet, ces variables sont lies par la relation
n
i=1 Xi Xn = 0.
loi uniforme sur [0, ] la moyenne Xn dun chantillon de cette loi, on a bien
V(Xn ) = 2 /12n
qui tend vers zro, mais cet estimateur ne converge pas vers
puisque E Xn = /2. Pour que lnonc soit vrai, il faut ajouter la condition dtre
un estimateur sans biais, ou asymptotiquement sans biais.
5 Faux. Lnonc est vrai si lon se restreint la classe des estimateurs sans
biais. Mais si lon utilise comme critre gnral de comparaison entre estima-
teurs lerreur quadratique moyenne, on peut trouver un estimateur avec biais
meilleur quun estimateur efficace. Par exemple, pour la loi N (0, ), lestimateur
1 n
2n = X2 est efficace, avec EQ 2n = V 2n = 24 /n. Mais lestimateur
n i=1 i
1 n 24
biais Tn = i=1 Xi a une erreur quadratique EQ (Tn ) =
2
plus petite
n+2 n+2
que celle de 2n .
94 TD Statistique et probabilits
-dire que E S2n = 2 . Si Sn tait un estimateur sans biais de , on aurait donc
E (Sn ) = . La variance de cet estimateur serait alors V(Sn ) = E S2n E2 (Sn ) =
2 2 = 0, ce qui est impossible.
10 Il est facile de vrifier que lestimateur T3 est sans biais. Les estimateurs T1
et T2 tant indpendants, sa variance est :
V3 = V(T3 ) = 2 V1 + (1 )2 V2
1 n
1
n
E (Fn ) = E Xn = E (Xi ) = p=p
n n
i=1 i=1
Xn E (X) = p
p
Pour dmontrer quil est galement efficace pour ce paramtre, nous allons dter-
miner la vraisemblance partir de la densit de la loi de Bernoulli, qui peut scrire
1x
P (X = x) = px 1 p avec x = 0 ou 1, soit :
n n n ni=1 xi
L x1 , . . . , xn ; p = P (Xi = xi ) = p i=1 xi 1 p
i=1
TD 6 Estimation ponctuelle 95
De drive :
n
n xi
1
n
ln L i=1
= xi
p p 1p
i=1
2 n E (Xi )
1
n
ln L i=1
In p = E = E (Xi ) + 2
p2 p2 1p
i=1
np n np n
= + 2 =
p2 1p p 1 p
2 = 0
m
do :
+ 1
= = =
n m n+m N
n m
/
pn+m = Fn + Gm
N N
Ce nest autre que la frquence empirique de lchantillon global, obtenu par
runion des deux chantillons partiels indpendants. Cest lestimateur efficace,
de variance minimale :
p 1p
pn+m ) =
V(/
N
1
n
Xn = Xi
n
i=1
On vrifie que cet estimateur est sans biais, daprs les proprits de linarit de
lesprance :
1 n
1
n
E Xn = E (Xi ) = =
n n
i=1 i=1
Xn = E (X)
p
1 1
n n
V(Xn ) = V(Xi ) = = 0
n2 n2 n
i=1 i=1
TD 6 Estimation ponctuelle 97
Nous allons maintenant tablir quil est efficace en calculant la quantit dinfor-
mation de Fisher partir de la vraisemblance :
n
n
i=1 xi
L (x1 , . . . , xn ; ) = e
n
xi !
i=1
Do la log-vraisemblance :
n
n
ln L (x1 , . . . , xn ; ) = n + xi ln ln (xi !)
i=1 i=1
et sa drive premire :
1
n
ln L
= n + xi
i=1
1
n
2 ln L
= xi
2 2
i=1
pour calculer :
2
1
n
ln L n n
In () = E = E (Xi ) = 2 =
2 2
i=1
Son inverse est la borne FDCR, gale ici la variance de Xn qui est donc un
estimateur efficace du paramtre . La drive de ln L sannule pour = Xn et
comme dautre part la drive seconde est toujours ngative, on tablit ainsi quil
sagit de lexpression de lestimateur du maximum de vraisemblance de .
13 Lorsque X = x, chacun des x clients entrs effectue des achats dun montant
suprieur 1 000 F avec une probabilit p, donc la loi de Y, conditionnellement
X = x, est une loi binmiale de paramtres x et p. La loi du couple (X, Y) se
dtermine donc par :
Dunod. La photocopie non autorise est un dlit.
x x y xy
P X = x, Y = y = P (X = x) P Y = y|X = x = e p 1p
x! y
y xy
p 1 p
= e
y! x y !
pour x et y entiers tels que 0 y x. On obtient la loi marginale de Y par
sommation de cette loi du couple :
y
p
1 p xy
P Y=y = P X = x, Y = y = e
x=y
y! x=y xy !
y y
p (1p) p p
=e e =e
y! y!
98 TD Statistique et probabilits
Ce qui montre que Y suit une loi de Poisson de paramtre p. Les rsultats
de lexercice prcdent permettent daffirmer que / pn = Yn / est un estimateur
pn ) = p/n. On obtient comme
sans biais, convergent et efficace, de variance V(/
estimation /p100 = 3,6/18 = 0,2.
14 La vraisemblance a pour expression :
n
n
i=1 xi
L (x1 , . . . , xn ; ) = P (Xi = xi ) = n
i=1 (1 + )n+ i=1 xi
et la log-vraisemblance :
n
n
ln L (x1 , . . . , xn ; ) = xi ln n + xi ln (1 + )
i=1 i=1
Sa drive est :
n
n+ xi
1
n
ln L i=1
= xi
1+
i=1
n
qui sannule pour = i=1 xi /n = x. tudions la drive seconde :
n
xi n+
1
n
2 ln L i=1
= 2 xi +
2 (1 + )2
i=1
qui a comme valeur n/x (1 + x) < 0 pour = x qui correspond donc bien un
maximum. Lemv est par consquent la moyenne empirique :
1
n
/
n = Xn = Xi
n
i=1
Nous allons dailleurs voir que le paramtre est ici la moyenne de la loi :
k1
k
E (X) = k = k
(1 + )k+1 (1 + )2 k=1 1+
k=0
quantit qui se calcule partir de la somme de la srie gomtrique k=0 x =
k
1/ (1 x) pour |x| < 1, et de sa drive k=1 kxk1
= 1/ (1 x) . La valeur de la
2
E (X) = (1 + )2 =
(1 + )2
n+ E (Xi )
1
n
2 ln L i=1 n n n
In () = E = 2 E (Xi ) = =
2 (1 + ) 2 1+ (1 + )
i=1
quantit qui nest dfinie que pour > 2. Si cette condition est ralise, on obtient :
1
E (X) =
2
On voit ainsi que le paramtre na pas dinterprtation simple en terme de moment.
On calcule donc la vraisemblance pour dterminer lemv :
Dunod. La photocopie non autorise est un dlit.
n
L (x1 , . . . , xn ; ) = ( 1)n x
i avec min xi 1
i=1
ln L n n
= ln xi
1
i=1
2 ln L n
=
2
( 1)2
100 TD Statistique et probabilits
La drive premire sannule pour = 1 + n/ ni=1 ln xi , avec une drive seconde
ngative, et il sagit donc bien dun maximum. Lemv est donc dfini par :
n
/
n = 1 +
n
ln Xi
i=1
Il est de la forme /
n = 1 + 1/Yn , ayant pos Yi = ln Xi pour 1 i n. Pour savoir si
on peut appliquer la loi des grands nombres Yn , nous allons calculer lesprance
de Y = ln X :
+ + +
1
E ln X = ( 1) x ln x dx = x+1 ln x 1 + x dx =
1 1 1
avec F (x) = 0 pour x < 1. Ainsi, pour y < 0, on a G y = 0 et pour y 0 :
G( y) = 1 e(1)y . La v.a. Y est donc positive, de densit ( 1) e(1)y , et on
reconnat une loi exponentielle de paramtre 1. On retrouve bien la valeur de
lesprance, la variance tant :
1
V(Y) =
( 1)2
1
Yn E (Y) =
p 1
1
n = 1 +
/ 1 + ( 1) =
Yn p
Notons que cet estimateur aurait pu aussi tre obtenu par la mthode des moments,
applique la loi de Y. En effet, lquation :
1
E (Y) = = Yn
1
Mn = max {X1 , . . . , Xn }
0 max xi
Figure 6.1
n
n
G (x) = P (Mn < x) = P (Xi < x) = P (Xi < x) = Fn (x)
i=1 i=1
donc cet estimateur est seulement asymptotiquement sans biais. Lestimateur sans
biais est :
n+1
Tn = Mn
n
Pour calculer sa variance, nous avons besoin de :
+ n+1
x n 2
E M2n = x2 g (x) dx = n dx =
0 n n + 2
Do on dduit :
n
V(Mn ) = E M2n E2 (Mn ) = 2
(n + 2) (n + 1)2
et enfin :
2
V(Tn ) =
n (n + 2)
Lensemble des valeurs prises par la variable est ici E = X () = [0, ], qui dpend
du paramtre ; donc pour calculer la quantit dinformation de Fisher, on doit
utiliser la premire formule fournie par la dfinition :
ln L 2
In () = E
La log-vraisemblance a ici comme expression ln L = n ln , de drive n/ pour
Mn , do :
n2
In () =
2
Si on compare la variance de lestimateur sans biais Tn et la quantit 1/In (), on
observe que :
2 2 1
V(Tn ) = < 2 =
n (n + 2) n In ()
Cependant, ce majorant nest pas une borne infrieure pour la variance des estima-
teurs sans biais, puisque les conditions de lingalit FDCR ne sont pas remplies. Il
nest donc pas anormal de trouver un estimateur sans biais de variance plus petite
que cette quantit.
V(X )2 = E (X )4 E2 (X )2 = 22 (1 )2
V(Sn )
= 2 (1 + )
V(Tn )
Tn = 3Xn 3E (X) =
p
La question de lefficacit ne se pose pas ici car X prend ses valeurs dans lintervalle
[0, ], qui dpend du paramtre de la loi ; donc les conditions de lingalit FDCR
ne sont pas remplies.
Estimation
par intervalle
de confiance 7
Afin de juger de la prcision du rsultat dun problme destimation, nous allons associer
un chantillon dune loi inconnue un ensemble de valeurs, et non plus une valeur unique.
Ces valeurs constituent gnralement un intervalle inclus dans lensemble des valeurs
possibles pour le paramtre. La dtermination de cet intervalle, dit de confiance, seffectue
par la donne de la probabilit, dnomme niveau de confiance, que la vraie valeur du
paramtre appartienne cet intervalle.
que :
P {t1 () Tn t2 ()} = 1
Il faut ensuite inverser cet intervalle pour Tn afin dobtenir un intervalle pour
, dont les bornes vont dpendre de lestimateur Tn , cest--dire dterminer les
valeurs a = a (Tn ) et b = b (Tn ) telles que :
P {a (Tn ) b (Tn )} = 1
Ainsi, [a (Tn ) , b (Tn )] est un intervalle de confiance de niveau 1 pour le paramtre
. Il sobtient en dterminant lensemble des valeurs de pour lesquelles on a
simultanment, pour Tn fix :
t1 () Tn et Tn t2 ()
106 TD Statistique et probabilits
Si par exemple ces deux fonctions sont croissantes, on voit sur la figure 7.1 que :
t1 () Tn t1
1 (Tn ) et Tn t2 () t1
2 (Tn )
Tn
t2 () t1 ()
Tn
a(Tn ) = t1
2 (Tn ) b(Tn ) = t1
1 (Tn )
Figure 7.1
Lintervalle est facile obtenir ici car les fonctions t1 et t2 sont inversibles :
t1 () Tn t2 () a (Tn ) = t1 1
2 (Tn ) t1 (Tn ) = b (Tn )
Le risque total = P (Tn < t1 ) + P (Tn > t2 ) peut tre a priori rparti de multiples
faons. Posons 1 = P { > b (Tn )} et 2 = P { < a (Tn )} ; les diffrents choix
possibles sont les suivants.
Intervalle unilatral (1 2 = 0)
droite : 1 = 0, 2 =
Cest linterprtation donne au paramtre qui conduit un intervalle de la forme
> a (Tn ).
gauche : 1 = , 2 = 0
Linterprtation du paramtre peut galement conduire un intervalle de la
forme < b(Tn ).
TD 7 Estimation par intervalle de confiance 107
pn
1 t2 (p) t1 (p)
pn
0 intervalle pour p 1 p
Figure 7.2
pq
Lestimateur sans biais de 2 , bas sur lchantillon (X1 , . . . , Xn ) de cette loi N (m, )
o m est connu est :
1
n
/
2n = (Xi m)2
n
i=1
Quand le second paramtre m de la loi normale est inconnu, lestimateur sans biais
de 2 quil faut retenir est :
1
n
2
S2n = Xi Xn
n1
i=1
Dunod. La photocopie non autorise est un dlit.
L encore, il ny a quune
seule
contrainte
pour dterminer
les valeurs de a et b. Si
nous posons 1 = P 2n1 < a et 2 = P 2n1 > b , la contrainte est 1 + 2 = .
110 TD Statistique et probabilits
Vrai Faux
1. On peut toujours trouver un intervalle de confiance qui contient
le paramtre avec une probabilit gale 1.
2. un estimateur donn du paramtre, de loi connue, on peut
associer une infinit dintervalles de confiance de mme niveau de
confiance donn.
3. La frquence empirique fn permet de construire un intervalle
de confiance pour le paramtre dune loi de Bernoulli, de niveau
exact 1 , avec 0 < < 1.
4. Cest pour une proportion p voisine de 50 % que lestimation
de ce paramtre est la plus imprcise.
5. Pour un niveau de confiance donn, lintervalle pour la
moyenne dune loi normale dcart type connu est de longueur
minimale si on le choisit symtrique.
6. Pour un niveau de confiance donn et une taille dchantillon
donne, la longueur dun intervalle bilatral symtrique est fixe.
7. Un intervalle de confiance pour une moyenne a une longueur
fixe pour un niveau donn et une taille dchantillon n donne,
cette longueur tendant vers zro avec 1/n.
Si on admet que son chiffre daffaires quotidien peut tre reprsent par une v.a. X
de loi normale, desprance m et dcart type inconnus, donner un intervalle de
confiance de niveau 0,95 pour le paramtre m. Obtient-on le mme intervalle si
est connu, de valeur = 300?
12. Sur 100 personnes interroges, 51 dclarent quelles voteront pour le can-
didat D. Magog aux prochaines lections prsidentielles. Donner un intervalle
de confiance de niveau 0,95 pour la proportion p dintentions de vote pour ce
candidat, dans la population. Mme question si ce sondage a t effectu auprs
dun chantillon de 1 000 personnes. Combien aurait-il fallu interroger dlecteurs
pour que le rsultat soit fourni 2 % prs?
Analyse de lnonc et conseils. Lintervalle pour p peut tre dtermin par simple
lecture de labaque 2, page 204, ou par lapproximation normale puisque la taille de
Dunod. La photocopie non autorise est un dlit.
14. On a effectu 25 peses dun objet, avec une balance dont la prcision est
mesure par lcart type = 1. La totalisation de ces peses tant de 30,25 g,
donner un intervalle de confiance de niveau 0,90 pour le poids de cet objet.
Analyse de lnonc et conseils. Le rsultat dune pese peut tre considr comme
une v.a. qui suit une loi normale dont la moyenne est gale au vrai poids de lobjet
et dont lcart type est la caractristique de prcision fournie par le constructeur de la
balance. On est alors ramen au problme classique de lintervalle de confiance pour la
moyenne dune loi normale dcart type connu.
16. Pour estimer la prcision dun thermomtre, on ralise n = 100 mesures ind-
pendantes de la temprature dun liquide maintenu une temprature constante
de 20 degrs Celsius. Les observations xi , 1 i 100, ayant conduit la valeur
100 2
i=1 xi = 40 011, construire un intervalle de confiance de niveau 0,95 pour la
prcision de ce thermomtre, mesure par la dispersion 2 des mesures.
17. Afin de vrifier la rgularit des horaires des bus, la RATP a effectu 71 relevs
des carts en secondes constats entre larrive des bus un arrt et lhoraire moyen
constat. Lestimation sans biais du paramtre 2 obtenue a t de 5 100. En dduire
un intervalle de confiance de niveau 0,95 pour cette mesure de la rgularit des
horaires.
Loi de Poisson
18. Le nombre dinterruptions du trafic de plus dune minute, dans une journe,
sur la ligne A du RER, est suppos suivre une loi de Poisson de paramtre inconnu,
que lon se propose destimer partir du relev de ces interruptions sur 200
journes. Les moments empiriques calculs sur cet chantillon ont pour valeurs
x200 = 3 et s2200 = 3,2. En dduire un intervalle de confiance de niveau 0,95 pour le
paramtre de cette loi de Poisson.
19. Soit X une v.a. de loi normale N (0, ) o est un paramtre rel strictement
Dunod. La photocopie non autorise est un dlit.
positif, que lon se propose destimer partir dun chantillon (X1 , . . . , Xn ) de cette
loi. Construire, partir de :
1
n
Dn = |Xi |
n
i=1
Loi exponentielle
20. La dure de vie dun certain matriel lectronique est une v.a. X de loi
exponentielle de paramtre > 0 et (X1 , . . . , Xn ) est un chantillon de cette loi.
Dterminer, par la mthode des moments, un estimateur sans biais de et montrer
quil est convergent. Construire un intervalle de confiance de niveau 0,95 pour
partir dun chantillon o on a observ une moyenne empirique x100 = 0,79.
Loi de Pareto
1 Vrai. Il suffit de le choisir suffisamment grand. Sil sagit dune proportion, elle
est contenue dans [0, 1] avec une probabilit gale 1. Si le paramtre est positif,
lintervalle [0, +[ le contient avec une probabilit gale 1.
4 Vrai. La frquence
empirique fn qui est lestimateur de p a une variance pro-
portionnelle p 1 p , produit de deux termes dont la somme est constante et qui
est maximal quand ils sont gaux, soit p = 0,5. Cest donc au voisinage de cette
valeur que lintervalle de confiance sera de longueur maximum.
male.
6 Faux. Si la loi de lestimateur dpend dun autre paramtre inconnu quil faut
estimer, cette longueur peut tre une variable alatoire, comme dans le cas de
lintervalle de confiance pour la moyenne dune loi normale dcart type inconnu.
paramtre voisin de 0,5 alors que manifestement ici il est proche de zro ! Rappelons
dautre
part que lapproximation normale nest considre comme justifie que
si np 1 p 3, donc il faudrait que p soit suprieur ici 4 %. Il faut donc
avoir recours labaque 2, page 204, qui va fournir lintervalle le plus exact, soit
0 < p < 0,04. Cependant, si on ne dispose pas de cet abaque, on peut quand mme
partir de lapproximation normale donnant lintervalle symtrique :
/
pn p
P a < n <a =1
pq
avec ici /
p100 = 0. Mais on nutilisera pas la seconde approximation de p par /
p100
au dnominateur puisque cette valeur est nulle. Pour 1 = 0,95 on lit a = 1,96
donc on est amen rsoudre les ingalits :
p
1,96 < n < 1,96
pq
1,962
0<p< = 0,04
n + 1,962
10 On applique la formule donne dans les rappels de cours avec x30 = 2 000
et s = 300, la table 6 donnant comme fractile dordre 0,975 de la loi de Student
29 degrs de libert la valeur t = 2,045. Lintervalle de confiance obtenu est
donc 1 888 < m < 2 112. Lestimation de tant exactement gale la valeur
de ce paramtre, on aurait pu penser que lintervalle ne serait pas modifi. Mais
lapplication des formules du cours dans le cas o est connu, avec comme fractile
dordre 0,975 de la loi normale u = 1,96, conduit lintervalle 1 893 < m < 2 107.
Sa longueur est 214, lgrement infrieure celle, 224, de lintervalle prcdent.
Ainsi, mme dans le cas dune estimation sans erreur, le fait destimer un paramtre
inconnu fait perdre de linformation et donc fournit un intervalle moins prcis.
TD 7 Estimation par intervalle de confiance 117
11 Si X est la v.a. qui reprsente la dpense consacre aux loisirs, de loi suppose
normale N (m, ), on ne dispose pas ici de 1 000 observations de cette variable, mais
seulement de lchantillon des moyennes empiriques Mj , 1 j 5, cest--dire
( )
dune v.a. M qui suit une loi N m, / 200 . Lintervalle de confiance pour m est
donc bas sur la statistique 5 M5 m /S5 qui suit une loi de Student quatre
degrs de libert. Il est donc de la forme :
S5 S5
M5 t < m < M5 + t
5 5
o t est le fractile dordre 0,975 de la loi T4 lu dans la table 6, page 200, soit
t = 2,776. Lintervalle obtenu est donc 282 < m < 320. Lamplitude assez leve
de cet intervalle, malgr une taille dchantillon importante, sexplique par une
grande dispersion du caractre mesur dans les cinq groupes, qui paraissent assez
dissemblables quant leur comportement vis--vis des loisirs.
14 On peut considrer que la valeur indique par la balance est une v.a. X de
loi normale, desprance m gale au poids rel de lobjet et dcart type = 1. Le
fractile dordre 0,95 de la loi normale tant u = 1,644 9, lobservation 25 i=1 xi =
30,25 conduit lestimation ponctuelle x25 = 1,21 puis lintervalle de confiance
0,88 < m < 1,54. Compte tenu du petit nombre de mesures et de la valeur leve
de lcart type, cet intervalle est peu prcis.
118 TD Statistique et probabilits
soit t = 2,37 et lintervalle m < 165. Il y a donc 99 chances sur 100 que cette publicit
soit mensongre.
16 On obtient comme estimation de la variance :
1 2
100
2100 =
/ xi m2 = 0,11
100
i=1
Les fractiles dordre 0,025 et 0,975 de la loi du khi-deux 100 degrs de libert, lus
dans la table 5, page 199, sont respectivement a = 74,22 et b = 129,56, do
lintervalle bilatral symtrique 0,08 < 2 < 0,15. Si on retient un intervalle
unilatral gauche, le fractile dordre 0,05 est a = 77,93, ce qui donne comme
intervalle 2 < 0,14.
17 Pour un intervalle de confiance bilatral symtrique, on relve dans la table 5
les fractiles dordres respectifs 0,025 et 0,975 70 degrs de libert a = 48,76 et
b = 95,02, do 3 757 < 2 < 7 322. Pour un intervalle unilatral gauche, le
fractile dordre 0,05 est a = 51,74, ce qui donne comme intervalle 2 < 6 900.
18 Daprs le thorme central limite, lestimateur du paramtre , centr et
rduit, converge en loi vers la loi normale centre et rduite :
Xn
n N (0, 1)
loi
Les inquations que lon peut en dduire sexprimant en fonction de et ,
on remplace le paramtre au dnominateur par son estimateur et lintervalle de
confiance bilatral symtrique se dduit de la condition :
Xn
P u < n 3 < u = 0,95
Xn
o on retient comme valeur approche de u le fractile dordre 0,975 de la loi N (0, 1),
soit u = 1,96. Lintervalle obtenu est alors :
0 0 0 0
Xn Xn Xn Xn
u < Xn < u Xn u < < Xn + u
n n n n
en prenant pour valeur approche de u le fractile dordre 0,975 de la loi N (0, 1),
soit u = 1,96. La rsolution de cette double ingalit conduit :
. .
2 2
u < Tn < u
2n 2n
. .
2 2
1u < Tn < 1 + u
2n 2n
120 TD Statistique et probabilits
Tn Tn
3 << 3
1 + u ( 2) /2n 1 u ( 2) /2n
Soit, pour cet chantillon, lintervalle de confiance : 1,16 < < 1,56.
Cet estimateur est asymptotiquement sans biais, lestimateur sans biais tant :
n 1/ n1
Tn = n =
n Sn
(n 2) 2
= 2 =
(n) (n 1) (n 2)
qui tend vers zro quand n devient infini. Donc, Tn converge en moyenne qua-
dratique vers , puisquil est sans biais. La loi de Tn nest pas une loi tabule qui
permet de construire un intervalle de confiance, donc on utilise la loi asymptotique
dduite du thorme central limite :
Xn 1/
n N (0, 1)
1/ loi
car, pour la loi exponentielle E (), V (X) = 1/2 . Pour obtenir la loi asymptotique
de /n = 1/Xn on applique le rsultat relatif la loi limite dune suite image vue
TD 7 Estimation par intervalle de confiance 121
- -
n = g Xn et g (x) = 1/x, soit g (x) = 1/x2 et -g (1/)- = 2 ,
au chapitre 5, avec /
do :
/n
n N (0, 1)
loi
n 1/ n1
Le rsultat est le mme pour Tn = n puisque tend vers 1 quand n
n n
devient infini. On obtient donc un intervalle de confiance bilatral symtrique pour
partir de la condition :
Tn
P u < n < u = 0,95
Tn Tn
u < Tn < u <<
n n 1 + u/ n 1 u/ n
pour x . La f.r. de mn est donc aussi nulle pour x < et dfinie par :
Dunod. La photocopie non autorise est un dlit.
G (x ; ) = 1 en(x)
partir du rapport des vraisemblances associes chacune des deux valeurs possibles du
paramtre.
Dfinitions. Lerreur de premire espce consiste dcider D1 alors que H0 est vraie,
soit rejeter tort lhypothse nulle H0 . Lerreur de seconde espce consiste dcider
D0 alors que H1 est vraie, soit accepter tort lhypothse nulle H0 .
2. Mthode de Bayes
D0 D1
H0 p0 C00 C01
H1 p1 C10 C11
p0 L0 p1 L1
0 = et 1 =
p0 L0 + p1 L1 p0 L0 + p1 L1
Privilgier lhypothse nulle revient considrer que lerreur la plus grave consiste
la rejeter tort. La mthode de Neyman et Pearson fixe un seuil maximum 0 au
risque de premire espce et le test est alors dtermin par la recherche de la rgle
qui minimise lautre risque de seconde espce.
Dfinition. On appelle puissance dun test la probabilit de refuser H0 avec raison,
cest--dire lorsque H1 est vrifie, soit :
Une hypothse est qualifie de simple si la loi de la v.a. X est totalement spcifie
quand cette hypothse est ralise. Dans le cas contraire, elle est dite multiple. Nous
allons examiner le cas o le paramtre ne peut prendre que deux valeurs 0 et 1 ,
ce qui correspond au choix entre les deux hypothses simples suivantes :
Dunod. La photocopie non autorise est un dlit.
H0 : = 0
H1 : = 1
Nous allons seulement considrer le cas dune hypothse simple contre une hypo-
thse multiple de la forme suivante :
H0 : = 0
H1 : = 0
Tn > k.
4. Tests du khi-deux
4.1 Test dindpendance
Pour tester lhypothse nulle quune v.a. X admet pour fonction de rpartition
une fonction donne F, on utilise un n chantillon de la loi de X. Si la loi
est discrte, avec k valeurs possibles de probabilits pi = P (X = xi ), ou si les
observations continues ont t rparties en k classes disjointes (ai , ai+1 ), avec cette
fois pi = P {X (ai , ai+1 )} = F (ai+1 )F (ai ), on compare cette distribution thorique
avec la distribution empirique dfinie par les valeurs ni /n, o ni est le nombre
dobservations xi ou appartenant la classe (ai , ai+1 ). On utilise comme distance
entre ces deux distributions la statistique :
k
2
k
ni npi n2i
Dn = = n
npi npi
i=1 i=1
Vrai Faux
1. Pour un problme de test donn, choisir une valeur importante
de la probabilit a priori p0 de lhypothse nulle dans la mthode
de Bayes est quivalent choisir une valeur faible du risque de
premire espce dans la mthode de Neyman et Pearson.
2. Les deux hypothses dun test de Neyman et Pearson jouent
des rles symtriques.
3. Le risque de seconde espce est toujours plus grand que le
risque de premire espce .
4. Sans information a priori, chacune des deux hypothses peut
indiffremment tre choisie comme hypothse nulle, dans un test
de risque de premire espce fix .
128 TD Statistique et probabilits
Vrai Faux
5. Dans le cas dun test entre deux hypothses simples, on peut
toujours calculer sa puissance.
6. Dans le cas dun test entre deux hypothses simples, on peut
toujours trouver un test de risque de premire espce fix .
7. Si on intervertit les deux hypothses simples dun test, la
conclusion au vu du mme chantillon peut tre change.
Mthode de Bayes
10. Un magasin propose aux acheteurs dun tlviseur de souscrire pour 300 F
une garantie complmentaire de cinq ans pour le remplacement du tube-image,
dune valeur de 2 500 F. On sait par ailleurs que 80 % de ces tlviseurs sont
fabriqus en Asie et que la probabilit de dfaillance du tube-image est alors
p = 0,15. Le reste des appareils est fabriqu en Europe, avec dans ce cas p = 0,05.
En interrogeant vingt anciens acheteurs, on apprend que deux dentre eux ont eu
changer leur tube dans les cinq ans qui ont suivi leur achat. Cette information
TD 8 Thorie des tests 129
11. Une entreprise possde cinq photocopieuses sur lesquelles neuf interventions
ont t ncessaires lanne prcdente, avec un cot moyen par intervention de
1 000 F. Une socit lui propose un contrat dentretien de 2 400 F par an et par
machine. Le nombre annuel de pannes est suppos suivre une loi de Poisson de
paramtre . Pour le quart des machines produites la valeur du paramtre est = 3.
Une amlioration du procd de fabrication a permis dobtenir ensuite = 1 pour
la production des trois quarts restants. Compte tenu de ces informations, quelle
sera la dcision de lentreprise?
13. Entre les deux tours de llection prsidentielle, le candidat D. Magog com-
mande un sondage une socit spcialise pour connatre ses chances dtre lu.
Si p est la proportion dlecteurs qui ont lintention de voter pour lui, cette socit
est conduite effectuer le test entre les hypothses simples suivantes :
H0 : p = 0,48
H1 : p = 0,52
a) Indiquer le sens que lon peut accorder ce choix dhypothse nulle et dter-
miner la rgion critique du test de risque de premire espce = 0,10 dans le cas
dun sondage ralis auprs de n = 100 lecteurs. On calculera ensuite la puissance
pour des valeurs de n gales 100, 500 et 1 000.
b) On considre maintenant le test suivant :
H0 : p = 0,49
H1 : p = 0,51
14. On dispose dun chantillon (X1 , . . . , Xn ) dune v.a. X qui suit une loi normale
desprance inconnue m et dcart type connu = 2 pour choisir entre les deux
hypothses :
H0 : m = 2
H1 : m = 3
15. On dispose dun chantillon (X1 , . . . , Xn ) dune v.a. X qui suit une loi normale
desprance inconnue m et dcart type inconnu , pour choisir entre les deux
hypothses :
H0 : m = 1
H1 : m = 2
Pour un risque de premire espce = 0,05, indiquer ce que sera sa conclusion pour
76 2
des observations de tempratures telles que 76 i=1 xi = 1 140 et i=1 xi = 17 195.
Que se produit-il si on intervertit les deux hypothses?
17. Un gnrateur de nombres au hasard est cens simuler une loi uniforme sur
[0, 1]. Sil est drgl, il fournira une simulation dune loi uniforme sur [0, ] avec
= 1,1. Sil fournit les valeurs 0,95 ; 0,24 ; 0,83 ; 0,52 et 0,68 doit-on considrer quil
est bien rgl?
18. La v.a. X suivant une loi uniforme sur [, 2], donner la rgion critique et la
puissance du test de risque de premire espce entre les hypothses suivantes :
H0 : = 1
H1 : = 0,9
fonction puissance de ce test si le procd de fabrication est tel que sa prcision est
caractrise par un cart type connu = 10?
seuil critique dpend dune statistique. Pour cela nous allons tester lautre hypothse
= 10 et, si elle est accepte, on calculera la fonction puissance en faisant comme si
lcart type tait connu.
21. Un industriel produit des pices dont la caractristique principale peut tre
considre comme une v.a. X de loi normale, de moyenne m = 1 et dcart type
= 1. Il prlve au hasard 25 pices qui ont t produites, pour tester si le rglage de
la machine est toujours m = 1. Sachant que la prcision est toujours caractrise
par = 1, indiquer les trois tests que lon peut envisager pour contrler un
drglement ventuel et reprsenter leur fonction puissance pour un risque de
premire espce = 0,05. Prciser chaque fois la dcision qui sera prise pour un
chantillon o on a observ 25 i=1 xi = 30,25.
134 TD Statistique et probabilits
Comparaison de proportions
Comparaison dchantillons
23. Pour comparer deux marques dampoules lectriques, on a effectu des essais
sur des chantillons prlevs au hasard. La dure de vie moyenne observe sur
un chantillon de 25 ampoules de la marque 1 est de 1 012 heures, avec un cart
type empirique de 241 h. Sur un chantillon de 13 ampoules de la marque 2, on a
obtenu respectivement 1 104 h et 319 h. Peut-on considrer que ces marques sont
de qualits quivalentes?
Analyse de lnonc et conseils. Nous ferons lhypothse que les dures de vie des
ampoules des marques 1 et 2 sont des v.a. X et Y de lois normales et lhypothse nulle
correspond lgalit des moyennes de ces deux lois. Les tailles dchantillon sont trop
faibles pour pouvoir faire des approximations de loi ; donc, pour effectuer ce test, il
faut au pralable tester lgalit des variances de ces deux lois. Si cette hypothse est
accepte, on pourra raliser le test de lgalit des moyennes de deux lois normales de
mme cart type, car la loi de la statistique de test dans ce cas sera connue.
TD 8 Thorie des tests 135
Test dindpendance
24. Le chef dtablissement dun grand lyce parisien dsire comparer les taux
de succs au baccalaurat des trois sections gnrales. Les statistiques de lanne
prcdente figurent dans le tableau suivant :
L ES S Total
Russite 41 59 54 154
chec 21 36 75 132
Tests dadquation
25. Pendant 200 minutes, on note toutes les minutes le nombre de voitures qui
ont franchi un poste de page sur lautoroute, ce qui donne la distribution observe
ci-aprs :
Nombre de voitures 0 1 2 3 4 5 6 7 8 9 10 11
Dunod. La photocopie non autorise est un dlit.
Effectif observ 1 15 30 46 38 30 16 13 5 3 2 1
Dterminer la loi thorique que lon pourrait retenir pour modliser ce phnomne
darrives par minute un page.
Analyse de lnonc et conseils. Parmi les lois usuelles, cest la loi de Poisson
qui parat convenir pour modliser ces arrives au poste de page. Il faut estimer
le paramtre de cette loi et ensuite tester son adquation la loi observe, en tant
attentif au nombre de degrs de libert de la loi utilise et aux effectifs de classes.
26. la sortie dune chane de fabrication, on contrle toutes les trente minutes
le nombre de pices dfectueuses contenues dans un lot de vingt pices produites.
136 TD Statistique et probabilits
Les rsultats observs sur 200 lots indpendants sont rsums dans le tableau
suivant :
Nombre de dfectueux 0 1 2 3 4 5 6 7
Nombre de lots 26 52 56 40 20 2 0 4
Quelle loi thorique du nombre de dfectueux par lot de vingt peut-on retenir au
vu de ces observations?
1 Vrai. Si lhypothse nulle est privilgie dans la mthode de Bayes par une
valeur forte de p0 , elle doit donc tre rejete avec un risque trs faible derreur
qui est justement le risque de premire espce dans la mthode de Neyman et
Pearson.
3 Vrai. Lerreur la plus grave consistant rejeter tort lhypothse nulle avec
une probabilit , il serait contraire lesprit de la mthode de Neyman et Pearson
que lautre erreur ait une probabilit plus faible.
5 Vrai. Si on retient comme dfinition dune hypothse simple celle qui est
fournie dans les rappels de cours, la loi de X est totalement spcifie sous lalter-
native H1 et le calcul de la puissance est donc possible. Par contre, si on retient
la dfinition plus gnralement admise o une hypothse simple correspond au
cas o le paramtre ne peut prendre quune seule valeur, cette affirmation peut
devenir errone. Si nous prenons lexemple dune v.a. X qui suit une loi normale
dcart type inconnu et que le test porte sur la moyenne, soit H0 : m = m0 contre
m = m1 , la loi sous H1 nest pas totalement dtermine car elle dpend de deux
paramtres, et il nest donc pas possible de calculer la puissance.
6 Faux. Dans le cas dune loi discrte, les valeurs du risque de premire espce ne
varient pas de faon continue et ne comporteront pas en gnral la valeur exacte .
7 Vrai. La rgion critique tant construite partir de lhypothse nulle, linver-
sion des hypothses peut conduire des conclusions inverses, pour le mme
chantillon, si on intervertit les deux hypothses.
8 Lexpression de la vraisemblance est :
n
n
xi 1 xi
L (x1 , . . . , xn ; ) = e = en n
xi !
i=1
xi !
i=1
La valeur du seuil C qui dfinit cette rgion critique W est dtermine par la
condition :
Dunod. La photocopie non autorise est un dlit.
n
= P (W|H0 ) = P Xi C| = 2
i=1
n
avec i=1 Xi qui suit une loi de Poisson de paramtre(2n. Pour n = )9, on lit dans
9
les tables de la loi de Poisson P (18) les probabilits P i=1 Xi 10 = 0,030 4 et
( )
9
P i=1 Xi 11 = 0,054 9. Comme la loi est discrte, on constate donc que lon
ne peut pas trouver un test de niveau exact = 0,05. Si on retient comme rgion
critique lensemble des points (x1 , . . . , x9 ) tels que :
9
xi 10
i=1
138 TD Statistique et probabilits
196
soit = = 0,8.
245
9 Lexpression de la statistique de test est :
k
(ni /n)2
Dn = n 1
pi
i=1
Dans le cas o N = 10n, on aura donc DN = 10Dn , soit pour les valeurs donnes
D1 000 = 21 qui est suprieur au seuil 16,9, ce qui conduit rejeter ladquation la
loi uniforme. Pour une taille dchantillon plus leve, la valeur de la statistique
augmente et la distribution empirique obtenue doit donc tre plus proche de la
distribution thorique pour quon accepte ladquation.
10 Le cot de la dcision D0 de prendre la garantie est de 300 F et le cot moyen
associ la dcision D1 de ne pas la prendre est de 2 500p, car p qui reprsente
la probabilit de panne est aussi la valeur moyenne de la variable indicatrice de
panne dfinie par :
1 si panne p
X=
0 sinon 1 p
D0 D1 prob. a priori
Les xi ne prenant que des valeurs entires, on dcide de prendre la garantie pour
des observations telles que 20 i=1 xi 2, ce qui est le cas pour cet chantillon.
Pour un cot de garantie de 350 F, la relation E [C (D0 )] < E [C (D1 )] est vraie pour
2251 < 250 , soit 9 0,2 L1 < 0,8 L0 , ce qui est quivalent :
20
19
20 20
19 9
ln 3 + ln xi > 20 ln + ln xi > 2,51 xi 3
17 17 4
i=1 i=1 i=1
D0 D1 prob. a priori
D0 D1 prob. a priori
H0 : m = 0 0 0,5 0,5
H1 : m = 2 0 1,5 0,5
Les esprances a posteriori des cots sont E [C (D0 )] = 0 et E [C (D1 )] = 0,50 1,51 ;
donc on aura E [C (D0 )] < E [C (D1 )] si 0 > 31 , soit L0 > 3L1 . Laccroissement de
bnfices par ville est une v.a. X de loi N (m, 2) soit une vraisemblance :
1
5
1
L (x1 , . . . , xn ; m) = exp (xi m) 2
2 2 8
i=1
1 ' 2 *
5 5
xi (xi 2)2 > ln 3 xi < 5 2 ln 3 = 2,80
8
i=1 i=1
5
Lobservation i=1 xi = 4 conduit donc lancer la campagne publicitaire si on
adopte cette rgle de dcision de Bayes.
Dans loptique de Neyman-Pearson, lhypothse nulle ne pas rejeter tort est
celle dune campagne qui serait efficace, ce qui correspond lhypothse simple
H0 : m = 2. Lhypothse alternative est alors H1 : m = 0. Le thorme de Neyman
et Pearson dfinit la forme de la rgion critique par L0 /L1 k, soit ici en prenant
les logarithmes :
1 ' *
5 5
(xi 2)2 x2i < k1 xi < C
8
i=1 i=1
la valeur
( de la constante )C tant dtermine par le risque de premire espce
5
=P i=1 Xi < C|m = 2 . Sous lhypothse nulle, la moyenne empirique X5 suit
( )
une loi normale N 2, 2/ 5 ; donc C est dfini par :
X5 2 C/5 2
=P <
2/ 5 2/ 5
TD 8 Thorie des tests 141
soit C = 10 + 2u 5 o u est le fractile dordre de la loi normale centre-rduite.
Pour un risque = 0,05, on a u = 1,644 9 et C = 2,64 ; donc la rgle de Neyman
conduit accepter lhypothse nulle, cest--dire lancer la campagne. Par contre,
pour un risque de premire espce plus lev = 0,10, on lit dans la table 2,
page 195, le fractile u = 1,281 6, do C = 4,27. Lobservation 5i=1 xi = 4 conduit
cette fois ne pas lancer la campagne.
Le changement de m = 2 en m > 0 oblige retenir lhypothse simple m = 0
comme hypothse nulle du test de Neyman-Pearson. La rgion critique L0 /L1 k
est cette fois dfinie par :
1 2
5 5
xi (xi m)2 < k1 xi > C
8
i=1 i=1
( )
5
o la constante C est dtermine par la condition = P i=1 Xi > C|m = 0 . On
obtient cette fois C = 2u 5, o u est le fractile dordre 1 de la loi normale
centre-rduite. Pour un risque = 0,10, le fractile est u = 1,281 6 et C = 5,73 ;
donc mme avec ce risque de premire espce lev on dcide de ne pas lancer la
campagne. Le changement dhypothse nulle, d des raisons techniques, amne
ne la rejeter que pour des trs grandes valeurs observes daugmentation de
bnfices, mme si on choisit un risque lev.
13 a) Choisir p = 0,48 comme hypothse nulle, au lieu de p = 0,52, cest vouloir
se prmunir avant tout contre le risque de conclure son lection, en acceptant
lhypothse p = 52 % alors quen fait on aurait p = 48 %. Ce candidat prfre
tre agrablement surpris, plutt que dentretenir un faux espoir. On introduit ici
des variables de Bernoulli associes chaque lecteur interrog i, 1 i n, qui
prennent la valeur 1 quand celui-ci dclare son intention de vote pour le candidat
D. Magog :
1 p
Xi =
0 1p
n
1xi n n ni=1 xi
Dunod. La photocopie non autorise est un dlit.
L x1 , . . . , xn ; p = pxi 1 p = p i=1 xi 1 p
i=1
xn C
La valeur de la constante C, qui est le seuil critique de ce test, est dfinie partir
du risque de premire espce, soit :
= P Xn C|p = 0,48
o U est une v.a. de loi N (0, 1). Ainsi, u dsignant le fractile dordre 1 de cette
loi, la rgion critique est dfinie par la condition :
.
p0 q0
xn p0 + u
n
Pour = 0,10 on lit dans la table 2, page 195, le fractile u = 1,281 6 et le seuil
critique pour n = 100 est alors C = 0,48 + 1,281 6/20 = 0,544. En dpit dun risque
de rejet de lhypothse nulle assez lev puisque = 10 %, on ne rejette lhypothse
p = 48 % que si plus de 54,4 % des personnes interroges dclarent vouloir voter
pour ce candidat, valeur bien suprieure p1 = 52 %. Ceci sexplique par une
taille dchantillon trop faible pour sparer deux hypothses voisines de 50 %. La
puissance de ce test se calcule par :
C p1
= P Xn C|p = p1 $ P U 3
p1 q1 /n
Les valeurs de p0 et p1 tant proches de 1/2, on peut remplacer C par p0 + u/2 n
et on calcule alors une valeur approche de la puissance par la probabilit :
= P U u + p0 p1 2 n
ou = 1 u 0,08 n , dsignant la f.r. de la loi N (0, 1). Pour n = 100, on
obtient = 0,544, soit un risque de seconde espce lev = 0,456. Le risque de
premire espce tant fix, la puissance augmentera si la rgion critique sagrandit,
TD 8 Thorie des tests 143
1 ' *
n
2
(xi 2)2 (xi 3)2 ln k
2
i=1
n
2 xi + 5n 22 ln k
Dunod. La photocopie non autorise est un dlit.
i=1
xn C
Il reste prciser la valeur de cette constante C, qui sera le seuil de cette rgion,
partir du risque de premire espce qui est fix. Il reprsente la probabilit de
144 TD Statistique et probabilits
cette rgion, lorsque lhypothse nulle est ralise, et par consquent, la condition
qui dfinit C scrit :
= P (W|m = 2) = P Xn C|m = 2
Sous H0 , la moyenne empirique Xn suit la loi N 2, 2/ n , donc en centrant et
rduisant on obtient la condition :
C2
=P U
2/ n
o U est une v.a. de loi N (0, 1). Ainsi la constante C est dfinie par :
u
C = 2 + 2
n
o u est le fractile dordre 1 de la loi N (0, 1). Pour un risque = 0,05, on lit
dans la table 2, page 195, le fractile u = 1,644 9, do une rgion critique dfinie
pour n = 100 par :
Dans ce cas, la puissance du test est la probabilit de cette rgion dans lhypothse
alternative, soit :
2,33 3
= P X100 2,33|m = 3 = P U = 0,996
2/ 100
La rgion critique est donc dfinie par le thorme de Neyman et Pearson comme
lensemble des points (x1 , . . . , xn ) tels que :
Dunod. La photocopie non autorise est un dlit.
n
(xi 16)2 C
i=1
o C est le fractile dordre 1 de la loi 2n suivie par ni=1 (Xi 16)2 sous
lhypothse nulle. Pour = 0,05, on lit dans la table 5, page 199, par interpo-
lation pour n = 76, la valeur C = 97. Les observations donnent 76 i=1 (xi 16) =
2
Mais cette fois cest la variable ni=1 (Xi 16)2 /4 qui suit une loi 2n sous H0 et
cest donc C/4 qui est le fractile dordre de cette loi. Pour = 0,05, on dduit
de la table 5, page 199, par interpolation pour n = 76, la valeur C = 227. On
refuse donc nouveau lhypothse nulle, qui est cette fois = 2. Lexpression des
deux rgions critiques nous montre que pour toutes les observations telles que
97 < 76 i=1 (xi 16) < 227 linterversion des hypothses entranera linterversion
2
des conclusions. Ceci sexplique par la remarque quil sagit dune rgion de
probabilit trs faible, quelle que soit lhypothse retenue, puisque :
76
P (Xi 16) > 150| = 1 $ 0
2
i=1
et :
76
P (Xi 16) < 180| = 2 $ 0,002 6
2
i=1
La loi de Mn est obtenue par P (Mn < x) = Fn (x) o F est la f.r. de la loi uniforme
sur [, 2], dfinie par :
0 si x
x
F (x) = 1 si x 2
1 si 2 x
On obtient donc :
n
2n + 1
= C1
n+1
Mn < 1 + 1/n
TD 8 Thorie des tests 147
C
=P Xi C|H1 = P Xn |p = 0,48 $ P U 3
i=1
n 0,48 0,52/n
soit ici comme valeur approche (0,467) = 0,32 o est la f.r. de la loi N (0, 1).
Il y a donc 68 chances sur 100 daccepter lhypothse p = 0,50 dans le cas o
p = 0,48. Le risque de seconde espce est trs lev.
Suivant que p1 < 0,5 ou p1 > 0,5, la rgion critique sera de la forme xn < k1 ou
xn > k2 . On retient donc pour lalternative p = 0,5 une rgion critique symtrique
par rapport lhypothse nulle, donc dfinie par :
avec m1 < 560 est lensemble des points (x1 , . . . , xn ) tels que :
xn 560
n C
sn
La constante C est dfinie par la condition :
Xn 560
=P n C|m = 560
Sn
lapproximation par la loi N (0, 1) de la loi de 2Y 2 1 avec Y de loi 2 et
ici = n 1. On obtient a = 150,49 et b = 253,14. Comme 200i=1 (xi x200 ) /100 =
2
xn 560
n C
10
et C est le fractile dordre de la loi N (0, 1). Pour = 0,01, on lit C = 2,326 3 et la
rgion critique est dfinie par xn < 558,36. La fonction puissance est alors dfinie
en fonction de m par :
Xn m 560 m ' *
=P n C+ n = 2 (558,36 m)
10 10
pour une v.a. X de loi N (m, ) avec lcart type connu = 1. Le thorme de
Neyman et Pearson conduit une rgion critique dfinie par :
25
(m0 m1 ) xi k
i=1
avec U v.a. de loi N (0, 1), de f.r. . Le seuil de ce test est donc C = 1 + u/5,
o u est le fractile dordre 1 de la loi N (0, 1). Pour = 0,05, on lit dans la
table 2, page 195, le fractile u = 1,644 9 et on obtient C = 1,33. Sur cet chantillon
150 TD Statistique et probabilits
on a observ x25 = 1,21 ; donc on accepte lhypothse nulle dun bon rglage. La
fonction puissance de ce test est dfinie par :
1 (m) = P (W1 |H1 ) = P X25 C|m > 1
= P {U 5 (C m)} = 1 {u 5 (m 1)}
Pour le test de :
H0 : m = 1
H1 : m < 1
avec toujours C = 1 + u/5, mais cette fois u tant le fractile dordre de la loi
N (0, 1). Pour = 0,05, on a donc u = 1,644 9 et C = 0,67, lhypothse nulle tant
bien sr toujours accepte. La fonction puissance de ce test est dfinie pour m < 1
par :
2 (m) = {u + 5 (1 m)}
Pour le test de :
H0 : m = 1
H1 : m = 1
on ne peut pas cette fois dduire la forme de la rgion critique de celle du test entre
les hypothses simples, car elle dpend de la position inconnue de m par rapport
1. On va retenir une rgion critique qui sera lunion des prcdentes, cest--dire
dfinie par x25 C1 ou x25 C2 , mais qui ne sera pas celle dun test UPP. En raison
de la symtrie de la statistique de test et de lalternative, on retient comme rgion
critique :
Donc C = u/5 o u est le fractile dordre 1 /2 de la loi N (0, 1). Pour = 0,05, on
lit u = 1,96 et C = 0,392, soit une rgion critique dfinie par x25 0,61 ou x25 1,39
et une nouvelle fois on accepte lhypothse nulle. La fonction puissance de ce test
est dfinie pour m quelconque par :
(m) = 1 {u + 5 (1 m)} + {5 (1 m) u}
Le graphe des trois fonctions puissances sur la figure 8.1, page ci-contre, montre
bien que ce dernier nest pas UPP puisque 1 (m) (m) pour m > 1 et 2 (m)
(m) pour m < 1.
TD 8 Thorie des tests 151
1
2 (m) 1 (m)
(m)
0,05
0 1 m
Figure 8.1
/p= = Xi + Yi
n1 + n2 n1 + n2
i=1 i=1
/ X Y
=
/
p 1 /
p (1/n1 + 1/n2 )
dont on peut admettre, compte tenu des tailles dchantillon leves, quelle suit
approximativement une loi normale standard dans lhypothse nulle. La rgion
152 TD Statistique et probabilits
critique est dfinie par / < C, o on retient comme valeur approche de C le fractile
dordre de la loi N (0, 1) pour un risque de premire espce fix. Pour = 0,05,
la rgion critique est dfinie par / < 1,644 9 et on obtient pour cet chantillon
x = 0,19, y = 0,23, /
p = 0,203, /p 1 / p (1/n1 + 1/n2 ) = 0,015 6 et /
= 2,57, donc
on accepte lhypothse de lefficacit de la campagne. Pour un risque plus faible
= 0,01, le seuil critique est C = 2,33 et lhypothse nulle est encore rejete.
23 Les dures de vie des ampoules des marques 1 et 2 sont respectivement les
v.a. X et Y de lois respectives N (m1 , 1 ) et N (m2 , 2 ), ces quatre paramtres tant
inconnus. Le test effectuer est :
H0 : m1 = m2 H0 : m1 m2 = 0
H1 : m1 = m2 H1 : m1 m2 = 0
1 1
n n
1
2 2
2
S21 = Xi X et S22 = Yi Y
n1 1 n2 1
i=1 i=1
Si on remplace lcart type inconnu par son estimateur S21 /n1 + S22 /n2 pour rduire
X Y, on nobtiendra pas une loi de Student. Il faut pour cela que lcart type des
deux chantillons soit le mme, donc on doit faire un test pralable dgalit des
variances :
H0 : 21 = 22
H1 : 21 = 22
On accepte lhypothse nulle si le rapport S21 /S22 est voisin de 1, soit une rgion
dacceptation de la forme :
S21
a< <b
S22
avec S21 /S22 qui suit une loi F (n1 1, n2 1) sous H0 . Pour = 0,10, on lit dans
1
la table 7, page 201, le fractile a = = 0,46 et on obtient par interpolation
2,18
b = 2,50. La valeur calcule de S21 /S22 pour cet chantillon est 0,55, donc on accepte
TD 8 Thorie des tests 153
lgalit des variances. On retient alors comme estimateur sans biais de la variance
commune 2 = 21 = 22 :
L ES S Total
Russite 33 51 70 154
chec 29 44 59 132
Dunod. La photocopie non autorise est un dlit.
800
25 La moyenne empirique de cette distribution vaut = 4, donc on teste
200
ladquation une loi de Poisson de paramtre = 4. La table 4, page 198,
nous permet de calculer les effectifs thoriques en multipliant les probabilits
individuelles par 200 et en arrondissant. Par exemple pour x = 1, la probabilit
vaut p1 = 0,073 3, soit un effectif thorique np1 = 14,66 arrondi 15. On obtient
ainsi le tableau des deux distributions, empirique et thorique :
Nombre de voitures 0 1 2 3 4 5 6 7 8 9 10 11
Effectif observ 1 15 30 46 38 30 16 13 5 3 2 1
Effectif thorique 4 15 29 39 39 31 21 12 6 3 1 0
Les effectifs des valeurs extrmes tant infrieurs 5, on regroupe les deux pre-
mires et les quatre dernires valeurs. Il reste donc seulement huit classes de valeurs
et comme le paramtre de la loi thorique retenue a t estim, la statistique qui
dfinit la rgion critique Dn C suit approximativement une loi du khi-deux six
(8 1 1) degrs de libert. Pour = 0,05, le seuil critique est le fractile dordre
0,95 de cette loi, soit C = 12,6. La valeur observe ici est :
Nombre de dfectueux 0 1 2 3 4 5 6 7
Nombre de lots 26 52 56 40 20 2 0 4
Effectif thorique 24 54 57 38 18 6 2 1
On regroupe les trois dernires valeurs pour obtenir un effectif thorique suprieur
cinq. La rgion critique est de la forme Dn C. La loi asymptotique de la
statistique Dn est une loi du khi-deux quatre degrs de libert car il y six classes
de valeurs distinctes retenues et un paramtre estim. Pour = 0,05, la valeur de
C est le fractile dordre 0,95 de la loi 24 , soit C = 9,5. La valeur observe ici est :
Donc on accepte comme loi thorique la loi binmiale B (20 ; 0,1). Pour = 0,10,
la conclusion serait identique puisque le seuil serait C = 7,8.
La valeur retenue pour p tant ici trs faible, on pourrait aussi considrer que
la prsence dune pice dfectueuse est un vnement rare susceptible dtre
modlis par la loi de Poisson. La variance empirique a pour valeur 1,98 trs
proche de celle 2,01 de la moyenne empirique, ce qui conforte cette possibilit. On
va donc calculer les effectifs thoriques associs une loi de Poisson P (2) :
Nombre de dfectueux 0 1 2 3 4 5 6 7
Nombre de lots 26 52 56 40 20 2 0 4
Effectif thorique 27 54 54 36 18 7 2 2
Septembre 2007
1. Deux vnements A et B ont comme probabilits respectives 1/4 et 1/3 de se
raliser seuls (lun et pas lautre). Sachant que la probabilit que lun ou lautre se
Dunod. La photocopie non autorise est un dlit.
b) Soit U une v.a. de loi normale centre et rduite et V une v.a. qui suit une loi
du khi-deux 16 degrs de libert. Ces deux v.a. tant indpendantes, trouver le
U
nombre rel b tel que P < b = 0,975 .
V
5. On effectue deux tirages successifs sans remise dans une urne qui contient 3
boules noires et 2 boules rouges. On note X la v.a. qui reprsente le nombre de
boules rouges tires et Y la v.a. qui vaut 1 si on tire une boule noire au premier
tirage et 0 sinon. Dterminer la loi de probabilit du couple (X, Y) puis calculer
cov (X, Y) . Les v.a. X et Y sont-elles indpendantes ?
Mai 2007
1. Un magasin souhaite squiper dun dtecteur de faux billets de 500 euros. On
note p la probabilit quun dtecteur repre effectivement un billet qui est faux.
a) On prsente 100 faux billets un dtecteur bon march et seulement 80 dentre
eux sont dtects. Construire un intervalle de confiance pour p , de niveau
1 = 0,95, laide dun abaque puis en utilisant une approximation que lon
justifiera, si lon ne disposait pas de cet abaque.
b) Ce caissier prsente nouveau 50 faux billets un dtecteur plus sophistiqu
qui les a tous dtects. Construire laide dun abaque un intervalle de confiance
de niveau 1 = 0,95 pour le paramtre p associ ce dtecteur. Quelle
approximation pourrait-on utiliser ici si lon ne disposait pas de cet abaque ?
1
n
2
S2n = Xi Xn
n1
Dunod. La photocopie non autorise est un dlit.
i=1
Janvier 2007
1. Dans une certaine population, la probabilit de naissance dun garon est de
4/7. Dterminer la proportion de familles de trois enfants o les enfants ne sont
pas tous du mme sexe, en prcisant lensemble fondamental retenu pour
modliser ce problme.
3. La fonction de rpartition dune v.a. X est nulle pour x 3 et pour tous les
entiers n 3 a pour valeur :
1
F (x) = 1 si n < x n + 1
2n2
Dterminer la loi de probabilit de X .
Septembre 2006
1. On lance un d rouge et un d vert et on considre les vnements A obte-
nir un chiffre pair sur le d rouge , B obtenir un chiffre pair sur le d vert et
C la somme des chiffres obtenus est paire . Les vnements A, B et C sont-ils
indpendants deux deux ? dans leur ensemble ? On prcisera lensemble fon-
damental retenu pour modliser ce problme.
2. On effectue lexprience suivante sur la mmoire des rats. Un rat peut appuyer
sur lune des trois manettes places devant lui et dans un seul cas il recevra de la
nourriture. On note X la variable alatoire qui reprsente le nombre de tentatives
effectues par le rat jusqu ce quil obtienne de la nourriture.
a) Dterminer la loi de probabilit de X dans les 3 situations suivantes :
il choisit au hasard une manette chaque tentative (aucune mmoire) ;
il exclut la mauvaise manette choisie la tentative prcdente (mmoire
courte) ;
il exclut toutes les mauvaises manettes choisies aux tentatives prcdentes
(mmoire parfaite).
b) Calculer dans chacune de ces situations la probabilit quil fasse plus de 3 ten-
tatives pour obtenir de la nourriture.
f x, y =
0 sinon
a) Dterminer les densits marginales de X et Y . Les v.a. X et Y sont-elles ind-
pendantes ?
b) Dterminer les densits conditionnelles de X sachant que Y = y et de Y sachant
que X = x .
Mai 2006
1. Soit p la probabilit quune pice produite par une machine prsente un
dfaut grave.
a) On prlve au hasard 150 pices produites pour effectuer un contrle de qua-
lit. Sachant que 6 dentre elles prsentent un dfaut grave, construire un inter-
valle de confiance pour p de niveau 0,95.
b) Une nouvelle machine est installe et sur 30 pices prleves au hasard aucune
ne prsente un dfaut grave. Donner un intervalle de confiance de niveau 0,95
pour ce nouveau paramtre p . Peut-on considrer que cette nouvelle machine est
de meilleure qualit ?
a) Dterminer lestimateur
n du maximum de vraisemblance du paramtre .
Janvier 2006
1. Parmi les patients venus consulter un ophtalmologue, 10 % taient myopes,
20 % presbytes, les autres ayant une bonne vue, les proportions de ceux dclarant
souffrir de maux de tte tant respectivement de 90 %, 50 % et 5 %. Quelle est la
probabilit quun patient souffrant de maux de tte nait pas besoin de porter de
lunettes ?
2
0 sinon
a) Dterminer la fonction de rpartition de X .
b) Calculer E (X) .
4. On lance 2 boules qui tombent chacune au hasard dans lun des 2 tiroirs A ou
B. On note X la v.a. qui reprsente le nombre de boules tombes dans le tiroir A
et Y la v.a. qui reprsente le nombre de tiroirs non vides. Dterminer la loi de pro-
164 TD Statistique et probabilits
babilit du couple (X, Y) puis calculer cov (X, Y) . Les v.a. X et Y sont-elles ind-
pendantes ?
Septembre 2005
1. Une urne contient trois boules rouges et deux boules noires. On effectue des
tirages successifs sans remise et on arrte ds quon a obtenu 2 boules rouges.
Prciser lensemble fondamental retenu pour modliser ce problme et calcu-
ler la probabilit de chaque vnement lmentaire.
2. Soit (X1 , ..., Xn ) des v.a. indpendantes et de mme loi que X de densit :
2 (1 x) si 0 x 1
f (x) =
0 sinon
Dterminer la densit de la v.a. Mn = max {X1 , ..., Xn } .
1
1
n n
2 Xn
Xn = Xi S2n = Xi Xn Tn1 = n
n n1 Sn
i=1 i=1
Mai 2005
1. Soit p la probabilit quun systme dalarme se dclenche bon escient.
a) Sur 250 essais indpendants effectus dans une bijouterie il y a eu 240 dclen-
chements justifis de lalarme. Construire un intervalle de confiance pour p de
niveau 0,95 laide dun abaque, puis en utilisant une approximation que lon jus-
tifiera, si lon ne disposait pas de cet abaque.
b) Un nouvel quipement est install dans cette bijouterie et sur 30 essais ind-
pendants effectus, tous ont provoqu un dclenchement justifi. Donner un
intervalle de confiance pour ce nouveau paramtre p de niveau 0,95. Peut-on
considrer que ce nouvel quipement est de meilleure qualit ?
Janvier 2005
1. Le jeu de lambassadeur consiste transmettre oralement son voisin, sans
que les autres entendent, un message compliqu pour samuser des dformations
quil peut subir. Le message initial contient une quantit dinformation note I0
(par exemple le nombre de phonmes) et chaque relais il y a une probabilit p
quil soit transmis correctement. Avec une probabilit q = 1 p la quantit din-
formation est diminue et devient aI0, avec 0 < a < 1 . On note In la v.a. qui repr-
sente la quantit dinformation obtenue aprs n relais. Dterminer la loi de pro-
babilit de I1 , I2 puis In pour n > 2 .
4. Soit (X, Y) un couple de v.a. discrtes dont la loi de probabilit est donne par
le tableau ci-aprs.
Calculer E (X) , E (Y) puis cov (X, Y) . Les v.a. X et Y sont-elles indpendantes ?
TD 9 Annales corriges Universit Panthon-Assas, Paris II 167
X
1 0 1
Y
2 1/8 1/8 1/8
2 1/4 1/8 1/4
LMENTS DE CORRECTION
Septembre 2007
1 1 3
1 Les hypothses se traduisent par P A B =
4
, P A B = , P (A B) = .
3 4
On en dduit :
1
P (A B) = P (A B) P A B P A B =
6
5
P (A) = P (A B) + P A B =
12
1
P (B) = P (A B) + P A B =
2
Comme P (A B) = P (A) P (B) , les vnements A et B sont dpendants.
2 a) Un joueur gagne sil tire une carte paire et si le(s) prcdent(s) a (ont) tir
une carte impaire. On obtient ainsi :
3 3 3 6 3 2 3 3
P (A) = , P (B) = = , P (C) = = ,
6 6 5 20 6 5 4 20
3 2 1 3 1
P (D) = =
6 5 4 3 20
Dunod. La photocopie non autorise est un dlit.
b) On en dduit :
3 6 3 1 35
E (N) = +2 +3 +4 =
6 20 20 20 20
3 On a P (X < 0) = P (X < 1) = 0 et, pour n 2 :
n1
1 1 1
P (X < n) = P (X = k) = 1 + + ...
2 2 3
k=1
1 1 1 1
+ +
n2 n1 n1 n
1
=1
n
168 TD Statistique et probabilits
On obtient :
1
E (X) = nP (X = n) = =
n+1
n=1 n=1
cest--dire que cette loi nadmet pas desprance.
5 La loi du couple (X, Y) figure dans le tableau ci-aprs, avec les lois de X et
X 0 1 2
Y
3 1 4
0 0
10 10 10
3 3 6
1 0
10 10 10
3 6 1
1
10 10 10
2 3 3
Avec par exemple P (X = 1, Y = 0) = P (RN) = = . On calcule partir
5 4 10
4 3 3
du tableau E (X) = , E (Y) = et E (XY) = P (X = 1, Y = 1) = .
5 5 10
9
Ainsi cov (X, Y) = et les variables X et Y sont dpendantes.
50
TD 9 Annales corriges Universit Panthon-Assas, Paris II 169
7 a) On calcule E (X) = + 1 .
donc on obtient :
n (Tn ) N (0, 1)
loi
1
Lestimateur Tn suit asymptotiquement la loi normale N , . On construit
n
donc un intervalle de confiance bilatral symtrique, puisque cette loi est sym-
trique. On peut trouver la valeur aproche de la constante u telle que :
1 = P u < n (Tn ) < u
Dunod. La photocopie non autorise est un dlit.
expression, quand 0 x :
x
3 x3
F (x) = t2 dt =
3 0 3
170 TD Statistique et probabilits
On calcule la f.r. de Mn :
n
n
G (x) = P (Mn < x) = P (Xi < x) = P (Xi < x) = Fn (x)
i=1 i=1
On obtient la densit par drivation :
x3n1
g (x) = 3n
3n
b) Lexpression de la vraisemblance est :
n
n
3
L (x1 , ..., xn ; ) = x2i
3 i=1
si 0 xi pour 1 i n . La vraisemblance, considre comme une fonction
de , est nulle pour 0 < max {x1 , ..., xn } puis dcroissante pour
max {x1 , ..., xn } (voir figure 9.1) :
Figure 9.1
1 = G [ (1 t1 )] = (1 t1 )3n
1 2 = G [ (1 t2 )] = (1 t2 )3n
TD 9 Annales corriges Universit Panthon-Assas, Paris II 171
on dduit :
t1 = 1 11 3n t2 = 1 (1 2 )1 3n
Lintervalle de confiance est dfini par la condition :
1 = P {t1 < Mn < t2 }
Sil est bilatral symtrique 1 = 2 = /2, do lintervalle de confiance pour
:
Mn Mn
1 3n
<<
(1 2) ( 2)1 3n
Mai 2007
On a ici
p100 = 0,8 et on lit dans la table 2 u = 1,645 do p > 73 % .
b) On lit sur labaque p > 93 % . Pour cet chantillon, on obtient
p50 = 1 , donc on
ne peut pas remplacer p 1 p par pn 1
pn . Lintervalle de confiance serait
obtenu par rsolution de lingalit :
Dunod. La photocopie non autorise est un dlit.
p 1p
p50 u <p
n
2 a) Lestimateur X
n est sans biais et convergent daprs la loi des grands
nombres.
1 2
b) Lestimateur Tn = S obtenu par la mthode des moments est sans biais. La
2 n
n1 2
v.a. S suit une loi du khi-deux n 1 degrs de libert, donc
2 n
22
V (Tn ) = . Cet estimateur est sans biais et sa variance tend vers zro donc il
n1
est convergent.
172 TD Statistique et probabilits
c) Pour comparer ces deux estimateurs sans biais, nous formons le rapport des
variances :
V (Tn ) n
=
V Xn n 1
Comme cette quantit dpend de la valeur du paramtre estimer, on ne peut pas
conclure. Ces deux estimateurs ne sont pas comparables. Aucun deux ne peut
tre efficace, car il serait alors toujours le meilleur.
n
n
1 (x mi )2
L (x1 , ..., xn ; ) = f (xi ; ) = exp i
2 22
i=1 i=1
n
1
n
1
= exp (xi mi )2
2 22
i=1
La log-vraisemblance est donc :
1
n
ln L (x1 , ..., xn ; ) = n ln 2 2 (xi mi )2
2
i=1
On obtient comme drive :
n
lnL
= 2 (xi mi )
i=1
1
n
Elle sannule pour = (x mi ) . On drive une nouvelle fois :
n i=1 i
2 lnL n
2
= <0
2
Le point qui annule la drive premire correspond donc un maximum et les-
timateur du maximum de vraisemblance est :
n
Tn = (Xi mi )
n
i=1
2 1
V (Tn ) = =
n In ()
TD 9 Annales corriges Universit Panthon-Assas, Paris II 173
Janvier 2007
1 Lensemble fondamental est constitu de tous les vnements lmentaires
possibles, crits sous la forme de triplets dont la premire lettre dsigne le sexe du
premier n. On a donc :
3
= {F, G}
Il y a quiprobabilit donc :
3 3
4 3
P (GGG) = P (FFF) =
7 7
La probabilit que les enfants ne soient pas tous du mme sexe est donc :
3 3
4 3 36
Dunod. La photocopie non autorise est un dlit.
1 =
7 7 49
4 a) On calcule la f.r. de Y :
G y = P Y < y = P X2 < y
On a donc G y = 0 pour y 0, G y = 1 pour y 1 et, pour 0 y 1 :
G y =P y<X< y =F y F y
La densit est obtenue par drivation :
1 1
g y = f y + f y = 1 + 3y
2 y 4 y
b) On obtient comme esprance :
1
1 7
E (Y) = y + 3y y dy =
4 0 15
5 a) Toute fonction linaire dune v.a. normale suit une loi normale, donc Y
suit une loi normale centre de variance 4 , X + Y = 3X suit une loi normale cen-
tre de variance 9 et X + Y 3X = 0 suit une loi normale dgnre (de variance
nulle), cest--dire est une variable certaine, P (X + Y + Z = 0) = 1 .
b) On a cov (X, Y) = E (XY) = E 2X2 = 2V (X) = 2 et V (X + Y + Z) = 0 car cest
une variable certaine.
TD 9 Annales corriges Universit Panthon-Assas, Paris II 175
Septembre 2006
2 a) Avec des notations videntes, on obtient dans le cas aucune mmoire
(am) :
n1
2 1
P (X = n) = P N...NN = , n1
3 3
Dans le cas mmoire courte (mc) :
Dunod. La photocopie non autorise est un dlit.
n1
1 2 1
P (X = 1) = , P (X = n) = P N...NN = , n2
3 3 2
Dans le cas mmoire parfaite (mp) :
1 2 1 1 2 1 1
P (X = 1) = , P (X = 2) = = , P (X = 3) = 1=
3 3 2 3 3 2 3
P (X = n) = 0 n 4
b) On calcule ensuite aisment, dans le cas am :
1 2 4 19 8
P (X 3) = + + = pam =
3 9 27 27 27
176 TD Statistique et probabilits
Dans le cas mc :
1 1 1 5 1
P (X 3) = + + = pmc =
3 3 6 6 6
Dans le cas mp :
1 1 1
P (X 3) = + + = 1 pmp = 0
3 3 3
3 a) La fonction de rpartition de X est nulle pour x 0 . Son expression pour
0 < x 1 est :
x
x2
F (x) = tdt =
0 2
Pour 1 x 2 :
x
x2
F (x) = F (1) + (2 t) dt = + 2x 1
1 2
1
On a ensuite F (x) = 1 pour x > 2 . Puisque F (1) = , la mdiane vaut 1 (cest le
2
centre de symtrie de cette loi).
b) On a P {|X 1| < x} = 0 pour tout rel x 0 . Pour x > 0 :
P {|X 1| < x} = P {1 x < X < 1 + x} = F (1 + x) F (1 x)
Donc P {|X 1| < x} = 1 pour tout rel x 1 . Pour 0 < x < 1 :
Figure 9.2
f x, y 1
fY y |X = x = = pour x y < 1
fX (x) 1x
Il sagit de la loi uniforme sur lintervalle [x, 1].
5
Les estimateurs Tn et Tm sont sans biais, donc E
pN = aE (Tn ) + bE (Tm )
= (a + b) p . Lestimateur
pN sera aussi sans biais si b = 1 a. Les estimateurs Tn
T
et m sont indpendants, donc :
!
a2 (1 a)2
V 2 2
pN = a V (Tn ) + b V Tm = p 1 p +
n m
a2 (1 a)2
f (a) = +
n m
Cest une fonction de drive :
2a 2 (1 a)
f (a) =
n m
n 2 2
La drive sannule pour a = avec f (a) = + > 0 donc lestimateur
n+m n m
sans biais optimal est :
nTn + mTm
pN =
N
178 TD Statistique et probabilits
Xn E (X)
p
3
do on dduit en multipliant par :
2
3 3
Tn = Xn E (X) =
2 p 2
n
n
G (x) = P (Mn < x) = P (Xi < x) = P (Xi < x) = Fn (x)
i=1 i=1
x2n1
g (x) = G (x) = nFn1 (x) f (x) = 2n 0x
2n
Ainsi :
2n 2n
E (Mn ) = 2n
x2n dx =
0 2n + 1
La valeur de E (Mn ) montre que lestimateur sans biais est :
2n + 1
Tn = Mn
2n
Pour les mmes raisons que dans la question prcdente, la question de leffica-
cit ne se pose pas. On calcule ensuite :
2n 2n 2
E M2n = 2n x2n+1 dx =
0 2n + 2
Do la variance :
n
V (Mn ) = E M2n E2 (Mn ) = 2
(n + 1) (2n + 1)2
La variance de cet estimateur est :
2n + 1 (2n + 1)2 2
V Tn = V Mn = V (Mn ) =
2n 4n2 4n (n + 1)
Nous allons comparer ces deux estimateurs sans biais en formant le rapport de
leurs variances :
V (Tn ) 2
= 0
Dunod. La photocopie non autorise est un dlit.
V (Tn ) n + 1
Lestimateur Tn est donc infiniment plus efficace que Tn .
1
2
n
Tn = Xn2 = Xi
n
i=1
Cet estimateur est sans biais :
E (Tn ) = E X2 =
180 TD Statistique et probabilits
Xn2 E(X2 ) =
p
1
2
n
n n
ln L (x1 , ..., xn ; ) = ln (2) ln xi
2 2 2
i=1
Soit en drivant :
1
2
n
ln L n
= + xi
2 22
i=1
On drive une nouvelle fois :
n
2 ln L n
= x2i
2 22 3 i=1
On calcule alors la quantit dinformation de Fisher :
1
2
n
2 ln L n n
In () = E = + E Xi = 2
2 22 3 i=1 2
22 1
V (Tn ) = =
n In ()
Lestimateur Tn est donc efficace.
b) La v.a. nTn / suit une loi du khi-deux n degrs de libert. Le paramtre
mesurant un degr dimprcision, on choisit un intervalle unilatral dfini par :
" #
nTn
1=P >a
100
Application : T50 = 2 et a = 34,76 d o lintervalle < = 2,88 .
a
TD 9 Annales corriges Universit Panthon-Assas, Paris II 181
Mai 2006
1 a) Lintervalle de confiance est unilatral gauche en raison de linterprta-
tion du paramtre. La taille dchantillon (n = 150 ) permet dutiliser le thorme
central limite :
pn p
n N (0, 1)
p 1 p loi
On a ici
p150 = 4 % et on lit dans la table 1 u = 1,645 do p < 7 % .
b) On doit utiliser labaque car n = 30 est trop petit ; on lit p < 8 % . Lestimation
de p est ici de 0 % contre 4 % dans le cas prcdent. Cependant, cela conduit mal-
gr tout un intervalle de confiance plus grand car la taille dchantillon est trs
petite. On ne peut pas conclure une meilleure qualit de la nouvelle machine.
n
n
L (x1 , ..., xn ; ) = f (xi ; ) = exp (xi ) = e exp xi
i=1 i=1 i=1
si xi pour 1 i n . Cette fonction de est croissante pour
min {x1 , ..., xn } puis nulle pour > min {x1 , ..., xn } (voir figure 9.3) :
L
Dunod. La photocopie non autorise est un dlit.
0 min xi
Figure 9.3
1
9
2
S29 = Yi Y9
8
i=1
Y9 m
9
S9
qui suit une loi de Student 8 degrs de libert. On peut donc trouver la valeur t
telle que :
Y m
1 = P t < 9 9 <t
S9
t t
Y9 S9 < m < Y9 + S9
3 3
Pour 1 = 0,95 le fractile est t = 2,306 et on obtient lintervalle :
Janvier 2006
1 Avec des notations videntes, les hypothses se traduisent par :
1 2 7
P (MY) = P (PR) = P (BV) =
10 10 10
9 5 1
P (MT |MY ) = P (MT |PR ) = P (MT |BV ) =
10 10 20
On en dduit :
7 1
P (BV MT) 7
P (BV |MT ) = = 10 20 =
P (MT) 1 9 2 5 7 1 45
+ +
10 10 10 10 10 20
2 a) La fonction de rpartition de X est nulle pour x 0 . Son expression pour
0 < x 1 est :
x
t x2
F (x) = dt =
0 2 4
Pour 1 x 2 :
x
1 2x 1
F (x) = F (1) + dt =
1 2 4
Pour 2 x 3 :
x
3t x2 + 6x 5
F (x) = F (2) + dt =
2 2 4
On a ensuite F (x) = 1 pour x > 3 .
b) On obtient :
1 2 3
x2 x 3x x2 3
E (X) = dx + dx + dx =
Dunod. La photocopie non autorise est un dlit.
0 2 1 2 2 2 2
2
X6
La v.a. suit une loi du khi-deux 1 degr de libert ; la condition :
3
2
X6 a
P < = 0,975
3 9
4 La loi du couple (X, Y) est donne dans le tableau suivant, avec les lois de X
et Y dans les marges :
X
0 1 2
Y
1 1/4 0 1/4 1/2
2 0 1/2 0 1/2
1/4 1/2 1/4 1
2
1
Avec par exemple P (X = 1, Y = 2) = 2 . On calcule partir du tableau
2
3 3
E (X) = 1, E (Y) = et E (XY) = . Ainsi cov (X, Y) = 0 et les variables X et Y sont
2 2
cependant dpendantes, car par exemple P (X = 1, Y = 1) = P (X = 1) P (Y = 1) .
Septembre 2005
1 La construction dun arbre permet dobtenir aisment
= {RR, RNR, RNNR, NNRR, NRNR, NRR} , avec :
3 1 1
P (RR) = P (RNR) = P (RNNR) =
10 5 10
1 1 1
P (NNRR) = P (NRNR) = P (NRR) =
10 10 5
On peut vrifier que la somme de ces probabilits est bien gale 1.
expression, quand 0 x 1 :
!x
x
t2
F (x) = 2 (1 t) dt = 2 t = 2x x2
0 2
0
On calcule ensuite la f.r. de Mn :
n
n
G (x) = P (Mn < x) = P (Xi < x) = P (Xi < x) = Fn (x)
i=1 i=1
TD 9 Annales corriges Universit Panthon-Assas, Paris II 185
La v.a. 4(X + 1)2 suit une loi du khi-deux 1 degr de libert ; la condition :
$
P 4X2 + 8X + 4 < 4a + 4 = 0,995
y
Dunod. La photocopie non autorise est un dlit.
0 1 x
Figure 9.4
186 TD Statistique et probabilits
n n
n
1 1
1 1 1 1
L (x1 , ..., xn ; ) = xi = xi
i=1 i=1
La log-vraisemblance est :
n
1
ln L (x1 , ..., xn ; ) = n ln +1 ln xi
i=1
On obtient comme drive :
n
ln L n
= + 2 ln xi
i=1
1
n
Elle sannule pour = ln xi . La drive seconde est :
n i=1
2
n
2 ln L n
= ln xi
2 2 3 i=1
Au point qui annule la drive premire, la drive seconde est ngative, donc
cela correspond un maximum et lestimateur du maximum de vraisemblance
TD 9 Annales corriges Universit Panthon-Assas, Paris II 187
est :
n
Tn = ln Xi
n
i=1
Nous avons E (Tn ) = E (ln X) , donc nous calculons :
+
1 1 1
E (ln X) = x ln xdx
1
Soit en intgrant par parties :
% &+ +
1 1 1
E (ln X) = x ln x + x dx =
1 1
Cet estimateur est donc sans biais et convergent daprs la loi des grands
nombres :
Tn E (ln X) =
p
Pour savoir sil est efficace on calcule alors la quantit dinformation de Fisher :
2
n
2 ln L n n
In () = E 2
= 2
+ 3
E (ln Xi ) =
i=1 2
Il faut maintenant calculer :
+
2 1 1 1 2
E (ln X) = x (ln x) dx
1
Soit en intgrant par parties :
% &+ +
2 1 2 1 1 2
E (ln X) = x (ln x) +2 x ln xdx = 2E (ln X) = 2
1 1
Ainsi V (ln X) = 2 et :
V (ln X) 2 1
Dunod. La photocopie non autorise est un dlit.
V (Tn ) = = =
n n In ()
donc lestimateur est efficace.
Mai 2005
1 a) Lintervalle de confiance unilatral obtenu avec labaque 1 est p > 93 % .
On a ici
p250 = 0,96 et on lit dans la table 1 u = 1,645 do p > 94 % , rsultat trs
proche du rsultat exact prcdent.
b) On doit utiliser labaque car n = 30 est trop petit ; on lit sur labaque 1 p > 90 %
avec pour cet chantillon p30 = 1 . Bien que lestimation soit plus leve que dans
le cas prcdent, cela conduit malgr tout un intervalle de confiance plus grand
car la taille dchantillon est trs petite. On ne peut pas conclure une meilleure
qualit du nouvel quipement.
n
Tn = (Xi 100)2
n
i=1
La v.a. nTn / suit une loi du khi-deux n degrs de libert, donc E (Tn ) = et
V (Tn ) = 22 /n.
b) Le paramtre mesurant un degr dimprcision, on choisit un intervalle unila-
tral dfini par :
" #
nTn
1=P >a
Pour n = 30 on lit a = 18, 49 et on obtient comme estimation :
A 1
T30 = (315400 200 3020) + 1002 = 380
30
do lintervalle < 617 .
c) Pour n = 50 on lit a = 34,76 et on obtient comme estimation :
B 1
T50 = (510000 200 4950) + 1002 = 400
50
do lintervalle < 575 . Bien que lestimation soit ici plus grande, lintervalle de
confiance est plus petit car la taille dchantillon est plus grande. Le modle B
parat donc de meilleure qualit.
G y = P ln X < y = P ln X > y = P X > ey
= 1 F ey
o F est la f.r. de la v.a. X . On en dduit par drivation la densit de Y , qui est
nulle pour y 0 et qui a pour expression pour y > 0 :
1
y y y
g y =e f e = e
On reconnat la densit de la loi exponentielle de paramtre 1/ .
b) Nous calculons lesprance :
1
1 1 1
E (X) = x dx =
0 +1
Pour calculer la variance, nous avons besoin de :
1
2 1 1 +1 1
E X = x dx =
0 2 + 1
Do :
2
V (X) = E X2 E2 (X) =
( + 1)2 (2 + 1)
c) Lexpression de la vraisemblance est :
n n
n
1 1
1 1 1 1
L (x1 , ..., xn ; ) = xi = xi
i=1 i=1
La log-vraisemblance est :
n
1
ln L (x1 , ..., xn ; ) = n ln + 1 ln xi
i=1
Dunod. La photocopie non autorise est un dlit.
n
ln L n
= 2 ln xi
i=1
1
n
Elle sannule pour = ln xi . La drive seconde est :
n i=1
2
n
2 ln L n
= + ln xi
2 2 3 i=1
Au point qui annule la drive premire, la drive seconde est ngative, donc
cela correspond un maximum et lestimateur du maximum de vraisemblance
est :
190 TD Statistique et probabilits
n
Tn = ln Xi
n
i=1
Nous avons E (Tn ) = E (ln X) = E (Y) = donc cet estimateur est sans biais ; il a
pour variance :
V (ln X) 2
V (Tn ) = =
n n
1
Il est donc convergent car cette variance tend vers 0 avec . Pour savoir sil est
n
efficace, on calcule la quantit dinformation de Fisher :
2
n
2 ln L n n
In () = E 2
= 2
+ 3
E (ln Xi ) =
i=1 2
Ainsi :
2 1
V (Tn ) = =
n In ()
donc lestimateur est efficace.
Janvier 2005
1 On a :
2 a) On obtient p1 = 1 p et :
2
p2 = P (V2 V1 ) + P V2 V1 = 1 p + p2
b) Pour n 2 :
pn = P Vn Vn1 + P Vn Vn1
= P Vn1 P Vn |Vn1 + P Vn1 P Vn Vn1
= pn1 1 p + 1 pn1 p = p + 1 2p pn1
c) On obtient :
1 n1 1 n
un = pn = 1 2p un1 = 1 2p u1 = 1 2p
2 2
Ainsi, pour 0 < p < 1 :
TD 9 Annales corriges Universit Panthon-Assas, Paris II 191
1 1 n 1
pn = + 1 2p car |1 2p| < 1
2 2 2
avec pn = 1 si p = 0 et p2k = 1, p2k+1 = 0 si p = 1 .
x1 < 1 < x2 < 1 x1 < 1 < 1 < x2 1 < x1 < x2 < 1 1 < x1 < 1 < x2
1 1 1 1 3
x32 + x2 + 2 1 (x2 x1 ) + x3 x31 x1 + x1 2
4 4 4 2 4
1
4 On obtient E (X) = 0 car la loi est symtrique, E (Y) =
2
,
cov (X, Y) = E (XY) = 0 . Les variables X et Y sont cependant dpendantes, car
1 3 3
par exemple P (X = 1, Y = 2) = = P (X = 1) P (Y = 2) = .
8 8 8
Dunod. La photocopie non autorise est un dlit.
Tables statistiques
Table 1
Fonction de rpartition de la loi normale centre rduite
Probabilit F(u) dune valeur infrieure u
Table 2
Fractiles dordre P de la loi normale centre rduite
196 TD Statistique et probabilits
Table 2 (suite)
Fractiles dordre P de la loi normale centre rduite
Grandes valeurs de u
Tables statistiques 197
Table 3
Loi binmiale
Probabilits cumules
198 TD Statistique et probabilits
Table 4
Loi de Poisson
Tables statistiques 199
Table 5
Fractiles dordre P de la loi 2
200 TD Statistique et probabilits
Table 6
Fractiles dordre P de la loi de Student T
Tables statistiques 201
Table 7
Fractiles dordre 0,95 de la loi de Fisher-Snedecor F(1 , 2 )
202 TD Statistique et probabilits
Table 7 (suite)
Fractiles dordre 0,975 de la loi de Fisher-Snedecor F(1 , 2 )
Tables statistiques 203
Abaque 1
Intervalles de confiance pour une proportion p
Intervalle bilatral de niveau de confiance 0,90
Intervalles unilatraux de niveau de confiance 0,95
204 TD Statistique et probabilits
Abaque 2
Intervalles de confiance pour une proportion p
Intervalle bilatral de niveau de confiance 0,95
Intervalles unilatraux de niveau de confiance 0,975
Index
A emv : 89
ensemble fondamental : 1, 5-7, 9, 11,
abaque : 159, 165, 171, 181, 187, 188 12, 25, 26, 160, 161, 164, 173, 175
algbre : 2, 7, 8 erreur quadratique moyenne : 86, 93
atome : 7, 15 esprance : 22, 25, 27, 36, 39, 42, 45,
56-58, 61, 81, 82, 119, 130, 131
B conditionnelle : 58, 60
biais : 86 estimateur
convergent : 86, 89-91, 113, 169, 171,
C 172, 178, 180, 190
du maximum de vraisemblance :
coefficient de corrlation : 52 88, 90, 91, 159, 160, 165, 166, 170,
combinaison sans rptition : 18 172, 181, 186, 189
convergence efficace : 87, 89-92, 113, 132, 159,
en loi : 73, 75, 76, 78, 79 160, 162, 163, 165-167, 169, 170,
en moyenne : 77, 79 172, 180, 187, 190
en moyenne quadratique : 74, 75, optimal : 162, 177
77, 79, 96, 119, 120 sans biais : 86, 87, 89-91, 113, 114,
en probabilit : 72-79, 86, 120 142, 145, 159, 162, 169, 171, 172,
convolution : 52 190
couple : 158, 161, 164, 166, 168 vnement
covariance : 23, 52, 56, 158, 160, 164, lmentaire : 1, 6, 9, 13, 14, 26, 61,
166, 168, 184, 191 164, 173, 175
incompatible : 5, 9
D indpendant : 5, 167, 175
densit : 36, 39-42, 44, 45, 53, 55, 56,
160-166, 170 F
conditionnelle : 161, 176
fonction de rpartition : 35, 40, 44, 47,
marginale : 59, 161, 164, 176, 185
56, 59, 114, 115, 127, 158, 160, 161,
163, 166, 169, 170, 174, 176, 183, 184,
E
188, 191
cart type : 22, 45, 90, 112, 129-131, formule
137, 152 de Bayes : 4, 11, 13
206 TD Statistique et probabilits
S V
support : 41 valeur extrme : 59, 132
variable alatoire certaine : 23, 29, 174
T variables alatoires indpendantes :
test 161, 164, 166, 176, 185
dadquation : 127, 135 variance : 22, 25, 26, 37, 39, 41, 42, 57,
dindpendance : 126, 135 112, 113, 119, 120, 145, 152
mixte : 138 empirique : 88, 148, 155, 159, 182,
UPP : 126, 133, 149 188
thorme vraisemblance : 87-89, 94, 101, 129,
central limite : 74, 78, 79, 113, 142, 137, 139, 141, 143, 145, 159, 170, 172,
169, 171, 181, 182, 187 180, 181, 186, 189
Dunod. La photocopie non autorise est un dlit.
TD co Sup
4 e dition
Jean-Pierre Lecoutre
PUBLIC
STATISTIQUE Licence conomie-
ET PROBABILITS Gestion, AES, MASS
MIAGE
- QCM
30% Cours
70%
Applications
- questions de rflexion
- exercices dentranement
- annales
+ corrigs