Vous êtes sur la page 1sur 49

Probabilités et Statistique pour SIC

Exercices

Exercice 1 Combien de mots de passe de 8 symboles peut-on créer avec 66 caractères ?

Exercice 2 Dans un pays, les voitures ont des plaques d’immatriculation composées de deux lettres (leur
alphabet a 26 caractères) suivies de trois chi↵res. Combien de plaques possibles y-a-t-il ?

Exercice 3 Un professeur dispose de 32 livres sur un rayon de sa bibliothèque. 23 d’entre eux sont des
livres de mathématiques et 9 de physique. Le professeur aimerait ranger ses livres de façon que tous les
livres traitant du même sujet restent groupés. Combien y a-t-il de dispositions possibles ?

Exercice 4 4 Américains, 3 Suisses et 5 Anglais doivent s’asseoir sur un même banc. Les gens de même
nationalité doivent rester ensemble. Combien de dispositions peut-on imaginer ?

Exercice 5 On veut former un comité comprenant 4 des 23 personnes d’un groupe. Combien y a-t-il de
ces comités ?

Exercice 6 Combien de mains de poker existe-t-il ? Le jeu comprend 52 cartes, une main en contient 5.

Exercice 7 Dans un groupe de 10 femmes et 8 hommes, on doit former un comité de 3 hommes et 3


femmes. Combien de comités di↵érents peut-on former si :
a) 2 des hommes refusent d’être ensemble dans le comité ?
b) 2 des femmes refusent d’être ensemble dans le comité ?
c) 1 homme et 1 femme refusent d’être ensemble dans le comité ?

Exercice 8 Un laboratoire de recherche en psychologie du rêve dispose de 4 chambres à deux lits. Trois
paires de vrais jumeaux sont étudiées. On veut placer chaque paire dans une chambre et assigner à chacun
un lit bien déterminé. De combien de manières peut-on organiser l’expérience ?

Exercice 9 Démontrer par le calcul que la construction du triangle de Pascal est correcte, c’est-à-dire
que
Cnk = Cnk 11 + Cnk 1

Exercice 10 n personnes dont A et B se mettent au hasard dans une rangée. Combien des manières
y-a-t-il d’avoir k personnes entre A et B ?

Exercice 11 Un dé est jeté jusqu’a ce qu’un 6 sorte, ce qui marque la fin de l’expérience.
a) Quel est l’ensemble fondamental pour cette expérience ?
b) Notons par En l’événement “l’expérience s’arrête au neme jet”. Quels points de l’ensemble fonda-
c
mental sont contenus dans En ? Décrire ([11 En ) .

Exercice 12 On jette deux dés. On note par E l’evénement “la somme des dés est impaire”, par F
l’evénement “au moins l’un des dés montre 1”, et par G “la somme des dés est 5”. Décrire
a) E \ F ,
b) E [ F ,
c) F \ G,
d) E \ F c ,
e) E \ F \ G.

Exercice 13 Trois joueurs, A, B et C, jettent une pièce à tour de rôle : A joue d’abord, puis B, puis C,
puis A etc. Le premier qui obtient pile a gagné. L’ensemble fondamental ⌦ de cette expérience peut être
décrit comme suit : ⇢
1, 01, 001, 0001, . . . ,
S=
0000 · · ·

1
a) Donner une interprétation des points de S.
b) Décrire les événements suivants en termes de ces points :
i) ”A gagne” ;
ii) ”B gagne” ;
iii) (A [ B)c .

Exercice 14 n personnes, dont A et B, se mettent au hasard dans une rangée.


a) Décrire l’ensemble fondamental associé à cette expérience, et en donner le nombre d’éléments.
b) Quelle est la probabilité qu’il y ait k personnes entre A et B (0  k  n 2) ?
c) Vérifier votre résultat pour n = 3 en explicitant tous les cas possibles.

Exercice 15 Quelle est la probabilité de tirer au moins un 6 lorsqu’on jette un dé quatre fois ?

Exercice 16 On répète n fois le lancer de deux dés. Calculer la probabilité que le six apparaisse au
moins une fois. Quelle valeur donner à n pour que cette probabilité atteigne 1/2 ?

Exercice 17 Combien de personnes faut-il pour que la probabilité qu’au moins deux d’entre elles aient
leur anniversaire le même mois soit au moins 1/2 ? Admettre que tous les mois sont équiprobables.

Exercice 18 Un récepteur se bloque si la durée entre les instants de réception de deux signaux est
inférieure au temp mort ✓. On sait que les deux signaux atteignent le récepteur dans l’intervalle de temps
(0, t), et arrivent indépendamment l’un de l’autre et au “hasard”.
a) Décrire l’ensemble fondamental ⌦ associé à cette experience stochastique.
b) Quelle est la probabilité que le récepteur se bloque ?
c) Simplifier votre résultat en admettant que ✓ ⌧ t.

Exercice 19 a) On jète une pièce n fois, n 2. On note Pn la probabilité que des piles successifs
n’apparaissent jamais lors des n jets. Montrer que
1 1
Pn = Pn 1 + Pn 2 n 4.
2 4
b) Montrer que limn!1 Pn = 0.
c) Soit Qn la probabilité que la suite P F P P P F F P n’apparaisse jamais lors de n jets. Montrer que
limn!1 Qn = 0.
Indication : La probabilité Qn que la suite P F P P P F F P n’apparaisse jamais lors de n jets est plus
petite que la probabilité Rn que la même suite n’apparaisse jamais entre le jet numéro 8i et le jet numéro
8(i + 1) 1 où i est un entier plus petit ou égal à n/8 8.

Exercice 20 On jette un dé trois fois.


a) Décrire l’ensemble fondamental de cette expérience.
b) Quelle est la probabilité que la somme des dés soit supérieure ou égale à 15 ?

Exercice 21 On jette deux pièces équilibrées. Quelle est la probabilité que l’une des deux pièces tombe
sur pile ?

Exercice 22 En 1654 de Méré propose à Pascal le problème suivant : Est-il plus probable d’obtenir au
moins un 6 avec 4 dés que d’obtenir au moins un double 6 lors de 24 jets de deux dés ?
Donner la réponse à cette question.

Exercice 23 Soit S la somme des valeurs de trois dés jetés simultanément. Il y a six configurations
di↵érentes qui permettent d’obtenir 9 ou 10 :
pour S = 9 : (6,2,1), (5,3,1), (5,2,2), (4,4,1), (4,3,2) et (3,3,3),
pour S = 10 : (6,3,1), (6,2,2), (5,4,1), (5,3,2), (4,4,2) et (4,3,3).
Peut-on en conclure que
P (S = 9) = P (S = 10)?

Exercice 24 D’une urne contenant 20 boules numérotées de 1 à 20, on tire sans remplacement 3 des
boules. Quelqu’un parie qu’au moins une des boules tirées portera un numéro égal ou supérieur à 17.
Quelle est la probabilité qu’il gagne ?

2
Exercice 25 Une urne contient 25 boules, 15 sont rouges et 10 sont vertes. Cinq boules sont tirées au
hasard, sans remise.
a) Trouver la probabilité que la première, la troisième et la cinquième boule soient rouges et que la
deuxième et la quatrième soient vertes.
b) Trouver la probabilité que la première, la deuxième et la troisième boule soient rouges et que la
quatrième et la cinquième soient vertes.
c) Trouver la probabilité que la la deuxième et la troisième boule soient rouges et que la première, la
quatrième et la cinquième soient vertes.
Exercice 26 Même exercice que le problème 36 ! ! !
Exercice 27 On considère 3 cartes à jouer de même forme. Cependant, les deux faces de la première
carte ont été colorées en noir, les deux faces de la deuxième carte en rouge tandis que la troisième porte
une face noire et l’autre rouge. On mélange les trois cartes au fond d’un chapeau, puis une carte tirée au
hasard en est extraite et placée au sol. Si la face apparente est rouge, quelle est la probabilité que l’autre
soit noire ?
Exercice 28 Pour dépister une maladie, on applique un test. Si le patient est e↵ectivement atteint, le
test donne un résultat positif dans 99% des cas. Mais il se peut aussi que le résultat du test soit positif
alors que le consultant est en bonne santé, et ceci se produit dans 2% des cas. Sachant qu’en moyenne
un consultant sur 1000 est atteint de la maladie à dépister, calculer la probabilité pour qu’un client soit
atteint sachant que son test a été positif. Que penser de ce résultat ?
Exercice 29 Les jours peuvent être ensoleillés ou nuageux. Le temps du lendemain est le même que
celui d’aujourd’hui avec probabilité p, et di↵érent avec probabilité q, où p + q = 1. S’il est ensoleillé
aujourd’hui, montrez que la probabilité sn qu’il soit ensoleillé le neme jour suivant satisfait
sn = (p q)sn 1 + q; n 1
où s0 = 1. En déduire que
1
sn = (1 + (p q)n ); n 0.
2
Exercice 30 Une unité de production comprend deux machines automatiques fonctionnant indépendamment
l’une de l’autre. Chaque machine a la fiabilité p au cours d’une journée, ce qui signifie que sa probabilité
de tomber en panne pendant cette période est égale à 1 p. Dans ce cas, elle sera réparée pendant la
nuit et se retrouvera en état de marche le lendemain. Une seule machine peut être réparée à la fois.
On note Xn = nombre de machines en panne au début de la nième journée, n = 1, 2, . . .. Calculer les
probabilités conditionnelles P (Xn+1 = 0|Xn = 0), P (Xn+1 = 1|Xn = 0), P (Xn+1 = 0|Xn = 1) et
P (Xn+1 = 1|Xn = 1).
Exercice 31 Les pièces fabriquées par une usine sont soumises à un contrôle, mais le mécanisme de
contrôle n’est pas entièrement fiable. En e↵et, si une pièce est bonne, elle est acceptée avec une probabilité
de 0.9, par contre si elle est défectueuse, elle est refusée avec une probabilité de 0.8.
a) Si un lot comprend trois pièces bonnes et une pièce défectueuse, quelle est la probabilité que ces
quatre pièces soient acceptées lors du contrôle ?
b) Quelle est la probabilité qu’il y ait une erreur lors du contrôle d’une pièce si l’on sait qu’il y a en
moyenne 20% de pièces défectueuses dans la production ?
c) Quelle est la probabilité qu’une pièce acceptée par le contrôle soit défectueuse (si l’on admet de
nouveau qu’il y a en moyenne 20% de pièces défectueuses dans la production) ?
Exercice 32 Un couple a deux enfants. Quelle est la probabilité que les deux soient des filles sachant
que l’aı̂née en est une ?
Exercice 33 On jette deux dés équilibrés. Quelle est la probabilité qu’au moins l’un d’entre eux montre
6, sachant que les deux résultats sont di↵érents ?
Exercice 34 On choisit trois cartes au hasard et sans remise dans un jeu ordinaire de 52 cartes. Calculer
la probabilité que la première carte tirée soit un pique, sachant que les deux dernières en sont.
Exercice 35 On admet que 5% des hommes et 0, 25% des femmes sont daltoniens. On sélectionne une
personne daltonienne au hasard. Quelle est la probabilité qu’il s’agisse d’un homme ? On admettra que les
hommes sont aussi nombreux que les femmes. Si au contraire il y en avait deux fois plus que de femmes,
que deviendrait le résultat ?

3
Exercice 36 La couleur des yeux d’une personne est déterminée par une unique paire de gènes. Si les
deux sont des gènes yeux bleus, la personne aura les yeux bleus ; si les deux sont des gènes yeux marrons,
la personne aura les yeux marrons ; si l’un est un gène oeil bleu et l’autre un gène oeil marron, la personne
aura les yeux marrons (car le gène oeil marron est dominant par rapport au gène oeil bleu). Un nouveau-né
reçoit indépendamment un gène oeil de chacun de ses parents et le gène qu’il reçoit d’un de ses parents a
autant de chances d’être l’un des deux gènes oeil de ce parent. Supposons que Xavier et ses deux parents
ont les yeux marrons, mais que la soeur de Xavier a les yeux bleus.
a) Quelle est la probabilité que Xavier ait un gène oeil bleu ?
b) Si la femme de Xavier a les yeux bleus, quelle est la probabilité que leur premier enfant ait les yeux
bleus ?

Exercice 37 a) On tire au hasard n boules sans remise d’une urne en contenant N de couleur blanche
et M de couleur noire. Donner la fonction de masse de la variable aléatoire X qui compte le nombre de
boules blanches tirées. Démontrer que l’espérance de X est N n/(M + N ).
Indication : écrire le nombre de boules blanches tirées comme la somme de Xi , 1  i  N , où Xi est égal
à 1 si la i-ème boule blanche a été tirée parmi les n boules, et 0 sinon.
b) Une urne contient N boules blanches et M noires. On prélève des boules une à une jusqu’à ce que
la première boule blanche apparaisse. Si on désigne par X le nombre de boules alors prélevées, quelle est
l’espérance de X ?

Exercice 38 On jette simultanément deux dés à six faces jusqu’à l’obtention d’une somme de 5 ou de 7.
a) Le jeu s’est arrêté au jième lancer. Quelle est la probabilité qu’on ait obtenu une somme de 5 au
jième lancer ?
b) Quelle est la probabilité de finir de jouer avec une somme de 5 ?
c) Quel est le nombre moyens de jets jusqu’à l’arrêt du jeu ?

Exercice 39 On jette une pièce n fois. Supposons que lors de chaque jet, la probabilité d’obtenir pile
est p, où p 2 [0, 1]. Les résultats sont supposés indépendants.
a) Donner la loi de probabilité de la variable X qui compte le nombre de piles obtenus.
b) Donner l’espérance et la variance de X.

Exercice 40 a) Un parc contient L lions et T tigres. Un employé du parc est chargé de silloner le parc.
Chaque fois qu’il voit un lion ou un tigre, il note sur un calepin le type d’animal (lion ou tigre) qu’il a vu.
Il s’arrête une fois qu’il a noté n animaux pour faire un rapport à son chef. Quelle est la loi du nombre
de lions notés dans le rapport ? Donner la probabilité que k lions aient été notés.
b) Dans un parc concurrent, une autre statégie est adoptée : chaque fois que l’employé (courageux !)
voit un lion ou un tigre, il le capture. Après avoir capturé n animaux, l’employé fait un rapport à son
chef. Quelle est la loi du nombre de lions notés dans le rapport ? Donner la probabilité que k lions aient
été capturés.

Exercice 41 42800 mariages ont été célébrés en Suisse en 2010. En expliquant vos hypothèses et en
donnant les lois de probabilités correspondantes, calculer la probabilité que pour exactement 2 de ces
couples :
a) les deux époux soient nés un 1er janvier,
b) les deux époux aient le même jour d’anniversaire.

Exercice 42 Un assistant de mathématiques essaie désespérément de passer son permis de conduire. On


suppose qu’il a une probabilité p 2 (0, 1] de réussir son permis à chaque essai, et on note T le nombre
d’essais nécessaires pour qu’il réussisse son permis. Donner la fonction de masse de T , sa moyenne et sa
variance.

Exercice 43 La fonction de masse d’une variable aléatoire X est donnée par


i
P (X = i) = c , i = 0, 1, 2, . . . ,
i!
où est un réel positif.
a) Calculer c et reconnaı̂tre la loi de X
a) Calculer P (X = 0).
b) Calculer P (X > 2).
c) Donner l’espérance et la variance de X.

4
Exercice 44 Soient X et Z deux variables à valeurs entières 0. On suppose que :
a) Z est une variable de Poisson de paramètre .
b) X  Z et :
8n 0 , 8k  n , P {X = k|Z = n} = Cnk pk (1 p)(n k)

(autrement dit : la loi conditionnelle de X sachant que Z = n est binomiale de paramètres n et p,


pour un 0 < p < 1 fixé).
Prouver que X et Y = Z X sont deux variables de Poisson indépendantes, et donner leurs paramètres
respectifs.

Exercice 45 Calculer les deux premiers moments d’une variable aléatoire X distribuée géométriquement
(paramètre p) en utilisant sa fonction génératrice des moments.

Exercice 46 On considère le jeu suivant, qui peut être joué autant de fois que voulu. Chaque tour est
indépendant et à chaque fois, la probabilité de gagner est p. A chaque tour, le joueur parie une certaine
quantité x, quelconque. En cas de réussite, le joueur récupère le double de sa mise. En cas d’échec, le
joueur perd sa mise. Arnaud applique une stratégie simple : il joue tant qu’il n’a pas gagné. Au premier
tour, il parie 100CHF. A chaque tour perdu, il parie le double de sa mise au tour précédent. Dès qu’il a
gagné une fois, il s’arrête.
a) Quelle est la quantité misée par Arnaud au tour n ?
b) Quelle est la loi du nombre de tours joués par Arnaud jusqu’au premier succès ?
c) Montrer que la valeur moyenne de la mise d’Arnaud au tour où il s’arrête est
⇢ 100p
2(1 p) si p > 1/2
1 si p  1/2

En donner une interprétation.

Exercice 47 Un livre de 350 pages contient 450 erreurs d’impression réparties au hasard. Calculer de
deux façons di↵érentes la probabilité pour qu’il y ait au moins trois erreurs dans une page déterminée.

Exercice 48 Montrer que si X et Y sont deux variables indépendantes suivant les lois de Poisson de
paramètres respectifs 1 et 2 alors Z = X + Y suit la loi de Poisson de paramètre 1 + 2 :
a) Par calcul direct de la fonction de masse.
b) En utilisant la fonction génératrice des moments.

Exercice 49 On suppose que la taille, en centimètres, d’un homme âgé de 25 ans est une variable
aléatoire normale de paramètres m = 175 et 2 = 36. Quelle est la pourcentage d’hommes de 25 ans
ayant une taille supérieure à 185 cm ? Parmi les hommes mesurant plus de 180 cm, quel pourcentage
d’entre eux dépassent 192 cm ?

Exercice 50 Le nombre de kilomètres couverts par une batterie de voiture avant défaillance est distribué
exponentiellement et sa valeur moyenne est de 10000 kilomètres. Une personne souhaite se lancer dans un
voyage de 5000 kilomètres. Avec quelle probabilité terminera-t-elle son voyage sans avarie de batterie ?

Exercice 51 Pour fonctionner, un système utilise une cellule interchangeable. On dispose de la pièce
originale et d’une cellule de rechange. Si le système a une durée de vie aléatoire X et si sa densité est
donnée (en mois) par : ⇢
cxe x/2 x>0
f (x) =
0 x0
quelle est la probabilité que le système fonctionne pendant au moins 5 mois ?

Exercice 52 La vitesse d’une molécule au sein d’un gaz homogène en état d’équilibre est une variable
aléatoire, dont la fonction de densité est donnée par
⇢ 2
ax2 e bx x 0
f (x) =
0 x<0

où b = m/2kT et k, T, m sont respectivement la constante de Boltzmann, la température absolue et la


masse de la molécule. Évaluer a en fonction de b.

5
Exercice 53 Si X admet la densité de probabilité fX (x) = ⇡1 1+x
1
2 , on dit que X est une variable aléatoire

de Cauchy. Montrer que X n’admet pas d’espérance mathématique.

Exercice 54 Soit X une variable aléatoire de loi gamma, de densité


⇢ ↵ x ↵ 1
f (x) = (↵) e x si x 0
0 si x < 0,
R1 y ↵ 1
pour ↵ > 0, > 0 et où ( ↵) = 0 e y dy est la fonction gamma.
a) En employant une intégration par parties, montrer que ( ↵) = (↵ 1) (↵ 1). Pouvez-vous trouver
une expression pour ( n) quand n est un nombre entier ?
b) Montrer que l’espérance de X est ↵/ .

Exercice 55 Les pièces d’une voiture sont souvent copiées, et vendues comme des pièces originales. On
veut remplacer certaines pièces d’une voiture. Avec probabilité 1/4 on achète une pièce pirate, et avec
probabilité 3/4 on achète une pièce originale. La durée de vie est une variable aléatoire exponentielle de
paramètre 5 pour une pièce pirate, et de paramètre 2 pour une pièce originale. Appelons T la durée de
vie de la pièce que l’on achète. Supposons que la pièce ait survécu jusqu’au temps t après son installation.
Quelle est la probabilité ⇡(t) que cette pièce soit pirate ? Trouver la limite de ⇡(t) lorsque t ! 1.

Exercice 56 Soit X une variable normale centrée réduite et Y = eX (on dit que Y est une variable
lognormale). Calculer la moyenne et la variance de Y .
Indication : on donne la fonction génératrice des moments de X : MX (t) = exp(t2 /2), t 2 R.

Exercice 57 On dispose de deux composants électroniques dont les durées de vie (temps avant la panne),
exprimées en années, sont modélisées par des variables aléatoires X et Y indépendantes. On suppose que
la durée de vie moyenne du premier composant est un an, alors que le deuxième composant a une durée
de vie moyenne de 6 mois.
a) Donner les lois de X et Y .
b) Calculer leurs fonctions de répartition FX et FY .
On considère deux montages possibles pour ces composants : en série ou en parallèle. Le système
monté en série tombe en panne dès que l’un des composants tombe en panne. Le système monté en
parallèle tombe en panne lorsque les deux composants sont tombés en panne. On note S la durée de vie
du système en série et T celle du système en parallèle.
c) Calculer la fonction de répartition FT de T .
d) Calculer la fonction de répartition FS de S.
e) Calculer la probabilité que le composant de durée de vie X fonctionne toujours à l’instant x (x > 0)
sachant que le système en série est tombé en panne avant cet instant.
f) Sachant que le composant de durée de vie X est tombé en panne avant l’instant x, quelle est la
probabilité que le système en parallèle fonctionne toujours à un instant t (avec t > x) ?

Exercice 58 Soient X1 , . . . , Xn des variables aléatoires exponentielles indépendantes de paramètre com-


mun . Calculer la fonction de répartition de min(X1 , . . . , Xn ) et reconnaı̂tre cette distribution.

Exercice 59 Si X est une variable aléatoire exponentielle de paramètre = 1, calculer la densité de la


variable aléatoire Y définie par Y = ln X.

Exercice 60 Soit X une variable aléatoire normale d’espérance nulle et de variance 1. Calculer la densité
de la loi de Y = eX (on dit que Y est une variable lognormale).

Exercice 61 Soient X et Y deux variables aléatoires avec une densité conjointe f (x, y). Calculer la loi
de X et de Y dans les cas suivants et déterminer dans chaque cas si X et Y sont idépendantes :
a) f (x, y) = xe x(1+y) pour x, y 0, et f (x, y) = 0 sinon.
b) f (x, y) = 60xy 2 pour x, y 0 et x + y  1, et f (x, y) = 0 sinon.

Exercice 62 Donner une expression pour la fonction de répartition et pour la densité du maximum Z
puis du minimum Z̃ de deux variables aléatoires continues indépendantes X et Y .

Exercice 63 Soit Z = X + Y où X et Y sont des variables exponentielles indépendantes de paramètres


1 et 2 .
a) Donner la fonction de répartition de Z.
b) Calculer sa fonction génératrice des moments.

6
c) La fonction génératrice des moments d’une variable aléatoire G de loi gamma de paramètres ↵,
est donnée par :
MG (t) = ( )↵ , t < .
t
Déduire du b) sous quelle condition sur 1 et 2 , la variable Z est-elle de loi Gamma et quels en sont
alors les paramètres ?

Exercice 64 Soit (X, Y ) un vecteur aléatoire de densité de probabilité jointe :



1/⇡ si x2 + y 2  1
h(x, y) =
0 sinon .

a) Calculer les densités marginales f et g de X et de Y . X et Y sont-elles indépendantes ?


b) Trouver Cov(X, Y ) sans calcul.

Exercice 65 On lance deux dés équilibrés. On note X1 (resp. X2 ) le plus grand (resp. le plus petit) des
deux résultats. Donner les fonction de masse de X1 et de X2 et les tracer.

Exercice 66 Un programme consiste en deux modules indépendants. Le nombre d’erreurs X1 dans le


premier module a la fonction de masse P1 et le nombre d’erreurs X2 dans le deuxième module a la fonction
de masse P2 où

x 0 1 2 3
P1 (x) 0.5 0.2 0.2 0.1
P2 (x) 0.7 0.2 0.1 0
a) Vérifier que P1 et P2 sont bien des fonctions de masse.
b) Tracer les fonctions de répartition de X1 et X2 .
c) Calculer la fonction de masse de Y = X1 + X2 , le nombre total d’erreurs dans le programme.
d) Tracer sa fonction de répartition.

Exercice 67 Les variables aléatoires X et Y sont telles que X est de moyenne 1 et de variance 4, Y est
de moyenne 2 et de variance 9, et corr(X, Y ) = 1/3. Quelle est la variance de 3X 2Y + 1 ? Quelle est la
covariance de X + 2Y avec X Y ? Si Z est une autre variable aléatoire vérifiant E(3X 2Y + Z) = 0,
quelle est la moyenne de Z ?

Exercice 68 Soient X1 et X2 deux variables aléatoires indépendantes avec distribution binomiale de


paramètres n et ⇡. Quelle est la variance de X1 X2 ? Si X1 , . . . , Xn sont des observations issues d’une
loi binomiale (n,⇡ ), quelle est la varaince de leur somme S = X1 + · · · + Xn ?

Exercice 69 Soit X et Y deux variables aléatoires indépendantes, la première avec moyenne 2 et variance
3, la seconde avec moyenne 4 et variance 5.
a) Quelle est la moyenne de 5X 3Y + 9 ? Quelle est la variance de 3Y 2X ?
2
b) Supposant que X et Y sont de même variance , si X + Y est de variance 96 et X Y de variance
64, que vaut la corrélation corr(X, Y ) ?

Exercice 70 On lance un dé équilibré n fois. Soit X1 le nombre total de 1 obtenus pendant les n lancés,
et X2 le nombre total de 2.
a) Quelles sont les distributions de X1 et X2 ? Pourquoi ?
b) Quelles sont les variances de X1 et X2 ?
c) On pose la variable aléatoire U = X1 + X2 . Que représente-t-elle ? En considérant la distribution de
la variable aléatoire U et de là obtenant sa variance, déduire que le coefficient de corrélation de X1
avec X2 est ⇢ = 1/5.
d) Quelle est la variance de V = X1 X2 , et quelle est sa corrélation avec U ?

Exercice 71 On suppose que X et Y sont des variables aléatoires indépendantes suivant chacune la loi
uniforme sur [0, 1]. Montrer que Z = X + Y admet pour densité
8
< z si 0  z  1
fZ (z) = 2 z si 1  z  2 .
:
0 sinon

7
Exercice 72 Soit Z le total des points obtenus à pile ou face, avec 0 le gain pour pile et 1 pour face, et
en lançant indépendamment un dé équilibré, dont la face indique le nombre de points obtenus. Donner
la fonction de densité de Z et l’espérance conditionnelle E(Z | X = x), où X représente le résultat de
pile ou face. Calculer également la variance conditionnelle var(Z | X = x) et vérifier que les résultats
concordent avec le théorème 167.

Exercice 73 Soit X et Y des variables aléatoires Bernoulli et géométrique indépendantes. Trouver la


fonction de densité de Z = X + Y et calculer les espérances conditionnelles de Z sachant X = x et de Z
sachant Y = y.

Exercice 74 Un programme informatique est composé de trois sections : une section d’initialisation A,
une section de calcul B composée de 100 cycles de calcul identiques et indépendants, et une section finale
C. On a enregistré les temps de calcul du programme pour chacune des trois sections. Le tableau suivant
résume les temps de calcul obtenus.

Section Temps moyen (ms) Déviation standard (ms)


Initialisation A 5.5 2.5
Calcul B (composé de 100 cycles) 3.4 2.6
Finalisation C 4.5 1.3
Tous les temps sont indépendants exceptés ceux des sections A et C dont la corrélation vaut 0.2.
a) Calculer cov(A, C).
b) Calculer la moyenne et la variance du temps d’exécution total T du programme.
c) Les temps des sections A et C sont normalement distribués. Bien que le temps de calcul d’un cycle
de la section B ne soit pas normalement distribué, expliquer pourquoi la distribution du temps total
de la section B (qui comporte 100 cycles) peut être approximée par une loi normale et préciser les
paramètres de cette distribution.
d) Calculer la proportion des cas pour lesquels le programme prend
i) moins de 10 ms,
ii) plus de 20 ms.

Exercice 75 Un professeur sait par expérience que la note de test d’un étudiant se présentant à un
examen final est une variable aléatoire d’espérance 75.
a) Donner une borne supérieure à la probabilité que la note de test d’un étudiant dépasse 85.
Supposons maintenant que le professeur sache en plus que la variance de la note de test d’un étudiant
est 25.
b) Que peut-on dire de la probabilité qu’un étudiant obtienne une note comprise entre 65 et 85 ?
c) Combien faudrait-il qu’il se présente d’étudiants à cet examen pour assurer, avec une probabilité
d’au moins 0,9, que la moyenne de la classe soit de 75 plus ou moins 5 ? Ne pas utiliser le théorème central
limite.
d) Utiliser le théorème central limite pour résoudre la partie c).

Exercice 76 On considère n variables aléatoires réelles X1 , X2 , . . . , Xn , indépendantes et identiquement


distribuées, ayant pour fonction de densité :
8
< 0 si x < 0
f (x) = ↵x si 0  x  ✓
:
0 si x > ✓

(✓ est un paramètre réel > 0 ).


a) Déterminer la valeur de ↵ pour laquelle f✓ est bien une fonction de densité.
b) Donner la fonction de répartition FMn du maximum Mn des variables X1 , X2 , . . . , Xn et calculer
ses deux premiers moments.
c) Montrer que Mn converge en probabilité vers ✓.

Exercice 77 On arrondit 50 nombres à l’entier le plus proche et on e↵ectue la somme. Si les erreurs
d’arrondi individuelles sont distribuées uniformément sur ( 0, 5, 0, 5), quelle est la probabilité que la
somme obtenue ait un écart de plus de 3 par rapport à la somme exacte ?

8
Exercice 78 On a 100 ampoules dont les durées de vie sont des variables aléatoires indépendantes
exponentielles de moyenne 5 heures. Si l’on allume une ampoule à la fois et que chaque ampoule grillée
est instantanément remplacée par une neuve, qu’elle est la probabilité qu’il reste encore au moins une
ampoule intacte après 525 heures ?

Exercice 79 Un local doit être éclairé en permanence ; lorsque l’ampoule tombe en panne, elle est
immédiatement remplacée par une nouvelle ampoule. Il en existe de deux qualités : une qualité A de
durée de vie (en heure) exponentielle de paramètre A = 0.01 et une qualité B de durée de vie (en
heures) exponentielle de paramètre B = 0.02. On a stocké 40 ampoules de qualités A et 60 de qualité B.
Quelle est la probabilité que cette réserve soit suffisante pour une illumination de 6500 heures du local ?

Exercice 80 Quelle est la probabilité qu’un dé équilibré jeté 120 fois produise moins de 16 fois le nombre
six ?

Exercice 81 Une pièce est lancée 500 fois. Quelle est la probabilité pour que le nombre de faces di↵ère
de 250 d’au plus 10 ?

Exercice 82 Soit X une variable aléatoire distribuée uniformément dans l’intervalle (0, 1), i.e. : X prend
ses valeurs dans (0, 1) et P {↵ < X < } = ↵, si 0  ↵ <  1.
a) On pose Y = ln X. Calculer l’espérance de Y et la variance de Y .
b) Si X1 , . . . , X100 sont 100 variables indépendantes de même loi que X et si Z = X1 X2 . . . X100 ,
donner une approximation de P {Z < 10 40 }. Indication : passer au logarithme et utiliser a).

Exercice 83 Expliquer brièvement les termes ⌧ robuste et ⌧ mesure de localisation dans l’énoncé
⌧la médiane est une mesure de localisation robuste .

Exercice 84 Définir la corrélation empirique pour un échantillon de n paires d’observations (xi , yi ),


i = 1, . . . , n. Esquisser les types de nuages de points de x et y auxquels on s’attend lorsque la corrélation
empirique vaut 1, 0 et 1.

Exercice 85 Soient X1 , . . . , Xn des observations avec moyenne empirique X̄ et variance empirique s2 =


0. Laquelle (lesquelles ?) des affirmations suivantes est-elle correcte ? Justifier.
a) La taille de l’échantillon est trop petite.
b) Toutes les observations sont égales.
c) X̄ = 0.
d) Les observations sont normalement distribuées.

Exercice 86 Quelles affirmations ci-après s’appliquent à la corrélation empirique rXY ? Justifier.


a) Dépend des unités dans lesquelles sont exprimées X et Y .
b) Mesure l’association des variables X et Y .
c) Est comprise entre 1 et 1.
d) Ne peut jamais être exactement zéro.

Exercice 87 Lesquelles des affirmations suivantes s’appliquent à la covariance empirique sXY ? Justifier.
a) Mesure l’association des variables X et Y
b) Est comprise entre 1 et 1.
c) Ne peut jamais être exactement zéro.
d) Dépend des unités dans lesquelles sont exprimées X et Y .

Exercice 88 On a pesé dix pommes cueillies aléatoirement sur un arbre, et on donne leur poids en
grammes ci-dessous.

121.9 164.4 167.3 170.1 178.6 99.2 96.4 187.1 144.6 172.9

a) Obtenir un intervalle de confiance à 90% pour le poids moyen µ d’une pomme.


b) Expliquer ce qu’on entend par ⌧ intervalle de confiance à 90% dans le point précédent.

9
Exercice 89 Lors d’un test, on a demandé à 120 personnes qui était Jean-Jacques Rousseau, et 12
d’entre elles ont répondu qu’il était plongeur. Estimer la proportion de la population qui a donné une
mauvaise réponse. Obtenir un intervalle de confiance à 95% pour cette proportion. (Question subsidiaire :
qui était vraiment Jean-Jacques Rousseau ?)

Exercice 90 Une entreprise analyse la durée des conversations téléphoniques de ses employés de bureau.
Neuf conversations consécutives avaient pour durée, en minutes :

10.3, 9.4, 9.9, 7.5, 11.7, 3.4, 7.8, 11.0, 10.0.

a) Calculer la moyenne empirique x̄ et la variance empirique s2 de ces observations. Quelles sont les
unités de x̄ et de s2 ?
b) Si on ajuste une distribution normale à ces observations, quelle est la probabilité que qu’une conver-
sation téléphonique dure plus de 10 minutes ?
c) Tester au niveau 5% si la durée moyenne des conversations téléphoniques égale huit minutes contre
son alternative qu’elle ne dure pas huit minutes.

Exercice 91 On e↵ectue 25 mesures d’une constante physique m dans un laboratoire, en supposant


que ces mesures suivent une loi normale N (m; 2 ) de variance 2 connue. A l’issue de ces 25 mesures,
l’intervalle de confiance à 90% obtenu pour m est : [6, 04; 6, 18]. Combien de mesures supplémentaires
doit-on e↵ectuer si l’on veut :
a) diminuer de moitié la longueur de l’intervalle de confiance à 90% pour m ?
b) obtenir un intervalle de confiance à 95% pour m ayant la même longueur ?

Exercice 92 On observe les données x1 , . . . , x6 , distribuées selon la loi N (m1 ; 12 ), et y1 , . . . , y12 dis-
tribuées selon la loi N (m2 ; 22 ) (m1 , m2 , 12 et 22 sont inconnus, et les variables sont supposées indépendantes
dans leur ensemble). Pour le premier échantillon, les moyenne et variance empirique sont de : m̂x =
1
P6 2 1
P6
6 k=1 xk = 49, 2 et ˆx = 5 k=1 (xk m̂x )2 = 2, 8, tandis que pour le deuxième échantillon on obtient :
2
m̂y = 48, 4 et ˆy = 3, 04.
a) Construire des intervalles de confiance à 95% pour m1 et pour m2 .
b) On dispose à présent de plus d’information qu’au point a) : les variances 12 et 22 sont maintenant
supposées connues, de valeurs respectives 2, 5 et 3. Donner de nouveaux intervalles de confiance à 95%
pour m1 et m2 .
c) En supposant toujours que 12 = 2, 5 et 22 = 3, donner la distribution de la di↵érence (m̂X m̂Y )
des moyennes empiriques de chaque échantillon, puis construire un intervalle de confiance à 90% pour
(m1 m2 ).

Exercice 93 Les poids en grammes de 1000 pots de confiture sortis successivement d’une machine à
conditionner ont été les suivants (les résultats sont donnés par classes de longueur 2, l’origine de la 1ère
classe étant 2000 et l’extrémité de la dernière 2024) :

classe 1 2 3 4 5 6 7 8 9 10 11 12
nombre de pots 9 21 58 131 204 213 185 110 50 16 3 0

On admet que les poids X des pots sont indépendants de loi N (m; 2 ).
a) Donner une estimation de m et 2 .
b) Donner des intervalles de confiance de niveau 95% et 99% pour m.

Exercice 94 Une étude e↵ectuée sur 300 employés d’une entreprise a révélé que le nombre moyen, X,
de cafés bus annuellement à la cafétéria de l’entreprise par un employé suit une loi normale de moyenne
500 et d’écart-type 100. Donner un intervalle de confiance à 95% de la moyenne et de la variance de X.

Exercice 95 Une entreprise souhaite recruter un ingénieur informaticien mais n’a pas encore décidé
quel salaire annuel proposer pour l’embauche. Ne voulant pas proposer un salaire trop éloigné des salaires
moyens proposés dans les autres entreprises, le recruteur décide d’interroger 1000 ingénieurs sur leurs
salaires annuels. Il ressort de l’enquête que le salaire moyen des 1000 ingénieurs est de 48000 CHF avec
un écart-type de 12000 CHF.
a) Donner l’intervalle de confiance au seuil 90% du salaire moyen.
b) Est-il raisonnable de dire que grosso-modo le salaire moyen d’un ingénieur est de 50000 CHF ?

10
Exercice 96 On observe un échantillon y1 , . . . , yn d’une distribution Gamma(3, ✓) de densité
1 ✓y
f (y) = ✓e (✓y)2 y > 0.
2
Déterminer les estimateurs du maximum de vraisemblance de ✓.

Exercice 97 Donner l’estimateur de vraisemblance d’une distribution de Poisson (2✓) à partir d’un
échantillon z1 , . . . , zm .

Exercice 98 Dans la population des ménages d’un pays lointain on considère le montant des économies
mensuelles X (exprimées en milliers de maravedis) qui possède la distribution de densité

f (x) := k 2 xe kx
1[0,+1] (x) x 2 R,

où le paramètre k est inconnu. On prélève un échantillon de 400 ménages et on a calculé la moyenne
x̄ = 2.
a) Estimer k en utilisant la méthode de maximum de vraisemblance.
b) En donner un intervalle de confiance au seuil 95%.
c) Quel est le pourcentage des familles qui économisent moins de 1000 maravedis par mois (on oublie
l’erreur d’estimation de k) ?

Exercice 99 Considérons un disque D de centre O connu et de rayon R inconnu.


a) On choisit un point x uniformément dans D. Ceci signifie que si A est un sous-ensemble de D de
surface s(A), alors : P {x 2 A} = s(A)/(⇡R2 ). Soit ⇢ la distance de x à O. Pour r 0, que vaut la
probabilité P {⇢  r} ? En déduire la densité de la variable aléatoire ⇢.
b) On choisit maintenant n points indépendamment et uniformément dans D, en notant ⇢1 , ⇢2 , . . . , ⇢n
leurs distances au centre O. Donner l’estimateur du maximum de vraisemblance de R comme fonction de
⇢1 , ⇢2 , . . . , ⇢n . Calculer le biais de cet estimateur et donner ensuite un estimateur sans biais de R.

Exercice 100 Soit X1 , . . . , Xn un échantillon aléatoire issu de la loi uniforme U (0, b). Trouver l’estima-
teur de maximum de vraisemblance de b.

Exercice 101 On considère un n échantillon X1 , . . . , Xn de loi p U [0, a] + (1 p) U[0, b], i.e. que Xi suit
la loi uniforme sur [0, a] avec la probabilité p et la loi uniforme sur [0, b] avec la probabilité 1 p. On
suppose a < b avec a et b fixés et connus.
a) Déterminer la fonction de répartition et la densité de X1 .
b) Considérons Na la variable aléatoire égale au nombre d’individus Xi compris entre 0 et a. Quelle
est la loi de Na ? En déduire son espérance et sa variance.
c) Déterminer l’estimateur de maximum de vraisemblance de p.

Exercice 102 On observe (X1 , . . . , Xn ), n-échantillon de la loi uniforme sur [a, b], de moyenne théorique
a+b a+b 2
2 . Quelle est l’erreur quadratique E{(X 2 ) } de la moyenne empirique ?

Exercice 103 On observe le temps d’attente de n personnes à un feu rouge, temps notés t1 , . . . , tn . On
fait l’hypothèse que les temps d’attente sont indépendants et de même loi uniforme U[0, ✓]. La durée
d’attente maximale à ce feu rouge est Pdonc ✓, paramètre inconnu et strictement positif.
N
a) Monter que ✓1 = 2T̄ où T = n1 i=1 Ti est un estimateur sans biais de ✓ et que sa variance converge
vers 0 quand n ! 1.
b) Calculer la fonction de répartition et la densité de la variable aléatoire Mn = maxni=1 Ti . Calculer
son espérance et sa variance.
c) En déduire un deuxième estimateur sans biais ✓2 de ✓. Montrer que sa variance converge également
vers 0 quand n ! 1.
d) Lequel des deux estimateurs ✓1 et ✓2 choisiriez-vous pour estimer ✓ ?
e) Montrer que Mn et ✓2 convergent en probabilité vers ✓.

Exercice 104 La durée T séparant deux arrivées successives de requêtes à un serveur suit une loi expo-
nentielle de paramètre ✓ et de densité :
✓t
f (t|✓) = ✓e pour t > 0.

On suppose que le paramètre ✓ est stochastique et suit une loi exponentielle de paramètre connu, de
densité
g(✓) = e ✓

11
La densité g(✓) représente donc la densité a priori sur le paramètre ✓.
a) Montrer que la densité a posteriori de ✓ est proportionnelle à ✓e ✓(t+ ) .
b) On observe un échantillon de n durées t1 , . . . , tn . Déterminer à partir des observations ti les esti-
mateurs du maximum a posteriori de ✓.

Exercice 105 Une entreprise produit des composants électroniques. Le responsable de la chaı̂ne de
production affirme que seul 5% des composants produits sont défectueux. Un inspecteur de qualité af-
firme quant à lui que la proportion de composants défectueux est plus élevée et l’estime à 10%. Afin
de déterminer lequel des deux est le plus près de la réalité, un échantillon de 20 composants est prélevé
aléatoirement et testé. Le test révèle 3 composants défectueux.
On se place dans un cadre bayésien. On note p la variable aléatoire égale à la probabilité qu’un compo-
sant soit défectueux et X la variable aléatoire égale au nombre de composants défectueux parmi les 20
composants. En l’absence d’information supplémentaires, on suppose a priori que les taux de défaillance
de 5% et 10% sont équiprobables.
a) Traduire l’énoncé en termes probabilistes sur p et X.
b) Calculer la probabilité marginale que X = 3.
c) Calculer la fonction de masse a posteriori de p et interpréter le résultat.
d) Calculer la moyenne a posteriori de p et sa variance a posteriori.
e) Conclure.

12
Probabilités et Statistique pour SIC
Problèmes

Problème 1 Un mot de passe est consitué de six lettres, sans tenir compte de leur casse. Combien de
mots de passe existe-il ? Combien de mots de passe ne contiennent que des lettres distinctes ?

Problème 2 Pour constituer une équipe de football (11 joueurs), on a le choix entre 20 postulants. En
supposant que chaque joueur est polyvalent (il peut jouer à tous les postes), combien peut-on constituer
d’équipes différentes ? Si parmi les 20 postulants, 17 sont joueurs de champ et 3 sont gardiens, combien
d’équipes distinctes peut-on alors constituer ?

Problème 3 Combien de nombres de 3 chiffres distincts peut-on former à l’aide des six chiffres 2, 3, 5,
6, 7, 9 ? Combien de ces nombres sont :
a) inférieurs à 500 ?
b) impairs ?
c) pairs ?
d) multiples de 5 ?

Problème 4 Six serveurs sont connectés par une ligne de communication. A chaque instant, un serveur
donné est soit prêt à transmettre, soit déjà occupé.
a) Combien d’états du système formé des six serveurs y a-t-il ?
b) Combien y a-t-il de possibilités que 3 serveurs exactement soient prêts à transmettre à un instant
donné ?

Problème 5 Combien de façons y-a-t-il de mettre 4 tours sur un échiquier de sorte qu’aucune tour n’en
menace une autre ?

Problème 6 On souhaite souder 8 composants électroniques sur un circuit imprimé, 4 composants du


type A et 4 composants du type B. Le circuit imprimé ne dispose que de 8 places libres alignées. Combien
y-a-t-il de façons de procéder si :
a) Il n’y a pas d’autres restrictions.
b) Les composants A doivent rester ensemble et les composants B également.
c) Seuls les composants A doivent rester ensemble.
d) Les composants A et B doivent être alternés.

Problème 7 Raymond a oublié son mot de passe pour accéder à sa messagerie électronique. Il se souvient
néanmoins que son mot de passe contient r occurrences de la lettre “c”, dont en dernière position. Les
autres symboles ne peuvent être que “a” ou “b“. Combien de mots de passe de longueur n pourraient
être celui de Raymond ?

Problème 8 Afin de pouvoir mieux organiser les nombreux fichiers associés à un logiciel (fichiers de
données, de code, ...), on impose un nouveau système pour nommer ceux-ci. Dans un tel système, un
nom de fichier se compose d’un identificateur et d’une extension reliés par un point. Un identificateur de
fichier comporte de 1 à 5 caractères dont le premier est une lettre, les caractères suivants sont soit une
lettre soit un chiffre. Une extension comporte de 1 à 3 caractères, le premier est une lettre, les suivants
une lettre ou un chiffre. De façon à ne pas avoir des noms trop imprononçables, on n’utilise que 20 lettres
de A à T, toutes en minuscule.
a) Combien d’identificateurs de fichiers peut-on avoir ?
b) Combien de noms de fichier existe-t-il ?
c) Les fichiers dont l’extension commencent par la lettre “d” sont des fichiers de données. Combien
de possibilités y a-t-il pour nommer les fichiers de données ?

Problème 9 Calculer le nombre de diagonales d’un polygone à n ≥ 3 côtés. Existe-t-il un polygone où
le nombre de côtés soit égal au nombre de diagonales ?

13
Problème 10 4 composants éléctroniques de type A, 3 composants de type B et 5 composants de type
C doivent être montés en série. La seule contrainte au fonctionnement du système est que les composants
de même type doivent rester groupés. Combien de dispositions peut-on imaginer ?
Problème 11 Il faut répartir 14 ordinateurs dans deux bureaux de 7 personnes chacun. Combien y a-t-il
de répartitions possibles entre les deux bureaux
a) en supposant que la répartition au sein des bureaux a de l’importance ?
b) en supposant que la répartition au sein des bureaux est sans importance ?
Problème 12 Quatre bits sont transmis à travers un canal. On regarde à la réception l’état de ces
quatre bits, dans l’ordre de réception. Chaque bit est soit correctement reçu, soit reçu avec erreur de
transmission. On note d un bit reçu sans erreur et e un bit reçu avec erreur.
a) Quel est l’ensemble fondamental Ω pour cette expérience aléatoire ?
b) Lister les événements tels que au plus un bit soit reçu avec erreur.
c) Dénombrer les événements tels que plus de la moitié des bits soient transmis avec erreur.
Problème 13 Un contrôle de qualité est effectué chaque heure sur des cartes à puce. A chaque test,
la carte à puce testée est classée selon son bon ou mauvais fonctionnement. Le contrôle s’arrête lorsque
deux cartes à puce consécutives sont défectueuses, ou lorsque quatre cartes à puces ont été testées. Quel
est l’ensemble fondamental Ω de cette expérience ?
Problème 14 Dans une fabrique de processeurs, on prélève toutes les heures les trois derniers processeurs
produits et on note dans l’ordre de prélèvement l’état de ces trois processeurs. Chacun est classé dans
une des deux categories : en état de marche, codé 1, et défectueux, codé 0.
a) Décrivez l’espace fondamental associé à cette expérience aléatoire.
b) Décrivez (en termes ensemblistes) les événements suivants :
i) le premier processeur est défectueux,
ii) le dernier processeur est en état de marche,
iii) deux processeurs sont défectueux,
iv) au moins deux processeurs sont en état de marche.
Problème 15 Un disque dur a 1% de chance de tomber en panne. Par conséquent, il est muni de deux
backups, chacun ayant 2% de chance de tomber en panne. L’information est perdue uniquement lorsque
les trois composants sont en panne. En supposant que les trois composants fonctionnent indépendamment
les uns des autres, quelle est la probabilité que l’information soit sauvée ?
Problème 16 Trois terminaux sont reliés à un ordinateur via 2 lignes de communication. Le terminal
1 a sa propre ligne alors que les terminaux 2 et 3 partagent une ligne de telle sorte qu’à chaque instant
un seul de ces deux terminaux peut être utilisé. Durant une journée de travail, le terminal 1 est utilisé
30 minutes chaque heure, le terminal 2 est utilisé 10 minutes chaque heure et terminal 3 est utilisé 5
minutes chaque heure. En supposant que les lignes de communication opèrent de manière indépendantes,
quelle est la probabilité qu’au moins un terminal soit opératif à un moment quelconque de la journée de
travail ?
Problème 17 Quelle est la probabilité pour que l’écriture décimale d’un nombre entier tiré au hasard
entre 0 et 9999 comporte au moins une fois le chiffre 1 ?
Indication : utiliser la formule d’inclusion-exclusion.
Problème 18 Au jeu de loto, sous contrôle d’un huissier, 6 numéros parmi 49 numéros de 1 à 49 sont
tirés au hasard. Un joueur de loto doit jouer 6 numéros distincts (on ignore ici la notion de “numéro
complémentaire”). On dit qu’on a gagné la cagnotte si les 6 numéros joués correspondent aux 6 numéros
tirés.
a) Quel est l’espace fondamental associé aux tirages ?
b) Quelle est la probabilité de gagner la cagnotte ?
c) La société organisatrice du loto envisage de passer de 49 numéros à 60 numéros avec un tirage de
8 numéros plutôt que 6. Aura-t-on plus de chances de gagner la cagnotte ?
Problème 19 Sophie veut parier à une course de chevaux mais n’a aucune idée des performances des
jockeys et chevaux. Elle décide donc de parier au hasard.
a) Sophie a-t-elle plus de chance de trouver les 3 chevaux de tête dans l’ordre lors d’une course de 17
chevaux, ou les 4 premiers chevaux dans l’ordre lors d’une course de 18 chevaux ?
b) Même question que précédemment mais dans le désordre.

14
Problème 20 Des bits sont envoyés à la suite sur un canal. Un bit donné prend la valeur 1 avec la
probabilité p. Les bits envoyés sont indépendants.
a) On enregistre deux bits à la suite b0 et b1 .
i) Quelle est la probabilité que les deux bits aient des valeurs différentes ?
ii) Quelle est la probabilité que le second bit soit égal à 1 si le premier est égal à 0 ?
b) On note maintenant la valeur de quatre bits envoyés à la suite.
i) Trouver la probabilité d’avoir au moins deux bits égaux à 1 parmi les quatre.
ii) Trouver la probabilité d’avoir au moins deux bits égaux à 1 et le quatrième bit à 0.

Problème 21 Un logiciel libre programmé par un étudiant de l’EPFL contient 5 bugs, répartis uni-
formément dans le code. Le code comporte 10 000 lignes dont 3000 de commentaire. Une certaine exécution
du logiciel passe par 1/3 des lignes exécutables. Quelle est la probabilité que le programme s’exécute cor-
rectement ?

Problème 22 n résistances sont installées en série, dont les résistances A et B.


a) Décrire l’ensemble fondamental associé à cette expérience, et en donner le nombre d’éléments.
b) Quelle est la probabilité qu’il y ait k résistances placées entre A et B (0 ≤ k ≤ n − 2) ?
c) Vérifier votre résultat pour n = 3 en explicitant tous les cas possibles.

Problème 23 Le Daily Mail du 13 octobre 2010 rapporte que la famille Allali (Angleterre) vient juste
d’avoir son troisième enfant et que, fait surprenant, ses trois enfants sont tous nés le même jour (un 7
octobre, en 2005, 2007 et 2010). Le journaliste affirme qu’il y a moins d’une chance sur 48 millions que
trois enfants d’une famille (ni jumeaux, ni triplets) naissent un même jour. Que pensez-vous de cette
affirmation ?

Problème 24 Vous venez d’installer un module de détection de courriers indésirables dans votre client de
courrier électronique. Le module réussit à identifier les courriers indésirables dans 99% des cas. Néanmoins
le module annonce qu’un message est indésirable alors qu’il ne l’est pas dans 2% des cas. Les statistiques
officielles indiquent que 10% des courriers électroniques reçus sont indésirables. Quelle est la probabilité
qu’un message soit effectivement indésirable lorsque le module indique que c’est le cas ?

Problème 25 A un test de fin d’année, trois élèves, Alain, Boris et Charles, ont oublié de mettre leur
nom sur les copies. Le professeur sait quels sont ces trois élèves mais ne sait pas quelle copie appartient à
chacun d’entre eux. Il estime néanmoins que Alain a 80% de chance d’avoir réussi l’examen, Boris 70% et
Charles 60%. Après correction des trois copies, il s’avère que deux ont réussi l’examen et un l’a échoué.
En supposant que les étudiants ont travaillé indépendamment, quelle est la probabilité que ce soit Charles
qui ait échoué à l’examen ?

Problème 26 L’envoi d’un paquet du serveur S1 au serveur S2 sur internet passe par deux routeurs
intermédiaires R1 et R2 . La probabilité que le paquet se perde sur chaque segment du chemin S1 →
R1 → R2 → S2 est p. On constate, au niveau du serveur S2 la perte du paquet. Quelle est la probabilité
qu’il ait été perdu au niveau de S1 ? de R1 ? de R2 ?

Problème 27 Un routeur reçoit l’essentiel des paquets qu’il fait transiter depuis deux autres routeurs
R1 et R2 , en proportion équilibrée. On constate qu’environ un paquet sur 200 est endommagé lorsque
ceux-ci proviennent de R1 , alors que seulement un paquet sur 1000 est endommagé lorsqu’ils proviennent
de R2 . On considère un paquet reçu de l’un de ces deux routeurs R1 ou R2 . Le paquet inspecté n’est pas
endommagé. Quelle est la probabilité qu’il provienne de R1 ?

Problème 28 100 programmes informatiques sont testés contre diverses sources d’erreurs. Il est trouvé
que 20 d’entre eux ont des erreurs de syntaxe, 10 des erreurs d’entrée/sortie qui ne sont pas des erreurs de
syntaxe, 5 ont d’autres types d’erreurs, 6 ont à la fois des erreurs de sytaxe et des erreurs d’entrée/sortie,
3 ont des erreurs de syntaxe ainsi que d’autres types d’erreur et un seul a les trois types d’erreur. Un
programme est sélectionné aléatoirement parmi ces 100 programmes.
a) Exprimer sous forme de probabilités les quantités données dans l’énoncé.
b) Quelle est la probabilité que le programme sélectionné ait des erreurs de syntaxe ou des erreurs
d’entrée/sortie ou les deux ?
c) On sait que le programme sélectionné a une erreur de syntaxe. Quelle est la probabilité qu’il ait
également une erreur d’entrée/sortie ?

15
Problème 29 Des requêtes sont effectuées sur des serveurs via 5 lignes de communication. Les lignes
de communication ne sont pas utilisées égalitairement : les pourcentages des requêtes envoyées sur les
lignes 1, 2, 3, 4 et 5 sont respectivement de 20, 30, 10, 15 et 25. De plus la ligne sur laquelle est envoyée
la requête dépend de la longueur de la requête : la probabilité qu’une requête excède 100 caractères sur
les lignes 1 à 5 est respectivement de 0.4, 0.5, 0.6, 0.2 et 0.8. Quelle est la probabilité qu’une requête
quelconque excède 100 caractères ?

Problème 30 On tire au hasard deux chiffres entre 0 et 9. Quelle est la probabilité que le premier chiffre
soit 6, sachant que la somme des deux est 6 ?

Problème 31 Un magasin d’électronique a remarqué que la probabilité pn que n clients entrent dans le
magasin un jour donné est pn (1 − p), n = 0, 1, . . .. De plus, lorsqu’un client visite le magasin, il en ressort
avec un achat deux fois sur trois. Néanmoins, le client n’est pas satisfait de cet achat et le rapporte au
magasin une fois sur quatre. On suppose que le fait d’acheter un produit et le fait d’en être satisfait sont
des événements indépendants.
a) Quelle est la probabilité qu’un client achète un produit et en soit satisfait ?
b) Si on sait que k produits vendus n’ont pas été rapportés au magasin, montrer que la probabilité
conditionnelle que le magasin ait reçu la visite de n clients est donnée par

Cnk pn−k (2 − p)k+1 /2n+1 , n ≥ k.

Problème 32 La probabilité pour que la durée de vie d’un composant dépasse 10 000 heures est de 80%
et on admet que les pannes des différents composants sont indépendantes.
a) Avec 3 composants, on réalise un montage “en série”. Il suffit que l’un des composants tombe en
panne pour que le système ne fonctionne plus. Quelle est la probabilité pour que celui-ci fonctionne au
moins 10000 heures ?
b) Avec les mêmes composants que précédemment, on réalise un deuxième montage “en parallèle”.
Dans ce cas pour que le système ne fonctionne plus il faut que tous les trois composants soient en panne.
i) Quelle est la probabilité pour que le système fonctionne au moins 10000 heures ?
ii) Sachant que le système, qui a été sous tension 10000 heures, est en état de fonctionnement,
quelle est la probabilité qu’un composant au moins soit défectueux ?

Problème 33 Dans une assemblée de n personnes, on doit constituer un comité de s personnes puis
désigner un président parmi celles-ci. Les n personnes n’arrivant pas à se mettre d’accord pour former le
comité, elles décident après des heures de débat de procéder par tirage au sort, aussi bien pour désigner
les s personnes du comité que son président. M. Truc, membre de l’assemblé, n’est pas le président du
comité. Quelle est est la probabilité que celui-ci fasse néanmoins partie du comité ?

Problème 34 On met au point un algorithme pour détecter si une page web écrite en anglais est rédigée
par un natif (quelqu’un dont l’anglais est la langue maternelle). On évalue que 55% des pages web en
anglais sont écrites par des natifs. L’algorithme réussit à détecter correctement que la page est écrite par
un natif dans 95% des cas lorsque la page est effectivement écrite par un natif. Elle affirme cependant
incorrectement que la page est écrite par un natif alors que ce n’est pas le cas avec probabilité 1%.
Quelle est la probabilité qu’une page soit écrite par un natif lorsque l’algorithme l’affirme ?

Problème 35 Un étudiant passe un test sous la forme d’un questionnaire à choix multiple ; pour chacune
des questions posées, il y a 5 réponses proposées, dont une seule réponse juste. Si l’étudiant connaı̂t la
réponse juste, il la choisit. Dans le cas contraire, il choisit une réponse au hasard parmi les 5 réponses
proposées. L’étudiant connait la réponse juste à 70% des questions.
a) Quelle chance a l’étudiant de répondre correctement à une question donnée ?
b) Si pour une question l’étudiant a répondu correctement, quelle est la probabilité qu’il ait répondu
en connaissance de cause (c’est-à-dire pas au hasard) ?

Problème 36 Une requête peut être envoyée de manière équiprobable sur six serveurs, quatre étant de
type X et deux serveurs étant de type Y . Deux requêtes consécutives ne peuvent pas être envoyées sur
le même serveur. On considère deux requêtes consécutives.
a) Décrire l’ensemble fondamental Ω de cette expérience stochastique.
b) Définissons les événements suivants B1 = “la première requête est envoyée sur un serveur de type
X” et B2 = “la seconde requête est envoyée sur un serveur de type X”.
i) Calculer les probabilités P (B1 ), P (B2 |B1 ), P (B2 |B1c ) et P (B2 ).
ii) Vérifier que P (B1 ∩ B2 ) + P (B1c ∩ B2 ) + P (B1 ∩ B2c ) + P (B1c ∩ B2c ) = 1.

16
Problème 37 Vous êtes directeur de cabinet du ministre de la santé. Une maladie est présente dans
la population, dans la proportion d’une personne malade sur 10000. Un responsable d’un grand labo-
ratoire pharmaceutique vient vous vanter son nouveau test de dépistage : si une personne est malade,
le test est positif à 99%. Si une personne n’est pas malade, le test est positif à 0.1%. Autorisez-vous la
commercialisation de ce test ?

Problème 38 On considère le jeu de dé suivant : pour participer au jeu, on mise 3 CHF. Puis on lance
le dé et on récupère 15 CHF si le nombre obtenu est 6. Le jeu est-il en moyenne rentable ? A partir de
quel gain pour l’obtention d’un 6 devriendrait-il rentable ?

Problème 39 On considère l’algorithme naı̈f ci-dessous pour trouver le plus grand élément, noté M ,
dans une liste non vide L de n éléments :
1. On initialise le maximum M avec la valeur du premier élément de la liste.
2. On parcourt ensuite la liste, du 2ième au dernier élément, et on affecte cet élément à M si celui-ci
est plus grand que la valeur courante de M .
Lors du traitement d’une liste de taille n :
a) Quel est le nombre de comparaisons effectuées ?
b) Quel est le nombre d’affectations à M dans le cas le plus favorable ? le plus défavorable ?
Dans la suite, on suppose que les éléments de la liste sont deux-à-deux distincts et que les n! permu-
tations possibles ont la même probabilité d’apparaı̂tre dans la liste. Soit p(n, k) la probabilité pour que,
lors du déroulement de l’algorithme sur une liste (aléatoire) L de taille n, k affectations soient nécessaires.
c) Montrer la récurrence suivante, pour n ≥ 2 et k ≥ 1 :
1 n−1
p(n, k) = p(n − 1, k − 1) + p(n − 1, k)
n n
Indication : Raisonner selon que le nième élément est maximal ou non.
d) Soit En l’espérance mathématique du nombre d’affectations effectuées lors du traitement d’une
liste de taille n. Déduire de la récurrence ci-dessus la récurrence sur En :
1
En = + En−1
n
et donner une approximation de En (en fonction de n) lorsque n → +∞.

! 40 Soit X une variable aléatoire prenant ses valeurs dans les nombres naturels. Montrer que
Problème
E(X) = ∞ n=1 P (X ≥ n).

Problème 41 On désire estimer le nombre N de poissons dans un lac sans avoir à tous les compter. Une
méthode pour cela est la méthode dite de la capture-recapture : dans un premier temps, M poissons sont
capturés, marqués d’une certaine façon pour les distinguer, puis relachés dans le lac. Quelques minutes
plus tard (le temps que les poissons aient pu se mélanger), n poissons sont capturés, et on note X le
nombre de poissons qui sont marqués, parmi ces n poissons.
(Cette méthode a été introduite par Laplace en 1768 pour estimer la population de la France.)
a) Calculer la fonction de masse de X.
b) L’application de cette méthode au lac Léman donne X = k. Déterminer alors le nombre de poissons
du lac Léman, N , le plus probable, i.e. trouver N̂ maximisant la probabilité P (X = k) (on parle de
maximum de vraisemblance).
c) Montrer que l’espérance de N̂ est infinie.

Problème 42 Un joueur tourne une roue. A chaque essai, il a une probabilité 1 − p de tomber sur une
case lui rapportant 1 CHF et p de tomber sur la case banqueroute qui lui fera tout perdre et l’éliminera
du jeu. Il débute avec une somme initiale nulle et souhaite atteindre un gain G0 , après quoi il quittera
le jeu – s’il n’y a pas déjà été contraint avant. Les résultats successifs obtenus en tournant la roue sont
supposés indépendants.
a) Quelle est la probabilité que le joueur atteigne le gain G0 qu’il s’était fixé ?
b) En déduire l’espérance du gain final.

Problème 43 Une requête est envoyée sur un réseau. On suppose qu’il a une probabilité p ∈ [0, 1] que
cette requête reçoive une réponse. Dans le cas contraire, la requête est renvoyée jusqu’à ce qu’une réponse
soit reçue. On note T le nombre d’essais nécessaires à cela. Donner la fonction de masse de T .

17
Problème 44 Pour la nouvelle année, un fournisseur internet décide de proposer une offre spéciale
d’abonnement pour attirer de nouvels utilisateurs. Chaque nouvel utilisateur reçoit l’offre spéciale avec
une probabilité de 0.2. 20 nouvels utilisateurs s’inscrivent à ce fournisseur internet. Par quelle loi peut-on
modéliser le nombre d’entre eux qui bénéficient de l’offre spéciale ? Calculer la probabilité qu’au moins le
quart d’entre eux en bénéficient.

Problème 45 Un chef d’entreprise, pour éviter l’attente des camions venant livrer, envisage de construire
de nouveaux poste de déchargement. Actuellement, 5 postes sont en activité. Pour simplifier l’étude, on
considère qu’il faut une journée entière pour décharger un camion. On désigne par X la variable aléatoire
mesurant le nombre de camions venant livrer chaque jour. Une enquête statistique préalable a montré
qu’on pouvait assimiler la loi de X à une loi de Poisson de paramètre 4.
a) Quelle est la probabilité de n’avoir aucun camion en attente ?
b) Combien faudrait-il de postes de déchargement pour porter cette probabilité à plus de 0.9 ?

Problème 46 Un concierge rentre de soirée. Il dispose de n clés dont une seule ouvre la porte de son
domicile mais il ne sait plus laquelle.
a) Il essaie les clés les unes après les autres en éliminant après chaque essai la clé qui n’a pas convenu.
Quelle est la probabilité que la porte ouvre après le kième essai ?
b) En réalité la soirée a été bien arrosée et le concierge ne pense pas à mettre de côté la mauvaise clé
après l’avoir essayée. Donner la loi du nombre d’essais nécessaires pour trouver la bonne clé. Quelle est
la probabilité que la porte ouvre après le kième essai ?

Problème 47 Pour l’étude des sols d’une région, on effectue des tests à partir d’échantillons prélevés sur
le terrain. Cinq échantillons doivent être soumis aux tests et on sait que la probabilité qu’un échantillon
prélevé s’avère être inadéquat (endommagé par exemple) est de 0.2. Si l’on veut être assuré de disposer
de cinq échantillons utilisables avec une probabilité au moins égale à 0.99, combien d’échantillons faut-il
prélever ?

Problème 48 Une version avancée d’un jeu sur console sort. 60% des joueurs ont passé tous les niveaux
de la version précédente. 30% d’entre eux décident d’acheter la version avancée alors que seulement 10%
des joueurs n’ayant pas passé tous les niveaux décident de l’acheter.
a) Quelle est la probabilité qu’un joueur achète la version avancée du jeu ?
b) Sur 10 joueurs, quel est le nombre moyen de personnes achetant la version avancée ?
c) Quelle est la probabilité qu’au moins trois joueurs l’achètent ?

Problème 49 La production d’un certain composant donne 5% de composants défectueux. On a besoin


de 10 composants non défecteux pour 10 nouveaux ordinateurs. Les composants sont testés jusqu’à ce
que 10 composants non défectueux soient trouvés.
a) Quelle est la loi du nombre X de composants à tester avant d’en trouver 10 fonctionnels ?
b) Quelle est la loi du nombre Y de composants fonctionels parmi 12 testés ?
c) Calculer de deux façons, à partir de a) et b), la probabilité que plus de 12 composants doivent être
testés pour en trouver 10 fonctionnels.

Problème 50 On considère une classe composée de N ≥ 60 élèves, N pair, qu’on regroupe aléatoirement
deux par deux. On s’intéresse aux N/2 “couples” distincts ainsi formés.
a) Donner la loi du nombre de “couples” ayant leur anniversaire le même jour, c’est-à-dire au nombre
de couples formés de deux personnes nées un même jour de l’année (mais pas nécessairement une même
année). On supposera pour simplifier qu’une année est composée de 365 jours.
b) Calculer de deux façons, en fonction de N , la probabilité qu’au moins un couple ait son anniversaire
le même jour .
Indication : utiliser l’approximation par la loi de Poisson (en la justifiant).
c) Quel doit être le nombre minimal d’étudiants dans la classe pour que cette probabilité soit supérieure
à 60% ? Faire le calcul de deux façons.

Problème 51 A un instant t donné, n serveurs cherchent à envoyer une réponse chacun (n réponses au
total pour les n serveurs) via n canaux de transmission indépendants. Ces canaux étant partagés par
d’autres serveurs, il y a une probabilité p qu’un canal soit déjà occupé à cet instant. Lorsqu’un serveur
essaie d’envoyer une réponse sur un canal occupé, l’envoi échoue et la réponse est mise en attente jusqu’au
pas de temps suivant (t+1) lorsque le serveur retente l’envoi, et ainsi de suite jusqu’à ce que les n réponses
aient été envoyées.
a) On considère une réponse particulière à envoyer,

18
i) Quelle est la loi du nombre de pas de temps nécessaires à l’envoi de cette réponse ?
ii) Quelle la probabilité que moins de k pas de temps soient nécessaires ?
b) On considère les n réponses à envoyer,
i) Quelle est la probabilité que moins de k pas de temps soient nécessaires à l’envoi de ces n
réponses ?
ii) En déduire la probabilité qu’exactement k pas de temps soient nécessaires.

Problème 52 n serveurs sont connectés via une ligne de communication. On estime le réseau tel que,
chaque minute, un serveur reçoit avec une probabilité p une requête sur cette ligne. De plus, durant une
minute quelconque, un serveur ne peut recevoir plus d’une requête.
a) Quelle est la loi du nombre de requêtes reçues par minute par les n serveurs ?
b) En déduire l’espérance et la variance de la proportion de requêtes reçues par serveur sur une minute.

Problème 53 Une enquête réalisée auprès de clients fréquentant un magasin révèle que, une fois entrés
dans le magasin, 40% d’entre eux font un achat. Sur 1000 clients entrés dans le magasin, on désigne par
X le nombre de ceux qui ont réellement acheté quelque chose.
a) Quelle est la fonction de masse de X ? Calculer son espérance et sa variance.
b) Calculer la probabilité que moins de 300 personnes aient fait des achats.
c) Calculer la probabilité que plus de 500 personnes aient fait des achats.

Problème 54 L’utilisation d’un logiciel de reconnaissance d’écriture a produit, à partir de 1000 pages
de texte, 1500 erreurs réparties au hasard.
a) Donner une valeur exacte de la probabilité qu’une page retranscrite par le logiciel contienne moins
de 2 erreurs.
b) Calculer la probabilité de cet événement si on remplace la loi du nombre d’erreurs par une loi de
Poisson bien choisie.

Problème 55 Un serveur dessert 1000 postes via 50 lignes à haut débit. Aux heures de pointe, chaque
poste est occupé en moyenne pendant 2, 5 secondes par minute. On suppose les postes indépendants.
Quelle est la probabilité de saturation du réseau pendant une durée moyenne d’une minute de pointe ?

Problème 56 Une variable aléatoire X a pour densité


"
2x−3 , x ≥ 1
f (x) = .
0, x < 1

Calculer sa moyenne et sa variance.

Problème 57 La durée de vie d’un composant (en années) est une variable aléatoire continue de fonction
de densité " k
x4 si x ≥ 1
f (x) =
0 si x < 1
a) Trouver k.
b) Calculer la fonction de répartition de la durée de vie du composant.
c) Calculer la probabilité que la durée de vie du composant excède 3 ans.
d) Quelle est la durée de vie moyenne du composant ?
e) Quel est l’écart-type de durée de vie ?

Problème 58 La fonction de répartition de Pareto à deux paramètres θ > 0 et α > 0 est


" # x $−θ
F (x) = 1 − α , x> α .
0, x ≤ α

a) Vérifier qu’il s’agit bien d’une fonction de répartition.


b) Calculer les moments d’ordre 1 et 2. A quelle condition sont-ils finis ?

Problème 59 On suppose que le temps d’attente entre deux “jobs” successifs d’une imprimante est en
moyenne de 1/4 d’heure.
a) Quelle loi utiliser pour le temps d’attente (en heure) entre deux jobs ?
b) Quelle est la probabilité que le job suivant soit envoyé dans les 5 minutes ?

19
Problème 60 La durée de vie d’un processeur a une moyenne µ = 12 ans et un écart-type σ = 4 ans.
a) En déduire la valeur des paramètres de la loi (à préciser) décrivant la durée de vie du processeur.
b) Calculer la probabilité que le processeur ait une durée de vie entre 10 et 15 ans.
Problème 61 On admet que la température moyenne en hiver à Rome suit une loi normale de moyenne
de 10◦ C et d’écart-type 4◦ C. Pour un hiver de température moyenne inférieure à 4◦ C, l’état de grand
froid est décrété. On suppose les températures indépendantes d’un hiver à l’autre.
a) Quelle est la probabilité que l’état de grand froid soit décrété un hiver donné ?
b) Quelle est la probabilité que l’état de grand froid ne soit pas décrété sur une période de 10 ans ?
Problème 62 On joue à pile ou face, et le résultat X vaut 0 pour pile et 1 pour face. Si la pièce tombe
sur face, on jette encore un dé équilibré, et on obtient le résultat Y ∈ {1, . . . , 6}. Soit Z = X + Y le
score total. Calculer les espérance et variance conditionnelles de Z sachant X et les utiliser pour vérifier
le théorème 167.
Problème 63 Un examen d’algèbre linéaire consiste en 20 questions à choix multiples, chacune avec
quatre choix à disposition, dont un seulement correct. Il faut répondre correctement à 10 questions pour
réussir l’examen. Ayant pris ses révisions un peu à la légère, un étudiant décide de répondre aux questions
de manière aléatoire. Trouver l’espérance et la variance du total des points qu’il obtiendra. Quelle est la
probabilité qu’il réussisse son examen ? Une fois l’examen terminé, il discute avec ses amis, et ils concluent
qu’il a coché la bonne réponse à six questions, et une fausse réponse à quatre autres questions. Quel est
l’espérance du total de points obtenus, conditionnée sur cette nouvelle information ? Quelle est à présent
la probabilité qu’il réussisse l’examen ?
Problème 64 Le téléchargement d’un logiciel se fait via deux miroirs possibles, l’un situé en Europe
et l’autre aux Etats-Unis. On estime que, selon l’état du réseau, le téléchargement via l’un de ces deux
miroirs met entre a et b secondes, toute durée entre ces deux valeurs étant équiprobable. Les temps de
téléchargements via les deux miroirs sont indépendants.
a) Quelle est la loi du temps nécessaire au téléchargement en passant par l’un des deux miroirs ?
Donner sa fonction de répartition.
b) Adrien demande simultanément le téléchargement du logiciel par les deux miroirs.
i) Quelle est la fonction de répartition du temps au bout duquel le premier téléchargement du
logiciel sera terminé ?
ii) Calculer son espérance et sa variance.
Problème 65 Un calcul sur ordinateur nécessite l’appel à n fonctions, dont les temps de calculs sont
indépendants et de loi normales N (µi , σi ). On suppose que le programme principal appelant ces fonctions
ajoute un temps b, fixe, au temps total de calcul. Quelle est la loi du temps total de calcul ?
Problème 66 Le nombre N de moustiques dans ma chambre d’hôtel une fois la nuit tombée suit une
distribution de Poisson de moyenne λ, et chacun d’eux me pique indépendamment avec probabilité p.
Trouver les moyenne et variance conditionnelles du nombre Z de piqûres que j’aurai le matin, sachant qu’il
y avait N = n moustiques. Utilisant ces résultats, trouver les moyenne et variance non conditionnelles de
Z. Utiliser les espérances conditionnelles pour calculer la fonction génératrice des moments de Z. Quelle
est la distribution de Z ?
Problème 67 Les variables aléatoires X et Y sont toutes deux discrètes avec une fonction de probabilité
conjointe définie dans le tableau ci-dessous.
Y
X 0 1 2
0 p 2p p
1 3p 2p p
Calculer la fonction de probabilité marginale PX (x) de X. Que vaut p ? Calculer également E(Y 2 ) et
E(XY ).
Problème 68 On suppose que la durée de vie d’un individu est une variable aléatoire de densité
" 2
ct (t − 100)2 si t ∈ [0, 100]
f (t) = .
0 sinon
a) Calculer la constante c.
b) Quelle est l’espérance de vie moyenne d’un individu ?
c) Quelle est la probabilité qu’un individu ait une durée de vie entre 50 et 80 ans ?

20
Problème 69 Un système a une durée de vie aléatoire X de densité donnée (en mois) par :
"
cxe−x/2 x>0
f (x) =
0 x≤0
Quelle est la probabilité que le système fonctionne pendant au moins 5 mois ?
Problème 70 Les timbres produits par la poste sont théoriquement de forme carrée de côté l = 1.5 cm.
Néanmoins, la machine étant mal calibrée, les timbres produits ne sont pas toujours exactement de côté
l mais restent toujours carrés. On suppose que l’erreur de production est de +/- 0.2 cm par côté et que
toutes les valeurs entre ces deux bornes sont équiprobables.
a) Par quelle loi peut on modéliser les longueurs mesurées ? Donner sa fonction de répartition.
b) Quelle est la fonction de répartition de l’aire du timbre ?
Problème 71 Adèle attend l’ascenseur, dont la capacité maximale est de 750 kilos. L’ascenseur arrive
avec 10 adultes dedans. On suppose que le poids moyen d’un adulte suit une loi normale de moyenne 70
kilos et d’écart-type de 12 kilos.
a) Quelle est la loi du poids des 10 personnes dans l’ascenseur ?
b) Est-il raisonnable qu’Adèle, 55 kilos, entre dans l’ascenseur ?
Problème 72 Des ingénieurs civils ayant participé à la construction du pont de Millau ont estimé que le
poids W (en milliers de kilos) que la travée du pont peut supporter sans subir de dommage au niveau de
sa structure, suit une loi normale, de moyenne 400 et d’écart-type 40. Supposons que le poids (également
en milliers de kilos) d’une voiture est une variable aléatoire normale de moyenne 3 et d’écart-type 0.3.
Combien de voitures devraient se trouver sur cette travée pour que la probabilité de rupture soit supérieure
à 0.1 ?
Problème 73 Soit Y une variable aléatoire de loi Gamma de paramètres α = 1/2 et λ = 1. On rappelle
que sa densité est " 1 −y
√ e , y>0
πy
fY (y) = .
0, y ≤ 0
Soit X une autre variable aléatoire dont on ne connait que la loi conditionnellement à Y : la loi de X
1
sachant Y est la loi normale N (0, 2Y ).
a) Calculer la densité du couple (X, Y ).
b) Calculer la densité X.
c) Calculer et reconnaı̂tre la densité conditionnelle de Y sachant X.
Problème 74 Soit X une variable gaussienne centrée réduite et % une variable indépendante de X telle
que P (% = 1) = P (% = −1) = 1/2. On note Y = %X.
a) Calculer Cov(X, Y ).
b) Le vecteur (X, Y ) est-il gaussien ?
c) Les variables X et Y sont-elles indépendantes ?
Problème 75 Soit (X, Y ) un vecteur aléatoire de densité conjointe
c(x2 + xy
"
fX,Y (x, y) = 2 ) si 0 ≤ x ≤ 1, 0 ≤ y ≤ 2
0 sinon
a) Déterminer la constante c.
b) Déterminer la densité marginale de X et celle de Y . Les variables aléatoires X et Y sont-elles
indépendantes ?
c) Calculer P (X > Y ).
Problème 76 On a calculé qu’un certain logiciel produit en moyenne 25 erreurs toutes les 1000 heures
d’utilisation, avec un écart-type de 2. Donner un majorant de la probabilité d’avoir plus de 30 erreurs en
1000 heures d’utilisation. Qu’en est-il si l’écart-type passe à 4 ?
Problème 77 Un serveur reçoit des requêtes de 8 lignes de communication. On sait que le nombre de
requêtes issues d’une quelconque de ces lignes est en moyenne de 20 requêtes par seconde. On suppose
de plus que le nombre de requêtes est indépendant de la ligne. On souhaite savoir si le nombre total de
requêtes reçues par le serveur n’excède pas le seuil de 500 requêtes par seconde, qui est un seuil critique
pour le serveur.
a) Utiliser l’inégalité de Markov pour obtenir un majorant de cette probabilité.
b) Qu’obtenez-vous en utilisant l’inégalité de Chebyshov ?

21
Problème 78 Un disque dur a 350 gigabytes de disponibles. Cela est-il vraisemblablement suffisant pour
stocker 300 films de taille moyenne 1.1 gigabyte et d’écart-type 0.4 ?

Problème 79 La mise à jour d’un logiciel nécessite l’installation de 85 fichiers, installés séquentiellement.
Le temps d’installation est aléatoire, mais prend en moyenne 15 secondes par fichier, avec un écart-type
de 4 secondes. Quelle est la probabilité que le logiciel soit mis à jour en moins de 20 minutes ?

Problème 80 280 messages indépendants sont envoyés d’un centre de transmission. Les messages sont
traités séquentiellement et le durée de transmission d’un message suit une loi exponentielle de paramètre
λ = 5 min−1 . Quelle est la probabilité que les 280 messages soient transmis en moins d’une heure ?

Problème 81 Un serveur reçoit 1000 requêtes par minute. Néanmoins, suite à des problèmes sur les
lignes de communication, on estime que la probabilité qu’un requête échoue est de 4%. On suppose
l’échec ou non des requêtes indépendants.
a) Quelle est exactement la probabilité pour que plus de 30 requêtes échouent en une minute ?
b) Donner deux approximations de la probabilité a), en les justifiant.

Problème 82 N touristes veulent se rendre à Zermatt et doivent donc prendre le train à Täsch. Or le
train ne comporte que deux wagons de n places chacuns. On admet que les choix des touristes de monter
dans la voiture de tête ou de queue sont indépendants les uns des autres et qu’un touriste quelconque a
une chance sur deux de monter dans le premier wagon.
a) Quelle est la probabilité p que tous les touristes ne puissent pas monter dans la voiture qu’ils ont
choisi ?
b) Combien aurait-il fallu de places dans le train si on sait que N = 1000 et si on veut que p soit
inférieur à 0,01 ?

Problème 83 Une entreprise assemble 25 ordinateurs par jour. Les contrôles de qualité montrent que
95% des ordinateurs assemblés fonctionnent correctement.
Donner une bonne approximation de la probabilité qu’au moins 600 ordinateurs sans défaut aient été
assemblés à l’issue de 25 journées de travail.

Problème 84 Le nombre de clients entrant dans un magasin un jour donné suit une loi de Poisson de
paramètre 12. Quelle est la probabilité de ne pas tomber en-dessous de 250 clients sur un mois de 22
jours ouvrables ? On fera les hypothèses d’indépendance qui s’imposent.

Problème 85 A partir d’un échantillon aléatoire de 500 temps de réponse d’un serveur, on a trouvé un
temps de réponse moyen de 5 millisecondes avec un écart-type 2 millisecondes.
a) Donner un intervalle de confiance à 95% du temps de réponse moyen.
b) Si l’on souhaite que la longueur de l’intervalle de confiance n’excède pas 0.3 ms, quelle devrait être
la taille de l’échantillon testé ?

Problème 86 On admet que la durée de vie d’un composant (en mois) est de distribution normale
N (µ, 9). On teste 20 de ces composants pour trouver une durée de vie moyenne ȳ = 100.9. Au seuil 99%,
rejette-on l’hypothèse µ = 100 ?

Problème 87 Les connexions internet sont parfois ralenties dû à la latence de transmission du réseau.
On souhaite quantifier cette latence. On envoie pour cela 500 paquets sur le réseau. On obtient une latence
moyenne de 0.8 seconde, avec un écart-type de 0.1 seconde. Donner un intervalle de confiance au seuil
99.5% de la latence moyenne dans le réseau.

Problème 88 L’utilisation d’un ordinateur consomme de l’électricité. Sur 9 ordinateurs on a obtenu les
coûts journaliers suivantes exprimés en CHF :

1, 2 0, 8 0, 6 1, 1 1, 2 0, 9 1, 5 0, 9 1, 0
a) Calculer la moyenne et la variance de cet échantillon.
b) On suppose que le coût journalier de l’utilisation d’un ordinateur suit une loi normale. Rejette-on
l’hypothèse d’un coût journalier moyen de 1 CHF au seuil 95% ?

Problème 89 Soit Y1 , . . . , Yn un échantillon aléatoire provenant d’une distribution exp(λ). Trouver le


test optimal pour tester l’hypothèse H0 : λ = 1 et son alternative H1 : λ > 1.

22
Problème 90 Soit Y1 , . . . , Yn un échantillon aléatoire provenant d’une distribution de Poisson avec
moyenne θ. Trouver le test optimal pour tester l’hypothèse H0 : θ = θ0 et son alternative H1 : θ > θ0 .
Montrer qu’il n’est pas toujours possible de trouver une région de rejet de taille α, et proposer une
approximation pour la région de rejet si ce n’est pas le cas.

Problème 91 Dans le cas d’un procès où un individu est accusé de crime, quel jugement erroné cor-
respond à une erreur statistique de type I ? (Considérer l’hypothèse nulle comme étant l’innocence de
l’accusé.) Un étudiant en droit s’intéresse aux sentences appliquées à de jeunes adultes convaincus de
grave crime à l’arme blanche en Angleterre et dans le Pays de Galles. Il sélectionne aléatoirement un
échantillon de 26 cas tirés des dossiers de justice pour la fin de l’année 2009 ; il trouve que la durée
moyenne de la peine est de 6.87 mois, avec un écart-type de 2.2 mois.
a) Construire un intervalle de confiance à 95% pour la durée moyenne de la peine.
b) Quelles sont précisément les hypothèses faites en a) ?
c) Supposer que tous ces condamnés ont purgé la moitié de leur peine. Quelle sont les espérance et
écart-type empiriques du temps de peine restant pour son échantillon aléatoire de 26 cas ?
d) Utiliser les résultats du point précédent pour tester au niveau 1% l’hypothèse que le temps moyen
passé en prison était d’au moins 5 mois pour les jeunes adultes convaincus de grave crime à l’arme
blanche en Angleterre et dans le Pays de Galles.

Problème 92 Supposer que les variables aléatoires X1 et X2 ont pour moyenne µ1 et µ2 respectivement
et pour variance σ12 et σ22 , avec corr(X1 , X2 ) = ρ.
a) Si a1 , a2 , b1 et b2 sont constant, prouver que
2 %
% 2
cov(a1 X1 + a2 X2 , b1 X1 + b2 X2 ) = ai bj cov(Xi , Xj ),
i=1 j=1

en citant précisément les résultats utilisés.


b) Prouver l’énoncé ci-après, avec ou sans l’aide du point précédent.

var(a1 X1 + a2 X2 ) = a21 σ12 + a22 σ22 + 2a1 a2 ρσ1 σ2

en citant précisément les résultats utilisés.


c) Quelle est la distribution de X̄1 −X̄2 , pour deux variable aléatoires indépendantes X̄1 et X̄2 représentant
des moyennes empiriques et satisfaisant

σ2 σ2
& ' & '
X̄1 ∼ N µ1 , 1 X̄2 ∼ N µ2 , 2 ,
n1 n2

et calculer cov(X̄1 , X̄2 ).


d) On a mesuré et reporté dans le tableau ci-dessous le temps de trajet arrondi à 5 minutes de 10
étudiantes et 10 étudiants en statistiques se rendant à l’université.

Etudiante 10 40 20 10 20 45 20 5 5 5
Etudiant 20 25 30 25 40 20 40 20 15 40

Tester au niveau 5% si le temps moyen de trajet pour les étudiantes et pour les étudiants est identique.
e) Pourquoi est-il raisonnable de penser que les donnée du point précédent peuvent être considérées
comme ! deux échantillons indépendants" ?

Problème 93 Un sondage auprès de 123 étudiants de statistiques a mis en lumière que durant la nuit du
17 au 18 mars 2010, 62 étudiants se sont couchés après 3 heures du matin. Estimer la probabilité qu’un
étudiant de statistiques de cette université se soit couché après 3 heures du matin cette nuit-là. Donner
l’approximation d’un intervalle de confiance à 95% pour la proportion de la population correspondant à
tous les élèves de statistiques de cette université s’étant couché après 3 heures du matin.

23
Problème 94 Un ingénieur compare l’épaisseur de peinture sur des voitures de deux lignes de production
(A) et (B) sélectionnées aléatoirement. Il a reporté ses résultats dans le tableau ci-dessous.

(A) 0.23 0.13 0.28 0.19 0.22 0.34 0.28 0.34 0.17 0.22
(B) 0.11 0.23 0.32 0.06 0.16 0.21 0.15 0.20 0.27 0.19

Est-ce que ces résultats indiquent qu’il y a une différence significative d’épaisseur de peinture sur les deux
lignes de production ? Quelles sont les hypothèses faites dans le point précédent ? Obtenir un intervalle
de confiance à 98% pour l’épaisseur de peinture sur la ligne de production (A).

Problème 95 On dit qu’une variable aléatoire Y suit une loi log-normale de paramètres (m,σ 2 ) si X =
ln Y suit une loi normale N (m,σ 2 ). On dispose d’un échantillon de neuf observations d’une loi log-normale
de paramètres (m,σ ) inconnus :

11, 3 2, 1 1, 1 8, 9 4, 6 5, 7 13, 5 24, 5 16, 4


a) Construire un intervalle de confiance pour m (au niveau α = 0, 05).
b) Même question pour σ.

Problème 96 Considérons un échantillon aléatoire X1 , . . . , Xn issu de la loi normale dont la moyenne


µ est inconnue mais l’écart-type σ est connu.
a) Déterminer l’estimateur de maximum de vraisemblance de µ. Est-il biaisé ? Calculer sa variance.
b) Calculer l’information observée.

Problème 97 Soit X1 , . . . , Xn un échantillon aléatoire issu d’une population de densité


" 1 − 1 (x−γ)
θe si x > γ
θ
fθ,γ (x) =
0 sinon

où θ > 0. Déterminer les estimateurs de maximum de vraisemblance de θ et γ.

Problème 98 Chaque année, la hauteur maximale H de la crue d’un fleuve est mesurée. On estime
qu’une crue supérieure à 6 mètres serait catastrophique. On a modélisé la loi de la variable aléatoire H
comme étant de Rayleigh, i.e la densité de H est
x − x2
fH (x) =
e 2a , x > 0,
a
où a est un paramètre inconnu strictement positif. Pendant 8 ans on a observé les hauteurs de crue
(en m)

2, 5 2, 9 1, 8 0, 9 1, 7 2, 1 2, 2 2, 8
a) Donner l’estimateur du maximum de vraisemblance de a.
b) Une compagnie d’assurance estime qu’une catastrophe n’arrive en moyenne qu’au plus une fois
tous les mille ans. Ceci peut-il être justifié par les observations ?

Problème 99 On considère un n-échantillon X1 , . . . , Xn i.i.d de loi de densité de paramètre α > 0 :


" 1 − 1 −1
αx
α si x ≥ 1
f (x) = .
0 si x < 1

a) Vérifier que f est une densité de probabilité.


b) Déterminer l’estimateur de maximum de vraisemblance de α.

Problème 100 Sur 100 ampoules électriques choisies au hasard, une durée totale de 88 912 heures a été
trouvée. Les durées de vie des ampoules peuvent être modélisées par une loi exponentielle de paramètre
λ, inconnu.
a) Donner l’estimateur de maximum de vraisemblance de λ.
b) Donner un intervalle de confiance à 90% de λ.
c) Au seuil 90%, rejette-on l’hypothèse λ = 0.001 ?

24
Problème 101 Une chaı̂ne de fabrication de composants électroniques produit un pourcentage 100 × p
de produits défectueux. p est inconnu mais on sait que p ≤ 0.08. On teste n composants.
a) Quel est l’estimateur du maximum de vraisemblance de p ?
b) Quelle doit être la taille de l’échantillon pour que l’erreur quadratique moyenne associée à p soit
inférieur ou égal à 0,002 ?

Problème 102 Les temps T1 , T2 , . . . , Tn entre deux pannes successives d’un ordinateur sont des variables
aléatoires indépendantes distribuées identiquement selon la loi Gamma de paramètres α = 2 et λ = 1θ ,
qui a pour fonction de densité :
y −y
f (y) = e θ si y > 0, 0 sinon.
θ2
θ est un paramètre > 0 inconnu et à estimer.
a) On observe les n premiers temps t1 , t2 , . . . , tn entre deux pannes successives ; estimer θ à l’aide de
t1 , t2 , . . . , tn par la méthode du maximum de vraisemblance.
b) Donner le biais et l’erreur quadratique de l’estimateur de maximum de vraisemblance de θ.

Problème 103 On s’intéresse au nombre moyen de pannes réseau hebdomadaires sur un certain réseau.
On se place dans un cadre bayésien et on considère donc que ce nombre moyen, θ, est une variable
aléatoire.
a) On note X la variable aléatoire égale au nombre de pannes réseau sur une semaine donnée. On
suppose que la répartition des pannes sur la semaine est aléatoire. Quelle loi proposez-vous pour X,
conditionnellement à θ ?
b) On a trouvé sur des réseaux similaires un nombre moyen de 4 pannes par semaine avec un écart-
type de 2 pannes par semaine. Proposer un choix simple de loi a priori pour θ et préciser ses paramètres.
Indication : pensez à la densité conjuguée de la loi proposée en 1).
c) Deux pannes se sont produites sur le réseau la semaine dernière, et aucune panne cette semaine.
Donner la loi a posteriori de θ, son espérance a posteriori et sa variance a posteriori.

Problème 104 Un opérateur téléphonique désire mettre à jour la statistique des appels qu’il traite. Les
dernières statistiques donnaient une moyenne de 1000 appels par heure, avec un écart-type de 200 appels.
Du fait de l’extension du réseau, le nombre moyen θ d’appels traités peut avoir évolué. On propose
de donner une estimation bayésienne de θ. Une nouvelle enquête est donc menée. Elle révèle que, au
cours de 10 heures choisies aléatoirement, 7265 appels ont été traités. On note θ la fréquence des appels
téléphoniques et X le nombre d’appels durant une heure donnée. On suppose que, conditionnellement à
θ, X suit une loi de Poisson de paramètre θ :

e−θ θk
P (X = k|θ) = , k = 0, 1, . . .
θ!
On suppose de plus que θ est de loi Gamma(α,λ ).
a) En se basant sur les chiffres de la précédente enquête, quelles valeurs de α et λ préconisez-vous ?
b) Déterminer la loi a posteriori de θ (la nommer et donner ses paramètres).
c) Donner la moyenne et l’écart-type a posteriori de θ.
d) Déterminer l’intervalle de crédibilité au niveau 95% de θ.

Problème 105 Le nombre de fautes X et le nombre de cartons Y distribués dans le groupe B lors de la
coupe du monde de football de 2006 sont donnés dans le tableau qui suit.

Match 1 2 3 4 5 6
X 26 19 34 34 31 39
Y 3 4 6 8 3 4

a) Calculer la covariance et la corrélation du nombre de fautes avec le nombre de cartons.


b) Donner l’estimation de la ligne de régression prédisant le nombre de cartons en fonction du nombre
de fautes.
c) Prédire le nombre de cartons si un match compte 30 fautes.

25
Probabilités et Statistique pour SIC
Corrigés aux Exercises

Corrigé 1 668
Corrigé 2 262 103
Corrigé 3 23!9!2!
Corrigé 4 4!3!5!3!
4
Corrigé 5 C23
5
Corrigé 6 C52
3
Corrigé 7 Remarquons qu’il y a C10 C83 = 6720 façons de choisir un comité de 3 hommes et 3 femmes
dans un groupe de 10 femmes et 8 hommes.
a) Le nombre de comités de 3 hommes qui contiennent les deux hommes qui refusent d’être ensemble
est C61 = 6. Alors, le nombre de comités de 3 hommes qui ne contiennent pas les 2 hommes qui refusent
d’être ensembles est C83 6 = 50. Il s’en suit que la réponse cherchée est
3
C10 (C83 6) = 120 · 50 = 6000.
b) Le raisonemment ici est similaire. On obtient :
3
(C10 C81 )C83 = (120 8) · 56 = 6272.
c) Le nombre des comités avec l’homme et la femme qui refusent d’être ensemble est C92 C72 = 756.
Alors la réponse est
3
C10 C83 C92 C72 = 6720 756 = 5964.
Corrigé 8 Il y a 4! = 24 façons de placer les trois paires de jumeaux dans les 4 chambres. D’autre part,
pour chaque placement, il y a 23 = 8 façons de distribuer les trois paires de jumeaux dans les lits. Il y a
donc 4!23 = 192 façons d’organiser l’expérience.
Corrigé 9 On a
(n 1)! (n 1)! (n 1)!(k + n k)
Cnk 1
1 + Cnk 1 = + = = Cnk
(n k)!(k 1)! (n k 1)!k! (n k)!k!
Corrigé 10 On s’apercoit d’abord qu’il y a 1 + (n k 2) = n k 1 manières de placer le bloc “A . . .
B” de longeur k + 2 dans la rangée. Il faut ensuite tenir compte des permutations de A et B : 2! = 2. Et
des permutations des (n 2) personnes di↵érentes de A et B : (n 2)!. Il y a donc 2(n 2)!(n k 1)
façons d’avoir k personnes entre A et B.
Corrigé 11 a) L’ensemble fondamental de cette expérience est ⌦ =⌦ 1 [ ⌦2 où⌦ 1 = {(D1 , D2 , . . .) où
Di 2 {1, 2, 3, 4, 5} 1  i < 1} (l’événement “aucun 6 ne sort”) et⌦ 2 = [1 n=1 {(D1 , D2 , . . . , Dn 1 , 6) où
Di 2 {1, 2, 3, 4, 5} 1  i  n 1} (l’événement que l’expérience s’arrête).
b) Les points de l’ensemble fondamental qui sont contenus dans En sont de la forme (D1 , . . . , Dn 1 , 6).
L’ensemble⌦ 1 = ([1 c
1 En ) est égal à l’événement “aucun 6 ne sort”, c’est à dire⌦ 1 .

Corrigé 12 a) E \ F = {(1, 2), (1, 4), (1, 6), (2, 1), (4, 1), (6, 1)}.
b) E [ F est égal à l’événement “la somme des dés est impaire ou bien l’un des dés montre 1”.
c) F \ G = {(1, 4), (4, 1)}.
d) E \ F c est égal à l’événement “la somme des dés est impaire et chaque dé montre un nombre plus
grand ou égal à 2”.
e) E \ F \ G = F \ G.

26
Corrigé 13 a) Le point {000 . . .} réprésente l’événement “personne ne gagne”. Les autres points corres-
pondent à des événements où A, B ou C gagne.
b) i) Ceux où le numéro 1 se situe dans la place 3n + 1 pour n entier, correspond à l’evénement où A
gagne.
ii) Ceux où le numéro 1 se situe dans la place 3n + 2 pour n entier, correspond à l’evénement où
B gagne.
iii) Ceux où le numéro 1 se situe dans la place 3n pour n entier, correspond à l’evénement où C
gagne. Finalement, (A [ B)c est égal à l’evénement que C gagne ou personne ne gagne.

Corrigé 14 a) L’ensemble fondamental est formé de tous les arrangements ordonnés possibles de n
personnes. Donc #(⌦) = n!.
b) Soit l’événement Ek =“il y a k personnes entre A et B”. Déterminons #(Ek ) =“nombre de cas
favorables de Ek ” :
On considère d’abord le bloc “A . k!
. . B” de longueur k+2. On s’aperçoit qu’il y a 1+(n k 2) = (n k 1)
manières de le placer dans la rangée.
Il faut ensuite tenir compte des permutations
- de A et B : 2! = 2 permutations,
- des (n 2) personnes di↵érentes de A et B : (n 2)! configurations di↵érentes.
Ainsi,
#(Ek ) = 2 · (n k 1)(n 2)!
et
#(Ek ) 2 · (n k 1)(n 2)! 2 · (n k 1)
P (Ek ) = = = .
#(⌦) n! n(n 1)
Pn 2 2·(n k 1)
Remarque : On peut contrôler que k=0 n(n 1) = 1.
c) Il est facile d’établir la liste des 3! = 6 cas possibles. On obtient alors que
4 2 2 1
P (k = 0) = = et P (k = 1) = = ,
6 3 6 3
ce qui correspond bien à l’expression trouvée sous b).

Remarque : On a bien P (k = 0) + P (k = 1) = 1.
5 4
Corrigé 15 La probabilité de ne tirer aucun 6 est de 6 ' 0.4822. Alors, la probabilité de tirer au
5 4
moins un 6 est de 1 6 ' 0.5177.

5 2n
Corrigé 16 La probabilité de que le six apparaisse au moins une fois est 1 6 . Pour que cette
5 2n
probabilité atteigne 1/2 il faut que 1 6 1/2. C’est à dire que

ln 2
n
2 ln 65

donc n 2.

Corrigé 17 La probabilité que les anniversaires de n personnes soient dans des mois di↵érents est
12 · 11 · · · · (12 n + 1)
12n
Alors, la probabilité qu’au moins deux personnes entre n personnes aient leur anniversaire le même mois
est
12 · 11 · · · · (12 n + 1)
1
12n
Finalement, il faut au moins 5 personnes pour que cette probabilité soit au moins 1/2.

Corrigé 18 a) Deux signaux S1 et S2 atteignent le récepteur dans l’intervalle (0, t). Soient X1 : le temps
d’arrivée de S1 et X2 : le temps d’arrivée de S2 . L’ensemble fondamental ou espace des résultats possibles
est donc :
⌦ = (x1 , x2 ) 2 R2 | 0  x1  t , 0  x2  t .

27
Un élément de cet ensemble (un couple (x1 , x2 )) représente une issue possible de cette expérience (c’est-à-
dire un événement élémentaire de l’ensemble fondamental) : “le signal S1 arrive au temps x1 et le signal
S2 arrive au temps x2 ”.
b) L’événement A qui nous intéresse (i.e. “le récepteur se bloque”) est un sous-ensemble de ⌦ défini
par : n o
A = (x1 , x2 ) 2 ⌦ |x1 x2 | < ✓ .
Le fait d’admettre que “les deux signaux arrivent indépendamment l’un de l’autre et au “hasard”” nous
permet d’affirmer qu’on a a↵aire à un modèle équiprobable. On peut alors calculer la probabilité de
l’événement A comme suit :
✓)2
aire de A t2 2 · (t 2 2✓t ✓2
P (A) = = = .
aire de⌦ t2 t2
c) Si ✓ ⌧ t, on peut négliger ( ✓t )2 par rapport à 2 ✓t , et donc P (A) ' 2✓
t .

Corrigé 19 a) Soit Sn le jet numéro n et En l’événement “deux piles successifs n’apparaissent pas”.
Remarquons que Pn = P (En ) et que
P (En ) = P (En \ {Sn = P }) + P (En \ {Sn = F })
Mais
1
P (En \ {Sn = F }) = P (En 1 \ {Sn = F }) = P (En 1)
2
et
1
P (En \ {Sn = P }) = P (En 2 \ {Sn 1 = F } \ {Sn = P }) = P (En 2)
4
On en déduit que
1 1
Pn = Pn 1 + Pn 2 (1)
2 4
b) Remarquons que Pn est une fonction décroisante de n (c’est à dire que Pn+1  Pn ). On en déduit
que la limite limn!1 Pn existe. Appelons la P1 . En prenant la limite n ! 1 dans l’équation (1) on
déduit que
3
P 1 = P1
4
Ceci étant possible seulement si P1 = 0.
c) Soit Gn,i égale à l’événement “{S8i = P, S8i+1 = F, S8i+2 = P, S8i+3 = P, S8i+4 = P, S8i+5 =
F, S8i+6 = F, S8(i+1) 1 = P }”, et Rn,i = Gcn,i (c’est à dire l’événement “la suite Sj , 8i  j  8(i + 1) 1,
n/8 8
est di↵érente de P, F, P, P, P, F, F, P ”). Soit Rn = \i=1 Rn,i . Par l’indépendance des événements Rn,i ,
1  i  n/8, on a
n/8
Y ✓ ◆n/8
1
P (Rn ) = P (Rn,i ) = 1 (2)
i=1
28

où dans la dernière égalité on a employé le fait que P (Rn,i ) = 1 218 . De l’équation (2), on déduit que
limn!1 P (Rn ) = 0. Mais clairement P (Qn )  P (Rn ) (parce que Qn ⇢ Rn ). Alors, limn!1 P (Qn ) = 0.
Corrigé 20 a) L’ensemble fondamental de cette expérience est ⌦= {(Y1 , Y2 , Y3 ) où 1  Y1 , Y2 , Y3 
6}.
b) Soit X1 le dé qui montre la valeur la plus petite, X3 le dé qui montre la valeur la plus grande et X2
le dé qui montre une valeur entre X1 et X3 (c’est-à dire X1  X2  X3 ). On veut calculer la probabilité
de l’événement “X1 + X2 + X3 15”. On appellera cet événement par E. La table ci-dessous donne les
valeurs de X1 , X2 et X3 qui rend leur somme plus grande ou égale à 15.

X1 X2 X3 somme poids probabilité


3 6 6 15 3 1/216
4 5 6 15 3! 1/216
4 6 6 16 3 1/216
5 5 5 15 1 1/216
5 5 6 16 3 1/216
5 6 6 17 3 1/216
6 6 6 18 1 1/216

28
La cinquième colonne correspond au nombre de façons qu’il y a d’obtenir les valeurs de X1 , X2 et X3
données. Et la sixième colonne correspond à la probabilité de chaque configuration (c’est-à-dire 1/63 =
1/216). Alors, la probabilité recherchée est égale à

(3 + 6 + 3 + 1 + 3 + 3 + 1) 20
P (E) = = ' 0.0926.
216 216
Corrigé 21 La probabilité qu’aucune des deux pièces ne tombe sur pile est égale à la probabilité d’obtenir
(F, F ). C’est à dire 1/4. Alors, la réponse récherchée est 1 1/4 = 3/4.

Corrigé 22 On utilise le fait que l’événement “avoir au moins un succès” est le complémentaire de
l’événement “n’avoir aucun succès”. La probabilité d’obtenir au moins un 6 avec 4 dés est donc de
1 4
1 (1 ) ' 0, 518,
6
et la probabilité d’obtenir au moins un double 6 lors de 24 jets de deux dés est de
1 24
1 (1 ) ' 0, 491.
36
Corrigé 23 On ne peut pas en conclure que P (S = 9) = P (S = 10) car les configurations ne sont pas
équiprobables. Si l’on tient compte de l’ordre elles le sont, il faut donc tenir compte des permutations
possibles de chaque configuration. Ainsi (3,3,3) ne “compte qu’une fois” alors que (5,2,2) “compte triple”
et (5,3,1) “compte six fois”. On obtient P (S = 9) = 25 27
63 et P (S = 10) = 63 .

16⇥15⇥14
Corrigé 24 P {”il gagne”} = 1 P {”il perd”} = 1 20⇥19⇥18 .

Corrigé 25 a) et b) La réponse est la même :


15 · 14 · 13 · 10 · 9
P = = 0.03854.
25 · 24 · 23 · 22 · 21
c) On obtient
15 · 14 · 10 · 9 · 8
P = = 0.0237.
25 · 24 · 23 · 22 · 21
Corrigé 26 Corrigé du problème 36.

Corrigé 27 Soient RR, N N et RN respectivement les événements, “la carte choisie est entièrement
rouge”, “entièrement noire” et “bicolore”. Soit encore R l’événement, “la face apparente de la carte tirée
est rouge”. On aura

P (R|RN )P (RN )
P (RN |R) =
P (R|RR)P (RR) + P (R|RN )P (RN ) + P (R|N N )P (N N )
1 1
2 3
= 1 1 1 1
1· 3 + 2 3 +0· 3
1
=
3
Corrigé 28 Soit M l’événement “le patient est atteint”, B l’événement “le patient est en bonne santé”,
et + l’événement “le résultat du test est positif”. De la formule de Bayes on a

P (+|M )P (M )
P (M |+) =
P (+|M )P (M ) + P (+|B)P (B)
99 1
100 1000
= 99 1 2 999
100 1000 + 100 1000
99
= ' 0.0472
2097
Ceci n’est pas un très bon résultat. Pour essayer de l’améliorer il faudrait répéter le test...

29
Corrigé 29 Soit Sn l’événement “le neme jour est ensoleillé” et Nn l’événement “le nème jour est nua-
geux”. Alors,

sn = P (Sn ) = P (Sn |Sn 1 )P (Sn 1) + P (Sn |Nn 1 )P (Nn 1 )


= psn 1 + q(1 sn 1 )
= (p q)sn 1 +q

On démontre que sn = 12 (1 + (p q)n ), n 0 par induction sur n. Si n = 0 c’est clairement vrai.


Supposons maintenant que cette formule est valide pour n  m. Alors,

sm+1 = (p q)sm + q
✓ ◆
1 1
= (p q) + (p q)m + q
2 2
p+q 1
= + (p q)m+1
2 2
1
= 1 + (p q)m+1 .
2
Ceci montre que le résultat est vrai pour m + 1. Donc sn = 12 (1 + (p q)n ) pour tout n 0.

Corrigé 30 Xn ne peut prendre que les valeurs 0 et 1. En e↵et, il ne peut y avoir plus d’une machine
en panne au début d’une journée. On a

P (Xn+1 = 0|Xn = 0) = p2 + p(1 p) + (1 p) p = p(2 p)


(soit ni l’une ni l’autre ne tombe en panne,
soit l’une tombe en panne et est réparée,
soit l’autre tombe en panne et est réparée)
P (Xn+1 = 0|Xn = 1) = p
P (Xn+1 = 1|Xn = 0) = (1 p)2
P (Xn+1 = 1|Xn = 1) = 1 p.

Corrigé 31 a) P (A|B) = 0.9 et P (Ac |B c ) = 0.8.


b) Les 4 pièces sont acceptées, donc le contrôle des 3 bonnes pièces est sans erreur et il y a erreur
dans le contrôle de la pièce défectueuse . La probabilité d’un tel événement est :

P (A|B)3 · P (A|B c ) = (0, 9)3 · 0, 2 ' 0.146.

c) Soit l’événement E =“il y a erreur dans le contrôle d’une pièce”.


P (E) = P (Ac |B) · P (B) + P (A|B c ) · P (B c ). D’où, puisque P (B c ) = 0, 2,

P (E) = 0, 1 · 0, 8 + 0, 2 · 0, 2 = 0, 12.

P (A|B c ) · P (B c ) P (A|B c ) · P (B c )
d) P (B c |A) = = ' 0, 053.
P (A) P (A|B) · P (B) + P (A|B c ) · P (B c )

Corrigé 32 L’ensemble fondamental de cette expérience est ⌦= {(E1 , E2 ) où E1 est le sexe du premier
enfant et E2 est le sexe du deuxième}. L’événement “les deux enfants sont des filles” est A = {(F, F )},
et “l’aı̂née en est une” est B = {(F, F ), (F, G)}. La probabilité recherchée est

P (A \ B) P (A) 1/4 1
P (A|B) = = = = .
P (B) P (B) 1/2 2

Corrigé 33 L’ensemble fondamental de cette expérience est ⌦= {(D1 , D2 ) où 1  Di  6 et i = 1, 2}.


Appelons A l’événement “au moins l’un d’entre eux montre 6”, et B l’événement “les deux résultats sont
di↵érents”. On veut calculer

P (A \ B)
P (A|B) = .
P (B)
6·5 5
Mais, P (B) = 6·6 = 6 et

30
5 5·4 5 5
P (A \ B) = P (B) P (Ac \ B) = = .
6 6·6 6 9
Alors, la probabilité recherchée est
6
P (A|B) = 1 = 1/3.
9
Corrigé 34 Soit A l’événement “la première carte tirée est un pique” et B l’événement “les deux
dernières en sont”. Remarquons que
13 12 11
P (A \ B) =
52 51 50
13 12 11 39 13 12
P (B) = P (A \ B) + P (A \ B c ) = +
52 51 50 52 51 50
13·12·11 11
Alors, la probabilité recherchée est égale à P (A|B) = 13·12·11+39·13·12 = 50 .

Corrigé 35 Soit D l’événement “la personne selectionée est un daltonien”, H l’événement “elle est un
homme” et F l’événement “c’est une femme”. Tout d’abord, par la formule de Bayes on a
P (D|H)P (H)
P (H|D) =
P (D|H)P (H) + P (D|M )P (M )
Si on admet que les hommes sont aussi nombreux que les femmes, alors P (H) = P (F ) = 1/2 et
5 1
100 · 2 5 20
P (H|D) = 5 1 0,25 1
= = .
100 · 2 + 100 · 2
5.25 21
Si au contraire il y avait deux fois plus de femmes que des hommes, on aurait,
5 2
100 · 3 10 40
P (H|D) = 5 2 0,25 1
= = .
100 · 3 + 100 · 3
10.25 41
Corrigé 36 D’abord remarquons que si Xavier et ses deux parents ont les yeux marrons et si la soeur de
Xavier a les yeux bleus, il faut que les deux parents aient chacun un gène oeil bleu et un autre marron.
a) Xavier peut avoir des gènes (M, M ), (M, B) et (B, M ), alors, la probabilité que Xavier ait un gène
oeil bleu est 2/3.
b) On définira par GX , GF et GE les gènes yeux de Xavier, de sa femme et de son enfant. Alors,
1 21 1
P (GE = (B, B)) = P (GX 2 {(M, B), (B, M )}) = = .
2 32 3
Corrigé 37 a) On numérote les boules blanches de 1 à N . Soit Xi la v.a. définie par : Xi = 1 si la boule
blanche numéro i a été tirée, 0 sinon.
On a
M +N 1 M +N 2 M +N n M +N n
P {Xi = 0} = . ... = ,
M +N M +N 1 M +N n+1 M +N
n
P {Xi = 1} = .
M +N
PN
Comme X = i=1 Xi , on en déduit que :
N
X Nn
E(X) = E(Xi ) = .
i=1
M +N

b) On numérote les boules noires de 1 à M et pour 1  j  M , on définit Yj par : Yj = 1 si la boule


noire numéro j a été tirée avant la première boule blanche, 0 sinon. Pour chaque 1  j  M :
1
P {Yj = 1} = .
N +1
(les événements ”la boule noire numéro j est tirée avant toutes les boules blanches” et ”la boule blanche
numéro i est tirée avant toutes
PM les autres boules blanches et avant la boule noire numéro j” sont
équiprobables). Comme X = j=1 Yj + 1, on obtient :
M
E(X) = 1 + .
N +1

31
Corrigé 38 a) On appelle Xi la somme de 2 dés au i–ème jet : Xi 2 {2, . . . , 12}. On a P (Xi = 5) = 1/9
et P (Xi = 7) = 1/6. On appelle ⌧ le temps d’arrêt du jeu, ⌧ = 1, 2, . . ., et Fj = {⌧ = j} est l’événement
que le jeu s’arrête au j–ème jet. On note que on peut ecrire l’événement Fj comme
h i
{Xj = 5 ou Xj = 7} \ \ji=11 {Xi 6= 5 et Xi 6= 7}

En utilisant cela et l’indépendance des variables Xi on obtient que pour tout j


1/9 2
P (Xj = 5|Fj ) = P ({Xj = 5}|{Xj = 5} [ {Xj = 7}) = = .
1/9 + 1/6 5
P1
b) Puisque le jeu va s’arrêter presque sûrement (c’est–à–dire j=1 P (Fj ) = 1), par la formule de la
probabilité totale on arrive à
1
X ✓ ◆X1
2 2
P ( le jeu s’arrête avec un 5 ) = P (Xj = 5|Fj )P (Fj ) = P (Fj ) = .
j=1
5 j=1
5

c) Par définition de ⌧ et Fj on a
1
X
E(⌧ ) = jP (Fj ).
j=1

Puisque que P (Xi = 5 ou Xi = 7) = 5/18, on voit facilement que


✓ ◆j 1 ✓ ◆
5 5
P (Fj ) = 1 .
18 18
On est donc en train de calculer l’espérance d’une loi géométrique de parametre 5/18 et on conclut
18
E(⌧ ) = = 3.6
5
Corrigé 39 a) X suit une loi binomiale de paramètres n et p : P {X = k} = Cnk pk (1 p)n k .
b) Voir cours. E(X) = np et V ar(X) = np(1 p).
Note : Pour montrer que XP a pour espérance np et variance np(1 p), on peut utiliser la décomposition
n
de X sous la forme X = i=1 Yi où Yi sont des variables aléatoires de Bernouilli indépendantes de
paramètres p. Les Yi ont pour espérance
E(Yi ) = 0 ⇥ P (Y1 = 0) + 1 ⇥ P (Yi = 1) = 0 ⇥ (1 p) + 1 ⇥ p = p
et variance
V ar(Yi ) = E(Yi2 ) E(Yi )2 = {02 ⇥ P (Y1 = 0) + 12 ⇥ P (Yi = 1)} p2 = p p2 = p(1 p).
On a alors
n
X n
X n
X
E(X) = E( Yi ) = E(Yi ) = p = np,
i=1 i=1 i=1
Xn n
X n
X
V ar(X) = V ar( Yi ) = V ar(Yi ) = {p(1 p)} = np(1 p).
i=1 i=1 i=1
Pn Pn
Attention, V ar( i=1 Yi ) = i=1 V Par(Y i ) est P
valable parce que les Yi sont indépendantes mais ce n’est
n n
pas vrai en général. Par contre E( i=1 Yi ) = i=1 E(Yi ) est toujours vrai.
Corrigé 40 a) Il s’agit ici d’un tirage avec remise car le même animal peut être noté deux fois par
l’employé. La probabilité qu’une observation quelconque soit celle d’un lion est de L/(L + T ). Le nombre
de lions notés dans le rapport suit une loi binomiale de paramètres n et p = L/(L + T ). La probabilité
que k lions aient été notés vaut
✓ ◆k ✓ ◆n k
L T
Cnk , k = 0, . . . , n.
L+T L+T
b) Contrairement au a), on est ici dans le cadre d’un tirage sans remise. Le nombre de lions notés
dans le rapport suit une loi hypergéométrique de paramètres L, T et n. La probabilité que k lions aient
été capturés vaut
CLk CTn k
n , k = max(0, n T ), . . . , min(L, n).
CL+T

32
Corrigé 41 On suppose que les dates d’anniversaire sont également réparties sur l’année et, pour sim-
plifier, qu’une année comporte 365 jours.
a) La probabilité qu’une personne au hasard soit née un 1er janvier est alors de 1/365. La probabilités
que les deux époux soient nées un 1er janvier est, en supposant l’indépendance, 1/3652 . Sur les 42800
couples mariés en 2010, le nombre de ceux dont les deux époux sont nés un 1er janvier, X, suit une loi
binomiale de paramètres n = 42800 et p = 1/3652 . On a donc
✓ ◆42798
2 1 1
P (X = 2) = C42800 1 = 0.0374.
3654 3652
b) La probabilité pour que les deux époux soient nés un même jour est 365 fois plus élevée que la
probabilité qu’ils soient nés un 1er janvier. Le nombre Y de couple mariés ayant leur anniversaire le même
jour suit donc une loi binomiale de paramètres n = 42800 et p = 1/365. On a donc
✓ ◆42798
2 1 1
P (X = 2) = C42800 1 ' 0.
3652 365
Corrigé 42 T est une variable aléatoire géométrique, sa fonction de masse est donnée par
P (T = n) = p(1 p)n 1
n 1.
On a
1
X 1
X 1
X 1
d X d 1 1 1
E(T ) = n P (T = n) = n p(1 p)n 1
=p n(1 p)n 1
= p (1 p)n = p = p⇥ 2 = .
n=1 n=1 n=1
dp n=1 dp p p p

D’autre part,
1 1 1
( 1
)
X X X d X
2 2 2 n 1 2 n 1 n
E(T ) = n P (T = n) = n p(1 p) =p n (1 p) = p n(1 p)
n=1 n=1 n=1
dp n=1
( 1
) ⇢
d X d 1 2 1 2 1
n 1
= p (1 p) n(1 p) = p (1 p) = p( + 2) = 2 .
dp n=1
dp p2 p3 p p p

La variance de T vaut donc :


2 1 1 1 1
V ar(T ) = E(T 2 ) E(T )2 = = 2 , p 2 (0, 1].
p2 p p2 p p
Corrigé 43 a) Puisque
1
X 1
X i
P {X = i} = 1 = c = ce ,
i=0 i=0
i!
nécessairement c = e . Il s’agit de la loi de Poisson de paramètre .
o
b) P {X = 0} = c 0! = e .
2 P1 i
c) P {X > 2} = 1 (P (X = 0) + P (X = 1) + P (X = 2)) = 1 e (1 + + 2 )=e i=3 i! . d)
Voir cours. E(X) = V ar(X) = .
Corrigé 44 Commençons par calculer la fonction de masse de X. Pour k entier 0 fixé, on a :
X
P {X = k} = P {X = k|Z = n}P {Z = n}
n k
X n
= Cnk pk (1 p)n k
e
n!
n k

(p )k X k n k
k!(n k)!
= e Cn (1 p)n k
k! n! (n k)!
n k

(p )k X (1 p)n k n k
= e
k! (n k)!
n k
k
(p ) (1 p)
= e e
k!
(p )k
= e p ,
k!

33
X est donc poissonienne de paramètre p .
Ensuite, pour l entier 0 fixé :
X
P {Y = l} = P {Y = l|Z = n}P {Z = n}
n l
X
= P {X = n l|Z = n}P {Z = n}
n l
X n
= Cnl pn l (1 p)l e
n!
n l

(1 p) ((1 p) )l
= e ,
l!
Y est aussi poissonienne de paramètre (1 p) . Enfin :
X
8k, l , P {X = k et Y = l} = P {X = k et Y = l|Z = n}P {Z = n}
n 0
= P {X = k et Y = l|Z = k + l}P {Z = k + l}
(
k k + l)
= Ck+l pk (1 p)l e
l!
p (p )k (1 p) ((1 p) )l
= e e ,
k! l!
X et Y sont bien indépendantes.

Corrigé 45 La fonction de masse de X est donnée par

P (X = n) = p(1 p)n 1
,

et sa FGM MX (t) vaut


1
X 1
X pet
MX (t) = etn p(1 p)n 1
= pet [et (1 p)]n 1
= .
n=1 n=1
1 et (1 p)
0
Le premier moment est donné par MX (0), soit
1
E(X) = .
p
Le deuxième moment est donné par la deuxième dérivée de MX (t) évalué en t = 0 et vaut
2 1
E(X 2 ) = .
p2 p

Corrigé 46 a) Arnaud mise au tour n la somme de 100 ⇥ 2n 1 CHF.


b) Puisque chaque tour est une expérience de Bernouilli de paramètre p, le nombre de tours N jusqu’au
premier succès suit une loi géométrique de paramètre p. Sa fonction de masse est donc

P (N = n) = p(1 p)n 1
, n = 1, 2, . . .

En e↵et, l’événement {N = n} a lieu si les (n 1) premiers tours ont été perdus et le nième a été gagné.
c) Soit Y : le montant investi au dernier pari, c’est-à-dire lorsque Arnaud gagne pour la première fois.
On a Y = 100 ⇥ 2N 1 où N est la variable aléatoire du nombre de tours jusqu’au premier succès. On a
1
X 1
X
E(Y ) = E(100 ⇥ 2N 1
)= (100 ⇥ 2n 1
)P (N = n) = (100 ⇥ 2n 1
)p(1 p)n 1

n=1 n=1
1
X ⇢ 100p
si p > 1/2
= 100p {2(1 p)}n 1
= 1 2(1 p)

n=1
1 si p  1/2

Si p  1/2 il faut être en moyenne infiniment riche pour pouvoir suivre cette stratégie ! Si p > 1/2, une
fortune finie sera en moyenne suffisante.

34
Corrigé 47 Considérons pour fixer les idées la première page. Une erreur donnée apparait sur cette page
avec la probabilité 1/350 puisque les erreurs sont équiréparties (c’est-à-dire réparties au hasard) et il y a
350 pages au total. Le nombre d’erreurs d’impression X sur la première page est donc distribué selon un
loi de Bernouilli B(n = 450, p = 1/350), d’où
2
X ✓ ◆i ✓ ◆450 i
i 1 349
P (X 3) = 1 P (X  2) = C450 ' 0, 14.
i=0
350 350

Puisque n est grand et p est petit, on peut aussi faire l’approximation de cette binomiale par une loi de
Poisson de paramètre = np ' 1.29 et on obtient alors
2
P (X 3) = 1 P (X  2) = 1 e 1+ + /2 ' 0, 14.

Corrigé 48 a) Par calcul direct : pour k entier 0:


Pk
P {Z = k} = P {X = l et Y = (k l)}
Pl=0
k
= l=0 P {X = l}P {Y = (k l)}
( 1+ 2)
Pk l (k l)
= e 1 2
l=0 l! (k l)!
e ( 1+ 2)
Pk l (k l)
= l=0 k! ⇥ l! (k l)!
1 2
k!
k
( 1+ 2) ( 1+ 2)
= e k! ,

Z est encore poissonienne, de paramètre ( 1 + 2) .


b) Rappelons que pour tout t réel,

MZ (t) = E[etZ ] = E[etX etY ] = E[etX ]E[etY ] (par ind.) .

Or :
1
X k
1 t
MX (t) = e 1
etk =e 1
e 1e
= exp( 1 (e
t
1)) .
k!
k=0
t t t
Ainsi : MZ (t) = exp( 1 (e 1)) exp( 2 (e 1)) = exp(( 1 + 2 )(e 1)),
on retrouve le fait que Z est poissonienne de paramètre ( 1 + 2 ).

Corrigé 49 Soit X la variable aléatoire de la taille d’un homme âgé de 25 ans.

P (X > 185) ' 4, 78 %

et
P (X > 192)
P (X > 192|X > 180) = ' 1, 14 %.
P (X > 180)

Corrigé 50 Soit X le nombre de kilomètres couverts par une batterie de voiture avant défaillance.
X ⇠ E( ) avec = 1/10000.
Z 1
1
P (X > 5000) = e x dx = e 5000 = e 2 .
5000
R +1
Corrigé 51 Il faut d’abord calculer c. Pour que f soit une densité on doit avoir 1
f (x)dx = 1,
c’est–à–dire
1
c = R1 .
0
x exp( x/2)dx
On fait une intégration par parties et on obtient
Z 1 Z 1
1
x exp( x/2)dx = 2x exp( x/2) 0
+2 exp( x/2)dx = 4,
0 0

donc c=1/4. Par conséquent la probabilité que le système fonctionne au moins 5 mois est égale à
Z 1
x 1 1 1 5
exp( x/2)dx = exp( x/2) 5 x exp( x/2) 5 = e 5/2 + e 5/2 ' 0.287.
5 4 2 2

35
R1
Corrigé 52 On doit trouver a tel que 1
f (x)dx = 1. Donc

1
a = R1 .
0
x2 exp( bx2 )dx
p
Si on fait le changement de variable y/ 2b = x on obtient
Z 1 ✓ ◆3 Z 1 ✓ ◆3 p Z +1
2 2 1 2 2 1 2⇡ y2
x exp( bx )dx = p y exp( y /2)dy = p ⇥ p exp( y 2 /2)dy.
0 2b 0 2b 2 1 2⇡

La dernière intégrale est égale à 1 (c’est la variance d’une variable normale standard) et donc
4
a = p b3/2 .

Corrigé 53 Z Z Z
1 0 1
x x x
E(X) = dx = dx + dx.
1 ⇡(1 + x2 ) 1 ⇡(1 + x2 ) 0 ⇡(1 + x2 )
et comme Z 1
x 1
dx = ln 1 + x2 |1
0 = 1,
0 ⇡(1 + x2 ) 2⇡
diverge, on en déduit que X n’admet pas d’espérance mathématique.

Corrigé 54 a) On calcule
Z 1
y ↵ 1 1
(↵) = e y y ↵ 1 dx = e y |0 + (↵ 1) (↵ 1) = (↵ 1) (↵ 1) (↵ > 1).
0

Puisque (1) = 1, on en déduit que, pour n un nombre entier 1, ( n) = (n 1)! .


b) On a
↵ Z 1 ↵ Z 1 ↵
y 1 (↵ + 1) ↵
E(X) = x↵ e x dx = ↵
e y dy = = .
(↵) 0 (↵) 0 (↵)

Corrigé 55 Soit P l’événement “la pièce acheté est pirate”. On a alors

P (T > t|P)P (P)


⇡(t) = P (P|T > t) =
P (T > t)
1 5t
4e
= 1 5t + 3 e 2t
4e 4
1
=
1 + 3e3t
On en déduit que
lim ⇡(t) = lim P (P|T > t) = 0.
t!1 t!1

Corrigé 56 La fonction génératrice des moments est définie par MX (t) = E(etX ). Ainsi

E(Y ) = E(eX ) = MX (1) = exp(1/2),


E(Y 2 ) = E(e2X ) = MX (2) = exp(2),
V ar(Y ) = E(Y 2 ) (E(Y ))2 = exp(2) exp(1).

Corrigé 57 a) X et Y étant des durées de vie, on utilise la loi exponentielle. D’après l’énoncé, X suit
une loi exponentielle de paramètre 1 et Y une loi exponentielle de paramètre 2.
b) On a ⇢ ⇢
e t si t 0 2e 2t si t 0
fX (t) = et fY (t) =
0 sinon 0 sinon
donc Z ⇢ ⇢
t
1 e t si t 0 1 e 2t si t 0
FX (t) = fX (x)dx = et FY (t) =
1 0 sinon 0 sinon

36
c) FT (x) = P (T  x) = P ([X  x] \ [Y  x]). X et Y étant indépendantes, on a
FT (x) = P (X  x)P (Y  x) = FX (x)FY (x)

(1 e x )(1 e 2x ) = 1 e x e 2x
+e 3x
si x 0
=
0 sinon
d) FS (x) = P (S  x) = P ([X  x][[Y  x]) = 1 P ([X > x]\[Y > x]). X et Y étant indépendantes,
on a
FS (x) = 1 P ([X > x])P ([Y > x]) = 1 (1 FX (x))(1 FY (x))

1 e x e 2x = 1 e 3x si x 0
=
0 sinon
e) On cherche P (X > x|S  x). On a
P (X > x \ S  x) P (X > x \ Y  x)
P (X > x|S  x) = =
P (S  x) P (S  x)
(1 FX (x))FY (x) e (1 e 2x )
x
= =
FS (x) 1 e 3x
f) On cherche P (T > t|X  x). On a
P (T > t \ X  x) P (Y > t \ X  x)
P (T > t|X  x) = =
P (X > x) P (X  x)
(1 FY (t))FX (x)
= = 1 FY (t) = e 2t .
FX (x)
Corrigé 58 Tout d’abord remarquons que
P (min(X1 , . . . , Xn ) t) = P (X1 t, . . . , Xn t) = P (X1 t)n
t
Mais P (X1 t) = e . D’où
tn
P (min(X1 , . . . , Xn ) t) = e ,
et donc la fonction de répartition de min(X1 , . . . , Xn ) est
tn
P (min(X1 , . . . , Xn )  t) = 1 e .
On en déduit que min(X1 , . . . , Xn ) est une variable aléatoire exponentielle de paramètre n.
Corrigé 59 On regarde pour y 2 R
Z y
P (Y  y) = fY (z)dz.
1

Du fait que la fonction logarithme soit inversible (elle est strictemement croissante), on peut écrire
Z exp(y)
P (Y  y) = P (log X  y) = P {X  exp(y)} = exp( x)dx.
0

On fait le changement de variable z = log x et on obtient


Z y Z y
P (Y  y) = exp(z) exp{ exp(z)}dz = exp{z exp(z)}dz,
1 1

d’où
fY (z) = exp{z exp(z)}.
Corrigé 60 Tout d’abord nous calculerons la loi de Y . C’est-à-dire,
Z 1
1 y2
P (Y x) = P (X ln x) = p e 2 dy
2⇡ ln x
Z 1
1 (ln y 0 )2 1
= p e 2 dy 0
2⇡ x y0
où dans la dernière égalité on a fait le changement de variable y ! ln y 0 . On en déduit que la densité de
la loi de Y est ( (ln y)2
p1 e 2
1
si y 0
f (y) = 2⇡ y
0 si y < 0

37
Corrigé 61 a) Soit fX la densité de X et fY la densité de Y . Remarquons que
Z 1 1 1
xe x(1+y) e x(1+y)
1
fY (y) = f (x, y)dx = + =
0 (1 + y) 0 (1 + y)2 0 (1 + y)2
a
On en déduit que Y a une loi donnée par P (Y < a) = 1+a . D’autre part,
Z 1
x
fX (x) = f (x, y)dy = e
0

On en déduit que X est une variable aléatoire exponentielle de paramètre 1. X et Y ne sont pas
indépendantes parce que f (x, y) 6= fX (x)fY (y).
b) Soit fX la densité de X et fY la densité de Y . Remarquons que
Z 1 x Z 1 x
fX (x) = f (x, y)dy = 60x y 2 dy = 20x(1 x)3
0 0

D’autre part, Z Z
1 y 1 y
2
fY (y) = f (x, y)dx = 60y xdx = 30y 2 (1 y)2
0 0

X et Y ne sont pas indépendantes parce que f (x, y) 6= fX (x)fY (y).

Corrigé 62 On a pour tout réel z :

FZ (z) = FX (z)FY (z),


FZ̃ (z) = 1 (1 FX (z))(1 FY (z)) = FX (z) + FY (z) FX (z)FY (z).

Puis

fZ (z) = fX (z)FY (z) + FX (z)fY (z),


fZ̃ (z) = fX (z)(1 FY (z)) + fY (z)(1 FX (z)).

Corrigé 63 a) On a
Z t Z t u
1u 2v
8t 0, P {Z  t} = 1 2 e { e dv}du
0 0
Z t
1u 2 (t u)
= 1 e (1 e )du
0
Z t
1t 2t
= (1 e ) 1e e( 2 1 )u
du
0

(1 e 1 t ) + 1
(e 1t
e 2t
) si 1 6= 2
= 1
t
2
1 (1 + t)e si 1 = 2 =

b) Rappelons que :

8t 2 R, MZ (t) = E[etZ ] = E[etX etY ] = E[etX ]E[etY ] (par ind.) .

Dans le cas d’une variable exponentielle :


Z +1
1u 1
8t < 1, MX (t) = 1e etu du = ,
0 1 t

d’où :
1 2
8 t < min( 1, 2 ), MZ (t) = .
1 t 2 t
c) On déduit du b) que si 1 = 2, Z est une variable Gamma de paramètres ↵ = 2 et .

38
Corrigé 64 a) On a p
Z 1 x2
1 2p
f (x) = p dy = 1 x2 ,
1 x2 ⇡ ⇡
pour 1  x  1. De même
2p
1 y2 , g(y) =

pour 1  y  1. X et Y ne sont pas indépendantes car h(x, y) 6= f (x)g(y).
b) Cov(X, Y ) = 0 par symétrie.

Corrigé 65 L’ensemble des valeurs possibles prises par X1 est S = {1, 2, 3, 4, 5, 6}. L’énumération des
di↵érents cas possibles donne :

P (X1 = 1) = 1/36 P (X1 = 2) = 1/12


P (X1 = 3) = 5/36 P (X1 = 4) = 7/36
P (X1 = 5) = 9/36 P (X1 = 6) = 11/36

De même, pour X2 ,

P (X2 = 1) = 11/36 P (X2 = 2) = 9/36


P (X2 = 3) = 7/36 P (X2 = 4) = 5/36
P (X2 = 5) = 3/36 P (X2 = 6) = 1/36

On obtient les graphes suivants :

Fonction de masse de X1 Fonction de masse de X2


0.4

0.4
0.3

0.3
P(x)

P(x)
0.2

0.2
0.1

0.1
0.0

0.0

1 2 3 4 5 6 1 2 3 4 5 6
x x

Corrigé 66 a) On vérifie que la somme de lignes vaut 1.


b) FX1 (0) = 0.5, FX1 (1) = 0.7, FX1 (2) = 0.9, FX1 (3) = 1.
FX2 (0) = 0.7, FX1 (1) = 0.9, FX1 (3) = 1.

Fonction de repartition de X1 Fonction de repartition de X2


1.0

1.0
0.8

0.8
0.6

0.6
F(x)

F(x)
0.4

0.4
0.2

0.2
0.0

0.0

−1 0 1 2 3 4 −1 0 1 2 3 4
x x

c) P (Y = 0) = P (X1 = 0)P (X2 = 0) = 0.35.


P (Y = 1) = P (X1 = 0)P (X2 = 1) + P (X1 = 1)P (X2 = 0) = 0.24.

39
P (Y = 2) = 0.23 P (Y = 3) = 0.13.
P (Y = 4) = 0.04.
P (Y = 5) = 0.01.
On vérifie : 0.35 + 0.24 + 0.23 + 0.13 + 0.04 + 0.01 = 1.
d) FY (0) = 0.35, FY (1) = 0.59, FY (2) = 0.82, FY (3) = 0.95, FY (4) = 0.99, FY (5) = 1.

Fonction de repartition de Y

1.0
0.8
0.6
F(y)
0.4
0.2
0.0

−1 0 1 2 3 4 5 6
y

Corrigé 67 La variance p se décompose var(3X 2Y + 1) = 9var(X) 12cov(X, Y ) + 4var(Y ). On a


cov(X, Y ) = corr(X, Y ) var(X)var(Y ) = 2. D’où var(3X 2Y +1) = 48. Par bilinéarité de la covariance,
cov(X +2Y, X Y ) = var(X)+cov(X, Y ) 2var(Y ) = 12. Par linéarité de l’espérance, E(3X 2Y +Z) =
0 () E(Z) = 2E(Y ) 3E(X). D’où E(Z) = 1.

Corrigé 68 var(X1 X2 ) = var(X1 ) + var(X2 ) = 2n⇡(1 ⇡) et on en déduit var(S) = n2 ⇡(1 ⇡).

Corrigé 69 a) Par linéarité de l’espérance, E(5X 3Y + 9) = 5E(X) 3E(Y ) + 9 = 7.


b) On a que cov(X + Y ) = var(X) + var(Y ) + 2cov(X, Y ) et que cov(X Y ) = var(X) + var(Y )
2cov(X, Y ). De là on tire le système d’équations :
(
cov(X, Y ) = 96 2var(X)
cov(X, Y ) = 64 + 2var(X),

d’où l’on déduit var(X) = var(Y ) = 40 et cov(X, Y ) = 16. La corrélation est alors donnée par
p 16 = 0.4.
40⇥40

Corrigé 70 a) X1 et X2 sont distribuées selon une loi binomiale de paramètres (n, 1/6). En e↵et, la
loi binomiale est une somme de lois Bernoulli, qui représentent chacune la probabilité d’un succès ou
d’un échec.
1 1 5
b) On a var(X1 ) = var(X2 ) = n ⇥ 6 ⇥ (1 6) =n⇥ 36 .
c) La variable U représente le nombre total de 1 et de 2 obtenus pendant n lancés. Elle est Bin(n, 1/3),
donc sa variance vaut n ⇥ 29 . On a que cov(X1 , X2 ) = 12 [var(X1 ) + var(X2 ) var(X1 + X2 )] = 36 n
.
n 5n 1
D’où corr(X1 , X2 ) = 36 / 36 = 5 .
12n cov(U,V )
d) On a var(V ) = var(X1 ) + var(X2 ) 2cov(X1 , X2 ) = 36 . En outre, corr(U, V ) = p , où
var(U )var(V )
10n
cov(U, V ) = var(X1 ) + var(X2 ). Ainsi, corr(U, V ) = p .
4 6

Corrigé 71 On utilise Z 1
fZ (z) = fX (x)fY (z x)dx
1

avec ici fX (x) = fY (y) = 1 si 0  x  1 et nulle sinon. On a donc

fX (x)fY (z x) = 1 si 0  x  1 et z 1  x  z, 0 sinon.

Il y a plusieurs cas à considérer :


– Si z > 2 ou z < 0, alors {0  x  1} \ {z 1  x  z} est vide et fZ (z) = 0.
– Si 0  z  1, alors {0  x  1} \ {z 1  x  z} = {0  x  z} et fZ (z) = z.
– Si 1  z  2, alors {0  x  1} \ {z 1  x  z} = {z 1  x  1} et fZ (z) = 1 (z 1) = 2 z.
On retrouve bien la densité voulue.

40
Corrigé 72 Enumérant les événements possibles, on observe que P(Z = 1) = P(Z = 7) = 1/12 et que
P(Z = 2) = · · · = P(Z = 6) = 1/6. E(Z | X = x) = 3.5 + x. On calcule d’abord var(Z | X = 0) = E(Z 2 |
X = 0) E(Z | X = 0)2 = 1/6(62 + · · · + 12 ) 3.52 = 35/12, par ailleurs var(Z | X = 1) correspond à la
même loi, transposée d’une unité. Ainsi, var(Z | X = x) = 35/12 ne dépend pas de x. Le théorème 167 est
1
vérifié, puisque E(Z) = 1 ⇥ 12 + 2 ⇥ 16 + . . . + 6 ⇥ 16 + 7 ⇥ 12
1
= 4 et Ex {E(Z | X = x)} = 12 ⇥ (3.5 + 4.5) = 4.

Corrigé 73 Si z = 0, P(Z = z) = P(X = 0)P(Y = 0) = (1 p)p. Pour z 1, P(Z = z) = P(X =


0)P(Y = z) + P(X = 1)P(Y = z 1) = p(1 p)z 1 (1 p + p2 ). On a E(Z | X = x) = E(Y ) + x et de
même E(Z | Y = y) = E(X) + y, avec E(X) = p(1 p) et E(Y ) = (1 p)/p.

Corrigé 74 On note A, B, C les variables aléatoires des temps de calcul pour chacune des trois sections
du programme.
a) On a cov(A, C) = corr(A, C) A C = 0.2 ⇥ 2.5 ⇥ 1.3 = 0.65.
b) On a
E(T ) = E(A + B + C) = E(A) + E(B) + E(C) = 5.5 + 3.4 + 4.5 = 13.4,
et

var(T ) = var(A + B + C)
= var(A + C) + var(B)
= var(A) + var(C) + 2cov(A, C) + var(B)
= 2.52 + 1.32 + 2 ⇥ 0.65 + 2.62
= 16.

c) Le temps de calcul de la section B est la somme de 100 temps de calculs identiquement distribués et
indépendants. D’après le théorème central limite, la distribution de B est approximativement normale.
Ses paramètres sont ceux obtenus empiriquement, B ' N (3.4, 6.76).
d) La loi de T est approximativement normale comme somme de lois normales avec T ' N (13.4, 16). On
a alors ✓ ◆
T 13.4 10 13.4
Pr(T  10) = Pr p  p = ( 0.85) ⇡ 0.20,
16 16
et ✓ ◆
T 13.4 20 13.4
Pr(T 20) = Pr p p =1 (1.65) ⇡ 0.05.
16 16
Corrigé 75 a) Comme X est une variable aléatoire positive, par l’inégalité de Markov, :
X 75
P {X > 85}  E( )= ' 0, 88.
85 85
b) La connaissance du 2ième moment de X permet d’améliorer la majoration précédente, par l’inégalité
de Chebyshov :
2
1 + E(X)2 25 + 752
P {X > 85} = P {X 2 > 852 }  E(X 2 ) = = ' 0, 78.
852 852 852
On a aussi :
2
P {65  X  85} = P {|X E(X)|  10} = 1 P {|X E(X)| > 10} 1 = 3/4.
102
c) Puisque les notes de chacun des n étudiants sont des variables indépendantes, leur moyenne
arithmétique
n
1X
Xn = Xk
n
k=1
1
est encore d’espérance 75, et sa variance vaut n2 (n.25) = 25/n. On a ensuite :

25/n n 1
P {|X n E(X n )|  5} = 1 P {|X n E(X n )| > 5} 1 = ,
25 n
avec 10 étudiants notre probabilité vaut au moins 0, 9 .

41
d) Voyons s’il est pertinent d’utiliser le T.C.L. Si celui-ci s’applique, on a :
Z 5
5 5
P {|X n E(X n )|  5} ' = P ( 5  Zn  5) = P ( p Z p )
5 25/n 25/n
(où Zn est normale centrée de variance 25/n et Z normale centrée réduite). Le nombre minimum
d’étudiants obtenu est cette fois n = 3 , un résultat franchement di↵érent ! Avec n = 10, on est en
e↵et pas dans ls cas asymptotique et le TCL ne s’applique donc pas.
Corrigé 76 a) ↵ = ✓22 .
b) Par définition FMn (x) = P (max1in Xi  x). Alors,
✓Z x ◆n ✓ 2 ◆n ⇣ ⌘
n x x 2n
FMn (x) = ↵ydy =↵ =
0 2 ✓
dFMn (x)
D’autre part fMn (x) = dx . Alors,
2n 2n 1
fMn (x) = x
✓2n
et
Z ✓
2n 2n 1 2n ✓2n+1 2n
µ1 = E(Mn ) = x x dx = = ✓
0 ✓2n ✓2n 2n + 1 2n + 1
Z ✓
2n 2n 2n ✓2n+2 n 2
µ2 = E(Mn2 ) = x2 x 1
dx = = ✓
0 ✓2n ✓2n 2n + 2 n+1

c) Il faut montrer que pour tout ✏ > 0 on a ; limn!1 P (|Mn ✓| ✏) = 0. Mais, par l’inégalité de
Chebyschov,
1
P (|Mn ✓| ✏)  E((Mn ✓)2 )
✏2
1
= E(M 2 2Mn ✓ + ✓2 )
✏2 ✓ n ◆
✓2 n 4n
= + 1
✏2 n + 1 2n + 1
✓2 1
=
✏2 (2n + 1)(n + 1)
d’où le résultat.
Corrigé 77 Soient X1 , X2 , . . . , X50 les nombres considérés, A1 , . . . , A50 leurs arrondies et U1 , U2 , . . . , U50
les variables d’erreur correspondantes.
P P50 On a donc Xk = Ak + Uk . La somme obtenue en arrondissant est
50
A
k=1 k et la somme exacte est i=k Xk , donc l’erreur sur la somme est
50
X 50
X 50
X
Xk Ak = Uk .
k=1 k=1 k=1
P50
La variable k=1 Uk est centrée (son espérance est nulle), de variance 50 ⇥ 1/12 (par indépendance). On
a donc, par application du T.C.L :
50
X 3 3
P {| Uk | > 3} ' P (|Z| > p ) = 2 ⇥ P (Z > p ) ' 0, 144.
k=1
50/12 50/12

(où Z est normale centrée réduite)


Corrigé 78 Soit T la variable aléatoire de durée de vie du système ; T suit approximativement une loi
normale d’espérance 100 ⇥ 5 = 500 et de variance 2 = 100 ⇥ 25 = 2500 (d’après l’indépendance des
variables de durée de vie de chaque ampoule). On a donc :
525 500
P {T > 525} ' P (Z > p ) ' 0, 31.
2500
(où Z est normale centrée réduite)

42
Corrigé 79 Dans notre problème, une première ampoule de durée de vie X1 est placée puis, lorsque
celle-ci est en fin de vie, on la change par une autre ampoule de durée de vie X2 , etc.
On s’intéresse à la somme des durées de vie de ces ampoules. Puisqu’on s’intéresse à la somme, l’ordre
des Xi importe peu.
Appelons XA la somme des durées de vie des ampoules de type A. Puisque 40 30 et que l’on peut
estimer que la durée de vie d’une ampoule est indépendante d’une autre, on peut appliquer le théorème
central limite qui nous dit que la somme XA obéit approximativement à une loi normale de moyenne
µA = 40A = 4000 [heures] et de variance A 2
= 402 = 400000 [heures2 ].
A
De même, si l’on appele XB la somme des durées de vie des ampoules de type B, on obtient grâce
au TCL (et à l’indépendance des durées de vie) que XB obéit approximativement à une loi normale de
moyenne µB = 60B = 3000[heures] et de variance B 2
= 602 = 150000 [heures2 ].
B
On s’intéresse ici à la somme des durées de vie de toutes les ampoules qui est X = XA + XB . Grâce à
l’additivité de la loi normale et à l’indépendance des durées de vie, X est approximativement une variable
normale de moyenne µ = µA + µB = 7000 et de variance 2 = A 2
+ B 2
= 550000. Ayant obtenu la loi de
X on peut maintenant calculer notre probabilité
✓ ◆
6500 7000
P (X 6500) = 1 P (X  6500) = 1 p =1 ( 0.67) = 0.75.
550000
Corrigé 80 Le nombre de six obtenus lors de 120 jets suit une loi binomiale de paramètres n = 120
et p = 1/6. Cette variable aléatoire a pour moyenne np = 120 · 1/6 = 20 et variance np(1 p) =
120 · 1/6 · 5/6 ' 16, 7. Par le TCL, on approxime le nombre de six obtenus lors de 120 jets par une
variable aléatoire X normale de moyenne µ = 20 et de variance 2 = 16, 7. La probabilité d’avoir moins
de 16 fois le nombre six est alors donné par
15, 5 µ
P (X < 15, 5) = P (Z < ) = P (Z < 1, 1) ' 0, 135,

où Z est une variable aléatoire normale centrée réduite.


Corrigé 81 Soit X le nombre de faces obtenus. X est égal à la somme de 500 variables aléatoires
indépendentes de Bernoulli de paramètre 1/2. X est donc une v.a. binomiale de paramètres n = 500 et
p = 1/2. Son espérance et sa variance valent donc µ := E(X) = np = 500 · 12 = 250 et 2 := V ar(X) =
np(1 p) = 500 · 12 · 12 = 125. Par application du TCL, on a ensuite
P (250 10  X  250 + 10) = P (240  X  260)
✓ ◆
240 µ 260 µ
' P Z = P ( 0, 894  Z  0, 894) = 2 · P (0  Z  0, 894) = 2 · 0, 314 = 0, 628,

où Z est une variable gaussienne centrée réduite


Corrigé 82 a) Puisque que Y = ln X on a
Z 1
E(Y ) = ln x dx = x ln x x|10 = 1,
0

et Z 1
2 2
var(Y ) = E Y (E(Y )) = (ln x)2 dx 1 = x(ln x)2 2x ln x + 2x|10 1 = 1.
0
b) On observe que la fonction ln est strictement croissante et donc
40
P Z < 10 = P (ln Z < 40 ln 10) ,
et que, si on pose Yi = ln Xi , on obtient
100
X
ln Z = Yi ,
i=1

c’est–à–dire ln Z est la somme de 100 variable indépendentes avec la même distribution (et on a calculé
en (a) l’espérance et la variance de Yi ). On va donc utiliser le TCL et remplaçer ln Z par la variable W
de loi N ( 100, 100) . Finalement on obtient
!
40 W E(W ) 40 ln 10 + 100
P Z < 10 ' P (W < 40 ln 10) = P p < ' (0.790) ' 0.78.
var(W ) 10

43
Corrigé 83 La médiane est une mesure de localisation au même titre que la moyenne (confondues dans
le cas gaussien par exemple). La médiane est très peu influencée par une perturbation importante d’une
observation, et donc peu sensible à la présence d’ouliers, au contraire de la moyenne par exemple.

Corrigé 84 La corrélation empirique est définie comme


Pn
1 (xi x̄)(yi ȳ)
pPn i=1 Pn ,
n 1 i=1 (xi x̄)2 i=1 (yi ȳ)2
où x̄ et ȳ sont les moyennes empiriques de x1 , . . . , xn et de y1 , . . . , yn respectivement.

Corrigé 85 Toutes les observations sont égales.

Corrigé 86 La corrélation empirique mesure l’association (linéaire) des variables X et Y et est toujours
comprise entre 1 et 1. On peut donner comme contre-exemple à d) les observations (x1 , y1 ) = (1, 1)
et (x2 , y2 ) = (1, 1), pour lesquelles la corrélation est nulle.

Corrigé 87 La covariance empirique mesure l’association des variables X et Y mais n’est pas bornée.
On peut donner comme contre-exemple à c) les observations (x1 , y1 ) = (1, 1) et (x2 , y2 ) = (1, 1), pour
lesquelles la covariance est nulle. Contrairement à la corrélation, la covariance n’est pas standardisée et
dépend des unités de X et Y .

Corrigé 88 a) La moyenne empirique vaut 150.3 grammes et l’écart-type empirique 33.2 grammes.
Supposant le poids des pommes normalement distribué, alors les bornes d’un intervalle de confiance à
90% se calculent comme suit : 150.3±0.9⇥33.2, autrement dit un intervalle de confiance [120.4, 180.1].
b) Un intervalle de confiance à 90% pour la moyenne recouvre en moyenne (si on cueille plusieurs autres
échantillons de pommes) 9 fois sur 10 la ⌧ vraie moyenne.

Corrigé 89 On estime la proportion de la population qui a donné une mauvaise réponse à 12/120 =
0.1. On pose X comme la variable aléatoire représentant le nombre de bonnes réponses, c’est-à-dire
X ⇠ Bin(120, 0.1). On applique le théorème central limite pour déduire un intervalle de confiance, ici
[0.1 ± 1.96 ⇥ 0.1⇥(1
120
0.1)
] = [0.099, 0.102].

Corrigé 90 a) On a x̄ = 9 et s2 = 6.25.
b) Si X est la variable aléatoire pour le temps de conversation, on cherche P(X 10). On suppose
X ⇠ N (x̄, s2 ), et écrivant X̃ = X s X̄ , la probabilité recherchée est P(X̃ 0.4) = 1 (0.4) = 0.345.
c) On utilise le test du rapport de vraisemblances 2{`0 (8) `a (x̄)} = 2( 21.24 + 20.52) = 1.44. Le
quantile à 95% de la loi 21 étant 3.84, on ne peut rejeter l’hypothèse nulle au niveau 5%.

Corrigé 91 a) Avec n mesures, l’intervalle de confiance à (1 ↵) = 90% pour m est :

[Xn p z1 ↵/2 ; Xn + p z1 ↵/2 ]


n n
p
(Xn étant la moyenne arithmétique des n mesures). L’IC a pour longueur 2( / n)z1 ↵/2 . Pour diminuer
de moitié la longueur de cet intervalle, il faut donc quadrupler le nombre de mesures e↵ectuées, autrement
dit e↵ectuer 75 mesures supplémentaires.
b) Soit ↵ = 0, 1 et ↵0 = 0, 05, Pour obtenir un intervalle de confiance à 95% pour p
m ayant la même
0
p n⇥z1 ↵0 /2
0
longueur que l’IC à 90%, il faut donc un nombre n de mesures qui soit tel que : n ' z1 ↵/2 ' 5, 958,
soit n0 = 35.5, donc 11 mesures supplémentaires.
p
6(m̂X m1 )
Corrigé 92 a) On sait que : ˆX suit une loi de Student à 5 degrés de liberté. On a ensuite :

P {m̂X a  m1  m̂X + a} = P {|m̂X m1 |  a}


= P {m1 a  m̂X  m1 + a}
p p p
6 6 6
= P{ a  (m̂X m1 )  a }.
ˆX ˆX ˆX
p
Cette probabilité vaut 0, 95 si : a ˆX6 ' 2, 57. Ici : ˆx ' 1, 673, on obtient donc : a ' 1, 756, puis

Ix = [47, 44; 50, 96].

44
p
12(m̂Y m2 )
De même, ˆY suit une loi de Student à 11 degrés de liberté, la probabilité P {m̂Y a0  m2 
p
12
m̂Y + a0 } vaut donc 0, 95 pour 0
ˆY .(a ) ' 2, 2, ainsi
Iy = [47, 29; 49, 51].
p
b) 6( m̂X 1
m1
) suit une loi normale centrée réduite, et :
p p
6 p m̂X m1 6
P {|m̂X m1 |  a} = P { a  6( )a },
1 1 1
p
6
vaut 0, 95 pour a 1
' 1, 96, i.e. : a ' 1, 265. Le nouvel intervalle de confiance à 95% pour m1 est donc
Jx = [47, 935; 50, 465].
Pour le deuxième échantillon, les calculs donnent : a0 ' 1,96
2 ' 0, 98, et le nouvel intervalle de confiance
à 95% pour m2 est donc
Jy = [47, 42; 49, 38].
c) (m̂X m̂Y ) est encore normale, d’espérance (m1 m2 ) et de variance : 12 /6 + 22 /12 = 2/3,
p p
I = [(49, 2 48, 4) 1, 64. 2/3; (49, 2 48, 4) + 1, 64. 2/3] = [ 0, 54; 2, 14]
fournit donc un intervalle de confiance à 90% pour la di↵érence (m1 m2 ).
Corrigé 93 a) On a :
1
m̂ = (9 ⇥ 2001 + 21 ⇥ 2003 + . . . + 3 ⇥ 2023) ' 2010, 73,
1000
1
S2 = (9 ⇥ (2001 2010, 73)2 + 21 ⇥ (2003 2010, 73)2 + . . . + 3 ⇥ (2023 2010, 73)2 ) ' 12, 81.
999
b) Soit Z une variable N (0; 1). On a : P {Z > 1, 96} ' 0, 025, P {Z > 2, 58} ' 0, 005 . L’intervalle de
confiance à 95% pour la moyenne m est donc :
1, 96 ⇥ S 1, 96 ⇥ S
[m̂ p ; m̂ + p ] ' [2010, 51; 2010, 95].
1000 1000
L’intervalle de confiance à 99% pour la moyenne m est :
2, 58 ⇥ S 2, 58 ⇥ S
[m̂ p ; m̂ + p ] ' [2010, 44; 2011, 02].
1000 1000
Corrigé 94 On note X la variable aléatoire égale au nombre de cafés bus annuellement par un employé.
D’après l’énoncé, X est normal. Noons µ et 2 respectivement sa moyenne et variance, tous deux inconnus.
A partir des quantité de cafés X1 , . . . , Xn bus annuellement par les n = 300 employés, on a trouvé une
moyenne empirique X̄ = 500 et une variance empirique S 2 = 1002 des quantités de café bus annuellement
par un employé. Un intervalle de confiance à 95% de la moyenne annuelle µ est alors donné par :
p p
[X̄ tn 1 (1 ↵/2)S/ n, X̄ + tn 1 (1 ↵/2)S/ n],
où n = 300 et tn 1 (1 ↵) est le (1 ↵)-quantile de la loi de Student à (n 1) degrés de liberté (égal ici
à z1 ↵ car n = 300 est grand), ↵ = 0.05. On trouve alors l’IC à 95% de µ :
[488.66, 508.79].
Note : Avec la table, on utilise tn 1 (1 ↵) = t1 (1 ↵) = z1 ↵ le (1 ↵) quantile de la loi normale
centrale réduite et on obtient l’IC à 95% de µ :
[488.68, 511.32].
2
Un intervalle de confiance à 95% de la variance de X est donné par :
(n 1)S 2 (n 1)S 2
[ 2 , 2 ],
n 1 (1 ↵/2) n 1 (↵/2)

2 2
où n 1 (↵) est le ↵-quantile de la loi du à (n 1) degrés de liberté. On obtient l’IC :
[8572.39, 11818.53].

45
Corrigé 95 a) Puisque n = 1000 est asez large, on peut supposer que le salaire moyen suit une loi
normale. Un intervalle de confiance au seuil 90% du salaire moyen est (avec ↵ = 0.1)
p p
[X̄ z1 ↵/2 S/ n, X̄ + z1 ↵/2 S/ n] = [47375, 48624].

b) Cela revient à tester l’hypothèse H : ”le salaire moyen est ǵal à 50000 CHF”. D’après la question
précd́ente, on rejette cette hypothèse au seuil 90%, donc on conclut que l’affirmation n’est pas raisonnable.

Corrigé 96 La vraisemblance vaut


n
Y
L(✓) = f✓ (yi )
i=1
⇢ Pn Qn
2 n ✓n e ✓ i=1 yi ✓2n i=1 yi2 , ✓ 0>
=
0, ✓0

puis : ( )
n
X
8✓ > 0, L(✓) = Cte ⇥ exp ✓ yi + 3n log ✓ ,
i=1
Pn
✓ 7! 3n log ✓ ✓ i=1 yi atteint son maximum en

3n
✓ˆ = Pn ,
i=1 yi

qui est l’estimateur du maximum de vraisemblance de ✓.

Corrigé 97 La vraisemblance est


m
Y zi
✓✓
L(✓) = (e ),
i=1
zi !
z1 +...+zm
2m✓ (2✓)
= e , ✓ 0.>
z1 ! . . . z m !
D’où
8✓ > 0, L(✓) = Cte ⇥ exp {(z1 + . . . + zm ) log 2✓ 2m✓} .
L(.) atteint son maximum en Pm
i=1 zi z̄
= , ✓ˆ =
2m 2
qui est l’estimateur du maximum de vraisemblance de ✓.

Corrigé 98 a) Soient x1 , . . . , x400 les données ( 0) de l’échantillon. Pour tout k > 0 :


400
Y
L(k) = fk (xi )
i=1
400
Y P
= k 800 ( xi )e k xi

i=1
n X o
= Cte exp 800 log k k xi ,
P
k 7! 800 log k k xi atteint son maximum en
800 2
k̂ = P = = 1.
xi x

b) La log-vraisemblance vaut
X
`(k) = Cte + 800 log k k xi ,

46
d’où
X
`0 (k) = 800/k xi ,
`00 (k) = 800/k 2 .

L’information observée en k̂ vaut donc J(k̂) = 800/k̂ 2 = 800. Un IC approximatif pour k au niveau
(1 ↵) = 95% est
[k̂ J(k̂) 1/2 z1 ↵/2 , k̂ + J(k̂) 1/2 z1 ↵/2 ] = [0.93, 1.07].
c) La proportion de familles économisant moins de 1000 maravedis est donc :
Z 1
x 2
⇢= xe dx = 1 ' 26%.
0 e

Corrigé 99 a) On a : ⇢ ⇡r 2
= ( Rr )2 , si 0  r  R,
P {⇢  r} = ⇡R2
1, si r > R.
La fonction de densité fR de la variable ⇢ est donc nulle en dehors de l’intervalle [0; R] et telle que :
2r
8r 2 [0; R], fR (r) = .
R2
b) Puisque les variables ⇢1 , . . . , ⇢n sont indépendantes :
n
Y
L(R) = fR (⇢i ).
i=1

On a donc ⇢
0 Q si 0  R < max1in ⇢i ,
L(R) = n
2n ( i=1 ⇢i )/R2n si R max1in ⇢i
et la fonction de vraisemblance L(.) atteint son maximum en :

R̂ = max ⇢i .
1in

Puisque P {(max1in ⇢i )  r} = P (⇢1  r)n = ( Rr )2n , R̂ a pour densité

2n 2n 1
fR̂ (r) = r , r > 0,
R2n

et le bias de R̂ vaut Z R
2n 2n
E(R̂) = r ⇥ r2n 1
dr = R.
R2n 0 2n + 1
Un estimateur sans biais de R est donc
2n + 1
R̃ = max ⇢i .
2n 1in

Corrigé 100 a) La densité de la loi uniforme U (0, b) est


1
f (x) = pour 0  x  b.
b
La vraisemblance est
1
L(b) =pour 0  X1 , . . . , Xn  b
bn
qui atteint son maximum lorsque b est le plus petit possible, i.e. lorsque b est égal à la plus grande des
xi . L’estimateur de maximum de vraisemblance de b est donc b̂ = maxni=1 Xi .

47
Corrigé 101 a) En notant Ua (resp. Ub ) : “X1 provient provient de la loi uniforme sur [0, a]”, on a
8
< 0 si x < 0
FX1 (x) = P (X1  x|Ua )P (Ua ) + P (X1  x|Ub )P (Ub ) si 0  x  b
:
1 si x > b
8
>
> 0 si x < 0
<
p xa + (1 p) xb si 0  x  a
=
>
> p + (1 p) xb si a  x  b
:
1 si x > b

et la fonction de densité est 8


> 0 si x < 0
>
< p (1 p)
a + b si 0  x  a
fX1 (x) = (1 p)
>
> si a  xb
: b
0 si x > b
b) Les variables étant supposées indépendantes, chacune des Xi appartiendra à l’intervalle [0, a] avec
la probabilité FX1 (a). Ainsi Na suit la loi binomiale de paramètre n et p̃ = p + (1 bp)a . Son espérance est
np̃ et sa variance np̃(1 p̃).
c) La vraisemblance pour p est
✓ ◆Na ✓ ◆n Na
p 1 p 1 p
L(p) = +
a b b

et en dérivant par rapport à p


@ log L(p) b a 1
= Na (n Na ) ,
@p pb + (1 p)a 1 p
d’où on tire
Na b na
p̂ = .
b a
Corrigé 102 On a
⇢ ( n
) n ⇢
a+b 2 X Xi a+b 2 X Xi a+b 2 (b a)2
E (X ) =E ( ) = E ( ) =
2 i=1
n 2n i=1
n 2n 12n

(la variance d’une somme de variables indépendantes centrées vaut la somme de leurs variances et Xi /n
2
est de loi uniforme sur [ na , nb ], donc de variance (b12na)2 ).
2
✓ ✓2
Corrigé 103 a) On a E(T̄ ) = ✓/2 et V ar(T̄ ) = 12n donc E(✓1 ) = ✓ et V ar(✓1 ) = 3n ! 0.
b) P (Mn < m) = P (T1 < m et T2 < m . . . et Tn < m), donc
8
< (m/✓)n si m 2 [0, ✓]
P (Mn < m) = 1 si m > ✓
:
0 si m  0

n✓ n✓ 2 n✓ 2
Par intégration, E(Mn ) = n+1 et E(Mn2 ) = n+2 donc V ar(Mn ) = (n+2)(n+1)2 .
n+1 ✓2
c) On prend ✓2 = n Mn . On a E(✓2 ) = ✓ et V ar(✓2 ) = n(n+2) ! 0 quand n ! 1.
d) Puisque la variance de ✓2 est plus faible que la variance de ✓1 (donc risque quadratique plus faible),
il est préférable d’utiliser ✓2 .
e) Mn et ✓2 convergent vers ✓ en probabilité car :
✓ ✏
8✏ > 0, P {|Mn ✓| > ✏} = P {(✓ Mn ) > ✏} = ( )n ! 0

et
n n n n
P {|✓ˆ2 ✓| > ✏} = P {|Mn ✓| > ✏} = P {Mn < (✓ ✏)} + P {Mn > (✓ + ✏)} ! 0.
n+1 n+1 n+1 n+1

48
Corrigé 104 a) La densité a posteriori s’écrit

f (t|✓)f (✓) ✓( +t) ✓( +t)


f (✓|t) = / f (t|✓)f (✓) = ✓e / ✓e .
f (t)

b) La vraisemblance a posteriori s’écrit


n
Y Pn
L(✓) = f (✓|t1 , . . . , tn ) / f (t1 , . . . , tn |✓)f (✓) = f (✓) f (ti |✓) = ✓n e ✓( + i=1 ti )

i=1

qui est maximale lorsque !


n
X
n 1 n
n✓ ✓ + ti =0
i=1

soit l’estimateur du maximum a posteriori


n
✓ˆM AP = Pn
+ i=1 Ti

Corrigé 105 a) D’après l’énoncé, la loi a priori de p est

P (p = 0.05) = P (p = 0.1) = 0.5.

Pour p fixé, X suit une loi binomiale de paramètres n = 20 et p :

P (X = k|p) = Cnk pk (1 p)n k


.

b) D’après la formule des proabilités totales,

P (X = 3) = P (X = 3|p = 0.05)P (p = 0.05) + P (X = 3|p = 0.1)P (p = 0.1)


= 0.0596 ⇥ 0.5 + 0.1901 ⇥ 0.5 = 0.1249.

c) Parmi les 20 composants, 3 composants ont été détectés comme défecteux. Les probabilités a
posteriori de p = 0.05 et p = 0.1 sont, d’après le théorème de Bayes,

P (X = 3|p = 0.05)P (p = 0.05) 0.0596 ⇥ 0.5


P (p = 0.05|X = 3) = = = 0.2386
P (X = 3) 0.1249
P (X = 3|p = 0.1)P (p = 0.1) 0.1901 ⇥ 0.5
P (p = 0.1|X = 3) = = = 0.7614
P (X = 3) 0.1249

Il est a posteriori trois fois plus probable que 10% des composants soient défectueux, plutôt que 5%.
d) L’espérance a posteriori de p est

E(p|X = 3) = 0.05 ⇥ P (p = 0.05|X = 3) + 0.1 ⇥ P (p = 0.1|X = 3) = 0.0881.

La variance a posteriori de p est

V ar(p|X = 3) = E(p2 |X = 3) {E(p|X = 3)}2


= 0.052 ⇥ P (p = 0.05|X = 3) + 0.12 ⇥ P (p = 0.1|X = 3) {E(p|X = 3)}2
= 0.0004

e) La moyenne a posteriori de p n’est ni en accord avec le chef de production (qui affirme que p = 0.05),
ni en accord avec l’inspecteur (qui estime que p = 0.1). Néanmoins, la valeur donnée par l’inspecteur est
la plus proche de la moyenne a posteriori.

49