Académique Documents
Professionnel Documents
Culture Documents
2022/2023
Cours Galien Lyon Est – 2022/2023
PASS – Biostatistiques – Variables aléatoires discrètes et continues - Lois classiques
Table des matières
Biostatistique
VARIABLES ALEATOIRES DISCRETES ET
CONTINUES – LOIS CLASSIQUES
c. Propriétés 9
d. 2. Loi normale centrée réduite 9
a. Propriétés 9
b. Comment fait-on pour calculer d’autres probabilités que celle qui nous sont données ici ? 10
e. 3. Théorème central limite 10
Formules à retenir… 11
- Une variable aléatoire est une variable quantitative associée à une expérience aléatoire. Elle sert à
caractériser le résultat d’une expérience aléatoire et est définie sur l’ensemble des résultats possibles de
cette expérience. C’est L’attribution d’un nombre à chaque résultat de l’expérience.
- Les variables aléatoires sont notées avec des majuscules (X, Y, Z, …) et les valeurs possibles d’une variable
aléatoire sont notées avec des minuscules (x, y, z, …).
Par exemple, les valeurs x sont les réalisations de la variable aléatoire X.
- Il est important de noter que les résultats d’une expérience ne sont pas nécessairement des nombres,
même si c’est souvent le cas. Dans cette situation, on peut attribuer des valeurs aux résultats.
Par exemple, on peut définir la variable aléatoire X : {0, 1} avec 0 : pion blanc et 1 : pion noir.
Propriétés :
Si X et Y sont des variables aléatoires définies sur Ω alors :
- X + Y est une variable aléatoire d´définie sur Ω
- X × Y est une variable aléatoire d´définie sur Ω
- ∀λ ∈ R, λX est une variable aléatoire d´définie sur Ω
Pour les variables aléatoires discrètes, à chaque valeur x de la variable aléatoire X est associée une probabilité
P(X=x).
On dit alors que la loi ou distribution de probabilité est l’ensemble des valeurs possibles x et des probabilités qui y
sont associées ; c’est-à-dire qu’on a : pi = P(X=xi).
1. Propriétés
Pour tout i∈ I ,
P ( X =xi ) ≥ 0
❑
∑ P ( X=x i )=1
i ∈I
La fonction de répartition correspond à la distribution des probabilités cumulées, c’est-à-dire la probabilité que X
soit inférieur ou égal à un x choisit. En d’autres termes :
F ( x )=P ( X ≤ x )
● 0 ≤ F ( x )≤ 1
● F est croissante sur R et est en marches d’escaliers
lim F (x)=0
x→−∞
- On parle de variables aléatoires continues lorsque X peut prendre toutes les valeurs dans un intervalle
donné, borné ou pas. La loi de probabilité n’est alors plus une fonction discrète mais une fonction
continue ; c’est-à-dire que X ne correspond plus à une variable en particulier, mais à un intervalle, à un
ensemble de valeurs.
Par exemple poids, dosage du cholestérol dans le sang, …
- On vient de voir que dans le cas des variables aléatoires continues, X ne correspondait pas à une valeur
précise, discrète. On peut donc écrire : P ( X=x ) =0.
- On associe alors une probabilité à chaque ensemble de valeurs comprises dans un intervalle donné
[ x i , x j ] , P ( xi ≤ X ≤ x j ) .
- Quand cet intervalle tend vers 0 (donc devient infiniment petit), la valeur prise par la variable aléatoire X
tend vers une fonction que l’on appelle fonction de densité de probabilité (notée f(x)). Elle correspond à
la probabilité d’obtenir ces valeurs.
a. 1. Propriétés
● f (x)≥0
+∞
● 0 ≤ F ( x )≤ 1
xj xi xi
- L’espérance d’une variable aléatoire X est un paramètre de position. Il s’agit en fait de la moyenne
théorique de X. On la note E ( X ) ou μ X .
🡪 Dans le cas d’une variable aléatoire discrète : il s’agit de la somme des valeurs possibles de X
pondérées par les probabilités associées, c’est donc l’équivalent de la moyenne arithmétique.
❑
E ( X )=μ X =∑ x i∗P(X =x i).
i
Dans le cas d’une variable aléatoire continue, l’espérance de X est égale à l’intégrale sur les valeurs
possibles de x pondérées par leur densité de probabilité
c. 1. Propriétés
🡪 Propriétés :
− E ( X +Y )=E ( X ) + E ( Y )
− E ( aX + b )=aE ( X ) +b
La variance d’une variable aléatoire est un paramètre de dispersion ; elle mesure la distribution de X autour de la
moyenne. On la note var(X) ou σ²(X).
❑ ❑
−∞
− Une variance est toujours positive ou nulle (c’est le carré de l’écart type)
2
− Pour tout a et b appartenant à R, var ( aX +b ) =a var ( X )
L’écart type d’une variable aléatoire permet de mesurer la dispersion (comme la variance), mais dans la même
unité que la variable aléatoire X. On le note σ(X) et on le défini par :
σ ( X )=√ var ( X )
Définition :
Soit X une variable aléatoire d’espérance E(X) et d’écart type σ(X). On dit que Z est une variable aléatoire centrée
réduite si :
🡪 Définition :
Si X et Y sont 2 variables discrètes indépendantes, alors P ( X =xi , Y = y i ) =P ( X=x i )∗P ( Y = y i )
🡪 Propriétés :
Si X et Y sont 2 variables indépendantes, alors :
− cov(X, Y) = 0 (ATTENTION !!! La réciproque est fausse !!!! Vous verrez pourquoi dans le chapitre
Corrélation Régression)
− var(X+Y) = var(X) + var(Y)
A) Distributions Discrètes
- Cette loi repose sur des expériences dont on distingue deux issues possibles.
- Il s’agit donc d’une loi de probabilité où la variable aléatoire comporte 2 valeurs possibles : 0 ou 1.
- On est donc dans le cas d’une variable aléatoire binaire.
E ( X )=p
var ( X )=E ( X 2 )−E ( X ) =pq
2
10
- On peut utiliser la loi binomiale quand on répète n fois la même épreuve de Bernoulli de façon
indépendante à chaque fois.
- On a donc, à chaque répétition de l’épreuve 2 résultats possibles (0 et 1) et 2 probabilités associées (q et
p).
- On dit alors que la variable aléatoire X (nombre de réalisations de l’événement 1) suit une distribution
binomiale de paramètres n et p que l’on note : X Bin(n , p).
- On cherche la probabilité d’observer k réalisations de l’événement 1 (et donc n-k réalisation de
l’événement 0). En tenant compte du nombre de combinaisons de k réalisations de l’événement 1 parmi
n épreuves de Bernoulli indépendantes :
k k n−k
P(S n=k )=C n p q
k n!
Avec : C n= ; n! = 1 x 2 x … x n ; 0! = 1
k ! ( n−k ) !
E ( Sn ) =np
var ( S n )=npq
σ ( S n )=√ npq
Ex : on reprend la loi de Bernoulli qu’on répète un nombre n de fois, un lancer de 10 pièces (on calculera par
exemple la probabilité d’avoir 5 pile) ou le nombre de bébés fille parmi 10 bébés (on calcule la probabilité d’avoir
5 filles par exemple)
B) Distributions Continues
On note : X N (μ , σ )
La densité de probabilité d’une variable aléatoire X qui suit une distribution normale d’espérance μ et d’écart type
σ est définie par :
1 1 x−μ 2
f(x) = x exp (- ( ¿ ) 🡺 pas utilisable en pratique on utilise les tables
√2 πσ 2 2 σ2
11
● Mode = médiane = μ
🡪 Remarque :
L’intervalle [ μ−σ ; μ +σ ¿ contient 68% des valeurs
L’intervalle [ μ−2 σ ; μ+2 σ ¿ contient 95% des valeurs
L’intervalle [ μ−3 σ ; μ+ 3 σ ¿ contient 99% des valeurs
(règle des 68-95-99%)
Fonction de répartition
On définit la fonction de répartition de la variable aléatoire X par :
x
1
F(x) =
√ 2 πσ 2
∫ ❑exp ¿2)dx
−∞
a. Propriétés
− Mode = Médiane = μ = 0
12
b. Comment fait-on pour calculer d’autres probabilités que celle qui nous sont données ici ?
- Si par exemple, on veut calculer la probabilité d’avoir une valeur de X qui soit comprise entre 1 et 2,5 ;
c’est-à-dire d’avoir P ( 1≤ X ≤ 2 ,5 ) .
- En d’autres termes, on cherche la probabilité d’avoir à la fois P( X ≥ 1) et P( X ≤ 2 ,5).
- Vu que nous sommes dans le cas d’une variable aléatoire centrée réduite et donc suivant une loi
Normale, on peut utiliser la table de la Fonction de Répartition Loi Normale Centrée Réduite.
- On a alors :
P ( 1≤ X ≤ 2 ,5 ) =P ( X ≥ 1 ) + P ( X ≤2 , 5 )
- Cependant, la table ne nous donne que P( X ≤ x).
- On modifie donc notre égalité :
P ( 1≤ X ≤ 2 ,5 ) =P ( X ≥ 1 ) + P ( X ≤2 , 5 )=P ( X ≤ 2 ,5 )−P ( X ≤1 )
- On regarde dans la table « Fonction de répartition de la loi normale centrée réduite » les valeurs pour
z=2,5 et z= 1 : ¿ 0.9938−0.8413=0.152
- On considère des variables X1, X2, …, Xn mutuellement indépendantes de même loi de probabilité
d’espérance μ et d’écart type σ.
- Quand n est suffisamment grand (c’est-à-dire ≥ 30). S n = X1 + X2 + … + Xn suit approximativement une loi
normale d’espérance nμ et d’écart-type σ √ n.
X 1+ X 2+…+ X n
- Quand n est suffisamment grand, la moyenne d’un échantillon M = suit
n
σ
approximativement une distribution normale d’espérance μ et d’écart-type .
√n
En gros : Sn c’est une somme de n loi normale donc Sn=n*N
M est la moyenne de ces lois normales et donc M=Sn/n
X N ( μ;σ)
Sn N ( nμ ; σ √ n )
σ
M N (μ; )
√n
13
14
Esperance et Variance :
❑
E ( X )=μ X =∑ ❑ xi∗P ( X=x i )
i
k k n−k
P( X=k )=C n p q
E ( X )=p E ( Sn ) =np
var ( X )= pq var ( S n )=npq
σ ( S n )=√ npq
−λ k
e λ
P ( X=k )= Variable Centrée Réduite : Z N ( 0 , 1 )
k!
E ( X )=λ X−E ( X )
Z=
var ( X )=λ σ (X )
σ ( X )=√ λ
n ≥ 30 ; np ≥5 ; n ( 1− p ) ≥ 5
15
Questions
2010- 2011
Question 6 :
Pour cet exercice, les valeurs lues dans les tables doivent être arrondies à la valeur entière la plus proche (ex :
4,89 = 5)
On appelle métaboliseurs lents pour CYP2D6 les individus présentant une activité réduite de cette enzyme. Pour
les métaboliseurs lents pour CYP2D6, la prise d’antidépresseurs présente donc un risque important d’effets
secondaires liés à un surdosage.
Dans la population caucasienne, la prévalence du phénotype métaboliseur lent pour CYP2D6 (noté ML) est de
10%. On note Y la variable aléatoire correspondant ay nombre de ML sur un échantillon aléatoire de 900 sujets
caucasiens.
Question 7 :
On note F la variable aléatoire correspondant à la proportion de ML sur un échantillon aléatoire de 900 sujets
caucasiens
A) On peut approximer la loi de F par une loi normale de paramètres μ=0 ,1 et σ=0 ,01
B) L’intervalle de fluctuation de niveau 0,95 de F est [0,08 ;0,12]
C) On ne peut pas calculer l’intervalle de fluctuation car les conditions d’approximation de la loi de F par une
loi normale ne sont pas vérifiées
D) Dans un échantillon aléatoire de 900 sujets caucasiens, la probabilité d’avoir plus de 108 ML vaut environ
2,5%
E) Dans un échantillon aléatoire de 900 sujets caucasiens, la probabilité d’avoir plus de 108 ML vaut environ
5%
16
Question 9 :
Dans la population française, la prévalence de l’hypertension artérielle est d’environ 20% chez les femmes de plus
de 20 ans. On considère un échantillon aléatoire de 100 femmes de plus de 20 ans. On note Y et Z les variables
aléatoires modélisant respectivement la proportion d’hypertendus dans cet échantillon et le double de la
proportion d’hypertendus dans cet échantillon.
Question 15 :
On suppose que dans une population le poids des hommes (en kg) suit une loi normale d’espérance 75kg et de
variance 100 kg2 et que celui des femmes suit une loi normale d’espérance 60 kg et de variance 44 kg 2 . On apparie
chaque femme et chaque homme, au hasard, indépendamment de leurs poids respectifs.
A) La probabilité que, dans un couple, la différence de poids dépasse 15 kg est exactement 0,5
B) La probabilité que, dans un couple, la différence de poids dépasse 30 kg est strictement supérieure à 0,1
C) La probabilité que, dans un couple, la femme soit plus lourde que l’homme est inférieur ou égal à 0,1
D) La probabilité que, dans un couple, l’un des deux soit plus lourd que l’autre est inférieure à 0,83
E) Sachant que la différence de poids dans un couple dépasse 15 kg, la probabilité que ce soit la femme la
plus lourde est environ 0,012
2012-2013
Question 14 :
La probabilité d’accoucher par césarienne dans la population des femmes enceintes françaises est de 15%. On
note X l’effectif d’accouchements par césarienne sur un échantillon de 1000 femmes enceintes issues de la
population française.
17
Question 1 :
L’allèle ε 4, du gène de l’Apolipoprotéine APOE, est connu pour être un facteur de risque de la maladie
d’Alzheimer. On notera ε a les autres allèles possibles pour APOE. Des études de génétique des populations ont
montré que les individus ε 4 ε 4 représentent 5% de la population, les individus ε 4 ε a 30% de la population et les
individus ε a ε a 65% de la population.
On note X la variable aléatoire correspondant au nombre d’individus ε 4 ε 4 dans un échantillon aléatoire de 50
personnes.
On connait par ailleurs la fonction de pénétrance de la maladie : la probabilité d’être malade est de 0,9% 0,3% et
0,1% pour les individus ε 4 ε 4 , ε 4 ε a et ε a ε a respectivement.
2016-2017
Question 4 :
La taille des hommes en France suit approximativement une loi normale de moyenne 175 cm et d’écart-type 10
cm. On note X la variable aléatoire modélisant la taille des hommes en France. On note M 100 la variable aléatoire
modélisant la taille moyenne dans un échantillon aléatoire constitué de 100 hommes français.
A) La taille minimum pour faire partie des 25,4% d’hommes les plus grands est comprise entre 181,6cm et
181,7cm
B) La probabilité pour que la taille moyenne soit supérieure à 171,83 est comprise entre 0,543 et 0,548
C) Un intervalle de confiance de μ à la confiance 0,95 vaut [173 ;177]
D) 95% des valeurs de la taille sont comprises entre 155,4 et 194,6
E) 95% des valeurs de la taille sont comprise entre 173,04 et 171,96
2017-2018
Question 4 :
Soient X et Y, deux variables aléatoires Gaussiennes, indépendantes, d'espérances respectives u x=20 et uy= 10 et
d'écart-types respectifs σ x =¿ 3 et σ y =¿ 2.
On définit la variable W = 2Y — X.
Aide au calcul : 1 , 96=2 √ 5=2 , 2 √ 7=2 , 6 √ 11=3 , 3 √ 17=4 , 1
2018-2019 Décembre
Question 4 :
La prévalence du déficit auditif chez les grands prématurés est de 5%. On considéra un échantillon aléatoire de 95
grands prématurés. On note T la variable aléatoire modélisant la présence d'un déficit auditif chez un grand
prématuré et X la variable aléatoire modélisant le nombre de grands prématurés souffrant de déficit auditif dans
l'échantillon.
2018-2019 Janvier
Question 4
Le taux de cholestérol sanguin chez les enfants âgés de 6 à 9 ans est modélisé par une variable aléatoire X,
Gaussienne, d'espérance 200 mg/dL et d'écart-type 50 mg/dL.
A) Une estimation de la proportion d'enfants entre 6 et 9 ans avec un taux de cholestérol supérieur à 250
mg/dL calculée sur un échantillon de 200 enfants est une variable aléatoire d'espérance 250 mg/dL et
d'écart-type √ 200∗0 ,2∗0 , 8
B) L'estimateur de la moyenne du taux de cholestérol sanguin est égal à 200 mg/dL
C) La probabilité qu'un enfant dont l'âge est compris entre 6 et 9 ans ait un taux de cholestérol supérieur à
240 mg/mL vaut environ 0,2
D) Avec les informations données dans l'énoncé, on peut calculer un intervalle de fluctuation de l'estimateur
de la proportion d'enfants ayant un taux de cholestérol supérieur à 240 mg/dL dans un échantillon de 200
enfants âgés de 6 à 9 ans, au risque α = 5%
E) Avec les informations données dans l'énoncé, on peut calculer un intervalle de confiance au risque 5% de
la proportion théorique d'enfants entre 6 et 9 ans, dont le taux de cholestérol est supérieur à 240 mg/dL
19
En France, 3 entreprises, A, B, et C commercialisent dans les hôpitaux, des lots constitués de 2 réactifs, R1 et R2,
les 2 réactifs étant préparés et contrôlés indépendamment. L’entreprise A fournit 80% des hôpitaux, les
entreprises B et C fournissent chacune 10% des hôpitaux. Des contrôles de qualité ont montré que, parmi les lots
produits par les entreprises A, B, et C, respectivement 1%, 5% et 0,5% des lots présentent un réactif R1 qui n'est
pas parfaitement conforme. Dans l'entreprise A, des contrôles additionnels ont montré que dans 2 lots sur 10
000, les 2 réactifs R1 et R2 ne sont pas parfaitement conformes.
Le CHU de Lyon se fournit dans l'entreprise A.
Question 5 :
Au CHU de Lyon, en 2018, une commande de 900 lots des réactifs R1 et R2 est passée. On note Y la variable
aléatoire modélisant le nombre de lots dans lesquels le réactif R1 n'est pas parfaitement conforme.
Aide au calcul : 0,99=1 1,96=2
2019-2020
Le taux d'a-tocophérol plasmatique suit approximativement une loi normale de moyenne égale à 900 μg/dl et
d'écart-type égal à 400 μg/dl. On notera X la variable aléatoire modélisant le taux d'a-tocophérol plasmatique. Au-
delà de 2100 μg/dL, l'a-tocophérol peut être toxique. Dans un échantillon de 2500 individus, on modélisera la
proportion d'individus dont le taux plasmatique d'a-tocophérol est supérieur à la dose toxique par la variable
aléatoire Y.
On prendra : 0,8416=0 , 8 0,9772=0,977 0,99865=0,998 1,2816=1 ,3 1,6449=1, 6 1 , 96=22,3656=2 , 4
A) Le seuil pour faire partie des 10% d'individus dont le taux d’a-tocophérol plasmatique est le plus bas vaut
environ 380 μg/dl
B) Un intervalle de fluctuation de X, à la confiance 0,95 vaut [884 ; 916]
C) La variable aléatoire Y suit une loi binomiale de paramètres n=2500 et p=0,002
E) La probabilité d'avoir plus de 5 individus dans l'échantillon qui a une dose toxique d'a-tocophérol
√ 0,002∗0,998
2500
20
QCM 6. Dans la population française, on suppose que le taux de LDL-cholestérol (noté LDL-c) suit une loi
normale d'espérance μ = 1,4 g/L et d'écart-type σ = 0,4 g/L. Le taux de LDL-c est supposé normal chez un
individu quand il est inférieur ou égal à 1,6 g/L. Le taux de LDL-c est considéré comme très élevé quand il
dépasse 1,9 g/L.
A. La probabilité que le taux de LDL-c d'un individu dépasse 1,6 g/L vaut environ 0,3 (arrondi à 1 chiffre après
la virgule).
B. La probabilité que le taux de LDL-c moyen dans l'échantillon dépasse 1,9 g/L vaut environ 0,1 (arrondi à
un chiffre après la virgule).
C. Pour faire partie des 80% d'individus ayant le taux de LDL-c le plus élevé, il faut avoir une glycémie au
moins égale à 1,064 g/L. Pour le calcul, selon la table choisie, soit vous arrondirez la valeur de z lue dans la
table à 2 chiffres après la virgule, soit vous prendrez la plus petite des 2 valeurs de z lue dans la table.
D. L’intervalle de fluctuation à la confiance 0,95 du taux de cholestérol d'un individu vaut: [1,2; 1,6].
E. [ITEM NEUTRALISE] L’estimateur de la proportion d'individus ayant un taux de LDL-c supérieur à 1,6 g/L
suit approximativement une loi normale de paramètres μ =0,3 et σ = 20 0,3 0,7.
QCM 7. Le taux de réussite en 1ère année de licence de biologie est de 60%. On constitue un échantillon
aléatoire simple de 10 étudiants de 1ère année de biologie. On note :
21
2021-2022
QCM 3. Variables aléatoires et lois classiques. Concernant la fonction de répartition d’une loi de probabilité
d’une variable aléatoire X. Indiquez la ou les réponse(s) juste(s) :
A. Si la loi de probabilité est discrète, la hauteur des marches correspond aux probabilités des différentes
valeurs de X.
B. Si la loi de probabilité est continue, la limite en + l’infini (+∞) de la fonction de répartition vaut 0,5.
C. La fonction de répartition d’une loi discrète est monotone croissante.
D. La densité d’une loi continue est l’intégrale de sa fonction de répartition.
E. L’aire sous la courbe de la densité d’une loi continue vaut 1.
QCM 6. (coef. 2) Variables aléatoires et lois classiques – Intervalles. Au cours d’une étude, on mesure le volume
d’éjection systolique (VES) d’un échantillon de 100 patients choisis aléatoirement dans la population étudiée.
L’estimation du VES moyen vaut 100 mL et l’estimation de la variance du VES vaut 400 mL².
QCM 7. Variables aléatoires et lois classiques. Probabilités. En 2021, 14 % des étudiants ont obtenu une
mention très bien au bac. On considère un échantillon constitué de 25 étudiants ayant passé le bac en 2021. On
définit T, la variable aléatoire modélisant le nombre d’étudiants ayant eu une mention très bien dans
l’échantillon et U, la variable aléatoire qui pour un étudiant donné prend la valeur 1 s’il a obtenu une mention
très bien et 0 sinon.
22
Correction
2010-2011
Question 6 : B
A) FAUX. L'extraction des informations de l'énoncé est une nouvelle fois cruciale dans cet exercice.
L'important ici est de noter la prévalence des métaboliseurs lents : P(ML) = 0.10, ainsi que le nombre de
patients composant l'échantillon, n = 900. A partir de la, on peut d'ores et déjà noter que la réponse A est
fausse, car une loi de Bernoulli ne concerne qu'un seul événement.
B) VRAI. C'est en fait une LOI BINOMIALE DE PARAMETRE n = 900 ET p = 0.1, c'est à dire une modélisation
de N épreuves de Bernouilli indépendantes.
C) FAUX. Y ne suit pas non plus une loi normale de paramètres μ=90 et σ=9, mais elle la suit DE FAÇON
APPROXIMATIVE.
D) FAUX. Pour l'item D, rappelons que la prévalence d'être un métaboliseur lent n'est qu'une probabilité. De
ce fait, avoir une prévalence de 10% au sein d'un échantillon aléatoire de 900 sujets ne nous garantit pas
d'y trouver 90 métaboliseurs lents exactement.
E) FAUX. Concernant l’item E :
Y −µ 0−0.90
P ( Y =0 )=P( )¿ = −10
σ 9
On cherche donc Φ(-10) dans la table de la fonction de répartition (table I), soit 1 – Φ(10).
La plus haute valeur que l’on peut lire est Φ(4.09), on peut donc uniquement supposer que Φ(10) sera
égal à 0.999999999…
1- Φ(10) sera donc très proche de 0, mais ne sera pas nulle.
Question 7 : ABD
A) VRAI.
B) VRAI.
C) FAUX.
D) VRAI.
E) FAUX
Pour cet exercice, il s'agit de déterminer un intervalle de fluctuation pour une proportion. On utilise pour cela la
√
2
formule suivante : p ± zα/2 s
n
Mais il faut avant tout vérifier les conditions d'approximation de la loi de F (Item C), c'est à dire que :
900 ≥ 30 900 x 0.1 = 90 ≥ 5 900 x 0.9 = 810 ≥ 5
F suit donc approximativement une loi normale, de paramètres (p ; √(pq/n)), id est (0.1 ; 0.01).
=> A : VRAI ; C : FAUX
23
Bornes = 0.1 ± 2 x
√ 900 √
0.1 x 0.9 = 0.1 ± 2 x 0.09 = 0.1 ± 2 x 1 = 0.1 ± 0.02
900 100
Enfin, La borne supérieure de l’intervalle de fluctuation à 95% de F est égale à 12%, d’où P(F>12)=2.5%. De ce fait,
P (Y > 900 x 0.12 = 108)=2.5%
2011-2012
Question 9 : AD
A) VRAI. Cf. Cours.
B) VRAI.
C) FAUX.
D) VRAI.
E) FAUX.
L’important dans l’énoncé est de noter la prévalence de l’hypertension artérielle, P(HTA)= 0.20, ainsi que le
nombre de sujets participants à l’étude, n=100.
=> B : VRAI ; C : FAUX
Y est une proportion dont la distribution peut être approximée par une loi normale de paramètres µ=p=0,2 et
σ=
√ √
pq
n
=
=> D : VRAI
0.2× 0.8 = 0.04
100
Question 15 : BE
Soit H la variable aléatoire suivant une loi normale N de paramètres (75 ; √ 100), et F une autre variable aléatoire
suivant une loi normale N de paramètre (60, √ 44 ).
Δ=H-F, Δ suit donc une loi normale de paramètres (15 ; √ 144 =12).
24
La probabilité que dans un couple, la femme soit plus lourde que l’homme est
P(F>H) = P(Δ<0) = P(Z<(-15/12)) = P(Z<-1.25) = 1- Ф(1.25) = 1-0.8944 > 0.1 🡪 C : FAUX
La probabilité que dans un couple, l’un des deux soit plus lourd que l’autre est égale à 1. 🡪 D : FAUX
On ne peut pas faire le calcul à la main, par contre, on peut vérifier si la réponse est à peu près correcte. Le
dénominateur vaut à peu 0,5 et 0,5*0,012=0,006. On trouve à peu près le numérateur. Donc E est VRAI.
2012-2013
Question 14 : ABDE
A) VRAI. Dans cet exercice, on s’intéresse à la probabilité pour des femmes enceintes d’accoucher ou non par
césarienne. Il y a donc 2 événements différents ; soit la femme accouche par césarienne, soit par voie
naturelle. De plus, on regarde le nombre de fois que se renouvelle l’événement « la femme accouche par
césarienne » sur un échantillon de 1000 femmes (et les observations sont indépendantes les unes des
autres). On répète donc 1000 fois un schéma de Bernoulli ; X suit donc une distribution binomiale de
paramètre (1000 ; 0.15).
B) VRAI. Pour faire une approximation d’une distribution binomiale par une loi Normale, il faut vérifier les
conditions d’approximations :
𝑛 = 1000 ≥ 30 ; 𝑛𝑝 = 1000x0.15 = 150 ≥ 5 𝑒𝑡 𝑛(1 – 𝑝) = 1000x0.85 = 850 ≥ 5
Nous pouvons donc bien approximer la distribution de X par une distribution Normale.
C) FAUX. Pour faire une approximation d’une distribution binomiale par une loi de Poisson, il faut vérifier les
conditions d’approximation
𝑛 = 1000 > 50 ; 𝒑 = 𝟎. 𝟏𝟓 > 𝟎. 𝟏 𝒆𝒕 𝒏𝒑 = 𝟏𝟓𝟎 > 𝟏𝟎
Les conditions d’approximation ne sont pas respectées, nous ne pouvons donc pas approximer la
distribution.
D) VRAI. On cherche ici la probabilité d’avoir 150 accouchements par césarienne (ou moins) dans notre
échantillon ; c’est-à-dire la probabilité d’avoir 𝑋 ≤ 150 ; soit 𝑃 (𝑋 ≤ 150).
25
On a vu précédemment que X suivait une loi Binomiale, donc μ=¿𝑛𝑝 = 1000 x 0.15 = 150
et σ x = √ npq = √ 150 x 0.85 = √ 127.5 ≈ 11 (car √ 121 = 11).
Application numérique :
La probabilité d’observer un effectif d’accouchements par césarienne inférieur ou égal à 150 est donc de
0,5 soit 50%.
E) VRAI. C’est logique, mais si on veut utiliser des formules, on peut dire que :
P(X ≤15) = P(X = 0) + P(X = 1) + ... + P(X = 15) car nous sommes dans le cas de variables discrètes.
2014-2015
Question 1 : BE
La variable aléatoire X correspond au « nombre d’individus e4e4 » dans un échantillon de 50 personnes. X suit
donc une loi binomiale de paramètres : N = 50 et p = 0.05
A) FAUX
B) VRAI
C) FAUX
D) FAUX
Conditions d’approximations de la loi binomiale par la loi normale : n>30 ; np >5 ; n(1-p) > 5
Or dans cet exercice np = 50 x 0.05 = 2.5 donc < 5. Les conditions d’approximations de la loi binomiale par la
loi normale ne sont pas respectées.
E) VRAI
Conditions d’approximations de la loi binomiale par la loi de Poisson : n > 50 ; p < 0.1 ; np < 10
Les 3 conditions étant toute respectées, X suit approximativement une loi de Poisson de paramètres λ = np =
2,5.
2016-2017
Question 4 : ABD
A) VRAI : La variable aléatoire X, modélisant la taille des hommes en France suit une loi normale de
paramètres μ=175 et σ =10 .
Pour répondre à l’item, on va chercher à déterminer deux probabilités : P1 ( X ≤181 , 6 ) et P2 ( X ≤181 , 7 )
On utilise donc le théorème centrale limite :
( 181 ,σ6−μ ≤ X −μ
P1 (181 , 6 ≤ X ) ⟺ P 1
σ )
⟺P (
181 , 6−175
10
≤ Z )⟺ P (0 , 66 ≤ Z )
1 1 1 1
P ( 181, 7 ≤ X ) ⟺ P ( ) ⟺P ( ≤ Z )⟺ P (0 , 66 ≤ Z )
181 , 7−μ X −μ 181 , 7−175
2 2 ≤ 2 2 2 2
σ σ 10
On regarde ensuite dans la table de la loi normale centrée réduite et on trouve alors :
P1=0,7454 et P2=0,7486 ; On a donc 74,54% des hommes en France qui font moins de 181,6 cm et
26
B) VRAI : On cherche P( X> 173 , 83) . On utilise une nouvelle fois le théorème centrale limite :
C) FAUX : Attention au piège ici ! On nous donne dans l’énoncé des données sur la population des hommes
en France et non sur un échantillon. On ne peut donc pas déterminer un intervalle de confiance ici un
intervalle de fluctuation. Il faut bien faire la différence entre les 2 types d’intervalle pour ne pas être pris
au piège par des items comme celui-ci.
D) VRAI : Comme dit dans le cours sur les Variables Aléatoires (dans la partie sur la Loi normale), 95% des
valeurs sont contenues dans l’intervalle : [ μ−2 σ ; μ+2 σ ]
95% des valeurs de la taille sont donc comprise dans l’intervalle suivant : [ 175−2 ×10 ; 175+2 ×10 ]
⟺ [ 155 ; 195 ] ⟺ [ 155 , 4 ; 194 ,6 ] car dans un intervalle, on minore la borne inf. et on majore la borne
sup.
2017-2018
Question 4 : ABCE
Y −μ ( Y )
C) Vrai : La variable aléatoire centrée réduite Z= suit la loi normale.
σ (Y )
p ( Y ≥ 8 )= p ( Z ≥−1 )= p ( Z ≤ 1 )=0.8413
D) Faux : p ( 15< X <20 )=1− p ( X ≤ 15 )− p ( X ≥ 20 )
E) Vrai :
[ ]
IF 1−0.05 ( W )= μW −z 0.05∗σ W ; μW + z 0.05 ∗σ W =[ 0−1.96∗√ 7 ; 0+1.96∗√ 7 ] = [−2∗2.6 ; 2∗2.6 ] =[ −5.2; 5.2 ]
2 2
27
Question 4 : B
A) FAUX : D’après l’énoncé, T suit un schéma de Bernoulli de paramètres p= 0,05. C’est X qui suit une loi
binomiale de paramètres n= 95 et p= 0,05
B) VRAI : On nous demande la probabilité suivante : P( X ≤ 1). Or, X suit une loi binomiale donc :
95! 0 95 95! 1 94 95 9
P ( X ≤1 ) =P ( X=0 )+ P ( X=1 )= ×0 , 05 ×0 , 95 + ×0 , 0 5 × 0 , 9 5 =1 ×1 ×0 , 95 +95 × 0 , 05× 0 , 95
0 ! 95 ! 1! 94 !
C) FAUX : voir correction item B
D) FAUX : Dans un échantillon de 95 grands prématurés, la proportion de nouveau-nés présentant un déficit
auditif suit un schéma de Bernoulli. C’est le nombre de nouveau-nés présentant un déficit auditif dans un
échantillon de 95 grands prématurés qui suit une loi binomiale.
E) FAUX : voir correction item D
2018-2019 Janvier
Question 3 : CD
A) FAUX : C'est l'estimateur de la proportion qui est une variable aléatoire, de plus l'écart type est égal à
Question 5 : ABD
A) FAUX : Attention Y suit une loi binomiale correspondant à plusieurs répétitions d'une expérience de
Bernoulli, ici 900 répétitions. Le paramètre est bien p = 0,01
B) VRAI : Les conditions sont respectées avec n = 900 > 50, p = 0,01 < 0,1, np = 900 x 0,01 = 9 < 10
C) VRAI : On réalise ici une approximation de la loi binomiale par la loi normale centrée réduite après
vérification des conditions d'approximation n = 900 > 30, np = 900 x 0,01 = 9 > 5, nq = 900 x 0,99 = 891 > 5
. Le nombre de lots contenant un réactif R1 non conforme suit approximativement la loi normale N(9; 3).
On a donc P(Y > 3) = P(Z > —2) après avoir centré et réduit.
Cela correspond à P(Z < 2) = 0,9772 ≈ 0,98 après lecture dans la table
28
2019-2020
B) VRAI
Dans la table on trouve une probabilité d’avoir un taux supérieur à 380 est de 0,9032. Pour cet item on
demandait un taux inférieur à 380. 🡪
10%
Les conditions sont respectées donc il est possible d’approximer avec 𝜇=𝑝=0,002 et
E) VRAI
Or notre table s’arrête à P(Z>5) = 0,99998 donc 1−𝑃(𝑍≤5) =0,00002
Ainsi 1−𝑃 (𝑍≤ 5000) < 0,00002
2020-2021
A. VRAI.
B. FAUX. Sa fonction de répartition est monotone CROISSANTE.
C. VRAI. Sa densité est bien symétrique, à retenir !
D. VRAI. Que l’on appelle plus simplement loi normale centrée réduite.
E. VRAI. L’intervalle [μ - σ ; μ + σ] contient 68% des valeurs.
L’intervalle [μ – 1,96σ ; μ + 1,96σ] (on arrondit généralement 1,96 à 2) contient 95% des valeurs.
L’intervalle [μ – 3σ ; μ + 3σ] contient 99% des valeurs.
29
X−E ( X ) 1 , 6−1, 4
A. VRAI. Pour commencer, on centre et on réduit. Z = = =0 , 5
σ (X) 0,4
On regarde maintenant dans notre table (fonction de répartition de la loi normale centrée réduite), avec
z=0,5. On trouve P(Z < z) = 0,6915 donc P(Z > z) = 1 - P(Z < z) = 0,3085 0,3.
B. FAUX. L’item aurait été vrai si l’on parlait du taux de LDL-c d’UN individu et non du taux de LDL-c moyen.
C. VRAI. Pour cet item, on peut procéder de deux manières, mais le tout est d’être méthodique :
On encadre maintenant dans notre table (ici la fonction de répartition), et on trouve 0,7995 < p <
0,8023. Ce qui correspond bien à notre item.
On regarde dans la table les deux valeurs de P qui encadrent le plus précisément la notre (ici 0,8), puis
on relève les valeurs de z correspondantes.
Ici notre z sera compris entre 0,84 et 0,85.
On repart de notre formule pour ensuite résoudre l’équation suivante et vérifier si l’on trouve la
valeur de l’item :
Z=
σ (X) |
X−E ( X ) X−1 , 4
=
0,4 |
=0 , 84 → X=−0 , 84∗0 , 4+ 1, 4=1,064
Remarque : Si vous utilisez cette technique, pensez à essayer le calcul avec un Z positif puis négatif.
D. FAUX. Ici, on est dans le cas d’une loi normale. On sait donc que 95% des valeurs sont comprises entre [μ
– 2σ ; μ + 2σ]. Donc l’intervalle de fluctuation serait de [0,4 ; 2,2].
E. ITEM NEUTRALISE.
30
A. VRAI. Pour la variable X, nous sommes dans le cas d’une loi de Bernoulli.
La variance s’exprime donc var(X) = E(X²) – E(X)² = pq avec ici p, la réussite de l’élève, et q, l’échec.
B. VRAI. Pour la variable Y, nous sommes dans le cas d’une loi binomiale. On cherche la probabilité que 2
élèves réussissent leur année dans l’échantillon concerné, on l’exprime par :
P(Y=k) = avec =
10! 10 ! 10∗9∗8∗7∗6∗5∗4∗3∗2∗1 10∗9
= = = =45
2! ( 10−2 ) ! 2! 8 ! (2∗1)(8∗7∗6∗5∗4∗3∗2∗1) 2
2021-2022
CORRECTION QCM 3 : AE
A. VRAI.
B. FAUX. Item logique, la limite en +∞ d’une loi de probabilité continue vaut 1. Une probabilité est comprise
entre 0 et 1, et non pas 0 et 0,5.
C. FAUX. La fonction de répartition d’une loi discrète n’est pas monotone, il s’agit d’une fonction en
« marches d’escaliers ».
D. FAUX. C’est l’inverse, c’est la fonction de répartition d’une loi continue qui est l’intégrale de sa densité.
E. VRAI.
31
A. FAUX. 𝑖𝑐0,966 (μ) = [m ± zα/2 x √s²/√n] = [100 ± 2,12 x 20/10] = [95,7 ; 104,3]
B. FAUX. Le résultat est bon, mais on calcule un intervalle de confiance d’une moyenne théorique (ici μ) et
non d’une moyenne estimée (m).
C. FAUX. Toujours pareil, c’est sur la valeur estimée.
D. VRAI.
zα
∗s
E. VRAI. 2 l z∗s∗2 d’où n=400. A l’aide la table, on trouve z = 1,96 = 2.
i= = → √ n= =20
√n 2 l
A. VRAI.
B. VRAI.
C. FAUX. Il n’est pas rigoureux de calculer l’intervalle de confiance d’une variable aléatoire.
D. FAUX. Attention ! La condition n > 30 n’est pas respectée.
E. VRAI. C’est une loi de Bernoulli, E(U) = 0,14.
32