Vous êtes sur la page 1sur 32

CAHIER PASS

2022/2023
Cours Galien Lyon Est – 2022/2023
PASS – Biostatistiques – Variables aléatoires discrètes et continues - Lois classiques
Table des matières

I. Variables aléatoires discrètes et continues 3


A. Les variables aléatoires discrètes 3
1. Propriétés 3
2. Fonction de répartition 4
B. Les variables aléatoires continues 4
a. 1. Propriétés 4
b. 2. Représentation graphique 5
C. Espérance et variance d’une variable aléatoire 5
c. 1. Propriétés 5
d. 2. La variance d’une variable aléatoire 6
3. L’écart type d’une variable aléatoire 6
D. La variable aléatoire centrée réduite 6
E. Les variables aléatoires indépendantes 7
II. Lois de probabilité classiques 7
A) Distributions Discrètes 7
e. 1. La loi de Bernoulli (ou schéma de Bernoulli) 7
f. 2. La loi binomiale 8
B) Distributions Continues 8
a. 1. Loi normale (ou loi de Laplace-Gauss) 8
b. Notion de densité de probabilité 8

Biostatistique
VARIABLES ALEATOIRES DISCRETES ET
CONTINUES – LOIS CLASSIQUES
c. Propriétés 9
d. 2. Loi normale centrée réduite 9
a. Propriétés 9
b. Comment fait-on pour calculer d’autres probabilités que celle qui nous sont données ici ? 10
e. 3. Théorème central limite 10
Formules à retenir… 11

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
III. Annales classées corrigées 12
Questions 12
Correction 19

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
I. Variables aléatoires discrètes et continues

- Une variable aléatoire est une variable quantitative associée à une expérience aléatoire. Elle sert à
caractériser le résultat d’une expérience aléatoire et est définie sur l’ensemble des résultats possibles de
cette expérience. C’est L’attribution d’un nombre à chaque résultat de l’expérience.

- Les variables aléatoires sont notées avec des majuscules (X, Y, Z, …) et les valeurs possibles d’une variable
aléatoire sont notées avec des minuscules (x, y, z, …).
Par exemple, les valeurs x sont les réalisations de la variable aléatoire X.

- Il est important de noter que les résultats d’une expérience ne sont pas nécessairement des nombres,
même si c’est souvent le cas. Dans cette situation, on peut attribuer des valeurs aux résultats.
Par exemple, on peut définir la variable aléatoire X : {0, 1} avec 0 : pion blanc et 1 : pion noir.

Propriétés :
Si X et Y sont des variables aléatoires définies sur Ω alors :
- X + Y est une variable aléatoire d´définie sur Ω
- X × Y est une variable aléatoire d´définie sur Ω
- ∀λ ∈ R, λX est une variable aléatoire d´définie sur Ω

- Il existe 2 types de variables aléatoires :


• On parle de variables aléatoires discrètes lorsque X prend un nombre fini ou infini
dénombrable de valeurs distinctes. Exemple : Nombre d’opérations réalisées dans un service
de chirurgie
• On parle de variables aléatoires continues lorsque X prend un nombre infini indénombrable
de valeurs dans un intervalle. Taux de glucose sanguin

A. Les variables aléatoires discrètes

Pour les variables aléatoires discrètes, à chaque valeur x de la variable aléatoire X est associée une probabilité
P(X=x).
On dit alors que la loi ou distribution de probabilité est l’ensemble des valeurs possibles x et des probabilités qui y
sont associées ; c’est-à-dire qu’on a : pi = P(X=xi).

1. Propriétés

Pour tout i∈ I ,

P ( X =xi ) ≥ 0

∑ P ( X=x i )=1
i ∈I

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
2. Fonction de répartition

La fonction de répartition correspond à la distribution des probabilités cumulées, c’est-à-dire la probabilité que X
soit inférieur ou égal à un x choisit. En d’autres termes :
F ( x )=P ( X ≤ x )
● 0 ≤ F ( x )≤ 1
● F est croissante sur R et est en marches d’escaliers

 lim F (x)=0
x→−∞

 lim F(x )=¿ ¿ 1


x→+∞
(car fait le lien entre plusieurs valeurs distinctes).
Si x i ≤ x j , alors P ( xi ≤ X ≤ x j ) =F ( x j) −F (x i)

B. Les variables aléatoires continues

- On parle de variables aléatoires continues lorsque X peut prendre toutes les valeurs dans un intervalle
donné, borné ou pas. La loi de probabilité n’est alors plus une fonction discrète mais une fonction
continue ; c’est-à-dire que X ne correspond plus à une variable en particulier, mais à un intervalle, à un
ensemble de valeurs.
Par exemple poids, dosage du cholestérol dans le sang, …

- On vient de voir que dans le cas des variables aléatoires continues, X ne correspondait pas à une valeur
précise, discrète. On peut donc écrire : P ( X=x ) =0.

- On associe alors une probabilité à chaque ensemble de valeurs comprises dans un intervalle donné
[ x i , x j ] , P ( xi ≤ X ≤ x j ) .
- Quand cet intervalle tend vers 0 (donc devient infiniment petit), la valeur prise par la variable aléatoire X
tend vers une fonction que l’on appelle fonction de densité de probabilité (notée f(x)). Elle correspond à
la probabilité d’obtenir ces valeurs.

a. 1. Propriétés

● f (x)≥0
+∞

● ∫ f ( x ) dx=1 C’est-à-dire que sur R, l’aire sous la courbe tend vers 1


−∞

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
Dans ce cas, on définit également une fonction de répartition qui cette fois-ci est une fonction continue (car
composée d’un regroupement d’intervalles et non des valeurs discrètes) que l’on caractérise par :
x
F ( x )=P ( X ≤ x )=∫ f ( x ) dx .
−∞

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
b. 2. Représentation graphique

● 0 ≤ F ( x )≤ 1

● F est croissante sur R

● lim F ( x )=0 et lim F ( x )=1


x→−∞ x→+∞

La fonction est continue et non plus en marches d’escalier

xj xi xi

● Si x i ≤ x j , alors P ( xi ≤ X ≤ x j ) =F ( x j) −F ( x i )= ∫ f ( x ) dx−¿ ∫ f ( x ) dx=¿ ∫ f ( x ) dx .¿ ¿


−∞ −∞ xj

C. Espérance et variance d’une variable aléatoire

- L’espérance d’une variable aléatoire X est un paramètre de position. Il s’agit en fait de la moyenne
théorique de X. On la note E ( X ) ou μ X .

🡪 Dans le cas d’une variable aléatoire discrète : il s’agit de la somme des valeurs possibles de X
pondérées par les probabilités associées, c’est donc l’équivalent de la moyenne arithmétique.

E ( X )=μ X =∑ x i∗P(X =x i).
i

Dans le cas d’une variable aléatoire continue, l’espérance de X est égale à l’intégrale sur les valeurs
possibles de x pondérées par leur densité de probabilité

On définit l’espérance par :


+∞
E ( X )=∫ ❑ x f ( x ) dx
−∞

c. 1. Propriétés

🡪 Propriétés :
− E ( X +Y )=E ( X ) + E ( Y )

− E ( aX + b )=aE ( X ) +b

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
− si X ≥ 0, alors E(X)≥0

− si X est un caractère constant de Ω , tel que X(x) = k, alors E(x) = k

− si E(X) = 0, alors X est une variable aléatoire centrée

− la variable aléatoire Y = E(X) est la variable aléatoire centrée associée à X

d. 2. La variance d’une variable aléatoire

La variance d’une variable aléatoire est un paramètre de dispersion ; elle mesure la distribution de X autour de la
moyenne. On la note var(X) ou σ²(X).

La variance est définie par :


var ( X )=E ( ( X −E ( X ) ) ¿¿ 2)¿
var ( X )=E ( X 2 )−E( X )²

Dans le cas d’une variable aléatoire discrète, on a :


❑ ❑
var ( X )=∑ ( xi −E ( X ) ) ∗P ( X=x i )=∑ x i P ( X=x i )− E ( X )
2 2 2

❑ ❑

Dans le cas d’une variable continue, on a :


+∞
var ( X )= ∫ ( x−E ( X ) ) ∗f ( x ) dx
2

−∞

− Une variance est toujours positive ou nulle (c’est le carré de l’écart type)
2
− Pour tout a et b appartenant à R, var ( aX +b ) =a var ( X )

− var ( X +Y )=var ( X ) + var (Y )+ 2 cov ( X , Y ) avec cov ( X ,Y )=E ( XY )−E ( X ) E (Y )

3. L’écart type d’une variable aléatoire

L’écart type d’une variable aléatoire permet de mesurer la dispersion (comme la variance), mais dans la même
unité que la variable aléatoire X. On le note σ(X) et on le défini par :

σ ( X )=√ var ( X )

D. La variable aléatoire centrée réduite

Définition :
Soit X une variable aléatoire d’espérance E(X) et d’écart type σ(X). On dit que Z est une variable aléatoire centrée
réduite si :

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
X−E ( X )
Z=
σ (X )

On a alors : E(Z) = 0 (variable centrée) et var(Z) = 1 (variable réduite)


La variableY = X−E (X ), est une variable aléatoire centrée associée à X.

E. Les variables aléatoires indépendantes

🡪 Définition :
Si X et Y sont 2 variables discrètes indépendantes, alors P ( X =xi , Y = y i ) =P ( X=x i )∗P ( Y = y i )

🡪 Propriétés :
Si X et Y sont 2 variables indépendantes, alors :
− cov(X, Y) = 0 (ATTENTION !!! La réciproque est fausse !!!! Vous verrez pourquoi dans le chapitre
Corrélation Régression)
− var(X+Y) = var(X) + var(Y)

De manière plus générale ; pour n variables indépendantes :


var(X1+X2+…+ Xn) = var(X1)+var(X2)+…+ var(Xn)

II. Lois de probabilité classiques


Il existe 2 grands types de lois de probabilités : les distributions discrètes et les distributions continues.

A) Distributions Discrètes

e. 1. La loi de Bernoulli (ou schéma de Bernoulli)

- Cette loi repose sur des expériences dont on distingue deux issues possibles.
- Il s’agit donc d’une loi de probabilité où la variable aléatoire comporte 2 valeurs possibles : 0 ou 1.
- On est donc dans le cas d’une variable aléatoire binaire.

De plus, on a : P(0) = q et P(1) = p


On définit l’espérance et la variance dans le cas d’une variable aléatoire X suivant le schéma de Bernoulli :

E ( X )=p
var ( X )=E ( X 2 )−E ( X ) =pq
2

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
Ex : lancer d’une pièce (pile ou face), ou sexe d’un bébé (fille ou garçon) etc.

10

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
f. 2. La loi binomiale

- On peut utiliser la loi binomiale quand on répète n fois la même épreuve de Bernoulli de façon
indépendante à chaque fois.
- On a donc, à chaque répétition de l’épreuve 2 résultats possibles (0 et 1) et 2 probabilités associées (q et
p).
- On dit alors que la variable aléatoire X (nombre de réalisations de l’événement 1) suit une distribution
binomiale de paramètres n et p que l’on note : X Bin(n , p).
- On cherche la probabilité d’observer k réalisations de l’événement 1 (et donc n-k réalisation de
l’événement 0). En tenant compte du nombre de combinaisons de k réalisations de l’événement 1 parmi
n épreuves de Bernoulli indépendantes :

k k n−k
P(S n=k )=C n p q
k n!
Avec : C n= ; n! = 1 x 2 x … x n ; 0! = 1
k ! ( n−k ) !

🡪 Espérance, variance et écart type :

E ( Sn ) =np
var ( S n )=npq
σ ( S n )=√ npq

Ex : on reprend la loi de Bernoulli qu’on répète un nombre n de fois, un lancer de 10 pièces (on calculera par
exemple la probabilité d’avoir 5 pile) ou le nombre de bébés fille parmi 10 bébés (on calcule la probabilité d’avoir
5 filles par exemple)

B) Distributions Continues

a. 1. Loi normale (ou loi de Laplace-Gauss)


- Cette loi continue est l’une des plus importantes en biostatistiques.
- Elle permet de modéliser de nombreux phénomènes ce qui fait qu’elle est souvent utilisée pour analyser
des tests statistiques.
- On la caractérise par 2 paramètres qu’il faut absolument connaître :
• μ, son espérance
• σ, son écart type (ou σ² sa variance, qui est son carré).

On note : X N (μ , σ )

b. Notion de densité de probabilité

La densité de probabilité d’une variable aléatoire X qui suit une distribution normale d’espérance μ et d’écart type
σ est définie par :

1 1 x−μ 2
f(x) = x exp (- ( ¿ ) 🡺 pas utilisable en pratique on utilise les tables
√2 πσ 2 2 σ2
11

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
c. Propriétés

● Répartition symétrique a l’axe vertical par rapport à μ

● Deux points d’inflexion d’abscisses : μ-σ et μ+σ

● Mode = médiane = μ

● Aire sous la courbe = 1

🡪 Remarque :
L’intervalle [ μ−σ ; μ +σ ¿ contient 68% des valeurs
L’intervalle [ μ−2 σ ; μ+2 σ ¿ contient 95% des valeurs
L’intervalle [ μ−3 σ ; μ+ 3 σ ¿ contient 99% des valeurs
(règle des 68-95-99%)
Fonction de répartition
On définit la fonction de répartition de la variable aléatoire X par :
x
1
F(x) =
√ 2 πσ 2
∫ ❑exp ¿2)dx
−∞

d. 2. Loi normale centrée réduite

Si E(Y) = 0, alors Y est une variable centrée.


Et si on a : Y = X – E(X), alors Y est la variable centrée associée à X.

Afin de manipuler avec plus de facilité on cherche à passer de X N ( μ , σ ) à Z N ( 0 ,1 ) .


X−E ( X )
Z=
σ (X )
On a besoin de centrer et réduire toutes nos lois normales car notre table n’est compatible que pour la loi
normale centrée réduite !
On a alors E(Z) = 0 et var(Z) = 1
1 1
La fonction densité : f(x) = * exp (- x 2)
√2 πσ 2 2

a. Propriétés

− Symétrie par rapport à 0 (car μ = 0) par rapport à l’axe des


ordonnées
− Deux points d’inflexion : -1 et +1

− Mode = Médiane = μ = 0

12

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
− Aire sous la courbe = 1

De plus, on note φ la fonction de répartition de Z :


φ (−Z )=1−φ(Z)
P ( a ≤ Z ≤b )=φ ( b )−φ(a)

b. Comment fait-on pour calculer d’autres probabilités que celle qui nous sont données ici ?

- Si par exemple, on veut calculer la probabilité d’avoir une valeur de X qui soit comprise entre 1 et 2,5 ;
c’est-à-dire d’avoir P ( 1≤ X ≤ 2 ,5 ) .
- En d’autres termes, on cherche la probabilité d’avoir à la fois P( X ≥ 1) et P( X ≤ 2 ,5).
- Vu que nous sommes dans le cas d’une variable aléatoire centrée réduite et donc suivant une loi
Normale, on peut utiliser la table de la Fonction de Répartition Loi Normale Centrée Réduite.
- On a alors :
P ( 1≤ X ≤ 2 ,5 ) =P ( X ≥ 1 ) + P ( X ≤2 , 5 )
- Cependant, la table ne nous donne que P( X ≤ x).
- On modifie donc notre égalité :
P ( 1≤ X ≤ 2 ,5 ) =P ( X ≥ 1 ) + P ( X ≤2 , 5 )=P ( X ≤ 2 ,5 )−P ( X ≤1 )
- On regarde dans la table « Fonction de répartition de la loi normale centrée réduite » les valeurs pour
z=2,5 et z= 1 : ¿ 0.9938−0.8413=0.152

e. 3. Théorème central limite

- On considère des variables X1, X2, …, Xn mutuellement indépendantes de même loi de probabilité
d’espérance μ et d’écart type σ.
- Quand n est suffisamment grand (c’est-à-dire ≥ 30). S n = X1 + X2 + … + Xn suit approximativement une loi
normale d’espérance nμ et d’écart-type σ √ n.
X 1+ X 2+…+ X n
- Quand n est suffisamment grand, la moyenne d’un échantillon M = suit
n
σ
approximativement une distribution normale d’espérance μ et d’écart-type .
√n
En gros : Sn c’est une somme de n loi normale donc Sn=n*N
M est la moyenne de ces lois normales et donc M=Sn/n

Dans ce cours, on considérera n suffisamment grand quand n ≥ 30

En résumé (dans le cas du Théorème central limite :

X N ( μ;σ)
Sn N ( nμ ; σ √ n )
σ
M N (μ; )
√n

Approximation de la loi binomiale par la loi normale :

13

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
Sn B ( n , p )
Sn N ( np , √ npq )

Avec Sn la somme de n variables aléatoires X de Bernoulli de même paramètre p.


Pour n ≥ 30 ; np ≥5 ; n ( 1− p ) ≥ 5,la distribution binomiale tend vers une loi normale d’espérance np et d’écart
type √ npq .

14

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
Formules à retenir…

Esperance et Variance :

E ( X )=μ X =∑ ❑ xi∗P ( X=x i )
i

var ( X )=E ( X−E ( X )) =E ( X 2 ) −E ( X )


2 2

⮚ Loi de Bernoulli : ⮚ Loi Binomiale : X Bin(n , p)

k k n−k
P( X=k )=C n p q
E ( X )=p E ( Sn ) =np
var ( X )= pq var ( S n )=npq
σ ( S n )=√ npq

⮚ Loi de Poisson : X Poisson( λ) ⮚ Loi Normale : X N ( μ , σ )

−λ k
e λ
P ( X=k )= Variable Centrée Réduite : Z N ( 0 , 1 )
k!
E ( X )=λ X−E ( X )
Z=
var ( X )=λ σ (X )
σ ( X )=√ λ

Conditions d’approximation de la loi binomiale par la loi de Poisson :

n>50 ; p ≤ 0.1; np≤ 10

Conditions d’approximation de la loi binomiale par la loi normale :

n ≥ 30 ; np ≥5 ; n ( 1− p ) ≥ 5

15

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
III. Annales classées corrigées

Questions

2010- 2011

Question 6 :

Pour cet exercice, les valeurs lues dans les tables doivent être arrondies à la valeur entière la plus proche (ex :
4,89 = 5)
On appelle métaboliseurs lents pour CYP2D6 les individus présentant une activité réduite de cette enzyme. Pour
les métaboliseurs lents pour CYP2D6, la prise d’antidépresseurs présente donc un risque important d’effets
secondaires liés à un surdosage.
Dans la population caucasienne, la prévalence du phénotype métaboliseur lent pour CYP2D6 (noté ML) est de
10%. On note Y la variable aléatoire correspondant ay nombre de ML sur un échantillon aléatoire de 900 sujets
caucasiens.

A) Y suit une loi de Bernoulli de paramètre 0,1


B) Y suit une loi Binomiale de paramètres n= 900 et p=0,1
C) Y suit une loi normale de paramètres μ=90 et σ =9
D) Au cours de l’année 2010, un hôpital a traité 900 patients avec des antidépresseurs. Parmi ces patients,
90 sont ML et présentent un risque d’effets secondaires lié à un surdosage.
E) La probabilité qu’aucun patient ne soit ML parmi les 900 est nulle

Question 7 :

On note F la variable aléatoire correspondant à la proportion de ML sur un échantillon aléatoire de 900 sujets
caucasiens
A) On peut approximer la loi de F par une loi normale de paramètres μ=0 ,1 et σ=0 ,01
B) L’intervalle de fluctuation de niveau 0,95 de F est [0,08 ;0,12]
C) On ne peut pas calculer l’intervalle de fluctuation car les conditions d’approximation de la loi de F par une
loi normale ne sont pas vérifiées
D) Dans un échantillon aléatoire de 900 sujets caucasiens, la probabilité d’avoir plus de 108 ML vaut environ
2,5%
E) Dans un échantillon aléatoire de 900 sujets caucasiens, la probabilité d’avoir plus de 108 ML vaut environ
5%

16

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
2011-2012

Question 9 :

Dans la population française, la prévalence de l’hypertension artérielle est d’environ 20% chez les femmes de plus
de 20 ans. On considère un échantillon aléatoire de 100 femmes de plus de 20 ans. On note Y et Z les variables
aléatoires modélisant respectivement la proportion d’hypertendus dans cet échantillon et le double de la
proportion d’hypertendus dans cet échantillon.

A) La fonction de répartition de Z est définie par F ( z )=P ( Z ≤ z ) , ∀ z ∈ R


B) Y suit une loi binomiale de paramètres n= 100 et p= 0,2
C) Y suit approximativement une loi normale de paramètres μ=20 et σ =4
D) Y suit approximativement une loi normale de paramètres μ=0 ,2 et σ=0 , 02
E) La variance de Z vaut le double de celle de Y

Question 15 :

On suppose que dans une population le poids des hommes (en kg) suit une loi normale d’espérance 75kg et de
variance 100 kg2 et que celui des femmes suit une loi normale d’espérance 60 kg et de variance 44 kg 2 . On apparie
chaque femme et chaque homme, au hasard, indépendamment de leurs poids respectifs.

A) La probabilité que, dans un couple, la différence de poids dépasse 15 kg est exactement 0,5
B) La probabilité que, dans un couple, la différence de poids dépasse 30 kg est strictement supérieure à 0,1
C) La probabilité que, dans un couple, la femme soit plus lourde que l’homme est inférieur ou égal à 0,1
D) La probabilité que, dans un couple, l’un des deux soit plus lourd que l’autre est inférieure à 0,83
E) Sachant que la différence de poids dans un couple dépasse 15 kg, la probabilité que ce soit la femme la
plus lourde est environ 0,012

2012-2013

Question 14 :

La probabilité d’accoucher par césarienne dans la population des femmes enceintes françaises est de 15%. On
note X l’effectif d’accouchements par césarienne sur un échantillon de 1000 femmes enceintes issues de la
population française.

A) X suit une distribution binomiale de paramètres (1000, 0,15)


B) La distribution de X peut être approchée par une distribution normale
C) La distribution de X peut être approchée par une distribution de Poisson
D) La probabilité d’observer un effectif d’accouchement par césarienne inférieure ou égale à 150 est
approximativement de 50%
E) La probabilité d’observer un effectif d’accouchement par césarienne inférieur ou égale à 15 est égale à la
somme des probabilités d’observer de 0 à 15 accouchements par césarienne

17

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
2014-2015

Question 1 :

L’allèle ε 4, du gène de l’Apolipoprotéine APOE, est connu pour être un facteur de risque de la maladie
d’Alzheimer. On notera ε a les autres allèles possibles pour APOE. Des études de génétique des populations ont
montré que les individus ε 4 ε 4 représentent 5% de la population, les individus ε 4 ε a 30% de la population et les
individus ε a ε a 65% de la population.
On note X la variable aléatoire correspondant au nombre d’individus ε 4 ε 4 dans un échantillon aléatoire de 50
personnes.
On connait par ailleurs la fonction de pénétrance de la maladie : la probabilité d’être malade est de 0,9% 0,3% et
0,1% pour les individus ε 4 ε 4 , ε 4 ε a et ε a ε a respectivement.

A) X suit une loi de Bernoulli de paramètre p= 0,05


B) X suit une loi binomiale de paramètres n=50 et p=0,05
C) X suit une loi normale de paramètres μ=50∗0 , 05 et σ= √ 50∗0 , 05∗0 , 95
D) X suit approximativement une loi normale de paramètres μ=50∗0 , 05 et σ= √ 50∗0 , 05∗0 , 95
E) X suit approximativement une loi de Poisson de paramètre λ=2 ,5

2016-2017

Question 4 :

La taille des hommes en France suit approximativement une loi normale de moyenne 175 cm et d’écart-type 10
cm. On note X la variable aléatoire modélisant la taille des hommes en France. On note M 100 la variable aléatoire
modélisant la taille moyenne dans un échantillon aléatoire constitué de 100 hommes français.

A) La taille minimum pour faire partie des 25,4% d’hommes les plus grands est comprise entre 181,6cm et
181,7cm
B) La probabilité pour que la taille moyenne soit supérieure à 171,83 est comprise entre 0,543 et 0,548
C) Un intervalle de confiance de μ à la confiance 0,95 vaut [173 ;177]
D) 95% des valeurs de la taille sont comprises entre 155,4 et 194,6
E) 95% des valeurs de la taille sont comprise entre 173,04 et 171,96

2017-2018

Question 4 :
Soient X et Y, deux variables aléatoires Gaussiennes, indépendantes, d'espérances respectives u x=20 et uy= 10 et
d'écart-types respectifs σ x =¿ 3 et σ y =¿ 2.
On définit la variable W = 2Y — X.
Aide au calcul : 1 , 96=2 √ 5=2 , 2 √ 7=2 , 6 √ 11=3 , 3 √ 17=4 , 1

A) W est une variable aléatoire centrée


B) L'écart-type de W vaut √ 7
C) P(Y ≥ 8) = 0, 8413
D) P(15 < X < 20) = P(X < 20) + P(X > 15)
18

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
E) L'intervalle de fluctuation au risque 5% de W est : [-5,2 ; 5,2]

2018-2019 Décembre

Question 4 :

La prévalence du déficit auditif chez les grands prématurés est de 5%. On considéra un échantillon aléatoire de 95
grands prématurés. On note T la variable aléatoire modélisant la présence d'un déficit auditif chez un grand
prématuré et X la variable aléatoire modélisant le nombre de grands prématurés souffrant de déficit auditif dans
l'échantillon.

A) T suit une loi binomiale de paramètres n=95 et p=0,05


B) La probabilité d'observer au plus un grand prématuré avec un déficit auditif dans un échantillon de 95 vaut
94
0 , 95 ∗¿
C) La probabilité d'observer au plus un grand prématuré avec un déficit auditif dans un échantillon de 95 vaut

D) Dans un échantillon de 95 grands prématurés, la proportion de nouveau-nés présentant un déficit auditif


suit une loi binomiale

E) Dans un échantillon de 95 grands prématurés, la proportion de nouveau-nés présentant un déficit auditif

suit une loi normale d'espérance égale à 0,05 et d'écart-type égale à


√ 0 ,05∗0 , 95
95

2018-2019 Janvier

Question 4

Le taux de cholestérol sanguin chez les enfants âgés de 6 à 9 ans est modélisé par une variable aléatoire X,
Gaussienne, d'espérance 200 mg/dL et d'écart-type 50 mg/dL.

A) Une estimation de la proportion d'enfants entre 6 et 9 ans avec un taux de cholestérol supérieur à 250
mg/dL calculée sur un échantillon de 200 enfants est une variable aléatoire d'espérance 250 mg/dL et
d'écart-type √ 200∗0 ,2∗0 , 8
B) L'estimateur de la moyenne du taux de cholestérol sanguin est égal à 200 mg/dL
C) La probabilité qu'un enfant dont l'âge est compris entre 6 et 9 ans ait un taux de cholestérol supérieur à
240 mg/mL vaut environ 0,2
D) Avec les informations données dans l'énoncé, on peut calculer un intervalle de fluctuation de l'estimateur
de la proportion d'enfants ayant un taux de cholestérol supérieur à 240 mg/dL dans un échantillon de 200
enfants âgés de 6 à 9 ans, au risque α = 5%
E) Avec les informations données dans l'énoncé, on peut calculer un intervalle de confiance au risque 5% de
la proportion théorique d'enfants entre 6 et 9 ans, dont le taux de cholestérol est supérieur à 240 mg/dL

19

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
ENNONCE COMMUN AUX QCM 4 ET 5

En France, 3 entreprises, A, B, et C commercialisent dans les hôpitaux, des lots constitués de 2 réactifs, R1 et R2,
les 2 réactifs étant préparés et contrôlés indépendamment. L’entreprise A fournit 80% des hôpitaux, les
entreprises B et C fournissent chacune 10% des hôpitaux. Des contrôles de qualité ont montré que, parmi les lots
produits par les entreprises A, B, et C, respectivement 1%, 5% et 0,5% des lots présentent un réactif R1 qui n'est
pas parfaitement conforme. Dans l'entreprise A, des contrôles additionnels ont montré que dans 2 lots sur 10
000, les 2 réactifs R1 et R2 ne sont pas parfaitement conformes.
Le CHU de Lyon se fournit dans l'entreprise A.

Question 5 :

Au CHU de Lyon, en 2018, une commande de 900 lots des réactifs R1 et R2 est passée. On note Y la variable
aléatoire modélisant le nombre de lots dans lesquels le réactif R1 n'est pas parfaitement conforme.
Aide au calcul : 0,99=1 1,96=2

A) Y suit une loi de Bernoulli de paramètre p=0,01


B) On peut approximer la loi de Y par une loi de Poisson de paramètre λ=¿ 9
C) La probabilité qu'il y ait strictement plus de 3 lots contenant un réactif R1 non totalement conforme vaut
approximativement 0,98
D) Un intervalle de fluctuation à la confiance a = 5% de Y vaut approximativement [3; 15]
E) Le nombre de combinaisons de 3 éléments parmi 10 vaut 720

2019-2020

Le taux d'a-tocophérol plasmatique suit approximativement une loi normale de moyenne égale à 900 μg/dl et
d'écart-type égal à 400 μg/dl. On notera X la variable aléatoire modélisant le taux d'a-tocophérol plasmatique. Au-
delà de 2100 μg/dL, l'a-tocophérol peut être toxique. Dans un échantillon de 2500 individus, on modélisera la
proportion d'individus dont le taux plasmatique d'a-tocophérol est supérieur à la dose toxique par la variable
aléatoire Y.
On prendra : 0,8416=0 , 8 0,9772=0,977 0,99865=0,998 1,2816=1 ,3 1,6449=1, 6 1 , 96=22,3656=2 , 4

Aide au calcul : 0,002∗0,998=0,002


√ 0,002
2500
=9∗10−4

A) Le seuil pour faire partie des 10% d'individus dont le taux d’a-tocophérol plasmatique est le plus bas vaut
environ 380 μg/dl
B) Un intervalle de fluctuation de X, à la confiance 0,95 vaut [884 ; 916]
C) La variable aléatoire Y suit une loi binomiale de paramètres n=2500 et p=0,002

D) On peut approximer la loi de Y par une loi normale de paramètres μY =0,002 et σ Y =

E) La probabilité d'avoir plus de 5 individus dans l'échantillon qui a une dose toxique d'a-tocophérol
√ 0,002∗0,998
2500

plasmatique est inférieure à 0,00002

20

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
2020-2021

QCM 4. Indiquez la ou les réponse(s) juste(s). Concernant la loi normale :

A. Elle est totalement définie par sa moyenne  et son écart type .


B. Sa fonction de répartition est monotone décroissante.
C. Sa densité est symétrique par rapport à .
D. Si X suit une loi normale de moyenne  et d’écart type , l’écart réduit  X   suit une loi normale de
moyenne 0 et d’écart type 1.
E. 95% des valeurs de X sont comprises dans l’intervalle [ - 1,96 ;  + 1,96].

QCM 6. Dans la population française, on suppose que le taux de LDL-cholestérol (noté LDL-c) suit une loi
normale d'espérance μ = 1,4 g/L et d'écart-type σ = 0,4 g/L. Le taux de LDL-c est supposé normal chez un
individu quand il est inférieur ou égal à 1,6 g/L. Le taux de LDL-c est considéré comme très élevé quand il
dépasse 1,9 g/L.

On considère un échantillon de 20 individus.

Aide aux calculs: √20  4,5 et 1,96  2

Indiquer la ou les proposition(s) juste(s).

A. La probabilité que le taux de LDL-c d'un individu dépasse 1,6 g/L vaut environ 0,3 (arrondi à 1 chiffre après
la virgule).
B. La probabilité que le taux de LDL-c moyen dans l'échantillon dépasse 1,9 g/L vaut environ 0,1 (arrondi à
un chiffre après la virgule).
C. Pour faire partie des 80% d'individus ayant le taux de LDL-c le plus élevé, il faut avoir une glycémie au
moins égale à 1,064 g/L. Pour le calcul, selon la table choisie, soit vous arrondirez la valeur de z lue dans la
table à 2 chiffres après la virgule, soit vous prendrez la plus petite des 2 valeurs de z lue dans la table.
D. L’intervalle de fluctuation à la confiance 0,95 du taux de cholestérol d'un individu vaut: [1,2; 1,6].
E. [ITEM NEUTRALISE] L’estimateur de la proportion d'individus ayant un taux de LDL-c supérieur à 1,6 g/L
suit approximativement une loi normale de paramètres μ =0,3 et σ = 20 0,3 0,7.

QCM 7. Le taux de réussite en 1ère année de licence de biologie est de 60%. On constitue un échantillon
aléatoire simple de 10 étudiants de 1ère année de biologie. On note :

 X la variable aléatoire modélisant la réussite ou non d'un étudiant


 Y la variable aléatoire modélisant le nombre d'étudiants qui réussissent leur 1ère année de biologie dans cet
échantillon
 Z la variable aléatoire modélisant la proportion d'étudiants qui réussissent leur 1ère année de biologie dans cet
échantillon.

Indiquer la ou les proposition(s) juste(s) :

21

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
A. La variance de X vaut 0,24.
B. P(Y=2) = 45 x 0.6² x 0.48
C. Z suit une loi binomiale de paramètres n=10 et p=0,6.
D. Soient A et B deux événements de probabilité non nulle, si A et B sont incompatibles, ils ne peuvent pas
être indépendants.
E. Soient A et B deux événements de probabilité non nulle, A et B sont indépendants si et seulement si P(A|
B) = P(B).

2021-2022

QCM 3. Variables aléatoires et lois classiques. Concernant la fonction de répartition d’une loi de probabilité
d’une variable aléatoire X. Indiquez la ou les réponse(s) juste(s) :

A. Si la loi de probabilité est discrète, la hauteur des marches correspond aux probabilités des différentes
valeurs de X.
B. Si la loi de probabilité est continue, la limite en + l’infini (+∞) de la fonction de répartition vaut 0,5.
C. La fonction de répartition d’une loi discrète est monotone croissante.
D. La densité d’une loi continue est l’intégrale de sa fonction de répartition.
E. L’aire sous la courbe de la densité d’une loi continue vaut 1.

QCM 6. (coef. 2) Variables aléatoires et lois classiques – Intervalles. Au cours d’une étude, on mesure le volume
d’éjection systolique (VES) d’un échantillon de 100 patients choisis aléatoirement dans la population étudiée.
L’estimation du VES moyen vaut 100 mL et l’estimation de la variance du VES vaut 400 mL².

On note μ la valeur de la moyenne du VES dans la population, m, son estimation et M l’estimateur de la


moyenne.

Aide au calcul : 0,4125≈ 0,41 1,8250 ≈ 1,82 1,96 ≈ 2 2,1201≈ 2,12

Indiquez la ou les proposition(s) juste(s) :

A. 𝑖𝑐0,966 (μ) = [93,3 ; 103,7].


B. 𝑖𝑐0,966 (m) = [95,7 ; 104,3].
C. L’intervalle de confiance est centré sur la valeur théorique (= de la population).
D. Plus le niveau de confiance est bas, plus l’intervalle de confiance est étroit.
E. Il faudrait inclure au moins 400 sujets pour obtenir un intervalle de confiance à la confiance 0,95 de
largeur égale à 4.

QCM 7. Variables aléatoires et lois classiques. Probabilités. En 2021, 14 % des étudiants ont obtenu une
mention très bien au bac. On considère un échantillon constitué de 25 étudiants ayant passé le bac en 2021. On
définit T, la variable aléatoire modélisant le nombre d’étudiants ayant eu une mention très bien dans
l’échantillon et U, la variable aléatoire qui pour un étudiant donné prend la valeur 1 s’il a obtenu une mention
très bien et 0 sinon.

Aide au calcul : : 25 x 0,14 = 3,50 25 x 0,14 x 0,86 ≈ 3 1,96 ≈ 2

A. T suit une loi binomiale de paramètres n=25 et p = 0,14.

22

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
B. L’estimateur de la moyenne du nombre de mention très bien dans l’échantillon vaut 25 x 0,14.
C. L’intervalle de confiance à la confiance 0,95 de T vaut : 𝑖𝑐0,95( T ) = [3,50 ± 2 × √3].
D. On peut approximer la loi de T par une loi normale d’espérance égale à 3,50 et de variance égale à 3.
E. L’espérance de U vaut 0,14.

Correction

2010-2011
Question 6 : B

A) FAUX. L'extraction des informations de l'énoncé est une nouvelle fois cruciale dans cet exercice.
L'important ici est de noter la prévalence des métaboliseurs lents : P(ML) = 0.10, ainsi que le nombre de
patients composant l'échantillon, n = 900. A partir de la, on peut d'ores et déjà noter que la réponse A est
fausse, car une loi de Bernoulli ne concerne qu'un seul événement.
B) VRAI. C'est en fait une LOI BINOMIALE DE PARAMETRE n = 900 ET p = 0.1, c'est à dire une modélisation
de N épreuves de Bernouilli indépendantes.
C) FAUX. Y ne suit pas non plus une loi normale de paramètres μ=90 et σ=9, mais elle la suit DE FAÇON
APPROXIMATIVE.
D) FAUX. Pour l'item D, rappelons que la prévalence d'être un métaboliseur lent n'est qu'une probabilité. De
ce fait, avoir une prévalence de 10% au sein d'un échantillon aléatoire de 900 sujets ne nous garantit pas
d'y trouver 90 métaboliseurs lents exactement.
E) FAUX. Concernant l’item E :
Y −µ 0−0.90
P ( Y =0 )=P( )¿ = −10
σ 9
On cherche donc Φ(-10) dans la table de la fonction de répartition (table I), soit 1 – Φ(10).
La plus haute valeur que l’on peut lire est Φ(4.09), on peut donc uniquement supposer que Φ(10) sera
égal à 0.999999999…
1- Φ(10) sera donc très proche de 0, mais ne sera pas nulle.

Question 7 : ABD

A) VRAI.
B) VRAI.
C) FAUX.
D) VRAI.
E) FAUX

Pour cet exercice, il s'agit de déterminer un intervalle de fluctuation pour une proportion. On utilise pour cela la


2
formule suivante : p ± zα/2 s
n
Mais il faut avant tout vérifier les conditions d'approximation de la loi de F (Item C), c'est à dire que :
900 ≥ 30 900 x 0.1 = 90 ≥ 5 900 x 0.9 = 810 ≥ 5
F suit donc approximativement une loi normale, de paramètres (p ; √(pq/n)), id est (0.1 ; 0.01).
=> A : VRAI ; C : FAUX

23

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
Il suffit désormais de calculer les bornes de l’intervalle de fluctuation de F de niveau 0,95. En lisant dans la table,
on trouve un z de 1.96, que l’on arrondi une nouvelle fois à 2.

Bornes = 0.1 ± 2 x
√ 900 √
0.1 x 0.9 = 0.1 ± 2 x 0.09 = 0.1 ± 2 x 1 = 0.1 ± 0.02
900 100

L’intervalle de fluctuation de niveau 0.95 de F est donc [0.08 ; 0.12].


=> B : VRAI

Enfin, La borne supérieure de l’intervalle de fluctuation à 95% de F est égale à 12%, d’où P(F>12)=2.5%. De ce fait,
P (Y > 900 x 0.12 = 108)=2.5%

On peut aussi calculer P ( F>108 )=P Z> ( 108−90


9 )
=P ( Z >2 )=1−Φ ( 2 )=1−0.9772=0.0228≈ 2.5 %
=> D : VRAI ; E = FAUX.

2011-2012

Question 9 : AD
A) VRAI. Cf. Cours.
B) VRAI.
C) FAUX.
D) VRAI.
E) FAUX.

L’important dans l’énoncé est de noter la prévalence de l’hypertension artérielle, P(HTA)= 0.20, ainsi que le
nombre de sujets participants à l’étude, n=100.
=> B : VRAI ; C : FAUX

Y est une proportion dont la distribution peut être approximée par une loi normale de paramètres µ=p=0,2 et

σ=
√ √
pq
n
=
=> D : VRAI
0.2× 0.8 = 0.04
100

σ²(Z) = σ²(2Y) = 2² variance (Y)


La variance de Z est donc égale à 4 fois la variance de Y
=> E : FAUX

Question 15 : BE

A) FAUX. Une probabilité n’est jamais strictement égale !!!!


B) VRAI.
C) FAUX.
D) FAUX.
E) VRAI.

Soit H la variable aléatoire suivant une loi normale N de paramètres (75 ; √ 100), et F une autre variable aléatoire
suivant une loi normale N de paramètre (60, √ 44 ).
Δ=H-F, Δ suit donc une loi normale de paramètres (15 ; √ 144 =12).
24

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
P(|Δ|>30) = P(Δ>30) + P(Δ<-30) = P(Z>(15/12)) + P(Z<(-45/12))

On s’occupe déjà du premier terme car le second va être faible.

P(Z>(15/12)) = P(Z>1.25) = 1-0.8944 > 0.1 🡪 B : VRAI

La probabilité que dans un couple, la femme soit plus lourde que l’homme est
P(F>H) = P(Δ<0) = P(Z<(-15/12)) = P(Z<-1.25) = 1- Ф(1.25) = 1-0.8944 > 0.1 🡪 C : FAUX

La probabilité que dans un couple, l’un des deux soit plus lourd que l’autre est égale à 1. 🡪 D : FAUX

Enfin, l’item E est plus compliqué.


Sachant que la différence de poids dans un couple dépasse 15 kg, la probabilité que ce soit la femme la plus
lourde :

On ne peut pas faire le calcul à la main, par contre, on peut vérifier si la réponse est à peu près correcte. Le
dénominateur vaut à peu 0,5 et 0,5*0,012=0,006. On trouve à peu près le numérateur. Donc E est VRAI.

2012-2013

Question 14 : ABDE

A) VRAI. Dans cet exercice, on s’intéresse à la probabilité pour des femmes enceintes d’accoucher ou non par
césarienne. Il y a donc 2 événements différents ; soit la femme accouche par césarienne, soit par voie
naturelle. De plus, on regarde le nombre de fois que se renouvelle l’événement « la femme accouche par
césarienne » sur un échantillon de 1000 femmes (et les observations sont indépendantes les unes des
autres). On répète donc 1000 fois un schéma de Bernoulli ; X suit donc une distribution binomiale de
paramètre (1000 ; 0.15).
B) VRAI. Pour faire une approximation d’une distribution binomiale par une loi Normale, il faut vérifier les
conditions d’approximations :
𝑛 = 1000 ≥ 30 ; 𝑛𝑝 = 1000x0.15 = 150 ≥ 5 𝑒𝑡 𝑛(1 – 𝑝) = 1000x0.85 = 850 ≥ 5
Nous pouvons donc bien approximer la distribution de X par une distribution Normale.

C) FAUX. Pour faire une approximation d’une distribution binomiale par une loi de Poisson, il faut vérifier les
conditions d’approximation
𝑛 = 1000 > 50 ; 𝒑 = 𝟎. 𝟏𝟓 > 𝟎. 𝟏 𝒆𝒕 𝒏𝒑 = 𝟏𝟓𝟎 > 𝟏𝟎
Les conditions d’approximation ne sont pas respectées, nous ne pouvons donc pas approximer la
distribution.

D) VRAI. On cherche ici la probabilité d’avoir 150 accouchements par césarienne (ou moins) dans notre
échantillon ; c’est-à-dire la probabilité d’avoir 𝑋 ≤ 150 ; soit 𝑃 (𝑋 ≤ 150).

25

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
Pour obtenir cette probabilité nous allons devoir centrer et réduire la valeur, ce qui donne :

On a vu précédemment que X suivait une loi Binomiale, donc μ=¿𝑛𝑝 = 1000 x 0.15 = 150
et σ x = √ npq = √ 150 x 0.85 = √ 127.5 ≈ 11 (car √ 121 = 11).
Application numérique :

La probabilité d’observer un effectif d’accouchements par césarienne inférieur ou égal à 150 est donc de
0,5 soit 50%.
E) VRAI. C’est logique, mais si on veut utiliser des formules, on peut dire que :
P(X ≤15) = P(X = 0) + P(X = 1) + ... + P(X = 15) car nous sommes dans le cas de variables discrètes.

2014-2015

Question 1 : BE
La variable aléatoire X correspond au « nombre d’individus e4e4 » dans un échantillon de 50 personnes. X suit
donc une loi binomiale de paramètres : N = 50 et p = 0.05
A) FAUX
B) VRAI
C) FAUX
D) FAUX
Conditions d’approximations de la loi binomiale par la loi normale : n>30 ; np >5 ; n(1-p) > 5
Or dans cet exercice np = 50 x 0.05 = 2.5 donc < 5. Les conditions d’approximations de la loi binomiale par la
loi normale ne sont pas respectées.
E) VRAI
Conditions d’approximations de la loi binomiale par la loi de Poisson : n > 50 ; p < 0.1 ; np < 10
Les 3 conditions étant toute respectées, X suit approximativement une loi de Poisson de paramètres λ = np =
2,5.

2016-2017

Question 4 : ABD
A) VRAI : La variable aléatoire X, modélisant la taille des hommes en France suit une loi normale de
paramètres μ=175 et σ =10 .
Pour répondre à l’item, on va chercher à déterminer deux probabilités : P1 ( X ≤181 , 6 ) et P2 ( X ≤181 , 7 )
On utilise donc le théorème centrale limite :

( 181 ,σ6−μ ≤ X −μ
P1 (181 , 6 ≤ X ) ⟺ P 1
σ )
⟺P (
181 , 6−175
10
≤ Z )⟺ P (0 , 66 ≤ Z )
1 1 1 1

P ( 181, 7 ≤ X ) ⟺ P ( ) ⟺P ( ≤ Z )⟺ P (0 , 66 ≤ Z )
181 , 7−μ X −μ 181 , 7−175
2 2 ≤ 2 2 2 2
σ σ 10
On regarde ensuite dans la table de la loi normale centrée réduite et on trouve alors :
P1=0,7454 et P2=0,7486 ; On a donc 74,54% des hommes en France qui font moins de 181,6 cm et

26

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
74,86% qui font moins de 181,7 cm. Or : 100−25 , 4=74 , 6 et 74 ,54 <74 ,6< 74 , 86. Donc, pour faire
partie des 25,4 % des hommes les plus grands, il faut avoir une taille comprise entre 181,6 et 181,7 cm.

B) VRAI : On cherche P( X> 173 , 83) . On utilise une nouvelle fois le théorème centrale limite :

P( X> 173 , 83)⟺ P ( X−μ


σ
>
173 , 83−μ
σ ) ⟺ P(
173 , 83−175
10
> Z ) ⟺ P(−0,117> Z) ⟺ P(≤ 0,117)
On regarde ensuite dans la table de la loi normale centrée réduite et on trouve pour z = 0,11 et z = 0,12
les probabilités suivantes : P ( Z ≤ 0 ,11 )=0,5438 et P ( Z ≤ 0 , 12 )=0,5478.

¿ :0 , 11<0,117<0 ,12 ⟺ 0,5438< P ( X >173 , 83 ) < 0,5478

On minore la borne inférieure et on majore la borne supérieure et cela nous donne :


0,543< P (X >173 , 83)<0,548

C) FAUX : Attention au piège ici ! On nous donne dans l’énoncé des données sur la population des hommes
en France et non sur un échantillon. On ne peut donc pas déterminer un intervalle de confiance ici un
intervalle de fluctuation. Il faut bien faire la différence entre les 2 types d’intervalle pour ne pas être pris
au piège par des items comme celui-ci.

D) VRAI : Comme dit dans le cours sur les Variables Aléatoires (dans la partie sur la Loi normale), 95% des
valeurs sont contenues dans l’intervalle : [ μ−2 σ ; μ+2 σ ]
95% des valeurs de la taille sont donc comprise dans l’intervalle suivant : [ 175−2 ×10 ; 175+2 ×10 ]
⟺ [ 155 ; 195 ] ⟺ [ 155 , 4 ; 194 ,6 ] car dans un intervalle, on minore la borne inf. et on majore la borne
sup.

E) FAUX : voir justification ci-dessus.

2017-2018

Question 4 : ABCE

A) Vrai : on calcule la moyenne et l’écart-type de W à partir des données de l’énoncé :


E ( W ) =E ( 2Y )−E ( X )=2 E ( Y ) −E ( X )=2∗10−20=0
W est donc une variable aléatoire centrée.
B) Vrai : X et Y sont 2 variables indépendantes donc cov ( X , Y ¿¿ 0 ) et
var (W )=var ( 2Y ) −var ( X )=2 σ ( Y ) −σ ( X ) =4∗2 −3 =16−9=7 σ (W )=√ var ( W )=√ 7
2 2 2 2 2

Y −μ ( Y )
C) Vrai : La variable aléatoire centrée réduite Z= suit la loi normale.
σ (Y )
p ( Y ≥ 8 )= p ( Z ≥−1 )= p ( Z ≤ 1 )=0.8413
D) Faux : p ( 15< X <20 )=1− p ( X ≤ 15 )− p ( X ≥ 20 )
E) Vrai :

[ ]
IF 1−0.05 ( W )= μW −z 0.05∗σ W ; μW + z 0.05 ∗σ W =[ 0−1.96∗√ 7 ; 0+1.96∗√ 7 ] = [−2∗2.6 ; 2∗2.6 ] =[ −5.2; 5.2 ]
2 2

27

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
2018-2019 Décembre

Question 4 : B

A) FAUX : D’après l’énoncé, T suit un schéma de Bernoulli de paramètres p= 0,05. C’est X qui suit une loi
binomiale de paramètres n= 95 et p= 0,05
B) VRAI : On nous demande la probabilité suivante : P( X ≤ 1). Or, X suit une loi binomiale donc :
95! 0 95 95! 1 94 95 9
P ( X ≤1 ) =P ( X=0 )+ P ( X=1 )= ×0 , 05 ×0 , 95 + ×0 , 0 5 × 0 , 9 5 =1 ×1 ×0 , 95 +95 × 0 , 05× 0 , 95
0 ! 95 ! 1! 94 !
C) FAUX : voir correction item B
D) FAUX : Dans un échantillon de 95 grands prématurés, la proportion de nouveau-nés présentant un déficit
auditif suit un schéma de Bernoulli. C’est le nombre de nouveau-nés présentant un déficit auditif dans un
échantillon de 95 grands prématurés qui suit une loi binomiale.
E) FAUX : voir correction item D

2018-2019 Janvier

Question 3 : CD
A) FAUX : C'est l'estimateur de la proportion qui est une variable aléatoire, de plus l'écart type est égal à

√ pq car il s'agit d'une proportion et non d'une moyenne


n
B) FAUX : Attention l'estimateur est une variable aléatoire, ici il s'agit de l'estimation de la moyenne du taux
de cholestérol
C) VRAI : Le taux de cholestérol sanguin chez les enfants suit la loi normale N(200;50), on cherche P(X > 240)
4
= P(Z > ¿ après avoir centré et réduit, P Z >
5 ( 45 )=1−P ( Z < 45 )=¿ 1 — 0,7881 = 0,2119 après lecture de
la table
D) VRAI : Ici on peut calculer un intervalle de fluctuation de l'estimateur car on connaît les données sur la
population
E) FAUX : On ne peut pas calculer un intervalle de confiance car nous ne sommes pas en présence d'un
échantillon

Question 5 : ABD

A) FAUX : Attention Y suit une loi binomiale correspondant à plusieurs répétitions d'une expérience de
Bernoulli, ici 900 répétitions. Le paramètre est bien p = 0,01
B) VRAI : Les conditions sont respectées avec n = 900 > 50, p = 0,01 < 0,1, np = 900 x 0,01 = 9 < 10
C) VRAI : On réalise ici une approximation de la loi binomiale par la loi normale centrée réduite après
vérification des conditions d'approximation n = 900 > 30, np = 900 x 0,01 = 9 > 5, nq = 900 x 0,99 = 891 > 5
. Le nombre de lots contenant un réactif R1 non conforme suit approximativement la loi normale N(9; 3).
On a donc P(Y > 3) = P(Z > —2) après avoir centré et réduit.
Cela correspond à P(Z < 2) = 0,9772 ≈ 0,98 après lecture dans la table

28

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
D) FAUX : Ici on ne peut pas réaliser un intervalle de fluctuation car nous sommes en présence d'un
échantillon donc on peut seulement réaliser un intervalle de confiance
E) FAUX :

2019-2020

Question n°3 : ABDE

A) VRAI : Nous avons 𝑋~𝑁 ( 900; 400)

B) VRAI

Dans la table on trouve une probabilité d’avoir un taux supérieur à 380 est de 0,9032. Pour cet item on
demandait un taux inférieur à 380. 🡪
10%

C) FAUX Pour trouver p on va chercher la probabilité d’avoir un taux supérieur a 2100

Dans la table on trouve 0,998 donc 1 - 0,998= 0,002


Y suit une loi binomiale de paramètre n=2500 et p=0,002
D) VRAI Les conditions d’approximation d’une loi binomiale par une loi normale sont :

Les conditions sont respectées donc il est possible d’approximer avec 𝜇=𝑝=0,002 et

E) VRAI
Or notre table s’arrête à P(Z>5) = 0,99998 donc 1−𝑃(𝑍≤5) =0,00002
Ainsi 1−𝑃 (𝑍≤ 5000) < 0,00002

2020-2021

CORRECTION QCM 4 : ACDE

A. VRAI.
B. FAUX. Sa fonction de répartition est monotone CROISSANTE.
C. VRAI. Sa densité est bien symétrique, à retenir !
D. VRAI. Que l’on appelle plus simplement loi normale centrée réduite.
E. VRAI. L’intervalle [μ - σ ; μ + σ] contient 68% des valeurs.
L’intervalle [μ – 1,96σ ; μ + 1,96σ] (on arrondit généralement 1,96 à 2) contient 95% des valeurs.
L’intervalle [μ – 3σ ; μ + 3σ] contient 99% des valeurs.

29

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
CORRECTION QCM 6 : AC

X−E ( X ) 1 , 6−1, 4
A. VRAI. Pour commencer, on centre et on réduit. Z = = =0 , 5
σ (X) 0,4

On regarde maintenant dans notre table (fonction de répartition de la loi normale centrée réduite), avec
z=0,5. On trouve P(Z < z) = 0,6915 donc P(Z > z) = 1 - P(Z < z) = 0,3085  0,3.

B. FAUX. L’item aurait été vrai si l’on parlait du taux de LDL-c d’UN individu et non du taux de LDL-c moyen.
C. VRAI. Pour cet item, on peut procéder de deux manières, mais le tout est d’être méthodique :

1) On réutilise les valeurs de l’énoncé pour les vérifier : Z =|


X−E ( X )
σ (X)
∨¿ |
1,064−1 , 4
0, 4 |
=0 , 84

On encadre maintenant dans notre table (ici la fonction de répartition), et on trouve 0,7995 < p <
0,8023. Ce qui correspond bien à notre item.

2) Technique peut-être un peu moins rigoureuse, mais qui fonctionne :

On regarde dans la table les deux valeurs de P qui encadrent le plus précisément la notre (ici 0,8), puis
on relève les valeurs de z correspondantes.
Ici notre z sera compris entre 0,84 et 0,85.

On repart de notre formule pour ensuite résoudre l’équation suivante et vérifier si l’on trouve la
valeur de l’item :

Z=
σ (X) |
X−E ( X ) X−1 , 4
=
0,4 |
=0 , 84 → X=−0 , 84∗0 , 4+ 1, 4=1,064

Remarque : Si vous utilisez cette technique, pensez à essayer le calcul avec un Z positif puis négatif.

D. FAUX. Ici, on est dans le cas d’une loi normale. On sait donc que 95% des valeurs sont comprises entre [μ
– 2σ ; μ + 2σ]. Donc l’intervalle de fluctuation serait de [0,4 ; 2,2].
E. ITEM NEUTRALISE.

30

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
CORRECTION QCM 7 : ABD

A. VRAI. Pour la variable X, nous sommes dans le cas d’une loi de Bernoulli.

La variance s’exprime donc var(X) = E(X²) – E(X)² = pq avec ici p, la réussite de l’élève, et q, l’échec.

On a p = 0,6 et q = 1 – p = 0,4. Donc var(x) = pq = 0,6 x 0,4 = 0,24.

B. VRAI. Pour la variable Y, nous sommes dans le cas d’une loi binomiale. On cherche la probabilité que 2
élèves réussissent leur année dans l’échantillon concerné, on l’exprime par :

P(Y=k) = avec =
10! 10 ! 10∗9∗8∗7∗6∗5∗4∗3∗2∗1 10∗9
= = = =45
2! ( 10−2 ) ! 2! 8 ! (2∗1)(8∗7∗6∗5∗4∗3∗2∗1) 2

P(Y=2) = 45 x 0,62 x 0,48 L’item est donc VRAI.

C. FAUX. Z suit une loi normale.


D. VRAI. On considère que deux évènements sont incompatibles lorsqu’ils n’ont aucun élément en commun.
Ils ne peuvent donc pas être indépendants, puisque la réalisation de l’un affecte la réalisation de l’autre.
E. FAUX. A et B sont indépendants si P(A|B) = P(A).

2021-2022

CORRECTION QCM 3 : AE

A. VRAI.
B. FAUX. Item logique, la limite en +∞ d’une loi de probabilité continue vaut 1. Une probabilité est comprise
entre 0 et 1, et non pas 0 et 0,5.
C. FAUX. La fonction de répartition d’une loi discrète n’est pas monotone, il s’agit d’une fonction en
« marches d’escaliers ».
D. FAUX. C’est l’inverse, c’est la fonction de répartition d’une loi continue qui est l’intégrale de sa densité.
E. VRAI.

31

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques
CORRECTION QCM 6 : DE

A. FAUX. 𝑖𝑐0,966 (μ) = [m ± zα/2 x √s²/√n] = [100 ± 2,12 x 20/10] = [95,7 ; 104,3]
B. FAUX. Le résultat est bon, mais on calcule un intervalle de confiance d’une moyenne théorique (ici μ) et
non d’une moyenne estimée (m).
C. FAUX. Toujours pareil, c’est sur la valeur estimée.
D. VRAI.

∗s
E. VRAI. 2 l z∗s∗2 d’où n=400. A l’aide la table, on trouve z = 1,96 = 2.
i= = → √ n= =20
√n 2 l

CORRECTION QCM 7 : ABE

A. VRAI.
B. VRAI.
C. FAUX. Il n’est pas rigoureux de calculer l’intervalle de confiance d’une variable aléatoire.
D. FAUX. Attention ! La condition n > 30 n’est pas respectée.
E. VRAI. C’est une loi de Bernoulli, E(U) = 0,14.

32

Cours Galien Lyon Est – 2022/2023


PASS – Biostatistiques – Variables Aléatoires Discrètes et Continues-Lois Classiques

Vous aimerez peut-être aussi