Académique Documents
Professionnel Documents
Culture Documents
Biostatistiques
2022-23
3
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
I. Probabilité
A. Différents aspects
1. Probabilités en santé :
2. Types de probabilités :
Il y en a 3 types :
- La probabilité géométrique ou analytique : cas particulier où tous les évènements élémentaires possibles
sont équiprobables, analyse combinatoire. Exemple : probabilité de tirer 3 as dans un jeu de 2 cartes.
- La probabilité événementielle ou fréquentielle : basée sur la répétition possible d’épreuve aléatoire dans
les mêmes conditions : estimations possibles de probabilité (cas le plus utilisé en PASS). Exemple : lancer
20 fois une pièce de monnaie de la même façon et compter le nombre de fois qu’elle tombe sur pile.
- La probabilité subjective : l’appréciation est liée au sujet.
Épreuve aléatoire :
- Que l’on peut répéter dans les mêmes conditions. Exemple : avec remise ou population considérée comme
infinie.
- Résultat objectif n’est pas connu à l’avance.
- Exemple d’épreuve aléatoire 1 : lancé de dés ; examen clinique du tympan qui peut être bombé ou non. Conditions
d’observation reproductibles. Par exemple on va noter P(X=1) la probabilité d’avoir un tympan bombé. Ce type
d’épreuve peut avoir deux issues possibles (tympan bombé ou non bombé). Dans ce cas-là, elle suivra une loi de
4
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
Bernoulli que nous détaillerons plus tard. L’épreuve peut également avoir plus de deux issues comme dans le cas du
lancé dé par exemple.
1. Probabilité et signification :
Par exemple : P(A) = 0,80 = 80% considérant que le tirage concerne des personnes :
⇨ Cela signifie que la personne à 80% de « chances » (ou de « risques ») de présenter l’événement A.
⇨ Cela veut dire que sur 100 personnes, on peut s’attendre à ce que 80 présentent l’événement A.
o Attention cela ne signifie pas que sur 100 personnes, 80 présentent l’événement A à coup sûr.
o Ce qui est important à retenir : lorsque l’on interprète une probabilité rien n’est certain, en
général on s’attend à une moyenne. 0≤P≤1 et P Є R . La probabilité est souvent exprimée en % en
médecine.
Autre exemple : Un enfant à 85% de chance d’avoir un tympan bombé.
- On note « A » l'événement « avoir un tympan bombé ».
- On note « B » l’événement « ne pas avoir le tympan bombé »
A cette épreuve aléatoire va être associé une variable aléatoire. On va répéter l’épreuve plusieurs fois dans les
mêmes conditions. La variable aléatoire est ici discrète, elle est appelée « X ». On note p(X=1) la probabilité
d’avoir un tympan bombé. On peut donc dire que P(X=1) = 0,85. Cette variable aléatoire suit une loi de Bernoulli
(vu plus loin) étant donné qu’il n’y a que deux issues possibles (avoir un tympan bombé/ne pas avoir un tympan
bombé ». Les évènements A et B étant complémentaires, on a alors P(A) + P(B) = 1.
Si on connaît P(X=1) on connaît donc P(X=0) qui vaut 1 – P(X=1). P(X=0) correspond à ne pas avoir le tympan
bombé.
Exemple d’épreuve aléatoire 2 : la température en cas d’otite diagnostiquée : épreuve aléatoire reproductible
dans les mêmes conditions, dont l’ensemble fondamental est en théorie infinie.
⇨ On mesure donc une variable d’étude quantitative continue qui peut être représentée par une variable
aléatoire continue. Notre loi de probabilité sera donc définie sur des intervalles. Pour rappel, nous avions
vu dans le cours précédent que la probabilité qu’une variable continue prenne une valeur définie valait 0.
Densité de probabilité : définition des probabilités sur des intervalles. Lorsque n → ∞, Δ x → 0 (lois des grands
nombres) :
P ( X=x ) =0
P ( x< X ≤ x +dx )=f ( x ) dx
5
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
2. Combinaison d’événements élémentaires :
Ensemble fondamental Ω : ensemble des résultats possibles de l’épreuve aléatoire, ensemble de tous les
événements élémentaires. Il peut y en avoir une infinité ou un nombre limité.
Evénements élémentaires : plus petits résultats possibles de l’épreuve.
Evénement non élémentaire : sous-ensembles disjoints de l’ensemble fondamental, peut comprendre plusieurs
événements élémentaires.
6
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
3. Définition ensembliste des événements et axiomes des probabilités et leurs
conséquences :
Connaissez bien ce tableau, il est la base pour comprendre la suite et résoudre les exercices.
événements élémentaires
● ø : jamais réalisé
Impossible P(ø) = 0
● ø : ensemble vide
● A et B sont réalisés
Intersection
o A ∩ B ou AB
P(A ∪ B) = P(A) + P(B) – P(A ∩ B)
● A ou B (ou les deux) est réalisé
Union
o A∪B
P(A ∩ B) = 0
● A et B ne peuvent pas être réalisés en même
→ P(AB) = P(A) + P(B)
temps
Événements
o A∩B=ø
incompatibles =
disjoints = exclusifs ● A et B sont liés par une relation d’exclusion, A
et B ne sont pas indépendant
P( A ) = 1 – P(A)
● Contraire de A : A n’est pas réalisé
o A ou AC
● A et AC sont exclusifs et leur union est Ω
Complémentaire
(exhaustifs)
o A ∩ AC = ø
o A ∪ AC = Ω
7
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
P(A) < P(B)
● Si A est réalisé alors B se réalise aussi
P(A ∩ B) = P(A)
Événements
● /!\ Réciproque fausse
inclusifs
o A ⊆ B (A est inclus dans B)
Exemple : dans une population connue, 40% des personnes sont vaccinées contre la fièvre jaune. Donc la
probabilité pour un sujet de cette population d’être vacciné contre la fièvre jaune (événement A) est égal à 0,40.
On sait aussi que 55% des individus sont vaccinés contre la diphtérie. 30% d’individus sont vaccinés contre les
deux maladies : P(AB)=0,3
Quelle est la probabilité d’être vacciné contre la fièvre jaune ou la diphtérie ?
P (A ∪ B) = P(A) + P(B) – P (A ∩ B) = 0,4 + 0,55 – 0,3 = 0,65
En croisant 2 groupes d’événements exhaustifs, on obtient alors une liste de couples exhaustifs.
Probabilités
marginales de B
Probabilités marginales de A
→ On obtient 4 couples d’événements exhaustifs dont l’union est un événement certain (les 4 cases au centre du
tableau).
Pour remplir ce tableau, vous devez commencer par mettre les informations de l’énoncé, et enfin vous finissez de
remplir par un système de soustraction/addition. Pour utiliser ce tableau, il vous faut au moins 3 cases de
remplies dont 1 au centre. Ce tableau est rapide à faire et à remplir dans chaque exercice. Je vous conseille de la
faire pour chaque exercice de probabilité pour éviter toutes erreurs, et pouvoir répondre le plus rapidement aux
QCMs. Si vous avez des probabilités conditionnelles qui découlent les unes des autres, je vous conseille de faire un arbre.
8
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
II. Variables aléatoires discrètes et continues
A. Intérêt et définition
Principe :
- Associer une variable aléatoire à une épreuve aléatoire.
- Représenter chaque événement élémentaire par un nombre pour :
o Mesurer
o Dénombrer
o Ordonner
o Qualifier
- Une variable aléatoire peut prendre des valeurs numériques avec la probabilité de l’événement
représenté par la valeur.
Intérêt : utiliser les ressources de l’algèbre et de l’analyse pour modéliser les phénomènes aléatoires.
− Les variables aléatoires continues représentent des évènements INdénombrables. Elles peuvent prendre
une infinité de valeurs dans un intervalle donné. Elles représentent les variables étudiées qui sont
quantitatives continues :
o Toujours numérique
o Résultat d’une mesure
− Les variables aléatoires discrètes représentent des événements dénombrables. Ne peuvent prendre que
des valeurs isolées, elles représentent les variables étudiées qui ne sont PAS quantitatives continues :
o Qualitative nominale (ou catégorielle) :
▪ Binaire (ou dichotomique)
9
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
B. Variable aléatoire : application de Ω dans R
On passe des événements à leur codage, ce qui permet d’affecter les probabilités des événements aux valeurs
correspondantes qui sont susceptibles d’être prises par les variables aléatoires.
C. Notation
Les variables aléatoires sont notées par des lettres latines de la 2ème moitié de l’alphabet en majuscule : X, Y etc.
Exemple : S’il y a une seule variable, on l’appellera X « Taille ». S’il y a deux variables, la 2ème sera Y « Poids ».
Les valeurs numériques prises par ces variables sont appelées réalisations possibles et sont notées par les
mêmes lettres mais en minuscules.
D’une façon générale : « X = x », « Y = y » sont des notations d’événements.
⇨ Exemple : Pour la variable aléatoire discrète X qui ne peut prendre que 3 valeurs :
● Alors (« X = 2 ») est le 3ème événement (ou valeur) possible, il sera donc noté (X = x3).
10
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
⇨ Exemple : pour une variable aléatoire continue X : « X = x », x Є R +, si X « âge » car l’âge est
toujours positif.
VA discrètes VA continues
Loi de probabilité : Loi de probabilité :
● Liste des J couples ( x j , p j) ● Comme P(« X = x ») = 0
X Fièvre pj
0 Aucune 0.3
0
11
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
1 Modérée 0.6 L’aire sous la courbe de f doit être égale à 1 :
0
2 Forte 0.1
0
+∞
∫ ❑ f ( x ) dx=1
−∞
1 Modéré 0.6
e 0
2 Forte 0.1
0
12
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
E. Espérance et variance des variables aléatoires :
● E ( X )=∫ ❑ xf ( x ) dx
−∞
13
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
+∞
● f ( x ) dx : Probabilité que X prenne une Var ( X )= ∫ ❑ ( x−μ ) f ( x ) dx
2
Enoncé du théorème : la somme de n variables aléatoires indépendantes et de lois quelconques est une variable
aléatoire dont la loi de probabilité converge vers la loi normale quand n tend vers l’infini.
Exemple : Chez 36 enfants où le diagnostic d’otite a été posé, la fièvre attendue est de 37,5 avec un écart type de
0,48. On peut donc écrire µ = 37,5 et σ = 0,48. Quelle est la moyenne théorique et l’écart type théorique de la
variable aléatoire appelée moyenne empirique, définie comme étant la moyenne algébrique d’un échantillon de
36 variables indépendantes et de même loi de probabilité ?
� Cette variable suit une loi normale de paramètre µ = 37,5 et σ = 0,48. L’espérance sera donc de 37,5. Pour
σ
= 0,48/√ 36 = 0,08.
trouver l’écart type, on utilise la formule
√n
Les paramètres de la moyenne empirique sont donc µ = 37,5 et σ = 0,08.
On observe un échantillon de 36 sujets provenant de la population précédente. Quelle est la loi de la moyenne
empirique ?
� 36>30, donc le théorème central limite peut s’appliquer, nous auront donc une loi normale. La moyenne
empirique suivra donc une loi normale avec µ = 37,5 et σ = 0,08.
Donner la valeur prise par la variable aléatoire centrée réduite U associé à cette moyenne empirique M en
fonction de la moyenne m d’un échantillon de taille 36.
15
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
m−μ(m)
m−μ (m) m−μ(m)
U=
σ ( m)
= σ = √n
σ
√n
On va observer l’évènement U=u avec u, la valeur prise par m dans l’échantillon.
m−37 , 5
u=
0 , 08
Exemple : Probabilité que la moyenne observée dans l’échantillon soit supérieure à 37,62 :
= p (m > 37,62)
37 , 62 – 37 ,5
� Pour passer en loi normal, on fait donc = 1,5
0 , 08
� p (U > 1,5) = 1 - p(U < 1,5) , on regarde ensuite dans la table de la lois normale et on trouve p(U < 1,5) =
0,93 donc p(U > 1,5) = 0,07.
A. La loi de Bernoulli
Il s’agit de la loi de probabilité d’une variable binaire X. L’épreuve de Bernoulli est décrite comme suit :
- A : « X=1 » Présence du caractère A
- A : « X=0 » Absence du caractère A
- Le paramètre π de la loi : π=P( X=1)
Notation : X → Bernoulli (π )
Espérance : E(X) = µ = π
Variance théorique : Var(X) = π (1 – π)
Son intérêt :
- Dénombrer le nombre de sujets présentant le caractère dans un échantillon de taille n.
- Estimer la probabilité de survenue d’un événement.
Exemple : Dans une population donnée, la prévalence de maladie est de 20%. La variable aléatoire X représente le
statu vis-à-vis de cette maladie. X=1 en cas de maladie.
On a donc comme moyenne π = 0,20.
La variance vaut 0,2 x (1 – 0,8) = 0,16.
L’écart type vaut donc 0,4.
16
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
B. Loi binomiale de paramètre (n, π)
Position du problème avec un exemple : Quelle est la probabilité d’avoir 1 seule fille sur 4 enfants ? 2 filles ? 3
filles ? 4 filles ou aucune fille ? Sachant que la probabilité de donner naissance à une fille est π.
Cette situation est en fait une répétition d’une même épreuve élémentaire de Bernoulli :
● n fois (exemple n = 4)
● De façon indépendante
▪ Sn= X 1 + X 2 +…+ X n
( )
n
n!
∑ ❑ X i=k
k
Ainsi : P ( S n=k )=P ¿ C kn π k ( 1−π )n−k Où C n=
i=1 k ! ( n−k ) !
Notation : Sn → (n , π )
¿
Moyenne théorique : E(Sn) = nπ
Variance théorique : Var (Sn) = nπ(1-π)
Exemple : La loi de probabilité de présence de fièvre chez les enfants avec otite à comme paramètre π = 0,4. Chez
les enfants avec otite diagnostiquée, à combien d’enfant avec fièvre peut-on s’attendre.
� On s’attends à nπ enfants avec fièvres. S’il y a dix enfants, on peut s’attendre à trouver 4 enfants avec de
la fièvre.
C. Lois de la moyenne F
X 1 + X 2 +…+ X n
- F=
n
17
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
- E ( F )=E ( X + X +n …+ X )=E ( Sn )=E ( X )=π
1 2 n n
De même, on obtient : F → N π ,
( √ π (1−π )
n )
car Sn=nF
- Paramètres :
18
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
o μ = moyenne = médiane = mode
o σ = écart-type
- Notation : X → N (μ , σ )
-
-
▪ IF centré en probabilité :
o P ( X ≤ binf )=P ( X ≥ b¿ )=α /2
▪ X est dans l’intervalle de fluctuation avec une confiance 1 –
α:
o P ( binf < X < b¿ )=1−α =0 , 95
▪ X n’est pas dans l’intervalle de fluctuation avec un risque α :
o P ¿ binf , b¿ ¿=α =0 , 05
Exemple : Dans une population donnée, la glycémie suit une loi normale de moyenne 4,8 et d’écart type 0,6. Dans
quel intervalle centré à t’on 95% de chance d’observer une glycémie chez n individus ? Chez 100 sujets de cette
population ?
19
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
� Pour un individu : 1−α=0 , 95donc α =0 , 05 . La valeur de u correspondante est à 1,96.
L’intervalle centré est μ +/- uσ = 4,8 +/- 2 x 0,6 = 4,8 +/- 1,2. On remplace 1,96 par deux pour simplifier les
calculs ! Ici, on s’intéresse à la loi de X étant donné qu’on tire un individu au hasard.
0 ,6
� Pour 100 individus : Comme n>30, M suit une loi normale de moyenne 4,8 et d’écart type = 0,06.
√100
L’intervalle de fluctuation sera aussi centré sur 4,8 mais +/- 2 x 0,06
Plus n est grand, et plus la moyenne observée fluctue autour de µ !
Exemple : Dans une population donnée, la probabilité d’avoir de la fièvre quand on a une otite est de 40 %. Dans
quel intervalle centré a-t-on une probabilité de 95 % d’observer de la fièvre chez 100 sujets avec otites ?
La loi normale associée aura comme fréquence 0,4. La variance est de 0,4 x (1-0,6) = 0,24. Donc l’écart type sera
environ égal à 0,5.
Notre intervalle sera centré sur 0,4 +/- 2 x 0,5.
0 ,5
Pour 100 personnes, on a σ = = 0,05. L’intervalle correspondant est donc : 0,4 +/- 2 x 0,05.
√100
IV. Résumé
A. Formules essentielles
Variance :
Non linéarité, Var ( aX +b )=a ² Var ( X )
Si X et Y quelconques : Var ( X +Y ) =Var ( X ) +Var ( Y )+ 2Cov (X , Y )
20
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
C. Approximation de loi
Ce résumé est plutôt clair pour comprendre et aide à mémoriser mais il faut remplacer les p par des π. Depuis
l’année 2018-2019, la prof considère que n ≥ 30 ne fait plus partie des conditions d’approximation de la loi
binomiale en loi normale.
n ≥ 50 ; nπ <10
V. Probabilités conditionnelles
A. Définition intuitive
B. Définition probabiliste
21
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
La probabilité conditionnelle d’un événement correspond à sa probabilité sachant qu’un autre événement se
réalise. La probabilité conditionnelle de A sachant B est la probabilité que A se réalise lorsque B se réalise.
P ( AB ) =P ( B ) P ( B )=P ( A ) P ( A )
C. Aspect fréquentiste :
Si on répète un très grand nombre de fois une expérience et que l’on observe :
- nA fois l’événement A
- nB fois l’événement B
- nAB fois conjointement l’événement A et l’événement B
Alors, quand n → ∞:
nA nB n AB
→ P ( A ) ; → P (B ); → P ( AB )
n n n
n AB
n n AB P ( AB )
= ; =P ( B )
nB nB P ( B )
n
n AB
P(A|B) sera interprété comme le rapport
nB
22
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
A savoir par cœur !!!! Il faut savoir faire la différence le jour du concours pour bien savoir ce qu’on vous demande.
• Probabilité que l’événement A se réalise quand l’événement B se
réalise.
• Probabilité que l’événement A se réalise lorsque l’événement B se
réalise.
• Probabilité que l’événement A se réalise sachant que l’événement B
se réalise.
Probabilités • Probabilité que l’événement A se réalise chez les sujets qui réalisent
P(A|B)
conditionnelles l’événement B.
• Probabilité que les sujets ayant réalisé l’événement B se réalisent
l’événement A.
• Probabilité que les sujets qui réalisent l’événement B réalisent
l’événement A.
• Probabilité pour une personne réalisant l’événement B de réaliser
l’événement A.
• Probabilité que l’événement A se réalise et que l’événement B se
P(AB) réalise.
• Probabilité que l’événement A se réalise avec l’événement B.
Probabilités
• Probabilité que l’événement A se réalise sans que l’événement B se
d’événements
réalise.
conjoints
P( A B) • Probabilité que l’événement A se réalise et pas B.
• Probabilité que l’événement B ne se réalise pas mais que
l’événement A se réalise.
P ( AB ) P ( AB )
P ( A )= ; P ( B )=
P( A) P ( B)
P ( AB ) =P ( A ) × P ( A )=P ( B ) × P ( B )
Il faut être à l’aise avec ces formules qui permettent de répondre aux questions dans les exercices !!!
Exemple : Dans une population donnée, 80% des personnes atteintes d’une maladie M sont des
hommes. Cette population est composée de 50% d’homes. La prévalence de la maladie (probabilité d’être
malade) est de 1%. Quelle est la probabilité de maladie chez les hommes ?
P ( HM )=P ( H ) × P ( H )=P ( M ) × P ( M )
P(M)×P(M)
On veut p(M/H) :
P (H )
= (0,01 x 0,81) /0,5
= 1,62 %
F. Théorème de Bayes :
Le théorème de Bayes a un intérêt puisqu’il permet une réversibilité des probabilités conditionnelles.
23
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
En effet :
VI. Indépendance
Deux événements possibles sont indépendants, si la réalisation de l’un des événements n’influence pas la
réalisation de l’autre évènement :
Si P ( B )=P ( A ) et P ( A )=P ( B )
⇔ P ( AB )=P ( A ) P ( B )
Exemple : Le fait de décéder est-il indépendant du genre dans cette population ? La probabilité d’être un homme
et d’être décédé est de 0,14. La probabilité d’être un homme (p(H)) est de 0,68 et la probabilité de décéder (p(D))
est de 0,25.
� On regarde si la probabilité p(HD) = p(H) x p(D)
24
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
� Les évènements ne sont pas indépendants.
VII. Résumé
La loi des grands nombres :
nA
f= n →∞ ⇒ p=P ( A )
n
Probabilités conditionnelles :
P (A et B) P( AB)
P ( B )= =
P( B) P (B)
P ( AB ) =P ( A ) × P ( A )=P ( B ) × P ( B )
P ( B )=P ( BA )+ P ( B A )
1=P ( B ) + P( A∨B)
25
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
VIII. ANNALES CLASSÉES CORRIGÉES :
PROBABILITÉS
2016-2017
Exercice 1 :
Pour un sujet d’une population P, X=1 représente l’exposition au tabac et Y=1 la présence de cancer.
La prévalence du cancer est de 12% dans cette population qui comprend 20% de fumeurs ; 72% des sujets sont
exempts de cancer et non fumeurs.
Question 01. Parmi les propositions suivantes, vous cocherez la ou (les) proposition(s) exacte(s) :
A) La probabilité pour un sujet fumeur de cette population d’avoir un cancer est de 0,04/0,20=0,2
B) La probabilité pour un sujet fumeur de cette population d’avoir un cancer est de 0,04/0,12=1/3=0,33
C) Les deux variables aléatoires sont indépendantes dans l’exemple numérique fourni dans l’énoncé
D) Il suffit de vérifier que P(X=0∩ Y=0)=P ( X =0 ) × P(Y =0) pour affirmer que les deux variables sont
indépendantes
E) Il suffit de vérifier que P ( Y =0 )=P(X =0) pour affirmer que les deux variables sont indépendantes
Réponses : AD
Pour les exercices de probabilités et notamment celui-ci, faire un tableau de contingence simplifie beaucoup les
choses :
Cancer (Y =1) Cancer (Y =0)
Fumeur( X=1) 0,04 0,16 0,20
Fumeur( X=0) 0,08 0,72 0,80
0,12 0,88 1
On remplit le tableau avec les données de l’énoncé (en gras), puis on le complète.
P (Y =1 ∩ X =1) P(C ∩ F) 0 ,04
A, B. On cherche : P ( Y =1 ¿=1 )= soit P ( C ¿ ) = = =0 , 20
P( X=1) P (F ) 0 , 20
C. FAUX : Pour savoir si deux événements sont indépendants, il faut que : P ( A ∩B )=P( A)× P( B) ou que
P ( A ¿ )=P( A) ou que P ( B ¿ )=P(B)
Pour cette question, P ( Y =1 ∩ X =1 )=0 , 04 et P ( Y =1 ) × P ( X =1 )=0 , 12× 0 , 20=0,024 .
On remarque que 0 , 04 ≠ 0,024 donc les deux variables ne sont pas indépendantes.
D, E. C’est du cours, pour que deux événements soient indépendants, il faut que : P ( A ∩B )=P( A)× P( B) ou
que P ( A ¿ )=P( A) ou que P ( B ¿ )=P(B), donc l’item D est VRAI.
2017-2018
Exercice 1 :
Des patients hospitalisés contractant une infection au cours de leur séjour sont pris en charge par une équipe
mobile spécialisée ne prenant en charge que des patients avec une infection nosocomiale. Ils peuvent souffrir
d’une ou plusieurs infections : une bactérienne (BAC), une pneumonie (PNE) ou une infection du tractus urinaire
(ITU).
26
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
Dans la population P des patients pris en charge par cette équipe, 2 patients sur 5 sont atteints d’une infection du
tractus urinaire et 35% ne présentent pas de pneumonie. Par ailleurs, 9 patients sur 10 sont atteints de
pneumonie ou d’infection du tractus urinaire.
Question 01. Parmi les propositions suivantes, vous cocherez la (ou les) proposition(s) exacte(s) :
A) La probabilité pour un patient pris en charge par cette équipe d’être atteint de pneumonie et d’infection du
tractus urinaire est de 0,10
B) La probabilité pour un patient pris en charge par cette équipe d’être atteint de pneumonie et d’infection du
tractus urinaire est de 0,15
C) La probabilité pour un patient pris en charge par cette équipe de n’avoir aucune infection est de 0,10
D) La probabilité pour un patient pris en charge par cette équipe de n’avoir qu’une bactériémie est de 0,10
E) Le fait de contracter une pneumonie est indépendant du fait de contracter une infection du tractus urinaire
Réponses : BD
Pour ce type d’exercice et si vous le pouvez (on peut ici), faites un tableau de contingence.
On note bactériémie : BAC ; pneumonie : PNE ; infection du tractus urinaire : ITU.
D’après l’énoncé, on a : P ( ITU )=0 , 4; P ( PNE ) =0 , 35; P ( PNE ∪ ITU ) =0 , 9
Pneumonie Pas de pneumonie
Infection du 2
0,15 0,25 =0 , 40
tractus urinaire 5
Pas d’infection du
0,50 0,10 0,60
tractus urinaire
0,65 0,35 1
Premièrement, il va falloir trouver une probabilité pour compléter le tableau. On va donc essayer de trouver :
P ( PNE ∩ ITU )=1−P ( PNE ∪ ITU ) =1−0 , 90=0 , 10
Les données en gras sont celles de l’énoncé.
A, B. D’après le tableau, on voit que P ( PNE ∩ ITU ) =0 , 15. Donc l’item B est VRAI.
Si vous n’avez pas fait de tableau de contingence, vous pouvez aussi passer par le calcul, en utilisant la formule :
P ( A ∪ B )=P ( A ) + P ( B ) −P( A ∩ B)
D’après l’énoncé, P ( PNE ) =0 , 35 donc P ( PNE ) =1−P ( PNE ) =1−0 , 35=0 ,65
P ( PNE ∩ IUT )=P ( PNE ) + P ( IUT )−P ( PNE ∪ IUT )=0 , 65+0 , 4−0 , 9=0 , 15
C. Dans cette étude, les patients ont obligatoirement une infection, donc la probabilité de n’avoir aucune infection
est de 0. On a P ( BAC )+ P ( PNE ) + P ( ITU )=1.
D. VRAI: N’avoir qu’une bactériémie signifie n’avoir ni pneumonie ni infection du tractus urinaire, donc d’après le
tableau : 0,10.
E. FAUX : On a une indépendance si : P ( PNE ∩ ITU ) =P( ITU )× P(PNE). Or, on a P ( PNE ∩ ITU ) =0 , 15 et
P ( ITU ) × P ( PNE ) =0 , 40 ×0 , 65=0 , 26 donc P ( PNE ∩ ITU ) ≠ P(ITU )× P(PNE). Ainsi, le fait de contracter
une pneumonie n’est pas indépendant du fait de contracter une infection du tractus urinaire.
2018-2019
Exercice 1 :
27
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
On considère qu’en Europe, parmi 200 patients admis en service de soins intensifs spécialisés en chirurgie, 140
présentent en moyenne une détresse respiratoire, et sont donc ventilés par intubation le jour de leur admission.
Par ailleurs, le risque de contracter une infection pulmonaire pour un patient au cours de son séjour est en
moyenne de 7% dans ces services. Sur 100 patients qui développent une infection pulmonaire pendant leur
séjour, en moyenne 85 sont ventilés à l’admission.
Quelle est la probabilité pour un patient ventilé le jour de son admission de contracter une infection pulmonaire
dans ces services ?
On donne : 49/85 ≈ 0,58.
Question 01. Parmi les propositions suivantes, vous cocherez la (ou les) proposition(s) exacte(s) :
A) La probabilité pour un patient ventilé le jour de son admission de contracter une infection pulmonaire dans
ces services est de 0,058
B) La probabilité pour un patient ventilé le jour de son admission de contracter une infection pulmonaire dans
ces services est de 0,085
C) La probabilité pour un patient ventilé le jour de son admission de contracter une infection pulmonaire dans
ces services est de 0,85
D) La survenue d’une infection pulmonaire au cours du séjour dépend du fait d’être ventilé à l’admission
E) L’absence d’infection pulmonaire au cours du séjour dépend du fait d’être ventilé à l’admission
Réponses : BDE
A, B, C. Dans cet exercice, on demande de trouver P(I ¿) . Soit les événements suivants : I → Infection
pulmonaire ; V → Ventilation.
140 70 85
On sait que : P ( V )= = =0 , 7 et P ( I )=7 %=0 , 07 P ( V ¿ )= =0 , 85
200 100 100
P (V ∩ I ) P(V ∩ I )
P ( V ∩ I )=P ( V ) × =P ( I ) ×
P (V ) P( I )
P ( V ∩ I )=P ( V ) × P ( I ¿ )=P(I )× P(V ¿)
P( I )× P (V ¿) 0 , 07 × 0 ,85 1 ×0 , 85
P ( I ¿) = = = =0,085
P (V ) 0,7 10
D. VRAI: Pour que deux événements soient indépendants, il faut que : P ( A ∩B )=P( A)× P( B) ou que
P ( A ¿ )=P( A) ou que P ( B ¿ )=P ( B ). Ici, on compare P ( I ¿ ) et P (I ). Or, P ( I ¿ ) =0,085 ≠ 0 ,07=P(I ). Donc les
deux événements ne sont pas indépendants, ainsi ils dépendent l’un de l’autre.
E. VRAI: Si on prouve que deux événements ne sont pas indépendants alors toutes autres combinaisons ne sont
pas indépendantes : P ( I ¿ ) ≠ P ( I ) → P ( I ¿ ) ≠ P(I ) .
2019-2020
Ø
2020-2021
Exercice 1 :
Dans la tranche d’âge 18-25 ans, les limites de référence du taux d’hémoglobine chez la femme sont de 124 g/L et
156 g/L. Ces deux limites correspondent respectivement aux percentiles 2,5 et 97,5 de la distribution théorique
28
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
du taux d’hémoglobine dans cette population. Le taux d’hémoglobine est normalement distribué dans cette
population. Une femme sera considérée anémique si son taux d’hémoglobine est inférieur à 120 g/L.
Vous arrondirez sur la 2edécimale la valeur lue dans la table et vous garderez deux chiffres après la virgule.1.
Question 01. Parmi les propositions suivantes, vous cocherez la (ou les) proposition(s) exacte(s):
A. La moyenne théorique du taux d’hémoglobine dans cette population est de 140 g/L.
B. L’écart type théorique du taux d’hémoglobine dans cette population est de 16 g/L.
C. L’écart type théorique du taux d’hémoglobine dans cette population est de 8 g/L.
D. La probabilité pour une femme de cette population de présenter une anémie est de 2 %.
E. La probabilité pour une femme de cette population de présenter une anémie est de 1 %.
Réponses : ACE
A. VRAI: le taux d’hémoglobine suit une lois normale. On a donc (124 + 156)/2 =140
B. FAUX. On a P (X ≤156) = 97,5 %. On a donc P ((𝑥−μ)/𝜎≤(156−μ)/𝜎) = 97,5 %. On note U = 𝑥−μ)/𝜎. U suit donc
une loi normale centrée réduite. On va à présent chercher dans la table la valeur correspondante à 97,5%. On
trouve P (U ≤u0,9750) = 0,975 🡪 P (U ≤ 1,96) = 0,975 Il faut donc résoudre l’équation : (𝑥−μ)/𝜎 = 1,96 soit 𝜎 = 8
g/L
C. VRAI (voir item B).
D. FAUX P(X ≤120) = P(U ≤(120−140)/8) = P(U ≤−20 /8) = 1 –P (U ≤2,5) = 1 –0,99 = 1 %
E. VRAI (voir item D)
Exercice 2 :
Dans une communauté comprenant 40% de fumeur réguliers, 20% des individus sont testé positifs au Covid-19 et
50% des sujets positifs au Covid-19 sont des fumeurs réguliers.
Question 02. Parmi les propositions suivantes, cochez la (ou les) proposition(s) exacte(s) :
A. Dans cette communauté, un sujet positif au Covid-19 a une chance sur 2 d’être fumeur régulier
B. Le résultat au test diagnostic du Covid-19 est indépendant du statut “fumeur régulier”
C. La probabilité pour un fumeur régulier d’être testé positif au Covid-19 est de 50 %
D. La probabilité pour un fumeur régulier d’être testé positif au Covid-19 est de 25 %
E. La probabilité pour un fumeur régulier d’être testé positif au Covid-19 est de 2,5 %
Réponses : AD
On connait : P(Fumeur régulier) = P(F) = 0,4 ; P(test Covid19 positif)= P(C) = 0,2 ; 𝑃(𝐹|𝐶)=0,5
A. VRAI: c’est P(F/C)
B. FAUX. 𝑃(𝐹)≠𝑃(𝐹|𝐶)
C. FAUX: On veut P(C/F). D’après Bayes, 𝑃(𝐹)×𝑃(𝐶|𝐹)=𝑃(𝐶)×𝑃(𝐹|𝐶), donc 𝑃(𝐶|𝐹)=𝑃(𝐶)×𝑃(𝐹|𝐶)/𝑃(𝐹) = (0,2 x
0,5)/0,4 = 25%.
D. VRAI (voir calcul item C)
E. FAUX (voir calcul item C)
2021-2022
Exercice 2 :
La sensibilité d'un signe clinique S vis-à-vis d'une infection par un virus V est de 60 % dans une population
donnée. Ceci signifie que la probabilité pour un sujet infecté par ce virus V de présenter ce symptôme S est
29
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
de 60 %. En population générale, 9 % des sujets présentent ce symptôme ubiquitaire quelle que soit la
saison. Sachant que l'hiver la prévalence de cette infection est de 6 %, quelle est la probabilité pour un sujet
présentant ce symptôme d'être infecté l'hiver par le virus V ?
QCM 2 : Parmi les propositions suivantes, cochez la (ou les) proposition(s) exacte(s) :
A) La probabilité demandée est inférieure à 0,01
B) La probabilité demandée est 0,4
C) La probabilité demandée est 0,9
D) Si le symptôme S est indépendant de l'infection par le virus V, alors P(V/S) = P(V)
E) Si le symptôme S dépend de l'infection par le virus V, alors P (V n S) = P(V) x P(S)
Réponses : BD
Information : P(S/V) = 0,6 P(S) = 0,09 P(V) = 0,06
On cherche P(V/S) = ??
On calcul P(SV) = P(S/V) x P(V) = 0.6 x 0.06 = 0.036
Soit P(V/S) = P(SV) / P(S) = 0.039 x 0.9 = 0.4 B VRAI
Si symptôme S est indépendant de l’infection par le virus V, alors P(V/S) = P(V) et donc P(SV) = P(V) x P(S) D
VRAI et E FAUX
30
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
IX. ANNALES CLASSÉES CORRIGÉES :
VARIABLES ALÉATOIRES
2016-2017
Exercice 2 :
Le taux de triglycérides des sujets d’une population P peut être représenté par une variable aléatoire X de loi
normale, de moyenne théorique ( μ=1 , 3) et d’écart-type théorique (σ =0 , 5). Les valeurs sont exprimées en g/L.
On donne les valeurs suivantes de la fonction de répartition de la loi normale centrée réduite :
u 0,20 0,50 0,75 1,00 1,25 1,50 1,75 2,00
P(U ≤ u) 0,58 0,69 0,77 0,84 0,89 0,93 0,96 0,98
Question 03. On considère la variable aléatoire Y qui prend la valeur 1 lorsqu’un sujet de cette population P
présente un taux de triglycéride inférieur ou égal à 1,2g/L et qui prend la valeur 0 dans le cas contraire.
Parmi les propositions suivantes, vous cocherez la (ou les) proposition(s) exacte(s) :
A) La variable aléatoire Y suit une loi normale
B) La variable aléatoire Y suit une loi de Bernoulli
C) La moyenne théorique de Y est P( X ≤ 1 ,2)
D) La variance théorique de Y est P( X ≤ 1 ,2)× P(X > 1, 2)
E) La loi de la variable Y peut être approximée par une loi normale
Réponses : BCD
A, B. On voit que Y suit une loi de Bernoulli de paramètre : p=P (Y =1) avec pour moyenne p et pour variance
p ( 1− p ) .
C. VRAI: Pour que (Y =1), il faut que le taux de triglycérides soit inférieur ou égale à 1,2g/L. On remarque donc
que P ( Y =1 )=P (X ≤1 , 2). Ainsi, p=P (X ≤1 , 2).
D. VRAI: On a dit que la variance d’une loi de Bernoulli s’écrit
σ = p ( 1− p )=P ( X ≤ 1 ,2 ) × [ 1−P ( X ≤ 1 ,2 ) ] =P ( X ≤ 1 , 2 ) ×[ P ( X >1 ,2 ) ].
E. FAUX On ne peut pas répondre avec les données de l’énoncé.
Exercice 3 :
On considère une variable aléatoire X de loi de probabilité quelconque de moyenne et de variance théoriques
connues.
On appelle moyenne empirique M la variable aléatoire qui est la moyenne de n variables aléatoires de même loi
de probabilité que celle de la variable aléatoire X .
Réponses : A
31
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
QCM de cours. E ( M )=E ( X ) dans tous les cas. Donc seule la réponse A est VRAI puisque les autres items sont
restrictifs.
2017-2018 et 2018-2019
Ø
2019-2020
Exercice 1
On suppose qu’en population générale, 80% des personnes âgées de plus de 75 ans sont atteintes d’arthrose. La
variable aléatoire F (fréquence empirique) représente la proportion de sujets atteints d’arthrose estimée à partir
d’un échantillon représentatif de 100 sujets de plus de 75 ans de la population générale.
Question 1. Parmi les propositions suivantes, vous cocherez la (ou les) proposition(s) exacte(s)
A- La variable d’étude dont la valeur est collectée par sujet est une variable quantitative de dénombrement.
B- La variable aléatoire (n × F) suit une loi binomiale de moyenne théorique 80 et d’écart type théorique 4
C- La loi de la variable aléatoire (F) peut être approximée par une loi normale
D- Pour s’assurer que la proposition C est juste, il suffit de comparer la valeur 20 à 5
E- L’écart type théorique de la variable aléatoire F est égal à 0,4
Réponses : BCD
A.FAUX 𝑋 représente une variable d'étude qualitative binaire et non pas quantitative de dénombrement
B. VRAI La moyenne théorique est bien dé 80. L’écart type de F vaut :
σ nF= √ Var (nF )=√ n × π 0 ×(1−π 0 )=√ 100× 0 , 8(1−0 , 8)=√ 8× 2=√ 16=4
C.VRAI on a n > 30, nσ = 100 x 0,8 > 5 et n(1-σ) = 100 x 0,2 = 20 > 5
D. VRAI
E. FAUX il vaut 0,04 :
E ( F )=π 0 Var ( F )=
√ π 0 ( 1−π 0)
n
=
√0 , 8(1−0 ,8)
100
=
100 √
0 ,16
=
16
2
=
100 100 √
4
=0 , 04
NB. La question 2 est à classer dans le chapitre « probabilités » plutôt que « variables aléatoires », mais comme
la question est liée à l’énoncé précédent, nous la laissons à la suite.
Question 2. Calculez et indiquez la probabilité d’observer la variable aléatoire F inférieure à 0,78 ou supérieure
à 0,82 parmi les valeurs du tableau 1. Vous arrondirez la valeur lue dans la table de la fonction de répartition de
la loi normale centrée réduite sur la 2ème décimale.
0,28 0,29 0,30 0,31 0,32 0,33 0,34 0,35 0,45 0,46
A B C D E AB AC AD AE BC
0,47 0,48 0,49 0,50 0,51 0,52 0,53 0,54 0,55 0,56
BD BE CD CE DE ABC ABD ABE ACD ACE
0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 0,66 Autre
ADE BCD BCE BDE CDE ABCD ABCE ABDE ACDE BCDE ABCDE
Tableau 1
Réponses : ABCD
32
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires
On veut P(F < 0,78) + P(F > 0,82).
0,78 et 0,80 étant symétriques par rapport à la moyenne théorique de F, on a donc :
P(F < 0,78) = P(F > 0,82).
Sachant que l’on peut approximer F par une loi normale : N(0,8 ; 0,04), on obtiens alors :
P ( F ≤ 0 ,78 )=P ( F−0 , 80 0 ,78−0 , 80
0 , 04
≤
0 , 04 ) =P (U ≤−
0 , 02
0 , 04 )=P (U ≤− )=1−P(U ≤ 0 , 5)
1
2
D’après la table de la loi normale, on peut écrire : P(F < 0,78) = 1 – 0,69 = 0,31
P(F < 0,78) + P(F > 0,82) = 2 x 0,31 = 0,62
2021-2022
Ø
33
Cours Galien Lyon Sud – 2022/2023
PASS – Biostatistiques – Probabilités et Variables aléatoires