Vous êtes sur la page 1sur 5

CORRIGE DES EXERCICES DE LA SEANCE DE TD 1

Exercice 1

1. a) Les probabilités qui vous sont demandées se calculent de la façon suivante :


• La valeur α = P(Z > 0,44) se lit directement dans la table pour zα = 0,44. zα doit être recherché
dans le “corps” de la table. On trouve 0,440 qui se situe au croisement de la ligne 0,3 (ce qui
donne la première décimale de α) et de la colonne 0,030 (ce qui donne les décimales suivantes de
α). On obtient donc α = 0,33. C’est-à-dire P(Z > 0,44) = 0,33.

• En se rappelant (voir livre p 33-34) que pour une loi de probabilité continue (comme c’est le cas
de la loi normale), on a P(Z ≥ x) = P(Z > x), on obtient : P( Z ≥ 0,44) = P(Z > 0,44) = 0,33

• En lisant directement dans la table de façon analogue aux questions précédentes, on trouve :
P(Z > 0) = 0,50 et P(Z > - 1,645) = 0,95

• P(Z > 3,09) se trouve dans le “complément de table” en bas de page correspondant aux petites
valeurs de α (ou, ce qui revient au même, aux grandes valeurs de zα). On lit : P(Z > 3,09) = 10-3.

• zα=1,5 ne figure pas dans la table. Cette valeur est située entre 1,476 et 1,514 qui correspondent
respectivement à α = 0,070 et α = 0,065. On a donc : 0,065 < P( Z > 1,5) < 0,070.
Remarque : si on a besoin d’une valeur unique, par exemple pour poursuivre des calculs, on prend
la case de la table la plus proche de zα. Ici on aura donc : P(Z > 1,5) ≈ 0,065.

• P(Z < 1,3) ne peut pas être lu directement dans la table qui donne des probabilités du type
P(Z > zα). Il faut utiliser la relation P(Z < 1,3) = 1 - P(Z > 1,3) qui donne (en prenant la valeur de zα
de la table la plus proche de 1,3) : P(Z < 1,3) = 1 - 0,095 = 0,905.

• On a P(|Z| > 0,86) = P(Z < - 0,86) + P(Z > 0,86). La table donne P(Z > 0,86) = 0,195 et on a
P(Z < -0,86) = 1 - P(Z > - 0,86) = 0,195. On en déduit : P(|Z| > 0,86) = 0,39.
Remarque : la symétrie de la loi normale centrée réduite donne P(Z < -0,86) = P(Z > 0,86), de
sorte qu’on peut écrire : P(|Z| > 0,86) = 2×P(Z > 0,86) 2×0,195 = 0,39.

• P(|Z| < 0,97) = 1 - P(|Z| > 0,97) = 1-2×P(Z > 0,97) = 0,67

• De façon générale, on a : P(a < Z < b) = P(Z > a) - P(Z > b). On obtient donc :
P(1,2 < Z < 1,8) = P(Z > 1,2) - P(Z > 1,8) = 0,115 - 0,035 = 0,080.

b) Pour trouver les valeurs de a demandées, il faut utiliser la table de la loi normale “dans l’autre
sens” :
• α = 0,86 correspond au croisement de la ligne 0,8 et de la colonne 0,060, où on lit zα = -1,080.
On a donc : P(Z > -1,080) = 0,86.
• De même : P(Z > 1,645) = 0,05

Master de Santé Publique - 2019-2020 1


M1 - UE de biostatistiques - TD 1 - Corrigé
• Pour trouver a tel que P(|Z| > a) = 0,05, on utilise la propriété qui a été vue à la question 1.a :
P(|Z|>a) = 2×P(Z > a). Il faut donc trouver a tel que P(Z > a) = 0,025 ce qui donne a = 1,960. On a
donc : P(|Z| > 1,960) = 0,05.
• Le même raisonnement donne P(Z > 2,576) = 0,005 puis : P(|Z| > 2,576) = 0,01.
Comme on le verra dans les TD suivants, les valeurs précédentes de a sont très utilisées pour les
tests statistiques.

c) Si on prend des valeurs a et b symétriques autour de 0, c’est-à-dire a = –b de sorte qu’on ait


P(Z<a) = P(Z>b), on obtient P(a < Z < b) = P(|Z| < b) = 1-P(|Z| > b) = 1-2×P(Z > b).
1− P(a < Z < b) 1− 0,90
Il faut donc trouver b tel que P(Z > b) = = = 0,05 , soit b = 1,645 (et donc
2 2
a = –1,645).
Cependant, d’autres valeurs de a et b sont possibles. En effet, P(a < Z < b) = P(Z > a) - P(Z > b). Il
suffit donc qu’on ait : P(Z > a) - 0,90 = P(Z > b). Il y a une infinité de couples (a,b) qui satisfont
cette égalité. Par exemple : a = –∞ et b = 1,282, ou a = –2,576 et b = 1,311, ou encore a = –1,282
et b = ∞.

X−µ
2. On sait que si X suit une loi normale de moyenne µ et de variance σ2, Z = suit une loi
σ
X − 10
normale centrée réduite. On en déduit ici que Z = suit une loi normale centrée réduite.
3,5
⎛ 9 − 10 X − 10 11− 10 ⎞
a) On a donc : P(9 < X < 11) = P ⎜ < < ⎟ = P(−0,535 < Z < 0,535) .
⎝ 3,5 3,5 3,5 ⎠
Le même type de calculs qu’à la question 1 donne :
P(-0,535 < Z < 0,535) = 1 - 2×P(Z > 0,535) = 1 - 2×0,295 = 0,41.
On a donc finalement : P(9 < X < 11) = 0,41.

b) On procède de même pour la probabilité que X soit compris entre 9 et 10,5 (Z désigne toujours
la loi normale centrée réduite) :
P(9 < X < 10,5) = P(-0,535 < Z < 0,267) = P(Z > -0,535) - P(Z > 0,267) = 0,705 - 0,395 = 0,31.

Exercice 2

1. La valeur X du dosage suit une loi normale avec les deux méthodes. Les moyenne et variance
de X étant différentes selon la méthode, il faut faire deux calculs séparés :

• Méthode 1
La probabilité P1 que la valeur X du dosage soit à l’extérieur de l’intervalle [2250 ; 2750] est la
somme des deux probabilités : P1 = P(X < 2250) + P(X > 2750). En se ramenant à une loi normale
centrée réduite, on obtient :

Master de Santé Publique - 2019-2020 2


M1 - UE de biostatistiques - TD 1 - Corrigé
X − µ1
P1 = P(Z = < −0,625) + P(Z > 0,625) = (1-0,735) + 0,265 = 0,53.
σ1
On peut remarquer qu’en raison de la symétrie de la loi normale de X autour de sa moyenne 2500,
les probabilités P(X < 2250) et P(X > 2750) ont la même valeur.

• Méthode 2
On obtient de la même façon la probabilité P2 que la valeur X du dosage soit à l’extérieur de
l’intervalle [2250 ; 2750] :
X − µ2
P2 = P(Z = < −3,5) + P(Z > 1,5) = (5 10-4) + 0,065 = 0,065.
σ2

Bien que la moyenne de la méthode 2 ne soit pas la valeur de référence, la valeur du dosage
s'écarte donc moins souvent de 10% de la valeur de référence avec la méthode 2 qu'avec la
méthode 1.

2. On peut comprendre le résultat précédent en superposant les distributions des dosages des 2
méthodes. On obtient le graphique suivant :

distribution du dosage
avec la méthode 2
distribution du dosage
avec la méthode 1

2500 2600

Contrairement à la méthode 1, la méthode 2 introduit un écart systématique à la valeur de


référence 2500 (cet écart s’appelle un biais). Cependant la méthode 2 a une dispersion beaucoup
plus petite.
Si une précision relative de 10% sur le dosage est jugée suffisante, les résultats de la question 1
indiquent qu’un dosage ne respectant pas ce critère sera moins souvent obtenu par la méthode 2
(6,5% des cas) que par la méthode 1 (53% des cas). On choisira alors la méthode 2.
Si l’on veut une précision plus grande, il arrive un moment, en répétant les mesures sur un même
échantillon sanguin et en faisant la moyenne, où la méthode 1 devient la meilleure.

Exercice 3

1. Le nombre X de non fumeurs dans un échantillon de taille n suit une loi binomiale. En notant P
la proportion de non fumeurs dans la population dont est extrait l’échantillon, on sait que, si nP et

Master de Santé Publique - 2019-2020 3


M1 - UE de biostatistiques - TD 1 - Corrigé
nQ sont supérieurs à 5, la distribution de X est approximativement une loi normale de moyenne nP
et de variance nPQ.
Comme ici nP = 30 et nQ = 70, l’approximation par la loi normale est possible. On obtient donc, en
X − nP
se ramenant à la loi normale centrée réduite Z = :
nPQ

⎛ X − 100 × 0,30 40 − 100 × 0,30 ⎞


a) P(X > 40) = P ⎜ Z = > ⎟ = P(Z > 2,18) = 0,015
⎝ 100 × 0,30 × 0,70 100 × 0,30 × 0,70 ⎠

b) De même, P(X > 35) = P(Z > 1,09) = 0,14.


On en déduit : P(35 < X < 40) = P(X > 35) - P(X > 40) = 0,14 - 0,015 = 0,125.

2. a) La question revient à chercher les valeurs a et b vérifiant P(a < X < b) = 0,95. La solution
retenue habituellement est de chercher des valeurs symétriques autour de la moyenne de X, c’est-
à-dire de µ = nP = 30. On prend donc a = µ - c et b = µ + c.
Il faut alors trouver c vérifiant : P(µ - c < X < µ + c) = 0,95. En se ramenant à la loi normale centrée
X−µ
réduite Z = (ce qui est possible puisque nP et nQ ≥ 5), on obtient :
σ
⎛ c c⎞ ⎛ c⎞
( )
P µ − c < X < µ + c = P ⎜ − < Z < ⎟ = P ⎜ | Z |< ⎟ = 0,95 avec σ = nPQ
⎝ σ σ⎠ ⎝ σ⎠
⎛ c⎞ ⎛ c⎞
Cela peut aussi s’écrire : P ⎜ | Z |> ⎟ = 0,05 ; ou, par symétrie de Z : 2 × P ⎜ Z > ⎟ = 0,05 ;
⎝ σ⎠ ⎝ σ⎠
⎛ c⎞
soit : P ⎜ Z > ⎟ = 0,025 .
⎝ σ⎠
c
La table de Z donne alors : = 1,96 et donc c = 1,96 σ = 1,96 100 × 0,30 × 0,70 = 8,98 .
σ
En revenant aux valeurs initiales, on a donc : a = 30 - 8,98 = 21,02 et b = 30 + 8,98 = 38,98.

Dans 95% des échantillons, le nombre de non fumeurs observés est donc compris entre 21 et 39.

Remarques :
• L’intervalle donné par le calcul était [21,02 ; 38,98]. Nous l’avons “arrondi” à [21 ; 39] pour que les bornes soient
des nombres entiers, ce qui est tout à fait logique. Cela a pour conséquence de modifier un peu la probabilité que
X soit à l’intérieur de l’intervalle : elle est un peu plus grande avec [21 ; 39] qu’avec [21,02 ; 38,98]. L’écart est ici
minime, mais dans d’autres cas l’arrondi peut être plus important et l’écart plus grand.
• On a pris un intervalle symétrique autour de la moyenne de X, mais d’autres solutions sont possibles. En fait
tout intervalle [x1 ; x2] vérifiant P(x1 < Z < x2) donnerait une solution. Celui que nous avons pris correspond à
x1 = -1,96 et x2 = 1,96, mais on pourrait aussi prendre x1 = -2,170 et x2 = 1,812 (qui donnerait pour le nombre de
non fumeurs [20,06 ; 38,30]) ou x1 = -2,326 et x2 = 1,751 (qui donnerait [19,34 ; 38,02]).
L’intervalle symétrique autour de la moyenne de X est habituellement retenu d’une part parce qu’on n’a pas de
raison de privilégier un écart à la moyenne d’un côté plutôt que l’autre, d’autre part parce c’est celui qui a la
longueur la plus petite.

Master de Santé Publique - 2019-2020 4


M1 - UE de biostatistiques - TD 1 - Corrigé
b) Tout est dans le mot “raisonnablement”, et ce que chacun veut y mettre … Chaque couple de
limites correspond à une probabilité que l’intervalle correspondant contienne le nombre de non
fumeurs observé, et donc à un risque qu’il ne le contienne pas (appelé aussi risque d’erreur). On
choisira donc des limites en fonction du risque d’erreur que l’on consent.
L’habitude en statistique (qui a sa part d’arbitraire) est de fixer le risque d’erreur à 5%. Le calcul de
la question précédente donne alors les limites 21 et 39.

3. Le nombre de non fumeurs observé, 50, est extérieur à l’intervalle [21 ; 39], c’est-à-dire qu’on
ne devrait pas “raisonnablement” l’observer si le pourcentage de non fumeurs dans la population
est 30%.
Il y a donc deux possibilités : le pourcentage de non fumeurs dans la population est effectivement
30% et l’observation est particulièrement excentrique (il y avait moins de 5% de chances de la
faire), ou bien le pourcentage de non fumeurs n’est pas 30%.
Comme on le verra en détail plus tard (TD 4), on choisit ici la seconde possibilité parce que le
risque d’erreur est inférieur à 5%. On conclut donc qu’il y a plus de 30% de non fumeurs dans la
population après la campagne d'information.
Mais peut-on conclure que la cause de cette différence est la campagne d'information ? Non, car
il s’agit d’une observation, et non d’une expérimentation; bien d’autres facteurs que la campagne
ont pu varier entre les deux prélèvements d’échantillon (il peut même s’agir d’une évolution
spontanée dans le temps, ou saisonnière, etc.).

Master de Santé Publique - 2019-2020 5


M1 - UE de biostatistiques - TD 1 - Corrigé

Vous aimerez peut-être aussi