Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Exercice 1
1. Puisque X suit une loi de χ 2 à 1 ddl, il faut utiliser la ligne ddl = 1 de la table de χ 2 .
a) Les probabilités demandées se lisent sur la première ligne de la table pour les valeurs de χ α
2
correspondantes. On obtient ainsi : P(X > 1,64) = 0,20 et P(X > 6,7) = 0,01. Une variable X suivant
une loi de χ 2 est toujours positive; on a donc |X| = X, d’où : P(|X| > 6,7) = P(X > 6,7) = 0,01.
b) Pour trouver les valeurs de a, il faut lire sur la ligne ddl = 1, les valeurs de χ α correspondant aux
2
2. a) Il faut lire cette fois sur la ligne ddl = 5. La valeur 13 n’y figurant pas, on prend la valeur la
plus proche (12,83), ce qui donne P(X > 13) ≈ 0,025.
b) La ligne ddl = 70 ne figure pas dans la table du livre. Il faut utiliser l’approximation de la loi de
χ 2 par la loi normale de moyenne µ = ddl = 70 et de variance σ 2 = 2 ddl = 140, comme cela est
X − 70
indiqué en bas de la table. Z = suit donc à peu près une loi normale centrée réduite. On en
140
⎛ 85 − 70 ⎞
déduit : P(X > 85) = P ⎜ Z > = 1,268⎟ = 0,100 .
⎝ 140 ⎠
Exercice 2
b) Si n = 100, c’est aussi une loi binomiale, mais le calcul des probabilités devient très lourd et on
peut faire une approximation par la loi normale car nP = 46 est largement supérieur à 5.
X suit donc approximativement une loi normale de moyenne µ = nP = 46 et de variance
σ 2 = nPQ = 24,84 ≈ 25 .
La proportion observée de fumeurs suit une loi normale de moyenne µ’ = P = 0,46 et de variance
PQ
σ '2 = = 0,0025 .
n
2. Pour n = 100, on utilise l’approximation par la loi normale comme cela a été dit à la question
précédente. On obtient, en se ramenant à la loi normale centrée réduite :
⎛ 0,30 − 0,46 ⎞
( )
P P0 < 0,30 = P ⎜ Z <
⎝ 0,05
( )
⎟⎠ = P Z < −3,2 = 0,0005
σ2
b) Pour que l’intervalle soit deux fois plus petit, il faut que soit deux fois plus petit, c’est-à-dire
n
que n soit quatre fois plus grand. Il faut donc un échantillon de 244 sujets.
⎣ ⎦
Ici, n-1 = 60 et la table de χ 2 donne a = 40,48 et b = 83,30.
⎡ 40,48 83,30 ⎤
On obtient donc l’intervalle : ⎢ × 6,5 ; × 6,5 ⎥ = ⎡⎣ 4,39 ; 9,02 ⎤⎦ .
⎣ 60 60 ⎦
Rappelons la condition d’application de ce calcul : distribution du nombre quotidien de cigarettes
fumées normale dans la population.
Master Santé Publique - 2019-2020 2
M1 - UE de biostatistiques - TD 2 - Corrigé
Comme ici n est supérieur à 30, on peut aussi utiliser l’approximation par la loi normale qui donne
2σ 4 2 × 6,5 2
l’intervalle de fluctuation suivant : σ 2 ± z α/2 = 6,5 ± 1,96 = ⎡⎣ 4,17 ; 8,83 ⎤⎦ .
n−1 60
Pour ce calcul, les conditions d’application sont : effectif supérieur à 30 et distribution du nombre
quotidien de cigarettes fumées normale dans la population.
Remarque : l’écart entre les intervalles de confiance calculé à l’aide des deux méthodes est dû à l’approximation
par la loi normale : le second intervalle est approché alors que le premier est exact.
Exercice 3
1. L’échantillon est petit (n < 30), mais comme la distribution du dosage suit une loi normale, on
σ2
peut calculer l’intervalle de fluctuation de la moyenne par la formule µ ± 1,96 qui donne ici :
n
34
22 ± 1,96 = ⎡19,4 ; 24,6 ⎤⎦ .
20 ⎣
3. a) Cette solution conduit à un échantillon non représentatif car les enfants venant à une
consultation de PMI n’ont pas les mêmes caractéristiques que l’ensemble des enfants de moins de
15 ans de la population. Par exemple, ils n’ont pas la même répartition de niveau social, ni la
même répartition par âge.
Lorsqu’il s’agit d’estimer un paramètre (moyenne, variance, pourcentage, …), il est essentiel
d’avoir un échantillon représentatif pour que les estimations ne soient pas biaisées. La solution
envisagée n’est donc pas acceptable. Il faut cependant noter que le fait de prendre les 100
premiers enfants venus consulter ne pose a priori pas de problème de biais en soi.
Remarques :
• Les bornes de l'intervalle de fluctuation exprimées en nombre d'enfants ne sont pas des entiers, ce qui peut
paraître curieux. Il en est ainsi parce qu’il s'agit des moyennes des nombres observés sur tous les échantillons
possibles, qui n’ont aucune raison d’être des nombres entiers. Si on veut arrondir à des entiers, ce qui peut être
plus "présentable", cela implique de modifier un peu le risque d'erreur ; l'intervalle de fluctuation n'est plus à 95%,
mais un peu plus ou un peu moins.
• Si le nombre observé n'était pas dans l'intervalle de fluctuation, deux interprétations sont possibles :
- il s'agit de fluctuations d'échantillonnage qui arrivent dans moins de 5% des cas ("on n'a pas eu de chance")
- l'échantillon n'a pas été tiré au sort comme il faut (par exemple comme en 3.a) et c'est la raison pour laquelle la
valeur observée s'écarte de ce qui est attendu.
Exercice 4
a) On ne peut pas répondre à cette question car on ne connait pas la distribution de la TAS. On
sait juste qu'elle n'est pas normale, ce qui permet seulement de savoir qu'on ne peut pas utiliser la
table de la loi normale ...
L'approximation par la loi normale ne s'applique pas car propriété concerne la moyenne calculée
sur un échantillon suffisamment grand (n ≥ 30) alors que la question porte sur les valeurs
individuelles des sujets de la population.
c) L'écart entre les 2 moyennes est 123,8 - 118,3 = 5,5. Pour savoir si cet intervalle est "normal"
(c'est-à-dire qu'il résulte de fluctuations d'échantillonnage) ou pas, il faut calculer l'intervalle de
fluctuation de la différence des deux moyennes qui donnera les limites de cette "normalité".
Les 2 échantillons étant tirés de la même population et ayant la même taille, supérieure à 30, leur
moyenne a une distribution normale dont les moyenne et variance vrai sont les mêmes : µ = 121
σ 2 280
et = = 5,6 . La différence D entre les moyennes a une distribution normale de moyenne
n 50
L'écart observé entre les moyennes des 2 échantillons étant dans l'intervalle de fluctuation, sa
valeur peut s'expliquer par les fluctuations d'échantillonnage. Elle fait donc partie des valeurs
attendues, il n'est pas surprenant d'observer un tel écart.