Vous êtes sur la page 1sur 10

Université de Garoua

Faculté de Médecine et des Sciences Biomédicales (FMSB) - Garoua


CORRIGE DES TRAVAUX DIRIGES DE
BIOSTATISTIQUE
Enseignant : Dr ATEBA NDONGO Francis
Parcours : Médecine Générale
Niveau : Licence 3

Question 1
Qu’est-ce qu’une population et qu’est-ce qu’un échantillon ?
Réponse_Q1 : La population est l’ensemble entier d’individus d’intérêt pour une étude de
recherche particulière. L’échantillon est l’ensemble spécifique d’individus sélectionnés pour
participer à l’étude. L’échantillon devrait être représentatif de la population.

Question 2
Une caractéristique qui décrit la population est appelée ?
Réponse_Q2
Paramètre

Question 3
La relation entre une population et un paramètre est la même que la relation entre un
échantillon et une…………………… ?
Réponse_Q3
Statistique

Question 4
Quelles sont les deux principales catégories des techniques statistiques ?
Réponse_Q4
Les deux catégories sont la statistique descriptive et la statistique inférentielle. Les techniques
descriptives visent à organiser, simplifier et résumer les données. Les techniques inférentielles
utilisent les données d’échantillon pour parvenir à des conclusions relatives aux populations.

Question 5
Définir brièvement le concept d’erreur d’échantillonnage
Réponse_Q5
L’erreur d’échantillonnage est l’écart entre la valeur obtenue pour une statistique
d’échantillon et la valeur du paramètre de population correspondant.

Question 6
Quels sont les deux éléments nécessaires pour qu’une étude de recherche soit une
expérience ?
Réponse_Q6
Premièrement, le chercheur doit manipuler l’une des deux variables étudiées. Deuxièmement,
toutes les autres variables susceptibles d’influencer les résultats doivent être contrôlées.
Question 7
Expliquer les deux éléments qui font la différence entre une recherche expérimentale et les
autres types de recherche.
Réponse_Q7
Les caractéristiques de distinction de la méthode expérimentale sont la manipulation et le
contrôle. Dans la méthode expérimentale, le chercheur manipule une variable et observe une
seconde variable. Toutes les autres variables sont contrôlées pour leur empêcher d’influencer
les résultats.

Question 8
La recherche expérimentale a pour but de démontrer une relation de cause à effet entre deux
variables. Comment appelle-t-on ces deux variables ?
Réponse_Q8
Le chercheur manipule la variable indépendante en changeant sa valeur pour créer deux (ou
plus de deux) conditions de traitement. La variable dépendante est ensuite mesurée pour un
groupe d’individus pour obtenir un ensemble de valeurs dans chacune des conditions de
traitement.

Question 9
Un échantillon de n = 6 données a une moyenne M = 10. Quelle est la valeur de la somme des
X ?
Réponse_Q9
Moyenne = (somme des X)/n
Donc somme des X = (n) (moyenne) = 6 x 10
Somme des X = 60.

Question 10
Dans quelles circonstances la médiane est la mesure de tendance centrale préférée au lieu de
la moyenne ?
Réponse_Q10
La médiane est utilisée au lieu de la moyenne en cas de distribution asymétrique (avec peu de
valeurs extrêmes), distribution ouverte, valeurs indéterminées ou échelle ordinale.

Question 11
Dans quelles circonstances le mode est la mesure de tendance centrale?
Réponse_Q11
Le mode est préféré lorsque les données sont mesurées sur une échelle nominale.

Question 12
Trouver la moyenne, la médiane et le mode de l’échantillon de données suivant :
3, 2, 3, 5, 4, 1, 4, 3, 2, 3
Réponse_Q12
Classement des valeurs de la distribution par ordre croissant : 1, 2, 2, 3, 3, 3, 3, 4, 4, 5
Tableau de distribution des fréquences :
X f
5 1
4 2
3 4
2 2
1 1
Pour cet échantillon, la moyenne, la médiane et le mode sont tous égaux à 3,00.

Question 13
Calculer la somme des écarts au carré (SS), la variance et l’écart-type de l’échantillon suivant
de n = 5 données : 10, 10, 10, 10, 10 (N.B. : pas de calcul nécessaire !).
Réponse_Q13
Puisqu’il n’y a pas de variabilité dans la distribution, la somme des écarts au carré (SS), la
variance et l’écart-type sont égaux à zéro.

Question 14
Trouver la proportion de la distribution normale qui est associée aux sections suivantes du
diagramme :
a. Z < +1,00 b. Z > +0,80 c. Z < -2,00 d. Z > -0,33 e. Z > -0,50
Réponse_Q14

a. En se référant à la courbe de la loi normale centrée réduite, z < +1,00 correspond


au corps de la distribution donc on utilise la colonne B
Réponse : 0,8413
b. En se référant à la courbe de la loi normale centrée réduite, z > +0,80 correspond à
l’extrémité de la distribution donc on utilise la colonne C
Réponse : 0,2119
c. Le graphique de la table normale centrée réduite est symétrique. Par conséquent,
p(z < -2,00) = p(z > +2,00) ; z > +2,00 correspondant à une extrémité de la
distribution donc on utilise la colonne C.
Réponse : 0,0228
d. Le graphique de la table normale centrée réduite est symétrique. Par conséquent,
p(z > -0,33) = p(z < +0,33) ; z < +0,33 correspond au corps de la distribution donc
on utilise la colonne B.
Réponse : 0,6293
e. Le graphique de la table normale centrée réduite est symétrique. Par conséquent,
p(z > -0,50) = p(z < +0,50) ; z < +0,50 correspond au corps de la distribution donc
on utilise la colonne B.
Réponse : 0,6915

Question 15
Pour une distribution de moyenne M = 80 et d’écart-type Sd = 10, trouver les probabilités
correspondantes suivantes :
a. P(X > 85)= ? b. p(X < 95)= ? c. p(X > 70)= ? d. p(75 < X < 100)= ?
Réponse_Q15
a. Pour X = 85, z = (85 – 80)/10 = +0,50 ; z > +0,50 correspond à une extrémité de la
distribution (colonne C)
p(X > 85)= 0,3085 (30,85%)
b. Pour X = 95, z = (95 – 80)/10 = +1,50 ; z <+1,5 correspond au corps de la
distribution (colonne B)
p(X < 95)= 0,9332 (93,32%)
c. Pour X = 70, z = (70 – 80)/10 = -1,00 ; p(z > -1,00) = p (z < +1,00) qui correspond
au corps de la distribution (colonne B)
p(X > 70)= 0,8413 (84,13%)
d. Dans le cadre de cette question, on utilise la colonne D
Pour X = 75, z = (75 – 80)/10 = -0,50 ; la proportion de valeurs comprises entre z=0
et z = -0,50 est égale à la proportion de valeurs comprises entre z=0 et z =
+0,50 (opposée de z = -0,50)
Pour X = 100, z = (100 – 80)/10 = +2,00
En se rapportant à la courbe de la loi normale centrée réduite,
p(75 < X < 100)= 0,6687 (66,87%)

Question 16
Dans quelles circonstances la distribution normale est-elle une approximation précise de la
distribution binomiale ?
Réponse_Q16
Quand pn et qn sont tous plus grands que 10.

Question 17
Une population a une moyenne = 80 et un écart-type = 12. Trouver le z-score correspondant à
chacun des échantillons suivants :
a. M = 84, n = 9 données
b. M = 74, n = 16 données
c. M = 81, n = 36 données
Réponse_Q17
Il s’agit dans cet exercice d’une population dont sont tirés plusieurs échantillons d’individus
de tailles différentes. Chaque de échantillon a une moyenne M. La population a une moyenne
m. On s’intéresse à la distribution des moyennes M d’échantillons tirés.
Il est à noter que pour la distribution des moyennes d’échantillons tirés d’une population, au
lieu de l’écart-type classique, on utilise l’erreur standard à la moyenne (de population) ; voir
la formule de calcul de l’erreur standard à la page 64 du document de cours :

Donc l’erreur standard ici varie en fonction de la taille de l’échantillon. Les échantillons de
même taille ont donc la même erreur standard.
La formule du z-score d’une distribution de moyennes d’échantillons M est :
z = (M – m)/erreur standard 

Réponses :

a. Erreur standard = 12/Ѵ9 = 4. Z-score = +1,00


b. Erreur standard = 12/Ѵ16 = 3. Z-score = -2,00
c. Erreur standard = 12/Ѵ36 = 2. Z-score = +0,50
Question 18
Qu’est-ce que l’hypothèse nulle prédit au sujet de la population ou de l’effet d’un traitement ?
Réponse_Q18
L’hypothèse nulle prédit que le traitement n’a pas d’effet ou que la population n’est pas
différente de l’échantillon.

Question 19
Définir la région critique pour un test d’hypothèse
Réponse_Q19
La région critique comprend les résultats d’échantillon qui sont très improbables d’être
obtenus si l’hypothèse nulle est vraie.

Question 20
Plus le niveau alpha diminue, plus la largeur de la région critique diminue aussi. (Vrai ou
Faux ?)
Réponse_Q20
Vrai. Plus le niveau alpha diminue, plus la région critique s’éloigne vers l’extrémité de la
distribution.

Question 21
Une faible valeur (proche de zéro) de la statistique du z-score correspond à l’évidence que
l’hypothèse nulle doit être rejetée. (Vrai ou Faux ?)
Réponse_Q21
Faux. Un z-score proche de zéro indique que les données sont favorables à l’hypothèse nulle.

Question 22
La décision de rejeter l’hypothèse nulle signifie qu’il a été démontré que le traitement n’a pas
d’effet. (Vrai ou Faux ?)
Réponse_Q22
Faux. Le rejet de l’hypothèse nulle signifie qu’on a conclu que le traitement a un effet.

Question 23
Qu’est-ce qu’une erreur de type 1 ?
Réponse_Q23
Une erreur de type 1 est le rejet d’une hypothèse nulle vraie.
Question 24
Pourquoi la conséquence d’une erreur de type 1 est-elle considérée comme étant sérieuse ?
Réponse_Q24
Une erreur de type 1 résulte souvent à un faux rapport. Un chercheur rapporte et publie un
effet de traitement qui n’existe pas.

Question 25
Si le niveau alpha est changé de 0,05 à 0,01, la probabilité d’une erreur de type 1 augmente.
(Vrai ou Faux ?)
Réponse_Q25
Faux. La probabilité d’une erreur de type 1 est alpha.

Question 26
Définir une erreur de type 2
Réponse_Q26
Une erreur de type 2 est le défaut de rejet d’une hypothèse nulle fausse. En termes d’étude de
recherche, une erreur de type 2 survient quand une étude ne parvient pas à détecter un effet de
traitement qui existe vraiment.
Question 27
Quelle situation de recherche est susceptible d’induire une erreur de type 2 ?
Réponse_Q27
Une erreur de type 2 est susceptible de survenir quand l’effet du traitement est très faible.
Dans ce cas, une étude de recherche est plus susceptible de ne pas détecter l’effet.

Question 28
Expliquer « statistiquement significatif » 
Réponse_Q28
« Significatif » veut dire que l’hypothèse nulle est rejetée (il existe une différence).
« Statistiquement significatif » veut dire que le résultat (différence) observé est plus grand que
la valeur prévue par le fait du hasard (valeur critique). Autrement dit, la différence observée
n’est pas le fait du hasard (Il est très improbable de se tromper en rejetant l’hypothèse nulle).
Cependant, le hasard correspond à l’erreur standard et quand la taille de l’échantillon est
grande, l’erreur standard peut être très petite. Dans ce cas, un effet de traitement, même,
minime peut être significatif.

Question 29
Au fur et à mesure que la puissance d’un test augmente, qu’advient-il à la probabilité d’une
erreur de type 2 ?
Réponse_Q29
Situation réelle
H0 vraie H0 fausse
Rejet de H0 Erreur de type 1 (alpha) Puissance (1 – béta)
Décision de l’investigateur
Non rejet de H0 Bonne décision (1 – alpha) Erreur de type 2 (béta)

Nota Bene : puissance = (1 – probabilité d’erreur de type 2) !!!


Plus la puissance augmente, plus la probabilité d’erreur de type 2 diminue.
Question 30
Quel est l’effet de l’augmentation de la taille d’échantillon sur la puissance ?

Réponse_Q30
Plus la taille d’échantillon augmente, plus la puissance d’un test est élevée.

Question 31
Dans quelles circonstances une statistique t est utilisée au lieu d’une statistique du z-score ?
Réponse_Q31
Une statistique t est utilisée au lieu du z-score lorsque la variance et l’écart-type de la
population ne sont pas connus.

Question 32
Pour conduire un test d’hypothèse avec une statistique du z-score, on doit connaître la
variance et l’écart-type de la population de données. (Vrai ou Faux ?)
Réponse_Q32
Vrai.

Question 33
En général, une distribution des statistiques t est plus étalée que la distribution normale
standardisée. (Vrai ou Faux ?)
Réponse_Q33
Vrai.
Question 34
Un échantillon de n = 15 données génère une statistique t avec un nombre de degrés de liberté
= 16. (Vrai ou Faux ?)
Réponse_Q34
df = n – 1
Faux, avec n = 15, la valeur du nombre de degrés de libertés est 14. On note t (14)

Question 35
Décrire les caractéristiques générales d’une étude de recherche sur des mesures indépendantes
Réponse_Q33
Une étude de mesures indépendantes nécessite un échantillon séparé pour chacune des
populations ou chacun des traitements à comparer. Une statistique t de mesures indépendantes
est appropriée lorsqu’un chercheur a deux échantillons et veut utiliser la différence de
moyenne d’échantillon pour tester les hypothèses concernant la différence moyenne de
populations.

Question 36
Une statistique t de mesures indépendantes est utilisée pour évaluer la différence moyenne
entre deux traitements utilisant un échantillon de n = 10 dans un traitement et un échantillon
de n = 15 dans l’autre traitement. Quel est la valeur du nombre de degrés de libertés pour le
test t ?
Réponse_Q36
La statistique t a df = df1 + df2 = 9 + 14 = 23 degrés de liberté. On note t (23).
Question 37
Le premier échantillon d’une étude de recherche sur des mesures indépendantes comprend n=
5 données avec SS = 40. Le second échantillon a n = 5 données avec SS = 32.
a. Calculer la variance pour chacun des deux échantillon
Réponse_Q37_a
Variance de population estimée à partir de SS = SS/(n -1)
- Premier échantillon :
df1 = n1 - 1 = 5 – 1= 4
Variance1 = SS1/(n1 – 1) = SS1/df1 = 40/4 = 10
- Deuxième échantillon :
df2 = n2 - 1 = 5 – 1 = 4
Variance2 = SS2/(n2 – 1) = SS2/df2 = 32/4 = 8
b Calculer la variance pondérée pour les deux échantillons. (Puisque les deux échantillons ont
exactement la même taille, la variance pondérée devrait être égale à la moyenne arithmétique
des variances des deux échantillons)
Réponse_Q37_b
SS = (n1.Var1 + n2.Var2)/( n1 + n2) = (5x 10 + 5x8))/10= (10 + 8)/2 = 18/2 = 9
La variance pondérée est 9 (exactement à mi-chemin entre 10 et 8).

Question 38
Le premier échantillon d’une étude de recherche sur des mesures indépendantes comprend n =
5 données avec SS = 40. Le second échantillon a n = 7 données avec SS = 48.
a. Calculer la variance pour chacun des deux échantillons
Réponse_Q38_a
Le premier échantillon a une variance de 10 et le second échantillon a une variance de 8.
b Calculer la variance pondérée pour les deux échantillons. (Puisque les deux échantillons
n’ont pas la même taille, la variance pondérée ne correspond pas à la moyenne arithmétique
des variances des deux échantillons. Puisque le plus grand échantillon a plus de poids, la
variance pondérée est plus proche de la variance dudit plus grand échantillon)
Réponse_Q38_b
La variance pondérée est 8,8 (plus proche de la variance du plus grand échantillon).

Question 39
Un chercheur utilise le test du chi-carré d’adéquation avec un échantillon de n = 120
personnes pour déterminer s’il existe des préférences parmi quatre marques de chocolat.
Quelle est la valeur du nombre de degrés de libertés de la statistique du chi-carré ?
Réponse_Q39
Nombre de catégories = 4 (marques de chocolat à choisir)
df = C – 1 = 3
Avec 4 catégories, df = 3. On note χ .
2
(3)

Question 40
Est-il possible que les fréquences attendues soient des fractions ou des valeurs
décimales (dans le cadre du calcul de la statistique du chi-carré)?
Réponse_Q40
Oui. Les fréquences attendues sont calculées et pourraient être des fractions ou des nombres
décimaux.

Question 41
Un chercheur a développé trois modèles logiciels différents. Un échantillon de n = 60
participants est obtenu et chaque individu teste tous les trois modèles puis identifie sa
préférence. La distribution de fréquences des préférences est la suivante :

Modèle A Modèle B Modèle C n


23 12 25 60

Utiliser un test du chi-carré d’adéquation avec un niveau alpha = 0,05 pour déterminer s’il
existe des préférences significatives parmi les trois modèles.

Réponse_Q41
Sous H0 : p = 1/C et fe = np = n/C = n/3
n/3 = 60/3 = 20
df = C – 1 = 2

L’hypothèse nulle (H0) déclare qu’il n’y a pas de préférences ; un tiers de la population
préfèrerait chaque modèle.
Avec df = 2, la valeur critique est 5,99. Les fréquences attendues sont toutes égales à 20, et la
statistique du chi-carré est 4,90. Non rejet de l’hypothèse nulle. Il n’y a pas de préférences
significatives parmi les modèles logiciels.

Question 42
Un enseignant a demandé aux élèves d’évaluer des livres pour déterminer s’il existe des
préférences. A cet effet, les étudiants ont été séparés en deux groupes : premier cycle et
deuxième cycle. Les données ci-dessous indiquent-elles que la distribution des préférences
pour les élèves du premier cycle est significativement différente de la distribution des
préférences pour les élèves du second cycle ? (Niveau alpha = 0,05)

Livre 1 Livre 2 Livre 3


Premier cycle 17 31 12 60
Deuxième cycle 35 10 15 60
52 41 27
Réponse_Q42

fe = fr.fc/n
- Cellule « Premier cycle/Livre1 » : fe = 60x52/120 = 26,0
- Cellule « Premier cycle/Livre2 » : fe = 60x41/120 = 20,5
- Cellule « Premier cycle/Livre3 » : fe = 60x27/120 = 13,5
- Cellule « Deuxième cycle/Livre2 » : fe = 60x52/120 = 26,0
- Cellule « Deuxième cycle/Livre2 » : fe = 60x41/120 = 20,5
- Cellule « Deuxième cycle/Livre2 » : fe = 60x27/120 = 13,5

Les fréquences attendues dans le tableau de distribution des fréquences sont  entre parenthèses
et en caractère gras:

Livre 1 Livre 2 Livre 3


Premier cycle 17 (26,0) 31 (20,5) 12 (13,5) 60
Deuxième cycle 35 (26,0) 10 (20,5) 15 (13,5) 60
52 41 27

χ2 = Σ ((f0 – fe)2/ fe)


χ2 = (17 – 26,0)2/26,0 + (31 – 20,5)2/20,5 + (12 – 13,5)2/13,5 + (17 – 26,0)2/26,0 +
(31 – 20,5)2/20,5 + (12 – 13,5)2/13,5
χ2 = 17,32

df = (R – 1) (C – 1)
df = (2 – 1) (3 – 1) = 1x2 = 2

L’hypothèse nulle déclare que la distribution des préférences est la même dans les pour les
deux groupes d’élèves (les deux variables sont indépendantes). Avec df = 2, la valeur critique
est 5,99.
Chi-carré = 17,32. Rejet de H0.

Vous aimerez peut-être aussi