Vous êtes sur la page 1sur 24

TRAVAUX DIRIGES DE BIOSTATISTIQUES L3

Dr. Nguefack-Tsagué

Exercice 1

Données : N=7 personnes ; Nombre de visite 0, 2, 1, 3, 1, 3, 5

1. nombre moyen et l’écart type du nombre de visites :


 nombre moyen

AN :

 l’écart type du nombre de visites :

2. Dans cette population


a) s échantillons de taille 2 qu’on peut extraire de cette population avec remise :
(0 ; 2),(0 ; 1),(0 ; 3),(0 ; 1),(0 ; 3),(0 ;5)
(2 ; 1),(2 ; 3),(2 ; 1),(2 ; 3),(2 ; 5)
(1 ; 3),(1 ; 1),(1 ; 3),(1 ; 5)
(3 ; 1),(3 ; 3),(3 ; 5)
(1 ; 3),(1 ; 5)
(3 ; 5)
b) moyenne des écart-types des échantillons

1
𝑋̅ = ∑2 𝑥𝔦 ; 𝑠 =
𝑛−1 𝑛−1
1
√ ∑2 (𝑥𝔦
𝑛−1 𝔦=1
− 𝑋̅)2

APPLICATIONS NUMERIQUES

Pour l’échantillon (0 ; 2),𝑋̅ 1=2visites et S1=4 visites


Pour l’échantillon (0 ; 1), 𝑋̅ 2=1 visites et S2=5 visites
Pour l’échantillon (0 ; 3), 𝑋̅ 3=3 visites et S3=5 visites
Pour l’échantillon (0 ; 1), 𝑋̅ 4=1 visites et S4=5 visites
Pour l’échantillon (0 ; 3), =3 visites et S5=5 visites
Pour l’échantillon (0 ; 5) 𝑋̅ 6=4 visites et S6=13 visites
Pour l’échantillon (2 ; 1), 𝑋̅ 7=3 visites et S7=4 visites
Pour l’échantillon (2 ; 3), 𝑋̅ 8=5 visites et S8=1 visites
Pour l’échantillon (2 ; 1), 𝑋̅9=3 visites et S9=1 visites
Pour l’échantillon (2 ; 3), 𝑋̅10=5 visites et S10=1 visites
Pour l’échantillon (2 ; 5) 𝑋̅11=7 visites et S11=9 visites
Pour l’échantillon (1 ; 3), 12=4 visites et S12=1 visites
Pour l’échantillon (1 ; 1), 𝑋̅13=2 visites et S13=1 visites
Pour l’échantillon (1 ; 3), 14=4 visites et S14=1 visites
Pour l’échantillon (1 ; 5) 𝑋̅ 15=6 visites et S15=9 visites
Pour l’échantillon (3 ; 1), 𝑋̅ 16=4 visites et S16=2 visites
Pour l’échantillon (3 ; 3), 𝑋̅ 17=6 visites et S17=2 visites
Pour l’échantillon (3 ; 5) 𝑋̅ 18=8 visites et S18=10 visites
Pour l’échantillon (1 ; 3), 𝑋̅ 19=4 visites et S19=2 visites
Pour l’échantillon (1 ; 5) 𝑋̅ 0=6 visites et S20=10 visites
Pour l’échantillon (3 ; 5) 𝑋̅ 21=8 visites et S21=10 visites

c) moyenne et l’écart-type de la distribution d’échantillonnage des moyennes


1 21 1
𝑚= ∑ 𝑋̅ 𝔦; 𝑒𝑡 𝑆𝑚 = √𝑛 ∑21 ̅
𝔦=1(𝑋 − 𝑚)
2
𝑛 𝑖=1
Applications numériques :

Exercice 2
1. minimum, le maximum, le premier quartile, le troisième quartile, la
médiane, la moyenne, la variance, les deux modes et l’étendu.
Minimum : 650 cas
Maximum : 10701 cas
Premier quartile : Q1=850cas
Troisième quartile : Q3= 980cas
Médiane : Q2= 940 CAS
Moyenne :
 AN :

Variance :
 AN : S² 13537 cas²
Les deux modes : mode1=980cas et mode2=1000cas
Étendue: Maximum-Minimum=1070-650 ; soit E= 420 cas

2. Interprétation de la moyenne, la médiane, les modes, Q1 et Q3.


• Interprétation de la moyenne : pour les 20 villes recensées, il existe en moyenne 958 cas de
polio sauvage
• Interprétation de la médiane : dans les 20 villes, recensées, 50% des villes ont un nombre de
cas inférieur à 940 et 50% des villes ont un nombre de cas supérieur à 940
• Interprétation de Q1 : 25% des villes comportent moins de 850 cas de polio et 75% de ville
ont plus de 850 cas
Interprétation de Q3 : 75% des villes comportent moins de 980 cas de polio et 25% de ville ont plus de
980 cas

3. intervalle interquartile et l’interprétation :


[Q1 ; Q3]= [850 ; 980]
Interprétation : 50% des villes ont un nombre de cas de polio sauvage compris entre 850 et
980 cas
4. Comparons la moyenne, les modes et la médiane : 940<958<980 et 1000
La distribution n’est donc pas symétrique car 940<958<980 et 1000
5. La distribution ne suit pas une loi normale car :
 La moyenne, les modes et la médiane sont différents
 La distribution comporte deux modes
 Le coefficient d’asymétrie est différent de 1
 La distribution n’est pas symétrique

Exercice 3

Données : échantillon de taille n=31 villes

Série statistique du nombre d’incidence par ville en 2 mois :


80,63,51,61,60,73,73,61,81,50,52,46,98,85,62,47,56,57,84,49,49,62,72,85,78,74,66,64,77,83,70.

a) Histogramme de la distribution des nombres de nouveau cas pour une amplitude de 10 :

Intervalle des nouveau [40;50[ [50;60[ [60;70[ [70;80[ [80;90[ [90;100] TOTAL
cas en 2 mois
Effectifs (xi) 3 6 8 7 6 1 31
Centres (ci) des classes 45 55 65 75 85 95 /
xici 135 330 520 525 510 95 2115
5
12

11

10

0
20 26 30 32 34 36 40 48

b) Calculons la moyenne en utilisant les données (b1) individuelles et (b2) groupées :


 moyenne des données (b1)
31
1
𝑋̅𝑏1 = ∑ 𝑥𝔦
𝑛−1
𝔦=1
31
∑ 𝑥𝔦 = 80 + 63 + 51 + 61 + 60 + 2 ∗ 73 + 61 + 81 + 50 + 52 + 46
𝔦=1
+ 98 + 85 + 62 + 47 + 56 + 57 + 84 + 2 ∗ 49 + 62 + 72
+ 85 + 78 + 74 + 66 + 64 + 77 + 83 + 70 = 2069
2069
𝑋̅𝑏1 = = 68,96667
31 − 1
Donc 𝑋̅𝑏1 ≈ 69 𝑛𝑜𝑢𝑣𝑒𝑎𝑢𝑥 𝑐𝑎𝑠 𝑒𝑛 2 𝑚𝑜𝑖𝑠

1
. 𝑋̅𝑏2 = ∑31
𝔦=1 𝑥𝔦𝑐𝔦 ou ci est le centre de chaque classe
𝑛−1

AN :

Donc

c) Déterminons les quartiles Q1, Q2, Q3 et interprétons.


Série statistique rangée par ordre croissant d’incidence de l’hépatite B :
46 ;47 ;49 ;49 ;50 ;51 ;52 ;56 ;57 ;60 ;61 ;61 ;62 ;62 ;63 ;64 ;66 ;70 ;72 ;73 ;73 ;74 ;77 ;78 ;80
;81 ;83 ;84 ;85 ;85 ;98
 Premier quartile Q1 : 56 cas nouveau, c'est-à-dire que, 25% des villes ont une
incidence d’hépatite en 2 mois inférieure à 56 et 75%, une incidence supérieure à 56
en 2 mois
 Deuxième quartile Q2 : 64 cas nouveau, c'est-à-dire que, 50% des villes ont une
incidence d’hépatite en 2 mois inférieure à 64 et 50%, une incidence supérieure à 64
en 2 mois
 Troisième quartile Q3 : 78 cas nouveau, c'est-à-dire que, 75% des villes ont une
incidence d’hépatite en 2 mois inférieure à 78 et 25%, une incidence supérieure à 78
en 2 mois
d) Déterminons l’intervalle interquartile et l’intervalle interquartile relatif.  intervalle
interquartile :
[Q1 ; Q3] = [56 ; 78] nouveau cas 
intervalle interquartile relatif.

Exercice 4 Données
:
T+ l’événement « test positif » et T- l’événement « test négatif ».
M+ l’événement « patient malade » et M- l’événement « pas malade ».

1. définitions :
 sensibilité : c’est la probabilité pour qu’une personne malade soit testée positif
 spécificité : c’est la probabilité pour qu’une personne saine soit testée négatif
 valeur prédictive positive : probabilité pour qu’une personne testée positive soit réellement
malade
 valeur prédictive négative : probabilité pour qu’une personne testée négative soit réellement
saine
2. valeurs idéales pour ces valeurs :
Sensibilité doit être égale à 1 c'est-à-dire que, P (M+/T+) =1
Spécificité doit être égale à 1 c'est-à-dire que, P (M-/T-) =1
3.
 Parmi ces valeurs, celles qui sont en principe d’une grande utilité pour un médecin sont les
valeurs prédictives positives
 Justification : les valeurs prédictives positives permettent au médecin de savoir si le patient
souffre réellement de l’affection qu’il cherche à diagnostiquer ou non.
 en pratique ces valeurs ne sont en général pas disponibles, car elles sont fonctions de la
proportion de malade et de non-malades (prévalence de la maladie), lesquelles varient d’un
centre hospitalier à un autre pour une même maladie ; ce qui fait qu’elles sont moins utilisées
en pratique bien qu’elles soient pertinentes 4. la courbe ROC (Receiver Operating
Characteristic) :
 but de la courbe :
 déterminer la valeur seuil du résultat des examens pour laquelle la Sensibilité et la
Spécificité du test sont les plus fortes possibles
 déterminer un seuil qui sépare les valeurs pathologiques et les valeurs physiologiques des
résultats du test
 le point idéal pour la courbe ROC (Receiver Operating Characteristic) est le point de
coordonnée (1-Se ; Se) = (0 ; 1) ; car pour 1-Se = 0, Sp est égale à 1
5. données : taille de l’échantillon n= 52119 femmes valeurs estimées de : Sensibilité, Spécificité,
Valeur Prédictive Positive et Valeur Prédictive Négative et Interprétations Tableau de
contingence :
M+ M- TOTAL
T+ 156 1234 1390
T- 78 50651 50729
TOTAL 234 51885 52119

 Sensibilité :
 Spécificité :
 Valeur prédictive positive :
 Valeur prédictive négative :
Exercice 5

=1052348FCFA et =543838FCFA2

1. Estimation du salaire journalier moyen d’un pharmacien ainsi que l’écart-type :


 Salaire moyen : ; AN : 10216,97 FCFA
Soit un salaire moyen de
 Ecart- ; AN : FCFA

Soit un écart-type de : S 73 FCFA


2. coefficient de variation du salaire :
𝑠
𝑐𝑣 =
𝑋̅
72.663474886
AN : 𝐶𝑉 = 10216,97 = 0,007112038
Soit un coefficient de variation CV
3. intervalle de confiance à 95% et 97% du salaire moyen et interprétation : 
intervalle de confiance à 95% du salaire moyen :
; où Z= 1,96 selon la table de la loi normale centrée réduite
; 10231] FCFA

Interprétation : on est sûr à 95% que le salaire moyen des pharmaciens se situe dans l’intervalle de
confiance avec un risque d’erreur de 5%

 intervalle de confiance à 97% du salaire moyen :


; où Z= 2,170 selon la table de la loi normale centrée réduite
FCFA

Interprétation : on est sûr à 97% que le salaire moyen des pharmaciens se situe dans l’intervalle avec
un risque d’erreur de 3%

Exercice 6

Classe Effectif (xi) Centre (ci) xici


[20-26[ 5 23 115
[26-30[ 7 28 196
[30-32[ 9 31 279
[32-34[ 8 33 264
[34-36[ 11 35 385
[36-40[ 8 38 304
[40-48[ 2 44 88
Total 50 / 1623
a) concentration moyenne et la classe modale.  concentration moyenne

1
.𝑋̅ = ∑50 𝑐𝔦𝑥𝔦
𝑛−1 𝔦=1

AN : mg/l
La classe modale est [34-36[

b) Il est nécessaire d’ajuster les effectifs parce qu’ils n’ont pas les mêmes amplitudes
c) Tableau statistique et histogramme non ajusté.

Classe Effectif (xi)


[20-26[ 5
[26-30[ 7
[30-32[ 9
[32-34[ 8
[34-36[ 11
[36-40[ 8
[40-48[ 2
Total 50
9
8
7
6
5
4
3
2
1
0
40 50 60 70 80 90 100

d) les deux grandeurs qui permettent de comparer cette distribution à la distribution normale
sont : la moyenne ; l’écart-type

Exercice 7

Données : taille de l’échantillon : n=70 personnes ; nombre de diabétiques : 9 ; soit une prévalence de
9 /70

Intervalle de confiance à 95% de la vraie proportion des diabétiques au sein de la population et


interprétation :

Interprétation : on est sûr à 95% que, la proportion vraie des diabétiques est comprise dans l’intervalle
avec un risque d’erreur de 5%.

Exercice 8

Données : µ= quantité moyenne de soja produite ; son écart type est σ=1,3

X la quantité de soja produite sur une exploitation.

Taille de l’échantillon = 175 exploitations ; moyenne ̅= 23,56 tonnes.


1. une estimation ponctuelle de la vraie moyenne µ
La moyenne de production des 175 exploitations est un reflet de la production moyenne µ ;
donc une estimation ponctuelle de la vraie moyenne µ est : m= 23,56 tonnes
2. intervalle de confiance à 95% et 98% pour µ et interpréter.
 intervalle de confiance à 95% :
oui car σ est considéré comme l’écart type de la population23

23,56 tonnes

Interprétation : on est sûr à 95% que, la production moyenne de soja par l’ensemble des exploitations
est compris entre avec un risque d’erreur de 5%

 intervalle de confiance à 98% :

23,56

Interprétation : on est sûr à 98% que, la production moyenne de soja par l’ensemble des exploitations
est compris entre avec un risque d’erreur de 2%

3. pour variance empirique : S²=2,2 construisons l’intervalle de confiance à 95%.

Car S est pour l’échantillon

Exercice 9 :

Données : Moyenne théorique : µ = 3400 heures

Taille de l’échantillon n = 90 ampoules ; de moyennes ; écart-type empirique


S=97heures

On a utiliser le Z score car comparaison de deux moyennes et taille échantillon > 30 ; moyenne de
l’échantillon à la moyenne théorique

 Vérifions si le fabricant a raison ; pour cela, procédons par un test de comparaison des
moyennes :
• Ho : la durée moyennes des ampoules de l’échantillon n’est pas différente de la
moyenne théorique. C'est-à-dire :
• H1 bilatérale : la durée moyenne des ampoules de l’échantillon est différente de la
moyenne théorique. C'est-à-dire
𝑋̅−𝜇
.𝑍𝑜 = 𝜎
Avec heures

AN :
Zo>Z donc on ne rejette pas Hok c'est-à-dire les durée moyenne sont égales
Donc cette différence est due au hasard
Exercice 10

Comparaison de deux moyennes d’échantillon indépendant Z score car taille > 30

Données : femme de poids normal : n1=323 m1=6.6 ;S1=2.6Femme obèses : n2=211 m2= 4.3 ; S2 = 3.4

• Ho : le groupe de femmes obèses a un taux de corticoïdes urinaires égale à celui des femmes
de poids normal c'est-à-dire que : m1=m2
• H1 : le groupe de femmes obèses a un taux de corticoïdes urinaires inférieur à celui des
femmes de poids normal c'est-à-dire que : m1<m2
𝑚1−𝑚2
𝑍𝑜 = 𝑆𝑑
Avec ; soit

AN : ; Zo>Z donc on rejette Ho

CONCLUSION : on peut affirmer que le groupe de femmes obèses a un taux de corticoïdes urinaires
inférieur à celui des femmes de poids normal

Exercice 11

Données :

A B TOTAL
Occupés 650(E1=652.4) 399(E2=396.4) 1049
Non-occupés 100(E3=13.02) 57(E4=7.4) 157
TOTAL 750 456 1206

Test du chi2 car ces sont les proportions et dans ce cas c’est le cas de chi2 d’homogénéité
1. intervalle de confiance à 95% pour le taux d’occupation dans chaque hôpital.
 HOPITAL A :

 HOPITAL B :
2.
• Ho : il n’existe pas de différence entre les taux d’occupation dans les deux
hôpitaux

• H1 : il existe une différence entre les taux d’occupation

AN : 913.5 X²o > X² donc on rejette l’hypothèse nulle c’est à dire que il existe une
différence significative entre les deux taux d’occupations.

EXERCICE 12
r=0,67 ; 76 hommes
Testons ρ = 0 contre ρ≠0 au seuil de 0,02, puis à 0,05
 Au seuil de 0,02 :
Ho : ρ = 0 ; il n’existe pas de corrélation entre l’âge et la tension artérielle

H1 bilatéral : ρ≠0 ; il existe une corrélation entre l’âge et la tension artérielle

; t=2.390

T<t donc on rejette Ho c'est-à-dire que la tension artérielle dépend de l’âge


 Au seuil de 0.05 : t=1.980
Ho : ρ = 0 ; il n’existe pas de corrélation entre l’âge et la tension artérielle
H1 bilatéral : ρ≠0 ; il existe une corrélation entre l’âge et la tension artérielle

; T<t donc on ne rejette pas Ho

Oi Fi(pop réf.) ei=284xfi


A 65 25 71
B 67 50 142
AB 152 25 71
TOTAL 284 100 284

• Ho : la distribution suit la loi de Mendel


• H1 : la distribution ne suit pas la loi de Mendel

Xo²=

Pour ddl=2, la valeur de X² pour 5% est de 5.991<132.5 donc on ne rejette pas Ho. Donc
ces donnée respectent la loi de mendel
EXERCICE 14

1. Estimation de la proportion des unions persistantes pour chacun de ces lieux :


RURAL : 287/305 = 0.94
PETITE VILLE : 1124/1213 =0.93
GRANDE VILLE : 2081/2346 = 0.89
2. un intervalle de confiance à 95% de chaque proportion et les interpréter
%

 rurale : on est sûr à 95% que la proportion


vraie d’union persistantes en zone rurale est compris dans l’intervalle avec un
risque d’erreur de 5%
 petite-ville : on est sûr à 95% que la proportion

vraie d’unions persistantes en zone rurale est compris dans l’intervalle avec un
risque d’erreur de 5%

 ville : on est sûr à 95% que la proportion


vraie d’unions persistantes en zone rurale est compris dans l’intervalle avec un
risque d’erreur de 5%
3. test d’indépendance :
• Ho : la pérennité du mariage est indépendant du lieu de résidence
• H1 : la pérennité du mariage est dépendant du lieu de résidence
X²o
X² = 5.991 pour ddl=2
X²o>X² donc on rejette Ho, c'est-à-dire que la pérennité du mariage est dépendant du lieu de
résidence

EXERCICE 15

Données : n= 100 semences ; m1= 8.5cm ; m2= 8.8cm ; Sd=1


• Ho : la hauteur de la plantes est améliorée par un sol enrichi
• H1 : la hauteur de la plante n’est pas améliorée par un sol enrichi

Zo <Z5% ; donc, on ne rejette pas l’hypothèse nulle ; c’est-à-dire que la hauteur de la plante
est améliorée par un sol enrichi ; donc il est bénéfique pour la fabrication du médicament, de planter la
plante dans un sol enrichi

EXERCICE 16
1. probabilités jointes
ANATOMIE

Bonne note Note moyenne Mauvaise note total


Bonne note P1=56/528=0.1 P2=71/528=0.13 P3=12/528=0.02
Note moyenne P4=47/528=0.09 P5=163/528=0.31 P6=38/528=0.07
PHYSIOLOGIE Mauvaise note P7=14/528=0.03 P8=42/528=0.08 P9=85/528=0.16
total

2. probabilités conditionnelles
Probabilité (bonne note anatomie/bonne note physiologie)= 56/139
Probabilité (bonne note anatomie/note moyenne physiologie)=47/248
Probabilité (bonne note anatomie/ mauvaise note physiologie)=14/141
Probabilité (note moyenne anatomie/ bonne note physiologie)=71/139
Probabilité (note moyenne anatomie/ note moyenne physiologie)=163/248
Probabilité (note moyenne anatomie/mauvaise note physiologie)=42/141 Probabilité
(mauvaise note anatomie/bonne note physiologie)=12/139
Probabilité (mauvaise note anatomie/note moyenne physiologie)=38/248
Probabilité (mauvaise note anatomie/mauvaise note physiologie)=85/141
Probabilité (bonne note physiologie/bonne note anatomie)=56/117
Probabilité (bonne note physiologie/note moyenne anatomie)=71/276
Probabilité (bonne note physiologie / mauvaise note anatomie)=12/135
Probabilité (note moyenne physiologie/ bonne note anatomie)=47/117
Probabilité (note moyenne physiologie / note moyenne anatomie)=163/276
Probabilité (note moyenne physiologie / mauvaise note anatomie)=38/135 Probabilité
(mauvaise note physiologie / bonne note anatomie) =14/117
Probabilité (mauvaise note physiologie / note moyenne anatomie)=42/276 Probabilité
(mauvaise note physiologie / mauvaise note anatomie)=85/135
3. probabilités marginales :

4. Existe-t-il une relation entre les deux notes ?


Test d’indépendance :
Ho : les deux notes sont indépendantes
H1 : les deux notes sont liées

X²o>X² ; donc on rejette Ho donc les deux notes sont liées

B) Exercice de synthèse
Exercice 17
• n =20 femmes
• groupe 1 ont reçu le nouveau médicament
• groupe 2 ont reçu le meilleur médicament déjà existant sur le marché
1. principaux facteurs qui auraient été pris en compte pour obtenir la taille d’échantillon de 20 :

Le nombre de patients devant participer à l'étude est calculé en tenant compte de la variabilité du critère
de jugement, de la différence attendue entre les résultats des deux traitements comparés et des risques
statistiques choisis.
2. moyenne, la médiane, le 1er et 3ème quartiles et la variance pour chaque groupe.  Groupe 1 :
; soit

; soit
er e
1 quartile : Q1 = 11 3
quartile : Q3= 17.2  Dans le
groupe 2 :
; soit
; soit
1er quartile : Q1 = 8.8
3e quartile : Q3= 10.9
2.1. Le groupes est plus dispersé est le groupe1 ; car
2.2. interprétation à chaque valeur des statistiques descriptives du groupe 1.
 L’efficacité moyenne du nouveau médicament est de 13.74
 25% des femmes ont une réponse d’efficacité inférieure à 11 et 75% , une réponse
d’efficacité supérieure à 11
 Le nouveau médicament à une efficacité inférieure à 17.2 chez 75% des femmes et
supérieure à 17.2 chez 25% des femmes
3. Ho : les valeurs en fer dans les groupes 1 & 2 suivent une loi normale H1 : les valeurs en fer dans
les groupes 1 & 2 ne suivent pas une loi normale
On a : valeur-P1= 0.97>0.05 ; valeur-P2= 0,94>0.05 donc on ne rejette pas Ho c'est-à-dire que, les
valeurs en fer dans les deux groupes suivent une loin normale
4. Soit m1 ; la moyenne du groupe 1 et m2, la moyenne du groupe2 :
• Ho : m1=m2
• H1 : m1est différent de m2
Proposition de test et justifications :
• Test de student : car les données suivent la loi normale ; de plus n1 et n2 sont inférieur à 30
• Test des intervalles de confiance
• Test avec la valeur-P
5. Calcul de valeur-T statistique :
(𝟏𝟎−𝟏)𝟏𝟑,𝟓𝟓+ (𝟏𝟔−𝟏)𝟏𝟎,𝟒𝟓
𝑺𝟐 = ; Soit S²=13,56
𝟏𝟖

; Soit Sd= 1,66

; Soit T= 1,93
Avec ddl= n1+n2-2=18
; Donc on ne rejette pas Ho

5.1. Valeur P=0,0445<0,05 ; donc on rejette Ho


5.2. Intervalle de confiance :

; soit IC=[-0,28 ; 6,7]


Interprétation : 0 appartient à IC donc Ho n’est pas rejetée

5.3. Différence des moyennes : m1-m2= 3.2 ; laquelle appartient à l’intervalle de confiance
 Pour un test de WILCOXON de Valeur-P = 0,0524 on peut dire que :
• Ho : dispersion des deux tests est comparable
• H1 : dispersion des deux tests n’est pas comparable
• Or ; Valeur-P = 0,0524>0,05 donc : on ne rejette pas Ho
 Conditions d’application puis les avantages et les inconvénients des tests
paramétriques et des tests non paramétriques.
• Avantages : Les tests non paramétriques ne nécessitent pas d’hypothèse sur la
distribution
• Inconvénients : les tests paramétriques nécessitent des hypothèses sur la distribution

Exercice 18

1. Formulation de l’hypothèse nulle et l’hypothèse alternative


• Ho : la prise du vaccin ne dépend pas de l’âge
• H1 : la prise du vaccin dépend de l’âge
2. Valeur-P pour le test est 0. P<0,05 donc on rejette Ho d’où la prise du vaccin dépend de l’âge
Décision : decision est de rejeter Ho
3. nombre de degrés : Ddl= (2-1) (3-1)
Fractiles de X : X (6,0.01)=0.872, X (3,0.01)=0.115, X (2,0.01)=0.02 Décision
au seuil de 1% :
X²= 0,21 ; D=45,4224<9,01=X² donc rejet de Ho. D’où la prise doit être fonction de l’âge
4. corrélation entre âge et poids : 0,78 IC= [0.29, 0.90]. on a 0  Ic du coefficient corrélation 
 une correlation comme le signe du coefficient est positif  la corrélation est positive entre
l’age et le poids
Une Valeur-P = 0.003
• Ho : pas de corrélation entre âge et poids
• H1 : corrélation entre âge et poids
Or : P<0,05 ; 0 appartient à IC donc on rejette Ho ; et on conclut que, la vaccination doit être
fonction de l’âge.
Il existe une corrélation entre âge et poids

Exercice 19
1. Formulation de l’hypothèse nulle et de l’hypothèse alternative.
Ho : la prévalence cadre avec la norme de 4% fixée par l’Organisation Mondiale de la
Santé (OMS).
H1 : la prévalence ne cadre pas avec la norme de 4% fixée par l’Organisation Mondiale
de la Santé (OMS).
2. trois (3) critères statistiques qui permettront de choisir une de ces deux estimations
• Biais ; variance ; erreur quadratique moyenne
• La plus importante est le biais
3. P=5,5%
3.1. Trois méthodes permettant de prendre la décision :
Intervalle de confiance, valeur-P ; chi-2
3.2. Un intervalle de confiance à 95% donne [3,6% ; 7,4%].
Interprétation : on a 95% de certitude que, la vraie valeur de la prévalence est
comprise dans l’intervalle [3,6% ; 7,4%] avec un risque d’erreur de 5%

Autres interprétation :Comme 4 appartient Ic et que l’intervalle de confiance et que Ic


à 95% donc il y’a de forte chance que cette prévalence cadre avec OMS : Ho accepte

CONCLUSION : la valeur 0 n’appartenant pas l’intervalle de confiance ; on rejette


l’hypothèse nul ; donc: la prévalence cadre avec la norme de 4% fixée par
l’Organisation Mondiale de la Santé (OMS).

Exercice 20
1. l’hypothèse nulle et l’hypothèse
alternative.
Ho : les deux traitements ont même efficacité
H1 : les deux traitements n’ont pas la même efficacité
2. test de décision : test de student.
car comparaison moyenne et
taille échantillon < 30
3. moyenne dans chaque groupe :
m1 ; soit m1=0,99 m2

; soit m2=1,91

4. variance empirique de chaque groupe :


S1=0,36

S2= 1,3

5. Le calcul de la valeur-P donne 0.01747.


P<0,05 donc, on rejette l’hypothèse nulle ; donc, les deux traitements n’ont pas la
même efficacité
6. intervalle de confiance à 95% pour la différence

; soit Sd=0.91

; Avec

Interprétation : la vraie valeur se trouve dans cet intervalle de confiance avec un


risque d’erreur de 5% 0 appartient Ic  on ne rejette pas Ho
7. Calculons la statistique T pour la comparaison des deux moyennes.
8. nombre de degrés de liberté : ddl =n1+n2-2=18

T<t on ne rejette pas Ho


Conclusion au risque de 5% : les deux traitements ont même efficacité
9. puisqu’il s’agit de comparer plus de 2 échantillons on utilise le test de Chi²

Exercice 21

P(M+)=1/2000 (soit 0,000500)


n =3 974 000 habitants, M+ =
2001 personnes Valeur-P=0,98.
1. intervalle de confiance à 95% de la vraie proportion :

2. conversion :
Prévalence :
Intervalle de confiance : 𝐼𝐶 = [48,1463 ; 52,6676]°/0000
3. hypothèse nulle et l’hypothèse alternative.

Ho : le Syndrome de Pallister-Killian (Tétrasomie 12p) n’est pas une maladie

rare

H1 : Syndrome de Pallister-Killian (Tétrasomie 12p) est une maladie rare

4. test statistique pour ces hypothèses.


Proposition : chi² de conformité
Description : sert à comparer une distribution connue dans une population ou par
rapport à une distribution théorique
5. conclusions :
 sur P-value
P=0,98> 0,05 ; Ho n’est pas rejeter syndrome par maladie rare
 sur IC : on est sûr à 95% que la proportion vrai est contenue dans cet IC.
Mais on ne peut pas conclure car même si proportion appartient à 95% on ne peut
pas dire si prévalence < 1/2000

Exercice 22

Données : valeur-P de 0,021


1. moyenne et l’écart-type avant et après.
 Moyenne d’avant m1 : m1

 Moyenne d’avant m2 :

m2
2. Formulation des hypothèses:
• Ho le nouveau médicament n’a pas d’efficacité, il ne renforce pas
l’organisme en fer ; m1=m2
• H1 : Ho le nouveau médicament a une efficacité, il renforce
l’organisme en fer ;
3. Intervalle de confiance pour la différence de moyennes :

(𝑛1−1)𝑆12 +(𝑛2−1)𝑆12
.𝑠 = √
𝑛1+𝑛2−2

(10−1)2,45+ (10−1)4,52
.𝑠 = √ = 3,63
18

1 1
.𝑆𝑑 = 𝑆√ +
𝑛1 𝑛2

2
AN : 𝑆𝑑 = 3,63√
10
𝐼𝐶95% = |𝑚1 − 𝑚2| ± 𝑡(𝑛1+𝑛2−2)𝛼 𝑆𝑑 ;
.𝐼𝐶95% = |𝑚1 − 𝑚2| ± 𝑡(𝑛1+𝑛2−2)𝛼 𝑆𝑑
.𝐼𝐶95% = |10,63 − 14,4| ± 2,1 ∗ 1,62
𝐼𝐶95 = [−6,91; −0,11] 𝑜𝑢 [0,11; 6,91]

Interprétation : la différence de moyenne m1-m2 à 95% de chance de se situer entre -6,81 et -0,11 avec
un risque d’erreur de 5%. Donc Ho est rejeté et Hi accepter car o appartient à l’intervalle de confiance

4. TEST T DE STUDENT :

Il suit une loi semblable à celle de Z (normale réduite). Il est utilisé lorsque la taille de (ou des)
échantillons est < 30

La loi de student est étalée la lecture de la valeur de α dans la table T tient compte du nombre de degré
de liberté.

5. Calcul du test T

AN :
6. Conclusions :

Valeur-P=0.021<0,05 ; on rejette Ho. Le nouveau médicament est efficace

Intervalle de confiance :

IC= [-6,91 ; -0 ;11] OU [6,91 ; 0 ,11].0 n’appartient pas à IC : on rejette Ho ; donc, le nouveau
médicament est efficaces

Vous aimerez peut-être aussi