Vous êtes sur la page 1sur 8

Exercice 1:

On a observé que la série des tailles d’une population d’élèves est une variable aléatoire X
normalement distribuée de moyenne 147 et d'écart type 6.
1) Calculer P(X<135); P(135<X<141); P(X<151).
2) Déterminer le réel x tel que 17,36% des élèves aient une taille inférieure à x.
3) Pour un échantillon aléatoire de 2000 élèves, combien devraient avoir une taille inférieure à
135?

Exercice 2:
Il y’a dix ans, on a observé que l’âge moyen de dépistage d’une maladie M chez certains
hommes était de 36 ans. Cette année, un échantillon aléatoire de 120 hommes atteints de la
maladie M a donné la distribution suivante selon l’âge.
Age de dépistage 15-25 25-30 30-35 35-40 40-45 45-55
Effectif 7 15 40 35 12 11
1-a) Tracer l’histogramme et le polygone des effectifs de cette série.
b) Calculer la moyenne et l’écart type de cette distribution.
2-a) Donner un intervalle de confiance aux niveaux de signification 0,05 et 0,01 de la moyenne
de cette distribution.
b) Peut-on rejeter aux risques de 0,05 et 0,01 l’hypothèse selon laquelle l’âge moyen de
dépistage de la maladie M n’a pas changé en dix ans?

Exercice 3: (Numérus 2009)


La moyenne ± écart type de la prise de calcium en mg d’un 1er échantillon (au-dessus du seuil
de pauvreté) de 25 femmes âgées de 12-14ans est de 6.56 ± 0,64. La moyenne ± écart d’un
second échantillon (au-dessus du seuil de pauvreté) de 40 femmes âgées de 12-14ans est de
6,80 ± 0,76.
1) Tester pour une différence significative entre les moyennes des 2 groupes.
2) Calculer à 95% d’intervalle de confiance de la différence des moyennes des 2 groupes.

Exercice 4: (Numérus 2009)


Une étude a été conduite en 1985 relative au temps d’utilisation d’UID; les résultats sont
résumés dans le tableau suivant.
<3 >=3,<18 >=18,<=36 >36
Cas 10 23 20 36
Contrôles 53 200 168 219

1) Performer le test d’hétérogénéité de la proportion des cas dans les 4 groupes.


2) La proportion varie-t-elle en fonction du temps d’utilisation de l’IUD?

1
Exercice 5:
Un essai a été réalisé pour comparer l’efficacité de 3 héparines de bas poids moléculaire dans le
traitement de la thrombose veineuse profonde des membres inférieurs. L’efficacité est évaluée
à l’aide du score de MARDER qui est mesuré à J0 (avant le début du traitement) et à J10 (à la fin
du traitement). On calcule la variation relative du score entre J0 et J10, exprimée en
pourcentage :
X = 100 [(J0-J10)/J0]
L’efficacité est d’autant plus importante que X est élevé. L’administration des héparines (A, B ou
C) a été faite par tirage au sort.
Héparine A Héparine B Héparine C
56 50 0
24 27 31
64 0 52
68 35 -8
4 0 75
79 90 5
38 31 59
100 45 30
75 0 0
75 11 -27
-15 35 0
-13 0 100
-5 48 25
10 -100 57
11 44 13
-12 77
n 16 16 15
∑x2 42167 37055 28532

Si vous aviez à prescrire une de ces héparines, laquelle choisiriez-vous à partir des observations
ci-dessus? (Détaillez les différentes étapes qui justifient votre choix)

Exercice 6:
Voici le tableau hebdomadaire (en moyenne sur l’année) des admissions en urgence dans un
hôpital:
Lundi Mardi Mercredi Jeudi Vendredi Samedi Dimanche Total
964 980 1012 989 990 1025 1040 7000

L’affluence aux urgences de cet hôpital est-elle uniformément répartie sur les jours de la
semaine?

Exercice 7: (Numerus 2010)


Encercler la seule bonne réponse des QCM. Justifier votre choix en une ligne dans l’espace
réservé pour cela directement sur le sujet qui est à remettre.

Supposons que les informations suivantes sont données par rapport à une étude sur la nutrition.

2
Prise de protéine (mg) chez les femmes.
Groupe Moyenne Ecart type Nombre
Régime standard 7.5 0.9 10
Régime laco végétarien 5.7 1.3 10
Régime végétarien 4.7 1.7 6

1) La grande moyenne (moyenne de l’ensemble des groupes) est:


A/ 5.97 B/ 1.3 C/ 8.67 D/ 6.16 E/ Autre à préciser
……………………………………………………………………………………………………………………………………………………..
2) La somme du carré des écarts (SCE) intergroupe de l’ANOVA est:
A/ 42.34 B/ 2.70 C/ 21.17 D/ 16.43 E/ Autre à préciser
……………………………………………………………………………………………………………………………………………………..
3) La variance intergroupe de l’ANOVA est:
A/ 16.91 B/ 2.70 C/ 21.17 D/ 16.43 E/ Autre à préciser
……………………………………………………………………………………………………………………………………………………..
4) La somme du carré des écarts (SCE) intra-groupe de l’ANOVA est:
A/ 42.34 B/ 33.82 C/ 32.86 D/ 5.39 E/ Autre à préciser
……………………………………………………………………………………………………………………………………………………..
5) La variance intra-groupe de l’ANOVA est:
A/ 23 B/ 1.84 C/ 1.47 D/ 143 E/ Autre à préciser
……………………………………………………………………………………………………………………………………………………..
6) La F statistique (F calculé) de l’ANOVA est:
A/ 8.93 B/ 9.19 C/ 11.49 D/ 92.04 E/ Autre à préciser
……………………………………………………………………………………………………………………………………………………..
7) Le F seuil au risque de 5% est:
A/ 9.95 B/ 3.49 C/ 3.32 D/ 3.86 E/ Autre à préciser
……………………………………………………………………………………………………………………………………………………..
8) Quelle est la décision par rapport à l’hypothèse nulle H0
A/ On ne rejette pas H0 B/ On rejette H0 C/ Autre à préciser

Exercice 8:
La durée de gestation humaine est en moyenne de 40,5 semaines. Dans une maternité, on a
noté l’âge gestationnel de 100 nouveau-nés successifs. La somme de ces âges est égale à 3850
semaines et l’écart type à 5 semaines.
1) On pense que ce service est spécialisé dans les accouchements prématurés. Cette hypothèse
est-elle justifiée?
2) Les mères des 100 nouveau-nés suivants ont reçu un traitement inhibant les contractions
utérines. La somme des âges gestationnels de leurs nouveau-nés est égale à 3950 semaines et
l’écart type à 4 semaines.
Comparer les durées moyennes de gestation entre les deux groupes (mères avec et sans
traitement). Peut-on dire que le traitement est actif sur les contractions utérines? Justifiez votre
réponse.

Exercice 9: (Numérus 2012)


Un important possible déterminant environnemental pour les problèmes respiratoires chez les
enfants est la quantité de cigarette fumée dans la famille.
Supposons que cette question est à étudier en sélectionnant deux groupes.

3
Le groupe 1 est constitué de 13 enfants non-fumeur de 4-10ans avec des parents tous deux
fumeurs qui ont une moyenne FEV de 0,21 dcL avec une variance de 0,0012 dcL.
Le groupe 2 est constitué de 10 enfants non-fumeur de 4-10ans avec des parents tous deux non-
fumeurs et ont une moyenne FEV de 0,23 dcL et la variance est de 0,0004 dcL.
a) Tester l’hypothèse selon laquelle les deux moyennes diffèrent à 1% de risque.
b) Déterminer 99% d’intervalle de confiance de la différence des deux moyennes.

Exercice 10: (Numérus 2013)


Le tableau suivant indique la pression systolique (y), le poids de naissance (x) de 10 nouveau-
nés.
1 2 3 4 5 6 7 8 9 10 Somme Somme
(xi) (𝑥𝑖2 )
Poids de 135 120 100 105 130 125 125 105 120 90 1155 135325
naissance
(x)
Pression 89 90 83 77 92 98 82 85 96 95 887 79097
systolique
(y)
Somme (xy) = 102655
1) Estimer la droite de régression linéaire simple de la pression artérielle systolique en fonction
du poids de naissance.
2) Tester le coefficient directeur de la droite de régression (la pente).

Exercice 11: (Numérus 2014)


Une étude a été faite auprès de 144 femmes pour savoir si leur consommation médicamenteuse
durant la grossesse était indépendante de l’âge. La variable âge est découpée en trois classes:
<20ans, entre 20 et 35ans, et ≥35ans. Conclure à partir des résultats suivants (on supposera la
consommation distribuée selon une loi normale et de même variance dans chaque classe d’âge).
<20ans ]20-35]ans >=35ans
Effectif (ni) 17 95 32
Consommation moyenne (yi) 8.7 9.64 9.06
Ecart-type estimé 6.1221 7.9850 7.2553

1) Poser les hypothèses.


2) Calculer les valeurs du tableau d’ANOVA en précisant la valeur (ou un encadrement) de la
probabilité p.
3) Conclure au seuil de 1%.

Exercice 12: (Numérus 2015)


Une enquête est menée auprès d’un échantillon aléatoire de 10000 personnes de la population
générale afin d’étudier l’apparition de trouble cardiaques en fonction de la présence d’asthme;
parmi ces 10000 personnes, 1500 sont asthmatiques. Deux ans plus tard, 1000 sujets présentent
des troubles cardiaques, dont 180 chez les sujets asthmatiques.
1. A partir des données ci-dessous, est-il possible d’estimer la prévalence et/ou l’incidence de
ces deux pathologie? Si oui, calculer l’estimation en question, si non, justifier en une phrase en
précisant l’(es) information(s) manquante(s) pour cette estimation.
a) La prévalence et/ou l’incidence annuelle de présence d’asthme dans la population générale.

4
b) La prévalence et/ou l’incidence annuelle de présence de troubles cardiaques dans la
population générale.
c) La prévalence et/ou l’incidence annuelle de présence d’asthme parmi les sujets présentant
des troubles cardiaques.
d) La prévalence et/ou l’incidence annuelle de présence de troubles cardiaques parmi les sujets
asthmatiques.
e) La prévalence et/ou l’incidence annuelle de présence d’asthme parmi les sujets ne présentant
pas de troubles cardiaques.
f) La prévalence et/ou l’incidence annuelle de présence de troubles cardiaques parmi les sujets
non asthmatiques.
2. Y’a-t-il une association significative entre l’asthme (l’exposition) et les troubles cardiaques (la
maladie) au risque de 1%?
a) Utiliser un test du Chi2 pour justifier votre réponse.
b) Utiliser un test de comparaison de deux proportions pour justifier votre réponse.
c) Utiliser l’intervalle de confiance de la différence des deux proportions pour justifier votre
réponse.

Exercice 13:
En fonction des données génétiques et nutritionnelles, un anthropologue avance l’hypothèse
que la taille adulte d’une ethnie A est en moyenne supérieure à celle de l’ethnie B. On mesure,
après tirage au hasard, la taille de 100 adultes de chaque ethnie et on obtient les résultats
suivants.
mA = 171 cm mB = 169 cm
Ethnie A Ethnie B
𝑆𝐴2 = 20cm2 𝑆𝐵2 = 16cm2
1) L’hypothèse de l’anthropologue est-elle vérifiée?
(Préciser les hypothèses H0 et Hi et le test choisi)
2) Un autre anthropologue affirme que l’ethnie A a bien en moyenne une taille supérieure à
celle de l’ethnie B sans qu’une valeur précise de la différence puisse être donnée. Quelle est la
plus petite différence significative qui peut être mise en évidence sur les deux échantillons
précédents?

Exercice 14:
On veut évaluer un soporifique chez les sujets insomniaques par comparaison de sujets traités
et de sujets témoins recevant un traitement inactif (placebo).
A cet effet, on constitue par tirage au sort 2 groupes de 10 hommes insomniaques, et 2 groupes
de 10 femmes également insomniaques. On vous donne les résultats suivants, pour la durée de
sommeil en heures. La durée de sommeil est supposée distribuée normalement, avec même
variance, chez les hommes traités et témoins et de même chez les femmes.

Ensemble
Hommes (Hommes + Femmes)
Témoins Traités Témoins Traités
Effectif 10 10 20 20
Moyenne m 3,10 6,00 2,95 4,60
Variance estimée 1,00 0,90 1,02 3,06

1) On souhaite comparer les durées moyennes de sommeil chez les témoins et les traités.

5
Effectuez le test approprié et concluez.
2) Les durées moyennes chez les hommes traités et les témoins sont statistiquement
significativement différents (p<10-4). Que pouvez-vous conclure concernant la comparaison de
durée moyenne entre les traités et les témoins chez les femmes?
Réalisez le test nécessaire.
3) Donner l’intervalle de confiance du gain observé avec le traitement chez les hommes.

Exercice 15: (Numerus 2016)


On considère les patients d’un hôpital H tous soufrant d’un trouble métabolique, soient deux
échantillon H1 et H2; on s’intéresse à la distribution du score de la variable X selon la prise ou
non d’une thérapeutique A (une valeur de X élevée qu’une amélioration du trouble métabolique
chez le patient).
Le groupe H1, composé de 36 personnes, reçoit la thérapeutique A pendant une semaine; on
note les valeurs suivantes: moyenne mA=3 et écart type δX=1,6.
Le groupe H2, composé de 49 personnes, ne reçoit aucun traitement pendant cette même
semaine; les valeurs suivantes sont notées: moyenne m=2 et écart type δX=2.
Vérifier si la thérapeutique A au bout d’une semaine améliore le trouble métabolique de ces
patients, au risque de 5%:
1) Poser les deux hypothèses pour la conduite de ce test.
2) Expliquer les conditions d’application de ce test et donner la formule du test statistique.
3) Calculer la valeur du test statistique et la valeur critique (seuil) pour ce test.
4) Peut-on conclure à une amélioration significative du trouble métabolique grâce à la
thérapeutique A?
5) Préciser la valeur p de la probabilité de ce test.
6) Calculer l’intervalle de confiance à 90% au tour de mA et de m, puis donner leurs
interprétations.
7) Les deux intervalles de confiance permettent-ils de vérifier l’hypothèse de l’amélioration des
troubles métaboliques par la thérapeutique A? Si oui, expliquer comment, si non, déterminer le
ou les intervalle(s) de confiance permettant de vérifier cette hypothèse.

Exercice 16:
On veut étudier l’effet d’une substance S sur une tumeur cancéreuse expérimentale chez le
lapin. On greffe cette tumeur à 80 lapins répartis par tirage au sort en deux groupes égaux. Le
critère de jugement est la survie calculée à partir de la date de la greffe et exprimé en mois.
1) On injecte à l’un des deux groupes de lapins la substance S en solution dans du sérum
physiologique. Que recevra l’autre groupe de lapins?
2) Le tableau ci-après donne la distribution des survies dans les deux groupes.
Survie(en mois) [0,1[ [1,2[ [2,3[ [3,4[ [4,5[ [5,6[ [6,7[ [7,8[
Groupe recevant S (n) 0 2 0 5 12 17 2 2
Groupe témoin (n) 2 1 6 15 12 3 1 0
On a 𝑆𝑆2 = 2,1 𝑆𝑇2 = 2,5
Que pensez-vous de l’efficacité de la substance S?
3) Si pour des raisons d’organisation de l’animalerie, il est impossible de garder les lapins au-
delà de 5 mois, comment répondre à la question posée sur l’efficacité de la substance S?

6
Exercice 17: (Numerus 2017)
On cherche à apprécier le rôle éventuellement néfaste des insecticides sur la santé des
travailleurs du secteur agricole. Pour ce faire, on interroge 420 travailleurs de ce secteur et il y
avait en tout 60 qui se plaignent de troubles pulmonaires. On caractérise deux groupes parmi les
personnes interrogées: les personnes exposées et les non exposées. Parmi les 260 exposées, 45
se plaignent de troubles pulmonaires.
Vérifier s’il y a une relation entre les troubles pulmonaires et l’exposition aux insecticides:
1) En utilisant un test de proportion et α=10%
a- Poser les hypothèses du test statistique à effectuer.
b- Calculer la valeur du test statistique.
c- Calculer la valeur seuil (valeur critique) pour ce test.
d- En déduire la conclusion.
e- Calculer la valeur p du test statistique.
2) En utilisant un test de Chi2 et α=10%
a- Poser les hypothèses du test statistique à effectuer.
b- Calculer la valeur du test statistique.
c- Calculer la valeur seuil (valeur critique) pour ce test.
d- En déduire la conclusion.
e- Calculer la valeur p du test statistique.

Exercice 18:
Sur échantillon de 10 sujets d’âges différents, on a recueilli les données suivantes: âge en année
(X) et concentration en cholestérol dans le sang en g/L (Y).
Xi 30 60 40 20 50 30 40 20 70 60
yi 1,6 2,5 2,2 1,4 2,7 1,8 2,1 1,5 2,8 2,6
Le taux de cholestérol est-il lié à l’âge?
Préciser le test utilisé et les conditions d’application.

Exercice 19:
On veut comparer l’efficacité de deux traitements A et B pour une maladie peu fréquente.
Les malades répartis dans deux groupes ont reçu, par tirage au sort, l’un des deux traitements.
Le tableau ci-après rassemble les résultats obtenus:
Traitement A Traitement B
Succès 17 18
Echec 4 1

1) Pour répondre à la question: « Les traitements A et B ont-ils des efficacités différentes? »,


quel test statistique utilisez-vous?
2) Un étudiant, auquel le problème avait été soumis a répondu affirmativement à la question. La
réponse est-elle correcte?

Exercice 20:
L’ion thiocyanate (SCN-), est un marqueur biologique reconnu de l’intoxication par le tabac. Sa
concentration sérique (en μmol/L) a été évaluée chez 35 volontaires non-fumeurs (X) et chez 35
volontaires fumeurs (Z). Les résultats obtenus sont les suivants:

7
Non-fumeurs: ∑ 𝑥i=1347,5 ∑ 𝑥𝑖2=5471,75

Fumeurs: ∑ 𝑧i=4550 ∑ 𝑧𝑖2=653240


1) Calculer les moyennes et écart types de ces deux échantillons.
2) Les deux moyennes diffèrent-elles statistiquement?
3) Estimer par un intervalle de confiance à 95% la moyenne μ de la concentration en ion
thiocyanate dans la population des fumeurs.
4) Donner une estimation ponctuelle de la variance dans la population des non-fumeurs.
5) Le taux (Y) de cet ion a été évalué dans la salive des 35 fumeurs. Les résultats sont tels que:
∑ 𝑦i=144,55 ∑ 𝑦𝑖2 =710,40 ∑ 𝑦izi=20730,30
a- Les variables Z et Y sont-elles corrélées?
b- Quelle est l’équation de la droite des moindres carrés y=bz+a qui s’ajuste aux couples de
points (zi,yi)?

Exercice 21: (Numérus 2018)

Source Degrés de Sommes des Carrés Pvaleur


degrés de liberté carrés (sum moyens F
variation of squares) (mean of
squares)
Inter classe 216,68 54,17
Intra classe 18 146,27
Total

Dans l’étude de cas de nutrition des personnes âgées, nous cherchons à étudier l’effet de la
consommation de chocolat sur le poids. Une analyse de la variance a été effectuée. Cette
analyse porte sur un extrait du fichier. Les modalités de la variable chocolat ont été regroupées.
Le tableau d’analyse de la variance obtenu est ci-dessus:
a. Sur combien de sujets (n) l’analyse a-t-elle été effectuée?
b. Combien la variable chocolat a-t-elle de modalité (p)?
c. Compléter le tableau d’analyse de variance.
d. Conclure (prendre α=1%)

Exercice 22: (Numérus 2018)


I. Trouver les valeurs de t pour les probabilités suivantes à l’aide de la table de Student.
a) P(T>t) = 0,975 avec T qui suit une loi de Student à 25 ddl
b) P(-t<T<t) = 0,95 avec T qui suit une loi de Student à 5 ddl
II. Soit X une variable aléatoire distribuée suivant une loi de CHI-deux avec 15 degrés de liberté,
déterminer les valeurs manquantes.
a) Pr(χ2 < … ) = 0,01
b) Pr(χ2 > … ) = 0,975

Proposé par: Youssouf CISSE MED5 (74311059)


Aboubacar HASSIMI « Dr. Boub’s » MED2 (75652362)

Vous aimerez peut-être aussi