Vous êtes sur la page 1sur 11

1. STATISTIQUE DESCRIPTIVE A.

Mizrahi
Travaux dirigs de statistiques S4-SV SVN
1 Statistique descriptive
Exercice 1 : On considre la srie suivante (1, 0, 2, 1, 1, 0, 1, 0, 0) .
1. Calculer sa moyenne et sa variance empiriques.
2. Reprsenter la courbe des frquences cumules.
3. Dterminer mdiane, premier et troisime quartile, ainsi que le mode.
4. Reprsenter la boite moustache de la srie.
5. Calculer le coefcient de Fischer.
6. Mme question avec la srie :(1, 2, 3, 4, 5, 5, 5, 5, 10 ).
Exercice 2 :
1. Dterminer une srie de cinq entiers dont la moyenne vaut 10 et la mdiane 12.
2. Dterminer une srie de cinq entiers dont la moyenne vaut 10 et la mdiane 8.
3. Dterminer une srie de cinq entiers dont la moyenne vaut 10 et lcart type vaut 2.
Exercice 3 :
Lors dune tude sur le grand corgone on a mesur la longueur
totale du corps en mm de 756 poissons.
1. Reprsenter la courbe des frquences cumules.
2. Reprsenter les donnes sous forme dun histogramme.
3. Proposer deux histogrammes dont les classes ont au moins 50
membres.
taille [270;290[ [290;310[ [310;330[ [330;350[ [350;370[ [370;390[ [390;410[
effectif 2 6 7 13 28 38 110
taille [410;430[ [430;450[ [450;470[ [470;490[ [490;510[ [510;530[ [530;600[
effectif 242 184 86 25 10 2 3
Exercice 4 : Montrer que si une srie de rels est symtrique par rapport un rel s, alors sa moyenne est gale
s, de plus cest une mdiane de la srie.
Exercice 5 :
Les mesures journalires de la temprature Rennes du premier juin 2001 au 30 septembre 2001, releve
midi donne la boite moustache suivante, la moyenne de ces tempratures est gale 21,5 degr. :
Universit de Cergy Pontoise 1 2009-2010
1. STATISTIQUE DESCRIPTIVE A.Mizrahi
1. La mdiane et la moyenne sont-elles diffrentes?
2. La distribution est-elle symtrique?
3. Quelle a t la valeur la plus basse observe? et la plus haute?
Exercice 6 : En utilisant le diagramme en btons ci dessous reprsentant le nombre denfants de 400 familles de
Susurre, rpondre aux questions :
1. Calculer le nombre moyen denfants par famille.
2. Calculer la nombre mdian denfants par famille.
3. Calculer la variance du nombre denfants par famille.
Exercice 7 : En utilisant le diagramme en btons ci dessus reprsentant la Cholestrolmie en g/l dans un chan-
tillon de 113 patients:
1. Calculer le taux moyen de cholestrol dans lchantillon.
2. Reprsenter la courbe cumulative des frquence.
3. Dterminer mdiane, quartile, cart inter-quartile.
4. Reprsenter la boite moustache correspondante.
Exercice 8 : La Frquence Cardiaque Maximum , note FCM, est un paramtre essentiel pour permettre au coureur
de fond dlaborer des plans dentranement efcaces. Cette frquence peut se mesurer, soit en laboratoire sur tapis
roulant, soit sur le terrain laide dun cardio-frquencemtre.
Une tude a t faite auprs de 13 hommes sentranant rgulirement (2 4 fois par semaine), et participant de
petites comptitions. On a mesur leur frquence cardiaque maximum. On souhaite tudier une relation ventuelle
entre lge dun individu et sa frquence cardiaque maximum. Voici pour chaque individu son ge et sa frquence
cardiaque maximum.
Age 40 36 51 49 47 51 32 55 55 23 49 52 35
FCM 187 195 180 190 185 183 195 185 189 201 189 185 195
1. Tracer le nuage de points, avec lge en abscisse et la FCM en ordonne.
2. Calculer le coefcient de corrlation linaire entre la variable ge et la variable FCM. Que constatez-vous?
Peut-on dire que la frquence cardiaque est fortement corrle lge des sportifs?
3. Calculer lquation de la droite de rgression linaire. Tracer cette droite sur le mme graphe que le nuage
de points.
4. Utiliser cette relation pour donner une estimation de votre FCM.
5. Peter Snell (Nouvelle-Zelande) a t 6 fois recordman du monde en demi- fond, du 800m au mile (1609m),
lge de 26 ans. A lpoque, sa FCM tait de 192. Placer ce point sur le graphique. Daprs la droite de
rgression, quelle FCM "devrait-il" avoir son ge? Commenter.
Universit de Cergy Pontoise 2 2009-2010
2. CONVERGENCE DES SUITES DE VARIABLES ALATOIRES A.Mizrahi
Exercice 9 : On a relev la production de bire alsacienne et le nombre de licences sportives des fdrations
franaises entre 1960 et 1995.
Annes Nombre de licences Production de bire en Belgique
(en milliers) (en millions dhectolitres)
1960 1640 3,3
1960 1640 3,3
1965 2220 4
1970 3240 5,6
1975 4620 8
1980 6300 9,6
1985 8340 10,2
1990 8980 11,3
1995 9210 11,2
Calculer la corrlation entre les variables Licences et Bires.
Peut-on en dduire que la pratique du sport conduit boire de la bire?
2 Convergence des suites de variables alatoires
Exercice 10 : Soit X une V.A. Gaussienne de paramtres (3; 4)
1. Calculer P(X < 4); P(X < 2,5); P(X > 2); P(|X| < 4).
2. Dterminer le plus grand possible tel que P(X 2 > ) > 10
2
.
Exercice 11 : Soit X
1
,X
2
,X
3
,X
4
des variables alatoires normales centres indpendantes de loi N(0; 9). Calculer
en fonction de la fonction de rpartition F
4
dune loi de
2
4 degrs de libert, la probabilit
p = P(X
2
1
+X
2
2
+X
2
3
+X
2
4
> 2)
Exercice 12 :
Soit T une variable alatoire qui suit une loi de
Student 7 degrs de libert : En utilisant le graphe
de la fonction de rpartition dune loi de Student 7
degrs de libert, ci contre droite.
1. Dterminer des valeurs approches de P(X <
1); P(X >
1
2
); P(|X| < 1,5).
2. Dterminer tel que P(X < ) =
1
4
. Dtermi-
ner tel que P(X > ) =
1
4
.
Exercice 13 : On modlise la taille des pins dune plantation par des variables alatoires iid (X
i
)
i
normales
N(30; 4), calculer P
_
10
i=1
(X
i
30)
2
144
_
. On mesure 10 arbres et lon obtient les longueurs suivantes :
31,39,27,28,29,24,29,29,31,33
qui donne

10
i=1
x
i
= 300 et

10
i=1
(x
i
30)
2
= 144. Que peut-on dire de la modlisation? Mme question pour
la loi N(30; 9).
Exercice 14 : Soit (X
n
) une suite de variables alatoires exponentielles de paramtre n, montrer que cette suite
converge en probabilit vers la variable alatoire nulle.
Exercice 15 : On modlise la taille des hommes de 18 ans en France par une variable alatoire normale N(175,36),
et la taille des femmes de 18 ans par une loi normale N(162,30).
1. Selon ce modle quelle est la proportion dhomme de plus de 180 cm.
Universit de Cergy Pontoise 3 2009-2010
2. CONVERGENCE DES SUITES DE VARIABLES ALATOIRES A.Mizrahi
2. Selon ce modle dans lensemble des couples htrosexuels de jeunes de 18 ans possible, quelle est la pro-
portion de couples ou lhomme est plus petit que la femme?
Exercice 16 : On note p la probabilit quune personne en ge dtre vaccine contre la grippe demande effec-
tivement ltre. Sur une population de 10 000 personnes en ge dtre vaccines, on modlise par une variable
alatoire N le nombre de personnes demandant se faire vacciner.
1. Quelle loi proposez-vous de prendre pour N?
2. On suppose que p = 0,1, si lon achte 1100 vaccins, quelle est la probabilit quil ny en ait pas sufsam-
ment ? La difcult semble dvaluer p
3. Toujours dans le cas o p = 0,1, dterminer le nombre m de vaccins quil faudrait prvoir pour que la
probabilit den manquer soit gale 1%.
Exercice 17 :
On sait par exprience quune certaine opration chirurgicale russi dans 90% des cas. Cette opration est
ralise dans une clinique 400 fois chaque anne. On modlise par une variable alatoire N le nombre de russites
dans une anne.
1. Quelle loi proposez vous de prendre pour N, on prcisera bien les hypothses faites? Calculer lesprance et
la variance de N.
2. Calculer la probabilit que la clinique russisse 350 ou plus oprations dans lanne.
3. Calculer la probabilit que la clinique rate 28 oprations ou plus dans lanne.
4. La clinique prend une assurance, le prix de lassurance est x par le nombre maximum doprations indem-
nise sur une anne, le directeur veut xer ce nombre de tel sorte que la probabilit de ne pas tre indemnis
soit infrieure 1%, quel nombre maximum doprations rates doit-il dclarer.
Exercice 18 : Soient B et N deux variables alatoires, B de loi B(n; p) et N de loi N(0,1).
1. Rappeler lesprance et la variance de B. Dterminer a et b pour que

N = aN + b ait mme esprance et
mme variance que B.
2. Dterminer et pour que

B = B + soit centre, rduite.
3. Trouver un lien entre les fonctions de rpartition de N et de

N.
Voici 3 graphiques, le premier reprsente les fonctions de rpartition de N et de

B pour n = 30 et p = 0,5. Les
2 suivants reprsentent lcart maximum quil y a entre la fonction de rpartition de N et de

B, pour p = 0,5 et
p = 0,1, n variant.
(c) N=30 (d) p = 0,5 (e) p = 0,1
4. Pour p = 0,5 et n = 50 quelle est lerreur maximale que lon fait lorsquon approche une loi B(50,
1
2
) par
une loi normale.
5. Quelle valeur de n faut-il prendre pour tre sur que lon peut approcher une variable alatoire binomiale
B(n,
1
2
) par une loi normale avec une erreur infrieur 5%?
6. Mme question avec B(n,
1
10
)
Universit de Cergy Pontoise 4 2009-2010
2. CONVERGENCE DES SUITES DE VARIABLES ALATOIRES A.Mizrahi
On reprsente maintenant sur le premier graphique, pour n = 50 et p =
1
2
, la diffrence entre les fonctions de
rpartition de B et de

N. Sur le second un zoom du premier graphique, enn sur le troisime on reprsente le
logarithme de lerreur maximale commise en fonction du logarithme de n.
(f) N=50 (g) N=50, Zoom (h) Des logarithmes
7. A laide de la gure (g). Dterminer lerreur commise maximale que lon peut commettre si lon calcule
P(c <

N < D) pour approcher P(c < B < d).
8. En utilisant la graphique (h), qui reprsente le logarithme nperien de lerreur maximale en fonction de ln(n),
comment dcrot cette erreur en fonction de n.
Jusqu prsent ce que lon cherche cest la diffrence maximum qui existe entre la fonction de rpartition de la loi
normale et celle de la loi binmiale centre rduite, mais dans la pratique ce que lon cherche cest approcher les
quantits P(B m), o m est un entier, par une loi normale, dans le premier graphique on a reprsent la suite de
points
_
n, max
m

P(B
n
m) P(

N
n
m)

_
n
.
Dans les deux derniers on a reprsent
_
n, max
m

P(B
n
m) P(

N
n
m+ 0,5)

_
n
pour p = 0,5 et pour p = 0,1, ceci est guid par le fait que P(B m) = P(B < m+ 1).
(i) Aux points entiers (j) Correction de Yates, p = 0,5 (k) Correction de Yates, p = 0,1
9. Pour p = 0,5 et n = 50 quelle est lerreur maximale que lon fait lorsquon approche P(N m) laide
dune loi normale, sans utiliser la correction de yates, puis en utilisant la correction de Yates.
10. Quelle valeur de n faut-il prendre pour tre sur que lon peut approcher P(N m) par une loi normale en
utilisant la correction de Yates, avec une erreur infrieur 1%?
11. On trouve parfois dans les livres que lon peut approcher une loi binomiale B(N,p) par une loi normale
lorsque Np > 5 et N(1 p) > 5. A quelle erreur cela correspond pour p = 0,5 et pour p = 0,1.
Universit de Cergy Pontoise 5 2009-2010
3. ESTIMATION A.Mizrahi
3 Estimation
Exercice 19 : On considre la srie suivante (1, 0, 2, 1, 1, 0, 1, 0, 0) .
1. Calculer sa moyenne et sa variance empiriques.
2. En supposant que les donnes de cet chantillon sont des ralisations dune variable de loi inconnue, donner
une estimation non biaise de lesprance et de la variance de cette loi.
3. On choisit de modliser les valeurs de cet chantillon par une loi binomiale B(2,p). Utiliser la moyenne
empirique pour proposer une estimation ponctuelle pour p.
4. Avec le mme modle, utiliser la variance empirique pour proposer une autre estimation de p.
5. Dterminer lestimateur du maximum de vraisemblance.
Exercice 20 : On ensemence 100 boites de Petri avec un cm
3
dune solution comprenant 4 bactries par cm
3
, on
modlise le nombre de bactries se trouvant dans la ime boite de Petri par une variable alatoire de Poisson N
i
.
1. Quel paramtre peut-on prendre pour le paramtre de la variable alatoire?
2. Donner un intervalle de conance au seuil 95% pour le nombre moyen de bactries par boite de Petri.
Exercice 21 : Comparaison de deux estimateurs.
On suppose que les V.A. X
i
sont indpendantes et suivent toutes une loi uniforme sur [0; 2A] on note :
X =
1
n
n

k=1
X
k
et M = max(X
1
; X
2
...; X
n
)
1. Rappeler les valeurs de E(X); E(X) et var(X).
2. Dterminer la fonction de rpartition de M, dnie par F
M
(t) = P(M t). On pourra se demander quelle
condition le maximum de n nombres est infrieur t.
3. Dterminer la densit de M, en utilisant le fait que f
M
(t) = F

M
(t).
4. Dterminer E(M) puis un tel que la nouvelle variable

M dnie par

M = M soit un estimateur sans
biais de A.
5. En calculant les variances des variables alatoires X et

M, comparer lefcacit de ces deux estimateurs sans
biais de A.
Exercice 22 : Dterminer lestimateur du maximum de vraisemblance pour le paramtre dune loi de Poisson.
Exercice 23 : On ensemence 100 boites de Petri avec 1 cm
3
dune solution comprenant bactries par cm
3
, on
modlise le nombre de bactries se trouvant dans la ime boite de Petri par une variable alatoire de Poisson N
i
,
aprs 9 jours de culture, chaque bactrie a donn naissance une colonie visible loeil nu on obtient le rsultat
suivant. Le nombre moyen de colonies est 4,83 et la variance de lchantillon est 4,48. On cherche estimer ,
Nombre de colonies 0 1 2 3 4 5 6 7 8 9 10 12
effectif 2 1 8 17 20 18 12 11 7 2 1 1
pour cela essayons deux mthodes diffrentes.
1. Si X suit une loi de Poisson de paramtre alors P(X = 0) = e

, en dduire une estimation de .


2. Si X suit une loi de Poisson de paramtre alors E(X) = , en dduire une estimation de .
3. Dterminer pour la deuxime mthode un intervalle de conance au seuil de 95%.
Exercice 24 : Un biologiste tudie un type dalgue "agressive", elle possde une toxine dont on mesure la quantit
par dosage dune solution organique. Il obtient les rsultats suivants en milligrammes de toxine par gramme de
solution : Pour chaque question on prcisera les hypothses faites.
1,2 0,8 0,6 1,1 1,2 0,9 1,5 0,9 1,0
1. Donner une estimation ponctuelle de lesprance et de la variance de la quantit de toxine.
2. Donner une estimation par intervalle de conance 95% de la quantit moyenne de toxine.
Universit de Cergy Pontoise 6 2009-2010
4. TESTS STATISTIQUES A.Mizrahi
3. Combien faudrait-il doser dalgues pour avoir un un intervalle de conance de longueur infrieur 2 mg/g.
Exercice 25 Une maladie touche environ 20% de la population, combien faut-il tudier dindividus pour valuer
1% prs , la proportion de sujets malades.
Exercice 26 (Thorique) On a deux populations dont un caractre quantitatif suit une mme loi normale de
moyenne et de mme cart type . Pour la premire population on a un chantillon de n
1
individus de moyenne
m
1
pour la seconde population on a un chantillon de n
2
individus de moyenne m
2
. On modlise ceci par n
1
variables alatoires X
i
N(,
2
) et n
2
variables alatoires Y
j
N(,
2
), toutes les variables X
i
,Y
j
tant
indpendantes.
1. Quelle est la loi de X =
1
n
1
(X
1
+X
2
. . . +X
n
1
)?
2. Quelle est la loi de Y =
1
n
2
(Y
1
+Y
2
. . . +Y
n
2
)?
3. Quelle est la loi de D = X Y ?
4. Dterminer

D la variable alatoire centre rduite associe D.
5. Quelle est la loi de
1

(X
i
X)
2
?
6. Quelle est la loi de
1

(Y
j
Y )
2
?
7. Quelle est la loi de Z =
1

(X
i
X)
2
+

(Y
j
Y )
2
_
?
8. En admettant que

D et Z sont indpendantes, dterminer la loi de T =

D
_
Z
n
1
+n
2
2
.
4 Tests statistiques
Exercice 27 ( traiter en cours) Daprs Brinkhaus B et al. 2006.
valuation de lacupuncture dans le traitement de la lombalgie : les auteurs cherchent comparer les effets dune
acupuncture classique, dune acupuncture minimale (aiguilles en dehors des points dacupuncture), et pas dacu-
puncture du tout. Pour cela ils utilisent comme critre de jugement : lintensit de la douleur (VAS chelle dauto-
valuation de la douleur). Ils obtiennent ainsi trois chantillons : 140 acupunctures, 70 minimaux et 74 tmoins. On
tudie la diminution de la douleur entre le dbut de lexprience et 8 semaines de traitement on obtient les rsultats
suivants :
Tmoins : m
0
= 6,9; s
0
= 22,0; n
0
= 74
Minimalistes : m
1
= 23,6; s
1
= 31,0; n
1
= 70,
Acupuncture : m
2
= 28,7; s
2
= 30,3; n
2
= 140.
Pour chacune des questions on prcisera bien les hypothses faites
1. Peut-on conclure que lacupuncture est plus efcace pour combattre la lombalgie que labsence de traite-
ment ?
2. Peut-on conclure que lacupuncture est plus efcace pour combattre la lombalgie que lacupuncture minima-
liste?
3. Calculer la p-valeur (p-value) pour m
2
m
1
.
4. Calculer la p-valeur critique (p-value) pour m
2
m
0
.
5. Les professionnels estiment quune diffrence de la VAS de 10 units correspond une douleur scienti-
quement diffrente. On estime que lcart type de la population est gale 30,5, quelle est la taille deffet
correspondante?
6. Quelle est la puissance de notre test comparant lacupuncture lacupuncture minimaliste, pour la taille
deffet de la question prcdente?
Exercice 28 On cherche comparer le poids moyen des pis de deux varits de bl : on a procd 10 peses
pour le bl A et 12 pour le bl B, avec un poids moyen pour A gale x
A
= 1,707g et une variance estime
s
A
2
= 432,9 et un poids moyen pour B gale x
B
= 1,685g et une variance estime s
B
2
= 182,7. Les deux
moyennes sont-elles signicativement diffrentes?
Universit de Cergy Pontoise 7 2009-2010
4. TESTS STATISTIQUES A.Mizrahi
Exercice 29 Les tudes statistiques portant sur la latralisation permettent destimer a environ 10% de la popula-
tion la proportion dindividus qui, dans nos socits, utilisent prfrentiellement leur main gauche dans les tches
motrices et dans lcriture en particulier. Parmi les meilleurs tennismen et escrimeurs mondiaux, on a dnombr 18
gauchers sur 64. Peut-on admettre que les gauchers sont plus nombreux dans ces sports dopposition que dans la
population totale?
Exercice 30 On a mesur lindice de Qutelet (poids (en kg) / taille
2
(en m)) chez 13 jeunes lles ges de 14 ans,
atteintes du syndrome de Turner (maladie chromosomique caractrise par une monosomie au niveau de la paire
de chromosomes sexuels). On a obtenu : 16,67 - 18,32 - 18,15 - 18,65 - 19,1 - 18,38 - 20,21 - 17,72 - 16,31 - 19,05
- 16,57 - 15,33 - 18,47.
1. Calculer la moyenne, la variance et lcart-type.
2. Sachant que lindice moyen de rfrence pour des jeunes lles du mme ge est de 19,39, peut-on conclure
que lindice de Qutelet moyen de lchantillon est identique lindice moyen de rfrence? Prcisez bien
les hypothses faites.
3. Quelle conclusion en tirez-vous?
Exercice 31 On a suivi, sur une priode de 20 ans, deux cohortes : 200 sujets fumeurs et 200 sujets non fumeurs.
On a not le nombre dapparition de cancer dans chacune des cohortes : 40 chez les fumeurs ; 20 chez les non
fumeurs. La diffrence dapparition de cancer dans les deux cohortes est-elle signicative?
Exercice 32 On veut tester la premire loi de Mendel pour deux allles A et a dun mme gne. Pour cela on part
dun chantillon de n croisements dindividus de gnotype (Aa) deux hypothses sont possibles. Soit la proportion
de phnotype [A] est 3/4 (cas Mendel) soit 2/3 (cas du gnotype (AA) ltal)
(a) N(
3
4
;
3
16
) et N(
2
3
;
2
9
) (b) N(
3
4
;
3
16400
) et N(
2
3
;
2
9400
)
1. Construire un premier test H
0
= 3/4 contre H
1
: = 2/3.
2. Construire un deuxime test H
0
= 2/3 contre H
1
: = 3/4. Calculer le risque derreur de seconde espce.
3. Interprter le problme laide des deux graphes ci-dessus, le premier reprsente les densits de deux lois
normales N(
3
4
;
3
16
) et N(
2
3
;
2
9
), puis le second reprsente les densits de deux lois normales N(
3
4
;
3
16400
) et
N(
2
3
;
2
9400
)
4. Dterminer un n assez grand pour que dans tous les cas la probabilit davoir une erreur soit infrieure 5%.
Exercice 33 On ajoute au rgime dun groupe de souris un produit P. dont on souponne quil peut tre toxique
et raccourcir la survie moyenne. Pour tudier si il est toxique, on dcide de constituer deux groupes de 100 souris
dont lun sera expos au produit P et lautre non. On suppose la variance de la survie gale 18 semaines (bien sur
cette . On dcide danalyser lexprience grce un test unilatral. Dire pour quelles valeurs de d = m
A
m
B
Universit de Cergy Pontoise 8 2009-2010
4. TESTS STATISTIQUES A.Mizrahi
on conclura la toxicit de P. Quelle est la puissance du test si le produit P raccourcit la survie moyenne de 2
semaines. Le rsultat serait-il diffrent si lon avait prit une variance gale 20.
Exercice 34 Lors dune tude granulomtrique de sdiments, on a relev, pour deux chantillons C et D, les ca-
ractristiques suivantes de la distribution des diamtres des grains. On fait lhypothse que les diamtres des grains
suivent une loi normale.
chantillon C: 12 grains, moyenne 63 microns, cart type 9,2 microns.
chantillon D: 18 grains, moyenne 51 microns, cart type 8,5 microns.
Les deux chantillons sont-ils signicativement diffrents, en ce qui concerne le diamtre des grains?
Exercice 35 On mesure la taille de pres n en 1942 et celle de leur ls adultes, on obtient les rsultats suivants :
Taille de lchantillon Taille moyenne cart type de lchantillon
Pre 241 169,7 8,21
Fils 215 174,3 9,41
En admettant que les tailles des hommes dune mme gnration suivent une loi de Gauss, peut-on conclure quentre
ces deux gnrations la taille des hommes a signicativement augmente?
Exercice 36 On teste deux hypnotiques A et B sur 10 volontaires 10 jours dintervalle, pour chacun des volon-
taires on note alors dans le tableau les dures dendormissement en minutes :
Volontaire i
1
i
2
i
3
i
4
i
5
i
6
i
7
i
8
i
9
i
10
Hypnotique A 12 18 25 28 29 33 35 37 39 43
Hypnotique B 22 11 16 17 20 32 37 39 42 47
Y a-t-il une variation signicative du temps dendormissement entre les deux hypnotiques? On prcisera bien les
hypothses que lon fait.
Exercice 37 On pse de jeunes hommes lors dune comptition sportive :
Poids mesur en kg <60 60-64 64-67 67-69 69-72 72-76 76-95 >95
Nombres de jeunes 15 65 63 70 58 45 15 4
Lhypothse que le poids de ces jeunes hommes suit une loi normale est elle raisonnable?
Exercice 38 Dans un article paru en 1999, M. H. Kohn laide du squenage de ladn fcal, a attribu 111 fces
de coyotes Canis latrans 30 individus, 8 individus sont reprsents par 1 djection, 6 par deux etc..., la distribution
complte est donne par :
Crottes 1 2 3 4 5 6 7 8 9 10 11
Coyotes 8 6 5 0 4 2 1 1 2 0 1
1. Expliquer pourquoi lhypothse dune loi de Poisson peut tre envisage.
2. Tester cette hypothse laide dun test du chi deux, au risque de 5%.
3. Conclusion et interprtation.
Exercice 39 Question prparatoire : On suppose que le phnotype dune premire gnration dun croisement doit
suivre une loi de Mendel 3/4 de [A] et 1/4 de [a], quelle est la probabilit que sur 1000 individus il y ait exactement
750 [A] et [250] a?
En 1866 Mendel publie un article volumineux ou sont dcrit entre autre des rsultats dexprience sur la reproduc-
tion du pois, des croisements de souches pures sont raliss par une fcondation croise de faon contrle. Par
exemple il regarde la couleur de lalbumen (tissu de rserves nutritives de la graine), en croisant des pois albumen
jaune avec des pois a albumen vert, la premire gnration donne 258 plants ayant un albumen jaune, on croise
cette premire gnration entre elle et Mendel trouve 6022 plants ayant lalbumen jaune et 2001 ayant lalbumen
vert. Certains auteurs ont accuss Mendel davoir arrang ces chiffres. Les valeurs trouves sont-elles trop proche
du modle (3/4;1/4) pour tre vrai ?
Exercice 40 On cherche comparer deux traitements A,B un groupe tmoin sans traitement pour un certaine
maladie, la question est de savoir si il y a une diffrence signicative entre les trois traitements.
Universit de Cergy Pontoise 9 2009-2010
4. TESTS STATISTIQUES A.Mizrahi
Gurison trs rapide Gurison rapide Gurison lente Complication
Traitement A 30 58 10 2
Traitement B 27 68 4 1
Sans traitement 19 70 11 0
Exercice 41 Une enqute auprs de 6672 personnes donne les rsultats suivants :
Hommes Femmes Total
Droitiers 2780 3281 6061
gauchers 311 300 611
Total 3091 3581 6672
Peut-on en conclure un lien entre les variable sexe et droitier/gaucher?
Exercice 42 Le rtrcissement des artres et des veines sous claviaires au niveau de larticulation du bras engendre
chez des patients des dmangeaisons pouvant ncessiter des interruptions de travail. Le diagnostic du syndrome peut
tre pos grce langiographie (cest--dire la radiographie des vaisseaux aprs injection dun liquide opaque aux
rayons X) effectue sur des patients en position assise ou couche. Pour tester la position la plus efcace, on a
relev la prsence (positif) ou labsence (ngatif) de dtection de la maladie chez 112 patients.
Assise Couche Effectif
positif positif 59
positif ngatif 8
ngatif positif 20
ngatif ngatif 25
La position couche amliore-t-elle la dtection de rtrcissement des artres ? Les positif-positif et les ngatif-
ngatif napportent aucune information. Si les deux positions sont quivalentes, un rsultat contradictoire est une
fois sur deux positif-ngatif et une fois sur deux ngatif-positif.
Exercice 43 Sur un chantillon de 57324 individus exposs un virus, une tude statistique sur lfcacit dun
vaccin donne les rsultats suivants : 1110 vaccins dont 10 malades et 1222 malades non vaccins. Le vaccin a-t-il
un effet sur cette maladie?
Exercice 44 Pour comparer diffrents tests, on simule 10000 chantillons de taille n qui suivent une loi L et on
compte le nombre de fois ou lon choisit H
1
au seuil de conance 95%, cest dire ou lon rejette H
0
. Pour
diffrents tests
T
1
est un test de
2
ou lon ajuste une loi N(0,1) avec 5 classes contenant chacune 20% de leffectif espr.
T
2
est un test de
2
ou lon ajuste une loi N(0,1) avec 10 classes contenant chacune 10% de leffectif espr.
T
3
est un test de
2
ou lon ajuste une loi N(m,
2
) o lon estime met
2
laide de lchantillon, avec 5 classes
contenant chacune 20% de leffectif espr.
T
4
est un test de
2
ou lon ajuste une loi N(m,
2
) o lon estime m et
2
laide de lchantillon, avec 10
classes contenant chacune 10% de leffectif espr.
T
5
est un test de Shapiro-Wilk qui permet de tester la normalit.
T
6
est un test de Kolmogorov-Smirnov qui permet de tester la normalit.
Loi L simule N(0; 1) N(0,5; 1) N(0; 1) N(0; 1) U(

3;

3) U(

3;

3) E(1) E(1) P(1)


n 100 100 25 10 25 100 25 100 10
T
1
495 9808 428 387 1233 4584 10000 10000 10000
T
2
479 9525 508 358 1012 3007 10000 10000 10000
T
3
751 790 786 712 1492 6598 5227 9417 8025
T
4
537 599 494 287 1546 3378 6095 9998 9800
T
5
498 511 502 522 2846 9967 9209 10000 7612
T
6
493 528 494 504 1185 5893 6902 9999 5976
1. Pour chacun des tests du
2
, dire combien on a pris de degrs de libert.
2. Expliquer les rsultats gaux 10000 pour les tests T
1
et T
2
.
Universit de Cergy Pontoise 10 2009-2010
4. TESTS STATISTIQUES A.Mizrahi
3. Comparer les deux tests T
5
et T
6
, lequel semble le meilleur?
4. Comparer les tests du
2
aux deux autres tests pour n = 10. La valeur 287 est-elle une preuve que le test
fonctionne bien?
5. Pour diffrencier la loi normale de la loi uniforme quel test semble plus performant ?
Universit de Cergy Pontoise 11 2009-2010