Vous êtes sur la page 1sur 234

MAT1375 Biornetrie - Nicolas Schtickzelle

Quelques exemples simples



17

175 em < 182 em

172em

180 em

o 'j-e. (Y\JL ~x ~ ~\frJ'\.Q_,L w..c.. ~cq J,' ec\\om\-~~

(\1 ) 'eo\: ~ du- \~d<:. .

Puis-je reellernent affinmer sur eette base que lies hommes sont en rnovenne plus petits que les femmes?

La methode scientifique

Approche hvpothetlco-deductive (Karl, Popper)

Millepattes introduits en Australie

Espace peste qui envahit les maisons, partlcuherernent ' les maisons fort eclairees

I I I /

t ttl



les millepattes sontattires par la lumisra



Iidevrait y avoir plus de rnillepattes sur des plaques

eclairees que sur des plaques non eclairees

11)1"'111.",. J

I

pt'C'l.-hdUlli ~._.-

Ibl'!ll"hc~; .. "Uf\I\t"\ :too ~'- mamcd

11)~'~hr:), ..

~1I---,

-05..II'iLll].C!I:6.~ .. ·1l"l ~f!il:O'>du~tJ~'I'J'I'<t~·

~ Gm >Q. iv, "l'U.- CL9Y\Fr\.,o.fn 0Yl(.Q_ d.u._ fT<I~ de ) \9'f\ 0.. ~ \~. _ik:_ I,Jj'f\JL ~d': d:.\ .en. . _ -,~o't- f'c\J.9V\- 0 \< ~

_ j; o\< 1/

Annee acadernique 2009-2010

9

MAT1375 Biornetrle - Nico:las Schtickzelle

La methode scientifique

Approche hvpothetico-deductlve [Karl Popper)

hypothese alternative (HAl'

hypothese nulle (Ho)

!! III n'est pas possible' de prouver qu'une hvpothese est vrale ll 19

·O§;_LI...:rq.l_~wir:;. ~ .......... t;o~Ltr..."""ttF'IcHI.·

On peut rarement etudier toute Iia population

• Population: ensemble de taus iles individus - lndivldu= unite d'observation

- P. ex. ensemble des millepattes d'Australie, des polssons

d'un lac, des cellules d'un organe, .. , .. ,

• C'est un fait: en blologie on peut tres rarement etudier toute la population

• Done on etudie un echantillon representatif de la population

Annee academlque 2009-2010

20

10

MAT1375 Biornetrie - Nicolas Schtickzelle

Alors comment fait-on?

• Les stati:stiques sont

un outil d'aide a la decision

pour determiner si iles differences observees - refletent une reelle difference entre populations

- sont dues uniquement au hasard

21

Q '?~\lli ~ q:6 A ~~ I'll ~o J ~Q. e-k...lo_ ~cb·,·tJ( ~ ~ d) J..U\\.9_ t. ~\:UQPJL ~

0). Sy~~ oS l ~\1'(\M)\''\'~ {m.c.. ~o ') jlL ,?Qu._-X: ~ Q'.QJrl ~ Or.:, CB'n dU/;:l I ~ ..

Echantillon: representatif ?

.~.~:>.~.~~ ~¢iIL·~~·P:>

.Jr"'~~~ .iJt:~¢~~=¢~~

~¢JtCP~~l-"~ ~~~ ¢.""~,,,,,,'p¢. ~

~~?-p2_~~~ ~""~.~~~

J:"~"""~""'~~

~~;.:..,

"-'

~~Q'c)O-')(d ~ f~~~·'[J~o-.~~n Qu_~. ~ ~c~ ~ n~ ~ ~ ~rrui. ~ ~-? 0 .. urn ~ ¥ -1. _Q;~\Q.Q..em_ _

" s~ T G~-l-;.Jhn o~ ,de. -t~ ~ .aC. - ~ en ttllt? ~ck, ~ JUx> ~ ? . '-

s,\1\ T EX g)_ . -, ~if oe. 'lL\'J n9'0't. - 'I'{n ~tl/') :v~ qto- -lo~ ~ di. U. ~ Q

Annee acadernique 2009-2010 ~\:t..~ d!._ _r~~ c.\e.. ('rugb\.D.. .~ 'J_ 11

2 echantillons d'une merne 2 echantillons de populations

population peuvent differer differentes peuvent etre identiques

22

MAT1375 Biornetrie - Nicolas Schtickzelle

Echantlllon: representatif ?

~.,.¢~~~ ~

La variation entreindividus peut masquer la variationexistant entre les 2 populations

Caracteristiques recherchees pour les mesure'5/donnees

• On essaie d'obtenir des mesures avec la plus grande precision et sans biais

Efflcaclte: vartabillte des mesures repetees de la merne quantite

Absence de biais:

pas d'inadequatlon systematique '; entre la rnesure et la valeur n~elle

'I'll

Ji'lJIfJ

Hw (.,

I~

VU!II: 8 .'lJ

...

I""

. ~.

'If_II F.1\"i

f., 2.4

23

12

e = 1- ? ~ q? 'je ~ ~ -~ '-'V)\- \~emd.ctvl\:.. (~dQ_ ~ J\JJ'ffi.2.O..Lx) A J~ y~ t'J'IV) ~k cllL ~ , ~-£__ dG~ ~\JJUJ\.. _QQ

~cnUL <i.u.JL OJ.. ~ .

S:i\ c\:Co.lf;JR. d..u.. ~ouj....J J> cL a- '6 CJo'L \ e..\ ~ ~m\}l~ ~ ~'";) ) ~ ~ ~~Oll \:. --1.. rm. '-\0 ~...ln.o ~-'d -:1. lTf\. eo ) : -€_ ffI J 'c) .0- ~ or-~ ~ ~01.d ~_ e.X~ ~ f-UL .

., y .. 0... - \- - \ t UJ'NL- -f ~ ~ {n b\_e. d.e oo.~ JJYt ~ c\R_...Q.c_ ~ ~ l\- ~ ('l\O(l AS:>; ~e. tmv.>l\AL '::, ~ ~ '1 q <:.Kn~ ~~ .~ j e. (n I g__ v= -1b.. ~lR... du- ~ _))e. Il\.Q. I~I) Ju..Wn_ ~ ~

f) R ~U±0: ~ ~llru.. \\- ~ ~ -..io. ~ ~ ({'m1lnllJU/L \ceo X -( em._ ~) dfmc. t9Y\_ AKA.. ~~ elL ~ ~ b.,t\_ d I LIJl\_ nwl_ ~doYt \:_~ Q1em_ fmJvJ~ ~ dsL·~ --tt., (t5'f\- 0.. dErnL du_ ~ 0: fO'\.lV?~ -10... r-uo~(Q.. dJ.L ~awi_

I' ~ 3 -'L ~ &J\- Jlc. b.9n.1'AA- .

)

c

MAT1375 Biornetrie - Nicolas Schtickzelle

Mesurer s manipuler

Deux gra ndes classes d'experlences:

- Mesure seule: on mesure les variables d'un svsterne dans son etat existent

- Avec manipulation: on modifie/manipule l'etat d'un svsterne et on mesure les changements qui en resultent

25

26

co c_}(Jk G\IL /:8J./IJJ'--::. <-.QfY' ~U::.du.. ~ ~ ~ o C;'\ ~\~ ~. G:l dz. ~.

" ..:. ~. ® dQ_J~~ Co1.~..-;) a.Fo1ero \:. CQ.Qn... "'") ~cL n:u. (\}(l.u..k. ~ dJlUl Ca.L~

Annee acadernique 2009-2010 tr> ~~ rm~ ._.Q_I'(I eNio\-e!n~ 13

ooe.c, ~ f'I:ructtu,c u._QchA1l~

Correlatione cause

• Seule une experience avec manipulation peut dernontrer un lien de cause a effet

• II faut se metier des relations observees dans une experience sans rnanipulatlon

Number nf mice

Weighl of wheat

. . •

\

/

Numbtf uf rmce JX'nn.!

StJii moisture

·O::;:U::Dwl'~.t~ wi:f1 ~l>I~d::J,-.u""'t~_."U'y 1'1.t,,~

MAT137S Biornetrie - Nkolas Schtickzelle

t'irnportance de la replication

• Seule la repllcation/repetition (prise de plusieurs rnesures

de la merne variable sur des individuslndependantsl II

permet de determiner la variation due au hasard

• C'est done un element vital de toute experience

Nombre de' crevettes par m' d'ea u dans un lac .~

: 1:', : :: ,~)

Pas de replication, pas de conclusion possible

(sur la difference de densite entre 10m e120m)

Chiffre: den,i!e n?ell~ lirt(on.nuel

"': 1 mesura realisee

,"

27 ,

Pse udore pi ication, conclusion incorrecte

28

Replication et randomisation, conclusion correcte

@ ''rJ; ~~ du. ~, ; 'i.9Y\_ ~l1J\Q._ S ~'\J)) • -r~\:. \" ~ S~, ten~ ~ J.g_ ,~ too,. b:L _,. ~ ~ de. ~91il ~cl:..~ .

,@ 0R ~ ~ 6&..ter.>& ~\A\ cb dW-l '~(l\.. ~ ~ UuJ...x. d.LL Ug'n\71...Sk

Annee acadernlque 2009-2010 an\:. -1... ,0 < Q: cill..tt. ~ ~ "'T ,~1..1.l\'I... ,~ 14

Irn,~.

~05..~~l~~h ~LTiu".;t!.~LII'I:ti:~~r~hKE-

La pseudoreplication, un piege a eviter

• 4 exemples d'experiences qui ne permettent pas une inference correcte:

o

o 0

2 0

'n ('J

P l t

UC~TlC.s

1 n Tl

17 n

-a'~~~r:'I:I'...'~..t.n ~d~t1~ftrru..-

MAT1375 Biornetrie - Nicolas Schtickzelle

Le design experimental! est une affaire de' cornprornis

---,_-- .. ~

;\billt~ luLlo IhL: experiment

em .•

or Ill,' experiment

,

, ,

,

,

,

, ,

QualilY uf'l.h~ e cpcrireenur! dc~igil

·O~L'!~~~~ .. ~~d~~rn.s!i'"

~ '3)er.)\~. r ~ ,~ t

--t'- (J'ffit. ~ffi_ J£_ ~ ~bn e de.. ~~c.d.. o. '7

Pourquoi a-t-on specialernent besoin de methodes statlstlques en biologie ?

Quelques exemples choisis en biologie et agronomie, heureux mais aussi (trop!) souvent malheureuxl

Annes acadernique 2009-2010

29

30

15

MAT1375 Biornetrie - Nicolas Schtickzelle

PapiUons

• En conservation de la biodiversite, comprendre la dynamique des populations est primordial

• Un chercheur s'Interesse aux facteurs qui influencent Ie taux de croissance des populations d'un papillon

• II a marque des papillons pour quantifier leur abondance pendant plusieurs annees

31

Papillons

32

• S'iI Y a plus de papillons, il ya rnolns de nourriture pourchacun

• On peut done s'attendre a une reproduction plus faible dans ce cas

Correlation

cause

Abondance

a 200 400 600 800 1000 1200

Annee acadernique 2009-2010

16

MAT1375 Biornetrie - lNicolas Schtickzelle

B.I.e

• Un chercheur s'lnteresse au rendernent de champs de ble obtenu a partir de 3 varietes differentes et de 4 engrais chimiques (12 combinaisons)

• Pour obtenir des donnees de haute quallte, ll applique chaque traiternent sur un grand champ

• iLes champs experimentaux etant rares,

11 ne peut en consacrer qu'un seul pour chacune des 12 cornbinaisons

Ble

• U mesure le rendement de chaque champ:

-.:......;.:.. ~[;l ~~
~u 4.2 5.3 4.9
~ 5.6 7.2 3.1
- 4.6 6.8 6.8
5.0 5.5 6.3
-.:.. • l'absence de repetition rend toute conclusion impossible

• Dans ce cas precis, ill est quand rnerne possible de s'en sortir plus au mains. Mais ce n'est pas toujours Ie cas!!

..... 11 est vital de planifier correctement ses experiences I

34

Annee acadernique 2009-2010

17

MAT1375 Biornetrie - Nicolas Schtickzelle

Diabete

• Un doctorant a realise une experience pour evaluer l'influence de la nutrltion maternelle sur Ie pancreas endocrine de la descendance devenue adulte

.' 4 regimes de nutrition pourles meres en gestation: - C: alimentation normale (20% de proteines)

- CT: alimentation normale + taurine (AA tres important)

- IR: alimentation carencee (8% de protelnes)

- HT: alimentation carencee + taurine (AA tres important)

• Diabete indult chez les jeunes

• Contenu en insuline rnesure dans Ie pancreas juste apres le traitement et 2 semaines plus tard

Diabete

L'insuline augmente chez les rats contrcles

8

7

D Juste aprss • 2 s:maines apres

__ traltement traiternent

Annee acadernique 2009-2010

35

36

18

MAT1375 Bicrnetrie - Nicolas Schtickzelle

UC'

unlverslte catholique de Louvain

MAT1375 Blornetrle

Nicolas Schtickzelle

2009-2010

1

MAT137S

BIRA2101 Florence Trurn

25h de cours:

Nicolas Schtickzeille

nicolas.schtickzelle@uclouvain.be 010/47.20.52, Carnov C.157 www.uclouvain.be/guant-cons-biol

25h de TP:

Jerome Vrancken

jerome.vrancken@uclouvain.be, 010/47.92.28, Carney C.135

florence.trum@uclouvain.be, 010/47.36.27, de Serres 8.273

Annee acadernique 2009-2010

1

MAT137S 'Biometrie - Nicolas Schtickzelle

Horalre

.' COURS: 2h/semaine

- lundi 8:30.-10.:30. (SUDo.3; MERCo.11e 22/0.3)

:1 • TPs: 2h/semaine

- Biologistes (MAT137S):

serie A:lundi 10.:45-12:45 (Salle Fisher) serie B: vendredi 0.8:30.-10.:30. (Salle Fisher)

- Blolngenleurs (BIRA21o.l):

serie A (lA, lOA,lOE):lundi 16:15-18:15 (Salle Ceres)

serie B (7A,. BAI gAr llAI iOC).: mardi 10.:45-12:45 (Salle Ceres)

MAT1375 sur iCampus

• www.kampus.ucl.ac.be

• Rassernble une serle d'Inforrnatlons utlles au cours: - Annonceseventuelles

- Pdf du syllabus de transparents

- lien vers diverses ressources cornplernentaires

- Forum pour discuter entre vous ou nous poser vos questions

• Inscrivez-vous des que possible - de d'Inscrlptlon: biom2010

Annee acadernique 20.0.9-20.10.

i

I

1

4

2

MAT1375 Biometrie - Nicolas Schtickzelle

Objectifs du cours

1. Vous montrer:

- Pourquoi les methodes statistiques sont indispensables a la biologie rncderne, quelle que solt I'orientation choisie

2. Vous faire comprendre:

- l.'lnference comme methode de progres de la science

- les principes importants pour assurer la quallte de toutela

demarche, depuis la planificaticn d'une experience jusqu'a l'interpretation des resultats

3. Vous apprendre:

- les methodes les plus utilisees en biologie

- Comment choisir la methode appropriee a la question, la mettre

en oeuvre et tirer les conclusions adequates

Ce que l'on attend de, vous

Face a une question scientifique donnee: - Etablir la/les hvpothesets) a evaluer

- Choisir la methode d'analyse adequate

- En deduire les elements auxquels il faut fa ire attention pour la

planification de l'experience et la recolte des donnees

- Mettre en ceuvre cette analyse (TPs sur logiciel statistique)

- Interpreter les resultats et repondre a la question, tout en

cornprenant les forces et les faiblesses du couple partlculier constitue par « donnees + analyse »

Annee acadernlque 2009-2010

5 !

6

3

MAT1375 Biometrie - Nicolas Schtickzelle

Comment se fera l'evaluation ?

comprehension

recitation, rmules

application ugle (cuisine)

• Examen a livre ouvert en 2 parties

• Objectif du cours :::

- Partie «theoriquexecrtte: questions de reflexicn pour evaluer votre degre de comprehension des tenants et aboutissants de la demarche d'analyse statistique d'un jeu de donnees biologiques

- Partie pratique avec defense orale: fa ire I'analyse statistique de cas concrets d'experiences biologiques: quelle analyse?, pourquoi?, comment?, interpretation>, limites? ...

7

Comment etudier ce cours?

• La biornetrie ne s'etudie pas, elle se comprend

• Une bonne strategie pour l'exarnen: vous fabriquer un resume personnel

qui vous permet de vous y retrouver facilement dans votre raisonnement pour I'appliquer a l'exarnen

8

Annee acadernique 2009-2010

4

MAT1375 Biornetrie - N.icolas Schtickzelle

Supports du cours

'. Syllabus des transparents

• La trame du tours suit lie livre Statistics Explained

S. McKiliup

Cambridge University Press ISBN: 0521543169

9

• Excellent livre d'introduction

• Insiste sur la comprehension des principes importants

• Pas assez pousse pour etre suffisant

Livres cornplernentaires

Statistics for terrified biologists H. van Emden

Blackwell

ISBN: 9781405149563

• livre plus complet

• Didactique: tous les exemples sont lllustres de calculs a la main pour bien cornprendre comment I'analyse fonctionne

10

Annee acadernlque 2009-2010

5

MAT137S Biometrie - Nicolas Schtickzelle

11

Livre en support du chapltre 5

• Le chapltre 5 n'est pas aborde dans les livres classiques

• Modell Based Inference in the Life Sciences

D.R. Anderson

Springer

pdf en acces Iibre depuis l'UCl (lien sur icampus)

• Livre tres abordable

• Reflexion sur la pratique de I'analyse de donnees en biosciences

• Approche statistique encore peu usitee rnais se developpe rapidement

Livres complernentaires

Experimental Design and Data Analysis for Biologists G.P. Quinn & M.J. Keough Cambridge University Press I!SBIN: 0521009766

Biostatisticall analysis J.H. Zar

Prentice Hall IISB:N:013081542X

12

Annee acadernique 2009-2010.

6

MAT1375 Biornetrie - Nicolas Schtickzelle

Contenu du cours

1. Pourquoi a-t-on besoin de methodes statistiques ?

2. Rappel des notions de base

3. Comparaison de moyennes (ANOVA)

4. Relation entre deux variables continues (regression)

5. t'Inference basee sur la selection de modeles

6. Les rncdeles lineaires generalises

7. L'analyse des tables de contingence

8. Les tests non pararnetriques

Annee acadernique 2009-2010

13

7

MAT1375 Biornetrle - Nicolas Schtickzelle

1.

Pourquoi a-t-on besoin de methodes statistiques ?

15

Quelquesexemples simples

• Je joue a pile ou face avec 10 pieces, j'obtiens 3 faces et 7 piles. Ce lot de pieces est-ll truque ?

• I'echantillonrre une population de mouettes, et j'observe 32 feme lies et 54 males. Y a-t-il reellernent plus de

males da ns la population?

9 3 el:. i ~ - \e. ~ 4 cia. s ~ S ? !\jON. 1. rp, c.ili-e.

3cxx:> ..tt. i:a:v If " II Sec d ~ '1 OJ~I) q

\)~dt.\..~

8.) ~\-- ce.qu- CfL ~ I?rvt? <&!n.. l'\'\.Em. ~ ~/4

, • i'l 16

.. ~~. orn-L 0/ en. MSD: de. Jb- rmQ:f'1(I.2.. rrf\o'\'l '\ .Vil_ JJb d'" Jk. ~ ~ (OJ/~:;\ b ('lrI_)

Annee acadernique 2009-2010

8

MAT1375 Blornetrie - Nicolas SchtickzeHe

Trypanosome'S

• Une chercheuse etudie lies trypanosomes, responsables de la maladie du sommeH

• En partlculier, elle etudie Ie role de proteines speciflques, appelees PEX

• Ellie a realise des trypanosomes mutants selon la technique du ARNil qui permet de supprimer I'expression d'une proteins, et donc d'etudier les dysfonctionnements eventuels de I'organisme

37

Que viennent faire lies stats la-dedans 7

Trypanosomes

• Pour verifier que ces mutants sont bons, e'lle quantifie la concentration en ARN de PEX dans lies individus mutants et dans lesindivldus normaux

38

1.4 -
1.2 - .t-
Il
1 ~ -
• t
0.8 -
0.6 -
0.4 - •
I
0.2 1
0 I I

Wild type Non induit Induit 24h Induit 48h

Annee acadernique 2009-2010

19

MAT1375 stornetrte - Nicolas Schtickzelle

2.

Rappel des notions de base

o~/o&ll

39

Variable'S

• Variable = attribut rnesure pour chaque

individu/observation ',",,0.. ~ 1-lJn.\\< (7JA ~~

, em ~\JJ\ c. J.: ee-.

• Types d'echelle de mesure:

- Ratio: Ie 0 est clairement defini: ne peut pas etre <0

- Intervalle: Ie 0 est arbitraire; peut etre <0

- Ordinale: l'ordre est defini: les rangs n'indiquent pas

necessairernent des differences constantes

- Norninale/categorique: l'ordre est non deflni

- Continue: presente une infinite de valeurs possibles

- Discrete: nombre limite de valeurs possibles

40

• E.X·, .~~...lQ TO ! ~" .~ ~~ ~il.9o-

.Jffi (,'..:J -\> I, \f'fI ~

20

MAT137S Blornetrle - Nicolas Schtickzelle

Types de statistiques

41

• Descriptives: Ie but est d'lltustrer les donnees

• Parametriques: on suppose que la/Ies variable(s) suivent une distribution particuliere G!:SfiJ'1UJ,.JL

• Non parametriques: on ne fait aucune supposition concernant Iia distribution de la/les variable(s)

*- 1)e.-:,UtLp'lc~ O"YII? QQ d.evo~. =c:oQ_cu.Q. Oll _Qo. ~ dIL~~

~ c_XJ19R~~ : ~ 1M- ¥'t ~ d'~ '(gn (slf\f\'\J[Sn\:.. ~ c\intu:..\cu...'t- 0 ¥ .~\:. ....tu..

~

f\_ cp.i-CL ~ EbJ~ ~ ~ ~ Qu'est-ce qu'une distribution?

Fonction qui exprime la frequence (denslte de probablllte) des differentes valeurs pouvant etre prises par une variable

~.~

(IJ)

(a)

J - - ~

42

Annee acadernique 2009-2010

21

I La distribution normale I
N
L~
• Tendance centrale: moyenne J.l. = i=l
N N
(_A) Ln-; _J.l.)2 .»
• Dispersion: variance (5"2= i=l d~lUTIe \d.~
N de..d~~'em_
• • • •
. I .
ecart-tvpe I
. .
Hl :<+« (5"=J;;2
(-2) (1"2)
6 1 /1=8 I} to
Differences quared ; I 4 4 I
Sum of the squared differences> 10
Populatiunsjze = 4 ·C'!..UIm"~.f~"''1to
Population vananre=[IO+41=2.5 ~ .... dD i!:~'f~ 43
C·" . In_ ~ U;:;i\.. r:A i9'n 'k:. ~ ak;V0. b.tt..3 J MAT1375 Biornetrie - Nicolas Schtickzelle

La distribution normale

y

-~ -4

-. 0 J 2 if

Quelle que soit la variance, il ya toujours 113 rnerne proportion d'observations dans chaque tranche de

largeur d'l ecart-tvpe (0) !FiT~~~~~~~~~:::{j

I ....... ..,] 4: -1 ~ H ,;2 "-3 pot

~oI ....... ~IIUrIdtittdi~

'S I. J.o. Vd\ (h\:: -\- ~.) -k - A i<..d\-\:' ~p~ neA.ci..t ~ ~ /"rtl..ah ~~Qdu-&~~ rJ/?J.o~.

Annee acadernique 2009-2010

22

MAT1375 Biornetrle - Nicolas Schtickzelle

P-valeur falble, ca veut dire quai?

• Traditionnellement, Ie seuil a partir duquel on considere la p-va leur suffisa mment faible pour rejeter Ho est de 0 .. 05 (5%)

• On dit que la difference/relation est « statistiquement significative »

• Attention: ce seuil n'est pas u ne valeur magique, les statistiques ce n'est pas blanc vs noir, vrai vs faux, significatif vs non significatif ...

-(" \SI...J:. et:>'\- C@1\\:lm \.L

'[;.~'. S~ ~ ~'l:: ~,~ -t> ('/,~\~~

" SJ \ ~ ~ (7;~f'(\~tt~

~\ - ce ~J q .zy:k {\.)1../l'nt.. -+ de_ S_, ~ C>/<. ? 47

Calcul direct de la p-valeur

• 1 sac contient 1000 boules blanches et noires

• On en tire 6 au hasard

• On veut tester l'hvpothese qu'il y a 500 blanches et 500 noires: Ho: P(blanche)=0.5 vs HA: P(blanche);t0.5 4"..~. ~V'n diJue.

Cas possibles

Boule

1

2 3 4 5 6

15

a st. Y\ 0 ..Q0Y ~ _) Q;'n ~ ~t\. J.o. 'f C\' .Q\)€i,'\. ~ JLX

"I(; ~ d/~ s\J~ ~~. ~ ~tM..~

~ 0. ",) ~~k q.~\)~Q~, Add.~\:.~0T\. oe, ~ c;~

Annee acadernique 2009-2010

48

24

Autres distributions classiques

Normale

z

I /\

Ply) I ) \

i \.

y

Student d~6Q_

~~

0.25~ 0.20 P(X) 0.15

y

45

<. ry~: ~?~Q. ~ ffi' ~ ~ ~~ de ~~[e_ ~ ~,~ ~E· ~\\-e::, de. ~~ a\V1 \..I.roJl.-~. cX'Q.. ~ ~ --lliL 8 . .J mi. Q

<;I ~ ~ ~. pe ~ fl,~ c:r;fu._ ~c. ~ b\. ~ \:;u1:_0

fJ::n/<:Jlr ~ q'~ ~ ~.

d.,v- Tout est affaire de probabilite

o.os

Fisher

Poisson

• Un test statistique est une aide a la decision concernant unehvpothese (alternative vs nuUe) ~ ~ c.ern.c:.Qu;ut_

• t'idee maltresse a la base de tout test d'hvpothese statistique:

L Je suppose que Ho est vrale (pas de difference/relation)

2. Je calcule la p-valeur, cad la probabilite d'obtenir une difference/relation au mains aussi forte qUe celle que j'ai observes dans man echantillon (qui est un fait etabli]

3. Si cette p-valeur est faible, alors il est probable que

Ho solt fausse: la difference rnesuree est simplement une mauvaise estimation d'une difference nulle

9 ~::; ~ d) ao temCrl. ...Q.a.o ~ d9..

) " . I ,

e .

46

23

MAT1375 Blometrie -Nicolas Schtickzelle

~') 5!>~ o\:n._\ b.ll:.. 0 ~ ~ ~~(o') d.Q.. .~~

Idl·~~ (£:ILl ~ ~

Calcul direct de la p-valeur

NlUllbfl" ,I' Nl;I.lTIbcrr oJ

bM:k .,.Jh:i~("

;;
- JO
Ptr,{'fi~.I&t: iJ( -!
~'~lljlil:;';fI1 u;~" Li~~I)" h' e
Ihh nlil,;rnlK' V'<I;' I his 'mUh ~
< 20
11M 1!!6 ~
""'" 9,.l.!
• 'lIM L\~4 ~
20),U 31.15 ~
t'l,/b-4 a"4 I to
"'"" 9JH
11 ... I,~ ~
(;.11M 10m. It 0
·C.s.Uo:uJ,~iCD:..f~wu. i!;
ti!m'Ii~Uo~. UNo'o:tt'fi"_' n , ~ J .J ;\ fo

N'Il!l'lb:1' 'lfbbelo: bead ... in II £:IJ'tIp5c i,(';;

• La probabllite de n'obtenir aucune boule blanche sur 6 boules tlrees est de 156% (d\ Vlo·~ ~

• On rejette l'hvpothese nulle Ho puisque p < 2.5% (test bidIrectionnel)

--.") S\ Gfficlc~ .c.Q ~~~ , ~~ ~ ~ 1:\ <0 nsi.\t-

~ • 49

=; ~ (SfIc_Qw.. cf .\~ ~ U * c'R w ¥- d~ {b ~ em.. ~ ~ \- ~I.... 'dc &'M ~1\'\~ ~ rn )e-0t ~ m.u.M.lt .

Passage interrnediaire par une statistique

• Dans ta rnajorite des cas, on ne peut pas calculer directement la p-valeur

• L'al.ternative est de calculer une statistique qui quantifie la difference entre les donnees observees et les donnees attendues sous Ho

• On calcule ensuite la p-valeur en comparant la valeur de la statistique a sa distribution theorique sous Ho

Annee acadernique 2009-2010

so

25

MAT1375 Biornetrie - Nicolas Schtickzelle

Inference a une moyenne

• Exemple: comparaison de la moyenne d'un echantlllon a la moyenne d'une population dont la variance est connue

• Ho: J1 = 110~· H A:/1 ~ 110

Et si les parametres de la populations sont inconnus ?

• Si on ne connait pas la variance n~elle de la population, Il taut tenir compte des biais possibles dus ala taille de IJechantilion (n)

• Statistiq ue de test:

Plus n est petit, plus la distribution est large

Y-p Y-/l

t = 0 - 0

obs SEM /S

car 5 sous-estime G, Quand n=oo, Student=Normale

l'echantillon libres de varier quand on estime la variance (.A)

-::. ro.esm\:1\e. 6' \ ~ ~ 52

s; (l\, ==- co) e-,

~O/~

i CII2IY\:tn:iY» YO\. ck.

, .....

1'Y\C1tI\ ~ ~ .;.k.

g.r~ jr~\- 0Cn ~ cL.:::..-n

c.c-n Ci...~ o.)t.{_ ~ d \ ot. .

f'Iu....~.

MAT1375 Biornetrle - Nicolas Schtickzelle

" ~ gn 0- de.- ~ ) ~ en. -o, d' \~ .) ~ .(gR f?f)\- c_;opclol!L de- J~€I\._ ~.~-

It· 0.@ffi o, dL ~/) e.....to ~em..rru. G<k blem. ~ ) ~ -1u. e€UJLbR_

/J) ~ ) VCfL (/).1;) ).~ e. <n 'Ie; ~/ ~rnc.o~ )LjJJ\_ .Jlc.ntdir> ~

Effet de la taille d'echantlllon (n)

Plus l'echantillon est grand, plus la precision avec laquelle est connue la moyenne est importante

(<\J Intervalle de confiance a

la moyenne reelle ./-1-:

Test uni- vs bidirectionnel

• t'hvpothese nulle est toujours

Lb. « il n'existe pas de » difference/relation ...

Cela revlenta dire qu'une certaine quantite (/-1-, ZObS".~r.;i

• l.hvpothese alternative est soil

- Cette quantite est differente de 0 (test bidirectionnel)

- Cette quantlte est superieure/inferieure a 0 (test unidirectionnel)

b~a\\f\9_d:: 1 ~ fJ1 oo~ d ~ &. ~ : ') __rt.. <, ----W\'I ~~u__~ p'" !YLO- ~d ~ ~ d~ d:eu..x

Annes acadernique 2009-2010

0Y'- 9"1\- ro Q._ ...-x::i \:. cdlcuJ.M._ fA-o . 'AD ~ " . -. .JV>t. d~ .. - I_ e'nN\1 0..

~ I.lJ'I\2. ~l.

; .

?~ A€lR

.I"M- r.cL t ~

U\~~ .iJ- -;:).

S4

27

• Test bidirectiannel Ho: P = POI au t = 0 HA: P :f. pa,au t:f. 0

ptl)

t,

p-val 1

3 1112 ~

0.015 (J

) ~~~ntck

- eb-a

. ~ de. Jl.o. ~ ~L..

Af\JU_ J&_ pc- J en, ~~..J)...J< ~\-

, '-

8..L1Bnr::e -.J.J'U.Z

~tQ_ ct.to. \> rud..

• Test unidirectionnel Ho : P = POlO U t = 0 HAl: P >IJ.OI OU t> 0 HA2: p. < POI OU t < 0

PH)

llSn;Q\I\J\-cl:.~~~ '. JD.:> S,"'/o ~rn\- 'rt9-Qn da.u- ~ <iLL.

'" ~ ~ ~ ~\j/of 0:: - eo CO\. ....Q\l.. ~'\. /1"..QIn. ~ de. ~ \J~ ~ .Nh ~ .

.. rye ~ .J.c. ~ ~\.; r.I < S?'<>.J E:lI\ ~e \\:~ \to

.. Cp- ro) e?\:: ~ • e_ \\e.. ~ \10 c.! Ifm ~ C\.(~')€_ •

"I~ 1.. ~ ~e\€A_ )\o~~~ ~~e-.

~Yo d€..~ (_QbJ?_ ~ 9'<k

Oe. s':to ~ a... ~ \ _.QD-;,

~~de. Q1\\,e_ ~..2.Q:.

t. o-val "i

Attention: Ho ne sera jarnais rejetee si tobs < 0 l! S5

2 types d'erreur sont possibles

• Quand on prend une decision concernant une hypothese sur la base d'une echantillon donne, on n'est ja mais sOr de prendre la bonne decislon l l

• On peut se tramper de 2 rnanieres: ~~JC

STATISTICAL CONCLUSION Rejed.Ho

;r-IvU h~I ... !o(1 3pph .. ·~

uJi h.) p.-ot:h.~b, f .. l.o.t

II('IC h. W1 dffi1 cr !fCI,~rtlC'j'tU

;~ d.t:oRi

ULAnoN SITlJATKlN

""'effect

Annee acadernique 2009-2010

, 0

28

( .

.t------ --II'

7<).\ 0 .

fI tt~~e_ :;; \ 0 .

, <J) ,e0ln-l 6.Lt o de.- --W. .-::bcL: ;=;; 11 CJ .

.. : . 2 ~'L ~

" COm.,em.. (9rI c:lluJ:. Luy~e p .~'t de 1 a ~o

.....p !9'l:1. ~ .!Cf1J'df e... ~ \1-0. tJ,.. = s/'o

.. ~":;'lrJ.b ~ ~ cJe_ a- 17L<9mpl'L ? d..9n L cr-.e_ N<1 /.!L t. ~n.e ~

t_S A.d.L~ == ~.ww\'1e. ~ 1 R . ~~~,_,

l -.J

.~ S <9Y1 o: ~.) \.t ~~

~ '-1VJ\ ~, ~ ....e.,o\. --1c. ~~ de ,Jtc6 €)--erL )-to I?\ ~ r.ct.~

~,,\:. \ R 4 : ~ ~ de /iii( ~~ ~ ~D- dv> bti. \oJ. t~ 'ri A d.ow:> ~ ~N gl .@'h rie ~_ ~

" S\~ ~'0\\J\'W... ~')aLl ",So) <9'f\ OJ.~ ~ ~ de ~L-e_ c\) -Qc.(_~\tl\.. \-\0 " {'(~~ ~ ',0 Cfev:> ~e c/ un\: ¥>

=) \ J ~\:. ~/~ ~ J rm.._OUY\/J ~ \Q_ gC). CWYtlQ de. J.p_ -t9-L.fJe'\_

MAT1375 Biornetrle - Nicolas Schtickzelle

Probabllite d'erreur de type I

STAnSTlCAI. CONClUSKJN

Reject Ho ReIO'" H

POPUlATION SITUATION

oHecl

57

(l Cnnt ~\:. «, tf?) ~ J.c_ ~ ~ .,..;, OJ. ~ 6:2. ~ ~ eJaM cL 0 (.~.I.lL \0 ~\tJ -I ®I em. ~I'(lc.\.. 'm?

a 1-a

• a (probabiiite d'erreur de type I: rejeter Ho a tort) est traditiannellement fixe a 5%

• Rien n'empeche de chaisir un a plus petit au plus grand

Probabilite d'erreur de type II

STATISTIc/a CO eLUSION

Reject" Rota,n H.

POPIJL.A nON enact , .J "-

SITUATION : ~t.J:£ c:bJ._ \-e?r Q._ "

1-~ ~ ~ dQ.~~~ ~

• 1- f3 est la puissance du test. Elle depend notamment de:

- la taille de I'effet: plus I'effet est grand, . r, .... -. 'Ji'L 'I

plus la probabilite de Ie detecter eSt grande ._ '. \ _ ~

~ ~ t- ~ \ e\ .sc- ~ I\Tt.CLL..ti- ~ ~~ ~"., ",.W· """'""

de.- lio . -. --

- la variance: plus Ie pararnetre est connu avec precision, plus la

prcbabilite d'en detecter une difference est grande.

La precision augmente avec Ie nombre d'observation

,LL_' I

I

- .. ~. .~ -

~CI~L~'lOl'h.IU"~ .... trI

~1!"!LI.I'-:.o'\:4 O'TU"~~ urkM~', Firott' 58

.IUt.iI.-.h

Annee acadernique 2009-2010

29

MAT1375 Biornetrie - Nicolas Schtickzelle

Compromis entre a et ~

k'

• II existe un eompromis entre les

probabilltes d'erreur

de type I (a) et de type II' (~)

• Pour un rnerne jeu de donnees, si on ehoisit de diminuer a, on augmentera automatiquement ~, et inversement

~-Nc-~

ffill ~I

.. --..

, ... """

'* S'\ Em rt ~ Jj3OQ. ~E'. o~ tu?2- :r:.J ~ f ~ <k ~pe.. rr " S, eR l' d J en J t10

Les deux grands types de questions

• 3 types de jeux de donnees en fonetion du nombre de variables rnesurees sur ehaque individu:

- unlvarie: une seule variable

- bivarie: 2 variables

- multlvarle: plus de 2 variables

EE. ~do .~ I'XX.n

EE y~..!lk~~

• II Y a done 2 grandes classes de questions:

- l'hvpcthese porte sur I'existence de difference(s)....llf{\'uu.,. ~

- l'hvpothese porte sur I'existence d'une relation entre variables

-'j \-Je rn ~ ~Q~\; ~ ~ A CO? lJ.rn\~

'S' en ~IJ.J'I'&~" '\Q_~ O>-~ @,.~

60

Annee acadernique 2009-2010

30

MAT1375 Biometrie - Nicolas Schtickzelle

Donnees univariees

t'hvpothese porte sur l'existence de differencets)

1.4 -I
1.21 ..
I *
14

0.8
0.6 - I
A .'
OA ~ •
0.21
0 Wild type Non lnduit Induit 24h Induit 48h

Donnees bivariees et rnultivariees

t'hvpothese partie sur l'existence d'une relation

entre variables 3

o 200 400 600800 1000 1200

Abondance

61

62

Annee acadernlque 2009-2010

31

MAT1375 Blornetrle - Nicolas Schtickzelle

Les grandes classes de methodes d'analyse

, ,.~ ~ J:I....

methodes non parametrioues (Chap. 8) r~'t- Vu.... •

63

correlation, regression lineaire (Chap. 4)

test de t et ANOVA (Chap. 3) ? '&\-te ~J' 0.. c\Ib +(0..:) .

modeles IOg-lineaireS}

(Chap. 6) regression logistique

tables de contingence (Chap. 7)

rE!PO

quantitatif( 5)

qualitatif(s}

quantltatifls]

Autre, inconnue ...

q_ualitatiftsJ

Annee acadernique 2009-2010

c&.IS lo~I\O.

32

MAT1375 Biometrie - Nicolas Schtickzelle

3.

Comparaison de moyennes

Test de r ANOVA

65

~ ~~ CDnb1N..uL.Jk~· ~ en... ~ J\.,"t9;\. nl ..J:Q ~ I\~ .JVl\ ttk. .~ J ~~.~ (.",)<_")

Un peu de nomenclature

• La reponse Y est une variable quantitative continue qui suit une distribution norma Ie

• t'hvpothese de test porte sur l'exlstence de differencets)

de la moyenne de Yentre plusieurs groupes

• Les groupes sont des niveaux du facteur/critere X

• X est une variable discrete, souvent qualitative norninale

• X peut etre fixe ou aleatoire:

- fixe: on ne s'interesse qu'aux niveaux etudies, choisis speclfiquernent (p .. ex. male vs femelle)

- aleatoire: on s'interesse a taus les niveaux possibles, parmi lesquels on en a etudle certains choisis aleatolrement

(p .. ex .. Espagne, Finlande et Pologne pour representer I'UE) 66

-------- ----

'3ixQ. ' p; ~ )QCti.Yl'Nfl1lVl1.C2- _Q I -'LxP J 8YlQlL'lO-- cls, ~\J-€J:::t..L..-ea_,;) !ll\. f)1 i (l,,'{OJLx.: q ~ 'U"'" A~', ~ Qrn~\:. .p:n ._QjJ\- - CR_ ¥ ..Qc_ ~ ~ d;, um, oe, ern '3 fOt(-> ~ ...Q/.)\- - U- ~ ~ ~ rooio-.~ C1L ~ UI¥t ck. CWJ fOr ~ .~

___Qo~ ~ .'2,\ \91\. jtU_0£m')J'vr\Qm~. ~ J JLX~ ~ Q 4 0... k:xp <Ck_cJ\.ornUL OLLl ~

Annee academique 2009-2010 ~ ~R2.... ~ ~ :3 ~)d Pr ~ r 33

Techniques de comparaison de moyennes

• S'iI y a 2 niveaux pour X (cad 2 groupes): test de t

• S'il Y a plus de 2 niveaux pour X: ANOVAQ» (Analyse de la variance a un critere de classification) ~

• S'il Y a plusieurs criteres X: ANOVA 2, ANOVA 3 ....

• A~o\jA= ~ <k. __Qc ~CQ.. C~ \9h o ' [(I\~

U\..X~~) Q

~ e: ~ 't -(Q_ ~ ...1c- ~ ~ du.. (;I!..Xe_ $ d.u- ~ \.

MAT1375 Biornetrie - Nicolas Schtickzelle

67

3a.

Comparaison de 2 moyennes

I Test de t paire Test de t independant

Annee acadernique 2009-2010

34

MAT1375 Biometrie- Nicolas Schtickzelle

Existe-il un lien entre les mesures

prises dans les 2 groupes ?

On distingue 2 cas pour les experiences ou une variable continue Y est rnesuree sur lies individus appartenant a 2 groupes (A et B):

- Soit une mesure du groupe A est associee avec 1 et lseule mesure du groupe B (et inversement): les donnees sont dites « pa i rees »

- Soit les mesures du groupe A ne sont pas associees aux mesures du groupe B: les donnees sont dites « independantes»

69

Observations pairees

• Exemple: on mesure Ie temps rnis par des sprinters pour couvrir Ie 100m lors de 2 jours de course consecutlfs,

pour verifier l'existence d'un effet d'adaptation .a un environnement non farnllier

• Ho: iI n'v a pas de difference entre les 2 [ours HA: il y a une difference entre les 2 jours

10 '

19 "1 ]8 J

_ II"

~ 16 J '"

a. 15 1

~ 14 i

F :H

10 -'-------------~

- - .--1

jour 1

jour 2

Annee acadernlque 2009-2010

35

MAT1375 Biornetrie - Nicolas Schtickzelle

!o (£m\fm.Q..._ Jv:, ~ ('I.)g'nt 'fO\.~) en- t>~ ~ccl~ ~ :/'(.D.. <.9rt O .. l.fl..:C.~JL_ ('.~"rruL de. .J!A. \e.\..J.!n ~ ~\c OJ. Jsw- ... -t_~. a.. S{ ~ ~ Q= o.J

~ J le 1)1.' '(\ 0- ~ ck -I Ul......oM- ~efI\JI'\JL.

0.10-0 L. _I\~_

tabs = 0.1247 = 2.536 df = 9 P = 0 .. 032:) 2) ~o .~ uru..;Tl c.a...

)10 -1 (3/ ; e fll' g 0.. ~

L- ----::--- 7--!l, . _1 w.. . I ' ,

• dz_ r d. 0'\)(9.fL

(f Gon~i 0ll.'J He:.:: Jbr> ~ -fun (;;12JvClOfri).- d.u.!v> C1.l.. ~ C!Y1 I'en (, (\.~ .-1. <!l- _\-.n _I~

...... . 1."'"- 1, '- },... '1.A"J1~ =F ~ .r [j' ~

~\; ck. __Qo_ ~ ~l~' St c, .. Oot f\Jt..Ci.. J ~ 0\ OU~ f:O'7 A /4e cle. ne..~

.keu..\..~ d/ ~ 'lJJ'l\_Q.._ -t Ul. UJ./h'. ~ de. AlAe de. rP2-. <:eenc_ 191\._

~ -R_frI- ~ ~' : .~. rna._ o.~jJU1A1"\:. ~. de. .J.A_ .~ l'fl'1.Oi1i ~ •

!b S c).vJt b~dlk~, ~ ~; ~ern\::. ~ ~~.

<!:m 0. a, ~'/' '0

d£_~,0sb(.

~~~~ ~~neul.L

:=) "POJ de .............. ,"'-"-1

de..~TnOlt~ . \\0 .e.-:i\:' r.t'..d.D... ,

Test de t paire

• N'est rien d'autre qu'un test d'hvpothese sur une moyenne :

• Ho:I1D = 0 [la moyenne de la difference egale O)

HA: JiD ;c .0 (Ia moyerme de la difference est dlfferente de 0)

'il ,U-

t!.., "..; n.1 , ...

IJ.J ,.,

ItI.~ ' ..

Ub ". 'I.

'" "' , ..

'11 1';',"I~ In

,'" Q.O

"' , "~

DJJ -fi..!:

...

y. - J1

t ::::: D_ D -St(n-l)

obs s. '

, D l,

I r:--;;',

~vn-l,

• .

rn

jill -OJ

\ O.II:U - ~LCfll,'

.-0.12£11' ,_ ~'Il·"_a

·C5.!.~~"~.a" N"rMlibn(l~._w..,""t'~F'tI;!'"

'iL\!' OJWlI

Observations independantes

'. Exemple: on mesure la tallle de coquillages provenant de 2 )acs differents . ~\:: -CJl_ ~'1.A.JnQ_ 4 ~ti.tobfue ~

Ho: !fI n'v a pas de difference de taille moyenne entre les 2 lacs! HA: H y a une difference de taille rnovenne entre l,e'S 2 lacs

k; 50 1 • • ~ ~eJl'J'l\Q_ J ;~

E I. I .~~~dow:>

~ oG," i

::iI

Gl ::iI

Ill' 30 - ..9 I

~.la.c... ~

f-\u.:.CUJl\..- JJ...Vh. \ e.t ' Qlti..l( d.U-..1ac II ~ d.n... Jo-c__ 8 .

20~------------------

I •

• • •

lacA lac B

Annee academique 2009-2010

72

36

MAT1375 Biometrle - Nicolas Schtickzelle

~', Ho =.. :fri\ talk ._Qffi ClnajeJ"I\f'r!.rL ',~ ~., S I: c) _]f)t /IJ1ri__):. ~ fO} 'a '0 ~ 3 x .tn'l

\ E£O ¥- Je. J\.,~ ~l1!00'l Wt\D:-- J. IJ)., de smvm ' ~ qqi GLL~ ~~ > (9n~~ ~ -k w do- ~-\-- pef:il:L, ~ ~ ,_Qf.)t- dD- B-, S % .3l4CCO c'-V}t ~ .~ . ,~ Jtodelh..~o. ~ ~Cl ,Qe_ ~ btempeA.. €r.lt dz. ,S"/o (~~ ~Q. a c.. 'UJyt ~'~

cp/~ rnJ ~ \P?

~~'.Emo._

3J/fa?o-o::.~

0/ o~ Ll.!'f'&.- + lQ..

ck... S(ll\,"lT\_

_J\.~ ) , 0 )

UJ~.i) ~ \'- m ~

\:l. t'J.> ' ~Q., ~ l?a\: bto.i ' cmci'J r:r( €Q\. ~ ~. Grn \J-.CUlUtCJ.:. Jln.L. ~0 LLryt C!L GY; ~ <...0',) (U;1. \ Cl:IJ

<0\1. o, d£oo. c 3 I ~ton ,r;;UJt \ ffiO ' de- f.R- ~ -JUY\.. ~ e1\- ern\:. 11(),

Test de t independent

• Ho:I1A = 118 (la moyenne des deux populations est egale] HA:{JA .;t J1B (Ia moyenne des deux populations est d iffe rente),

• ~ ~ 0. r.o.. ~f\I)'\.Q_ A (D ~-E.\-\ ., 0-rL.~ ,~ I

~eJl\,rrLQ_ (j(;v.) ;Q - ( YA - YB ) - (J.i A - flB )

Si!nA=nB: t = ~St(n +n -2)

obs .. 2 2 . A B

SA SB

-+-

,nA nB

t = (34.67-40.87)-(0) =-3 .. 287

";" 24.67 28.69 ~+-

15 15

, =0

ptll

df= 28 p = 0.003

73

Test de t independent

• Ho: flA ={JB (la moyenne des deux populations est ega Ie)

HA: J1A :t fla (Ia moyenne des deux populations est differente)

74

Annee acadernique 2009-2010

37

MAT1375 Biornetr!e - Nicolas Schtickzelle

Paire vs independent

• Et si on avait analyse l'exernple des sprinters comme si les observations des 2 jours etaient lndependantes ?

lOJ 20 i .-t> <fJl1 cb h ernl- CL
• •
19 . 19 •
, • ~\k lUI e;rL
.8 ] 18
_ 17 <ii'" 171 • •
-= 16 J ~ 16 • ~~~
:Q. 15 -i ;s_ J.5 J -
E E • • ~~\:;
14 -I I'
e 13~ ~ 13 ! ,
• ~.,
12 - 12 •
11 11 • •
10 10 ~~~
2 jour 1 jour 2
tobs = -0.084 dj= 18 P = 0.934 ~~~I
• .~
I . . • La difference entre les 2 jours n'apparait plus du tout

comme significative!' Pourquoi? 75

.. ~ C1l.. cos - ci.. ) IJ' en.. ~ ¥ _Ii' ~ ~. (;)\-e_ j !{2!\') 0... WNL ~ &Q.~.J\\ 'Yo ~r.,e ~(;= ~~'0

=) ~~~ JlQ..Ie.I.(b:;, Q. ~~ ~ ~l: Q.J.o. ~~ ~ ~ d.anr.>LvrL

M ~~ ~\ en 0. llJ'M_ -f lD... \ ~ I Jbo Q... ~ .• } t9'h,Q_. l.Q.m.Q.. e.. !Vo1.u:in t.Q.. Q..L

~ ~ & ) c_)-Mt qu. CQ):tQ_ plQ. t'I)QL\: ~~ d.£pe_. '&n..S- . \:, cp.tL ).b.>l

~) ~tlefVl- Paire vs lndependant

~dQb1 ..

le.\~ illW\.0J.J\.O --------------

Dans un test de t independant, on integre la difference entre sprinters dans la variation due au hasard. De ce fait la difference entre moyennes des 2 jours para1t faible comparee aux differences entre sprinters.

de.r.> ¥ en n]-1lfT..~. ~roeu.t. ~~

i:~ \ili'l u.m M C€U.l\.PuJI._\€.\~ &3. ~. I\\£X\. J 0"(1 c1b\.l1;u

ell. ~...Sb..t ~ le\ JIe.?~

~¥J'&. .

~~ ~~.

~------------------------------------------~

20 -
19 ~ • ..
• I •
18 - I
<ii'" 11 _f_ · e

~ 16 • •
'" .t. •
CI. J.5 - -
E • •
14 •
~ 13 " • ,
• •
121
11 • •
10
jour 1 jourZ
76 Annee acadernique 2009-2010

38

MAT1375 Biometrie - Nicolas Schtickzelle

3b.

Comparaison de plus de 2 moyennes

ANOVA a 1 critere de classification

Plus de 2 groupes ?

• Dans beaucoup d'experiences biologiques, on veut comparer les moyennes de plus de 2 groupes

• Exemple:

Test de l'efficacite de 2 medicaments pour limiter Ie developpernent de tumeurs du cerveau

12 patients sont repartis au hasard en 3 groupes: - Controle: ils recoivent un placebo

- Tumostat

- Inhibine 4

On mesure la croissance de la tumeur apres 2 mois

Annee acadernique 2009-2010

77

78

39

MAT1375 Biornetrie - Nicolas Schtickzelle

e S'1Q;: ~

}

rroox <¥- I9YL

i~\i'. WIt

OJ 5i en ¥t '3 \-e,-:, D', en \.I.k:, ~ ~ S ~ \1.\ D/O•

Et pourquoi pas une serle de tests de t ?

Test 1

· •



u .,.,...,

·os.~~~.~...uHw.", ~lb-oQII~~tr~

Test 2

Problerne lie aux tests multiples: a (0.05) pour chaque test

Probabilite de ne faire aucune erreur sur 3 tests est (0.95)3=0.86 ... Probabilite de faire au moins une erreur de type I = 0 .. 14

79

1) Con ~}: c\vJ \-eJ~ ~ ~t_ 00\em \It ~ Xab~ ~ (met/:>..2sL ~ C_).D/}b <¥- I ~ u.beV,.e llfllO.-- n1L ~ b de.. ~ .

.. ~Q_ ('\9._ ~\: ~ ~ Jtn ~ ...QJh ~ ~~,

~ ~ (cl.IJ\ ~ }J-~ 0t'\_ ~ ~ VCIL L'Analyse de la Variance

• ANOVA (ANalysis Of VAriance)

• Principe de fonctionnement: comparer les variances pour tester une hypothese portant sur les moyennes

• Ho: Vi, Pi = P 01 n'existe pas de difference entre

les rnovennes reelles J1i des groupes)

HA: ::Ji, Pi =I:- f-l (un groupe au moins presente une .~,'') jR._ JX~~).e OJ....

moyenne reelle u, differente des autres) ~ A ~~ ~'L~h , fl \XYt~'t IO::~~

~~

~ 8~O ~ ~~.

Annee acadernique 2009-2010

40

MAT1375 Biornetrie - iNicolas Schtickzelle

Principe de I'ANOVA

Co\, en f'I\.2. ~ j~ ~

lm\JL do'ib~ ta:

Ck .1) .J1JJt.wJL ,

Variance totale

, .

.

:i~

I~ i"r..N~

~1tf."nI:1 !!I DT~;T~ •. ~-

.jInfT'I! 1 __ L "'(tfpt' ,,_"

.' .

T~

_.

Variance au sein des groupes

(intra, residuelle) 81

Variance entre groupes (inter, factorielle)

J.N~U.R- ~-~ " ~ J _ ,~ It (e~ 'ci 0R ffi.:L cnnbt&lR.. ~.

Principe de ,1"AiNOVA

• S'il n'ya pas de difference entre les moyennes reelles l1i (pas d'effet du ::::: traiternent), la variance entre groupes sera de rnerne amplitude que la variance au sein des groupes car due al'erreur seulement

.If~e_ tJ- ~~~

: : Gr"", .. ", ~.e~t «<

--~~---==---~.---•

I.

• 5'i,1 Y a une difference entre les moyennes reelles Pi (un effet du traltement), la variance entre groupes sera plus grande que la variance au sein des groupes

variance inter .... la statistique de test sera basee sur -----variance intra

Annee acadernique 2009-2010

41

MAT1375 Biornetrie - Nicolas Schtickzelle

Statistique de test

• Formule generate d'une variance:

n

1)V; - yl..... SC (Sommes des Cartes d'ecarts

CM (Carre Moyen) -<E- 52 = ...!..:i~:..=...l _

n -1 __.. df [degres de liberte)

• Decomposition de la variance:

( ,_......, I .... '

(".-.I tII_ ~. ~"'..,_..

21~~[,' l,~·~~_"I'~.c~

su .. it:,._ ..... t~ ................ ,""I; ..... ....-.. ... ~'1!'!j;:~1

.-

til:: ~ I::

LJ

., , .,

, .....

5kpJ~Ttrroul~~IK~ _"~I.lbo::MI"INIhr .. ~ ... ~rin.. .. r~- • ...-tdm.I .... rl>r' ~d!o:-lPkw.unfr..!L ..

.... -

" • ....- ~ ~l s-~~

1,;,1,·,-1'1',',"-"1,,1· .~

(C!Ii!IUI 1~ ",...~ I .kr.I, ..... ""

~. ~~~. ,J ~~. ~ ~

·OJ.~1:XtIo,nD'ld.a;;Iw"W'l pMriub:.d.cnbI'I=iI~~I'fFnss'"

Annee acadernique 2009-2010

84

42

MAT1375 Biometrie - Nicolas Schtickzelle

Un exemple decortique

Ho: 'v'i, J.1i = J.1 HA: 3i, J.1i *- Jl

Source of variation

Slim of squares df Mean square F rario :l'rob~b.ilily

35

Among groups (treatment) n

Within groups (error) 30

Total 102 11.

2 36.0 10.8 0.00'1

<J 3.3

11

* Sc. T z: ScF -\ SG'R Id.i = '=!a. +30 C\'oW_.!L p;tvL _:Qo-J d~ .

Si ~ 6)~ du. \.:u::L\eJmam\.J ~ cu.:u::i_\: du.. ~ ~ Ai) ~ ~ ScF.Q..\:. .£C~ ~ 9lL ClL'\<i.t dii- CNeJ\. \1JY\.. ~t de...{_. C9'\ en Q.... \0 I '0', __Qc.. 4- L'L du.. ~ \eJm.om t. ._QJ)\:; \0 "j. -t- ~e. ~ ~ ck. J! ~ {'fY\a/J 8l\.. 0.. ~ 4}ACCO ck. dI.n\'l. tn. ~ (it ~ f\J1.c.L ='> 0n. fUj e_ + e. \1 0

~Q_ j o, 0.; !'meJi1. usn ~ g-u- o, l..lJY\n_ ~ Met/:>?

ANOVA 1 vs test de t independent

• Conclusion: '.,~,,,,,.,,,,, ..... ,,~

pt:r"'''p;ilrld~t.rh.,.t(F-~-

P < a.os) donc relet de Ho: iI existe au moins un groupe qui a une moyenne reelle J1 differente des autres

(du moins je Ie parie avec une probabilite p de me tramper!)

•. Oui mais lequel ? Un test cornplementaire est necessaire

-.QI)-l UJYUt.Jl)l. Kl')y::); ~ rqv..) :~. ~ 0-

~~&>. tb n1\, denrnk.-:l ~\:. ~~~?e ~) ~ Q j-.L();;mt.

,

"7> I'm... rm.a>1

, ~qut A t-b\J (t (X.. hn<.. (Jw'\ ~

1.- ---'86 ~.J m f'I\.O..

d!P~~~ ~ 4 u? <£)--D.\:; (2)

~c. en f)\L ~ ~ ~~ ltrn \etJl u.m \d.iA.ediet'4~

• S'il n'y a que 2 groupes dont les observations sont independantes, test de t independent et ANOVA 1 sont equivalents

• Fobs = (tobs)2, les p sont identiques • ~\¥ C..o\ Al\}oVA

• Attention:les deux tests ont la rnerne Ho: J11 = J12 oe, 1:;

mais seulle test de t permet une HA du type < au > 1- Si on veut une telle HA unidirectionnelle

au tester une difference entre moyennes autre que 0, alors seulle test de t convient

:.) ~ V : '» <. EO... -:/:. d.e'l\l\WYtl ~ ffit. ~~

Annee acadernique 2009-2010

MAT1375 Biornetrie - Nicolas Schtickzelle

3c.

Hypotheses de I'ANOVA

A quai faire vraiment attention?

Hypotheses de I'ANOVA

• II y a independence entre toutes les observations, aussi bien entre groupes (niveaux du facteur X) qu'entre repetitions. ~ ~ ~ .u, cleo ~-Q

• La variable Y suit une distribution normale

• La variance de Yest identique pour tous les groupes (hom oscedasti cite)

Annee academique 2009-2010

87

88

44

MAT1375 Biornetrie - Nicolas Schtickzelle

3d ..

Comment savoir quels groupe's ont des moyennes differentes ?

Comparaisons multiples (2 a 2) Contrastes a priori

97

Comparaisons de moyennes

• Sl I.e test de rANOVA conclut a I'existence de differences significatives de moyenne entre les groupes, il ne permet pas de dire quelles moyennes different

• 5i Ie facteur X est fixe, cela a un sens de vouloir affiner Ie resultat et determiner quels groupes different

• 2 methodes de test frequernrnent utilisees: - Comparaisons multiples de moyennes 2 a 2

- Contrastes a priori C4.) .

NB '. _a.w.t Q: ~~ ell- J24t d ~.' \-et.... p:q ~. 0. -'rde c.lan .: ~I • _.n<oO .... \en.. u...rrn. tcna.t.L 1'0 I /!.J4.~. ~'rf_ ~. c..at eM. 0. c_i_.~ _eg_!

\.4 Illtll.A..I'L . I -II. _ ..-t~_./ ). .... I

c.cn ...2X1:n..~ fJ J ~ UJ{./J "':'.,vuU/.! ~(l.. ~~ . .;_,

ll/Y\ I\Jtci... ~ ~ /o)~\: ,€t.Cf-! e.,

- - -

~: U9'mp:nPA-, _to.. )toc..a_. J_..£t 4 M. ~. 0... U'U.L .~

~ _A_ (£) Jli: 't ~t.J.Q e: , + ~'€tYI.\:. (9'(l ctt.{c9... -1- ~~ ~ qu.- /X.t£L ~ - i. 'lI'ruuem \-l

Annee acadernique 2009-2010

49

MAT1375 Biornetr!e - Nicolas Schtickzelle f) ?

c\\~ : \f'rJUeIn~ ~,~.; rYO\....

d. ~: 11'1\lVeJr\ \-eL C1.L (9 -1 • " _.. 4

........ s: €lY\ a.;!, ~ " (; ~. ~@ efn ~t:. ~ ~~ ,ID 8't1 0 do-?

·c.lonun ci I 0Jait_ ~ ~ (_ cu.0 lQLLx eLl. ~ J\.cno,.d)

4'- Si ct ~ ~5· . ~~!M.~.~ U9'1\J'I1~~ q{ ~Md

CO\..etv.> C0Y1~

~~e.~\:..

.~.!L

Comparaisons multiples (a posteriori, post-hoc)

• On teste toutes les combinaisons de 2 moyennes

• Ho: I1A = 118' ou I1A - 118 = 0 HA: J.iA ~ /18' ou I1A - 118 ;t 0

• 2 problemas:

- Tests multiples (on fait un ensemble de w tests),

donc P{au moins une erreur de type I) = Ciglobol = 1-{1- cxindividuel)W - Ces comparaisons ne sont pas independantes les unes des autres, donc on ne peut pas connaitre CXglobo/

• Plusieurs methodes ont ete developpees, qui forment une serie depuis les methodes contr61ant te Clglobal a celles contr61ant Ie (Xindividuel

99

Principe des comparaisons multiples

• Ces methodes fonctionnent sur un principe similaire: - Calcul d'une difference seuil q

- Si IYA - YB I> q, Ho est rejetee: IJ.A :t /lB (A)

•. Pour certaines methodes, q depend de la difference observee entre YA et YB (p .. ex. SNK, dassique en SBMe)

• On illustre les resultats en connectant les moyennes non significativement differentes par des barres ou en leur attribuant une me me lettre sur un graphe~)

9.0 Control I
Diameter 6.0 I\'eyrohib
(mm) I C:~)
3.0 Milo,top
~OS.~IIOl»..teD'Q(I..I:IId""" 0
,*,.m.t:i::ItIt.l~.:ft;tun"'1nlI)'fraJ;· 100 Annee acadernique 2009-2010

50

MAT1375 Biornetrie - Nicolas Schtickzelle

Les principales methodes de comparaisons multiples

• Certaines controlent Ie ajndividuel' d'autre lie aglobal

Puissant; grand UgJobal

Peu puissant; UgJDballimite a 0.0.5

aindividuel

0.0.5 7

<0.0.5 <0.05

>0.0.5 7 0.05 0.0.5

..-"--, ,--"--" ,-----"----.,.-----"----,

Fisher LSD SNK

Tukey Scheffe

Bonferroni a

a b b

9.0

Corurol

a b

a b

a

a b b

a

a b b

Diameter

(mm) 6.0

NClIf(lhib

c

c

3.0

MilOSiOP

·C1.s. ...... ~~W'\.';,p'""""'w .... .1h ~rn.i<~"'"t:lQrri;t'(~L!......-~tl'foo;H ••

rnoyennes moyenne

de rangs de rangs

vo isi ns extrern es

Essayer plusleurs methodes et etre prudent en cas de desaccord

101

Contrastes a priori

• Plutot que de tester taus azirnuts des differences entre groupes, ll est preferable de tester certaines differences ! correspondant a des questions particulierernent lnteressantes preclsees independamment des resultats

• On appelle ces questions contrastes a priori

• La question peut porter sur p!lus de 2 moyennes

• Plus generalernent, Ie contrastr est une cornbinaison lineaire des moyennes: L b = "'" c. . Y avec" c. = 0

05 L...JI I L...Jr

i=l

Annee acadernique 2009-2010

102

51

MAT1375 Biometrie - Nicolas Schtickzelle

Un exemple de contrastes a priori

" Une rnernorante a etudle lie papillon Tircis (Pararge aeqeria} dont les males presentent 2 strategies de recherche des femelles: perching vs patrolling

" Elle a pese des males des InJloids

2."~---------~

2 strategies dans 2 paysages .as

• ANOVA 1 critere avec 4 niveaux:

F3-65 = 2 .. 18, P = 0.098

I

• •





• I

i

I

· •

""t,- __ ~_-~~---,J ""'"

gr.Qup

Un exemple de contrastes a priori

3 questions etaient deja d'un interet particulier avant l'experlence:

1. existe-Il une difference entre les 2 strategies?

2. existe-!l une difference entre les 2 paysages ?

3.les differences entre strategies sont-elles slmllaires dans les 2 paysages?

1. Ho= IlpatA-:'l1patB ,= ilpeA+J1pe8 au IlpatA?j1patfJ-JlpeA-J1peB = 0 HA: .l1potA+J1.putB ~. J1.peA+J1.peB au I1patA+fJ.patB-J1.peJj-fJ.peB # 0

2. Ho: I1putA+J1.peJj= J1.patB+flpeB au .fJ.patA+fJ.peJj-fJ.patB-J1.peB = 0 HA: flpatA+fJ.pel1 # flpotB+fJ.peB au fJ.palA+f.1peA-fJ.patll-llpeB ~ 0

3_ Ho: I1patA-l1peA= I1patB-llpeB au Ilpat/CllpeA-flputB+PpeB = 0 HA: J1.parA-PpeA ~ J1.patB-PpeB au fJ.PalA-fJ.peJj-J1.pat8+J1.peB ~ 0

Armee acadernique 2009-2010

....

104

52

MAT1375 Biometrle - Nicolas Schtickzelle

105

Lava ntage des contrastes orthogona ux

k

• Des contrastes sont orthogonaux si LCIA 'CiB = 0 i=1

strategies ? ~i:!;

pavsages? I ~

effet strategie similaire dans les :2 paysages ?

1 1 1

1

-1 1 -1

-1

-1'

-1

-1

1

• Le gros avantage des eontrastes orthogona ux est qu'ils sont independants run de l'autre (si n egaux]. Done on peut controlera la fois Ie Clindividuef et Ie Clglobal'

106

Decomposition de la variance totale

SCT

~

SCF SCR

~

SCl

SC2

SC3

-

-

-

-

-

--

Contrairement aux comparaisons multiples, cela a du sens de faire des contrastes a priori merne si Ie test de I'ANOVA est non significatif!!

Annee acadernique 2009-2010

53

MAT137S Bicmetrie - Nicolas Schtickzelle

3e.

Comparaison de moyennes avec 2 facteurs X

1. ANOVA 2 croisee

• ~ ~ rt\L r.ent: ~ ·c.et1\f?tit.u.~~t. +1;; Ol·.~ 0.' tl.r\. ~ ()noln de. cewtb \ ~ ~ O!. f: t:r,

en ~ 0Jt0J._)(. dt.. 9. ~~ I

Reprenons l'ex, du Tircis

• Une rnernorante a etudie Ie papil'ion Tircis (Pararge aegeria) dont les males presentent 2 strategies de recherche des femelles:. perching vs patrolling

• EJle a pese des males des

2 strategies dans 2 paysages

• ANOVA 1 critere avec 4 niveaux

• SCF decomposes en 3 contrastes orthogonaux

i'''pald •

. 2D~

.2..

...

• •

· ·

I I

i

I

• •



...

....

group

Annee acadernique 2009-2010

107

lOll

o-i, lo?;, IlO.

S4

MAT1375 Biornetrle - Nicolas SchtickzeUe

lndependance entre observations

• Si certaines observations sont liees entre elles, cela va bialser lie test car la p-valeur va etre erronee ~

• Difficile de prevoir dans quel sens ira Ie biais:

- Sprinters: differences sous-evaluees car la variation entre sprinters est integree a la variance d'erreur

~e ~ CWll ..Q.tl'n A .81\ ('NL ~ ~It. '{OJ. Qm .~ LLIY\ ~ •

- Coquillages: differences sur-evaluees E 5O-

si les coquillages viennent d'une famille"i ,.' par lac car Ie nombre de repetition est ~ 30- alors en realite de 1 (1 famille par lac) .3" I

>D- •
I •
~ I •
Ii J'Si"l
E
~ I'

"
jour 1 :

I

jnur.2
i

taea
89 lndependance entre observations

• Planifier l'experience pour limiter les liens entre observations

(p.ex, eviter Iia pseudoreplication]

• lntegrer dans Ie modele d'analvse tout facteur qui cree un Hen entre observations

(cf exemples de plan en blocs aleatoires complet, vus + tard)

Annee acadernlque 2009-2010

!\.,cltu.u._ €tk. cd c! &: (i);.)I\. ~ d/ uJ'l\:Q_ ~ d' ~h_OO~n__

90

45

MAT1375 Biornetrie - Nicolas Schtickzelie

• ~ ~ (l).£c. ~ rf1L r'\X:U.lcnu ~ k ~ 1l9nt:.:J ~ '-

• A.~\d.un e- (A. cp.! Ie Jtoo"re. ~ .~ Q..~ ~ ~ ~ Q..L ~ ~ -1. ~ - ~ e du.1J19 tf£-

?~ eY\. ~l LQ.O.Q ~ . ..Q.an ::, ~) ~ Ju..arr.~ ~ ~bLl b..c.k.0

Y suit une distribution normale

• 5'il existe des differences de moyenne entre groupes, elles fausseront la forme y de la distribution de Y

• II faut done tester la norrnalite des resldus, et jamais des donnees brutes (Y)

• S·,...to. dh~o eL ~ --t> en aoH~l um.. ~- ~ ~nn&~~ ~

Y suit une distribution normale

Comment tester la norrnalite 7:

~X-Plot

L~

- Examen visuel de la distribution

y

- Test statistlque,

p. ex. Kolmogorov-Smirnov

,.

Annee acadernique 2009-2010

92

46

lrcl' \

- i"" ...___.

JiA -I- d:.. L

Mn~ f

... l: .. k:, • Ne pas se braquer sur la normallte a mains que la

/.Pn f distribution soit tres asvmetrique, ou multimodale au theoriquernent non normals (p.ex. un ratio]

Y suit une distribution normale

• Voir si une transformation de la variable Ypeut normaliser

et/ou rendre les variances plus egales:

- Racine carree: si l'ecart-tvpe est proportionnel a la moyenne

- Logarithme: si la distribution est asvrnetrique positive

- 1.1 Y en a beaucoup d'autres possibles .....

• L'ANOVA est robuste a la non-norma lite rnais si les deviations de norrnalite sont vralment lrnportantes, utlliser les equivalents non pararnetriques de I'ANOVA

Egalite des variances

eMF • La base du test de I'ANOVA est ~bs =-CMR

• Le CMR est calcule a partir de la variance des ecarts entre repetitions (relatifs a, la moyenne du groupe) pour tous les groupes sirnultanernent, car on suppose qu'elle est reellernent identique pour tous les groupes

,I 111:11 1"111'11.0

(':T8 I,:: !,1

[I:: G I"' L.J I~D

I .,

00r.I0._~ ~ i.:iah,~ 'I" __ ",~

I'I'I'I'I+I'!"'I+I'I'I' ·E

·O:i.kJ.: ~lQ35.,'r;>'.~ ... ,\h

~dClrft.ft~~'Ur.r'll!!.l~ SiI.>p,~fk'-:_I-~ft:!"I:iIl.~ .. 'Il"_"~'\l

Annee acadernique 2009-2010

941

47

MAT1375 Biornetrie - Nicolas Schtickzelle

~. . . 't/~ ~i u.~t .-V)'~ ~ :...tc 1-01. \~I ~ u ~ ~l·ln.ep ~

I ~ _) JXQ.fdL .~ pQM. ~ c::l.uA. OL .J\o1oLd_. .'

~ .- 't/·· I ~) ~t~ Q + d} ~ qt.e..1')2.U.i ~ .h.. ~-JOt£l ;J COt.l9'n. ~et\t

-I> e\ Ie. .. ~"l: ... ~~ d.u.. :3.f.. ~.

~dJuL...tJIL .

~.10, '3 '~ pswt" ok t1JfL J! ~p

-1> ~ . • 51 certains groupes ant une variance plus grande au plus

ttTI\Il... d.D/3~ II petite que les autres, cela va biaiser CMR:

tiJ·/A~A ei_.' - Sion indut dans I'analyse un

)0.-... -' •

, •. L-f1.CJJH ~i .

_tt if I~ ~ de-

J, "

~ ~~!11\.0'\.

bar.,~ ~ I

Egalite des variances

groupe avec une variance superleure, CMR augmente; done les effets sont moins signlficatifs

tl* til

9S I

~ ~ cwa..Jrmtl, --frn .. nn. ~ de ~ . ...L.:t~} JL h9u.l: t/1t cJz~ ,r.,\ (jy) .;. ~~ ...L ~ cu.. ~ ..AJJYl1qwrme-nl:. -b -ton =ItA. ~A9'n'c 'fJ>'l

n; ~I"f\~ f~ . ~ 1"$.~) e'ft -t:Fll- UIIl It'-ot f? l,b-:, ~~

t

f

CMFICMR

- 5i on incl:ut dans l'analvse un

+

groupe avec une variance inferleure, CMR diminue; done les effets sont plus significatifs

Ega lite, des va ria nces

• On peut tester l'egalite des variances des differents groupes par Ie test de Levene (NB.: H y en a d'autres)

" Base sur une idee simple: ANOVA 1 sur Iy· - VI

"." _ ~J J

,!II 'Hi

Conlml 8

1

7

8

Tumo.r,,( Inh;bin 4·

2 2

I I

i ·i

2 2

i[!J •.•

--IT1 _ ___,,:c;,_. ".:_;' - r--1

._. ~

... '"

r.-;- [D

•• I

·C$..~~t~ .. r. ~"""'gj~.:!iJ:IJ~trFo-n.'·

_,

• Si l'heteroscedasticlte est vraiment importante, utillser lesequivalents non pararnetrlques de I'ANOVA

~ ~. <.dklltlaL. A »a:a' df~~(£.. ~

qtJl (A. ~ n~rn·~~ .

• S

Annee acadernique 2009-2010

96

48

MAT1375 Biornetrie - Nicolas Schtickzelle

c-

=-- '\ ~;/~

r:-_----=DF:---:: ...... ---:.::-::III:-.:_:---:-_--::-._::---::- ... "":"'~., ~ ~ d\ l~

-

-

1:1 y a en fa it 2 criteres X

• On aurait pu structurer l'analvse autrement puisque les 4 groupes sont en fait 2 strategies * 2 pavsages:

ilya2

pat pe I

Groupe

patA patS peA IpeB

• Correspondance avec la decomposition de I'effet en 3 questions:

1. existe-il une difference entre les 2 strategies? 2 .. existe-il une difference entre les 2 paysages ?

3 .. les differences entre strategies sont-elles similaires dans les 2 paysages?

Le principe de I'ANOVA 2 est similaire:: decomposer la variance totale

SCT

~

SCF SCR

~

-

-

- • I

SCi

SC2

SC3

SCA

SCB

Interaction A*8

.. re ~~.J:!. ~" ~ 'f ( Sc..R ~~t\:. Gk d.VLe. rl: e ~ 0.. lIJt'\.c.. FCA. de. ~e...

Annee academique 2009-2010

109

110

55

MAT1375 Blornetrie - Nicolas Schtickzelle

Notion d'interaction

• Une autre experience, avec un design similaire: effet de l'hurnidite et de la temperature

sur l'activlte des cafards

A (temperature)

B (h 1r'ldlte)

111

Notion d'interaction

• On entend par interaction entre A et Bun effet synergique, cad que I'effet de A est module par B

(et vice-versa) ..a) EX '. J..' ~~ de.-Q.' ~\ di'rl au..

~ ~ ~~-~~. ,., [

• Sans interaction, I'effet de /'" ... -~ ,i) ":9. ~.Q. \I.M ~. ~

I '_~"''''''''' ~ I ..... , •• ~ ~

la to est slmilaire a 33% et ~ .... / _·.,n'" ---- ~

-- ~' i d'"\(. 01\a.:, )k'

66% d'hurnidite

~C\\fl ~c1~aaJ(~\~ '" ,~,,,,, • ,elJGn .~.

• Avec interaction, l'effet de · I

la to est different a 33% et ~~- I --- __ _._ ~_'"_'''

66% d'humiditeL: __

'J

·iD"-~'upl~'4"'IIIdt.Dd .. ~ ~·~_do;~~-.:w...n.'t-tFTI"H'"

112

. af';I'f\~~\sn, ilO'J\;~I~ /&lAJ.'Q~ ~J.Q t4 -tk: ~ ~ .A~ d.iJ.A.d:: latA ~ ~,

Annee acadernique 2009-2010

56

MAT1375 Blornetrie - Nicolas Schtickzelle

-e s, .. 4.St1;.l1C1:!!IIY..,rt~w.l:'i ~d.c-c.-o:!p~11ti.1"'

Decomposition de la variation

SCT 0

»<: ).Ji!> 2)Yi. - y)2

/ ~ On suppose les ;;1 effectifs egaux

SCF SCR "".' ----.-------!...-----c

, ....... "".-1

~

SCA SCAB

0-1 (a-1)(b-l)

,0 ~\Q\t£ \~~Q.

b ';:. (). "Qrle e. ,"

{'C\ = {'n "'"' I ~ l~ •

.. .. .

SCAB=SCF-SCA-

113

..

~

F =-obs(B) CMR

So us HOI FB ~ FS(b -l;ab[n -1])

Realisation des tests

Annee acadernlque 2009-2010

seT

~

SCF SCR

~

SCA 0-1 =CMA

SCAB (a-l)(b-l) =CMAB

CMA

F ---

obs(A) - CMR

So us HOI FA - FS(a-l;ab[n-l]) FA ~FS(a-l;abn-ab)

.~ 4-

Nb total d'obs Nb de groupes

: b dt. ~~.

CMAB F =--

obs(AB) CMR

Sous HOI FAB -FS({a-l][b-l];ab[n-l]} I

114

57

MAT1375 Blornetrle - Nicolas Schtickzel!e

Re'5ulitats pour l'exemple des c:afards

\'0 = (). . \C. ~-\~ a..:.~ b '='2:. (\1:.2:1

56 hurnidite

99

-t- ipI, "?c. ~"=. ~Jn ..,wp..J..A ~eJCL -l. ..Aft ~ \ 1\ ..Jll. tu-

<.<~ ~) Au. lWl~ i~dfn~

~lt-;,-~

l. Co\. ~\t ~ Q, S ~a.I~\Q''ri ~ ..Da..

~~~~ ~u..

'longueur ~r---------------~

-

2Il 15 10

-

-

-

ij -

I 'Ie mperatu re .20.,30. _40 I

ne correspondent pas aUK donnees)

.' II ya un effet slgniflcatif dela to, de l'humidlte, rnals pas d'interactlon entreles 2 (l'effet de l'hurnidite est identique pour Ies 3 to et vice-versa)

• a>2 &, b>2, done pour savoir ou se situent les

differences, il faut utiliser des eontrastes 115

Illustration des effets possibles

A B

_-- =~lJ'I

A B A*B

B A;B

A

Interaction: I'effet de la to est nul a 33%

~"I-.II!Id'J"

.. ,_ d'humidite rnais fort ,a 66% d'humidite

'" lJJ

T~I'["I

~Q.s.M;;II;iI1..plCth."IV~I$ ... ':-,=" ~llhl.d~I~T(Ftat·

Annee acaderntque 2009-2010

116,

58

MAT137S Biometric - Nicolas Schtickz.elle

Attention a l'interaction

·D!.~lCll'l.r~~we. ~"";d~l)~trF.",,.·

L .

,. Iii'

Co!Ail:l~h _ _ _ .. ul'ln:Jr::Iwll.

:Jt".llvnr IU

I.~ .' ..

, ,

---

ro )0 oIQ

T~fflJ":'f1:IIILlrtr"C,

~. ..

~~~7;Joarll~ -:- - (rr~rP:MI

I ~ .

..

interaction A*B significative: done A (to) influence la taille rnais de manlere differente

pour les differents niveaux de B (hurnidite]

A apparait non significatif

B apparalt non signlflcatif

117

• Une interaction peut masquer lies effets principaux des facteurs

• II faut etre prudent en interprets nt les effets principaux s'Il existe une interaction sign ificative

Diverses formes d'Interaction

A.<2:i r?1c.f'·' ~ <hie

I

~ cR. ~.R!t:. ~ A

t.. l/j ~~cuk.<:IO

;- ecn~

B,

x

118

Annee acadernique 2009-2010

AI ",}

, ~-.e.~Q

S9

MAT1375 Biornetrie - Nicolas Schtickzelle

Fixe au aleatolre ?

• X peut etre fixe au aleatoire:

- fixe: on ne s'lnteresse qu'aux niveaux etudies, choisis speclfiquement

- aleatoire: on s'interesse a taus les niveaux possibles, parmi lesquels on en a etudie certains choisis aleatoirernent

• Les tests de F sont differents da ns les 3 cas possibles:

CMA/CMAB (. .... 1

CMB/CMAB CMAB/CMR

CMNCMAB CMB/CMR CMAB/CMR

CMB/CMR CMAB/CMR

l~) ~ 'Itn\c.. - 1+ cenb..1.. ~,",YIA~.

- (?;)" , ...

_ ~/.\ ~cxk.0 c:.emou.. ..h.. ~ \ d.u~~

119

Pourquoi 'I'es tests sont-ils differents ?

• La statistique de test doit repondre a 2 conditions sous Ho:

- pouvoir etre calculee

- suivre une distribution eonnue (J\

• Par definition:

SCX/EICMX]-x2(d!X)]. CM1/E[CM1] .. .

x} / dfl __ • 'r~ u_. >- cssz Icrrllnl - F5(dfl;df2)

-. - r:;'\OIJ.·OIL)) '-, '''-I '-l'-'V'L,.J (" ~

x; /df2' .

• Done pour pouvoir calculer Fobs! il faut choisir 2 CMX qui ont la rnerne esperance E[CMX] sous Ho

• III existe des methodes pour determiner les tests pour des rnodeles encore plus cornpliques

120

@ I ~
-
,
-
,
C °T
~ u.k. -

1

c

MAT1375 Biornetrie - Nicolas Schtickzelle

3f.

Comparaison de >2 moyennes avec 2 facteurs X

2. ANOVA 2 hierarchisee

121

• A et B sont dits crolses car chaque

niveau de A est applique avec la

rnerne signification a taus les riiM_ft niveaux de B (It.'

• Best hierarchise .a A si la signification des niveaux de B change d'un niveau de A a l'autre: 1 animal ne peut a la fois etre mouton et chevre, done 1 n'est qu'un nurnero

..... Un facteur hierarchise ne peut etre qu'aleatoire I L

<5, e5'l'\ ('l\L \NJS(1\ en~ ~. Q).. ~ O\d.l ~...Q..'lC ~ ~ J c.~ rn ~c.

~ AI Q I ":I ~ ..J(s_ . ~ I ...h. Q." .~ r\):\ e.uc.) ., " ~~22 ~CJt.eIv.;IUL

lA) n~\~ F=- fIJtUk. d.lJ.L~ ~ ~ ~ ~ en nsAt=.. ~ ~ ~e. It ~

.J&.~ ~ .~e ~ A.svk ~ ~ ~~ fC'?\ ~ ~..Al::. pR..

~ ~ ~' ~ Q. Q.J.,.c.uff\.. ~ ..Mt\~ _b.. .), tI\ ~ ....oJ: ~ .J.. Il ~. <att ~ ;~ ~

~ # c..~ c:v-.' 1;\'\ I.wl:= lO1 ~ i \ah. d.crrn wh.. c.cn ~. 'i~ \l'I.uffr\ b..en ft'I) Ie

Annee acadernique 2009-2010 ct n'cr"-tf..C"OtiPm. b\~i9-l~' ern fO'" 61

Facteurs croises vs hlerarchises

pat pe

Un exemple d'ANOVA 2 bierarchisee

• Effet de 2 vitamines sur la croissance des crevettes

• Contrainte pratique: il n'ya que 9 bassins disponibles, donc chaque traitement est applique dans 3 bassins (eontenant 100 crevettes ehacun)

o

o

o

Contrfile (nourriture seule)

Pond A

Pond B

Pond C

PondD

Nourriture + vit. A

000

o

Nourriture + vito B

Pond E Pond F

P011dG

Pond H

Pood I

~1O;L"""'''J~Jo;n.''ft;I'~aitrJ perorlJ.l,i;;nrJa..g'IrJf.I,I~R'I!'U~

Un exemple d'ANOVA 2 hierarchisee

• Une ANOVA 1 avec 300 crevettes par niveau du faeteur traitement est inappropriee car il peut exister une variation entre les 3 bassins d'un merne tralternent

• Une telle analyse serait pseudorepliquee: Ie vrai niveau de replication est le bassin, pas la crevette

• II faut done garder ie facteur bassin

Annee academique 2009-2010

123

124

62

MAT1375 Biornetrie - Nicolas Schtickzelle

Un exemple d'ANOVA 2 hierarchisee

• Une ANOVA 2 croisee ne convient pas car Ie niveau

« bassin 1 » (ou « bassin 2 » ... ) n'a aucune signification

commune pour les 3 traitements .

~~. ~ - '1b? ,QQ. ~

:~~J;I: '\e\ ..Qe.? I ~1Wa.1I

l>ilJnlm Po

-~ ~ ..l.._ .JHn·

wn 5....-~rta~ f"W'.J..,..

IPIII,J ,\1 IMl'r::I.''tl' EI"'IhIIJ

ICo(tl'l.I.wn...

;l'unoJllJ

1'(' .... lIui."1

I 125 I

I

126

~ ban'! Il\.. c..esn~ - jJ. 0i!5YI~~ .)

-+~ 4 ~~In C.

I - fi- Gern~ -\- •. _

+ ~.QI\ \:::an '\ m.. V,t ~ - fi. t\li.\:. F\) ~ • , -

. A ru(t. SJ... ~ rh ~rt"\

'\1:n c1,\~~o. ~ ~ ~et~ darn.x .~Qe.lb,

CO"t\ ~ ~ ~ d.lin~~ JI ~ ~ \:;on\{'l\. at. J1': rn~; EP"\

Annee acadernique 2009-2010 63

Irt'Jllllrlll

nc ... lmrnl

• Le facteur bassin est hierarchise au facteur traitement

~as..M:J.:lL9~r~ •• d\ pettntloll)"1d~e~Fr"''II'

.~ '&U.\e ~eK\\.d:.'en .(V}\:. ~ ~ C.Q\ ·1SVl Nett ~ \l a Q. UI1\ ~ t.M:. ~ "b ~', [\)WJ..)( J ..Ak ~ \ooh\1l\. ~c.. 3 \fI'iruecux

Decomposition de la variation

SCT

.r<:

SCF SCR

~

D

b.n·2)'i.-Y)2 ~

;=1

.: ~ I •

-.3

~~

. ~

~

SCA 0-1 j~dbo. 0.1..

'vI.cl.. \emCitlt

SCAB (o-l)(b-l)

=')

--

*r..c. (. ~ ~ \:::m,\ (l'V'j

·O:!i...J,.UJ;i:upJ~,""r:do..u1faltnc ,p!r'rft.':-""dC.~.,U""'-'.',,,.,,,=,,.~

MAT1375 Blornetrie - Nicolas Schtickzelle

Realisation des tests

SCT

~

SCF SCR

~

CMA

F;,bS(A) = --

Sous HO,FA - FS(a-l;a[b-l])

SCA

F ---

obs(8(A)) - CMR

Sous HOI i=s(A) - FS(a(b-l];ab[n-l])

127

(f'\') <Ode. :# c.e ie \ ~'O~\~

• \;.R.):. CS:iUtJ. ~J""

"'_ .. _ lIS . ,··-:--v

r...... IW lr,oo." -- F .. >rl b:rr:i,~ I ~

u; ._ 1Jl 0 34 0 42 1;1\.d..~'t.

• Le vrai niveau de replication est Ie bassin, pas la creJette (3) ~\-\~ ~fAu~

• Les differences entre traitements ne sont pas assez gra ndes .!'oo. _\c..lH~. d

, dOff' bass! . t H CI .... ern ocumc:rn ~

comparees aux I erences entre assms pour reje er 0 ~ ~ de ~

L- iz ...... B.. JO,Qp'&A.. -= '~)

.. ~ ~d'" cUl ~'·rtn ~\... ~\n\em~ .....Q.Q ~. du.. 'ol.QL~'t , ~ ~o de ~e--; f'Tf\e'n.'otvo':. -U? ~CI \t.....QJ..., ~~ I'f"y:)

0-1 =CMA

Resultats pour l'ex. slrnpllfle des crevettes

1 :HQc ... :«e 4SJj.lllll SC.t. -c: _

11033.333

,: ~

• ----=--G

·ID$...~~.~I'I'VI ~ejt:J.l.:botclcilLNvtn:rtJ"l'In-

MAT1375 Biornetrie - Nicolas Schtickzelle

3g ..

Comparaison de moyennes avec 3 facteursX

ANOVA 3

Generalisation a plus de 2 facteurs X

• Les principes sont identlques, ce n'est qu'une ge ne ral isation

• II Y a simplement plus de designs experimentaux possibles

• Pour representer lie modele, on a introduit la notation

suivante:

- un facteurXest represente comme un arc de cercle

- si 2 facteurs Xl. et X2 sont crolses, leurs arcs de cercle se croisent

- si 1 facteur est hierarchise a 1 autre, son arc de cercle est

contenu dans celui du facteur hierarchisant

- II existe un terme d'Interaction par croisement de 2 arcs et par surface fermee

Annee acadernique 2009-2010

129.

130

65

MAT1375 Biometrie - Nicolas Schtickzelle

Generalisation a plus de 2 facteurs X

• Modele tout crolse:

A C

~y:_)

• Modeles Ipartiellernent) hierarchises:

AC(AB)

type I ~

A C

~

type II

A C(AB)

type III ~'-J

A C(B)

typelV ~

Modele tout crolse: les tests

A C

<u:

I & fi I A & B fixes I A fixe I A, B s C

A, B exes C aleatoire 8 & C aleatclres aleatoires

CMA/CMR CMA/CMAC 0 .... .> e No testab e
CMB/CMii ....., ........ 1_- .. ,....,.., GvlD/crtlioC .
LfV/O/UlflDL t:::>La It::
CMqCMR CMC/CMR CMC/CMBC No estable
(MAB/CMIl CMAS/CMABC CMABICMABC CMAB/CMABC
CMAC/CMR CMAC/eMR CMAC/CMABC CMAC/CMABC
(MBC/CMR CMSC/CMII CMBC/CMR CMeC/CMABC
eMABC/CMR CMABC/eMR CMABC/CMR CMABqCMR
132 Annee academique 2009-2010

131

66

@

D "~..),\~\~:

- ~ -! : it . .£Q\-- ~\~~

- ~~~:

- bot'l3 ~ A etX ~'I~~ 0 & ~) ~A\JX

C. I.QJ)t II CJl..X; ~

- ~tf- \(: A en\- 0tJi.d. ~ B

c. ~t ~ ~ A M'i- ~\~~

<® ..

.. R &«*- LU'f\ ~ue.un.. q..U. ~'t. ~SUf\r.i ~ Qf\~ c£ \&U:.....b.. ~ tmJ::t,;., ril·~ e.

m/~ 0 cu!~ ~e.tA1en/et\~~~.

,-- ;. ~I ~ I

~ci cU.\:..; err. ~ ~ lJ.!'ru'. ~.

• ~ & q~h t.an\... ~~ .b. ~t. ~;Q. .x wn r~J:. ~xe &. ~ ruo.. CNEi.n. ~ '\rN\fO~ ~ ..

MAT137S Blornetrie - Nicolas Schtickzelle

Modeles (partiellement) hierarchises: les tests

type I

A fixe au aleatolre, 8(A} & e(AB) aleatoires

--;A ......... ' " : .'

8[A) ((AS)

CMB{A}/CMC(AB} CMqABJ/CMR

Extrernernent rare en biolcgie

133

type II

A C

~

Modeles (partiellement) hlerarchises: les tests

type III

A ((AB)

~"-J

A

B

AS

C(AB)

A & B fixes, C(AS) ah~atoire

I A fixe,

B& C(AS) aleatelras

~. :

CMB/CMqAB) CMAB}CMqAB} CMCIABJ/CMR

CMB/CMC(AB) CMAf)/CMC(AB) CMC{AB)/CMR

134

A C(B)

I type IIV~\)J

Annee acadernique 2009-2010

I A & S fixes,

1:(81' aleatoire

CMA!CMAq8) CMB/CMt(8} CMC(B}/CMR

CMAS/CMAC(B) CMAC(B)/CMR

CMA/CMAB CMB/CMC(B) CMC(BJ/CMR

CMAB/CMAC(B) CMAC(B)/CMR

67

MAT1375 Biometrie - Nicolas Schtickzelle

• Une entomologiste s'interesse aux variations de tallle chez Onychogomphus forcipotus et Cercion lindenii, deux especes de libellule qui n'occupent pas le rnerne habitat

• Pour chaqueespece, 2 sites sont choisis et 10 males et 10 femelles echantillcnnes dans chaque site

l.ibellules

• Reponse Y: taille

• Facteurs X:

- Sexe: fixe 13,2 niveaux (males, femelles)

- Espece: fixe a 2 niveaux (0.. [orcipatus et C. lindenii)

- Site: aleatoire a 2 niveaux (site 1, site 2)

• Relations entre les facteurs:

- Sexe et Espece sontcroises

- Site est hierarchise <1: Espece

- Sexe et Site sont croises

Sexe

Site( pece)

type IV

Annee acadernique 2009-2010

13S

136

68

., • J

• '?&J'\. ~.I:I?I en ~ a p','\-er.> c") ~,ieJ\D)t.~.

• CJ. 9JA 'j ~d&D. ~...I2k. ~ ..... c.' vA. ~ on.. cl.ts)Q.. ~ ~ m ¥C4I:l ~ \.~~'c. .~ '\n\~~\\9'\'\..

• Wn. ~Q. c?l ~ 0. J}c ~ C?i, ~',\~~ ~.Qg,., G? ~.l6? O"""'.A.\: ;~6rt~ -) '11'l\~\~ = ~

~..Qc. ~\~\if.cd:ierr.. ~ rn',~ ~ ~ o" M X urn.. ..An\- \.~unt.i¥ ~ 'r~ ._h..,. ~,~x oe Jtl ~, (Ex.:..lbo s.4CJvi1)

Esf?

0 I C
.-:t .a. -1.,'
gl, a I ~I (§)

*Ame\lO..~ I CJi!S'm:'b',me. ~ ~ ~.:QJrt -i.. L %CJQ? .... '4OQQ.)

Gtno. n\e\Jm~'t @O ~~ ~ "49~

Au.. fSdt, d..vk ~tt..

"P x.. "> f": <: oJEXX:I-l _" ~ ~ ~ '~ ~ ~.1 OJ.. ~ l..\tf\, er.k:. /:

S) en 0. v.m o.Qpk

~ 9'n.~ rnElnA. ~~.

o (sr.dun\GflVj·Qa ttL \:..dGQoo~·.

~ 0J,1.. "* , !;.Q\. ~ \(rj~ ~ T9J.n Cc:L~ ...An\. ~avi\: .....Q.a ~ ~t.m.

JUfr,i dl' p..D.. ~") ,t !tF' ,\:. ~ ...JIM \Er.I~ ra.uluvn't? @

... ') ~d~ D~ tR r;u:e." ~ a'..v.riOY.l J ~ dJ... "C4n' te ~'\e-:,.

~ d I ~ Q.u. ~ e ~ s: ~c."'C,sl.. ~Il!o. \:.~ =') flP.su..n. .AJJ\\,Q r.p,l' d~

rn"o. ~ dt dirmerr..pr\';'~ t?l.X~ ...tk. J leaL .l).l'ng.. r.p ~ ~ ,

MAT1375 Biometric - Nicolas Schtickzelle

l.lbellules

j A& BflRS.

1 C(AS] alenoire

~q8J' CMBlCMClBj CMqBl/CMR

CMAB/CMAC(B) (MAC(BVCMR'

INB: cet exemple est sorti tout droit d'un questionnaire d'exarnen: iI est done representatif de ce que I'on peut y demander; mais pas necessairement suHisant !]

Diabete

• Un doctorant a realise une experience pour evaluer I'infiluence de la nutrltlon maternelle sur Ie pancreas endocrine de la descendance devenue adulte

• 4 regimes de nutrition pour les meres en gestation: - C: alimentation ncrrnale (20% de proteines)

- CT: alimentation normals + taurine (AA tres important)

- R: alimentation carencee (8% de prcteines)

- HT: alimentation carencee + taurine (AA tres important)

• Diabete induit chez ies jeunes

• Contenu en lnsuline rnesure dans lie pancreas juste apres lie traitement et 2 sernaines p!lus tard

Annee acadernique 2009-2010

137

138

69

MAT1375 Biornetrie - Nicolas Schtickzelle

139

Diabete

• En realite, Ie doctorant a mesure Ie contenu en insuline dans 2 portions du pancreas: splenique et duodena Ie

• Vu ce design experimental, deterrninez: - la variable Y

- le(s) facteur(s) XI leur caractere fixe/aleatoire

- les relations entre les facteurs s)il yen a plusieurs

- les tests a reallser

3h.

Quelques plans experirnentaux

Aonee acadernique 2009-2010

140

70

Q y,:\~e...

VO}ti..OQQ ~t.\~ CIilm~ OJ/.,~\~ \l\;e'U'm~ ,

Q X. :. ~ 4 ~~~ dg,. rrwknL~ . ~ .x r.Em't. ~a....

x ~ elln';' ~ _]g_ ~HvP' ~ en't ~e. C. ('tn.a/, en f2uL ~ J' \v.)t.\ ~ ~ ~ ...,

,,.

i') Gro 0.. 'O.Crn. ~ 4 ~~ de. ~t.\ e'f"I.- ~ {$I,. d de? ~~

~i). 'Cb'n 0. ". ~ d ~ rn'\ NtO.U< =) tt e* ~

t

C. :I R

- - - 1-

T

T~ en\: ~ ~ \aU:. eot ~l'e.

't:tn . Q~t:J A ~ ..JYj'c. ~ ctJQ..C. J&.? ~ ~ 0 t::Q\-b. ~~...Q,c.~~~~.

E.!:: ~ r?t:rru:..rn8"":l ~ ~ tm. ~ ~ A~ a Fe. .

~':

\) . a.'U~!l.a. e;,\:"...tA 1'\JoI..L~ ~? ~ <:tb'\-i' .....lM ',~-e.

. (gJb_ f'\J"O'J..~ -eIJ\:.CStt1~~ ~t. <)' ~o. ~t. \ tcl:Due.. .

- ~ ~ ~ NO\.l~ t.eh bAu.u.. ...Q/)~ dJ.:?bU. \..;lu.~ ("H9Vm. chJm -erot. .

~) cs; ~~~ Q ~ ~ .. SV\ d \rn~c.. OJ.,.,( f~ cit

~') ~ t:8l'\t...Qo." ~Uewr, ¥ ~~er.t ~ ~,

- ..JQ ~ J dWmeJt\~: ~ lJ. ["rI\~ rra-nt 1). ~~

~ ~c. t.u..(Vt. ~ rn\~. c.. R.

~ ~ ~ r.&"rI.t. ~et).. T~-t-_

~cx~ ~e,.;, c...o. ~ ~ \. '" \

¥JtJ&'I r/irn~ ~...QQ. ~ ~ W\J. ~esn rpl~~~\.

j,/ J • r"J'! ~ 1fy,i3ta

...rU: <9'1 0. ~ ~\ rn t. l.lJ'(\. ."t 0 p1L~ J.M r _. -, , "

- ..a ~ ! ..x;.~ ru f"naJIJ \~~~ q...-Q,. ~ ~ dlLo):$Ail,..

~"e...

~) '')~~n.. ~e. 0: T~e.

~ ~..h ~ d.o'rr:;;! ..ii.. ~~ ~ ~ ~ d.L!rrIQlY1t::~ ~

• \.pm., ~ , .....J.'" I \-0\,

~c. ~ V'Ql.I.1U.l'1U. C.oi. '¥~ ~u_ r;sL'r.h ' ..... , "'t" .. ~'\"l\ I tJfR-

I~\: Q ~~....b..~ .

.... t«\a;iih. &l. ~...Qf.)~ ~ Jk hsuk. eo't ~I\t.

• .I I I I) ,

·Cdn. f\Jo. ~~ ~ C\"\ R -+ ~ ,&~ ~ ~ 'i>- u.m ru:;:.. n\~ ." fh ~

c, PO? de.. c.'" 'R CJ::A I ~I.'t:. d: ~ o , ~ ~'k: OJ.. \'I'T1J.9l.1Yi &.t

I

.x..c.in ~c..

J 1.-..: cte..? d..ctrv? ~ l~/ en ~...suk l.J..M ~I..

-\'C9.li::.. 1\)0. ~ ~ CO'\ ~ ~\ ~~ ~\:: '

('r~~ y~ w.. ~ ~.

\ ~.x.d:Ent. '\ ~ctt~~.

" "a. Jji_ ~ ...un 'reIrIfn 0 J./'r\ ~ ~ Q.J.. ~ ? ..

0..) ~ cs; ~ S. ~ ~ ~t. ~ ~ ~ kd:.) <:..p- ~

~ ~~\ ~ ~~ Ju:k_ .iJ... co.. ~.

~ ~ ~\ ~ ~t:0 /t) M )1J:j;-_ ~

• .J I'

>ft. ~ JUJt' ~"\~ ~ J.: chslT\e!l\\::.d:.°

fl Ir II 0. ~~

fI (/ ~ ". cu.. ~ C£fI,. 9Y\ Q. ~ ~ ~ ~ J.L ~ Jt.d.:..

S', g'\'\ I'Jt1l.k_ r?I~.:i. ~ I en ~Q.. wn l ~ ~

JJJ"r\ ~ .. Q ..urn 0:. & ~ _ elm o rm e o.rfv.;', ~ ~~ Jtc:k.....Q;,.-e .J

cu..~~.

b) \ em ~ . ~ e-n b..u.. ~ Ild:. ~ 9J-' ~r . ~ 'Fe- l~ "' )

~ \U ~ ~ ~.~ ""'-- ~ ~~ J!n tTrl.lY.i\).l\.tv? • - '~ •

~ f2I\jO.. l ~O\..~ c:u.. ~ rmoh 9Y1 ~JUJ\.A. J..o.,., it ti E:fr1r,

'\ en ...LI.k::.\ ~ CJJ.rr.J l...u.m t'Ld:. .. r ~ ~ ~; \9ltn ~ I'l..ICit: ..rv:I\" ~

.. v cSJ.J.k.. '

@

• _11-..... .......... n... _ ....1. __ J ....I. ,..;'1- ·':.l... I .\./""",~, ...1 __

• "\'euk. '4P~ '~ r.1oJU,~"",,," .. n.~ ... ..AloIn uJ.Jl\nl ~u.ao.r- WWIollloo "m,. fJ........ \PoITn'

~~. S1. ~ d.£U:.:Qlng_ ~l ....trW\ ~adrir:cn~ ak,Q~k OJ..~C>Ui. l~ en ~~;~le ~ d/.Q~)

~ SeJ.lu. dJe.C drv,a, ~ c. "" 1b..cL~~ -+ t:"

S, Qf\ '~e. cp.' \e -Q.X \r.) 'I-e. ...um ~t j an ~ti ...DvJ ~ ~r:;..sA9.rm EIn\:.. ~ ....Ao. ~.

MAT1375 Biornetrie - Nicolas Schtickzelle

Randomisation des unites experlrnentales . !

• Dans certains cas, ii' peut exister une heterogenelte dans: lies conditions experimentales, p. ex. l'eclairage dans un I phytotron i

• Pour eviter une confusion avec les facteurs d'interet, II faut assigner les unites experimentales aux dlfferents niveaux des facteurs de facon aleatoire

• Plan cornpleternent aleatoire: B A

B

c

A B C C
G B A A
1411 Pourquoi des plans cxperimentaux ?

• Parfois, on connait la structure de l'heterogeneite, p. ex. un gradient d'hurnidlte dans un champ

• II exlste des plans experimentaux adaptes aces

situations:

- Plan en blocs aleatoires cornplets

- Plan en blocs aleatoires incornplets

- Carre latin

- Split-plot

142

Annee acadernique 2009-2010

71

MAT137S Biorrretrfe - iNi.colas Schtickzelle

1:\ t--lllb.l..-X \ ~ \ (J~- -' •

• Un plan en blocs aleatolres complets modelisel'effet du

gradient par un facteur supplernentaire (iIIe bloc) pour I

qu'll ne soit pas confondu avec le(s) facteur(s) X d'interet

• Chaque niveau du facteur X est present danschaque bloc:

'Block l'

• Le bloc est considere comme un facteur aleatoire

Trypanosomes

• Une chercheuse etudle les trypanosomes, responsables de la maladie du sommeil

• En particuller, eUe etudie Ie role de proteines speclfiques, appelees PEX

• Elle a realise des trypanosames mutants selan la technique du ARNjl qui perrnet de supprirner l'expression d'une proteine, et donc d'etudier Ies dvsfonctlonnernentseventuels de l'organisrne

Annee acadernique 2009-2010.

143

--

I

144

72

@

• ~ ': ~ ~ ~ ~ .J.' o~ d' u.rn <o~t,

<b-n ~~ \l ~ Cer.~t. h9Jn JAn 0\ci..~bo ~.x &'t\ ~ J.1 ~

cW-~~'

• ~\ ~J~ ~~~~'1ls.

• ~. .s: ~1 eM.. ~ ~ -I:~. Eo ..Alk, 'd.l9Cr.> -c") e'n ()\.g. 'ri U1't.. ~ ~ de.. JA.. • ta ~ b\.o:..~t. 0.. J b J c..


x
[]
'.
x
0
C T .~~~.

• ~t.a,b, : -4 u ie, i. ~tn..~ ; ~\!YI.':onl: , =") g'f\ -\d-~ ~ A~o\lA it ';

- ~~ b\.o:.~\::..

- -@p.~ bO.&c:. (dl'-d:Qh..) 9-"- J\J:rr?ermYe.

jy, CArrI~.

• U1. ~ ; rm ~~ J e, ''t/i't.. 0' 0'\.tS:h. ~ SMn J.c. ~ ... IJl. ,~, b\.~ '\.etrnam'-: t= = c t-\ A <<. =') 1- ~iQ\ gr1\'\~~

, I • ~ ~

(. t'. A r::,,~ 'ter.l ~ ~ \ m ~

S:, €I1\. ~i!. J&.. ~c. i en ~ m \~e ..lc... 4!.A ~ e '. ~ ~ ~ ..Q.Q.. ~ U1. \t.\ Jt1.n \ dJ.v;J • :;:. ") (9)"1 nJJ'~ hJ'mJ1. ..h ~

MAT1375 Blometrie -Nicolas Schtickzelle

Trypanosomes

1.5 "

• Ouantiflcatlon de la concentration en ARN de PEX en fonction de la taille des bandes sur un gel

..

1 ~

r

I

0,51

O+I--------~--~--

I

,

Wild type Nan indurt Induit 24h lnduit 48h

• De nombreux parametres different entre les gels

~II~ -

• Done on considere Ie gel comrne un bloc et chaque niveau est present sur chaque gel

• Modele: ANOVA 2 croisee mixte (avec n =: 1)

Trypanosomes

• Le modele est une ANOVA 2 croisee mixte:

I A fixe, B aleatclre

CMA,..lCMAB CMB/CMR CMA8/CMR

• Comme n =: 1, SCR =: 0 et CMR n'est pas calculable: done on ne peut pas tester l'effet du gel ni l'interaction

Tra iternent" geli

T_ oI~'-'" TnIO.USIor.

-.. OF

-

Annee acadernique 2009-2010

~ebcmde = ~ w.. 'ttnn~\;,

145

146

73

MAT1375 Biometrie- Nicolas Schtickzelle

Trypanosomes

• Si on peut raisonnablement supposer qu'il n'existe pas d'lnteraction, on peut la supprimer

• Done la variation attrlbuee a I'interaction (SCAB) est comptabtlisee comme variation d'erreur (SCR)

• On peut alors aussl tester I'effet de B:

~:Soolfto lIiF ~.ss _~ F_ Pr~F

~ '5 2._iL;t'2;4.s:nl "_Slf"-t¥.;'1a :s.e_l" <.CO'01

go! 3 ~.:~15?3fJ a.ClSOt33 ~.05 O.lUof

• Bien sur les donnees ne nous permettent pas de verifier cette absence d'interaction; done iI faut etre tres prudent avant de faire cette hypothese

(+ d'lnfos: Zar section 12.3)

147

Virus du millet

• Un doctorant en biolngenierie s'est interesse au taux de transmission d'un virus dans les grains desepis de millet en fonction de la hauteur des graines sur l'epl

• III a mesure Ie taux d'infestation sur 8 epis (panicu'les):

._.,_---_..__--_ -

• On dolt considerer l'epi comme un facteur aleatoire, croisea ta position (equivalent d'un bloc):

ANOVA 2 croisee rnixte avec n = 1

Annee acadernique 2009-2010

148

74

@)

• \-l'n~ ~ Q'(\ ~ 'tk I " e I"n' ~ Q.. ~ a I \ rn~c.\l:Rm.. .

<;c i ::. ~c:. A + sc.~ + ~,9(~ ~ sc.~

.. ) Ctrn ~ cOt~ ...It'~ SC.R

du. ~c:.. _,. em. ~ ~~ :i. ..p~ c.L.J.. ~

@

. '&c. ~. r.3- ~ J.Q.,oo\,un &~ 1-- ~ su.. ..Q.m ~ ?

l.'!,. ~_.\ ... !'1.,,, I J , • ,

• \:::lrM·tI~ " hsr.:. ~ Jo,. ~1.. dl.. ~ 'J Ul ~ ;)"-. \

,~L..~,

-

"l.._ "L • I\. _. . \ ...... A I j,&.,

.. ~ llS?' ..:,\ e"l'Ir.:Ic;ru.e.c ...... ~.. if::

• \..un (,SY\.~~ ~\~1t~ ,n; Qtn ~0. ~a ~E.. *- ...JJo,. E. de.? ~ d' lOO\~ ,_U: ~ rm~r\ ~ d.A.? ddt (4. OJ.. ~e.u. dt. Q)

MAT1375 Blometrle - Nicolas Schtickzelle

Virus du millet

• Analyser cet exernple avec une ANOVA 1 ne tient pas compte du lien existant entre les rnesures effectuees sur un me me epi

• l'effet de la position est donc teste contre la variation entre epis et non l'interaction position+epi

• Leffet de la posi,tion n'est plus significatif:

101'1 .... -" -

-

-

-

• C'est une erreur similaire 31 l'analvse des donnees de sprinters avec un test de t independant

Virus du millet

• On. peut utiliser des contrastes orthogonaux pour determiner quelles positions different en terrnes de taux de transmission du virus:

- les positions superieure et rnediane different-elles ?

- la position lnferleure a-t-ella une rnovenne lntermedlaire

entre positions superieure et rnediane?

Ces 2. contrastes ferment une decomposition de seA: seA = SCl + 5C2

Trees significatif.alors que I~efte:t principal de I'a position est l10lrt juste non significatff;

0.05 n':est pas un seuil magique entre 2. mondes !!

Annee acadernique 2009-2010

149 '

150

75

MAT1375 Biometrie - Nicolas Schtickzelle

Plan en blocs aleatoires incomplets

• Un plan en blocs aleatolres incomplets mode lise aussi l'effet diu gradient par un facteur bloc

.' Maisici chaque bloc ne contient que certains niveaux diu

f X ----. r---I --, I~- I-~ 1

acteur: G Fit B B I ~" B I

E A ~i G E IQ1

.________j I, I J ' I

~ ...----1 jr--------------,.__._- ~-I

A ,Cj C! FljD: D lEI

• Chaque niveau est applique le rnerne nombre de fols

• L'analyse de ce genre d'experiences est plus cornplexe

151

• '"4 ~o.:.~'v:>', It\.~ ':') ~ (.) ~" r.l ..I-?f'\ t.D. • E ~.~ "i- ~ 0'\)Q.c.. ~ b\.c::L~Po,

d'\~~ : .....h. bI49c. ...gn,\; ~ ~ c.ctL 't'sAI? .Qa..,. t7\.cC.~~

rn.L r.91\.\: \rncju;, ~ WV\ ~ •

Carre latin

I • Un plan en carre latin rnodelise l'effet de 2 facteurs

d'heterogeneite via des blocs «lignes» etxcolonnes.

• II Y a autant de Ugnes/colonnes que de niveaux diu facteur X

• Chaque niveau 5e trouve une fois par ligne et par colonne:

C II A I D !
I D C II I ... I
a A ole:
A 0 c I is I • On suppose les interactions nulles, et donc un modele avec:

facteurX, bloc ligne, bloc colonne

• Le facteur X est teste centre Ie .R

SCT

~

SCF SCR

~

SCX

SCAC

Annee acadernique 2009-2010

152

76

MAT1375 Biornetrie - Nicolas Schtickzelle

Split plot

• Un plan en split pilot convient lorsqu'on veut etudier deux facteurs d'Interet A et B qui sont cruises

• Les niveaux du facteur .A et du ~ ~ ~ H=

facteur B ne sont pas appliques ~ t:±:J t:::b ~

aux memes unites experlrnentales: ~ . I~A ~

I • Cela peut etre interessant sl un traitement est dlfflcllement

applicable sur de petites parcelles

• I'analvse est complexe (cf van Emden chap. 15)

• Plus de puissance pour Ie facteur applique sur les sousunites et l'interaction que pour Ie facteur applique sur les unites

1531

3i ..

'Donnees manquantes et debalancernent

1541

Annee academlcue 2009-2010

77

MAT1375 Biornetrie - Nicolas Schtickzelle

Effet pervers du debalancernent

• Debalancement = n lnegaux: iI n'y a pas Ie rnerne nombre de repetitions dans chaque condition experimentale

• Cela peut creer des artefacts

• Exemple: on a pese 100 mulotsen fevriier et 100 mulots en mars:

I Fevrier I Mars

26g 2.9g tob.s=-3 dfo:198 p=O.003

SOgl 5Og1

• La difference de taille est un artefact:

Comment traiter un debalancernent

• Un debalancernent leger peut etre tralte sans trop de problerne

• Mais ca devient difficile si des cases manquent

.... Toujours essayer d'avoir des eftectifsegaux et planifier son experience soigneusement

.. Dans ce cours, on suppose que les effectifs sont egaux pour tous les exemples d'ANOVA 2 et 3

Annee acadernique 2009-2010

155

156

78

~(.,(

.- '? ~ < c; c. ~Cl ~ to' cb. :I ~ cU.. ~ e.\ ~'I e., -..Q):. ~ ~~.V::, .

.. Com 0.. tmQr.)uU.. ~ ~. <lrn J& ,-,;it. WI. etl MSl t. ~e d~:: \~CC ..

CJYnt ~ - en. ~ ("J i \ ~,o.. ~....b. rm_ ~ JI"n ~ .JIl= i'l'11.Oln ?

Si c.' ~~k ~ I 9'1'\ ~ dt::. qq .

. s\ e..Q/J\ ~" ern c..d.~ .J..JJn. 'ril?t. ~ 1)..J!'f1.9.. ~ ~e_.

~ N\19T\ ~

~ A ..... 'r€ ~c.k. " J1n ~., Q. QUJI.~ ~ ~ . .-'*..JVn fn\.O'V? /?JJt. t\ din ~

a€o. I: ~ Oc. t~..vk den c. ..AJf\'\ au{~ ~ ~ .lQ. ~ dill r..ttx Q. ~ •

'=-) ~ ~ 00nc. Nei..~ Q '11\\-" Y'tSlU::. ~~ ¥ '~Ul. C\JOti..~ .

(b (.:I) em ~ ~ A~'JA it co\....aJk ~ nJ _h,., ~ \m~\~ .

~ C11.lQ. ~c. ~C,JI, Q. ~ "\rr-d'~L.~ 7=.C.A. .da ~

~ ~ ~ ,.lJL d'Q\=dkYr"'~~ .

@ \._ "J. ....... L t"'!fr\ri'ln.-,Q__ hnt"'lll'Vlrlf"v¥lt- I • Q: L c.o.. ....

• (goelt}em1"\:. QI:. \,D.~ r;Q'n. ' ...... --,,_ .sin ,~_, .. r;;;;, ~I \ ~ Q u.rn..tL 'f' ,e, ~

., . I, I ~A.~

.....x ~, ~; ton Q-rI. I'\)t{lJ.. A.o ~.. ~ SrI. d!) A~ r~ ..tIJ'r\..

~ fUIn Jit ~. ~~ ~ Qt.. ~ 0l.Q.Q. ,

. Corn 00 ~'\Jl._All\. A~o"J PI A ...Ih\.. de\.w..a.cmt=. _i ~

~~ J\lO. ~ ~ cp. ~ d.tn ~ d.l- ~aUAm~\:. tcI\ ~~ ~ ~Q.. ~ unu. cr.na ~ fO'J cU.. ~.";I ~t ~ Ou )+ Q.l"b\g)} n'l ~'j ~ c.td:,~.

!J::> (?~ p ~ :.. It Ole oc:A -b. \-en\:. M/ &:It.~. tt- Ii. '&cit ~\JJl'tc..~

• ,~&'J ~ ~~ ~. 'U1\r..ak:.~ rn"'\m~~t. ~. clam ~ cenmoo\tn ~ \o\~ d.s:::Jtv, ~ ~ cL..uDDSL .

MAT1375 Biornetrie - Nicolas Schtickzelle

Tireis

• Une rnernorante a etudie Ie papillon Tircis (Pararge aegeria) dont les males presentent 2 strategies de recherche des femelles: perching vs patrolling

• Elle a pese des males des 2 strategies dans 2 sites

• ANOVA 1 critere avec 4 niveaux

Groupe

patA patB peA peS

OU

AN OVA 2 croisee fixe

pat ; pe

Tire is

• En realite, il ya aussi des femelles + une strategie male

intermediaire dans un des deux sites, rnais dans

I'autre:

• Cette situation rend I'analyse en ANOVA 2 tres cornpliquee, mais on peut par contre analyser cela en ANOVA 1 avec des contrastes appropries

Groupe

MpatA patB MpeA MpeB MintA FA FB

Annee acadernique 2009-2010

157

158

79

MAT1375 Biornetrie - Nicolas Schtickzelle

Tircis

• '-"introduction de nouvelles donnees modifie SCR, et modifie donc les tests:

- uniquement les

4 groupes de depart

- en rajoutant 3 groupes

-

--

• La modification est tres legere car les 3 nouveaux groupes ont une variance intragroupe tres similaire:

Tircis

• En realite, la variable Ya ete transforrnee en In( Y)

• Sans cette transformation, les groupes n'ont pas la rneme variance intragroupe:

• Dans un tel cas, I'introduction des feme lies modifie ies tests concernant « perchers » vs « patrollers »:

- uniquement les , I

4 groupes de depart

- en rajoutant 3 groupes

Annee acadernlque 2009-2010

159

160

80

Vous aimerez peut-être aussi