Vous êtes sur la page 1sur 37

Utilisation de Statistica et de R Florent Aubry, INSERM U8 !

I"a#erie c$r$brale et %an&icaps neurolo#iques

''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''

()ob*ecti+ &e ce &ocu"ent est &e &onner &es in+or"ations pratiques sur l)utilisation &es lo#iciels Statistica, -StatSo+t Inc., .ulsa, /01 et R pour con&uire &es &)analyses statistiques univari$es ou "ultivari$es classiques. (e probl2"e &e l)analyse statistique &e s$ries te"porelles ou &e &onn$es spatiales ou spatio-te"porelles n)est pas abor&$ bien que R propose &es outils pour cela1. Il pr$sente aussi la "ani2re &e con&uire les tests &e per+or"ances et &e vali&it$ &es analyses statistiques avec ces outils -pour les &$tails sur ces tests, cf. 3mthodes avances en statistiques3, partie I et II1. 4e ce +ait, ce &ocu"ent &onne essentielle"ent co""ent "ettre en 5uvre les analyses plut6t que les bases t%$oriques &es proc$&ures.

Notes : 1) Dans le document, je suppose que la version de Statistica est la version franaise. 2) Toute remarque ou complment sont les bienvenus. De m me, si vous ave! des procdures dans d"autres lan#a#es comme $atlab% &$at'(or)s *nc., +atic), $,), vous pouve! me les si#naler afin que je les int-#re . cette note.

7ar e8e"ple, les pac9a#es AnalyzeFMRI ou fmri pour l)analyse &es &onn$es &e l)IRM+, dti ou tractor.base pour la &i++usion. 7our plus &e &$tails, voir la pa#e http: cran.r!pro"ect.or# $eb vie$s MedicalIma#in#.html.

Statistiques pratiques avec Statistica et R

- F. Aubry

p1

Utiliser R
S)il est inutile &e pr$senter Statistica, *e co""encerai par quelques consi&$rations #$n$rales concernant R. R est un lo#iciel #ratuit &$velopp$ par la co""unaut$ statistique internationale. Il co"pren& un c5ur et &es e8tensions, connues sous le no" &e :pac9a#e). (e c5ur est &$velopp$ par la +on&ation R tan&is que les :pac9a#es) sont &$velopp$s par &es utilisateurs et sont int$#r$s ; R apr2s vali&ation. R tourne sur toutes les plate+or"es, <in&o=s > et ?@ bits, Apple et Uni8 et peut Atre t$l$c%ar#$ sur le site &e R -http: $$$.r!pro"ect.or# 1. /n t$l$c%ar#e alors le c5ur puis les :pac9a#es) &)int$rAt.

R nati+ propose une console alp%anu"$rique et l)appel &es proc$&ures se +ait &onc li#ne ; li#ne, un peu co""e pour Matlab. Il est possible &)$crire &es scripts et &es +onctions B voir la &ocu"entation. Co%n Fo8 a &$velopp$ une inter+ace plus orient$e, R commander, vers l)utilisateur qui est ; "ic%e"in entre la co""an&e li#ne ; li#ne et l)inter+ace o++ert par Statistica. Elle propose l)acc2s au8 principales +onctions sans avoir ; $crire &e li#nes &e co""an&e. Ce conseille &e l)installer. 7our cela, il su++it &e c%ar#er le pac9a#e Rcmdr ainsi que tous les pac9a#es Rcmd%lu#in.&&&. 7roc$&ure &e c%ar#e"ent 11 (ancer R 1 4ans le "enu :7ac9a#es), cliqueD sur :Installer les pac9a#es) i1 E%oisir le site "iroir -e.#., France, .oulouse1 ii1 E%oisir les pac9a#es ; installer. /n peut +acile"ent c%oisir son site "iroir par &$+aut, ce qui +ait que la question &u c%oi8 &u site "iroir ne se posera plus. Il su++it &e "o&i+ier le +ic%ier :Rpro+ile.site: &ans le r$pertoire :etc: &u pro#ra""e R F G set a ERAN "irror F utiliser le EIE. &e .oulouse local-Hr I- #et/ption-3repos31 rJ3ERAN3K I- 3%ttpFLLcran.cict.+r3 options-reposMr1N1 7ar &$+aut, il +aut r$installer le pac9a#e ; c%aque +ois qu)on lance R. Eeci peut se +aire par la co""an&e F library- Rc"&r1 Eepen&ant, ce n)est pas pratique. /n peut auto"atiser ce lance"ent &e &eu8 "ani2res &i++$rentes I1 A*outer la li#ne &e co""an&e ; la +in &u +ic%ier te8te :Rpro+ile.site)

Statistiques pratiques avec Statistica et R

- F. Aubry

II1 a1 4ans son propre r$pertoire &e base -OP/ME pour Uni8, Mes 4ocu"ents pour <in&o=s1, cr$er le +ic%ier te8te :.Rpro+ile) Jle no" &u +ic%ier co""ence par un pointK b1 4ans ce +ic%ier, y "ettre la li#ne &e co""an&e. R commander se lancera alors auto"atique"ent ; c%aque appel &e R. Eepen&ant, R re+usera &e le "ettre ; *our quan& vous essaiereD &e la +aire par la co""an&e :"ise ; *our &es pac9a#es). Il +aut &)abor& sortir &e R, "ettre la li#ne &e lance"ent &e R commander en co""entaire -i.e., "ettre un G en &$but &e li#ne1, relancer R, "ettre ; *our les pac9a#es, ressortir &e R et suppri"er les co""entaires.

7our l)ai&e en li#ne, R &onne &eu8 possibilit$, 11 &e l)obtenir sous +or"e &e +enAtres &e te8te, 1 &e l)avoir sous +or"e &e pa#es P.M( &ans le navi#ateur par &$+aut. Eette secon&e option est plus pratique. Elle est +acile"ent pro#ra""able par &$+aut &ans le +ic%ier Rpro+ile.site F options- %elp'typeM3%t"l31 /n peut aussi c%oisir l)$&iteur &e te8te ; appeler ; partir &e R F

options- e&itorMc%e"in4AccesA(E&iteur1

Il e8iste aussi un #roupe +rancop%one &es utilisateurs &u lo#iciel R %$ber#$ par le Eira& -Eentre &e rec%erc%e a#rono"ique pour le &$veloppent1 ; l)a&resse http: forums.cirad.fr lo#iciel!R faq.php -a&resse &u +oru" au8 questions1.

7our les utilisateurs &e <in&o=s, il e8iste un $&iteur asseD a#r$able et #$n$ral, "A"e s)il est un peu ancien qui est Eri"son &)E"eral& E&itor Eo""unity -http: $$$.crimsoneditor.com 1. Il +aut corri#er le +ic%ier :e8tension.r) qui se trouve &ans le r$pertoire :lin9) &u pro#ra""e et re"placer son contenu par F (ANQS7EEFR.S7E 0ER</R4SFR.0ER Si, &e plus, on &$sire pouvoir $&iter les +ic%iers :.%istory) &e R -%istorique &es co""an&e1 avec le "A"e co&e &e couleur que les +ic%iers &e script ou &e +onction, il +aut a*outer &ans ce r$pertoire un +ic%ier &e no" :e8tension.r%istory) avec le "A"e contenu que le +ic%ier :e8tension.r). Eepen&ant cet $&iteur ne per"et pas &e &ialo#ue entre la console R et l)$&iteur, par e8e"ple il ne per"et pas &e lancer &es co""an&es &epuis l)$&iteur ou &e +aire &e la "ise au point li#ne ; li#ne. Il e8iste &es $&iteurs autres qui le per"ettent co""e Tinn-R -http: scivie$s.or# 'inn!R 1. 7our plus &e &$tails sur ces $&iteurs voir la pa#e &es FAS consacr$ ; ce su*et http: forums.cirad.fr lo#iciel! R vie$topic.php(t)**+start),+postdays),+postorder)asc+hi#hli#ht)+sid)-,.eaf,/-0a1c22ccf3 43bda-a-d./.b.

Statistiques pratiques avec Statistica et R

- F. Aubry

p>

R est un lan#a#e orient$ ob*et bas$ sur la notion &e classes &)ob*et, c)est-;-&ire que c%aque &onn$es utilis$es par R appartient ; au "oins une classe -accessible par la +onction class1. Il y a &eu8 versions &e co&a#e pour les classes, le type S>, co&a#e le plus ancien, et le type S@. (es ob*ets &e type S> sont lar#e"ent bas$s sur les list et &onc leurs attributs sont accessibles via l)op$rateur O -p.e8., l".result I- l"- ... B l".resultOcoe++icients sont les para"2tres esti"$s1 tan&is que pour les ob*ets S@, les attributs sont no""$s slots et sont accessibles par l)op$rateur T -p.e8., l"er.result I- l"er- ... B l"er.resultT+i8e+1. ()avanta#e &es classes est la notion &e "$t%o&e qui est une sorte &e +onction &ont le co"porte"ent &$pen& &e l)ob*et auquel est elle appliqu$e. 7ar e8e"ple, pour avoir un r$su"$ &)une analyse +aite par l" ou l"er, on utilisera la "$t%o&e su""ary. 7our les ob*ets &e type S>, la "$t%o&e #$n$rique -p.e8., anova, su""ary1 +ait appel ; une "$t%o&e sp$ci+ique &e no" no"4e(aMeto&eQenerique.no"4e(aElasse -p.e8., anova.l", anova.aov...1. Eeci e8plique pourquoi certaines pa#es co""e celle &e l" renvoient ; &es &escriptions &e +onction ayant ce no" co"posite. Eepen&ant, l)utilisateur n)a #$n$rale"ent pas besoin &e connaUtre ces no"s sp$ci+iques, sau+ pour acc$&er ; la &ocu"entation. 7our plus &e &$tails sur la pro#ra""ation sous R, voir "on &ocu"ent 3%ro#rammer sous R3.

Statistiques pratiques avec Statistica et R

- F. Aubry

p@

La notion de contraste
Il est i"portant &e bien co"pren&re cette notion &e contraste coura""ent utilis$e &ans les analyses statistiques &e type Anova, &)autant que Statistica et R ont &es co"porte"ents &i++$rents qui con&uisent appare""ent ; &es r$sultats &iver#ents. Ees &i++$rences ne peuvent se co"pren&re qu); partir &e la notion &e contraste.

7renons un e8e"ple si"ple. Soit un +acteur F ; trois niveau8 N1, N et N>. ()Anova nous servira ; tester l)%ypot%2se -"ultiple1 5, FFM "oyenne- N11 M "oyenne- N 1 M "oyenne- N>1 qui se r$$crit, par e8e"ple F i1 "oyenne- N11 - "oyenne -N 1 M V ii1 "oyenne- N 1 - "oyenne -N>1 M V iii1 "oyenne- N>1 - "oyenne -N11 M V. /n peut &$*; constater que si &eu8 &es trois $#alit$s sont v$ri+i$es alors, la troisi2"e l)est aussi. Il y a &onc re&on&ance. /n &ira alors que le no"bre &e &e#r$s &e libert$ est puisqu)il est n$cessaire et su++isant que &eu8 &es trois con&itions soient v$ri+i$es pour que les trois le soient.

/n part tou*ours &e l)i&$e que c%aque "oyenne ; esti"er s)$crit co""e la so""e &)une or&onn$e ; l)ori#ine co""une ; tous les #roupes -que *e noterai //1 et &)une &i++$rence ; cette or&onn$e +onction &u #roupe -que *e noterai &N8 avec 8 le nu"$ro &u #roupe1. /n peut alors re"placer &ans les $quations ci-&essus les &i++$rences entre &eu8 valeurs "oyennes N8 et Ny par &N8y M N8 - Ny. Appare""ent, on obtient par ce nouveau co&a#e SE7. con&itions ; tester -// M V, &N1 M V, &N 1 M V, &N1> M V, &N>1 M V, &N > M V et &N> M V1 alors qu)il n)y a que trois &e#r$s &e libert$s, &eu8 $tant li$s au8 $quations &)$#alit$ -cf. supra1 et une ; l)or&onn$e ; l)ori#ine. En r$alit$, cela se si"pli+ie car les &N8y sont $quivalentes par paires -&N8y M &Ny8 M V1 et co""e "entionn$ ci-&essus, &eu8 &N8y v$ri+i$es entrainent que la troisi2"e l)est. /n retrouve &onc les trois &e#r$s &e libert$ et seule"ent trois para"2tres ; esti"er. (es esti"ations peuvent se +aire &e no"breuses "ani2res. (es principales solutions sont F I1 la "$t%o&e par &$+aut &e R qui est appele abusivement contraste traitement. /n a alors ; esti"er les para"2tres suivants F // // M V N1 Waleur +i8e M V N &N M N - N1 N> &N> M N> - N1

Esti"ation

Sue *e noterai abusive"ent N8 ; la place &e "oyenne- N81

Statistiques pratiques avec Statistica et R

- F. Aubry

p!

II1 la "$t%o&e par &$+aut &e Statistica, appel$e contraste so""e &ans R -:contr.su")1 qui est reco""an&$ pour &es raisons t%$oriques par &e no"breu8 auteurs. (es trois para"2tres esti"$s sont F i1 l)or&onn$e ; l)ori#ine qui est $#al ; la #ran&e "oyenne &e tous les #roupes B ii1 &N1 M N1 - N> -pour R1 B &N M N - N1 -pour Statistica1 iii1 &N M N - N> -pour R1 B &N> M N> - N1 -pour Statistica1>.

Notes ; l)attention &es utilisateurs &e R Sous R, il est tr2s +acile &)utiliser un niveau &e r$+$rence autre que celui par &$+aut, c)est-;-&ire le &ernier. Il su++it &e per"uter la &erni2re li#ne &e la "atrice en sortie &e contr.su" -no"breNiveau81 avec la li#ne correspon&ant au niveau servant &e r$+$rence. E8e"ple F contr.sum( 3) : 3me niveau = rfrence 1 V V 1 -1 -1
me

!" ! !3

1 -1 V

niveau = rfrence V -1 1

Eo&e associ$ "E I- contr.su"- nbNiveau81 G nivRe+ est le nu"$ro &u niveau qu)on veut co""e r$+$rence "E I- rbin&- "EJ1 F-nivRe+-11,K, "EJnbNiveau8,K, "EJ-nivRe+1 F-nbNiveau8-11,K1

III1 7our l)analyse &e ten&ance, il +aut utiliser &es contrastes polyno"iau8 qui sont obtenus par contr.poly- nbNiveau81 &ans R. 4ans Stastistica, la solution la plus si"ple est &e +aire &)abor& l)analyse puis &e pro#ra""er &es co"paraisons plani+i$es.

Note ; l)attention &es utilisateurs &e R A1 R propose trois co&a#es pour le co&a#e &e type traitement contr.treat"ent- n, baseM11 F les para"2tres esti"$s seront alors no""$s par la concat$nation &u no" &u +acteur et &e celui &u niveau, par e8e"ple FN1. (e para"2tre base est le nu"$ro &u niveau servant &e r$+$rence -i.e., pour lequel &N8 M V1, par &$+aut le pre"ier.

/n constate que par &$+aut R utilise co""e r$+$rence le &ernier niveau tan&is que Statistica utilise le pre"ier.

>

Statistiques pratiques avec Statistica et R

- F. Aubry

p?

contr..reat"ent- n, baseM11 F les para"2tres sont alors no""$s selon la r2#le No"4uFacteurJ..no"4uNiveauK tan&is que le para"2tre base ; le "A"e r6le que pr$c$&e""ent. Ce conseille &)utiliser ce co&a#e car les r$sultats sont plus lisibles. contr.SAS- n1 qui est $quivalent ; :contr.treat"ent) avec base ayant pour valeur la position &u &ernier, &onc contr.SAS- n1 M contr.treat"ent- n, baseMn1. Y1 7ar &$+aut, R utilise :contr.treat"ent) pour les +acteurs non or&onn$s et les contrastes polyno"iau8 -contr.poly1 pour les +acteurs or&onn$s. /n peut "o&i+ier ce co"porte"ent &e &i++$rentes "ani2res. 11 En a++ectant &irecte"ent le type &e contraste &$sir$ au +acteur &ans le tableau -&ata.+ra"e1 &es &onn$es. 7ar e8e"ple, si le tableau s)appelle 4/NNEES, on tapera F contrasts- 4/NNEESOF1 I- le contraste &$sir$ 1 En l)a++ectant au "o"ent &e l)analyse B il su++it alors &e &onner une valeur ; l)ar#u"ent :contrasts) &e la +onction utilis$e. 7ar e8e"ple, si on veut a++ecter :contr.SAS) ; F et qu)on utilise la +onction &)analyse l", on tapera l"- +or"ule, &ataM4/NNEES, contrastsMlist- FM3contr.SAS31... >1 En "o&i+iant le co"porte"ent par &$+aut en ins$rant l)option &ans le +ic%ier Rpro+ile.site ou .Rpro+ile. Eette option s)$crit alors F options- contrastsMc- +acteurNon/r&onne, +acteur/r&onne1 oZ +acteurNon/r&onne -resp. +acteur/r&onne1 est le no" &u type &e contraste par &$+aut. A..EN.I/N F cette co""an&e &oit Atre "ise apr2s l)appel ; R #ommander car ce &ernier $crase cette option par &$+aut. E1 ()utilisateur peut intro&uire ses propres "atrice &e contrastes. Ee sont &es "atrices &e N li#nes, oZ N est le no"bre &e niveau8, et &e M-1 colonnes &ans lesquelles c%aque colonne co&e un contraste particulier.

Statistiques pratiques avec Statistica et R

- F. Aubry

pX

Tests de normalit
Sous Statistica, pour tester l)a&$quation &e la &istribution &)une variable ; une loi F cliqueD sur l)ite" :A*uste"ent &e &istribution) &u "enu :Statistiques). 7our tester la nor"alit$, c%oisir :&istribution nor"ale) et activeD le test &e 0ol"o#orov-S"irnov -continu1 puis visualiser les r$sultats. Wous aureD alors les r$sultats pour les tests &u 9%i-&eu8, &e 0ol"o#orov-S"irnov et &e (ilien+ors.

Sous R, on peut &irecte"ent +aire le test &e S%apiro et <il9s, +onction s%apiro.test. Il +aut noter qu)il e8iste un pac9a#e sp$ciale"ent &$&i$ au8 tests &e nor"alit$, le pac9a#e nortest qui propose cinq tests &ont &eu8 tests classiques, celui &e (illie+ors -lillie.test1 et celui &e Era"er-von Mises -cv".test1. (e pac9a#e stats, c%ar#$ par &$+aut, propose aussi le test &e 0ol"o#orov-S"irnov -9s.test1 qui per"et &e co"parer une +onction &e r$partition e"pirique ; une +onction &e r$partition t%$orique.

Statistiques pratiques avec Statistica et R

- F. Aubry

p8

Lancer lanalyse
Sous Statistica, *)utiliserai par la suite l)on#let le plus #$n$ral, c)est-;-&ire l)option :Mo&2le (in$aire Q$n$ral) &e l)ite" :Mo&2le (in$aire Q$n$ral) &u "enu :Statistiques) -c+. ci-contre1. \ l)utilisateur &)a&apter les e8e"ples ; son c%oi8.

Sous R, *e n)utiliserai pas R #ommander "ais les li#nes &e co""an&e. Ici aussi, ; l)utilisateur &)a&apter les e8e"ples. (es e8e"ples sous R sont tous bas$s sur l)utilisation &es +onctions l" ou aov. Il e8iste &)autres +onctions per"ettant &e +aire &es analyses lin$aires ou non, "ais cela sort &u ca&re &e ce &ocu"ent.

Statistiques pratiques avec Statistica et R

- F. Aubry

p[

R$+$rences pour les utilisateurs &e R, par e8e"ple F Fara=ay, CC, 37ractical re#ression an& AN/WA usin# R3 - VV 1, http: cran.r!pro"ect.or# doc contrib Fara$ay!%RA.pdf@ Yaron, C, (i, R, 3Notes on t%e use o+ R +or psyc%olo#y e8peri"ents an& questionnaires3 - VV>1, http: cran.r!pro"ect.or# doc contrib 6aron!rpsych.pdf Yaayen P., 3AnalyDin# (in#uistic 4ataF A 7ractical Intro&uction to Statistics3, http: $$$.ualberta.ca 7baayen publications baayen89%stats.pdf

/n peut trouver &)autres r$+$rences sur le site &e R, &ont certaines en +ran]ais -http: cran.r!pro"ect.or# option $anuals et #ontributed documentation1.

Il e8iste un pac9a#e &e no" fara$ay qui contient les &onn$es et les +onctions &u livre.

Statistiques pratiques avec Statistica et R

- F. Aubry

p 1V

Spcification de lanalyse (ANOVA et rgression)

Sous Statistica, le "o&2le se sp$ci+ie en &eu8 $tapes F E%oi8 ses variables &$pen&antes et in&$pen&antes E%oi8 &e la +or"ule -e++ets et interactions1

7r$&icteurs cat$#oriels M +acteurs -AN/WA, ANE/WA1 7r$&icteurs continus M r$#resseurs -ANE/WA, r$#ression1

7ar &$+aut F "o&2le satur$, c)est-;-&ire tous les e++ets principau8 et toutes les interactions. (e bouton :E++ets inter) per"et &e c%oisir les e++ets et les interactions ; tester -voir la &ocu"entation &e Statistica1.

Statistiques pratiques avec Statistica et R

- F. Aubry

p 11

Sous R, la +onction a &eu8 ar#u"ents, la +or"ule et les &onn$es. 7ar e8e"ple l"- +or"ule, &ataM4/NNEES1. (a +or"ule co"pren& &eu8 c%a"ps F a1 ; #auc%e, le no" &e la colonne correspon&ant au8 variables &$pen&antes, b1 ; &roite, la co"binaison &es variables et covariables e8plicatives. (es &eu8 c%a"ps sont s$par$s par un til&e -^1. Un e++et principal est co&$ par le no" &u +acteur, une interaction par le no" &es +acteurs s$par$s par :F). Si &eu8 +acteurs sont s$par$s par :_), cela si#ni+ie qu)on teste les e++ets principau8 et l)interaction. E8e"ples F MMSE/4E ^ Qroup'4ia# ` S@ MMSE/4E ^ S@ ` Qroup'4ia#FS@ MMSE/4E ^ Qroup'4ia# _ S@ co&e pour MMSE/4E e8pliqu$ par Qroup'4ia# et S@ sans interaction co&e pour MMSE/4E e8pliqu$ S@ et l)interaction entre Qroup'4ia# et S@! co&e pour MMSE/4E ^ Qroup'4ia# ` S@ ` Qroup'4ia#FS@

S)il s)a#it &)une r$#ression lin$aire, par e8e"ple a, on co&e la "A"e "ani2re le r$#resseur. 7ar contre &ans le cas &)une r$#ression polyno"iale, le co&a#e &es puissances est particulier. 7ar e8e"ple, pour une r$#ression cubique, on aura R ^ a ` I-ab 1 ` I-ab>1. 4e plus, R per"et &)intro&uire &es +onctions &ans la +or"ule. /n peut par e8e"ple tester &irecte"ent lo#- R1 ^ ... /n peut aussi +orcer certains coe++icients #rcce ; la +onction o++set. 7ar e8e"ple, R ^ a ` o++set- - _ a1 per"ettra &e tester si la pente est si#ni+icative"ent &i++$rente &e - . En+in, l)ar#u"ent contrasts per"et &e tester &irecte"ent &es contrastes sans Atre obli#$ &e calculer les para"2tres &u "o&2le par &$+aut co""e &ans Statistica, puis &)utiliser l)on#let :co"paraisons plani+i$es) &es r$sultats -au travers &u bouton :autres r$sultats)1.

/n pourra aussi $crire MMSE/4E ^ S@LQroup'4ia# ou MMSE/4E ^ S@ ` Qroup'4ia# dind S@1

Statistiques pratiques avec Statistica et R

- F. Aubry

p1

Visualisation des rsultats

Sous Statistica, les pre"iers r$sultats s)obtiennent en cliquant sur les boutons :tous les e++ets) ou :tous les e++etsL#rap%es), pour visualiser les e++ets et interactions si#ni+icatives, le secon& bouton per"ettant en plus &)obtenir un #rap%ique B :R "o&2le co"plet) pour avoir le /2 et le /2 a*ust$.

Sous R, cela se +ait en plusieurs $tapes. a1 on esti"e les para"2tres par la +onction l" ou aov F para"."o& I- l"- +or"ule, &ata...1 ou aov- +or"ule, &ata...1 b1 on obtient la table &e F i&entique ; ce qu)on obtient avec le bouton :tous les e++ets) &e Statistica par la +onction anova F anova- para"."o&1. c1 le /2 est accessible par la +onction su""ary si on a utilis$ l". Il +aut cepen&ant +aire attention puisque par &$+aut Statistica utilise une so""e &es carr$s &e t%pe 3 -ou ? qui en est une e8tension1 et que la so""e &es carr$s par &$+aut &e R est &e t%pe ". /n peut cepen&ant revenir ; une so""e &es carr$s &e type > #rcce ; la +onction Anova -avec un & ma'uscule1 F Anova- para"."o&, typeM>1

/n peut visualiser #rap%ique"ent les r$sultats et, par e8e"ple, visualiser les interactions par la +onction interaction.plot.

Statistiques pratiques avec Statistica et R

- F. Aubry

p 1>

(a +onction su""ary &e R per"et &)obtenir les valeurs &es contrastes et leur si#ni+icativit$. Il n)y a par contre pas &e +onction qui per"et &)obtenir &irecte"ent les coe++icients co""e on l)a par le bouton :Eoe++icients) &e l)on#let :Synt%2se) &e Statistica. Eepen&ant, la +onction &u""y.coe+ per"et &e calculer les &N8y tels que *e les ai &$+inis plus %aut quan& *e pr$sente les contrastes. /n peut revenir au8 coe++icients en utilisant les "atrices &e contrastes. En e++et, ils se &$+inissent ainsi par la "atrices suivantes &e N li#nes -le no"bre &e coe++icients &$+inis par 1 ` no"bre &e niveau8 &u +acteur 1 ` no"bre &e niveau &u +acteur ` ... ` no"bre &e niveau8 &ans les interactions1 et M colonnes, le no"bre &e para"2tres esti"$s F // 1 V V V Eontrastes +acteur 1 V c1 I- contrasts- 4/NNEESOF11 V V Eontrastes +acteur Eontrastes interaction V V V V c I- contrasts- 4/NNEESOF 1 V V 9ronec9er- c , c11? 7ara"2tres esti"$s /r&onn$e ; l)ori#ine Eontrastes &u +acteur 1 Eontrastes &u +acteur Eontraste &es interactions

// Niveau8 +acteur 1 Niveau8 +acteur Niveau8 interaction

!(T) *$+(RT&!T) : ,a formulation prcdente nest pas applicable au t%pe appel contraste traitement par R (contr.treatment et contr.Treatment) dans R car ils ne donnent pas des contrastes. -ien .ue facilitant linterprtation des paramtres/ il est prfrable de ne pas utiliser ce t%pe de contraste.

Ce rappelle que les proc$&ures c%erc%ent ; esti"er l)or&onn$e ; l)ori#ine et les coe++icients, appel$s p%i &ans la litt$rature statistique, &e l)$quation suivant F y* M or&onnee/ri#ine ` niveau- *B F11 ` niveau- *B F 1 ` ... ` interaction- *B F1, F 1 ` ... Ainsi, la "oyenne &es "oin&res carr$s &u niveau 1 &e F1 pourra se calculer par F E"cJRF1.1K M or&onnee/ri#ine ` F1.1 ` so""eSur.ous(esNiveau84eF - F .8 1 `... /n pourra alors tester ces coe++icients ou tout autres coe++icients qui peuvent se construire selon la "$t%o&olo#ie ci-&essus #rcce, par e8e"ple, ; une +onction #$n$rale &e tests #$rant les co"paraisons "ultiples, la +onction #l%t -Qeneral (inear Pypot%esis .estin#1 &u pac9a#e multcomp. Ce ne &$taillerai pas cette +onction et ses "ultiples possibilit$s. 7our les lecteurs qui veulent en savoir plus, et se plon#er un peu &ans la t%$orie, voir E%ap"an an& Pall, Multiple co"parisons Usin# R -http: eboo:ee.or# Multiple!8omparisons!9sin#!R;1/14./.html1.
?

(e pro&uit &e 0ronec9er est un pro&uit &e l)al#2bre lin$aire &ont la &$+inition i"porte peu ici. S)il y a trois +acteurs, on aura alors 9ronec9er- c>, 9ronec9er- c , c111.

Statistiques pratiques avec Statistica et R

- F. Aubry

p 1@

\ noter que si le +acteur a est une covariable et non un +acteur, la sous "atrice ci-&essus ca se r$&uit ; une "atrice 181 &e valeur unit$. (a pr$sentation "atricielle ci-&essus per"et &e calculer :; la "ain) &e nouveau8 contrastes. En e++et, si on appelle E la "atrice ci-&essus et Nc la "atrice &es nouveau8 contrastes, la valeur &e ces nouveau8 contrastes se calcule par F p%i I- E d_d as."atri8- resultatOcoe++icients, ncolM11 nouveau8Eontrastes I- #inv- Nc1 d_d p%i

Statistiques pratiques avec Statistica et R

- F. Aubry

p 1!

Analyse des rsidus


Sous Statistica 4roite &e Penry -toutes analyses1

Analyse &es r$si&us -r$#ression1 .est &e 4urbin-<atson F eee .est &es suitesX F eee .rac$ &e ri`1 M +- ri1 F r$cup$reD les valeurs et tracer la courbe par un autre lo#iciel

(es options :R$si&us &ans les trac$s) per"ettent &e c%oisir F . :Yrut) peut +aire apparaUtre un r$si&u biais$ -i.e., non centr$ sur D$ro1 . :Eentr$s-r$&uits) F nor"alit$ &es r$si&us . :Stu&entis$s) F r$si&us anor"au8 -cf. infra1

Analyse &e la +or"e &es r$si&us F on#let :R$si&us ). E%oisir &ans la liste :a) le r$#resseur -en #$n$ral &ans les &erniers &e la liste1, &ans la liste :R), :R$s Stu) puis cliqueD sur :Nua#e &e points &es a vs. R s$lectionn$s)1. Si les observations sont or&onn$es selon le r$#resseur est qu)il est uni+or"$"ent $c%antillonn$, on peut utiliser le bouton :Nf &)obs g r$si&) &u panneau :R$si&us 1)

En an#lais, :test &es suites) se &it :runs test)

Statistiques pratiques avec Statistica et R

- F. Aubry

p 1?

Sous R, il e8iste plusieurs +onctions F i1 &roite &e Penry F qqnor", ii1 test &e 4urbin-<atson F &urbin<atson.est -cf. &ocu"entation1 ou &urbin.=atson, iii1 test &es suites F on peut par e8e"ple utiliser la +onction runs.test &u pac9a#e la$stat, iv1 le trac$ &e ri`1 M +- ri1 peut Atre +acile"ent pro#ra""$ F supposons que result est le r$sultat &e l)analyse, on peut alors, par e8e"ple, utiliser le co&e suivant F G N F est le no"bre total &)observations plot- resultOresi&ualsJ1F-N-11K, resultOresi&ualsJ FNK1 v1 Analyse &e la +or"e &es r$si&us G /n stu&en&ise les r$si&us F +onction rstu&ent ou stu&res stu&.res I- rstu&ent- result1 G .rac$ &es r$si&us en +onction &u r$#resseur plot- stu&.res ^ 4/NNEESOno"4uRe#resseur1 G A*out &e la li#ne yMV abline- %MV1 G A*out &e la &roite &e r$#ression l".res I- l"-stu&.res ^ 4/NNEESOno"4uRe#resseur1 pre&ict.res I- pre&ict- l".res1 points- pre&ict.resO+it ^ 4/NNEESOno"4uRe#resseur, typeM3l3, colM3 31 G 7our les trans+or"ations puissance &e type Yo8-Eo8 F +onctions bc7o=er -ancienne"ent bo8.co81 ou bo8co8

Rgression : test de la VI (Varia!le Inflation actor)

4ans Statistica, le +acteur &e #on+le"ent &e la variance -WIF1 est accessible par l)on#let :Avanc$) &es r$sultats &e r$#ression "ultiple. Woir le "anuel $lectronique en li#ne &e Statistica, "ots ; c%erc%er WIF, pour les &$tails. Statistiques pratiques avec Statistica et R - F. Aubry p 1X

R propose une +onction vi+ &ans le pac9a#e car -c%ar#$ par &$+aut1 qui pren& co""e ar#u"ent le r$sultat &)une analyse par l". Woir l)ai&e8.

ANOVA : groupes "uili!rs

Sous Statistica, la solution pour tester l)$quilibra#e en e++ecti+ est &e cr$er une colonne contenant le no"bre &)in&ivi&us par cellule et &e tester l)a*uste"ent ; la &istribution uni+or"e. /n peut utiliser alors le test &u 9%i-&eu8 et le test &e 0ol"o#orov-S"irnov avec l)option :cat$#oris$) pour tester la con&ition &ans c%aque #roupe.

(e test &e #roupes proportionnels est +acile ; "ettre en 5uvre pour les analyses ; +acteurs. En e++et, il su++it alors &e construire le tableau &e contin#ence et &)analyser l)in&$pen&ance &e ces &eu8 +acteurs en ter"es &e +r$quence. En e++et si +i* est la +r$quence &ans la cellule -i, *1, les e++ecti+s sont proportionnels si +i* M +i. _ +.* oZ les +i. sont les +r$quences "ar#inales pour les niveau8 &u pre"ier +acteur et +.* celles pour le secon& +acteur. Sous R, on peut construire +acile"ent le vecteur &es e++ecti+s et le tester F e++ecti+s I- a##re#ate- 4/NNEESOy, byMlist- 4/NNEESOF1, 4/NNEESOF ...1, len#t%1 c%isq.test- e++ecti+sO81 7our tester les +r$quences F ro=.+req I- a##re#ate- 4/NNEESOy, byMlist- 4/NNEESOF11, len#t%1O8 L nro=- 4/NNEES1 col.+req I- a##re#ate- 4/NNEESO8, byMlist- 4/NNEESOF 1, len#t%1O8 L nro=- 4/NNEES1
Sous R, pour avoir &e l)ai&e sur une +onction, il su++it &e taper eno"4e(aFonction si le pac9a#e est c%ar#$ et activ$, eno"4u7ac9a#eFFno"4e(aFonction, si le pac9a#e a si"ple"ent $t$ c%ar#$. Si on n)obtient rien, cela si#ni+ie qu)il +aut c%ar#er le pac9a#e &epuis le site &e R ou un &es sites "iroir. 7our rec%erc%er &es in+or"ations sur le site, on peut utiliser ; partir &e R la +onction RSiteSearc%.
8

Statistiques pratiques avec Statistica et R

- F. Aubry

p 18

c%isq.test- table- 4/NNEESOF1, 4/NNEESOF 1, pM 9ronec9er- t- col.+req1, ro=.+req11

4ans le cas &e #roupes non $quilibr$s, les proc$&ures classiques aussi sous Statistica que sous R, ne #2rent pas &irecte"ent ce cas. 4e plus, les statisticiens ne sont pas &)accor& entre eu8 pour &$+inir le type &e so""e &es carr$s ; utiliser. Eertains reco""an&ent le type I, &)autres le type II et les &erniers les type III.

ANOVA : #troscdasticit

Test des variances


Sous Statistica, le test &)$#alit$ &es variances est accessibles &ans les r$sultats, sous l)on#let :Pypot%2ses) accessibles par le bouton :Autres r$sultats).

Sous R, on peut utiliser la +onction levene.est.

+ondration des donnes et corrections pour l0troscdasticit


Statistica ne pr$voit pas &e corrections et su##2re &e trans+or"er les &onn$es.

Statistiques pratiques avec Statistica et R

- F. Aubry

p 1[

4ans R, on peut pon&$rer +acile"ent les &onn$es en utilisant l)ar#u"ent =ei#%ts &es proc$&ures l" ou aov. Si on n)utilise pas la pon&$ration, on peut corri#er les r$sultats &e l)anova an utilisant l)ar#u"ent =%ite.a&*ust &e la +onction Anova en lui &onnant valeur .RUE ou une &es valeurs &e l)ar#u"ent type &e la +onction %cc". /n peut aussi corri#er les tests sur les para"2tres en utilisant la +onction linearPypot%esis avec l)ar#u"ent =%ite.a&*ust ayant les "A"es valeurs &e pour Anova. Il est possible aussi &e pren&re en co"pte l)%$t$rosc$&asticit$ si on utilise la +onction #l%t &u pac9a#e multcomp en in&iquant e8plicite"ent l)utilisation &)une +onction pour esti"er la "atrice &e covariance &es para"2tres. ()une &es solutions propos$es est &)utiliser l)esti"ation &ite sand1ic0 qui est un esti"ateur robuste &e la "atrice &e covariance. Il est accessible par la +onction san&=ic% &u pac9a#e sand$ich. (es +onctions coe+test et =al&test &u pac9a#e lmtest per"ettent aussi &es tests sur les coe++icients en tenant co"pte &e l)%$t$rosc$&asticit$ puisqu)elles poss2&ent aussi un ar#u"ent vcov qui per"et &e sp$ci+ier une "atrice &e variance covariance &es para"2tres. \ noter que par &$+aut, ces +onctions n$cessitent le pac9a#e sand$ich. ()appel &e #l%t sera par e8e"ple F require- san&=ic%1 G ou library- san&=ic%1 #l%t- "o&eleA.ester, lin+ctM%ypot%eses.estees, vcovMsan&=ic%1 \ noter que R propose &es pac9a#es &ont les proc$&ures, plus co"ple8es que l" ou aov, prennent e8plicite"ent en co"pte l)%$t$rosc$&asticit$, par e8e"ple, la +onction #ls &u pac9a#e nlme qui per"et &e sp$ci+ier la structure &e la corr$lation. Eette +onction n)utilise pas une esti"ation par les "oin&res carr$s "ais une esti"ation &u "a8i"u" &e vraise"blance. 7our tester les "o&2les entre eu8, il est conseill$ &e sp$ci+ier "et%o&M3M(3 et &)utiliser le crit2re AIE, tan&is que pour esti"er les para"2tres, il est pr$+$rable &)utiliser l)option par &$+aut -"et%o&M3REM(31. A..EN.I/N F (es calculs peuvent s)av$rer lon#s en +onction &e la structure &e corr$lation.

$o%paraisons planifies

Sous Statistica, on peut lancer &es co"paraisons plani+i$es ; partir &e l)on#let :Eo"paraisons plani+i$es) accessible via le bouton :Autres r$sultats), une +ois que l)analyse +aite. 11 on peut &$+inir ses propres contrastes F Si les co"paraisons plani+i$es portent sur un e++et principal, il n)y a qu)une seule +a]on &e les con&uire. Si elles portent sur une interaction, Statistica propose &eu8 strat$#ies F 11 S$par$"ent pour c%aque +acteur, 1 Ense"ble.

Statistiques pratiques avec Statistica et R

- F. Aubry

p V

Une +ois les contrastes sp$ci+i$s, il su++it &e cliqueD sur le bouton :Ealculer). Statistica +ournit @ panneau8, les &eu8 pre"iers reprennent les sp$ci+ications, le troisi2"e &onnent l)esti"ation, la si#ni+icativit$ ; D$ro et l)intervalle &e con+iance &e c%acun &es contrastes le quatri2"e &onne le la"b&a &e <il9, c)est-;&ire la si#ni+icativit$ #lobale &e tous les contrastes pris ense"ble. Il n)a &onc &)int$rAt que si on calcule si"ultan$"ent plusieurs contrastes. A..EN.I/N F Il +aut noter que Statistica ne #2re pas correcte"ent ces co"paraisons quan& il y a &es interactions et que les co"paraisons portent sur les e++ets principau8. En e++et, supposons le "o&2le satur$ R ^ F1 ` F ` F1FF . ()analyse &onne alors les r$sultats suivants F

F Ord.Orig. "F1" "F2" "F1"*"F2" Erreur 510,058 1,919 1074,290 47,913

p 0,000000 0,128889 0,000000 0,000000 Ord.Orig. "F1" "F1" "F1" "F2"

Niveau

"VXcr"

"VXcr"

"VXcr"

-95,00%

+95,00%

0,319587 22,5845 0,000000 0,291630 0,347545 "Fact_1.1" -0,020978 -0,8559 "Fact_1.2" 0,048475 1,9778 "Fact_1.3" -0,040609 -1,6568 0,107326 4,3789 0,207770 8,4770 -0,231036 -9,4263 0,393407 -0,069402 0,027446 0,049761 0,000051 0,096899 0,099617 -0,089032 0,007815 0,000022 0,058903 0,155750 0,000000 0,159346 0,256194 0,000000 -0,279460 -0,182612

"Fact_2.1" -0,463810 -32,7764 0,000000 -0,491768 -0,435853

"F1"*"F2" 1 "F1"*"F2" 2 "F1"*"F2" 3

Si on utilise le volet :Eo"paraisons plani+i$es) et qu)on &onne co""e contraste pour F1 les valeurs suivantes qui sont les contrastes utilis$s par la proc$&ure pour calculer les valeurs ci-&essus F
Coefficients Contraste Inter (mat_eq) Coefficients de chaque cellule pour l'effet slectionn "F1" 1 "Fact_1.1" 40 N Cellul 1 CNTRST1 0 CNTRST2 0 CNTRST3

Statistiques pratiques avec Statistica et R

- F. Aubry

p 1

2 "Fact_1.2" 3 "Fact_1.3" 4 "Fact_1.4"

40 40 40

0 0 -1

1 0 -1

0 1 -1

/n obtient alors F
Contrastes Estims (mat_eq) Variable dpendante : "VXcr" Estim. Err-Type t p -95,00% +95,00% CNTRST1 -0,034089 0,040024 -0,85170 0,395723 -0,113164 0,044987 CNTRST2 0,035364 0,040024 0,88357 0,378325 -0,043712 0,114440 CNTRST3 -0,053720 0,040024 -1,34217 0,181542 -0,132795 0,025356

Sui sont &i++$rentes &e celles au8 quelles on pouvait s)atten&re "ais qui sont alors celles &es para"2tres esti"$s par le "o&2le a&&iti+ sans interaction F R ^ F1 ` F F
Paramtres Estims (mat_eq) Paramtrisation sigma-restreint Niveau Ord.Orig. "F1" "F1" "F1" "F2" Colonne 1 "Fact_1.1" 2 "Fact_1.2" 3 "Fact_1.3" 4 "Fact_2.1" 5 "VXcr" "VXcr" "VXcr" "VXcr" -95,00% +95,00% "VXcr" "VXcr" -95,00% +95,00%

0,319587 0,019546 16,3501 0,000000 0,280975 0,358199 -0,020978 0,033855 -0,6196 0,048475 0,033855 1,4318 -0,040609 0,033855 -1,1995 0,536415 -0,087855 0,045900 -0,028261 0,045610 -0,118358 0,061836 0,154206 -0,018402 0,115353 0,065306 0,045610 -0,024792 0,155403 0,232176 -0,107486 0,026269 -0,054708 0,045610 -0,144805 0,035390

-0,463810 0,019546 -23,7286 0,000000 -0,502422 -0,425198 -0,883660 0,037240 -0,957224 -0,810096

*, 2&3T 4(!# 5TR) TR67 +R34)!T 4&!7 ,3T*,*7&T*(! 4)7 #($+&R&*7(!7 +,&!*2*8)7 7(37 7T&T*T*#&.

Statistiques pratiques avec Statistica et R

- F. Aubry

1 on peut utiliser &es contrastes pr$&$+inies en cliquant sur l)un &es boutons &e la boUte :7r$&$+ini) &e la +enAtre &e &ialo#ue :Sp$ci+ier les contrastes &u +acteur) F

Sous R, on peut lancer &irecte"ent &es co"paraisons plani+i$es #rcce ; l)ar#u"ent constrasts &e la +onction &)analyse -cf. supra1. Il est aussi possible &e la +aire ; partir &u r$sultat &)une pre"i2re analyse lin$aire #rcce ; la +onction up&ate en &onnant &e nouveau8 contrastes qui sont co&$s co""e pour le para"2tre contrasts &e +onction &)analyse. 4ans les &eu8 cas, les r$sultats sont e8ploitables par toutes les +onctions qui per"ettent &)e8ploiter les r$sultats &e l" -si on a utilis$ l"1 ou &)aov &ans l)autre cas. (a +a]on &e proc$&er &e R est &onc proc%e &e la secon&e strat$#ie &e Statistica, sans le probl2"e "entionn$ ci-&essus. Il +aut aussi noter que sous R, les +onctions linearPypot%esis -pac9a#e par &$+aut1, coe+test -pac9a#e lmtest1 et #l%t -pac9a#e multcomp1 per"ettent nota""ent ce #enre &e test.

Statistiques pratiques avec Statistica et R

- F. Aubry

p >

E8e"ples sous R F s.+1 I-l"- Wacr ^ F1 _ F , "at.eq, contrastsMlist- F1M3contr.su"3, F M3contr.su"311 ps.+1 I- up&ate- s.+1, contrastsMlist- F1M3contr.poly311 u.+1 I- l"- Wacr ^ F1 _ F , "at.eq, contrastsMlist- F1M3contr.poly3, F M3contr.su"311 su""ary- ps.+11 et su""ary- u.+11 &onnent e8acte"ent les "A"es r$sultats.

Il +aut cepen&ant +aire tr2s attention ; la sp$ci+ication &es contrastes. En e++et, supposons qu)on ne veuille que tester l)$#alit$ &es &i++$rences entre les niveau 1 et &e F1 &)une part, et les niveau8 > et @ &)autre part. En ter"es &e contraste, on pourra $crire ce test sous la +or"e F V,! _ -Fact'1.@ - Fact'1.>1 M V,! _ -Fact'1. - Fact'1.11 qui est i&entique au contraste testant la ten&ance qua&ratique quan& il y a quatre niveau8. En e++et, la "atrice nor"alis$e &es contrastes et la suivante F (in$aire -V,?XV8 -V. >?V V. >?V V,?XV8 Sua&ratique V,! -V,! -V,! V,! Eubique -V, >?V V,?XV8 -V,?XV8 V. >?V

Fact'1.1 Fact'1. Fact'1.> Fact'1.@

/n peut alors se &e"an&er si ne tester que ce contraste qui nous int$resse &onne la "A"e c%ose que le test #lobal &u +acteur, c)est-;-&ire si le para"2tre qua&ratique &e F1 &ans ps.+1 est i&entique au seul para"2tre esti"$ pour F1 &ans l)analyse suivante F pu.+1 I- up&ate- s.+1, contrastsMlist- F1M"atri8- c- V.!, -V.!, -V.!, V.!1, ncolM1111

Statistiques pratiques avec Statistica et R

- F. Aubry

p @

(e r$sultat "ontre que ce n)est pas le cas co""e le "ontre les tableau8 suivants F AN<=A 4f 2" 2 2":2 Residuals > 1 > 1! 7um 7. V,18@@ >@,@1[ @,?V! @,8?[[ ps.f" $ean 7. 2 value +r(92) V,V?1! 1,[18[ V,1 8[ >@,@1[ 1VX@, [V V,VVVV 1,!>!1 @X,[1>V V,VVVV V,V> V NA NA pu.f" $ean 7. 2 value +r(92) V,VV ! V,V@V1 V,8@1? >@,@1[ !!X, ! V V,VVVV V,V 1X V,>!V? V,!!@X V,V?18 NA NA

4f 1 1 1 1!?

7um 7. V,VV ! >@,@1[ V,V 1X [,?>!!

%aram>tres (*ntercept) 2".; ou 2"" 2 " 2".;<2"":2 " )stimate V,>1[? -V,VVX[ -V,@?>8 V,V >>

ps.f" 7td. )rror V,V1@ V,V 8> V,V1@ V,V 8>

t value ,!8@! -V, X8V -> ,XX?@ V,8 1

+r(9:t:) V,VVVV V,X81@ V,VVVV V,@1 >

)stimate V,>1[? -V,VVX[ -V,@?>8 V,V >>

pu.f" 7td. )rror V,V1[? V,V>[> V,V1[? V,V>[>

t value 1?, ?!8 -V, VV - >,?V? V,![ 1

+r(9:t:) V,VVVV V,8@1? V,VVVV V,!!@X

E8ercice F e8pliquer les &i++$rences

\ noter le pac9a#e contrast &e R que *e n)ai pas test$ et qui se"ble proposer une inter+ace beaucoup plus conviviale pour e++ectuer les tests.

Statistiques pratiques avec Statistica et R

- F. Aubry

p !

&est 'post(#oc

S.A.IS.IEA per"et &e no"breu8 tests post-%oc, c)est-;-&ire &es tests sur les "oyennes. Ils sont accessibles sous l)on#let :7ost-%oc) obtenus en cliquant le bouton :autres r$sultats). (es principales options &e S.A.IS.IEA sont F - tester &es &i++$rences si#ni+icatives entre "oyennes B - cr$er &es #roupes %o"o#2nes, c)est-;-&ire re#rouper entre eu8 les niveau8 &ont les "oyennes sont &u "A"e or&re &e #ran&eur. 4ans ce cas, les #roupes peuvent se c%evauc%er et c)est ; l)e8p$ri"entateur &e c%oisir lui -"A"e les re#roupe"ents a+in &e cr$er une partition, par e8e"ple en coupant entre les &eu8 niveau8 cons$cuti+s &ont la &i++$rence entre les "oyennes et la plus #ran&es. Il propose &es tests en une seule passe et &es tests ; plusieurs passes, ceu8-ci $tant #$n$rale"ent plus puissants que les tests ; une seule passe, ainsi que la co"paraison ; un #roupe &e r$+$rence -test &e 4unett1.

(es tests post-%oc n)entrent pas &ans la p%ilosop%ie &e R qui ne propose que &eu8 tests +acile"ent accessibles et unique"ent pour les r$sultats &e la proc$&ure aov, le test PS4 &e .u9ey, .u9eyPS4 et le test &e 4uncan -(4uncan &u pac9a#e laercio1. Eepen&ant, R o++re un outil tr2s souple pour pro#ra""er ses tests, en tenant co"pte &es co"paraisons "ultiples et &e l)%$t$rosc$&asticit$, #rcce ; la proc$&ure #l%t &u pac9a#e multcomp -cf. supra1. Il e8iste plusieurs "ani2res &e sp$ci+ier les co"paraisons par l)ar#u"ent lin+ct F i1 &e "ani2re sy"bolique par un vecteur &e con&itions &u type 3co"binaison(ineaire M valeur3 B &ans ce cas les co"binaisons lin$aires test$es sont &es co"binaisons &es para"2tres esti"$s et non &es "oyennes &es niveau8 B ii1 &e "ani2re nu"$rique sous +or"e &)une "atrice qui est la tra&uction nu"$rique &e l)option pr$c$&ente B &ans ce cas, il est conseill$ &e no""er les li#nes &e la "atrice -ar#u"ent &i"na"es &u constructeur "atri8 ou +onction ro=na"es1 B il +aut +aire attention au8 contrastes &u "o&2le tester, on peut alors cr$er &es contrastes non pas sur les para"2tres esti"$s "ais sur le p%i qu)on obtient +acile"ent par la trans+or"ation suivante -cf. supra1 F p%i I- E d_d l"."o&elOcoe++icients Statistiques pratiques avec Statistica et R G Woir plus %aut la construction &e la "atrice E - F. Aubry p ?

Il +aut &onc &onner ; lin+ct la "atrice r$sultant &u pro&uit "atriciel entre les contrastes ; tester la "atrice E F Epersonnel d_d E. iii1 en utilisant la +onction &)inter+ace "cp qui a soit un ar#u"ent sy"bolique, soit un ar#u"ent nu"$rique sous +or"e &e "atrice B cette +onction a ses li"ites "ais, en contrepartie, elle per"et &e ne pas avoir ; pren&re en co"pte les contrastes &u "o&2le qu)elle #2re elle-"A"e. (a solution ii1 est la plus #$n$rale. Suan& on utilise une sp$ci+ication nu"$rique, le test par &$+aut est celui ; la valeur nulle. #l%t per"et alors &e sp$ci+ier &)autres valeurs par son ar#u"ent r%s.

Analyse de tendance

Sous Statistica, elle est accessible par l)on#let :Eo"paraisons plani+i$es), option :contrastes polyno"iau8) -cf. supra1. Il +aut &$+inir tous les contrastes. A..EN.I/N au8 probl2"es &)interpr$tation &$*; $voqu$s ci-&essus -c%an#e"ent &e "o&2le, "oins &e contrastes que &e &e#r$s &e libert$...1

Sous R, il su++it &e &$+inir co""e contraste pour ce +acteur, :contr.poly) par l)une &es "$t%o&es &$*; $voqu$e.

Statistiques pratiques avec Statistica et R

- F. Aubry

p X

Influence des points et points a!errants

Sous Statistica, on a acc2s ; ces outils sous les on#lets :R$si&us 1) et :R$si&us ) accessibles par le bouton :Autres r$sultats). 7ar &$+aut, les nua#es &e points ne &onnent pas les $tiquettes &es points. Il est cepen&ant +acile &e les obtenir F en n)i"porte quel en&roit &u #rap%ique, cliqueD avec le bouton &roit &e souris. 4ans le "enu conte8tuel, cliqueD sur :7ropri$t$s &u #rap%ique) puis aller ; l)on#let :.rac$ - htiquettes &es points).

Sous R, il e8iste plusieurs possibilit$s. (a "ani2re la plus synt%$tique est F plot- resultat4e(Analyse1 Si on veut aller plus loin, voir la +onction :in+luence) ainsi que les autres +onctions au8 quelles elle +ait r$+$rence -in+luence."easures, %at, ... 1. 7our r$cup$rer les i&enti+ications &es in&ivi&us ne respectant pas les contraintes, on peut par e8e"ple utiliser la s$quence suivante F para"etre4In+luence M +onction4In+luence- result, ...1 G par e8e"ple, +onction4In+luence M coo9s.&istance in&ivi&us I- &onneesJpara"etre4In+luence i seuil,K et pour visualiser les &onn$es F plot- para"etre4In+luence, typeM3p3, 8labM3nu"ero in&ivi&us3, ylabM3no"7ara"etre31 abline- vMseuil, typeM3l3, colM 1

Statistiques pratiques avec Statistica et R

- F. Aubry

p 8

)ualit de la*uste%ent et dfaut da*uste%ent

Sous Statistica, il e8iste une option 3&$+aut &)a*uste"ent3 -lac9 o+ +it1.

Sous R, le &$coupa#e en classe peut se +aire #rcce ; la +onction cut et le calcul &u &$+aut &)a*uste"ent sera alors pro#ra""$ co""e suit F re#.result I- l"- R ^ a..., &onnees1 l".result I- l"- R ^ +actor- cut- &onneesOa, brea9sM...11..., &onnees1 anova- re#.result, l".result1 G Re#ression sur a G Ealcul sur les classes

+rogra%%er des ,ANOVA et des %esures rptes

Sous Statistica, il su++it &e &$+inir plusieurs variables &$pen&antes. Ensuite, selon qu)on &$+ini &es e++ets intra -bouton :E++ets intra) &e l)on#let :Yase)1 ou non, on pro#ra""e une AN/WA ; "esures r$p$t$es ou une MAN/WA. Il est possible &e &$+inir un plan intra co"prenant plusieurs +acteurs, ; con&ition qu)il soit +actoriel co"plet. Statistica +onctionne &onc en &eu8 $tapes, une pre"i2re co""une au8 MAN/WA et au8 AN/WA ; "esures r$p$t$es qui consiste en une analyse "ultivari$es et une secon&e, sp$ci+ique &es "asures r$p$t$es, qui teste les r$sultats &e la pre"i2re en tenant co"pte &u plan intra.

Sous R, il n)y a &eu8 "ani2res &i++$rentes selon qu)on utilise la +onction l" ou la +onction aov. Eepen&ant, les &eu8 options r$pon&ent ; &es lo#iques &i++$rentes. R propose aussi &)autres +onctions pour "ener ces analyses. 7our plus &)e8e"ples, on peut consulter &es pa#es co""e celles r$+$renc$es par cette pa#e http: $$$.r!blo##ers.com repeated!measures!anova!$ith!r!tutorials . Statistiques pratiques avec Statistica et R - F. Aubry p [

9tilisation de lm

l" +onctionne en &eu8 $tapes co""e Statistica. (a pre"i2re consiste &onc ; pro#ra""er une analyse "ultivari$e. 7our cela on sp$ci+ie &ans la partie #auc%e &e la +or"ule la liste &es colonnes &u &ata.+ra"e qui contiennent les variables &$pen&antes. ()$criture utilise alors la +onction cbin& qui co"bine &es colonnes[ (a +or"ule &evient alors cbin&- var4ep.1, var4ep. , ...1 ^ ... (a secon&e $tape est sp$ci+ique &es "esures r$p$t$es. En e++et, il +aut pren&re en co"pte le plan intra-su*et, c)est-;-&ire les relations entre les niveau8 &es +acteurs intra-su*ets &)une part et les relations entre les +acteurs inter-su*ets et intra-su*ets &)autre part. (a MAN/WA, qui est co""une avec la pre"i2re $tape &e l)analyse, ne pren& en co"pte que la relation entre c%aque variable &$pen&ante prise in&ivi&uelle"ent et les +acteurs intra-su*ets, et que les corr$lations entre les variables &$pen&antes. Eette prise en co"pte se +ait via le ter"e &)erreur qui, #rossi2re"ent se &$co"pose en &eu8 F un ter"e co""un ; toutes les variables -ii& ; travers les su*ets pour repr$senter les corr$lations entre variables &$pen&antes1 et un ter"e sp$ci+ique &e c%aque variable, in&$pen&ant &u pre"ier, ii& ; travers toutes les variables et tous les su*ets. Ainsi, pour aller vite, les tests n$cessaire ; l)analyse &es "esures r$p$t$es vont se baser sur une "o&i+ication &u secon& ter"e, initiale"ent esti"$ co""e $tant ii& ; travers toutes les variables et tous les su*ets, pour pren&re en co"pte la corr$lation &e type te"porelle entre les niveau8 &es +acteurs, car les "esures r$p$t$es sont, en pre"i2re appro8i"ation, une r$#ression sur &es variables qualitatives or&onn$es. Mais, l)analyse +ait aussi l)%ypot%2se que le sc%$"a &e corr$lation est le "A"e pour tous les su*ets et qu)il n)e8iste aucune corr$lation entre les su*ets. R propose &eu8 "$t%o&es pour "ener ; bien cette analyse.

(a +onction cbin& est une +onction #$n$rique &e R et son co"porte"ent &$pen& &u pre"ier ar#u"ent. Si c)est une "atrice, les autres ar#u"ents &oivent Atre &es "atrices ayant le "A"e no"bre &e li#nes ou &es vecteurs &e lon#ueur $#al au no"bre &e li#ne. Si c)est un &ata.+ra"e, les autres ar#u"ents &oivent Atre &es &ata.+ra"e. /n peut trans+or"er +acile"ent une "atrice en &ata.+ra"e par la +onction as.&ata.+ra"e. Inverse"ent, plusieurs colonnes &e "A"e type &)un &ata.+ra"e peuvent Atre trans+or"$es en "atrice par as."atri8. En+in, il est possible &ans tous les cas &e no""er les colonnes par la synta8e suivante F cbin&- no"EolonneMcontenuEolonne, ...1

Statistiques pratiques avec Statistica et R

- F. Aubry

p >V

11 utilisation &e la +onction anova -&ocu"entation accessible par eanova."l"1 F Eette +onction per"et aussi &e tester l)%ypot%2se &e sp%$ricit$ pour la MAN/WA qi on ne &onne pas &e valeur ; l)ar#u"ent i&ata. Ses principau8 ar#u"ents sont F test F le type &e test ; e++ectuer, i&ata F un &ata.+ra"e &$crivant le sc%$"a intra-su*et B ce &ata.+ra"e &oit avoir autant &e li#ne qu)il e8iste &e variables &$pen&antes et c%aque li#ne &$crite le niveau &u +acteur r$p$t$ associ$ ; la variable &$pen&ante, ou les niveau8 si le sc%$"a intra co"pren& plusieurs niveau8. (e plan +actoriel intra &oit Atre co"plet B les colonnes &oivent Atre &es +acteurs et no""$es. M et a, &es +or"ules ou &es "atrices &$crivant les tests -par &$+aut, aM^V1 B l)utilisation &e ces &eu8 ar#u"ents n)est pas $vi&ente car la &ocu"entation utilise un lan#a#e "at%$"atique sp$cialis$. Suan& ce sont &es +or"ules, elles utilisent alors les no"s &es colonnes &e i&ata. Ce vais essayer &)e8pliquer l)utilisation &e ces &eu8 ar#u"ents au pri8 &e quelques si"pli+ications F Ee qui va Atre test$ ce sont les contributions &es +acteurs &$crits &ans M qui ne proviennent pas &irecte"ent ou in&irecte"ent -via &es interactions1 &es +acteurs &$crits &ans a. M per"et &onc &e sp$ci+ier le sous ense"ble &e +acteurs intra sur lesquels on veut e++ectuer les tests, &e ce +ait la +or"ule associ$e sera sous la +or"e &)une so""e &e +acteurs F M M ^ F1 ` F a per"et &)e8clure les +acteurs &ont les e++ets &irects ou in&irects ne nous int$ressent pas, &onc les +acteurs "entionn$s &ans a &oivent Atre "entionn$s &ans M ; &eu8 e8ceptions pr2s F i1 aM^V F on s)int$resse au8 "oyennes esti"$s par les +acteurs &e M, c)est &onc un test avec co""e %ypot%2se nulle, la nullit$ &e la contribution &es +acteurs &e M B ii1 aM^1 F on centre les valeurs, on teste &onc l)$#alit$ ; la #ran&e "oyenne.

Statistiques pratiques avec Statistica et R

- F. Aubry

p >1

Qrap%ique"ent on peut repr$senter ces tests co""e suit F /n suppose &eu8 +acteurs intra F1 et F avec interaction -&)oZ le +ait que sur le #rap%ique les &eu8 +acteurs ne sont pas ort%o#onau81. ()or&onn$e :classique) &u r$sultat &e l)analyse -point 71 sur le +acteur F est le point oF1. /n voit sur le #rap%ique qu)elle se co"pose &)une contribution sp$ci+ique &e F -8F 1 et &e l)interaction entre F1 et F . Si on pose alors F M M ^ F1 ` F et a M ^ F1

/n ne teste alors que la contribution propre 8F .

1 utilisation &e la +onction Anova -avec un A "a*uscule1 qui est un peu plus intuitive que la pr$c$&ente. 7our sp$ci+ier les tests sur les "esures r$p$t$es, Anova utilise para"2tres obli#atoires -i&ata et i&esi#n1 et un para"2tre optionnel -icontrasts1. (a +onction propose une alternative ; l)utilisation &e ces > para"2tres par l)ar#u"ent i"atri8 "ais qui est &)une utilisation beaucoup "oins pratique et &onc ; n)utiliser que pour &es cas sp$ci+iques non couverts par l)utilisation con*ointes &es trois para"2tres "entionn$s pr$c$&e""ent. i&ata est co&$ &e la "A"e "ani2re que l)ar#u"ent i&ata &e anova B i&esi#n per"et &e sp$ci+ier le "o&2le intra qui peut ne pas Atre un "o&2le +actoriel co"plet B par e8e"ple, pour repren&re l)e8e"ple ci&essus, on peu avoir, par e8e"ple F i&esi#n M ^ F1 _ F i&esi#n M ^ F1 ` F ou i&esi#n M ^ F1 ` F1FF

Statistiques pratiques avec Statistica et R

- F. Aubry

p>

iconstrats per"et &)utiliser &es contrastes par &$+aut &i++$rents &e ceu8 par &$+aut &e options- contrastsM...1 B il est aussi possible &e +orcer &)autres contrastes en associant &es contrastes particuliers au8 colonnes &e i&ata.

En+in, on peut aussi tester &)autres %ypot%2ses lin$aires concernant les "esures r$p$t$es par la +onction linearPypot%esis &ont le co&a#e est bas$ sur celui &e la +onction Anova.

9tilisation de aov

(a structure &es &onn$es est tr2s &i++$rente &e la structure classique &es "esures r$p$t$es. En e++et, on &oit cr$er un &ata.+ra"e ayant autant &e li#nes que le pro&uit &u no"bre &)in&ivi&us par le no"bre &e co"binaisons possible &e niveau8 &es +acteurs intra et a*outer ; ce &ata.+ra"e autant &e colonnes suppl$"entaires plus une que le no"bre &e colonnes &e la structure i&ata pr$c$&e""ent pr$sent$e. (es pre"i2res colonnes sont &es +acteurs et ont co""e valeurs les niveau8 &es +acteurs intra et la &erni2re colonne, la valeur &e la "esure. E8e"ple F &ata.+ra"e :classique) F !o su'et 2*7" 1 ... M Fis1.1 Fis1.M 2acteurs inter su'ets ... 2acteurs intra su'et 2*7n 2 .!iveau" W11.1 W11.M 2".!iveau" 2 .!iveau W1 .1 W1 .M 2 .!iveau3 W1>.1 W1>.M 2 .!iveau" W 1.1 W 1.M 2".!iveau 2 .!iveau W .1 W .M 2 .!iveau3 W 1.1 W >.M

Fisn.1 Fisn.M

Statistiques pratiques avec Statistica et R

- F. Aubry

p >>

&ata.+ra"e "o&i+i$ pour Atre utilisable par aov F !o su'et 2*7" 1 1 1 1 1 1 ... M M M M M M Fis1.1 Fis1.1 Fis1.1 Fis1.1 Fis1.1 Fis1.1 Fis1.M Fis1.M Fis1.M Fis1.M Fis1.M Fis1.M 2acteurs inter su'ets ... Fisn.1 Fisn.1 Fisn.1 Fisn.1 Fisn.1 Fisn.1 Fisn.M Fisn.M Fisn.M Fisn.M Fisn.M Fisn.M 2acteurs intra su'et 2*7n 2" F1.Niveau1 F1.Niveau1 F1.Niveau1 F1.Niveau F1.Niveau F1.Niveau F1.Niveau1 F1.Niveau1 F1.Niveau1 F1.Niveau F1.Niveau F1.Niveau F F F F F F F F F F F F 2 .Niveau1 .Niveau .Niveau> .Niveau1 .Niveau .Niveau> .Niveau1 .Niveau .Niveau> .Niveau1 .Niveau .Niveau> =aleur W11.1 W1 .1 W1>.1 W 1.1 W .1 W >.1 W11.M W1 .M W1>.M W 1.M W .M W >.M

(a trans+or"ation &u &ata.+ra"e &)ori#ine avec plusieurs colonnes pour les variables &$pen&antes en &ata.+ra"e co"patible avec aov peut Atre +acile"ent +aite par la +onction res%ape. \ ce niveau, le "o&2le ; analyser r$pon& alors ; la +or"ule F Waleur ^ -"o&eleInterSu*et- FIS1, ..., FISn11 _ "o&eleIntraSu*et- F1, F 1 Eepen&ant, un tel "o&2le stipule que les erreurs sont pour c%aque su*et in&$pen&antes entre les &i++$rents niveau8 &es +acteurs intra-su*ets, ce qui con&uit ; &es esti"ations +ausses &es erreurs et &onc &e la si#ni+icativit$ &es e++ets et &es interactions. Il est &onc n$cessaire &)in&iquer cette absence &)in&$pen&ance. E)est le r6le &u ter"e Error-1 qu)on &oit a*outer ; la +in &e la +or"ule. Conat%an Yaron e8plique co""ent co&er ce ter"e &ans le &ocu"ent pr$cit$ 3Notes o+ t%e use o+ R +or psyc%olo#y e8peri"ents an& questionnaires3, *e repren&rai &onc pas son e8plication F Waleur ^ -"o&eleInterSu*et- FIS1, ..., FISn11 _ "o&eleIntraSu*et- F1, F 1 ` Error- NoSu*etL+or"uleIntra- F1, F 11 Statistiques pratiques avec Statistica et R - F. Aubry p >@

Il &onne aussi co""ent calculer l)epsilon &e Qreen%ouse an& Qeisser ou l)epsilon &e Puyn%-Fel&t a+in &e corri#er &e la non-sp%$ricit$.

!ote F (e plan &oit Atre co"pl2te"ent $quilibr$ pour qu)aov +onctionne correcte"ent. 4e plus, cette approc%e est tr2s #our"an&e en ressources "$"oire et on arrive rapi&e"ent ; une e8ception &e type :Me"ory over+lo=) sur une "ac%ine > bits.

Rplication de valeurs

aov per"et &e #$rer la r$plication &e valeurs, c)est-;-&ire le +ait qu)on "esure plusieurs +ois la "A"e variable e8acte"ent &ans les "A"es con&itions -$ventuelle"ent pour les "A"es niveau8 &es +acteurs intra1. Supposons qu)on r$p2te 0 +ois la "A"e "esure pour c%aque su*et &$crit par les +acteurs FIS1 ; FISn. /n pourra utiliser aov pour analyser ce sc%$"a &e "esure, avec les "A"es restrictions sur l)$quilibra#e que pr$c$&e""ent, avec le "o&2le suivant F Waleur ^ "o&eleInterSu*et- FIS1, ..., FISn1 ` Error- NoSu*et1

/n peut a"$liorer les esti"ations pr$c$&entes en a*outant un +acteur su*et a&&iti+, un peu co""e a#it S7M, et &onc utiliser une +or"ule &u type F Waleur ^ NoSu*et ` -"o&eleInterSu*et- FIS1, ..., FISn11 _ "o&eleIntraSu*et- F1, F 1 ` Error- NoSu*et1 Eepen&ant, une telle approc%e con&uit ; l)esti"ation &e para"2tres pour c%acun &es su*ets qui ne pr$sentent aucun int$rAt en eu8-"A"es, sau+ &e corri#er &)un $ventuel e++et :su*et). 4e plus, l)i&$e sous-*acente ; l)analyse est que c%aque su*et est tir$ al$atoire"ent &ans une population in+inie et que les su*ets sont interc%an#eables. Il est &onc plus astucieu8 &)utiliser un "o&2le et une approc%e bas$e sur ce +ait, c)est-;-&ire qui per"ette &e corri#er un e++et su*et en se basant sur une esti"ation &e la &istribution &e cet e++et &ans la population. (e su*et &evient alors ce qu)on appelle un facteur alatoire et le "o&2le ; esti"er est alors un mod>le mi&te. 4e tels "o&2les sont beaucoup plus e++icaces et "oins #our"an&s en ressources "$"oire "ais peuvent Atre tr2s lon#s en te"ps calcul. Ils sont i"plant$s &ans les pac9a#e nlme -proc$&ure l"e1 ou lme0 -proc$&ure l"er, une e8tension &e l"e1. Ils #2rent l)%$t$rosc$&asticit$, le non-$quilibra#e et per"ette "A"e &e &$+inir &es covariables co""e +acteur intra. (eur utilisation &$passe le ca&re &e cette note.

Statistiques pratiques avec Statistica et R

- F. Aubry

p >!

$o%paraisons de %od-les et c#oi.

Sous Statistica, on peut utiliser les options &e l)on#let :/ptions) &es "o&2les #$n$rau8 &e r$#ression -Menu QRM1 pour c%erc%er le :"eilleur) "o&2le.

Sous R, la +onction anova1V per"et &e co"parer &es "o&2les entre eu8 F il su++it &e &onner la liste &es r$sultats ; co"parer. Il +aut noter qu)il co"pare le pre"ier au secon&, le secon& au troisi2"e... (a +onction step per"et &e c%erc%er le :"eilleur) "o&2le entre un "o&2le "ini"al et un "o&2le "a8i"al et &eu8 +onctions per"ettant &e tester &es c%an#e"ents plus cibl$s -a&&1 et &rop11. R per"et aussi &e calculer &)autres para"2tres &e "esure &e l)a*uste"ent -lo#(i9, AIE, e8tractAIE...1

Validation

4ans Statistica, il e8iste une option :Wali&ation crois$e).

Sous R, les pac9a#es boot et bootstrap propose un certain no"bre &)outils.

\ noter que la +onction anova sert aussi pour co"parer entre eu8 &es "o&2les "i8tes issus &es +onctions l"e -pac9a#e nlme1 ou l"er -pac9a#e lme01. Eepen&ant, si on co"pare &es r$sultats obtenu avec les options par &$+aut -i.e., "et%o&M3REM(3 pour l"e et REM(M.RUE pour l"er1, on ne peut co"parer que &es "o&2les ayant les "A"es e++ets +i8es et &es e++ets al$atoires &i++$rents. 7our co"parer &es "o&2les avec &es e++ets +i8es &i++$rents, il +aut utiliser &es esti"ations &u "a8i"u" &e vraise"blance -"et%o&M3M(3 pour l"e et REM(MFA(SE pour l"er1. (a *usti+ication t%$orique &e cette strat$#ie sort &u ca&re &e ce &ocu"ent.

1V

Statistiques pratiques avec Statistica et R

- F. Aubry

p >?

Annexe I : Vito Ricci -R Functions For Regression Analysis 1 !1"!"# $%ito&ricci'ya(oo)com*


(e &ocu"ent intitul$ 3Ricci R re+car re#ression3 pr$sente une synt%2se &es principales +onctions &e R pour r$aliser &es analyses lin$aires et non lin$aires. 4atant &e VV!, il ne "entionne pas quelques nouveau8 pac9a#es co""e lme0, une e8tension et a"$lioration &e nlme, et ?an#ua#eR qui lui est associ$. 4e plus, certaines +onctions nota""ent &u pac9a#e car, c%an#ent &e no" et risquent &e &isparaitre sous leur ancien no" &ans les +utures versions -voir la pa#e car-&epreciate&1. Eepen&ant, ce &ocu"ent reste un ai&e-"$"oire essentiel pour les utilisateurs &e R.

Statistiques pratiques avec Statistica et R

- F. Aubry

p >X