Vous êtes sur la page 1sur 26

Anlise de Varincia com dois ou mais factores a a planeamento factorial

Em muitas experincias interessa estudar o efeito de mais do que um factor e sobre uma varivel de interesse. Quando uma experincia envolve dois ou mais a e factores diz-se que temos uma ANOVA mltipla. Uma ANOVA em que todas u as combinaoes de todos os n c veis de todos os factores so consideradas diz-se a ANOVA factorial. Na maioria das situaes, quando estamos interessados em co estudar a inuncia de dois ou mais factores numa varivel, utilizamos uma e a ANOVA factorial. Exemplo: Pretende-se estudar a concentrao de clcio no sangue de uma ca a populao de aves parte da qual foi sujeita a um tratamento hormonal. Os ca investigadores pretendem averiguar se existem diferenas na concentrao mdia c ca e de clcio dependendo do tratamento hormonal e tambm dependendo do sexo a e das aves. Os factores deste estudo so o tratamento hormonal (presente ou a ausente) e o sexo (feminino e masculino).
Bioestat stica, 2007 1

Anlise de Varincia mltipla - planeamento hierrquico a a u a


Em geral o nmero de n u veis de cada factor bem como o seu valor no a depende dos restantes factores. Quando o nmero de n u veis ou o seu valor varia consoante os n veis considerados nos restantes factores diz-se que temos a uma ANOVA hierrquica. Nestes casos deixamos de ter uma ANOVA factorial. Enquanto numa ANOVA factorial os factores so cruzados (dando origem a a todas as poss veis combinaes dos seus n co veis), numa ANOVA hierrquica os a factores so encaixados uns nos outros (dando origem a uma estrutura tipo a rvore). a Exemplo: Pretende-se fazer um estudo sobre os n veis de uma dada substncia a no sangue (usada como anti-epilptico) e para tal vrias amostras de sangue e a foram enviadas para 4 laboratrios. Cada laboratrio utiliza diferentes tcnicas o o e para fazer a anlise e o nmero de tcnicas dispon a u e veis tambm varia de e laboratrio para laboratrio. Neste caso temos dois factores: o laboratrio o o o (com 4 n veis) e a tcnica de anlise (com um nmero de n e a u veis que depende do laboratrio). Este ultimo factor encontra-se encaixado no primeiro. o
Bioestat stica, 2007 2

ANOVA mltipla - factores xos, aleatrios e mistos u o


Vimos que numa ANOVA simples o factor em causa podia ter os efeitos xos ou os efeitos aleatrios. O mesmo se vai passar com os modelos de ANOVA o com dois ou mais factores. Quando um modelo tem todos os factores com efeitos xos diz-se que temos uma ANOVA de efeitos xos ou um Modelo I de ANOVA. Quando um modelo tem todos os factores com efeitos aleatrios diz-se que o temos uma ANOVA de efeitos aleatrios ou um Modelo II de ANOVA. o Quando um modelo tem alguns factores com efeitos xos e outros com efeitos aleatrios diz-se que temos uma ANOVA de efeitos mistos ou um Modelo III de o ANOVA.

Bioestat stica, 2007

Anlise de Varincia mltipla - interaco entre factores a a u ca


Quando temos dois ou mais factores h que ter em conta que estes podem a interagir entre si, i.e., a variao na varivel resposta produzida por uma ca a alterao do n ca vel de um dos factores pode variar consoante os n veis dos restantes factores. Assim h que prestar ateno `s poss a ca a veis interaces entre co os vrios factores, dois a dois, trs a trs, etc.. Quanto mais factores existirem a e e no estudo mais complexo se torna o modelo, porque o nmero de interaces u co poss veis aumenta muito rapidamente. Quando no existe interaco entre os a ca factores o valor esperado de cada combinao de n ca veis dos factores a soma e dos valores esperados de cada n separadamente e o modelo diz-se aditivo. vel Seguidamente apresenta-se um conjunto de grcos que pretende ilustrar difera entes comportamentos de ANOVAs com 2 factores (A e B), tendo cada um deles apenas 2 n veis (A1 e A2, B1 e B2). Quando as linhas so paralelas a temos modelos sem interaco entre os factores (modelo aditivo). Este tipo de ca grcos permite ao investigador ter uma ideia se a interaco est presente ou a ca a no. a
Bioestat stica, 2007 4

Bioestat stica, 2007

Anlise de Varincia mltipla no SPSS a a u


A ANOVA com dois ou mais factores pode ser realizada no SPSS no menu Analyze / General Linear Model / Univariate. (Ateno que ANOVA ca mltipla signica que temos apenas uma varivel dependente e mltiplos factores u a u a inuenciar essa varivel. Da o menu ser identicado por Univariate. a ANOVA multivariada (Multivariate) refere-se a experincias em que temos e vrias variveis de resposta que interessa analisar em simultneo.) a a a Na janela principal selecciona-se a varivel em estudo (dependent variable) e a seleccionam-se os factores (xos ou aleatrios) para as respectivas janelas. o Por defeito o SPSS assume o modelo factorial completo (com todas as interacoes entre os factores). Se quisermos especicar um modelo que no seja c a este podemos faz-lo atravs do boto Model e e a

Bioestat stica, 2007

Anlise de Varincia dupla a a


Uma ANOVA com dois factores diz-se ANOVA dupla. Em seguida iremos considerar o modelo geral de uma ANOVA factorial dupla (planeamento completamente aleatorizado). Iremos designar os factores por A e B sendo que A tem a n veis e B tem b n veis. Existem portanto ab combinaes poss co veis dos n veis dos factores. Tal como foi feito para a ANOVA simples iremos considerar o planeamento equilibrado, ou seja, para cada combinao de n ca veis dos factores existem n observaes co (rplicas) independentes. No total so necessrias N = abn observaes. e a a co As observaoes da varivel de interesse Y so indexadas por 3 c a a ndices, Yijk , i representa o n do factor A, j representa o n do factor B, e k representa vel vel a posio dentro do grupo ij. ca

Bioestat stica, 2007

Modelo de ANOVA factorial dupla


i = 1, 2, . . . , a, j = 1, 2, . . . , b, = + i + j + ij + ijk , k = 1, 2, . . . , n,

Yijk onde

representa a mdia global, e i representa o efeito do n i do factor A, vel j representa o efeito do n j do factor B, vel ij representa o efeito da interaco dos factores A e B, ca o ca ijk representa um erro aleatrio de cada observao sendo estes erros independentes entre si e todos com distribuio Normal de mdia 0 e ca e varincia 2. a
Bioestat stica, 2007 8

ANOVA factorial dupla - pressupostos e hipteses a testar o


Pressupostos exigidos: 1. Temos ab grupos de observaes independentes (ab amostras aleatrias) co o sendo os grupos independentes entre si. 2. Cada grupo de observaoes deve provir de uma distribuio Normal. c ca 3. A varincia de todas as populaes deve ser a mesma. a co Hipteses a testar (se os efeitos forem xos) o 1. H0 : 1 = 2 = . . . = a = 0 (efeito principal do factor A) 2. H0 : 1 = 2 = . . . = b = 0 (efeito principal do factor B) vs H1 : i = 0 pelo menos para um i H1 : j = 0 pelo menos para um j

vs

3. H0 : 11 = 12 = . . . = ab = 0 vs H1 : ij = 0 pelo menos para um par i, j (interaco entre os factores A e B) ca


Bioestat stica, 2007 9

Partio da soma de quadrados ca


Seja
b n

yi =
j=1 k=1 a n

yijk

yi yi = bn yj = yij = yj an yij n y abn

yj =
i=1 k=1 n

yijk yijk
k=1 n

yij =
a b

y =
i=1 j=1 k=1

yijk

y =

Bioestat stica, 2007

10

(yijk y )2 = bn
i=1 j=1 k=1 SStotal i=1

(i y)2 y
SSA b

+ an
j=1

(j y)2 y
SSB a b

+n
i=1 j=1

(ij yi yj + y)2 y
SSAB

(yijk yij)2
i=1 j=1 k=1 SSE

Bioestat stica, 2007

11

SStotal tem N 1 = abn 1 graus de liberdade. SSA tem a 1 graus de liberdade. SSB tem b 1 graus de liberdade. SSAB tem (a 1)(b 1) graus de liberdade. SSE tem ab(n 1) graus de liberdade.

Bioestat stica, 2007

12

Tabela de ANOVA

Fonte de Variao ca factor A factor B Interaco ca Erros Total

Soma de quadrados SSA SSB SSAB SSE SStotal

g.l. a1 b1 (a 1)(b 1) ab(n 1) abn 1

Mdia de e quadrados
SSA a1 M SB = SSB b1 SSAB M SAB = (a1)(b1)

Fobs
M SA M SE M SB M SE M SAB M SE

p () () ()

M SA =

M SE

Bioestat stica, 2007

13

Atravs desta tabela podemos testar as hipteses referidas anteriormente atravs e o e dos p-values da ultima coluna. Neste caso: a estat stica de teste para as hipteses 1 (efeito principal do factor A) o e M SA F = M S Fa1,ab(n1), sob H0;
E

a estat stica de teste para as hipteses 2 (efeito principal do factor B) o e F = M SB Fb1,ab(n1), sob H0; M SE a estat stica de teste para as hipteses 3 (interaco) F = o ca e F(a1)(b1),ab(n1), sob H0;
M SAB M SE

Bioestat stica, 2007

14

Vericao dos pressupostos da ANOVA ca


Deve-se sempre vericar os pressupostos de realizao da ANOVA. ca Para averiguar se podemos considerar que a varincia de todos os grupo a e constante podemos utilizar um teste de homogeneidade de varincias, como a por exemplo o teste de Levene dispon no SPSS (menu Analyze / General vel Linear Model / Univariate, boto Options opo Homogeneity tests). a ca Para averiguar se os erros se podem considerar como sendo provenientes de uma populao Normal faz-se uma anlise de res ca a duos. Se conhecssemos os e erros que afectam as observaes poder co amos construir QQ-plots e fazer testes de ajustamento ` Normal. Mas no conhecemos os erros pois estes so dados a a a por ijk = Yijk ( + i + j + ij ) e os parmetros , i, j e ij so desconhecidos. a a
Bioestat stica, 2007 15

Ora, + i + j + ij representa o valor mdio da combinao dos n e ca veis Ai e Bj , que podemos representar por ij . Este valor mdio pode ser estimado pela e mdia das observaoes deste grupo, Yij. Assim, os erros podem ser estimados e c por ijk = Yijk Yij. duos e costumam-se representar por eijk . Estas diferenas chamam-se res c Uma anlise de res a duos consiste em estudar o conjunto de todos os res duos eijk , i = 1, . . . , a, j = 1, . . . , b, k = 1, . . . , n, no sentido de averiguar se podemos considerar que essa amostra aleatria e proveniente de uma populao e o ca Normal. Para averiguar a Normalidade, constroem-se QQ-plots e fazem-se testes de ajustamento. No SPSS, podemos guardar os res duos, para seguidamente os analisar, atravs e do boto Save do menu da ANOVA, Analyze / General Linear Model / a Univariate.
Bioestat stica, 2007 16

Anlise de Varincia com blocos aleatorizados a a


Em certas experincias podem existir factores (externos) que introduzem varie abilidade nos dados e que interessa controlar. Por exemplo, se estivermos interessados em comparar 3 variedades de trigo atravs do peso mdio dos e e gros, pode ter inuncia o tipo de solo em que as plantas vo crescer. Em vez a e a de seleccionarmos ao acaso um certo nmero de campos para semear as vrias u a sementes, podemos seleccionar um conjunto de campos (possivelmente com caracter sticas de solo diferentes) e dividir cada campo em trs parte de modo a e semear as trs variedades de trigo em cada campo. Neste tipo de planeamento e designa-se cada campo por bloco. Os blocos constituem o factor externo cuja variabilidade induzida vai ser poss controlar do ponto de vista estat vel stico. Assim, num planeamento com blocos aleatorizados temos um factor de interesse que possui g n veis (tratamentos) e temos b blocos prefazendo um total de N = gb observaoes. Os tratamentos so distribu c a dos aleatoriamente pelos g elementos de cada bloco.

Bioestat stica, 2007

17

Modelo de ANOVA com blocos aleatorizados


O modelo para este planeamento uma extenso do modelo de ANOVA e a simples e tambm um caso particular do modelo de ANOVA factorial dupla. e e Neste caso no existe interaco entre os factores e apenas dispomos de uma a ca observao por clula. ca e As observaoes so designadas por Yij onde i = 1, . . . , g identica o grupo e c a j = 1, . . . , b identica o bloco. Yij = i + j + ij = + i + j + ij , onde i representa a mdia de cada grupo, e representa a mdia de todos os grupos, e i representa o efeito do tratamento i j representa o efeito do bloco j e ij representa um erro aleatrio de cada observao sendo estes erros o ca aleatrios e independentes entre si. o
Bioestat stica, 2007 18

ANOVA com blocos aleatorizados - pressupostos


Pressupostos exigidos: 1. O modelo descrito anteriormente vlido. e a 2. Os erros so aleatrios e independentes entre si, com distribuio Normal, a o ca ij N (0, ). 3. O factor em estudo e o factor bloco no tm interaco (resulta do pressua e ca posto 1.).

Bioestat stica, 2007

19

Hipteses a testar o No caso de o factor em estudo ser de feitos xos temos H0 : 1 = 2 = . . . = g = ou equivalentemente H0 : 1 = 2 = . . . = g = 0 vs H1 : i = 0 pelo menos para um i vs H1 : i = pelo menos para um i

No caso de o factor em estudo ser de efeitos aleatrios temos o


2 H0 : = 0 vs 2 H1 : > 0,

2 onde representa a varincia associada ao factor de interesse. a

Bioestat stica, 2007

20

Hipteses a testar o Tambm podemos testar se os blocos produzem diferenas na varivel resposta e c a (ou seja, se vale a pena considerar os blocos como um factor) O factor associado aos blocos tanto pode ser considerado xo como aleatrio o (a situao mais habitual ser aleatrio). A tabela de ANOVA igual em ca e o e todos os casos. No caso de o factor bloco ser de feitos xos temos

H0 : 1 = 2 = . . . = g = 0

vs

H1 : i = 0 pelo menos para um i

No caso de o factor bloco ser de feitos aleatrios temos o


2 H0 : = 0 vs 2 H1 : > 0,

2 onde representa a varincia associada ao factor bloco. a


Bioestat stica, 2007 21

Partio da soma de quadrados ca


g b g b

(yij y)2 = b
i=1 j=1 SStotal g i=1

(i y )2 + g y
j=1 SST rat b

(j y)2 y
SSB

+
i=1 j=1

(yij yi yj + y)2
SSE

SStotal tem N 1 = gb 1 graus de liberdade. SST rat tem g 1 graus de liberdade. SSB tem b 1 graus de liberdade. SSE tem (g 1)(b 1) graus de liberdade.
Bioestat stica, 2007 22

Tabela de ANOVA
Fonte de Variao ca Tratamentos Blocos Erros Total Soma de quadrados SST rat SSB SSE SStotal g.l. g1 b1 (g 1)(b 1) gb 1 Mdia de e quadrados M ST rat M SB M SE Fobs
M ST rat M SE M SB M SE

p () ()

Atravs desta tabela podemos testar as hipteses referidas anteriormente atravs e o e do p-value associado aos tratamentos. Neste caso a estat stica de teste e M ST rat F = M S Fg1,(g1)(b1), sob H0.
E

Tambm podemos testar se os blocos inuenciam os resultados (em mdia) e e atravs do p-value associado aos blocos. Neste caso a estat e stica de teste e F = M SB Fb1,(g1)(b1), sob H0. M SE
Bioestat stica, 2007 23

ANOVA mltipla - Comparaes mltiplas u co u


Tal como foi descrito para a ANOVA simples, quando se rejeita a hiptese nula o de igualdade das mdias (em pelo menos um dos factores) pode-se proceder a e uma anlise de comparaoes mltiplas para averiguar quais os pares de n a c u veis que apresentam diferenas signicativas entre si (dois a dois). Os mtodos c e de Bonferroni, Tuckey, Dunnett (entre outros) podem ser generalizados para planeamentos com dois ou mais factores. No SPSS estes procedimentos encontram-se dispon veis no boto Post Hoc do a menu da ANOVA.

Bioestat stica, 2007

24

Anlise de Varincia com medies repetidas a a co


Um planeamento em que cada unidade experimental medida duas ou mais e vezes (em geral sequencialmente), diz-se que contm medies repetidas. Tratae co se de uma generalizao do conceito de amostras emparelhadas. Em ingls este ca e tipo de planeamento designado por repeated measures experimental design e ou within-subjects ou treatment-by-treatment design. Por exemplo: um investigador est interessado em comparar 3 drogas para a reduzir a tenso arterial em doentes hiper-tensos. Um planeamento completaa mente aleatorizado consiste em alocar cada uma das drogas (aleatoriamente) a 15 doentes (3 grupos de 5 doentes cada) e aps um per o odo de tratamento efectuar uma ANOVA simples. Outra possibilidade consiste em seleccionar apenas 5 doentes e administrar as trs drogas a cada doente, de forma sequencial no e tempo. Assim, cada doente d origem a trs medies e no total continuamos a a e co ter 15 observaoes. Neste caso passamos a ter uma experincia com medies c e co repetidas , ou seja, um planeamento do tipo dos blocos aleatrios em que cada o doente funciona como um bloco.
Bioestat stica, 2007 25

As vantagens destes planeamentos so geralmente as seguintes: a 1. A experincia torna-se mais econmica pois exige um menor nmero de e o u unidades experimentais. 2. A variabilidade entre unidades experimentais reduzida relativamente a um e planeamento completamente aleatorizado. 3. A potncia superior ` do planeamento completamente aleatorizado. (tal e e a como acontecia ao compararmos duas mdia com amostras emparelhadas ou e com amostras independentes). a As desvantagens so geralmente as seguintes: 1. A experincia pode tornar-se muito demorada. e 2. Podem existir efeitos de alguns dos tratamentos que preduram no tempo (carryover ) e que afectam os resultados dos outros tratamentos. No SPSS existe um menu espec co para ANOVA com observaes repetidas, co Analyze / General Linear Model / Repeated Measures.
Bioestat stica, 2007 26

Vous aimerez peut-être aussi