Académique Documents
Professionnel Documents
Culture Documents
. Cada observao
elevada ao poder de lambda ().
Cria um jogo de dados de arranjos em trs locais (fator Localidade) com trs rplicas em cada local.
> :c!<data.<rame(Kocal&dadeA,l(3$3)$ DadosAc(meusdados))
Plote os dados e anote a grande diferena em variabilidade entre as amostras.
> :o!plot (DadosVKocal&dade$ dataA:c!)
Carregue a biblioteca MASS
> l&:rar.(MM)))
Rodar a transformao boxcox. Acrescentamos um pequeno valor 0.01 para evitar valores negativos
> :o!co!(Dados07.7"VKocal&dade$dataA:c!)
Aparecer um grfico mostrando a curva e o valor de lambda o ponto onde a linha pontilhada do pico da
curva intercepta o eixo-x. Podemos ler o valor de lambda usando o mouse.
niciar propriedade de localizao de pontos do mouse
> locator()
Coloque o cursor "+ no ponto da intercepo da linha pontilhada do pico da curva com o eixo-x. Clique
uma vez com o boto esquerda. Depois clique uma vez com o boto do meio (se no tiver um mouse com
trs botes, clique em ambas botes no mesmo tempo).
Aparecer os coordinados do ponto na linha de comando. O valor x o valor de lambda.
L!
-"/ 7.#"56
L.
-"/ ""1.5#58
Pronto, agora para transformar os dados, basta elevar cada valor x ao poder de 0.2175. Em R, esta
operao feita usando o "chapeu, a seguir: !W7.#"56.
Plotar os dados transformados e anote a maior similaridade em variabilidade entre amostras em relao
aos dados no-transformados.
> :o!plot (DadosW7.#"56VKocal&dade$ dataA:c!)
> (()
18
AN<LISE DE 'RE2>?NCIAS @2UIA2UADRADOB
Mais exemplos podem ser obtidos nos Captulos 11 de Vieira (1980), 10 de Levin (1985), 13 de Fowler &
Cohen (1990) e 22 e 23 de Zar (1999).
Freqncias observadas dos 10 integers 0 a 9 obtidos em uma amostra gerada aleatoriamente (n=100)
pelo computador:
> o:s<c("7$ 5$ "7$ 1$ "%$ 2$ ""$ ""$ "#$ "")
A freqncia esperada (!esperada) para cada integer 10, mas vocs j devem ter pensado nisso ;-)
Rode qui-quadrado
> ch&s(.test(o:s)
Ch&s(uared test <or ,&*en pro:a:&l&t&es
data: o:s
Xs(uared A 6.#$ d< A 8$ p*alue A 7.2"16
O valor de probabilidade indica que as freqncias observadas no diferem das freqncias esperadas, ou
seja as observaes so verdadeiramente aleatrias.
Verifique as freqncias esperadas
> ch&s(.test(o:s) Le!pected
-"/ "7 "7 "7 "7 "7 "7 "7 "7 "7 "7
Um exemplo sobre as freqncias de moscas em uma pequena lagoa
> moscas<c(=D. autumnal&s=A#%$ =D. aest&*al&s=A3#$ =D.
amph&:&a=A"7$ =D. att&ca=A8)
Verifique as freqncias de quatro espcies de mosca
> moscas
D. autumnal&s D. aest&*al&s D. amph&:&a D. att&ca
#% 3# "7 8
Plote as freqncias Figura 7
> :arplot(moscas$!la:A=9spFc&e=$.la:A=Pre(QRnc&a=$ce!.namesA7.5)
As freqncias observadas so significativamente diferentes da homogeneidade? (lembra como se calcula
a !esperada=18.75?)
19
>ch&s(.test(moscas)
Ch&s(uared test <or ,&*en pro:a:&l&t&es
data: moscas
Xs(uared A "8.8215$ d< A 3$ p*alue A 7.777"572
As freqncias das quatro espcies so diferentes de uma distribuio homognea.
UM GRAU DE LIBERDADE
Quando h apenas duas categorias, h um grau de liberdade e a correo de Yates usada. Podemos
testar a hiptese nula que a razo entre macho : fmea no diferente de 1 : 1. Uma amostra de 16 larvas
coletadas e criadas at adulto contm 12 machos e 4 fmeas (Fowler & Cohen, 1990). Esta razo
significativamente diferente de 1 : 1?
Coloque as freqncias observadas numa matriz com duas colunas
> !<matr&! (c ("#$%)$ ncA#)
> !
-$"/ -$#/
-"$/ "# %
Rode o teste para propores iguais e com correo de Yates (correctACSY9)
> prop.test (!$ correctACSY9)
"sample proport&ons test w&th cont&nu&t. correct&on
data: !$ null pro:a:&l&t. 7.6
Xs(uared A 3.71#6$ d< A "$ p*alue A 7.727"#
alternat&*e h.pothes&s: true p &s not e(ual to 7.6
86 percent con<&dence &nter*al:
7.%5%7232 7.8"115##
sample est&mates:
p
7.56
O valor de qui-quadrado 3,0625 menor que o valor crtico com v=1, portanto aceitamos a hiptese nula.
mportante: os indivduos de cada sexo devem ser dispersos em uma maneira independente.
20
TESTE PARA CONCORDCNCIA ENTRE DADOS OBSER:ADOS E UM MODELO MATEM<TICO
Dados de contagem sobre o nmero de nematdeos vistos em uma amostra de 60 observaes em uma
cmera de contagem sob o microscpio. A probabilidade (P) para cada valor de x foi calculada usando a
distribuio de probabilidade de Poisson, estimando o parmetro lambda () a partir da amostra.
No. nematdeos (x): 0 1 2 3 4 5 6 ou mais
Freqs. Observadas (n=60): 3 12 17 13 9 3 3
P (Poisson): 0.0743 0.193 0.251 0.218 0.141 0.074 0.0478
Freqs esperadas (P x n): 4.458 11.58 15.06 13.08 8.46 4.44 2.87
> E:s<c(3$"#$"5$"3$8$3$3)
> Zpo&sson<c(7.75%3$ 7."83$ 7.#6"$ 7.#"2$ 7."%"$ 7.75%$ 7.7%52)
Usamos a lista de probabilidades (Ppoisson) gerada pelo modelo Poisson para esta amostra de dados de
contagem para calcular as freqncias esperadas. ndicamos isso no teste pelo componente p=Ppoisson.
> ch&s(.test(E:s$pAZpo&sson)
Ch&s(uared test <or ,&*en pro:a:&l&t&es
data: E:s
Xs(uared A ".#6$ d< A 1$ p*alue A 7.85%3
[arn&n, messa,e:
Ch&s(uared appro!&mat&on ma. :e &ncorrect &n: ch&s(.test(E:s$ p A
Zpo&sson)
Sabemos que devemos retirar mais um grau de liberdade quando usamos o modelo Poisson devido a
estimativa do parmetro lambda (/). Portanto, o nmero de graus de liberdade v=(7-2)=5. Consultando a
tabela de qui-quadrado com v=5, vemos que o resultado permanece no significativo, ou seja, no h uma
diferena entre as freqncias observadas e esperadas. O modelo Poisson descreve adequadamente a
disperso (aleatria, claro!) dos nematdeos na cmera de contagem.
Verifique as freqncias esperadas s para confirmar!
> ch&s(.test(E:s$pAZpo&sson)Le!pected
>-"/ %.%62 "".627 "6.717 "3.727 2.%17 %.%%7 #.212
21
AN<LISE DE 'RE2>?NCIAS USANDO TABELAS DE CONTING?NCIA
Em duas amostras tiradas de solos diferentes foram encontradas duas espcies de tatuzinho:
Oniscus Armadilidium
Solo ar+iloso 14 6
Solo .al.(reo 22 46
Coloque os dados numa matriz e verifique a matriz x. Pode separar comandos na mesma linha com ";
> !<matr&!(c("%$##$1$%1)$ncA#)T!
-$"/ -$#/
-"$/ "% 1
-#$/ ## %1
Rode qui-quadrado com a correo de Yates, mesmo se voc esquecer, ele vai fazer a correo
automaticamente ;-)
> ch&s(.test(!$ correctACSY9)
Zearson;s Ch&s(uared test w&th \ates;
cont&nu&t. correct&on
data: !
Xs(uared A 5.6571$ d< A "$ p*alue A 7.776833
H uma associao significativa entre as variveis, podemos inferir que #niscus associada com solo
calcreo e %rmadilidium com solo argiloso.
Pode at plotar os dados! - Figura 8
> :arplot(!$ namesAc(=En&scus=$=Mrmad&l&d&um=)$
<ontA3$:es&deACSY9)
> le,end("$37$c(=Mr,&loso=$=CalcIreo=)$<&llAc(#$5))
MAIS UM EXEMPLO DE UMA TABELA DE CONTING?NCIA
Dados sobre as freqncias de espcies de mosca do gnero Di,a em trs riachos com diferentes graus
de eutrofizao
D. nebulosa D. submaculata D. dilatata D. nubilipennis
Oli+otr-"i.o 12 7 5 17
Mesotr-"i.o 14 6 22 9
E!tr-"i.o 35 12 7 11
22
Coloque os dados em uma matriz e verifique a matriz eutrof
> eutro<<matr&!(c("#$"%$36$5$1$"#$6$##$5$"5$8$"")$ncA%)Teutro<
-$"/ -$#/ -$3/ -$%/
-"$/ "# 5 6 "5
-#$/ "% 1 ## 8
-3$/ 36 "# 5 ""
Rode o teste qui-quadrado
> ch&s(.test(eutro<)
Zearson;s Ch&s(uared test
data: eutro<
Xs(uared A 37.86%6$ d< A 1$ p*alue A #.621e76
O resultado mostra que h uma associao significativa entre as espcies e o nvel de eutrofizao.
Verifique os valores esperados
> ch&s(.test(eutro<) Le!pected
-$"/ -$#/ -$3/ -$%/
-"$/ "6.8#88% 1.6#211# 2.25282" 8.11#%#
-#$/ "8.2"6#8 2."#"7"8 "".7%%621 "#.7"8""
-3$/ #6.#6%52 "7.3673"2 "%.751%33 "6.3"2%5
As freqncias podem ser plotadas - Figura 9
> :arplot (eutro<$ namesAc(D. ne:ulosa$ D. su:maculata$ D.
d&latata$ D. nu:&l&penn&s)$ colAc(%$5$3)$
ce!.namesA7.1$ :es&deACSY9)
> le,end (5$36$ c(El&,otr]<&co$ Mesotr]<&co$ 9utr]<&co)$
<&llAc(%$5$3))
23
Figura 7. Barplot mostrando as freqncias Figura 8. Barplot mostrando as freqncias
de espcies de mosca amostrados na de duas espcies de tatuzinho em dois
lagoa. tipos de solo.
Figura 9. Barplot mostrando as freqncias de espcies de Di,a em diferentes graus de poluio.
24
TESTEAt
Mais detalhes sobre o o teste de F e o teste-t podem ser encontradas em Captulo 12 da Vieira (1980), 16
de Fowler & Cohen (1990) e 8 de Levin (1985). Captulo 9 de Zar (1999) apresenta uma boa discusso do
uso do teste t.
PARA AMOSTRAS NDEPENDENTES
Exemplo do livro da Viera (1980) p.122-124 sobre a perda de peso (kg) em dois grupos de pacientes; cada
paciente seguindo a dieta designada para seu grupo.
> D&eta"<c("#$2$"6$"3$"7$"#$"%$""$"#$"3)
> D&eta#<c("6$"8$"6$"#$"3$"1$"6)
Verifique normalidade dos dados
> shap&ro.test(D&eta")
)hap&ro[&l+ normal&t. test
data: D&eta"
[ A 7.81"6$ p*alue A 7.27#8
> shap&ro.test(D&eta#)
)hap&ro[&l+ normal&t. test
data: D&eta#
[ A 7.8#1$ p*alue A 7.6"52
Verifique homogeneidade das varincias usando o teste de F
> *ar.test(D&eta"$D&eta#)
P test to compare two *ar&ances
data: D&eta" and D&eta#
P A 7.2$ num d< A 8$ denom d< A 1$ p*alue A 7.53#6
alternat&*e h.pothes&s: true rat&o o< *ar&ances &s not e(ual to "
86 percent con<&dence &nter*al:
7."%%232# 3.%665556
sample est&mates:
rat&o o< *ar&ances
7.2
Os dados so normais e as varincias no so significativamente diferentes. Podemos prosseguir com o
25
teste-t para as duas amostras independentes, mas com varincias iguais. A hiptese nula que no h
uma diferena na perda de massa mdia e a alternativa que h uma diferena. O teste de duas caudas.
> t.test(D&eta"$D&eta#$ *ar.e(ualACSY9$alternat&*eA=two.s&ded=)
Cwo )ample ttest
data: D&eta" and D&eta#
t A #.87#"$ d< A "6$ p*alue A 7.7"786
alternat&*e h.pothes&s: true d&<<erence &n means &s not e(ual to 7
86 percent con<&dence &nter*al:
6.#733"1# 7.5811232
sample est&mates:
mean o< ! mean o< .
"# "6
Como pode ser visto no resultado, h uma diferena significativa em perda de massa mdia e a perda de
peso maior para os pacientes seguindo a dieta 2.
PARA AMOSTRAS PAREADAS
A massa de 10 pssaros migratrios foi medida em duas ocasies, primeiro em agosto e os mesmos
pssaros (marcados individualmente e recapturados) foram remedidos em setembro
> a,o<c("7.3$"".%$"7.8$"#.7$"7.7$"".8$"#.#$"#.3$"".5$"#.7)
> set<c("#.#$"#."$"3."$"".8$"#.7$"#.8$"".%$"#."$"3.6$"#.3)
Plotamos os duas amostras Figura 10
> :o!plot(a,o$set$namesAc(=M,osto=$=)etem:ro=))
> shap&ro.test(a,o)
)hap&ro[&l+ normal&t. test
data: a,o
[ A 7.257"$ p*alue A 7."77#
> shap&ro.test(set)
)hap&ro[&l+ normal&t. test
data: set
26
[ A 7.837#$ p*alue A 7.%6
> *ar.test(a,o$set)
P test to compare two *ar&ances
data: a,o and set
P A ".1%81$ num d< A 8$ denom d< A 8$ p*alue A 7.%15%
alternat&*e h.pothes&s: true rat&o o< *ar&ances &s not e(ual to "
86 percent con<&dence &nter*al:
7.%785%81 1.1%"%525
sample est&mates:
rat&o o< *ar&ances
".1%81%8
Os dados so normais e as varincias so homogneas. Rode o teste-t com as duas amostras pareadas.
O teste de duas caudas e com as varincias iguais.
> t.test(a,o$set$pa&redACSY9$alternat&*eA=two.s&ded=$
*ar.e(ualACSY9)
Za&red ttest
data: a,o and set
t A #.1""8$ d< A 8$ p*alue A 7.7#2"2
alternat&*e h.pothes&s: true d&<<erence &n means &s not e(ual to 7
86 percent con<&dence &nter*al:
".1%#"6#1 7.""52%5%
sample est&mates:
mean o< the d&<<erences
7.22
O resultado indica que h uma diferena significativa entre as mdias das duas amostras e conclumos que
o aumento em massa mdia entre agosto e setembro significativo.
27
Figura 10. "o,plot das duas amostras pareadas de massa (g) dos pssaros em Agosto e Setembro.
ANDLISE DE :ARICNCIA @ANO:AB
O clculo de ANOVA pode ser encontrado em Captulo 10 e 11 de Zar (1999), 17 de Fowler & Cohen
(1990), 13 de Vieira (1980) e 9 de Levin (1985). Uma das melhores discusses sobre as suposies do
ANOVA encontrada em Captulos 7 e 8 de Underwood (1998).
Teste a hiptese de que a massa mdia (g) de uma espcie de pssaro igual entre as quatro localidades
de coleta (A-D, com n=10 indivduos medidos em cada local).
Os dados esto contidos no arquivo massa.csv na seguinte forma:
A B C D
78 78 79 77
88 78 73 69
87 83 79 75
88 81 75 70
83 78 77 74
82 81 78 83
81 81 80 80
80 82 78 75
80 76 83 76
89 76 84 75
mporte os dados
> massa<read.cs*(massa.cs*)
Facilite acesso s variveis
28
> attach(massa)
Calcule a mdia e desvio padro dos dados massa. Existe uma diferena significativa entre as mdias?
> mean(massa)
M ^ C D
23.1 58.% 52.1 56.%
> sd(massa)
M ^ C D
%.733"81 #.67333" 3.371668 %."%"8#5
Verifique a maior e a menor varincia. Precisamos testar se a varincia maior (D) significativamente
diferente da varincia menor (B). Se no for o caso ento nenhuma das varincias significativamente
diferente das outras.
> *ar(D)
-"/ "5."6661
> *ar(^)
-"/ 1.#11115
Realize o teste de F sobre as amostras D e B
> *ar.test(D$^)
P test to compare two *ar&ances
data: D and ^
P A #.5351$ num d< A 8$ denom d< A 8$ p*alue A 7."%81
alternat&*e h.pothes&s: true rat&o o< *ar&ances &s not e(ual to "
86 percent con<&dence &nter*al:
7.1588523 "".7#"6"68
sample est&mates:
rat&o o< *ar&ances
#.535628
O resultado mostra que no h uma diferena significativa entre as varincias.
Alternativamente, pode ser usado o teste de Bartlett.
> :artlett.test(massa)
29
^artlett test <or homo,ene&t. o< *ar&ances
data: massa
^artlett;s _s(uared A #.6#58$ d< A 3$ p*alue A 7.%573
O resultado igual ao teste de F: no h uma diferena entre as varincias do grupo
Para verificar a normalidade das quatro amostras, usaremos o teste de Shapiro-Wilk
> shap&ro.test(M)
Dados de A so normais
)hap&ro[&l+ normal&t. test
data: M
[ A 7.283$ p*alue A 7."236
> shap&ro.test(^)
Dados de B so normais
)hap&ro[&l+ normal&t. test
data: ^
[ A 7.288#$ p*alue A 7.#"%2
> shap&ro.test(C)
Dados de C so normais
)hap&ro[&l+ normal&t. test
data: C
[ A 7.8162$ p*alue A 7.2%8%
>shap&ro.test(D)
Dados de D so normais
)hap&ro[&l+ normal&t. test
data: D
[ A 7.8%13$ p*alue A 7.1#6
No esquea desprender o jogo de dados massa
30
> detach(massa)
Prosseguimos com ANOVA para verificar diferenas entre mdias, mas precisamos modificar o jogo de
dados para ser lido pelo programa e os dados sero colocados em forma vertical com uma coluna fatorial
(Localidade) e uma da varivel (Massa)
> massa.*ert<data.<rame(Kocal&dadeA,l(%$"7)$
MassaAc(massaLM$massaL^$massaLC$massaLD))
> massa.*ert
Kocal&dade Massa
" " 52
# " 22
3 " 25
. . .
. . .
. . .
%7 % 56
Deveria apresentar os mesmos dados, mas a diferena que as observaes de massa (g) so arranjados
em uma coluna Massa e a primeira coluna Localidade tem os cdigos dos locais de coleta (A=1, B=2, C=3,
D=4). Portanto, cada observao ainda associada com sua respectiva localidade. Compare a tabela de
dados horizontais massa com os dados verticais massa.vert para confirmar.
Facilite o acesso s variveis
> attach(massa.*ert)
Define a coluna Localidade como um fator
> Kocal&dade<<actor(Kocal&dade)
Verifique se Localidade mesmo um fator
> &s.<actor(Kocal&dade)
-"/ CSY9
Rodamos a anlise de varincia pelo teste aov para verificar diferenas em massa mdia (varivel Massa)
entre as amostras tiradas em diferentes ninhos (fator Localidade)
> massa.ao*<ao*(MassaVKocal&dade)
Mostramos a tabela de ANOVA
31
> summar.(massa.ao*)
D< )um )( Mean )( P *alue Zr(>P)
Kocal&dade 3 3%".87 ""3.85 8.7763 7.777"387 444
Ses&duals 31 %66.17 "#.11
)&,n&<. codes: 7 `444; 7.77" `44; 7.7" `4; 7.76 `.; 7." ` ; "
A tabela de ANOVA mostra que a(s) diferena(s) entre as mdias (so) altamente significativa(s).
Podemos concluir que h uma diferena significativa entre a massa mdia dos pssaros nos quatro
localidades.
Entretanto, a anlise no terminou ainda e para verificar entre exatamente quais pares de amostras (A-D)
ocorrem diferenas signficativas usamos o teste de Tukey HSD.
> Cu+e.O)D(massa.ao*$ ordered A CSY9)
Os valores das diferenas di!! entre as mdias de pares de amostras. Localidade A=1, B=2, C=3, D=4
Cu+e. mult&ple compar&sons o< means
86a <am&l.w&se con<&dence le*el
<actor le*els ha*e :een ordered
P&t: ao*(<ormula A Massa V Kocal&dade$ data A massa.*ert)
LKocal&dade
d&<< lwr upr
3% 3.# ".72%5271# 5.%2%52"
#% %.7 7.#2%5271# 2.#2%52"
"% 2.# 3.8"6#"832 "#.%2%52"
#3 7.2 3.%2%5271# 6.72%52"
"3 6.7 7.5"6#"832 8.#2%52"
"# %.# 7.72%5271# 2.%2%52"
Podemos plotar as diferenas Figura 11
> plot(Cu+e.O)D(massa.ao*$orderedACSY9))
O grfico mostra as diferenas (intervalo de confiana 95%) entre as mdias das pares de amostras. Os
pares com diferenas significativas so aqueles com limites inferiores (lwr) positivos. Os detalhes do
clculo do teste de Tukey so descritos por Zar (1999) e Levin (1985). Apenas as diferenas entre A e D e
A e C so significativas no nvel de 5% (p<0,05). Portanto, foram estas amostras que contribuiram para as
diferenas detectadas pela ANOVA.
32
Exerccio: tenta plotar as mdias com o desvio padro (s) das amostras A-D como na Figura 6. Como
possvel plotar o erro padro em vez do desvio padro?
Figura 11. Diferenas significativas do teste de TukeyHSD. Os pares de amostras com diferenas
significativas so A-C e A-D. A=1, B=2, C=3, D=4.
CALCULANDO ESTATSTCAS USANDO tappl.()
Quando as observaes esto em uma coluna vertical com uma ou mais colunas de fatores, podemos usar
a funo tappl. para calcular a mdia, desvio padro, varincia, etc.
Calcular a massa mdia por localidade a partir do jogo de dados massa.*ert:
> tappl.(Massa$ Kocal&dade$ mean)
Substituir sd, *ar e len,th no lugar de mean para calcular o desvio padro, varincia e nmero de
observaes destes dados.
No final da sesso no esquea
> detach(massa.*ert)
> (()
33
AN<LISE DE :ARICNCIA COM DOIS 'ATORES MODELO I @a*bos "atores "iEosB
Os detalhes de ANOVA com dois fatores podem ser obtidos em Captulo 17 de Fowler & Cohen (1990) e
12 de Zar (1999).
mporte os dados (mostrados aqui parcialmente para facilitar visualizao). Dados sobre a Massa (g) de
pssaros medidos em dois meses (Mes=Fator 1) em 4 diferentes locais (Ninho=Fator 2). H 10 rplicas em
cada local ou seja o nmero total de rplicas 80. Apenas as primeiras trs rplicas de cada amostra esto
mostradas aqui.
>!<read.cs*(=starl&n,.cs*=)T!
Massa Mes '&nho Sepl&cates
" 52 " " "
# 22 " " #
3 25 " " 3
. . . .
"" 52 " # "
"# 52 " # #
"3 26 " # 3
. . . .
#" 58 " 3 "
## 53 " 3 #
#3 58 " 3 3
. . . .
3" 55 " % "
3# 12 " % #
33 56 " % 3
. . . .
%" 26 # " "
%# 22 # " #
%3 21 # " 3
. . . .
6" 2% # # "
6# 22 # # #
63 8" # # 3
. . . .
1" 8" # 3 "
1# 87 # 3 #
13 25 # 3 3
. . . .
5" 87 # % "
5# 25 # % #
34
53 26 # % 3
. . . .
27 55 # % "7 A ltima rplica. O jogo completo no mostrado aqui.
Agora podemos ligar os dados em x para facilitar acesso
> attach(!)
Definimos e verificamos os fatores
> Mes<<actor(Mes)T '&nho<<actor('&nho)
> &s.<actor(Mes)T &s.<actor('&nho)
-"/ CSY9
-"/ CSY9
Plotamos as massas mdias das 8 localidades para cada ms e o resultado mostra que o padro de
variao da mdia ao longo dos dois meses parecida entre as localidades Figura 12
> &nteract&on.plot ('&nho$Mes$Massa)
Roda ANOVA sobre a varivel Massa com dois fatores Mes e Ninho e com um teste para interao entre
Mes e Ninho
> !.ao*<ao*(MassaVMes0'&nho0Mes:'&nho)
Exibe a tabela de ANOVA aps rodar o teste
> summar.(!.ao*)
D< )um )( Mean )( P *alue Zr(>P)
Mes " "161.#7 "161.#7 83.1777 "."5#e"% 444
'&nho 1 172.17 "7".%3 6.53#6 1.%66e76 444
Mes:'&nho 3 3%.#7 "".%7 7.1%%3 7.628"
Ses&duals 5# "#5%.77 "5.18
)&,n&<. codes: 7 `444; 7.77" `44; 7.7" `4; 7.76 `.; 7." ` ; "
A localidade do ninho afeta significativamente a massa mdia. O efeito da data de coleta (Mes) sobre
massa tambm significativo. O resultado mostra que no h interao significativa, confirmando a
interpretao do interaction plot acima
Podemos verificar entre quais amostras h diferenas significativas.
Cu+e.O)D(!.ao*$orderedAC)
Cu+e. mult&ple compar&sons o< means
86a <am&l.w&se con<&dence le*el
<actor le*els ha*e :een ordered
35
P&t: ao*(<ormula A !LMassa V Mes 0 '&nho 0 Mes:'&nho)
LMes
d&<< lwr upr
#" 8." 5.##%866 "7.85676
L'&nho
d&<< lwr upr
3% 3.1 7."7"%27" 5.7826#
#% 6.7 ".67"%27" 2.%826#
"% 5.% 3.87"%27" "7.2826#
#3 ".% #.7826"88 %.2826#
"3 3.2 7.37"%27" 5.#826#
"# #.% ".7826"88 6.2826#
L=Mes:'&nho=
d&<< lwr upr
-"$/ 3.# #.15#5#1" 8.75#5#1
-#$/ %.7 ".25#5#1" 8.25#5#1
-3$/ 2.# #.3#5#538 "%.75#5#1
-%$/ 2.2 #.8#5#538 "%.15#5#1
-6$/ "#.2 1.8#5#538 "2.15#5#1
-1$/ "%.2 2.8#5#538 #7.15#5#1
-5$/ "6.% 8.6#5#538 #".#5#5#1
-2$/ 7.2 6.75#5#1" 1.15#5#1
-8$/ 6.7 7.25#5#1" "7.25#5#1
-"7$/ 6.1 7.#5#5#1" "".%5#5#1
-""$/ 8.1 3.5#5#538 "6.%5#5#1
-"#$/ "".1 6.5#5#538 "5.%5#5#1
-"3$/ "#.# 1.3#5#538 "2.75#5#1
-"%$/ %.# ".15#5#1" "7.75#5#1
-"6$/ %.2 ".75#5#1" "7.15#5#1
-"1$/ 2.2 #.8#5#538 "%.15#5#1
-"5$/ "7.2 %.8#5#538 "1.15#5#1
-"2$/ "".% 6.6#5#538 "5.#5#5#1
-"8$/ 7.1 6.#5#5#1" 1.%5#5#1
-#7$/ %.1 ".#5#5#1" "7.%5#5#1
-#"$/ 1.1 7.5#5#538 "#.%5#5#1
-##$/ 5.# ".3#5#538 "3.75#5#1
36
-#3$/ %.7 ".25#5#1" 8.25#5#1
-#%$/ 1.7 7."#5#538 "".25#5#1
-#6$/ 1.1 7.5#5#538 "#.%5#5#1
-#1$/ #.7 3.25#5#1" 5.25#5#1
-#5$/ #.1 3.#5#5#1" 2.%5#5#1
-#2$/ 7.1 6.#5#5#1" 1.%5#5#1
H apenas dois nveis no fator Mes, ento qualquer diferena significativa tem que ser entre os dois meses.
Em termos do fator Ninho, o ninho 4 diferente dos demais ninhos e ninho 1 diferente de ninho 3.
Plote um grfico mostrando as diferenas entre os ninhos do Tukey HSD Figura 13
> plot(Cu+e.O)D(!.ao*$'&nho$ orderedAC)
Tanto na tabela, como no plot, os pares de amostras com diferenas significativas so aquelas cujos limites
inferiores (lwr) so positivos. Neste caso, apenas trs pares de ninhos tm diferenas significativas: 1-3, 1-
4, 2-4, e 3-4.
Calcular a massa mdia por ms e ninho a partir do jogo de dados x:
> tappl.(Massa$ Mes:'&nho$ mean)
Desligar o jogo de dados x
> detach (!)
Termina a sesso
> (()
Figura 12. Grfico de interao: a variao Figura 13. Diferenas significativas do teste
na massa mdia entre os locais parecida entre TukeyHSD. Os pares de ninhos com
os dois meses. diferenas significativas so 1-3, 1-4, 2-4 e 3-4.
37
MAIS UM EXEMPLO DE ANO:A MODELO I DE DOIS 'ATORES @a*bos "atores "iEosB
Exemplo de Zar (1999), p.233. Dados sobre o efeito de tratamento e sexo sobre nveis de plasma.
Fator 1 = tratamento, 1 = sem hormnio, 2 = com hormnio. Fator 2 = sexo, 1 = fmea, 2 = macho.
mporte os dados.
> !<read.cs*(=plasma.cs*=)T !
plasma tratmento se!o repl&cas
" "1.6 " " "
# "2.% " " #
3 "#.5 " " 3
% "%.7 " " %
6 "#.2 " " 6
1 "%.6 " # "
5 "".7 " # #
2 "7.2 " # 3
8 "%.3 " # %
"7 "7.7 " # 6
"" 38." # " "
"# #1.# # " #
"3 #".3 # " 3
"% 36.2 # " %
"6 %7.# # " 6
"1 3#.7 # # "
"5 #3.2 # # #
"2 #2.2 # # 3
"8 #6.7 # # %
#7 #8.3 # # 6
Agora podemos ligar os dados em x para facilitar acesso
> attach(!)
Definimos os fatores
> tratmento<<actor(tratmento)T se!o<<actor(se!o)
Verificamos a interao visualmente Figura 14
> &nteract&on.plot(tratmento$se!o$plasma)
No h interao entre tratamento e sexo e ainda h um grande efeito de tratamento enquanto o efeito de
sexo pouco (pouca distncia entre as linhas paralelas). Rode ANOVA sobre a varivel plasma com dois
fatores tratamento e sexo e com um teste para interao entre os dois fatores
38
> !.ao*<ao*(plasmaVtratmento0se!o0tratmento:se!o)
> summar.(!.ao*)
D< )um )( Mean )( P *alue Zr(>P)
tratmento " "321."" "321."" 17.6331 5.8%3e75 444
se!o " 57.3" 57.3" 3.7571 7.78221
tratmento:se!o " %.87 %.87 7.#"%7 7.1%825
Ses&duals "1 311.35 ##.87
)&,n&<. codes: 7 `444; 7.77" `44; 7.7" `4; 7.76 `.; 7." ` ; "
O resultado mostra que no h interao significativa, no h efeito de sexo e que o efeito de tratamento
altamente significativo, confirmando a interpretao do grfico de interao (interaction.plot)
Figura 14
Calcular a mdia e desvio padro por tratamento e sexo a partir do jogo de dados x:
> tappl.(plasma$ tratamento:se!o$ mean)
> tappl.(plasma$ tratamento:se!o$ sd)
> detach(!)
> (()
Figura 14. Grfico de interao mostrando a ausncia de interao (linhas paralelas), pouco efeito de sexo
(distncia curta entre linhas) e um grande efeito de tratamento (diferena grande na mdia entre
tratamentos 1 e 2). Sexo: ----fmea, ___macho.
39
TESTE DE FILCOXON RANG SUM TEST @eH!i%alente a TESTE U DE MANNAF;ITNEI B
PARA OBSERVAES NDEPENDENTES
Detalhes do teste podem ser encontrados em Zar (1999) p. 145, Captulo 10 de Levin (1985) e 16 de
Fowler & Cohen (1990).
Para testar para uma diferena entre as medianas de duas amostras: nmeros de besouros capturados
durante a noite em 8 armadilhas no hbitat A e em 7 armadilhas no hbitat B
> M<c(2$"#$"6$#"$#6$%%$%%$17)
> ^<c(#$%$6$8$"#$"5$"8)
Verifique as estatsticas das amostras usando o boxplot (Figura 15)
> :o!plot(M$^$ namesAc(=M=$=^=))
Rode o teste de Wilcoxon
> w&lco!.test(M$^)
[&lco!on ran+ sum test w&th cont&nu&t.
correct&on
data: M and ^
[ A %5.6$ p*alue A 7.7#51"
alternat&*e h.pothes&s: true mu &s not e(ual to 7
[arn&n, messa,e:
Cannot compute e!act p*alue w&th t&es &n: w&lco!.test.de<ault(M$
^)
O resultado do teste mostra que h uma diferena significativa entre as medianas das amostras A e B. O
Wilcoxon Rank Sum Test (equivalente ao Teste U de Mann-Whitney) testa a hiptese nula na qual as
medianas das distribuies de A e B diferem pelo valor de . Desde que o valor padro de =0, signifique
que a hiptese nula que as medianas so iguais
TESTE DE FILCOXON SIGNED RANG TEST
PARA OBSERVAES PAREADAS
Mais informaes podem ser obtidas em Zar (1999) p. 145, Captulo 16 de Fowler & Cohen (1990).
O Wilcoxon Signed Rank Test igual ao Wilcoxon Rank Sum Test com a diferena que as duas amostras
tm observaes pareadas.
A massa de 10 pssaros migratrios foi medida em duas ocasies, primeiro em agosto e os mesmos
pssaros (marcados individualmente e recapturados) foram medidos novamente em setembro
40
> a,o<c("7.3$"".%$"7.8$"#.7$"7.7$"".8$"#.#$"#.3$"".5$"#.7)
> set<c("#.#$"#."$"3."$"".8$"#.7$"#.8$"".%$"#."$"3.6$"#.3)
Plote as estatsticas das amostras (Figura 9)
> :o!plot(a,o$set$namesAc(=M,osto=$=)etem:ro=))
Parece que os pssaros ganharam peso entre agosto e setembro, mas essa diferena significativa?
Rode o teste de Wilcoxon agora com paired=TRUE, para indicar se as observaes so pareadas
> w&lco!.test(a,o$set$ pa&redACSY9)
[&lco!on s&,ned ran+ test
data: a,o and set
N A 2$ p*alue A 7.7%223
alternat&*e h.pothes&s: true mu &s not e(ual to 7
O resultado mostra que h uma diferena significativa entre as massas medianas das duas amostras e
podemos inferir que os pssaros tm uma massa significativamente maior em setembro
> (()
Figure 15. Nmero mediano de besouros capturados em duas amostras independentes em hbitat A e
hbitat B.
41
TESTE DE GRUSGALAFALLIS @ANO:A N=O PARAM3TRICA DE UM 'ATORB
Mais informaes podem ser obtidas na p. 195 de Zar (1999), Captulo 10 de Levin (1985) e 16 de Fowler
& Cohen (1990).
Os dados no precisam ser distribudos normalmente, mas as distribuies das amostra devem ser
semelhantes entre si. H diferenas de opinio sobre a questo da homogeneidade das varincias (veja
Zar,1999 e Fowler & Cohen, 1990 versus Underwood, 1998).
O nmero de orqudeas em cinco quadrados em quatro campos (A-D).
> M<c(#5$"%$2$"2$5)
> ^<c(%2$"2$3#$6"$##)
> C<c(""$7$3$"6$2)
> D<c(%%$5#$2"$66$38)
Mostre as estatsticas das amostras
> summar.(M)
M&n. "st Ju. Med&an Mean 3rd Ju. Ma!.
5.7 2.7 "%.7 "%.2 "2.7 #5.7
> summar.(^)
M&n. "st Ju. Med&an Mean 3rd Ju. Ma!.
"2.7 ##.7 3#.7 3%.# %2.7 6".7
> summar.(C)
M&n. "st Ju. Med&an Mean 3rd Ju. Ma!.
7.7 3.7 2.7 5.% "".7 "6.7
> summar.(D)
M&n. "st Ju. Med&an Mean 3rd Ju. Ma!.
38.7 %%.7 66.7 62.# 5#.7 2".7
Plote as estatsticas das amostras Figura 16
> :o!plot(M$^$C$D$ namesAc(=M=$=^=$=C=$=D=)$ .la:A='o. or(ubdeas=$
colA3)
Coloque os dados em uma forma vertical. H um fator, Campo, e uma varivel, o nmero de Orquideas
> or(.dados<data.<rame(Campo<,l(%$6)$ Er(u&deas<c(M$^$C$D))
Verifique os dados
> or(.dados
42
Campo Er(u&deas
" " #5
# " "%
3 " 2
% " "2
6 " 5
1 # %2
5 # "2
2 # 3#
8 # 6"
"7 # ##
"" 3 ""
"# 3 7
"3 3 3
"% 3 "6
"6 3 2
"1 % %%
"5 % 5#
"2 % 2"
"8 % 66
#7 % 38
Execute o teste Kruskal-Wallis
> +rus+al.test(Er(u&deasVCampo$ or(.dados)
_rus+al[all&s ran+ sum test
data: Er(u&deas :. Campo
_rus+al[all&s ch&s(uared A "%.17#$ d< A 3$ p*alue A 7.77#"87
O teste mostra que h uma diferena (ou diferenas) significativa(s) entre as medianas do grupo de quatro
amostras. H vrios mtodos para efetuar comparaes mltiplas no-paramtricas (Zar, 1999, p. 223).
Alternativamente, o teste pode ser rodado assim, dando o mesmo resultado!
> +rus+al.test (l&st(M$^$C$D))
_rus+al[all&s ran+ sum test
data: l&st(M$ ^$ C$ D)
43
_rus+al[all&s ch&s(uared A "%.17#$ d<A 3$ p*alue A 7.77#"87
Se tiver replicao desigual, use este mtodo mais flexvel para arranjar os dados
> or(.dados<c(M$^$C$D)
> or(.dados
-"/ #5 "% 2 "2 5 %2 "2 3# 6" ## "" 7 3 "6
-"6/ 2 %% 5# 2" 66 38
Deve ser observado que o -"/ e -"6/ indicam a primeira e a dcima-quinta observao,
respectivamente.
Organize um arranjo de 1 a 4 amostras com 5 rplicas em cada e com as etiquetas "A a "D.
-ota. &/ T0/&&/ uma r1plica a mais na amostra %+ ento o n2mero de r1plicas seria c)3+4+4+4*5
> ,<<actor(rep(":%$ c(6$ 6$ 6$ 6))$la:elsAc(=M=$=^=$=C=$=D=))
> +rus+al.test (or(.dados$ ,)
_rus+al[all&s ran+ sum test
data: or(.dados and ,
_rus+al[all&s ch&s(uared A "%.17#$ d< A 3$ p*alue A 7.77#"87
Novamente o resultado idntico aos anteriores!
> (()
44
Figura 16. Boxplot dos dados A, B, C, D.
CORRELA7CO E REGRESSCO
Veja Captulo 6 e 7 de Vieira (1980), 11 de Levin (1985), 14 e 15 de Fowler & Cohen (1990) e 17 e 19 de
Zar (1999).
Coeficiente de correlao de Spearman (no paramtrico)
Diversidade de gafanhotos (y) em relao ao nmero de anos depois da aplicao de pesticidas (x)
> !<c(7$"$3$6$8$"#$"3$"6$#"$#6)
> .<c(7$7."8$7."6$".%8$"."7$"."#$".1"$".%#$".%2$".8#)
> !
-"/ 7 " 3 6 8 "# "3 "6 #" #6
> .
-"/ 7.77 7."8 7."6 ".%8 "."7 "."# ".1" ".%# ".%2 ".8#
Plotamos as duas variveis em um grfico de disperso Figura 17
> plot(!$.$ .la:AD&*ers&dade de ,a<anhotos$ !la:A'o. anos ap]s
apl&caDco de pest&c&da)
Parece que h uma correlao positiva entre as duas variveis e podemos testar se esta correlao real
ou no usando a funo cor.test().
Testamos a significncia da relao
> cor.test(!$.$methodA=spearman=$alternat&*eA=two.s&ded=)
)pearman;s ran+ correlat&on rho
45
data: ! and .
) A 3#$ p*alue A 7.772#31
alternat&*e h.pothes&s: true rho &s not e(ual to 7
sample est&mates:
rho
7.2717171
O valor da estimativa do coeficiente de Spearman rs 0,806 e a correlao altamente significativa.
Podemos inferir que h uma correlao positiva e significativa entre diversidade de gafanhotos e o tempo
aps aplicao de pesticidas.
Coeficiente de correlao de Pearson (paramtrico)
! <c(1.1$1.8$5.3$5.6$2.#$2.3$8."$8.#$8.%$"7.#)
. <c(21$8#$5"$5%$"26$26$#7"$#23$#66$###)
Plotamos a relao em um grfico de disperso Figura 18
> plot(!$.$ .la:A=Massa do pe&!e (,)=$ !la:A=Compr&mento do
ot]l&to=)
Testamos a significncia da relao
> cor.test(!$.$methodA=pearson=$alternat&*eA=two.s&ded=)
Zearson;s productmoment correlat&on
data: ! and .
t A %.36%1$ d< A 2$ p*alue A 7.77#%3
alternat&*e h.pothes&s: true correlat&on &s not e(ual to 7
86 percent con<&dence &nter*al:
7.%%#2"21 7.817226#
sample est&mates:
cor
7.2321#5"
O valor da estimativa do coeficiente de Pearson r 0,8386 a correlao altamente significativa.
Podemos inferir que h uma correlao positiva e significativa entre comprimento do otlito e a massa do
peixe.
Um exemplo de regresso simples linear: dados sobre a massa de fertilizante (gm
-2
) aplicada (x) e a
46
colheita de grama obtida (gm
-2
) para cada aplicao de fertilizante (y).
! <c(#6$67$56$"77$"#6$"67$"56$#77$##6$#67)
. <c(2%$27$87$"6%$"%2$"18$#71$#%%$#"#$#%2)
Aplique a regresso linear simples pelo mtodo de quadrados mnimos e mostre os resultados
> <ert&l&@ante.lm<lm(.V!)
> summar.(<ert&l&@ante.lm)
Call:
lm(<ormula A . V !)
Ses&duals:
M&n "J Med&an 3J Ma!
##.58 "".75 6.77 "#.77 #8.58
Coe<<&c&ents:
9st&mate )td. 9rror t *alue Zr(>dtd)
(Gntercept) 6".83333 "#.8587% %.77" 7.7738% 44
! 7.2""38 7.72315 8.185 ".75e76 444
)&,n&<. codes: 7 `444; 7.77" `44; 7.7" `4; 7.76 `.; 7." ` ; "
Ses&dual standard error: "8 on 2 de,rees o< <reedom
Mult&ple S)(uared: 7.8#"1$ Mdjusted Ss(uared: 7.8""2
Pstat&st&c: 8%.7% on " and 2 DP$ p*alue: ".715e76
O intercepto y 51,933 e o gradiente 0,81139. A regresso tem a frmula y = 0,81139 x + 51,933
No R, a significncia da regresso testada pela ANOVA. O valor de F significativo com 1 e 8 graus de
liberdade e concluamos que a regresso altamente significativa.
Detalhes da ANOVA para testar a significncia da regresso:
> ano*a(<ert&l&@ante.lm)
Mnal.s&s o< Nar&ance Ca:le
Sesponse: .
D< )um )( Mean )( P *alue Zr(>P)
! " 338%5 338%5 8%.7%" ".715e76 444
Ses&duals 2 #222 31"
47
)&,n&<. codes: 7 `444; 7.77" `44; 7.7" `4; 7.76 `.; 7." ` ; "
As quantidades importantes so a varincia da regresso (33947) e a varincia residual (361) com 1 e 8
graus de liberdade, respectivamente.
Plote os dados
> plot(!$.$.l&mAc(7$377)$!la:A=Massa de
<ert&l&@ante=$.la:A=Colhe&ta de ,rama=)
Acrescente a reta da regresso ao grfico
> a:l&ne (<ert&l&@ante.lm)
Alternativamente, se quiser uma linha mais "enxuta use
> l&nes (!$7.2""384!06".833)
Adicione a frmula e a significncia da regresso ao grfico Figura 19
> te!t("77$#77$=.A7$2""38!06"$833$ p<7$7"=)
> (()
48
Figura 17. Diversidade de gafanhotos em Figura 18. Massa do peixe em relao ao
relao ao nmero de anos aps aplicao comprimento do otlito.
de pesticidas.
Figura 19. Regresso simples linear entre a massa de fertilizante e a colheita de grama.
49
'UN78ES MISCELCNEAS JTEIS
Para planejar uma amostragem aleatria, usa a funo sample()
Tire uma amostra aleatria de 10 observaes/indivduos/posies a partir de uma populao de 100
> !<sample(":"77$"7) T!
Arranje as observaes em ordem crescente. Brincadeira: qual a mediana?
> sort(!)
Crie um ranking das observaes.
> ran+(!)
Qualquer grfico produzido em R pode ser exportado em vrias formas incluindo postscript, pdf,
jpeg,png,bmp, etc.
Para ver as opes dos diferentes formatos p.ex. png use
> help(pn,)
Exemplo
> !<c(=M=A#$=^=A6$=C=A"#)T!
M ^ C
# 6 "#
> :arplot(!)
> pn, (<&lenameA=meu,rI<&co.pn,=)
A extenso .png significa Porta$le -et'or6 7raphic ou Grfico da Rede Porttil e mais limpa que o
formato .jpeg. Este ltimo s deveria ser usado com fotos.
Repite os comandos para desenhar o grfico
> :arplot(!)
Termine o grfico e fecha o dispositivo jpeg
> de*.o<<()
Agora deve ter um arquivo grfico chamado meugrfico.jpg no seu diretrio de trabalho que pode ser
inserido em um documento de texto - Figura 20
50
Figura 20. Barplot do jogo de dados x no exemplo anterior.
51
AN<LISE MULTI:ARI<:EL B<SICA
Anlise multivarivel um tpico complexo e h muitas tcnicas complementares e alternativas. Consulte a
bibliografia para decidir quais so apropriados para seus dados.
mportar dados (dadosmv.csv), especifique a presena de um cabealho e que a primeira coluna contem
os nomes das fileiras
> !<read.cs*(=dadosm*.cs*=$headerAC$row.namesA")
Para usar algumas funes preciso carregar a biblioteca *e,an. Esta pode ser baixada do site do R e
instalada antes de prosseguir.
Carregar a biblioteca *e,an
> l&:rar.(*e,an)
Calcular o ndice de diversidade Shannon usando o logaritmo natural (opo padro)
> d&*ers&t.(!$=shannon=)
)bt&o M )bt&o ^ )bt&o C )bt&o D
7.1316"%# ".7#81637 7.183"%5# "."135#33
Calcular a riqueza de espcies
> specnum:er(!)
)bt&o M )bt&o ^ )bt&o C )bt&o D
# 3 # 1
Para ver mtodos de padronizao use o comando decostand. R tem muitas funes integradas para a
transformao de dados
Calcular a matriz de dissimilaridade Bray-Curtis sobre dados no transformados, no padronizados
> !.d&st<*e,d&st(!$=:ra.=)
Criar o agrupamento hierrquico com ligao mdia sobre a matriz de dissimilaridade Bray-Curtis
!.clust<hclust(!.d&st$=a*era,e=)
Plotar o dendrograma (veja opes de plot digitando ?hclust)
> plot(!.clust$ han,A7.6)
Carregar a biblioteca MASS
> l&:rar.(MM)))
52
Rodar anlise nmMDS (escalonamento multidimensional no-mtrico)
> !.mds<&soMD)(!.d&st$+A3$ma!&tA8888)
&n&t&al *alue 7.777777
<&nal *alue 7.777777
con*er,ed
Anote que recomendado o uso de &n&tMD) e postMD) que esto disponveis na biblioteca *e,an.
O valor final de estresse (neste caso muito pequeno, quase zero) uma medida de quanto a ordenao
representa os valores de dissimilaridade entre Stios na matriz. Quanto menor o estresse melhor essa
representao.
Plotar a ordenao MDS em branco (tipo = nula), inicialmente
> plot(!.mdsLpo&nts$ t.peA=n=)
Acrescentar as etiquetas dos locais
> te!t(!.mdsLpo&nts$ la:elsAas.character(row.names(!)))
Pode embelezar os grficos (etiquetas de eixos, cores etc.) usando as opes de plot. Veja demo
(,raph&cs) para ver a capacidade grfica de R. H tambm a possibilidade de realizar ANOSM, PCA,
e outras tcnicas multivariveis no R.
53
Figura 21. Agrupamente hierrquico (ligao mdia)
Figura 22. Ordinao nmMDS. Estresse<0.0001
54
DISTRIBUI78ES DE PROBABILIDADE
Podemos criar distribuies de probabilidade de diferentes famlias (Gaussiano ou Normal, Binomial,
Poisson e Binomial Negativa) usando valores personalizados dos parmetros das distribuies.
Distrib!i,6o nor*al
Para visualizar uma distribuio normal de probabilidade (parmetros: e o) com a mdia da amostra
=74.0 e s =2,34 (estimativas de e o, respectivamente) para as observaes entre 68 e 80 use:
> :arplot(dnorm(12:27$ 5%.7$ #.3%)$ colA#$ namesAc(12:27)$
!la:ACompr&mento da planta (mm)$ .la:AZro:a:&l&dade)
Distrib!i,6o Bino*ial
Para visualizar uma distribuio Binomial de probabilidade com k=8 ensaios, p=q=0,5 e para o nmero de
resultados nomeados entre 0 a 8 use:
> :arplot(d:&nom(7:2$2$7.6)$ namesAc(7:2)$ !la:A'emero de
machos$ .la:AZro:a:&l&dade)
Para visualizar uma distribuio Binomial de probabilidade com k=8 ensaios, p=0,8 e q=0,2 e para o
nmero de resultados nomeados entre 0 e 8 use:
> :arplot(d:&nom(7:2$2$7.2)$ namesAc(7:2)$!la:A'emero de
&nd&*bduos de D. autumnal&s$ .la:AZro:a:&l&dade)
Distrib!i,6o Poisson
Para visualizar uma distribuio Poisson de probabilidade com =4 (a mdia uma estimativa do
parmetro ) e para observaes entre 0 e 10 use:
> :arplot(dpo&s(7:"7$%.7)$colA3$namesAc(7:"7)$ !la:A'emero de
&nd&*bduos por un&dade de amostra,em$ .la:AZro:a:&l&dade)
Distrib!i,6o Bino*ial Ne+ati%a
Para visualizar uma distribuio Binomial Negativa de probabilidade com==2,
2
=s
2
=5.0, kappa k=1.33
(veja Elliott, 1983 para estimao de parmetros) e para observaoes entre 0 e 8 use:
> :arplot(dn:&nom(7:2$ muA#$ s&@eA".33)$ colA3$ namesAc(7:2)$
!la:A'emero de &nd&*bduos por un&dade de amostra,em$
.la:AZro:a:&l&dade)
Criando distribuies de probabilidade permitem ns testar se dados biolgicos sobre a disperso de
organismos no seu ambiente conformem aos modelos Binomial (disperso regular), Poisson (disperso
aleatria) ou Binomial Negativa (disperso contagiosa ou agregada). Veja Elliott (1983) ou Fowler & Cohen
(1990) para mais detalhes.
55
RE'ER?NCIAS BIBLIOGR<'ICAS
Elliott, JM (1983) Some methods for the statistical analysis of samples of benthic invertebrates. Freshwater
Biological Association Scientific Publication No. 25.
Fowler J & Cohen L (1990) Practical statistics for field biology. John Wiley & Sons, Chichester.
Levin J (1985) Estatstica aplicada a cincias humanas. Harper & Row do Brasil, SP.
haka R & Gentleman R (1996) R: A Language for Data Analysis and Graphics. Journal of Computational
and Graphical Statistics 5 (3): 299-314.
Jongman RHG, Ter Braak CJF & Van Tongeren, OFR (1995) Data analysis in community and landscape
ecology. Cambridge University Press.
Underwood AJ (1998) Experiments in ecology. Their logical design and interpretation using analysis of
variance. Cambridge University Press.
Vieira S (1980) ntroduo bioestatstica. Editora Campus
Zar JH (1999) Biostatistical analysis. Prentice Hall, Upper Saddle River, NJ.
Copyright (c) 2004 Colin Robert Beasley.
dada permisso para copiar, distribuir e/ou modificar este documento sob os termos da Licena de
Documentao Livre GNU, Verso 1.2 ou qualquer verso posterior publicada pela Free Software
Foundation; sem nenhum Seo nvariante, sem nenhum Texto da Capa da Frente, e sem nenhum Texto
da Quarta-Capa. Uma cpia da licena pode ser consultada no endereo http://www.fsf.org/licence/. Uma
traduo no-oficial desta para o portugus do Brasil pode ser encontrado no endereo:
http://www.ead.unicamp.br/minicurso/bw/texto/fdl.pt.html.
56