Vous êtes sur la page 1sur 16

Universidade Federal do Maranho

Bioestatstica
Mestrado em Diversidade e Biologia da Conservao

Ana Catarina Miranda


14/5/2015
1
Sumrio
Sobre o Curso ................................................................................................................................ 4
1.1. Carga Horria................................................................................................................. 4
1.2. Faltas ............................................................................................................................. 4
1.3. Material para as Aulas (incluindo a primeira) ............................................................... 4
Captulo 1 - Dados ......................................................................................................................... 6
1.1. Amostras ....................................................................................................................... 6
1.2. Populao ...................................................................................................................... 6
1.3. Variveis ........................................................................................................................ 6
1.3.1. Variveis de Medio (Variveis Contnuas e Variveis Discretas) ....................... 7
1.3.2. Variveis Ordinais (Variveis de Classificao) ..................................................... 7
1.3.3. Variveis Qualitativas (Variveis Nominais ou Atributos) ..................................... 7
1.4. Como Coletar Dados? .................................................................................................... 8
1.5. Pseudoreplicao .......................................................................................................... 9
Referncias .................................................................................................................................. 12
Anexo 1 Script do R para o Grfico da Figura 2........................................................................... 14
Sobre o Curso
1.1. Carga Horria
Este um curso de 60 horas, incluindo 45 horas de trabalho em aula e 15 horas de trabalho
fora de aula (preparao de trabalhos e apresentaes). As aulas decorrero em Maio nos dias
15,18, 19, 20, 21 e 22 e em Junho nos dias 1,2,3 e 5. Todas as aulas tero incio s 8:30 e
finalizar-se-o s 13:30, com um intervalo das 10:45 s 11:15. Pra no haverem conflitos entre
os nossos estmagos e os horrios das aulas so permitidos nas aulas qualquer tipo de
comidas, pratos, e talheres. Lquidos perto de computadores podem causar muitos danos.
Podem e devem matar a sede, mas no me responsabilizo por possveis estragos!

1.2. Faltas
Quem chegar 15 minutos depois da hora de incio da aula (aps as 8:45 na hora de entrada e
aps as 11:00 aps o intervalo) ter meia-falta, assim como quem sair 15 minutos antes da
hora de final da aula (notem que assim pode-se chegar a ter 1,5 faltas s num dia!). Acumular
3 faltas implicar a reprovao na disciplina. Se a professora reprovar por faltas, e se se provar
que no foi por sabotagem dos alunos, conceder-se- uma amnistia a todos os alunos.

1.3. Material para as Aulas (incluindo a primeira)


Trazer laptops com a ltima verso do software R instalada (encontram-no em
http://cran.r-project.org, ou em qualquer pesquisa google pela palavra-chave CRAN).
Estou muito familiarizada com o R em Ingls, um pouco com o R em Portugus
(Portugal), e nada com o R em Portugus (Brasil). Mas estou disposta a aprender...
Trazer um caderno, lpis e caneta.
Qualquer dvida escrevam-me para catarina.miranda@gmail.com

4
Captulo 1 - Dados
1.1. Amostras
Em bioestatstica, os dados so geralmente baseados nas nossas observaes individuais,
sendo observaes ou medidas da menor1 unidade de amostragem. A unidade mais pequena
de amostragem frequentemente, mas nem sempre, o indivduo. Se medirmos o peso de 66
formigas, o peso de cada formiga uma observao individual, o conjunto de pesos das 66
formigas representa a amostra de observaes, que pode ser definida por uma coleo de
observaes individuais. Neste caso, uma observao individual baseada num indivduo
biolgico, uma formiga. Se, no entanto, tivssemos estudado o peso de uma nica formiga ao
longo de um perodo de tempo, a amostra de observaes individuais seriam os pesos
registrados numa formiga em momentos temporais sucessivos. Se desejarmos medir
temperaturas em colnias de formigas, onde cada colnia uma unidade bsica de
amostragem, cada registro de temperatura uma observao individual, e a amostra das
observaes so as temperaturas para todas as colnias consideradas.

Os termos observao individual e amostra de observaes que so usados acima definem


apenas a estrutura, no a natureza dos dados de um estudo. A propriedade do que medido
pelas observaes individuais a varivel. Mais do que uma varivel pode ser medida na mais
pequena unidade de amostragem. Por exemplo, no grupo de 66 formigas do exemplo acima
podemos medir peso, comprimento, etc. Cada formiga (um indivduo biolgico) a unidade
mais pequena de amostragem, e peso e comprimento seriam duas das variveis estudadas. As
medidas de peso e comprimento so observaes individuais.

1.2. Populao
Em estatstica, o termo populao significa a totalidade de observaes individuais acerca das
quais sero feitas inferncias, que podem existir em qualquer parte do mundo ou pelo menos
dentro de uma rea amostral especificada limitada no espao e no tempo. Se amostrarmos 6
humanos e estudarmos o seu peso e estivermos preparados para tirar concluses acerca do
peso de toda a humanidade, ento a populao que foi amostrada representa o peso de todos
os restantes membros da humanidade. Por outro lado, podemos restringir a nossa amostra
fazendo uma especificao mais restrita, como 5 humanos do sexo masculino, brasileiros,
nascidos no Maranho com a idade de 25 anos. Deste modo estaramos a restringir as nossas
concluses a este grupo particular, e a populao da qual teria retirado amostras seriam todos
os homens brasileiros, nascidos no Maranho, e com 25 anos.

Um erro comum em estatstica a falha na definio da populao da qual feita a inferncia


estatstica. Um artigo descrevendo a anlise de uma populao restrita no deve implicar a
generalizao dos resultados.

1.3. Variveis
Em estatstica, varivel define-se como uma propriedade em relao qual indivduos numa
amostra variam. Se a tal propriedade no difere numa amostra, ou pelo menos em alguma das
amostras coletadas, no pode ter qualquer interesse estatstico! Por exemplo para os
mamferos faz sentido amostrar propriedades como comprimento, altura, peso, e nmero de

1
Em portugus de Portugal nunca se diz menor, diz-se sempre mais pequeno, portanto no
estranhem se usar este termo.

6
dentes. Mas para este grupo no faz sentido amostrar se so animais de sangue quente, pois
todos os mamferos o so (no entanto, faria sentido amostrar a temperatura corporal).

Existem vrios tipos de variveis, que definimos abaixo.

Figura 1: Tipos de dados

1.3.1. Variveis de Medio (Variveis Contnuas e Variveis Discretas)


Medidas expressas numericamente. Dividem-se em variveis contnuas e discretas

Variveis Contnuas
Medidas que teoricamente podem assumir um nmero infinito de valores entre dois pontos
(e.g.: comprimentos, reas, volumes, pesos, ngulos e temperaturas). Incluem os intervalos e
as rcios descritos na Figura 1. A diferena entre intervalos e rcios que os intervalos no
tm um zero absoluto (e.g. uma temperatura de o graus Celsius no significa que no exista
temperatura, assim como o relgio marcar 00:00 horas no significa que no exista tempo),
enquanto que as rcios tm um zero absoluto (e.g. massa, comprimento, etc.).

Variveis Discretas (Variveis Descontnuas)


Variveis que s tm certos valores numricos fixos sem valores intermdios entre eles (e.g.
dados de contagem como nmero de apndices de um inseto, nmero de dentes de um
roedor, nmero de glndulas, nmero de descendentes, nmero de colnias, ou nmero de
animais ou plantas numa determinada rea).

1.3.2. Variveis Ordinais (Variveis de Classificao)


So variveis que no podem ser medidas mas podem ser ordenadas ou classificadas pela sua
magnitude. Por exemplo numa experincia podemos registrar a classificao de ordem de
emergncia de dez pupas de uma espcie de borboleta sem registrar o tempo exato a que
cada pupa emergiu. Esta uma varivel ordinal, e existem mtodos especiais para lidar com
estes tipos de varivel (ver por exemplo Sokal & Rohlf, 1987). Expressar uma varivel como
uma srie de classes, como 1,2,3,4 e 5, no significa que a diferena em magnitude entre dois
ranks (por exemplo o 1 e o 2) seja idntica ou proporcional diferena entre outros dois ranks
(por exemplo o 4 e o 5).
1.3.3. Variveis Qualitativas (Variveis Nominais ou Atributos)
Variveis que no podem ser medidas, mas que so expressas qualitativamente. Consistem em
propriedades como rural ou urbano, macho ou fmea, juvenil ou adulto, morto ou vivo
(exemplificmos apenas pares de atributos, mas podem ser mais que dois, como cores de
pelagem). Quando tais atributos so combinados com frequncias podem ser tratados
estatisticamente. Outras alternativas so a transformao em variveis de medida (por
exemplo cores podem-se traduzir em comprimentos de onda), ou em variveis ordenadas (por
exemplo as variveis qualitativa juvenil, subadulto e adulto podem ser codificadas em 1,2 e 3).

1.4. Como Coletar Dados?


As amostras que obtemos para a nossa pesquisa cientfica so os nossos dados, a informao-
chave para o trabalho de qualquer pesquisador. Um dos maiores erros em Ecologia (tanto por
pesquisadores jniores como pelos sniores) dedicar pouco ou mesmo nenhum tempo a
discutir, aprender, e ensinar tcnicas de coleta, de arquivamento e de manejo de dados. Isto
um erro crucial, dado que na maioria dos casos, a recolha de dados de campo em Ecologia
extremamente rdua e custosa, tanto logstica como monetariamente. essencial que os
eclogos tratem dos seus dados tendo em mente que a informao que coletamos
proveniente de dinheiro investido em cincia (que poderia ser dedicado a outras causas, como
combater a fome e a pobreza), e que deve se credvel (ou estaremos a enganar os leitores das
nossas publicaes cientficas).

Abaixo descrevo alguns passos bsicos e essenciais para uma boa coleta e armazenamento de
dados (adaptado de Magnusson & Mouro, 2003):

1. Antes de coletar os dados que sero estudados, determine quais so os objetos de


estudo (varivel de interesse, por exemplo 30 indivduos de 3 espcies) e quais so os
atributos (varivel que quer relacionar com seu objeto de estudo, por exemplo
espcie, ou peso dos indivduos amostrados). Ao organizar os dados numa tabela os
objetos devem ser SEMPRE as linhas e os atributos devem ser SEMPRE as colunas.
NUNCA se devem sumarizar os dados originais. Se o seu objeto (sua varivel de
interesse, seu objeto de estudo) no est individualizada em cada linha da sua tabela,
alguma coisa est errada, o mesmo relativamente ao uso das colunas para cada
atributo ().
2. Cada objeto deve ter um identificador nico, que no se repete nunca. Este pode ser
um nmero, um nome, um cdigo, ou uma combinao de atributos, desde que nunca
se repita.
3. Ao criar a tabela, deve-se definir claramente que tipo de dado vai ser digitado em cada
coluna da tabela (p.ex. caracteres numricos, alfanumricos, ou de data). Isso vai
ajudar a evitar erros de digitao.
4. Devem-se conferir os dados aps a digitao. Preferencialmente, isso deve ser feito
por 2 pessoas, 1 lendo e a outra conferindo.
5. Defina claramente o que o nome de cada atributo significa, inclusive especificando as
unidades de medida e o tipo de dado.
6. Na tabela para recolha de dados que leva para o campo devem ser preenchidas
algumas informaes adicionais importantes como atributos/colunas, como por
exemplo:
a) Quem recolhe a amostra e quem digita
b) Local
c) Data
d) Condies meteorolgicas
1.5. Pseudoreplicao
Imaginem que um pesquisador quer determinar se a degradao de habitats na Amaznia
maranhense influencia a densidade de peixes de uma determinada espcie. E se o nosso
bilogo, para resolver esta questo, amostrasse cinco seces de um riacho no degradado e
cinco seces de um riacho degradado? Todas as seces do riacho no degradado poderiam
ter menos peixes porque este era um riacho menos produtivo, ou porque os peixes desse
riacho tinham sofrido grande mortalidade por terem sido alvos de um fungo parasita, ou
mltiplos fatores que podem at ser alheios degradao de habitat. Neste caso, a
observao da densidade de peixes num sector de um riacho no independente da
observao da densidade de peixes noutro sector desse riacho. Deste modo, as 5 observaes
de densidades em cada riacho, no nos do mais informao do que uma nica observao!!!

Seria errado o nosso Bilogo apresentar o grfico da esquerda na Figura 2, o correto seria
apresentar o grfico da direita (este grfico foi criado no R, para verem o script utilizado para a
sua criao consultem o Anexo 1).

Com Pseudoreplicao Sem Pseudoreplicao


10

8
densidade

degradado no degradado degradado no degradado

habitat

Figura 2

A pseudoreplicao (tambm chamada pseudo-repetio), um erro muito grave que tem


vindo a ocorrer em anlises ecolgicas. Em estatstica, repeties so imperativamente
consideradas observaes independentes. A pseudoreplicao significa uma falsa replicao
das nossas observaes individuais, o que leva a que estas no possam ser consideradas
independentes. Observaes no independentes tendem a fornecer a mesma informao,
fazendo com que o aumento do nmero de observaes no se reflita num aumento da
informao disponvel sobre o fenmeno de estudo. Inadvertidamente, muitos eclogos
possuem problemas de pseudoreplicao nos seus dados, o que faz com que estes acreditem
que tm mais informao do que a que realmente possuem.

No caso do nosso bilogo da Amaznia Maranhense, faria sentido alterar o plano de coleta de
dados. Uma possibilidade era amostrar uma seco de cinco riachos em zonas degradadas e
uma seco de cinco riachos em zonas no-degradadas.
O nosso exemplo de pseudoreplicao espacial, mas tambm existe pseudoreplicao
temporal, filogentica, ou tcnica (para mais informaes por favor consultem Hurlbert, 1984).
Referncias
Hurlbert, S. H. (1984). Pseudoreplication and the Design of Ecological Field Experiments.

Ecological Monographs, 54(2), 187211. http://doi.org/10.2307/1942661

Magnusson, W. E., & Mouro, G. de M. (2003). Estatstica sem matemtica: a ligao entre as

questes e as anlises. E. Rodrigues.

Sokal, R. R., & Rohlf, F. J. (1987). Introduction to Biostatistics (2 Sub edition). New York: W.H.

Freeman & Company.

12
Anexo 1 Script do R para o Grfico da Figura 2

# vou assumir que o bilogo coletou 5 amostras de densidade de


peixes num habitat no degradado e outras 5 amostras num habitat
degradado

# o conjunto de amostras do habitat no degradado e degradado


foram respectivamente {1,2,4,5,6} e {5,7,8,9,10}

# para construir o meu grfico, preciso de definir 3 variveis

# a varivel pseudoreplicao" (se o investigador comete ou no


o erro da pseudoreplicao),

(pseudoreplicao<-c(rep("Com Pseudoreplicao",10),rep("Sem
Pseudoreplicao",2)))

# a varivel habitat, que o habitat onde so recolhidas as


amostras (5x no degradado + 5 x degradado para as amostras com
pseudoreplicao: e apenas 1 x no degradado + 1x degradado para
as amostras sem pseudorepetio)

(habitat<-c(rep("no degradado",5),rep("degradado",5),"no
degradado","degradado"))

# a varivel densidade, que a densidade de peixes (os 5


primeiros valores so as densidades em habitats no degradados,
os segundos 5 valores so as densidades em habitats degradados,
e seguidamente as mdias das densidades nos habitats no
degradados e degradados)

(densidade<-
c(1,2,4,5,6,5,7,8,9,10,mean(c(1,2,4,5,6)),mean(c(5,7,8,9,10))))

# agora fao uma tabela com todas as minhas variveis

(Dados<-data.frame(pseudoreplicao,habitat,densidade))

14
#descarrego um pacote do R que far o grfico que eu quero

require(lattice)

#e voil!!!

xyplot(densidade~habitat|pseudoreplicao,data=Dados,scales=list
(tck=c(1,-1),alternating=c(1,1)))
)

Vous aimerez peut-être aussi