Vous êtes sur la page 1sur 57

Introduo

O termo medidas repetidas usado para designar


medidas feitas ou na mesma unidade experimental
ou mesmo indivduo em mais de uma ocasio. ;
Os objetivos da anlise de dados de medidas
repetidas so examinar e comparar tendncias de
respostas sobre o tempo, comparaes de
tratamentos em pocas especficas ou
comparaes de pocas dentro de um tratamento.

Introduo
So freqentemente usadas em pesquisas
cientficas em reas agrcolas, biolgicas, mdicas,
geogrficas, demogrficas dentre outras.
Peso de animais

Curvas de Crescimento;

Podem, tambm, ser tomadas em sequncia


espacial

Introduo
As observaes para cada unidade experimental
devem ser expressas em unidades comparveis;
As observaes devem se distribuir normalmente
com varincia constante entre 2 observaes

dentro de cada unidade experimental;

Introduo
Requer que as unidades experimentais sejam
independentes.
So um tipo de experimento fatorial (tratamento e
poca)

Mtodos de Anlise para Medidas


Repetidas
As respostas de tempos mais prximos so, em geral,

mais fortemente correlacionadas que as de tempos


mais distantes;
Varincias frequentemente mudam com o tempo;
Produzindo uma complicada estrutura de covarincia,
requerendo mtodos especiais de anlise;

Mtodos de Anlise para Medidas


Repetidas
Os mtodos mais comuns;
1- Separar a anlise em perodos de tempo;
2- Anlise de varincia univariada;

3- Anlise univariada e multivariada de variveis

contrastes no tempo;
4- Mtodologia dos Modelos Mistos

Mtodos de Anlise para Medidas


Repetidas
Sero apresentados os quatro mtodos atravs de um

mesmo experimento;
Fonte de Mg sobre a excreo urinria de Mg em cordeiros;
Uma dieta basal de 1275 ppm de Mg

Suplementada com: 0, 700, 1400 ou 2100 ppm Mg (MgSO4) ,

ou;
1400 ppm de Mg de trs fontes fontes comerciais de oxido de
Mg;
Totalizando 7 tratamentos;
Foram utilizados 5 cordeiros (unidade experimental) pra cada
tratamento;

Mtodos de Anlise para Medidas


Repetidas
O Mg urinrio foi medido para os cordeiro em 10 dias

consecutivos;
Para os tratamentos A, B e D foram removidos 1
cordeiro cada (outliers)
No tratamento A, para um cordeiro, a medida do dia 7
foi removida

Mtodos de Anlise para Medidas


Repetidas
Os mtodos de anlise estatstica ilustrados neste

trabalho enfocam comparaes de tratamentos em


tempos especficos, calculando a mdia sobre
tratamentos comparados ao longo do tempo, e;
Sobre as alteraes ao longo do tempo em tratamentos
especficos.

Mtodos de Anlise para Medidas


Repetidas
As diferenas entre os tratamentos A e B so calculadas

em momentos especifcos e a mdia calculada ao


docorrer do tempo.
Os erros padro so calculados com base em cada um
dos mtodos de anlise, sempre que possvel
Comparao dos tratamentos A e B ilustram o efeito da
taxa experimental mais baixa de MgSO4;
Entretanto, a escolha da diferena entre A e B foi feita
apenas para fins de comparaes de tratamentos

Mtodos de Anlise para Medidas


Repetidas
Comparaes envolvendo outros tratamentos seriam

implementada de forma semelhante.


Alm disso, as comparaes de perodos so ilustradas
com as diferenas entre as mdias de cada perodo, e a
mdia de todos os perodos subsequentes para o
tratamento D.
Os erros padro so calculados usando cada mtodo de
anlise.
Na maioria dos casos, as declaraes so mostrados no
SAS que produzem cada um dos quatro mtodos de
anlise, e os resultados so resumidos.

Mtodos de Anlise para Medidas


Repetidas
No entanto, a inteno no apresentar instrues

detalhadas sobre a utilizao do SAS e a sua


interpretao. Pelo contrrio, o objetivo apresentar
uma viso geral das metodologias e para ilustrar como
elas so implementadas no Sistema SAS.
Diferentes procedimentos do SAS exigem que o
conjunto de dados seja organizado de forma diferente.

Mtodos de Anlise para Medidas


Repetidas
Anlises separadas por perodos de tempo e o

procedimento GLM REPEATED requerem que os


dados sejam organizados em "modo multivariado."
Ou seja, h uma coluna para cada unidade
experimental no conjunto de dados, e as medidas em
cada tempo so consideradas variveis repostas
separadas;
A medida para o tempo 1 EXC1, para o tempo 2
EXC2, e assim por diante.

Mtodos de Anlise para Medidas


Repetidas
A anlise de varincia univariada pelos procedimentos

ANOVA e MIXED exigem que os dados sejam


organizados em "modo univariado", ou seja, uma
coluna por unidade experimental, em cada perodo,
com todas as medies Mg urinrio inseridas como
valores de uma varivel chamada EXC.

Mtodos de Anlise para Medidas


Repetidas
Os resultados mostram que os teores de Mg urinrio

tendem a aumentar ao longo dos 10 dias, exceto para A,


mas tendem a estabilizar do 2 ao 4 dia;
Os tratamentos B, C, D (fonte de sulfato) mostram
aumento do Mg urinrio correpondente ao aumento
de Mg na dieta;
Para os tratamentos E, F e G (fontes de xido)
mostram Mg urinrio inferior do que para o mesmo
nvel (1.400 ppm) na dieta de Mg na fonte de sulfato.

Anlise em Pontos Individuais no


Tempo
Analisa os efeitos de tratamento separadamente em

observaes individuais e no faz comparaes


estatstica entre os perodos;
Nenhuma inferncia realizada sobre as tendncias ao
longo do tempo, de modo que este mtodo no
verdadeiramente
Geralmente usado em uma fase preliminar da anlise
dos dados e no um mtodo preferido para a
publicao final, porque no aborda os efeitos do
tempo em uma anlise de medidas repetidas.

Anlise em Pontos Individuais no


Tempo
demonstraes SAS para obter anlises em cada

momento so:
PROC GLM DATA = SU_MULT;
CLASS TRT;
MODEL EXC1-EXC10 = TRT;
MEANS TRT/LSD;
ESTIMATE trt A - trt B TRT 1 -1 0 0 0 0 0;
RUN;

Anlise em Pontos Individuais no


Tempo
Os resultados esto na Tabela 1, com mdias de cada

tratamento em cada dia, com diferena mnima


significativa LSD para comparar valores de tratamentos em
cada dia. Os valores das mdias e LSD so obtidos a partir
da afirmao em [1]. A declarao ESTIMATE [1] calcula a
diferena entre as mdias para os tratamentos A e B, em
cada dia, com erros padro, que tambm so apresentados
na Tabela 1. Similares declaraes em ESTIMATE poderiam
ser usadas para calcular as diferenas entre as mdias para
todos os tratamentos, ou combinaes de tratamentos.
Estes valores LSD e erros padro das estimativas so vlidos
porque eles envolvem apenas os dados no mesmo tempo.

Anlise em Pontos Individuais no


Tempo

Anlise de varincia univariada,


utilizando o PROC GLM
o mtodo, comumente, mais aplicado para dados

com medidas repetidas,


Faz comparaes entre os tempos.
Ele trata os dados como se fossem um esquema de
parcelas subdivididas
com os animais como parcelas de todas as unidades e
os animais em pocas especficas como unidades de
sub-parcelas.

Anlise de varincia univariada,


utilizando o PROC GLM
Caso as medidas tenham varincia igual em todos os

perodos, e se os pares de medidas no mesmo animal, so


igualmente correlacionadas, independentemente do
intervalo de tempo entre as medidas, ento a anlise de
varincia univariada vlida a partir de um ponto de vista
estatstico, e, de fato, um mtodo ideal de anlise.
A condio necessria para a validade dos testes ANOVA

univariada a chamada condio Huynh-Feldt (Huynh e


Feldt, 1970), que matematicamente menos rigorosas do
que as varincias e covarincias iguais.

Anlise de varincia univariada,


utilizando o PROC GLM
No entanto, as medidas prximas no tempo so

frequentemente mais altamente correlacionadas do


que medidas distantes no tempo, o que invalidar
testes sobre os efeitos que envolvem tempo.
No presente exemplo, testes para DAY e para interao
TRT*DIA so invlidas, pois os dados no cumprem os
pressupostos H-F.

A anlise de varincia univariada obtido a partir PROC

GLM
com as seguintes afirmaes:

PROC GLM DATA = SU_UNI;


CLASS TRT PEN DAY;
MODEL EXC = TRT PEN(TRT) DAY TRT*DAY;
RANDOM PEN(TRT)/TEST;
LSMEANS TRT/STDERR E = PEN(TRT);
LSMEANS TRT*DAY/PDIFF;
RUN;
[2]

Observe que a verso univariada do conjunto de dados utilizada. A declarao MODEL especifica as
fontes de variao para a anlise de varincia. A declarao RANDOM produz um quadro de
esperanas dos quadrados mdios que, em um experimento em parcelas subdivididas verdadeiro,
pode ser usado para determinar denominadores adequados de estatstica-F para todos os termos da
declarao MODEL. Esses testes so produzidos pela opo TEST no final da declarao RANDOM.
Na sada completa das declaraes [2], no mostrado. Em vez disso, os resultados parciais so
resumidos na ANOVA na Tabela 2. Neste caso, uma adequada (embora no exatamente por causa da
falta de referncia de tratamento d 7 A) estatstica de teste para TRT F = MS [TRT] / MS [PEN
(TRT)].
Testes sobre os efeitos para DIA e TRT*DIA usam a estatstica-F com MS[ERROR] para
denominador quadrado mdio. Estes testes no so vlidas porque os dados no satisfazem a
condio de HF. A declarao LSMEAN primeiro calcula mdias de cada tratamento, em mdia, em
dias, com erros padro. Depois, a declarao LSMEANS calcula mdias para combinaes de
tratamentos e dias, com erros padro. Os resultados parciais das declaraes LSMEANS so
apresentados na Tabela 3.
Alm dos potenciais problemas de validade estatstica com a anlise de varincia univariada
de medidas repetidas, h lacunas em potencial com recursos do procedimento GLM. A declarao
LSMEANS no PROC GLM no considera correo para os erros padro para as medias de TRT*DIA,
mesmo se a estrutura de correlao de medidas repetidas no um problema, ou seja, mesmo que os
desvios so iguais e correlaes so iguais. Alm disso, comparaes de LSMEANS entre os
tratamentos em dias especficos (no mostrada) no so vlidos devido a erros de clculo dos errospadro das diferenas. Mais detalhes sobre estes problemas apresentado em Littell et al. (1996).

Anlise para contrastes Variveis


usando o procedimento GLM
REPEATED
Contrastes variveis em dados com medidas repetidas

so combinaes lineares de respostas sobre o tempo


para animais;
Um exemplo pelos polinmios ortogonais (Snedecor e
Cochran, 1980), que representam as tendncias linear,
quadrtica, cbica, etc, ao longo do tempo.

Outro exemplo o conjunto de diferenas entre as

respostas nos perodos consecutivos do tempo, isto ,


as mudanas do tempo 1 para tempo 2, tempo de 2 a
tempo 3, e assim por diante.
Um conjunto de variveis de contraste pode ser usado
para analisar as tendncias ao longo do tempo e fazer
comparaes entre os tempos em dados de medidas
repetidas. Os dados originais de medidas repetidas
para cada animal, so transformados em um novo
conjunto de variveis dado por um conjunto contrastes
variveis.

Em seguida, as anlises multivariadas e univariadas podem

ser aplicadas a estas novas variveis. Isto fornece um


mtodo para anlise de dados de medidas repetidas que
foge de alguns dos problemas da estrutura de covarincia
que invalida a anlise univariada ANOVA, como discutido
na seo anterior. A declarao REPEATED no GLM
fornece clculo automtico e anlises para diversas escolhas
comuns das variveis de contraste. Os dados devem estar
em um modo multivariado para uso da instruo GLM
REPEATED. Por exemplo, suponha que TRT a varivel que
indica os grupos de tratamento e que existem medies
feitas em 10 pontos no tempo, entram no conjunto de
dados como Y1, Y2, ... Y10. Declaraes genricas GLM so:

PROC GLM DATA = MULT;


CLASS TRT;
MODEL Y1-Y10 = TRT;

REPEATED TIME <type of contrast> / <options>;

Note que o perodo" no uma varivel no conjunto

de dados SAS chamado MULT. Pelo contrrio, apenas


um nome ligado ao conjunto de contrastes a ser
analisado. Alm disso, a declarao MODEL em [3] o
mesmo que a declarao MODEL em [1]; "TRT" o
nico efeito listado. Selees para "tipo de contraste"
esto listados no SAS (1989). Deve-se ressaltar que os
apenas animais com os dados em todos os dias so
utilizados nas anlises da instruo REPEATED.

Van Ravenswaay et al. (1992) usaram comparaes de Mg urinrio a

cada dia com a mdia de dias subseqentes para avaliar quando Mg


urinrio atingiram um plat, isto , deixou de aumentar
significativamente. A opo HELMERT na declarao REPEATED
fornece contrastes deste tipo. Os contrastes de Helmert sero usados
com os dados de exemplo para ilustrar a anlise dos contrastes da
varivel tempo com a declarao REPEATED. Demonstraes SAS para
a obteno desses resultados so:
PROC GLM DATA=SU_MULT;
CLASS TRT;
MODEL EXC1-EXC10 = TRT;
REPEATED DAY HELMERT / SUMMARY;
RUN;
[4]

A declarao REPEATED produz resultados de vrios

mtodos estatsticos para obter testes sobre os efeitos que


envolvem DAY. A sada parcial da declarao REPEATED
em [4], resumida na Tabela 4, mostrando P-valores para
cinco testes estatsticos para os efeitos DAY e TRT*DIA.
Dois testes multivariados so mostradas (caracterstica de
Pillai e maior raiz de Roy), embora a declarao REPEATED
realmente produza quatro testes multivariados. Resultados
de dois testes no mostraram concordncia a cerca da
caractersticas de Pillai. Se houvesse o mesmo nmero de
animais por tratamento e no houvessem dados em falta
em qualquer animal, todos os quatro testes multivariados
teriam resultados iguais.

Todas as cinco estatsticas de teste para o dia na Tabela 4 mostram

efeitos significativos do DAY (P = 0,0001). Este no um ponto de


discrdia. No entanto, h discordncia nos resultados para TRT*DIA.
O trao de Pillai encontra TRT*DIA no significativa (P = 0,3361),
enquanto a maior raiz de Roy declara TRT*DIA altamente significativa
(P = 0,0013).
Discrepncias como esta so explicveis, mas so ocorrncias comuns
para estes dois testes multivariados.
O REPEATED tambm produz os testes que so ajustes para o p-valor
para a ANOVA univariada. Eles so mostrados na Tabela 4.
(Se todos os animais apresentaram dados completos, os resultados da
anlise univariada ANOVA na Tabela 4 concordaria exatamente com
aqueles na Tabela 2.) Com base em nossas experincias, ns preferimos
o GG ajustado P-valor, em vez de os testes multivariados.

Outros resultados da instruo REPEATED em [4] so apresentados na Tabela 5. O rtulo DAY.1 se


refere a uma diferena entre a resposta EXC1 em d1 e a mdia das respostas em EXC2 no d 2 a EXC10
no d 10.
Ou seja, DAY.1 = EXC1 - (EXC2 + ... + EXC10) / 9. Da mesma forma, DAY.2 refere-se a EXC2 - (EXC3 +
... +EXC10) / 8, e assim por diante.
A declarao REPEATED do PROC GLM serve para calcular uma ANOVA para cada uma das variveis
contraste DAY.1 at DAY.9.
A ANOVA para DAY.1 mostra que tratamentos so significativamente diferentes (P = 0,0022), o que
significa que a diferena entre EXC1 e a mdia de EXC2 at EXC10 no a mesma para todos os
tratamentos.
Na verdade, este um componente da interao entre tratamentos e dias. Os tratamentos no so
significativamente diferentes para as variveis contrastes DAY.2 (P = 0,5228) at DAY.9 (P = 0,3043).
Interpretado pelo valor de face, isto indicaria nenhuma interao entre tratamentos de d 2 a d 10, em
outras palavras, que os perfis para todos os tratamentos so paralelas a partir de d 2 at d 10.
Mas na verificao da Figura 1 indica que os perfis no so todos paralelos. Por exemplo, o perfil para o
tratamento D (fonte sulfato, 2.100 ppm) continua a aumentar na sequncia d 2, mas o perfil para o
tratamento C (fonte sulfato, 1.400 ppm) continua a aumentar no nvel d 2.
Assim, significativo para examinar as tendncias ao longo de dias para os tratamentos
individualmente.

A declarao CONTRAST pode ser utilizada no GLM

para avaliar a significncia das variveis de DAY.1 at


DAY.9 relativo combinaes lineares definidas nas
declaraes CONTRAST.
Na verdade, as combinaes lineares definidas por
uma declarao CONTRAST no tem que ser
"Contrastes", no sentido de que os coeficientes no
tm a acrescentar ao zero. Tal o caso com as seguintes
afirmaes, pois cada declarao CONTRAST
realmente define uma mdia de tratamento:

CONTRAST Trt A INTERCEPT 1 TRT 1 0 0 0 0 0 0;


CONTRAST Trt B INTERCEPT 1 TRT 0 1 0 0 0 0 0;
CONTRAST Trt C INTERCEPT 1 TRT 0 0 1 0 0 0 0;

CONTRAST Trt D INTERCEPT 1 TRT 0 0 0 1 0 0 0;


CONTRAST Trt E INTERCEPT 1 TRT 0 0 0 0 1 0 0;
CONTRAST Trt F INTERCEPT 1 TRT 0 0 0 0 0 1 0;
CONTRAST Trt F INTERCEPT 1 TRT 0 0 0 0 0 0 1;
[5]

A declarao CONTRASTE 'Trt A' define a mdia para o

tratamento de A. Assim, o objetivo da declarao do


CONTRASTE 'Trt A' avaliar se as mdias do DAY.1 at DAY.9 so
diferentes de zero no tratamento A.
Sada para as CONTRAST aparecem em [5], resumidos na Tabela
6. A diferena entre a mdia de d 1 e a mdia de d 2 a 10 (DAY.1)
significativamente diferente de zero para todos os tratamentos,
exceto os tratamentos A (basal, P = 0,5348) e F (xido de 1.400
ppm, P =. 1270).
A diferena entre a mdia de d 2, sendo a mdia de d 3 a d 10
(DAY.2) no significativamente diferente de zero para os
tratamentos A (P = 0,7914), B (P = 0,3115), C (P = 0,4903) e F (P =
0,3287), mas a diferena significativa para os tratamentos D, E e
G no nvel 0,1.

O primeiro dia em que no significativamente diferente

da mdia para os dias subseqentes podem ser


considerados o dia em que a resposta comea a chegar a um
plat.
Estes dias so indicadas na Tabela 1.
A anlises de contraste quando realizadas pela instruo
REPEATED no GLM so vlidas no sentido de que
varincias iguais e correlaes no so necessrias serem
medidas em todos os momentos. Entretanto, os resultados
a partir da declarao REPEATED so testes estatsticos, e
sem capacidade fornecido pelo GLM para o clculo dos
erros padro de comparaes. Alm disso, somente tipos
especficos de comparaes esto disponveis na
procedimento REPEATED

Anlise de modelos mistos usando


o PROC MIXED
Como mencionado acima, a anlise de medidas repetidas de

dados exige uma ateno especial estrutura de covarincia,


devido natureza seqencial dos dados sobre cada animal.
Os procedimentos discutidos anteriormente querem evitar o
problema (anlise das variveis contrastes) ou ignor-lo (anlise
de varincia univariada).
Ignorar problemas de covarincia pode resultar em concluses
incorretas a partir da anlise estatstica.
Evitar os problemas pode resultar em anlises ineficientes, o que
equivale a perder dados. O modelo linear geral misto permite a
capacidade de resolver a questo diretamente com a modelagem
da estrutura de covarincia. Essa capacidade implementada no
mbito do procedimento MIXED do Sistema SAS.

Existem dois passos bsicos para realizar uma anlise

de medidas repetidas usando a metodologia de


modelos mistos.
O primeiro passo modelar a estrutura de covarincia.
O segundo passo analisar a evoluo temporal dos
tratamentos estimando e comparando as mdias.

Introduo
Modelos lineares mistos foram desenvolvidos por

criadores
Para avaliar o potencial gentico de touros;
Os modelo mistos tem sido recentemente utilizada em

diversas reas de pesquisas

Application of mixed models has recently spread to all

areas of research, spurred by availability of advanced


computer software.

Previously, mixed model analyses were implemented

by adapting fixed-effect methods to models with


random effects.
This imposed limitations on applicability because the
covariance structure was not modeled.
This is the case with PROC GLM in the SAS System

Recent versions of the SAS System include PROC

MIXED.
Thereby, PROC MIXED can compute efficient
estimates of fixed effects and valid standard errors of
the estimates.

Introduo
Medidas repetidas, referem-se s respostas mltiplas

tomadas em seqncia em uma mesma unidade


experimental (animal).
Os objetivos da anlise de dados com medidas
repetidas examinar e comparar as tendncias de
resposta ao longo do tempo.
The feature of repeated measures experiments that
requires special attention in data analysis is the
correlation pattern among the responses on the same
animal over time.

So freqentemente usadas em pesquisas cientficas

em reas agrcolas, biolgicas, mdicas, geogrficas,


demogrficas dentre outras.

Methods for Analyzing Repeated


Measures Data
Responses measured on the same animal are

correlated because they contain a common


contribution from the animal.
Special methods of statistical analysis are needed for
repeated measures data because of the covariance
structure

There are several statistical methods used for

analyzing repeated measures data. Ranging from most


basic to most sophisticated, these include
1) separate analyses at each time point,
2) univariate analysis of variance,
3) univariate and multivariate analyses of time contrast
variables, and
4) mixed model methodology.

Separate analyses at each time point do not require

special methods for repeated measures but do not


directly address the objectives of examining and
comparing trends over time.
The other three approaches require special
methodology and software.

Development of statistical methods for repeated

measures data has been an active area of research in


the past two decades because of advancements in
computing hardware and software. Enhancements in
the SAS System (SAS, 1996) reflect the advancements
in methodology and hardware. When the SAS System
became available on a commercial basis in 1976, it
contained the GLM procedure.

This procedure enabled users to perform univariate

analysis of variance but did not provide valid standard


errors for most estimates.

Moreover, conclusions derived from univariate analysis

of variance are often invalid because the methodology


does not adequately address the covariance structure
of repeated measures.
In 1984, the REPEATED statement was added to the
GLM procedure.
However, the tests were inefficient and the problem of
incorrect standard errors remained.

This approach basically bypassed the problems of

covariance structure rather than addressing them


directly. The REPEATED statement enabled users to
obtain statistical tests for effects involving time trends.
However, the tests were inefficient and the problem of
incorrect standard errors remained. In addition,
missing data on even one measure of an animal caused
all the data for that animal to be ignored.

In 1992, the MIXED procedure was released in the SAS

System. It provided capabilities of mixed model


methodology for analysis of repeated measures data.

In 1992, the MIXED procedure was released in the SAS

System. It provided capabilities of mixed model


methodology for analysis of repeated measures data.
Use of mixed model methodology enabled the user to
directly address the covariance structure and greatly
enhanced the users ability to analyze repeated
measures data by providing valid standard errors and
efficient statistical tests. In addition, some missing
measures do not cause all data for an animal to be
ignored.

Vous aimerez peut-être aussi