Vous êtes sur la page 1sur 30

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

ANLISE DE CORRESPONDNCIA CANNICA

NDICE Pgina 1. INTRODUO........................................................................................................2 2. A ANLISE DE CORRESPONDNCIA...............................................................5 2.1. Algoritmo de Gerao da Anlise de Correspondncia....................................7 3. A ANLISE DE CORRESPONDNCIA CANNICA.........................................9 3.1. Algoritmo de Gerao da Anlise de Correspondncia Cannica..................11 3.2. Reduzindo o Nmero de Variveis..................................................................13 3.2.1. Seleo Atravs de Critrios Externos......................................................13 3.2.2. Exame da Estrutura de Correlao............................................................13 3.2.3. Interpretabilidade.......................................................................................13 3.2.4. Anlise de Stepwise ..................................................................................14 3.3. Apresentao e Interpretao dos resultados...................................................14 3.4. Implementando a Anlise de Correspondncia Cannica...............................17 3.4.1. Preparao dos Dados................................................................................17 3.4.2. Execuo da CCA no PC-ORD.................................................................19 3.4.2.1. Opes de Escala da CCA...................................................................19 3.4.2.2. Escalonamento dos Escores de Ordenao.........................................20 3.4.2.3. Escores para os Grficos:....................................................................20 3.4.2.4. Lista de Coeficientes de Correlao para a Matriz Secundria..........20 3.4.2.5. Teste de Monte Carlo..........................................................................20 3.4.3. Resultados da CCA....................................................................................21 3.4.3.1. Relatrio de Interao..........................................................................22 3.4.3.2. Sumrio das Estatsticas dos Eixos.....................................................23 3.4.3.3. Resultados da Regresso Mltipla......................................................23 3.4.3.4. Escores Finais para os Stios e Espcies.............................................25 3.4.3.5. Correlaes e Escores Biplots para as Variveis Ambientais............26 3.4.3.6. Resultados do Teste de Monte Carlo..................................................27 3.4.4. Elaborao dos Grficos de Ordenao....................................................27 4. REFERNCIAS BIBLIOGRFICAS...................................................................29

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

1. INTRODUO A anlise multivariada a rea da anlise estatstica que se preocupa com as relaes entre variveis dependentes. Os mtodos multivariados so poderosos, permitindo ao pesquisador manipular diversas variveis simultaneamente. So, porm, bastantes complexos, tanto na sua estrutura terica como na metodologia operacional. Em alguns casos os testes estatsticos a serem utilizados exigem requisitos muito rgidos e em outros, no apresentam base estatstica terica no havendo, desse modo, possibilidade de testes de significncia. O modelo matemtico no qual os procedimentos estatsticos multivariados so baseados a distribuio normal multivariada. Por sua vez, os dados multivariados apresentam as seguintes caractersticas (WALKER, 2001): Possuem mltiplas fontes de varincia; Podem ter mltiplas dimenses, como, por exemplo, quando lotes de um mesmo tipo de dados so coletados dentro de lotes de mesmas amostras; Temos interesse nas relaes de mais de duas dessas fontes de varincia. Segundo JOHNSON & WICHERN (1988), os mtodos multivariados so mais apropriados quando os objetivos da investigao cientfica incluem: Reduo de dados ou simplificao estrutural: O fenmeno estudado representado de modo mais simples possvel, sem sacrificar informaes valiosas. Espera-se assim, uma interpretao mais fcil; Classificao ou agrupamento: Grupos de objetos ou variveis similares so criados, baseando-se em medidas caractersticas. Alternativamente, regras para classificao de objetos em grupos bem definidos podem ser elaboradas; Investigao de dependncia entre variveis: Neste caso o interesse est na natureza das relaes entre variveis. Todas as variveis so independentes ou, uma ou mais varivel dependente de outras? Sendo dependente, quais so essas variveis? Predio: As relaes entre variveis so determinadas com a finalidade de predizer os valores de uma ou mais variveis, com base nas observaes sobre outras variveis; Construo e teste de hipteses: So testadas hipteses estatsticas especficas, formuladas em termos dos parmetros de populaes multivariadas. Isto pode ser feito para validar pressuposies ou reforar convices assumidas a priori. As principais caractersticas dos mtodos multivariados segundo ORLCI (1978) so: Usam dados multidimensionais nos quais os indivduos so descritos por p-vetores de valores nos quais os elementos so medidas de p variveis. Assume-se que os indivduos na populao so unidades discretas que podem ser reconhecidas sem ambigidade. Assume-se tambm, enquanto permitindo correlaes entre elas, que as variveis so diferentes propriedades mensurveis dos objetos; De modo geral, no associam, a priori, diferentes variveis com diferentes valores de importncia. Se diferente importncia atribuda a diferentes variveis, os dados so manipulados para introduzir diferentes pesos antes da anlise; So concernentes com variveis correlacionadas em um contexto mais amplo. Se as variveis em uma amostra so independentes, nenhuma vantagem real pode ser obtida pela aplicao da anlise multivariada; 2

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Estipulam ou assumem uma forma funcional para as vrias correlaes. Esta forma freqentemente linear, embora existam tcnicas que no restringem a no linearidade. Podem ou no requerer pressuposies cerca da estrutura dos dados. Se um tipo especfico de estrutura de dados assumido, freqentemente a gerada quando a distribuio das variveis normal multivariada; Podem ser considerados paramtricos num contexto mais amplo, pois utilizam medidas reais. Algumas vezes, tambm so paramtricos em termos estatsticos ao assumirem um certo tipo de distribuio de probabilidade nos dados. A distribuio mais freqentemente assumida a distribuio normal p-dimensional; Normalmente assumem que a estrutura dos dados no incorpora a dimenso de tempo; So extremamente consumidores de tempo de processamento. Normalmente, no poderiam ser contemplados sem o acesso a modernos recursos computacionais. A escolha do mtodo de anlise multivariada mais adequado tem sido determinada pela preciso desejada, pela facilidade da anlise, pela forma como os dados foram obtidos e pela natureza dos objetivos a serem alcanados. Assim, por exemplo, a anlise de agrupamento difere da anlise por componentes principais e por variveis cannicas em razo de dependerem fundamentalmente de medidas de dissimilaridade, estimadas previamente, como as distncias euclidianas ou de Mahalanobis, entre outras. Por outro lado, nos mtodos de componentes principais e de anlise cannica, o objetivo avaliar a similaridade dos indivduos por intermdio de uma disperso grfica, em que se consideram, em geral, dois eixos cartesianos (CRUZ, 1990). Neste contexto, PALMER (2001) recomenda os seguintes passos que devem ser seguidos ao se fazer uma anlise multivariada: Definir os objetivos; Determinar a estrutura dos dados: Os dados so multidimensionais? Podem ser reduzidos em poucas variveis? Quais variveis so dependentes, quais so independentes, e quais podem ser ambas, dependendo do contexto?; Determinar quais tipos de medidas se possui: As variveis so mtricas ou no mtricas? Se forem no mtricas, poderiam ser convertidas de alguma maneira em mtricas, ou, se ordinal, tratadas como mtrica? O que se pode ganhar ou perder ao se fazer isto? Determinar se h problemas de suposies ou de modelo com as tcnicas; Decidir qual tcnica se ajusta ao conjunto de dados, pelo menos nominalmente. A Figura 1 apresenta um guia para auxiliar na escolha das tcnicas. Determinar se se deve quebrar o problema em partes suficientemente pequenas: a maioria dos estudos real envolve o uso de diferentes tcnicas em diferentes estgios. Muitas vezes o produto de um pode tornar-se a entrada do prximo.

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Figura 1 - Guia para seleo de tcnicas multivariadas (PALMER, 2001) difcil estabelecer um esquema amplamente aceito de classificao para as tcnicas multivariadas e que ao mesmo tempo indique a adequao de cada uma delas. Uma classificao distingue tcnicas desenhadas para estudar relaes de interdependncia daquelas desenhadas para estudar relaes de dependncia. (JOHNSON & WICHERN 1988). A anlise de dependncia estuda a dependncia de uma ou mais variveis em relao s outras variveis. Consideramos, ento, dois subconjuntos, um no qual as variveis so denominadas independentes e outro em que tratamos das variveis dependentes. Por sua vez, a anlise de interdependncia estuda as relaes de um conjunto de variveis entre si, sem selecionar nenhuma delas em especial, como varivel dependente (KENDALL (1950), citado por FACHEL, 1976). Enquadram-se na anlise de dependncia, por exemplo, a anlise de regresso, a anlise de varincia multivariada, a mltipla contingncia e a anlise discriminante; enquanto na anlise de interdependncia, salientando-se apenas o carter de interdependncia das variveis, que se enquadram as tcnicas de Cluster Anlise ou Anlise de Agrupamento, Componentes Principais, Correlaes Cannicas, Anlise Fatorial e Escala. Outra maneira de se classificar as tcnicas multivariadas colocar cada procedimento em um quadrante de um lattice de acordo com a quantidade de conjuntos de variveis e de populaes que so includas no desenho, conforme ilustrado na Figura 2. GAUCH (1982) classifica as tcnicas multivariadas, de acordo com o uso em estudos de ecologia de comunidades, em trs grupos diferentes: Anlise Direta de Gradiente; Classificao e Ordenao. A anlise direta de gradiente utiliza procedimentos grficos simples para reduzir e revelar a estrutura dos dados multivariados. usada para estudar a distribuio de espcies ao longo de gradientes ambientais conhecidos e facilmente medidos. A classificao basicamente envolve o agrupamento de entidades similares em grupos ou clusters, sendo que esses grupos podem ou no ser arranjados hierarquicamente.

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Os mtodos de ordenao consistem basicamente em sintetizar, em um grfico com eixos perpendiculares (eixos de ordenao) entre si, a variao multidimensional dos dados a serem estudados. O termo ordenao significa, para os biologistas, essencialmente o mesmo que escala significa para o cientista social. Ambas palavras descrevem o processo de produo de um pequeno nmero de variveis que pode ser usado para descrever a relao entre um grupo de objetos iniciando ou por uma matriz de distncias ou similaridades entre os objetos, ou a partir de valores de um grande nmero de variveis medidas sobre cada objeto (MANLY, 1994).
POPULAES Uma Populao Duas ou Mais Populaes

Componentes Principais Um Conjunto Anlise Fatorial V ar i v ei s Q1 Polinomial Dois ou trs conjuntos Correlao Mltipla Q3 Q2 Q4

Anlise de Varincia Multivariada Funes Discriminantes Funes de Classificao

Covarincia Multivariada Correlao Cannica Correlao parcial mltipla

Figura 2 - Classificao dos procedimentos multivariados (COOLEY & LOHNES, 1971) O objetivo deste trabalho apresentar os principais aspectos da anlise de correspondncia cannica, uma tcnica de ordenao usada principalmente em pesquisas ecolgicas para estudar as relaes espcies-ambientes.

2. A ANLISE DE CORRESPONDNCIA A anlise de gradiente indireto uma tcnica multivariada que tem se mostrado eficiente na identificao de gradientes ambientais em comunidades vegetais. Atravs de uma 5

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

tcnica de ordenao, so extrados, dos dados de espcies, os padres dominantes de variao na composio da comunidade e, como resultado, as espcies e unidades amostrais so arranjadas em um diagrama de maneira que entidades similares se mostram prximas e as dissimilares apresentam-se separadas. Em um segundo momento, feita uma tentativa de correlacionar estes padres, isto , os primeiros eixos de ordenao, com as variveis ambientais, ou seja, a correlao espcie/ambiente estabelecida em um segundo momento, de forma indireta. Destas tcnicas de ordenao, as mais conhecidas so a anlise de componente principal e a anlise de correspondncia (CA). A primeira um mtodo linear, em que os escores de espcies resultantes so os valores de inclinao das retas geradas. Diferentemente, a anlise de correspondncia se baseia em mdias recprocas em que as curvas de resposta so unimodais e os escores de espcies podem ser considerados como centro, ou o timo da curva (GAUCH, 1982). A anlise de correspondncia (CA), que atualmente tem sido a tcnica mais utilizada para identificar gradientes ambientais, foi proposta por HILL (1973). um mtodo de construo de eixos contra os quais so plotados, simultaneamente, os objetos de interesse e as caractersticas que so usadas para descrever os objetos iniciando com dados sobre a abundncia de cada uma das caractersticas para cada um dos objetos. Ela til em ecologia, por exemplo, onde os objetos de interesse so stios diferentes, as caractersticas so diferentes espcies, e os dados consistem de abundncia das espcies em amostras tomadas em cada um dos stios. A finalidade da anlise de correspondncia poderia ser ento clarear as relaes entre os stios, expressas pelas distribuies das espcies, e as relaes entre as espcies expressas pelas distribuies dos stios (MANLY, 1994) . Inicia-se com dados tabulares, normalmente de dupla entrada, entretanto a tcnica generalizvel a tabelas de n-entradas com mais de duas variveis. As variveis devem ser discretas: variveis nominais, ordinais, ou contnuas segmentadas em faixas. A tcnica define uma medida de distncia entre dois pontos, onde pontos so os valores (categorias) das variveis discretas. Desde que distncia um tipo de medida de associao (correlao), a matriz de distncia pode ser o imput para a anlise de componentes principais, da mesma maneira que as matrizes de correlao podem ser o imput para a anlise fatorial convencional. Porm, onde a anlise fatorial convencional determina quais variveis se agrupam entre si, a anlise de correspondncia determina quais valores de categoria esto mais prximos. Isto visualizado no mapa de correspondncia que plota os pontos (categorias) ao longo dos eixos fatoriais computados. A CA uma tcnica que constri uma varivel terica que melhor explica os dados das espcies. Isto feito atravs da escolha dos melhores valores para os stios, isto , valores que maximizam a disperso dos escores das espcies. Esta varivel terica chamada de primeiro eixo de ordenao da CA ou, primeiro eixo da CA, e seus valores so os escores do stio no primeiro eixo da CA. Um segundo eixo e outros mais tambm podem ser construdos, com a inteno de se obter informaes adicionais s obtidas com o primeiro eixo. Esses eixos tambm maximizam a disperso dos escores das espcies mas sujeito restrio de serem no correlacionados com os eixos anteriores. Esta restrio visa garantir que a nova informao seja expressa sobre os eixos anteriores. Na prtica desejamos poucos eixos na esperana que representem a maioria da variao dos dados de espcies (TER BRAAK, 1995).

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

2.1. Algoritmo de Gerao da Anlise de Correspondncia A CA tambm conhecida por reciprocal averaging, quando utiliza dados de ausncia/presena, e weighted averaging, quando utiliza dados de abundncia. Pode ser gerada por um algoritmo de ordenao interativo (GAUCH, 1982), cujo sumrio apresentado na Tabela 1. O algoritmo ir ser explicado no contexto da ordenao de n stios com base na abundncia de p espcies, porm ele pode ser usado igualmente bem com dados que podem ser representados como uma tabela de dupla entrada de medidas de abundncia, com as linhas correspondendo a um tipo de classificao e as colunas a um segundo tipo de classificao. Considerando yki a abundncia das espcies k no stio i, xi o escore do stio i , e k os escores das espcies, parte-se de valores de escores dos stios (amostras) arbitrrios e obtm-se escores de espcies atravs da seguinte equao:

k = yki xi / yki Equao 1


i =1 i =1

Em seguida, novos escores dos stios so obtidos, pela Equao 2 abaixo, utilizandose dos escores das espcies gerados anteriormente. Novos escores de espcies so ento derivados, e assim sucessivamente. xi = yki k / yki Equao 2
k =1 k =1 m m

Ao tomarmos mdias sucessivas, a faixa dos escores vai se tornando cada vez menor, a cada interao. Assim necessrio que se faa um re-escalonamento (padronizao) dos escores das espcies e dos stios, o que pode ser feito de vrias maneiras. No procedimento de padronizao utilizado neste algoritmo os escores dos stios so padronizados para mdia 0 e varincia 1. Sendo os escores dos stios padronizados, a disperso dos escores das espcies pode ser escrita como:

= yk + k 2 / y+ + , Equao 3
k =1

Onde, yk + abundncia total da espcie k; e y+ + o total global.

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Tabela 1: Algoritmo de Gerao da Anlise de Correspondncia (TER BRAAK., 1995) Processo Interativo: Passo 1: Atribua diferentes valores arbitrrios para os escores (valores) dos stios ( xi ); Passo 2: Calcule novos escores para as espcies ( k ), atravs das mdias ponderadas dos escores dos stios (Equao 1); Passo 3: Calcule novos escores para os stios ( xi ), atravs das mdias ponderadas dos escores das espcies (Equao 2); Passo 4: Para o primeiro eixo, v para o passo 5. Para o segundo e demais eixos, transforme os escores dos stios em escores no correlacionados com os eixos anteriores atravs do procedimento de Ortogonolizao descrito a seguir; Passo 5: Padronize os escores dos stios ( xi ); Passo 6: Pare quando atingir a convergncia, isto , quando os novos escores dos stios forem suficientemente prximos dos escores dos stios do ciclo de interao anterior. Caso contrrio volte ao passo 2. Procedimento de Ortogonolizao Passo 4.1. Denote os escores dos stios dos eixos anteriores de f i , e os escores do eixo atual por xi ; Passo 4.2. Calcule v = y+ i xi f i / y+ + onde y+ i = yki e y+ + = y+ i ;
i =1 k =1 i =1 n m n

Passo 4.3. Calcule xi , new = xi , old vf i ; Passo 4.4. Repita os passos 4.1 a 4.3 para todos os eixos anteriores. Procedimento de Padronizao Passo 5.1. Calcule o centride, z, dos escores dos stios ( xi ) z = y+ i xi / y+ + ;
i =1 2 Passo 5.2. Calcule a disperso dos escores dos stios s = y+ i ( xi z ) / y+ + ; 2 n n

Passo 5.3. Calcule xi , new = ( xi , old z ) / s .

i =1

Note que aps a convergncia, s igual ao autovalor.

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Em cada ciclo de interao a disperso ir aumentar fortemente, at se aproximar ao seu valor mximo (aproximadamente 10 ciclos). Os escores das espcies e dos stios se estabilizam ao mesmo tempo. Os escores resultantes tm a disperso mxima e ento se constituem no primeiro eixo da CA. Um segundo eixo de ordenao pode ser extrado atravs do mesmo procedimento interativo, com um passo adicional no qual os escores para o segundo eixo so transformados para serem no correlacionados com os escores do primeiro eixo. Isto obtido atravs do procedimento de Ortogonolizao descrito na Tabela 1. Um terceiro eixo tambm pode ser derivado do mesmo modo, tornando os escores no correlacionados com os escores dos primeiros dois eixos, e assim sucessivamente. Os eixos de ordenao da CA so denominados autovetores. Cada autovetor possui um autovalor correspondente, normalmente denominado de . O autovalor representa a disperso mxima dos escores das espcies nos eixos de ordenao, sendo portanto, a medida de importncia dos eixos de ordenao. O primeiro eixo de ordenao possui o autovalor mais alto ( 1 ), o segundo eixo o segundo mais alto autovalor ( 2 ), e assim sucessivamente. Todos os autovalores da CA possuem valores entre 0 e 1. Valores acima de 0,5 freqentemente indicam uma boa separao das espcies ao longo do eixo. A CA no pode ser aplicada quando os dados contm valores negativos, uma vez que os dados no poderiam ser padronizados ou centrados. A interpretao do diagrama de ordenao feita com o auxlio de dados externos, por exemplo, pelo clculo dos coeficientes de regresso entre variveis ambientais e eixos de ordenao, ou por regresso mltipla dos eixos de ordenao sobre as variveis ambientais. Se as variveis ambientais mensuradas relacionam-se fortemente com os primeiros eixos de ordenao, estes ltimos podem explicar (isto , eles so suficientes para predizer) a principal parte da variao da composio das espcies. Se as variveis ambientais no se relacionam fortemente com os primeiros eixos, estes podem no explicar a principal parte da variao, mas eles podem explicar um pouco da variao remanescente, que pode ser substancial. Ainda, a anlise de gradiente indireto pode detectar os efeitos de um subconjunto de variveis ambientais em que uma particularmente importante na composio da comunidade (CARLETON, 1984). 3. A ANLISE DE CORRESPONDNCIA CANNICA Em muitos casos desejamos avaliar as relaes entre dois grupos de variveis: o primeiro grupo consiste de variveis dependentes mltiplas de interesse direto; e o segundo composto de variveis que supostamente influenciam as variveis do primeiro grupo. Sendo que, os objetivos principais desejados so determinar quais variveis dependentes, ou suas combinaes, so mais influenciadas e estimar os efeitos das variveis explanatrias, ou suas combinaes, que mais influenciam o grupo de variveis resultantes de interesse. Enquanto os modelos lineares multivariveis (regresso multivariada, ou anlise de varincia mltipla MANOVA) podem obter o segundo objetivo, mas no o primeiro, os mtodos multivariados que no consideram as relaes assimtricas entre os grupos de variveis explanatrias e resultantes, tais como anlise de correlaes cannicas, no podem obter o segundo objetivo. Assim, para se alcanar os dois objetivos simultaneamente podemos utilizar a anlise de correspondncia cannica - CCA (FAYE et.al., 1997). 9

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

A CCA uma tcnica de anlise de gradiente direto baseada na CA, em que os eixos interpretativos so obtidos dentro do algoritmo interativo de ordenao usando um conjunto de variveis ambientais. Na realidade, uma ordenao que considera a restrio extra de que os eixos de ordenao sejam combinaes lineares de variveis ambientais (MANLY, 1994). Existe certa confuso entre anlise de correspondncia cannica e a anlise de correlao cannica que tambm freqentemente abreviada como CCA. A anlise de correlao cannica se assemelha anlise de correspondncia cannica no fato que ambas buscam as relaes entre dois conjuntos de dados multivariados (por exemplo, um conjunto de dados ambientais e um conjunto de dados relativos abundncia de espcie). Porm, a anlise de correlao cannica assume respostas lineares para as variveis ambientais. O que improvvel na natureza. Por sua vez a anlise de correspondncia cannica, como outros mtodos de anlise de correspondncia, assume de forma mais razovel uma curva de resposta unimodal (TER BRAAK e PRENTICE, 1988). A CCA tem sido usada principalmente em pesquisas ecolgicas para estudar as relaes espcies-ambientes. Nesses estudos, dois conjuntos de dados so analisados simultaneamente: o primeiro contm a ocorrncia de diferentes espcies e animais; e o segundo descreve as condies ambientais. A aplicao dessa tcnica tem demonstrado ser uma importante ferramenta na identificao das relaes espcie - ambiente, permitindo inclusive classificar espcies em termos de suas preferncias quanto ao habitat (OLIVEIRA FILHO et al., 1994 a; OLIVEIRA FILHO et al., 1994 b; SMITH, 1995; OLIVEIRA FILHO et al., 1996), alm de investigar questes especficas sobre a resposta de espcies s caractersticas ambientais (JOSE et al., 1996). Como exemplos recentes de utilizao desta tcnica citam-se os trabalhos de BALDUINO (2001), que detectou atravs da anlise de correspondncia cannica um padro de variao de densidade de espcies de uma rea de cerrado stricto sensu em Paraopeba MG, influenciado por algumas caractersticas edficas, que responderam por 64,9% da variao existente nos dados de vegetao; e PEREIRA (1998), que utilizou a anlise de correspondncia cannica para detectar as variveis ambientais mais correlacionadas com a distribuio de ocorrncia de espcies de formigas cortadeiras em plantios de eucalipto no estado de Minas Gerais. A maior vantagem da CCA sobre todos os outros mtodos de anlise multivariada admitir um teste de significncia das variveis ambientais na determinao dos padres ambientais, atravs do teste de Monte Carlo (HOPE, 1968, citado por TER BRAAK, 1988), testando os eixos associados com as variveis usando os autovalores como teste estatstico (SMITH, 1995). Na anlise de correspondncia cannica, a variao da comunidade pode ser diretamente relacionada variao ambiental, uma vez que os eixos de ordenao so escolhidos luz do conhecimento das variveis, por impor a restrio de que os eixos so combinaes lineares das variveis ambientais (TER BRAAK, 1986). A CCA usada para analisar questes especficas sobre as respostas das espcies e unidades amostrais s variveis ambientais. Assim, ao contrrio de outras tcnicas de ordenao, possibilita uma anlise direta de gradientes (TER BRAAK, 1987).

10

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

3.1. Algoritmo de Gerao da Anlise de Correspondncia Cannica A CCA uma tcnica que seleciona a combinao linear das variveis ambientais (Equao 4) que maximiza a disperso dos escores das espcies (TER BRAAK, 1987). Em outras palavras, CCA escolhe os melhores pesos (cj) para as variveis ambientais. xi = c0 + c1 z1i + c2 z2i + + cq zqi Equao 4 Onde, zi o valor da varivel ambiental j no stio i; c j o peso (no necessariamente positivo) pertencente quela varivel; xi o valor resultante da varivel ambiental composta do stio i. O segundo e demais eixos da CCA tambm selecionam combinaes lineares das variveis ambientais que maximizam a disperso dos escores das espcies, mas sujeito restrio de serem no correlacionados com os eixos anteriores. Podem ser obtidos tantos eixos quanto forem o nmero de variveis ambientais. Incorporando, no algoritmo da CA descrito anteriormente, a restrio de que os escores dos stios devem ser restritos combinaes lineares das variveis ambientais medidas (Equao 4) obtemos um algoritmo para a CCA. Mais precisamente em cada ciclo de interao, uma regresso mltipla deve ser elaborada para os escores dos stios, obtidos no Passo 3, em funo das variveis ambientais (por razes tcnicas tomamos y+ i / y+ + como peso dos stios). Os valores obtidos desta regresso so por definio uma combinao linear das variveis ambientais (Equao 4) e so ento os novos escores dos stios para continuar no Passo 4. Como na CA, os escores se estabilizam aps vrias interaes e os escores resultantes constituem num eixo de ordenao da CCA. O autovalor ( ) correspondente igual disperso (maximizada) dos escores das espcies ao longo do eixo. Os parmetros da regresso final no processo de interao so os melhores pesos, e so chamados de coeficientes cannicos, e a correlao mltipla desta regresso chamada de correlao espcies-ambiente. Esta correlao uma medida da associao entre espcies e ambiente, mas no a ideal. A importncia da associao melhor expressada pelo autovalor ( ), porque este mede o quanto da variao nos dados das espcies explicado pelo eixo e, conseqentemente, pelas variveis ambientais. O algoritmo para a soluo da CCA pode ento ser resumido conforme a Tabela 2, sendo apresentado na forma matricial, de acordo com a seguinte legenda: b = u, vetor m contendo os escores das espcies k (k=1,...,m); Y = { yki }, matriz m x n contendo os dados de m espcies (linhas da matriz) e n stios (colunas da matriz); M = diag ( yk + ), matriz diagonal m x n contendo os totais das linhas de Y; N = diag ( y+ i ), uma matriz diagonal m x n contendo os totais das colunas de Y; Z = matriz q x n na qual a j-sima linha contem os valores centrados da j-sima varivel ambiental ( isto , z j + = 0 ); c = ( c j ) [j =1,...,q], coeficientes das variveis ambientais; N e Y matriz transposta de N e Y.

11

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Tabela 2 - Algoritmo de Gerao da Anlise de Correspondncia Cannica (TER BRAAK, 1995) Processo Interativo: Passo 1: Atribua diferentes valores arbitrrios para os escores (valores) dos stios ( xi ); Passo 2. b = M-1 Y x Passo 3a. x* = N-1 Y b Passo 3b. c = (ZNZ)-1 ZN x* Passo 3c. x = Z c Passo 4: Para o primeiro eixo, v para o passo 5. Para o segundo e demais eixos, transforme os escores dos stios em escores no correlacionados com os eixos anteriores atravs do procedimento de Ortogonolizao descrito a seguir; Passo 5: Padronize os escores dos stios ( xi ); Passo 6: Pare quando atingir a convergncia, isto , quando os novos escores dos stios forem suficientemente prximos dos escores dos stios do ciclo de interao anterior. Caso contrrio volte ao passo 2. Procedimento de Ortogonolizao Passo 4.1. Denote os escores dos stios dos eixos anteriores de f i , e os escores do eixo atual por xi ; Passo 4.2. Calcule v = y+ i xi f i / y+ + onde y+ i = yki e y+ + = y+ i ;
i =1 k= i= n m n

Passo 4.3. Calcule xi , new = xi , old vf i ; Passo 4.4. Repita os passos 4.1 a 4.3 para todos os eixos anteriores. Procedimento de Padronizao Passo 5.1. Calcule o centride, z, dos escores dos stios ( xi ) z = y+ i xi / y+ + ;
2 Passo 5.2. Calcule a disperso dos escores dos stios s = y+ i ( xi z ) / y+ + ; 2 n

Passo 5.3. Calcule

xi , new = ( xi , old z ) / s

i =1

Note que aps a convergncia, s igual ao autovalor.

12

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Uma vez alcanada a convergncia, para garantir que os escores finais dos stios satisfaam x = Z c (notao matricial da Equao 4), podemos dividir c por . Isto a mesmo que substituir c na Equao 7 por c . 3.2. Reduzindo o Nmero de Variveis O propsito da ordenao simplificar a interpretao de um conjunto de dados complexo. Porm, este propsito pode no ser alcanado se h um nmero muito grande de variveis ambientais. Incluir dzias de variveis ambientais em um diagrama de CCA pode ser muito informativo ao investigador em uma fase exploratria do estudo, contudo difcil de explicar os padres principais de variao, a menos que os padres sejam bvios. Assim s vezes desejvel reduzir o nmero de variveis includo em uma anlise. impossvel reduzir o nmero de variveis sem alguma perda de informao. PALMER (2001) apresenta quatro modos para se reduzir o nmero de variveis. Os dois primeiros (se executados a priori) so vlidos para pesquisa exploratria e levantamento de hiptese, os dois ltimos so vlidos somente para pesquisa exploratria: 3.2.1. Seleo Atravs de Critrios Externos As variveis podem ser escolhidas por razes externas ao conjunto de dados. Uma dessas razes poderia ser a compatibilidade com outros estudos. Se outro estudo fosse executado em uma regio semelhante, poderia ser valioso usar exatamente as mesmas variveis. Outro critrio externo poderia envolver a biologia da espcie envolvida. Por exemplo, um estudo prvio poderia ter determinado que a profundidade do sistema radicular da maioria da espcie no excedeu a 15 cm. Nesse caso, poderia no ser til incluir os resultados de anlises de solo coletados 25 cm. 3.2.2. Exame da Estrutura de Correlao Variveis ambientais podem ser altamente correlacionadas ou redundantes com outras. Por exemplo, pH do solo, clcio, magnsio, e capacidade de troca catinica normalmente so fortemente correlacionados. Nesse caso, qualquer uma destas variveis poderia ser usada como uma aproximao para todas as outras. Geralmente, melhor escolher a varivel que mais provvel de ser a causa direta da resposta da vegetao, e/ou uma varivel que j tenha sido usada em outros estudos de vegetao. Pode-se no se conhecer previamente quais variveis so correlacionadas entre si. Neste caso, um exame detalhado da matriz de correlao seria til. Um modo relativamente sofisticado para fazer isto seria executar uma Anlise de Componentes Principais (PCA) na matriz de correlao, e escolher a varivel ambiental que fortemente associada com cada um dos primeiros eixos principais. 3.2.3. Interpretabilidade Variveis podem ser removidas post-hoc em anlises exploratrias se elas no parecem explicar a variao ao longo dos maiores eixos de uma forma facilmente 13

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

interpretvel. O usurio deve estar atento, entretanto, pois mesmo se o resultado no interpretvel, baseado na experincia corrente e na intuio, ele pode representar uma caracterstica muito importante e real. Por isso, recomenda-se remover somente variveis que so representadas por setas muito pequenas nos primeiros eixos da CCA, ou variveis cujas setas so quase idnticas s de outras variveis. 3.2.4. Anlise de Stepwise Variveis no informativas podem ser removidas por inspeo contnua dos resultados, como sugerido acima, ou por um procedimento de stepwise semi-automatizado. Segundo PALMER (2001) o software CANOCO, utilizado para execuo de anlise de correspondncia cannica, inclui o procedimento de stepwise conhecido como seleo forward que adiciona uma varivel ambiental de cada vez at que nenhuma outra varivel explique significativamente a variao residual. O procedimento semi - automatizado, e permite ao usurio fazer escolhas sobre incluso de variveis. O procedimento funciona como se segue: 1. A CCA executada separadamente para cada varivel; 2. Obtm-se assim, como cada varivel se ajusta aos dados; 3. Escolhe-se uma destas variveis baseando-se na qualidade do ajuste, ou na importncia que atribuda incluso da varivel na anlise; 4. Esta varivel pode ser testada para significncia usando um teste de randomizao; 5. A varivel selecionada ser usada como um co-varivel, em uma anlise de correspondncia cannica parcial (pCCA) nas variveis restantes separadamente; 6. Retorna-se ao passo 2; 7. Decide-se quando parar - convencionalmente quando o nvel " de significncia (p) deixa de ser menor que 0.05. Alternativamente, pode-se parar automaticamente uma vez que se inclui um nmero fixo de variveis. 8. Ao final executa-se uma CCA conjunta com todas as variveis significantes. A razo de significante est entre aspas porque ele no representa a verdadeira significncia estatstica - at mesmo com dados aleatrios, se obtm um grande nmero de resultados falsamente significantes devido ao problema de comparaes mltiplas. No h nenhuma garantia que seleo forward (ou qualquer outro procedimento de stepwise) resultar no melhor conjunto de variveis ambientais. O nico modo para determinar o melhor conjunto de variveis executar uma CCA separada para toda combinao concebvel de variveis; isto , na maioria dos casos, impossvel com a tecnologia atual porque envolve um nmero astronomicamente grande de combinaes. Porm, a falta de uma garantia no deveria ser uma preocupao quando se executa anlises exploratrias, onde o objetivo determinar um nmero limitado de variveis que explicam bem a composio de espcie, e no estar fixado com p-valores e pureza matemtica. 3.3. Apresentao e Interpretao dos resultados No diagrama de ordenao produzido pela CCA (Figura 3) as espcies e os stios (neste caso, as parcelas) so representados por pontos, e as variveis ambientais, por vetores ou flechas que indicam a direo das mudanas destas variveis no espao de ordenao 14

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

(TER BRAAK, 1987; TER BRAAK e PRENTICE, 1988; TER BRAAK, 1995). Este diagrama possibilita a visualizao no apenas de um padro de variao da comunidade (como padro de ordenao), mas tambm das principais caractersticas responsveis pelas distribuies das espcies ao longo das caractersticas ambientais (TER BRAAK, 1987).Dessa forma, espcies e parcelas aparecem no diagrama de ordenao como pontos correspondentes aos seus timos aproximados no espao bidimensional. Variveis ambientais contnuas aparecem como setas, indicando a direo do seu aumento no espao de ordenao. O comprimento das setas proporcional sua importncia na explicao da varincia projetada no eixo. Variveis nominais so indicadas como centrides, que so os pontos mdios de sua varincia projetados no eixo de ordenao (OLIVEIRA FILHO, 1994). A CCA tambm identifica, para cada eixo, as variveis ambientais mais fortemente relacionadas com a distribuio das espcies, alm de permitir a ordenao conjunta das variveis ambientais e das espcies em um mesmo diagrama (biplot). Esta tcnica permite utilizar regresses mltiplas, resultando em eixos de ordenao que sumarizam combinaes lineares das variveis ambientais (TER BRAAK, 1987). Na interpretao do diagrama (biplot) da CCA devemos observar que: No diagrama, as mdias ponderadas so aproximadas como desvios da grande mdia de cada varivel ambiental; a grande mdia representada pela origem (centride) do plot; A mdia ponderada inferida maior que a mdia se o ponto de projeo situa-se no mesmo lado da origem como a ponta de uma seta; por outro lado, menor que a mdia se a origem estiver entre o ponto de projeo e a ponta de uma seta; A ordenao das espcies resumida pelas suas posies relativas ao longo de cada eixo; As amostras tendem a ser dominadas pelas espcies que esto localizadas prximo elas no espao de ordenao; As posies das amostras indicam a similaridade entre elas; A direo de um vetor ambiental indica sua correlao com cada um dos eixos ilustrados. Um alinhamento paralelo de um vetor com um eixo indica que ele altamente correlacionado com o mesmo. Por outro lado, um vetor em ngulo entre dois eixos, indica que ele correlacionado com ambos; Os ngulos entre os vetores ambientais indicam a correlao entre as variveis ambientais; A localizao das amostras prximas aos vetores ambientais sugere as condies ambientais daquelas amostras; A localizao dos escores das espcies prximas aos vetores ambientais sugere as afinidades ambientais das espcies; Quanto maior a linha de um vetor ambiental no diagrama de ordenao, maior a relao dessa varivel com a comunidade. Alm do diagrama de ordenao, a CCA fornece uma tabela com as correlaes entre as espcies e as variveis ambientais, e sumrios de regresses, para os eixos de ordenao, que indicam o quanto cada varivel contribui para cada eixo.

15

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Figura 3 - Diagrama de ordenao produzido pela anlise de correspondncia cannica. As espcies esto representadas por pontos com as respectivas abreviaes de seus nomes cientficos, e as variveis ambientais, por vetores (sil = silte; are = areia grossa; arg = argila; Mg = magnsio; Ca = clcio; e K = potssio) (BALDUINO, 2001). A CCA fornece ainda uma estimativa da " inrcia ", ou a varincia total nos dados de espcie. A percentagem da varincia explicada por cada eixo obtida atravs da diviso do autovetor do eixo pela inrcia total. Pode-se tambm determinar a correlao entre o eixo de ordenao que foi derivado dos dados de espcie e os eixos cannicos, que so combinaes lineares das amostras (stios) e dos dados ambientais. So obtidos dois conjuntos de escores para os stios: um representado pela mdia ponderada dos escores das espcies, e outro que a combinao linear de variveis ambientais. Assim temos 2 conjuntos de correlaes: "Interset e Intraset. As Correlaes Interset so entre as variveis ambientais e os escores dos stios derivados diretamente dos escores de espcie. As Correlaes Intraset

16

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

so entre as variveis ambientais e os eixos cannicos, isto , os eixos so combinaes lineares das variveis ambientais. 3.4. Implementando a Anlise de Correspondncia Cannica A anlise de correspondncia cannica no disponvel nos principais pacotes estatsticos. O sistema PC-ORD (McCUNE & MEFFORD, 1997) foi desenvolvido para executar anlises multivariada de dados ecolgicos e, alm das ferramentas para transformao de dados e manuseio de arquivos, oferece muitas tcnicas de ordenao e de classificao, entre elas a CCA. Um fluxo tpico de anlise utilizando esse sistema envolve os seguintes procedimentos: Preparao dos dados; Execuo da anlise selecionada; Inspeo, arquivo ou descarte dos resultados; Elaborao dos grficos de ordenao; Inspeo, arquivo ou descarte dos resultados; Impresso dos resultados. 3.4.1. Preparao dos Dados A implementao da CCA no PC-ORD usa o mtodo interativo de CCA (TER BRAAK, 1986), descrito no item 3.1, e requer duas matrizes de dados. O sistema reconhece quatro formatos de dados, sendo padro o formato de planilha, devendo o arquivo ter a extenso WK1, usado em Lotus 1-2-3. Na matriz principal, as linhas so normalmente stios (parcelas, e outros) e as colunas so espcies. A estrutura dessa matriz deve seguir o modelo da Tabela 3 abaixo, sendo que: 1. As clulas A1 e B1 indicam o nmero de entidades (linhas) e a sua identificao (no mximo oito caracteres). Neste exemplo, seis locais; 2. As clulas A2 e B2 indicam o nmero de atributos (colunas) e a sua identificao (no mximo oito caracteres). Neste exemplo, dez clones de eucalipto; 3. As letras da linha trs indicam o tipo de varivel de cada coluna. Existem trs valores aceitveis para estes campos: Q = Quantitativo; C = Categrico; M = Mix de Quantitativo e Categrico. 4. A linha quatro contem o nome da varivel de cada coluna. Somente os oito primeiros caracteres so usados; 5. A linha cinco e seguintes contm o nome da linha na primeira clula, seguido pelos valores numricos para cada atributo da coluna para aquela linha. No exemplo abaixo os valores so produtividade (m3.ha-1.ano-1) para cada clone em cada local. Os nomes das linhas, assim como das colunas, so limitados a oito caracteres. Somente dados numricos so permitidos no corpo da matriz.

17

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Tabela 3 - Matriz Principal: Produtividade (m3.ha-1.ano-1) de Dez Clones de Eucaliptos em Seis Locais Selecionados
A 1 2 3 4 5 Loc1 6 Loc2 7 Loc3 8 Loc4 9 Loc5 10 Loc6 6 10 B locais clones Q 60,7 55,0 43,5 36,7 31,5 28,0 Q 61,3 59,1 45,0 40,0 23,1 25,4 Q 72,3 64,5 53,3 51,7 32,5 35,9 Q 32,7 35,0 45,0 50,0 51,2 64,2 Q 56,7 47,6 27,5 36,2 34,6 30,7 Q 68,0 56,6 51,3 48,7 45,9 50,1 Q 23,1 35,0 40,0 45,4 51,4 55,2 Q 64,8 59,5 47,3 42,8 29,0 29,8 Q 53,5 50,4 43,7 44,1 38,6 41,4 Q 49,3 46,4 39,6 43,4 44,0 45,3 Clone1 Clone2 Clone3 Clone4 Clone5 Clone6 Clone7 Clone8 Clone9 Clone10 C D E F G H I J K

A matriz secundria deve seguir o mesmo formato da matriz principal, sendo que as linhas so as mesmas da matriz principal, enquanto que as colunas so variveis ambientais. O nmero de variveis ambientais deve ser menor que o nmero de stios. A Tabela 4 apresenta o modelo da matriz secundria, onde as variveis ambientais so caractersticas fsicas e qumicas dos solos e precipitao anual (mm). Tabela 4 - Matriz Secundria: Caractersticas Ambientais dos Locais Selecionados
A 1 2 3 4 5 6 7 8 9 10 Loc1 Loc2 Loc3 Loc4 Loc5 Loc6 6 5 B locais caracter Q M.ORG 7,1 5,6 4,0 2,5 2,1 1,8 Q Fsforo 21,2 17,2 12,0 9,7 7,5 6,5
3

Q Argila 32 48 50 60 72 80

Q Prof 170 186 152 170 152 166

Q Ppt_mm 1600 1300 1000 900 800 750

M.ORG -% matria orgnica; Fsforo mgP2O5/dm ; Argila -%; Prof Profundidade efetiva - cm; Ppt_mm mm/ano.

Ainda em relao entrada de dados devem ser observados os seguintes cuidados: 18

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Os campos calculados da planilha devem ser convertidos em campos numricos antes de se proceder anlise com o PC-ORD; Se a extenso WK1 no o formato nativo da planilha de trabalho, os dados devem ser exportados para um arquivo tipo *.WK1, antes de serem utilizados no PCORD; Os nomes das linhas e colunas (na coluna A e linha 4 respectivamente) devem conter o formato texto. Caso as linhas ou colunas sejam nomeadas por nmero deve-se converter essas clulas numricas para o formato texto; No h um tamanho mximo para a matriz pr-estabelecido pelo PC-ORD. Isto depende da memria disponvel do computador; A entrada das matrizes principal e secundria no sistema feita atravs dos comandos: FILE/OPEN/ MAIN MATRIX e FILE/OPEN/SECOND MATRIX. Caso seja necessrio, o menu MODIFY DATA fornece vrias opes de manipulao dos dados originais, tais como: relativizao e padronizao; multiplicao de duas matrizes; eliminao de colunas ou linhas cujo nmero de valores diferentes de zero seja menor que um valor N desejado; eliminao de colunas ou linhas especficas; operaes aritmticas nas colunas ou linhas; transposio de matriz; e randomizao dos dados. Todas essas alternativas, exceto a multiplicao de matrizes, so realizadas somente na matriz principal. Essas modificaes so salvas como arquivos temporrios denominados Work.wk1 e Work.wk2, que substituem, respectivamente, os dados das matrizes principal e secundria e no afetam o arquivo de dados originais. 3.4.2. Execuo da CCA no PC-ORD Para se efetuar a anlise de correspondncia cannica deve-se inicialmente selecionar a opo CCA no menu ORDINATION. Imediatamente aps essa seleo, aparece a caixa de dilogo CCA SETUP, onde devem ser definidos os seguintes parmetros: Opes de escala da CCA; Escores para os grficos; Lista de coeficientes de correlao para a matriz secundria; Teste de Monte Carlo. 3.4.2.1. Opes de Escala da CCA O PC-ORD disponibiliza duas opes para padronizao dos escores das linhas e colunas. Na opo CENTRALIZAO E NORMALIZAO, padro (default) do sistema, os escores dos stios so re-escalonados de modo que a mdia zero e a varincia um. J com a opo MTODO DE HILL, os escores dos stios so re-escalonados de modo que o desvio padro da mdia cerca de uma unidade, e a curva de resposta das espcies pode subir e declinar num intervalo de cerca de quatro unidades (isto , dois desvios padres) (McCUNE & MEFFORD, 1997).

19

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

3.4.2.2. Escalonamento dos Escores de Ordenao So disponveis trs opes para controlar a escala relativa das espcies versus stios (unidades de amostras). Na opo OTIMIZAR LINHAS (usualmente stios), os escores dos stios so mdias ponderadas dos escores das espcies (alfa = 1). As distncias entre os stios aproximam-se de suas distncias Qui-quadrado (McCUNE & MEFFORD, 1997). A opo padro do sistema , OTIMIZAR COLUNAS (usualmente espcies), onde os escores das espcies so mdias ponderadas dos escores dos stios (alfa=0). As distncias entre espcies ento se aproximam de suas distncias Qui-quadrado. Se os pontos das espcies e os pontos biplots para as variveis ambientais esto presentes na ordenao, ento esta escolha permite uma interpretao espacial direta da relao entre espcies e variveis ambientais. O biplot aproxima as mdias ponderadas das espcies de acordo com as variveis ambientais. Para a opo COMPROMISE selecionado um valor de alfa = 0,5. No exemplo ilustrado, foram selecionadas todas as opes default do sistema. 3.4.2.3. Escores para os Grficos: A CCA calcula dois conjuntos de escores para as linhas (usualmente stios) na matriz principal: Escores derivados de combinaes lineares das colunas na matriz secundria (usualmente variveis ambientais); Escores derivados das colunas na matriz principal (usualmente espcies). A primeira opo padro do PC-ORD e representa o melhor ajuste das abundncias das espcies em relao s variveis ambientais. A segunda opo representa melhor a abundncia observada das espcies. 3.4.2.4. Lista de Coeficientes de Correlao para a Matriz Secundria A escolha desta opo permite a impresso da matriz dos coeficientes de correlao simples de Pearson entre todas os pares de variveis na matriz secundria (Tabela 5). 3.4.2.5. Teste de Monte Carlo Dois tipos de teste de Monte Carlo so disponveis com a CCA no PC_ORD, dependendo da hiptese de nulidade (H0) testada:
1.

NO RELATIONSHIPS BETWEEN MATRICES (No H Relaes Entre As Matrizes). Para esta hiptese, as linhas na matriz secundria so aleatoriamente reassinaladas dentro da mesma. Isto destri a relao entre as matrizes principal e secundria, mas mantm intacta a estrutura de correlao das variveis na segunda matriz.

20

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

2.

NO STRUCTURE IN MAIN MATRIX AND THEREFORE NO RELATIONSHIPS BETWEEN MATRICES (No H Estrutura Na Matriz Principal, Portanto No H Relao Entre As Matrizes). Para esta hiptese, os elementos na matriz principal so aleatoriamente re-assinalados dentro das colunas. Isto preserva os totais das colunas e os totais da matriz, mas altera os totais das linhas e destri as relaes entre colunas na matriz principal (normalmente espcies).

Para ambas hipteses deve-se selecionar o nmero de rodadas, isto de randomizao. Quanto maior este nmero, maior preciso pode ser obtida nos p-valores resultantes. Deve-se tambm ser especificado, na caixa de dilogo CCA RANDOM NUMBERS, como obter o nmero semente para iniciar o gerador de nmero aleatrio. Tabela 5 - Matriz de correlaes entre as variveis ambientais - relatrio Result

RESULT.FIL
___________________________________________________________________
RAW CORRELATIONS AMONG VARIABLES IN SECOND MATRIX M.ORG Fsforo Argila Prof PPT_mm M.ORG 1.000 .995 -.945 .475 . 989 Fsforo .995 1.000 -.950 .525 . 995 Argila -.945 -.950 1.000 -.340 -.933 Prof .475 .525 -.340 1.000 .511 Ppt_mm .989 .995 -.933 .511 1.000 WEIGHTED CORRELATIONS AMONG VARIABLES IN SECOND MATRIX (weighted by row totals in main matrix) M.ORG Fsforo Argila Prof PPT_mm M.ORG 1.000 .995 -.948 .475 .990 Fsforo .995 1.000 -.952 .522 .995 Argila -.948 -.952 1.000 -.338 -.937 Prof .475 .522 -.338 1.000 .503 PPT_mm .990 .995 -.937 .503 1.000

3.4.3. Resultados da CCA

O PC-ORD fornece um relatrio, Result RESULT.FIL, indicando as opes selecionadas na parametrizao (Figura 4) e os seguintes resultados da anlise de correspondncia cannica:
Correlaes bruta e ponderada entre as variveis da matriz secundria; Relatrio de Interao; Sumrio das estatsticas dos eixos; Resultados da regresso mltipla; Escores finais para os stios e espcies; Escores biplots para as variveis ambientais; 21

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Correlaes das variveis ambientais com os eixos de ordenao; Resultados do Teste de Monte Carlo;

******************* Canonical Correspondence Analysis ******************


PC-ORD, Version 3.12 20 Apr 2002, 15:10 Exemplo de Anlise de Correspondncia Cannica DATA MATRICES --------------------------------------Main matrix: 6 locais (rows) 10 clones (columns) Second matrix: 6 locais (rows) 5 caracter (columns) Finished reading data. --------------------------------------OPTIONS SELECTED Axis scores centered and standardized to unit variance Axes scaled to optimize representation of columns: clones (Scores for clones are weighted mean scores for locais) Scores for graphing locais are linear combinations of caracter No Monte Carlo tests --------------------------------------Figura 4 - Informaes gerais sobre a anlise efetuada - relatrio Result RESULT.FIL

3.4.3.1. Relatrio de Interao A soluo para cada eixo considerada estvel quando alcana um valor de tolerncia definido pelo sistema. Este relatrio apresenta, para cada eixo, o nmero de interaes necessrias para se alcanar uma soluo estvel. Caso, esta soluo no tenha sido alcanada at 999 interaes, a anlise finalizada e uma mensagem emitida no relatrio. Para o exemplo estudado, a tolerncia, para o primeiro eixo, foi alcanada aps sete interaes (Tabela 6), para o segundo eixo, aps onze interaes e para o terceiro eixo, aps 36 interaes.

Tabela 6 - Relatrio de Interao para o Primeiro Eixo - relatrio Result RESULT.FIL

22

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

ITERATION REPORT ----------------------------------------------------------------Calculating axis 1 Residual = .50E+04 at iteration 1 Residual = .35E-02 at iteration 2 Residual = .85E-05 at iteration 3 Residual = .33E-07 at iteration 4 Residual = .13E-09 at iteration 5 Residual = .69E-12 at iteration 6 Residual = .70E-13 at iteration 7 Solution reached tolerance of .100000E-12 after 7 iterations. -----------------------------------------------------------------

3.4.3.2. Sumrio das Estatsticas dos Eixos Este sumrio apresenta os resultados para as seguintes variveis: A varincia total (ou inrcia) nos dados das espcies, que representa a quantidade total de variabilidade na matriz da comunidade que poderia ser explicada; Os autovalores para cada eixo de ordenao; A percentagem da varincia total (inrcia) que explicada por cada eixo. Para um eixo particular, este valor calculado como sendo 100 vezes a razo entre o seu autovalor e a varincia total; Correlao de Pearson, espcies ambiente: Para cada eixo, so apresentados os coeficientes de correlao padro entre os escores das amostras derivado dos dados das espcies e os escores das amostras obtidos a partir de combinaes lineares das variveis ambientais; Coeficientes de Correlao de Kendall (Rank), espcies ambiente, para cada eixo e para a mesma relao anterior. A Tabela 7 abaixo mostra o resultado do sumrio das estatsticas dos eixos para o exemplo selecionado. 3.4.3.3. Resultados da Regresso Mltipla Os resultados da regresso relatam a efetividade das variveis ambientais em estruturar a ordenao e descrevem as relaes das variveis ambientais nos eixos de ordenao. Os coeficientes cannicos so apresentados de duas formas: os coeficientes padronizados, baseados nas variveis ambientais centradas e padronizadas e os coeficientes baseados nas variveis em suas unidades originais.

23

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

No exemplo selecionado verificamos (Tabela 7) que as variveis, Fsforo, Ppt_mm (precipitao anual) e Argila, foram as variveis mais efetivas no eixo um. Tabela 7 - Sumrio das Estatsticas dos Eixos de Ordenao - relatrio Result RESULT.FIL __________________________________________________________________ AXIS SUMMARY STATISTICS Number of canonical axes: 3 Total variance ("inertia") in the species data: .041 ----------------------------------------------------------------------Axis 1 Axis 2 Axis 3 ----------------------------------------------------------------------Eigenvalue .038 .002 .001 Variance in species data % of variance explained 91.9 5.8 1.4 Cumulative % explained 91.9 97.7 99.1 Pearson Correlation, Spp-Envt* 1.000 1.000 1.000 Kendall (Rank) Corr., Spp-Envt 1.000 1.000 1.000 ----------------------------------------------------------------------* Correlation between sample scores for an axis derived from the species data and the sample scores that are linear combinations of the environmental variables. Set to 0.000 if axis is not canonical.

Tabela 8 - Coeficientes Cannicos resultantes da Regresso Mltipla - relatrio Result RESULT.FIL

_______________________________________________________________
MULTIPLE REGRESSION RESULTS: Regression of locais in clones space on caracter ------------------------------------------------------------------------------------------Canonical Coefficients -------------------------------------------------------------------------------Standardized Original Units ------------------------------------------------------------------------Variable Axis 1 Axis 2 Axis 3 Axis 1 Axis 2 Axis 3 S.Dev -------------------------------------------------------------------------------------------1 M.ORG -.411 -12.155 -17.632 -.206 -6.086 -8.828 .200E+01 2 Fsforo 2.274 21.997 47.230 .420 4.064 8.726 .541E+01 3 Argila -.551 5.590 7.215 -.034 .349 .450 .160E+02 4 Prof .089 -1.960 -2.741 .008 -.166 -.233 .118E+02 24

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

5 Ppt_mm -1.474 -3.372 -21.589 -.005 -.011 -.070 .311E+03 -------------------------------------------------------------------------------------------

_______________________________________________________________
3.4.3.4. Escores Finais para os Stios e Espcies So apresentados os escores de ordenao (i.e. coordenadas sobre os eixos de ordenao) para cada stio (Tabela 9) e para cada espcie (Tabela 10) . A escala desses escores depende das opes selecionadas para escalonamento dos eixos de ordenao. So listados dois conjuntos de escores de stios (linhas): um conjunto no qual os escores dos stios so combinaes lineares das variveis ambientais e um conjunto no qual os escores dos stios so produzidos pela mdia ponderada com a matriz espcies. Tabela 9 - Coordenadas para os Locais nos Eixos de Ordenao - relatrio Result RESULT.FIL _________________________________________________________________ Scores that are derived from the scores of clones (WA Scores) FINAL SCORES and raw data totals (weights) for 6 locais ----------------------------------------------------------------------------Raw Data Axis 1 Axis 2 Axis 3 Totals ----------------------------------------------------------------------------1 Loc1 1.256831 .975796 -1.150336 542.3889 2 Loc2 .872324 -.050667 1.361431 509.1122 3 Loc3 .115497 -1.838924 -.230052 436.1927 4 Loc4 -.274293 -.471418 .222693 439.0935 5 Loc5 -1.190592 1.277818 1.078728 381.7815 6 Loc6 -1.480820 .043851 -1.178374 405.9880 ----------------------------------------------------------------------------Scores that are linear combinations of caracter (LC Scores) FINAL SCORES and raw data totals (weights) for 6 locais ---------------------------------------------------------------------------Raw Data Axis 1 Axis 2 Axis 3 Totals ----------------------------------------------------------------------------1 Loc1 1.256860 .975942 -1.150416 542.3889 2 Loc2 .872339 -.050535 1.361419 509.1122 3 Loc3 .115502 -1.838902 -.230197 436.1927 4 Loc4 -.274338 -.471465 .222655 439.0935 5 Loc5 -1.190588 1.277701 1.078953 381.7815 6 Loc6 -1.480838 .043642 -1.178415 405.9880 ----------------------------------------------------------------------------Tabela 10 - Coordenadas para os Clones nos Eixos de Ordenao - relatrio Result RESULT.FIL

25

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

_________________________________________________________________________ FINAL SCORES and raw data totals (weights) for 10 clones -----------------------------------------------------------------------------Raw Data Axis 1 Axis 2 Axis 3 Totals -----------------------------------------------------------------------------1 Clone1 .157632 .002486 .016433 255.4000 2 Clone2 .227146 -.055713 .013565 253.9077 3 Clone3 .152315 -.038668 -.010848 310.2035 4 Clone4 -.334110 -.028620 -.034545 278.1000 5 Clone5 .083188 .132175 .010668 233.3035 6 Clone6 -.004453 .021758 -.036297 320.6563 7 Clone7 -.364819 -.024387 .049642 250.0990 8 Clone8 .177212 -.031371 .004655 273.2000 9 Clone9 -.011040 -.000921 -.001086 271.6671 10 Clone10 -.091113 .039443 .004061 268.0196 -----------------------------------------------------------------------------___________________________________________________________________ 3.4.3.5. Correlaes e Escores Biplots para as Variveis Ambientais As variveis ambientais so freqentemente representadas como linhas que se irradiam a partir do centride de ordenao. Os escores biplots fornecem as coordenadas da extremidade dessas linhas e so utilizados para a elaborao dos grficos de ordenao. Os resultados das correlaes intraset e interset entre as variveis ambientais com os eixos de ordenao tambm so apresentados (Tabela 11). Tabela 11 - Correlaes "Intraset" e "Interset", e coordenadas nos Eixos de Ordenao para as variveis ambientais - relatrio Result RESULT.FIL ___________________________________________________________________ CORRELATIONS AND BIPLOT SCORES for 5 caracter -------------------------------------------------------------------------Correlations* Biplot Scores Variable Axis 1 Axis 2 Axis 3 Axis 1 Axis 2 Axis 3 -------------------------------------------------------------------------1 M.ORG .957 .174 -.129 .957 .174 -.129 2 Fsforo .968 .199 -.109 .968 .199 -.109 3 Argila -.974 -.007 .127 -.974 -.007 .127 4 Prof .525 162 .231 .525 .162 .231 5 Ppt_mm .943 .271 -.165 .943 .271 -.165 --------------------------------------------------------------------------* Correlations are "intraset correlations" of ter Braak (1986) INTER-SET CORRELATIONS for 5 caracter --------------------------------------------------------Correlations 26

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Variable Axis 1 Axis 2 Axis 3 --------------------------------------------------------1 M.ORG .957 .174 -.129 2 Fsforo .968 199 -.109 3 Argila -.974 -.006 .127 4 Prof .525 .162 .231 5 Ppt_mm .943 .271 -.165 ---------------------------------------------------------

3.4.3.6. Resultados do Teste de Monte Carlo Caso seja selecionado, apresentado como resultado uma tabela contendo, para cada eixo, os autovalores para os dados reais; os autovalores mnimos, mdios e mximos para os dados randomizados e o valor de p, que representa a proporo das rodadas com autovalor maior ou igual ao autovalor real. 3.4.4. Elaborao dos Grficos de Ordenao A opo GRAPH produz os diagramas de ordenao e dispem de opes para arquivar (FILE); imprimir; editar (GRAPH EDIT); seleo de tipos de diagrama (GRAPH), parametrizao dos diagramas (OPTIONS), seleo dos eixos dos diagramas (AXES) e da escala dos eixos (SCALING). Atravs do menu OPTIONS/PREFERENCE so definidos os formatos diagrama de ordenao, incluindo, principalmente, os pontos que sero plotados no diagrama (locais e/ou espcies). Na Figura 5 apresentado o diagrama de ordenao do exemplo selecionado, que contem alm dos vetores ambientais os pontos dos clones. Podemos inferir que as produtividades dos clones 7 e 4 so diretamente correlacionadas com o teor de argila no solo. Alm disso, esses dois clones, principalmente, e os clones 9 e 10 formam um grupo de clones adaptados regies de menor precipitao anual. Por outro lado, os clones 1, 2, 3 e 8, so indicados para regies de maior precipitao anual e solos com menores teores de argilas (arenosos).

27

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

Eixo 2
Clone5

Prof Ppt-mm Fsforo


Clone10

M.Org.

Clone6

Clone9

Clone1

Eixo 1

Argila
Clone7 Clone4 Clone8 Clone3

Clone2

Figura 5 - Diagrama de ordenao produzido pela anlise de correspondncia cannica. As espcies esto representadas por cruzes com as respectivas identificaes, e as variveis ambientais, por vetores (Argila; Prof; Ppt_mm; Fsforo e M.Org.)

28

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

4. REFERNCIAS BIBLIOGRFICAS BALDUINO, A.P.C. Estrutura da vegetao lenhosa do cerrado stricto sensu e sua relao com o solo na Estao Florestal de Experimentao de Paraopeba MG. Viosa: UFV, 2001. 81p. Dissertao (Mestrado em Cincia Florestal). Universidade Federal de Viosa, 2001. CARLETON, T.J. Residual ordination analysis: a method for exploring vegetationenvironment relationships. Ecology, v.65, n.2, p.469-77, 1984. COOLEY, W.W.; LOHNES, P.R. Multivariate Data Analysis. New York, John Wiley, 1971. 364 p. CRUZ, C.D. Aplicao de algumas tcnicas multivariadas no melhoramento de plantas. Piracicaba: ESALQ, 1990. 188p. Tese (Doutorado em Melhoramento Gentico) - Escola Superior de Agricultura Luiz de Queiroz, 1990. FACHEL, J.M.G. Anlise fatorial. So Paulo, USP, 1976. 81 p. (Tese MS). FAYE, B.; LESCOURRET, F.; DORR, N.; TILLARD, E.; MACDERMOTT, B.; MCDERMOTT, J. Interrelationships between herd management practices and udder health status using canonical correspondence analysis. Preventive Veterinary Medicine, v. 32, p. 171-192, 1997. GAUCH, H.G. Multivariate analysis in community ecology. Cambridge: Cambridge University Press, 1982. 263p. HILL, M.O. Reciprocal averaging: an eigenvector method of ordination. Journal of Ecology, v.61, p.237-49, 1973. JOHNSON, R.A. & WICHERN, D.W. Applied multivariate statistical analysis (2a ed.). Englewood Cliffs, Prentice Hall, 1988. 607 p. JOSE, S.; GILLESPIE, A.R.; GEORGE, S.J.; et.al. Vegetation responses along edge-tointerior gradients in a high altitude tropical forest in peninsular India. Forest Ecology and Management, v.87, p.51-62, 1996. MANLY, B.F.J. Multivariate statistical methods. London, Chapman & Hall, 1994. 215p. McCUNE, B.; MEFFORD, M.J. PC-ORD for Windows: multivariate analysis of ecological data (verso 3.12). Oregon: MJM Software Design, Gleneden Beach, 1997.

29

MANEJO FLORESTAL DEF/UFV

Prof. Agostinho Lopes de Souza

OLIVEIRA FILHO, A.T. Estudos ecolgicos da vegetao como subsdios para programas de revegetao com espcies nativas: uma proposta metodolgica. Cerne, v.1, n.1, p.6472, 1994. OLIVEIRA FILHO, A.T.; VILELA, E. A.; CARVALHO, D. A.; et al. Differentiation of streamside and upland vegetation in an area of montane semideciduous forest in southeastern. Flora, v.89, p.287-305, 1994a. OLIVEIRA FILHO, A.T.; VILELA, E. A.; CARVALHO, D. A.; et al. Effects of soils and topography on the distribution of tree species in a tropical riverine forest in south-eastern Brazil. Journal of Tropical Ecology, v.10, p.483-508, 1994b. OLIVEIRA FILHO, A.T.; CURI, N.; VILELA, E.A.; et al. Tree species distribution along soil catenas in a riverside semideciduous Forest in southeastern Brazil. Flora, v.191, p.971-88, 1996. ORLCI, L. Multivariate Analysis in Vegetation Research. 2.ed. Boston, W. Junk B.V., 1978. 415 p. PALMER, M. Ordinations Methods okstate.edu/artsci/botany/ordinate). [05/12/2001]. for Ecologists. (http://www.

PEREIRA, R.C. Espcies de formigas cortadeiras em plantaes de eucalipto relao com fatores ambientais e consumo foliar. Viosa: UFV, 1998. 144p. Dissertao (Mestrado em Cincia Florestal). Universidade Federal de Viosa, 1998. SMITH, M.L. Community and edaphic analysis of upland northern hardwood communities, central Vermont, USA. Forest Ecology and Management, v.72, p.267-74, 1995. TER BRAAK, C.J.F. Canonical correspondence analysis: a new eigenvector technique for multivariate direct gradient analysis. Ecology, v.67, n.6, p.1167-79, 1986. TER BRAAK, C.J.F. The analysis of vegetation environment relationships by canonical correspondence analysis. Vegetatio, v.69, p.69-77, 1987. TER BRAAK, C. J. F. and Prentice, I. C. A theory of gradient analysis. Adv. Ecol. Res. v. 18, p.271-313, 1988. TER BRAAK, C.J.F. Ordination. In: JONGMAN, R.H.G.; TER BRAAK, C.J.F.; VAN TONGEREN, O.F.R. (Eds.) Data analysis in community and landscape ecology. Cambridge: Cambridge University Press, 1995. p.91-173. WALKER, M.D. Courses Lectures: 2. (http://www.colorado.edu/epob/epob4640mwalker/ lecture2). [05/12/2001].

30