Académique Documents
Professionnel Documents
Culture Documents
en ecologa fluvial
Edicin a cargo de:
ARTURO ELOSEGI
Profesor titular de Ecologa en la Universidad del Pas Vasco
SERGI SABATER
Catedrtico de Ecologa en la Universidad de Girona
_______________________________________________
22.1. Introduccin
El diseo del estudio y el anlisis de datos son partes cruciales en cualquier in- El pensamiento
vestigacin ecolgica. A menudo, el uso apropiado de diseos y anlisis estadsti- estadstico debe guiar
cos es desafiante y frustrante para el investigador. Un primer error, todava fre- el diseo experimental
desde el principio
cuente debido en parte a la aversin estadstica de muchos bilogos, es pensar en
la estadstica slo despus de obtener los datos (Green 1979). Ello, a menudo,
conduce a diseos inapropiados o subptimos, dificultades de anlisis y resulta-
dos dudosos.
397
CONCEPTOS Y TCNICAS EN ECOLOGA FLUVIAL
Tres principios Al diseo de experimentos se ha prestado mucha atencin desde los trabajos del
importantes del diseo gran estadstico y bilogo Ronald A. Fisher (Box 1978). El diseo de estudios ob-
experimental: control, servacionales se llama diseo muestral (sampling design en ingls), y desafortunada-
replicacin y
mente su aplicacin ha sido mucho menos desarrollada en ecologa que el dise-
aleatorizacin
o experimental. Tres principios clsicos del diseo experimental bsicamente
desarrollados por Fisher (vase, por ejemplo, Hurlbert 1984) son el control, la re-
plicacin (uso de varias unidades experimentales que reciben el mismo trata-
miento) y la aleatorizacin (asignacin al azar de los tratamientos a las distintas
unidades experimentales).
Hay que tener cuidado La replicacin es el principio de que necesitamos dos o ms unidades experimen-
en incurrir en la tales (rplicas) con el mismo tratamiento para medir el error experimental. La
seudorreplicacin mayora de mtodos estadsticos (como el anlisis de varianza o ANOVA) estu-
dian la existencia de efectos de los tratamientos comparando la variacin entre
tratamientos con la variacin dentro de los tratamientos. Aumentar el nmero de
rplicas (y reducir el error experimental) aumentar la precisin de las estima-
ciones y la potencia de las pruebas estadsticas, es decir, la capacidad de detectar
efectos. Un error frecuente en experimentos ecolgicos es la seudorreplicacin, tr-
mino acuado por Hurlbert (1984), que consiste en el anlisis incorrecto que usa
la variacin dentro de la unidad experimental como error experimental. Por
ejemplo, si slo usamos un acuario tratado (por ejemplo, con un txico) y otro
sin tratar, no podemos usar medidas de distintos individuos (por ejemplo, tama-
o o fecundidad de invertebrados) dentro de cada acuario para analizar el efec-
to del tratamiento. Ntese que la seudorreplicacin es un error ms de anlisis
que de diseo, y que algunos experimentos sin replicacin pueden analizarse co-
rrectamente, por ejemplo, mediante tcnicas de regresin (Hurlbert 2004).
398
DISEO EXPERIMENTAL Y ANLISIS DE DATOS
Estos tres principios del diseo experimental son de fcil aplicacin en el labora-
torio pero, a menudo, presentan muchas dificultades para la experimentacin en
el campo a escalas medias o grandes, o para estudios como los de impactos am-
bientales (Carpenter et al. 1989, Carpenter 1990, Osenberg et al. 2006). La uni-
direccionalidad y heterogeneidad espacial de los ros seguramente dificulta ms
el diseo experimental que en ecosistemas terrestres o lacustres (Downes et al.
2002). Imaginemos, por ejemplo, que queremos ver cul es el efecto de fertilizar
un tramo de ro en los procesos biogeoqumicos o en las comunidades de diato-
meas. Podemos aadir nutrientes en el tramo experimental y usar un control jus-
to aguas arriba del tramo. Podramos repetir simultneamente la fertilizacin en
otro tramo, aunque ello duplica el esfuerzo de campo. Podemos usar la variacin
entre diferentes controles, por encima de un nico tramo fertilizado? Pues, segn
Stewart-Oaten y Bence (2001), ello no sera correcto. Usar la variacin entre un
tramo fertilizado y dos controles por encima es inapropiado porque:
En este caso, si no se pueden fertilizar varios tramos, el diseo ms apropiado se- El diseo BACI consiste
gn Stewart-Oaten y Bence (2001) es un diseo BACI (Before-After-Control-Impact) en comparar las
tambin llamado BACIPS (BACI-Paired Series). El diseo BACI compara las series condiciones en dos
tramos, uno control y
temporales (o las diferencias) de la zona tratada (o impactada) y el control, an-
otro impactado, antes y
tes y despus de la intervencin o tratamiento experimental (fig. 22.1). Se pue- despus del impacto
den analizar con pruebas t de Student de las diferencias de medias o, preferible-
mente, con tcnicas de regresin o series temporales (si existen datos suficientes)
(Stewart-Oaten y Bence 2001).
399
TCNICA 55 CONCEPTOS Y TCNICAS EN ECOLOGA FLUVIAL
Figura 22.1: a) b)
Antes Despus Antes Despus
Ilustracin de un diseo Impacto
BACI Control
Abundancia
Diferencia
Tiempo Tiempo
Nota: Se estudia la abundancia de un organismo en una zona control y otra zona impacto antes y despus de un
determinado suceso, intervencin, o tratamiento experimental. En la izquierda (a) existe una diferencia entre las
dos zonas (control e impacto) y una tendencia temporal, pero que es similar en el control y la zona impactada o
tratada. En cambio, en la derecha (b), las diferencias entre control e impacto cambian con la intervencin (antes-
despus), por lo que concluiremos que existe un efecto de la intervencin.
Fuente: Adaptada de Stewart-Oaten et al. (1992).
Los diez mandamientos A modo de principios generales, enumeramos, a continuacin, una adaptacin
de Green son un de lo que nosotros llamamos los diez mandamientos de Green (1979), advirtiendo
compendio de buenas que quien est libre de pecado, que tire la primera piedra:
conductas en estadstica
aplicada
1. Objetivo. Sers capaz de explicar a cualquier persona, de forma clara y concisa,
qu cuestin quieres resolver. Los resultados del estudio sern tan coherentes
y comprensibles como tu concepcin inicial del problema.
2. Replicacin. Tomars rplicas por cada combinacin de tiempo, lugar y cual-
quier otro factor controlado. Las diferencias entre grupos slo pueden detec-
tarse comparndolas con las diferencias dentro de estos grupos.
3. Aleatorizacin. Tomars aleatoriamente un nmero igual de rplicas para cada
combinacin de variables controladas. Decidir qu rplicas son representati-
vas o tpicas no es un muestreo aleatorio.
400
DISEO EXPERIMENTAL Y ANLISIS DE DATOS TCNICA 55
Un primer paso para disear bien un estudio y, por ende, escoger el mtodo es-
tadstico adecuado, es aplicar bien la terminologa del diseo, que es un poco dis-
tinta para experimentos y estudios observacionales, a la estructura de nuestro es-
tudio (cuadro 22.1).
401
TCNICA 56 CONCEPTOS Y TCNICAS EN ECOLOGA FLUVIAL
Cuadro 22.1:
Definicin Estudio observacional Experimento
Terminologa del diseo
experimental (experimentos) Aquellas variables que nosotros manipulamos Factor o variable Factor, variable
y muestral (estudios (experimento) o que medimos a niveles independiente experimental o
observacionales) distintos ya preestablecidos (estudio variable
observacional) independiente
Variable que medimos y queremos saber cmo Variable, variable de Variable, variable de
responde a nuestra manipulacin o a los respuesta o variable respuesta o variable
distintos niveles del factor dependiente dependiente
Distintos niveles de un factor Nivel Tratamiento o nivel
Todo el conjunto de material al cul aplicamos Unidad
un cierto tratamiento, independientemente del experimental
resto de material. Las distintas unidades
experimentales que reciben el mismo
tratamiento reciben el nombre de rplicas
Los estudios Si aplicamos esta terminologa a nuestros estudios, podremos decidir qu mto-
observacionales y los dos estadsticos utilizar. Por ejemplo, el de la figura 22.1 ser un estudio observa-
experimentos siguen cional si se trata de un impacto ambiental que ya se ha producido, y ser un ex-
aproximaciones
perimento si es una fertilizacin o adicin de nutrientes controlada por el
estadsticas diferentes,
lo que se refleja en la investigador. En cualquier caso, existen dos factores: la zona (con los niveles con-
terminologa utilizada trol e impacto) y el tiempo (que tiene mltiples niveles pero del que, bsicamen-
te, queremos decidir si existe una diferencia antes y despus de la intervencin).
La variable de respuesta es la abundancia de un cierto organismo o cualquier varia-
ble que nosotros queramos estudiar cmo se ve afectada por el impacto. La uni-
dad muestral o experimental es el material en cada una de las zonas en un momen-
to determinado de medicin. Podemos considerar que tenemos cuatro muestras
resultantes de dos factores con dos niveles cada uno, pero sin replicacin. En se-
leccin de mtodos de la tcnica 56 veremos cmo analizar este tipo de datos.
402
DISEO EXPERIMENTAL Y ANLISIS DE DATOS TCNICA 56
dad y tradicin de uso en nuestro entorno ms inmediato. S que es poco reco- Es esencial manejar
mendable ceirse slo a Excel, ya que sus extensiones son limitadas y constrien programas estadsticos
la eleccin de mtodos. completos
Tiene revisiones y actualizaciones muy frecuentes, y constante aparicin de El entorno R ofrece gran
paquetes con nuevos mtodos; los investigadores estadsticos que desarrollan variedad de aplicaciones
actualmente nuevos mtodos los implementan a menudo en R, por lo que se estadsticas gratuitas,
aunque no es el
facilita mucho la transicin entre desarrollo de nuevos mtodos y su aplica-
programa de ms fcil
cin generalizada. manejo
Estn apareciendo versiones Gui (entorno grfico similar a Windows o a Mac-
intosh) de algunas aplicaciones, por lo que se facilita el uso.
Existen numerosos mtodos especficamente desarrollados o recomendados
para datos ecolgicos.2 Desarrollado por eclogos de la Universidad Claude-
Bernard Lyon I originalmente para Macintosh, incluye muchas ms variantes
de tcnicas de ordenacin (Doldec et al. 2000, Pelissier et al. 2003, Dray et
al. 2003) que las que pueden hacerse con un software de ms fcil uso pero co-
mercial como CANOCO (Ter Braak y Smilauer 2002, Lep y Smilauer 2003)
que, seguramente, an es el ms utilizado en ecologa.
Flexibilidad para implementar mtodos o clculos propios (por ejemplo, si-
mulaciones).
Facilidad de repeticin de los mismos anlisis (ya que se genera un script) por
el mismo u otros usuarios.
En cualquier paso de la investigacin cientfica se cometen errores. Una vez in- Un anlisis exploratorio
troducidos los datos en el programa estadstico elegido, es muy recomendable rea- de los datos es
lizar lo que se llama anlisis exploratorio de datos, el cual, adems de servir para de- fundamental para
depurar los mismos y
purar los datos, tambin sirve para entender las caractersticas de los mismos (por
comprender el tipo de
ejemplo, la forma de la distribucin de las variables de respuesta). Este anlisis ex- distribucin de las
ploratorio de datos puede consistir en estadstica descriptiva, histogramas, grfi- variables
cas de caja, etc. Resultan muy tiles las grficas de dispersin entre variables cuan-
titativas, ya que a menudo nos permiten identificar valores atpicos o outliers.
Deberemos revisar estos valores atpicos y eliminarlos tan slo en aquellos casos
1
Puede encontrarse informacin sobre este entorno en http://www.r-project.org/
2
Vase una relacin de ellos en la Task View: Analysis of Ecological and Environmental Data, disponible en
http://cran.r-project.org/web/views/Environmetrics.html). Por ejemplo, el programa ade4, consultable en
http://pbil.univ-lyon1.fr/ADE-4/
403
TCNICA 56 CONCEPTOS Y TCNICAS EN ECOLOGA FLUVIAL
SELECCIN DE MTODOS
A fin de seleccionar la 1. Tipo de estudio. Experimento con variables cuantitativas (contraste de hiptesis
tcnica estadstica o estadstica inferencial), estudio observacional de ecologa de comunidades
adecuada cabe (tcnicas de ordenacin y clasificacin de anlisis multivariante).
responder estas siete
2. Tipo de variable/nivel de medida. Cuantitativa o medida (estadstica paramtrica
cuestiones
como el anlisis de la varianza, la regresin mltiple o los modelos lineales ge-
neralizados), ordinal (estadstica no paramtrica), categrica binaria o polit-
mica (anlisis de frecuencias o de datos categricos: regresin logstica o mo-
delos lineales generalizados con errores binomiales, etc.).
3. Nmero de variables. Una (estadstica univariante) o dos variables de respuesta,
o bien muchas variables en general (anlisis multivariante).
4. Nmero de factores. Uno o ms; nmero de muestras: uno, dos o ms.
5. Objetivo/hiptesis. Estudiar la tendencia central, la variabilidad, toda la forma de
la distribucin (pruebas de bondad de ajuste), la relacin entre variables (co-
rrelacin, regresin, anlisis multivariante).
6. Tenemos muchos datos (n > 50) durante el tiempo (series temporales), o el espacio
(estadstica espacial)?
7. Tenemos datos de supervivencia? (anlisis de supervivencia)
404
2 muestras 2 o ms muestras
Tipos de variable dependientes: dependientes:
1 var. y 1 factor 1 var. y ms que
ESTADSTICA 2 muestras cuantitativo o 2 o ms muestras 1 factor cuantitativo OBJETIVO
independientes: 1 var. con independientes: o 1 var. con medidas
1 muestra 1 var. y 1 factor medidas repetidas 1 var. y 1 factor repetidas
NO PARAMTRICA
Runs Mann-Whitney Wilcoxon Kruskal-Wallis Friedman Tendencia
central
Cuantitativas Kolmogorov- Kolmogorov- Forma
Smirnov Smirnov
ESTADSTICA Shapiro-Wilks
PARAMTRICA
Correlacin o Correlacin o Relacin
regresin simple regresin mltiple
Prueba t Prueba t muestras Prueba t datos ANOVA 1 factor ANOVA bloques Medias
independientes apareados comp. mltiples ANCOVA
405
TCNICA 56
Cuadro 22.2:
Figura 22.2:
Mtodos multivariantes
Seleccin de mtodos
multivariantes en funcin
del tipo de datos y el
objetivo del estudio Interdependencia
Dependencia
(asociacin)
CONFIRMATORIOS EXPLORATORIOS
Contraste de hiptesis Generacin de hiptesis
406
DISEO EXPERIMENTAL Y ANLISIS DE DATOS TCNICA 56
Entre los mtodos de ordenacin (fig. 22.2), podemos escoger entre las tcnicas
siguientes segn el objetivo y tipo de datos (Ter Braak 1988):
407
TCNICA 56 CONCEPTOS Y TCNICAS EN ECOLOGA FLUVIAL
Las tcnicas de anlisis El NMDS es un mtodo basado en distancias ampliamente usado en psicologa y
indirecto analizan una tambin en biologa marina.3 En cambio, en ecologa terrestre y limnologa, los
sola matriz de datos, las mtodos ms utilizados son las distintas variedades de ACP y anlisis de corres-
de anlisis directo se
pondencias.
basan en dos matrices
Las tcnicas de anlisis indirecto de gradiente analizan una sola matriz, por ejemplo,
un AC para la abundancia de diatomeas en distintas muestras o un ACP para la
fisicoqumica. En cambio, las tcnicas de anlisis directo de gradiente o anlisis cons-
treido (constrained) como el CCA, analizan al mismo tiempo dos matrices, cons-
triendo que la ordenacin de las muestras, segn la composicin de especies,
sea una funcin lineal (modelo de regresin mltiple) de las variables ambienta-
les (fisicoqumicas). Ambos tipos de tcnicas (indirectas y directas o constrained)
tienen objetivos distintos y son alternativas o complementarias: aunque el CCA re-
sume en un solo anlisis toda la informacin, es posible que la principal variacin
en la composicin de especies corresponda a una variable ambiental no medida,
por lo que un AC mostrara una ordenacin muy distinta (y muy informativa)
(kland 1996). A menudo el CCA es menos robusto y precisa muchas ms mues-
tras que variables ambientales (McCune 1997). Buenos manuales para el uso de
estas tcnicas son Jongman et al. (1995) y Lep y Smilauer (2003).
Es importante verificar La verificacin de los supuestos o condiciones en los que se basan los mtodos es-
los supuestos del tadsticos es una de las cuestiones que ms preocupan a los bilogos, y en las que
mtodo estadstico ms malentendidos persisten (Box 1953, Stewart-Oaten 1995, Smith 1995, John-
utilizado, pero sin caer
son 1995). A continuacin intentamos aclarar algunos:
en extremismos
3
Vase software Primer en http://www.zen87707.zen.co.uk/primer-e/
408
DISEO EXPERIMENTAL Y ANLISIS DE DATOS TCNICA 56
409
TCNICA 56 CONCEPTOS Y TCNICAS EN ECOLOGA FLUVIAL
de los puntos 6 y 8, los mtodos grficos son ms fiables y tiles (en contra de
lo que parece inicialmente), porque nos indican si es adecuado utilizar una
transformacin y cul de ellas.
10. A pesar de lo que se piensa muy a menudo, la estadstica no paramtrica tam-
bin hace supuestos. Por ejemplo, el test de Mann-Whitney y el de Kruskal-
Wallis suponen que la nica diferencia, si la hay, entre los grupos que se com-
paran es en la tendencia central; y que la dispersin y distribucin de los
grupos es igual excepto con respecto a la tendencia central (Johnson 1995,
Kasuya 2001). Es decir, hacen supuestos similares a la homoscedasticidad y no
son ninguna panacea como se suele asumir. En cambio, para las pruebas t de
Student hay frmulas que no suponen la homoscedasticidad, por lo que rea-
lizan menos supuestos y sus resultados a menudo sern ms correctos que
los de un mtodo no paramtrico (Johnson 1995). Lo mismo ocurre con los
tests de aleatorizacin o permutacin: hacen los mismos supuestos que los pa-
ramtricos, excepto el de normalidad (que es irrelevante para estos ltimos)
(Stewart-Oaten et al. 1992, Hayes 2000).
11. Slo existen los equivalentes no paramtricos de los diseos experimentales
ms sencillos. Por ejemplo, la mayora de paquetes estadsticos no tienen el
equivalente no paramtrico de un diseo de bloques aleatorizados o de un
ANOVA de medidas repetidas. Por ello, a menudo, se aplican mtodos no pa-
ramtricos de diseos ms simples sin respetar el diseo experimental esta-
blecido, lo que puede conducir fcilmente a conclusiones errneas.
410
DISEO EXPERIMENTAL Y ANLISIS DE DATOS TCNICA 56
22.2. Bibliografa
411
CONCEPTOS Y TCNICAS EN ECOLOGA FLUVIAL
KASUYA E. Mann-Whitney U test when variances are unequal. Animal Behaviour 61 (2001):
1247-1249.
LEP J., y SMILAUER P. Multivariate analysis of ecological data using CANOCO. Cambridge: Cam-
bridge University Press, 2003.
MCcULLAGH P., y NELDER J.A. Generalized linear models. Nueva York: Chapman and Hall, 1989.
MCcUNE B. Influence of noisy environmental data on canonical correspondence analysis.
Ecology 78 (1997): 2617-2623.
KLAND R.H. Are ordination and constrained ordination alternative or complementary
strategies in general ecological studies?. Journal of Vegetation Science 7 (1996): 292.
OSENBERG C.W., M. B.B., WHITE J.S., ST. MARY C., y SHIMA J.S. Statistical issues and assess-
ment of ecological restorations: Lessons from marine reserves. En D. Falk, N. Palmer,
and J. Zedler, eds. Foundations of restoration ecology. Washington, D.C.: Island Press, 2006:
280-302.
PELISSIER R., COUTERON P., DRAY S., y SABATIER D. Consistency between ordination techni-
ques and diversity measurements: Two strategies for species occurrence data. Ecology 84
(2003): 242-251.
SACHS L. Estadstica aplicada. Barcelona: Ed Labor, 1978.
SMITH S.M. Distribution-free and robust statistical methods: Viable alternatives to parame-
tric statistics?. Ecology 76 (1995): 1997-1998.
SOKAL R.R., y ROHLF F.J. Biometry: The principles and practice of statistics in biological research.
Nueva York: Freeman, 1995.
STEWART-OATEN A. Rules and judgments in statistics: Three examples. Ecology 76 (1995):
2001-2009.
STEWART-OATEN A., y BENCE J.R. Temporal and spatial variation in environmental impact as-
sessment. Ecological monographs 71 (2001): 305-339.
STEWART-OATEN A., BENCE J.R., y OSENBERG C.W. Assessing effects of unreplicated pertur-
bations: No simple solutions. Ecology 73 (1992): 1396-1404.
TER BRAAK C.J.F. A theory of gradient analysis. Advances in Ecological Research 18 (1988):
271-317.
TER BRAAK C.J.F., y MILAUER P. CANOCO reference manual and CANODRAW for Windows user's
guide: Software for canonical community ordination (version 4.5). Ithaca, Nueva York: Micro-
computer Power, 2002.
412