Vous êtes sur la page 1sur 79

DE LA BIODIVERSIT

M ESURES

Eric Marcon
05/03/2013 1

REMERCIEMENTS
Je remercie Franois Morneau pour sa relecture attentive de la premire version de ce document et sa contribution dcisive pour la bonne utilisation de R dans les exemples. Bruno Hrault et Chris Baraloto ont contribu la revue de la littrature de faon significative.

Les opinions mises par les auteurs sont personnelles et nengagent pas lUMR EcoFoG ou ses tutelles.

MESURES DE LA BIODIVERSIT
Entropie : introduction ......................... 33

Sommaire
Remerciements ................................... 2 Notations ............................................. 5 Notions de diversit ............................. 7
Composantes ....................................... 7
Richesse quitabilit Rgularit et divergence Diversit , et Dcomposition 7 8 8

Dfinition de lentropie Entropie relative Entropie et biodiversit : historique Logarithmes dforms Entropie et diversit Biais dchantillonnage Profils de diversit Dfinition Biais dchantillonnage

33 34 35 36 37 38 39 39 39

Entropie HCDT ................................... 36

Indice de Hurlbert ............................... 39

Niveaux de ltude ................................ 9


9 10

quitabilit .......................................... 40

SAD et SAR........................................ 10

Mesures neutres de la diversit ou .......................................................... 13


Mesures fondes sur les relations aireespces .............................................. 13
Indice de Fisher Synthse Influence de la structure spatiale Taux de couverture 14 16 18 19 20 20 La relation dArrhenius Le modle de Gleason

Diversit et dcomposition ............. 43


Le dbat sur la dcomposition ............ 44 Dfinitions de la diversit ................. 43 Dcomposition multiplicative de la diversit .............................................. 45 Lindice de chevauchement ......... 45
Biais dchantillonnage Tests 46 46

Dcomposition de lindice de Shannon 45

Dcomposition de lentropie gnralise ........................................................... 47 Dcomposition du nombre despces . 49 Dcomposition de lindice de GiniSimpson.............................................. 50 Synthse............................................. 50 Le partitionnement de la diversit selon Plissier et Couteron........................... 51
Cadre Dcomposition 51 52

Richesse spcifique............................ 21
Techniques destimation non paramtrique 21 Infrence du nombre despces partir de la SAD 26 Infrence du nombre despces partir de courbes daccumulation 27 Combien y a-t-il despces diffrentes sur Terre ? 28

Indice de Simpson .............................. 29


Dfinition Biais dchantillonnage 29 30

Diversit fonctionnelle et phylogntique .......................................................... 53


Cadre .................................................. 53
Dissimilarit et distance Distance phylogntique Distance fonctionnelle quivalence des deux diversits 53 54 54 55

Indice de Shannon.............................. 30
Dfinition Biais dchantillonnage 30 31

Typologie des mesures Biais dchantillonnage

55 56

FD et PD ............................................. 56 Indice de Rao ...................................... 56


Principe Calcul sous R Maximum thorique Dcomposition Alternatives 56 57 57 59 60

FAD et MFAD...................................... 60 Hp et I1................................................. 61 Mesures dentropie phylogntique ..... 61


Gnralisation de lentropie HCDT Biais dchantillonnage Entropie et diversit Dcomposition Arbres non ultramtriques 61 62 62 63 64

Rgularit ........................................... 65

Conclusion ......................................... 67 Bibliographie ...................................... 69

NOTATIONS
Les notations peuvent diffrer de celles de la littrature cite pour lhomognit de ce document. Souvent, la littrature cologique nest pas trs rigoureuse sur la distinction de ce qui est un paramtre, une variable alatoire ou son estimation. Par exemple, le nombre dindividus chantillonns (choisi) devrait tre not , un nombre dindividus alatoire (rsultat dun processus stochastique) devrait tre not et son estimateur . La confusion est frquente dans la formu lation des mesures de diversit et leurs estimateurs. Dans la mesure du possible, des notations plus rigoureuses que les originales sont utilises ici. : laire dtude, et, selon le contexte, sa surface.

: le nombre dindividus chantillonns, paramtre choisi dans le cadre du protocole dchantillonnage. est le nombre dindividus de lespce dans la communaut . Les effectifs totaux sont + (pour lespce s), + pour la communaut et le total gnral. Sil ny a quune communaut, le nombre dindividus par espce est .

() : lesprance de la variable alatoire .

: la diversit vraie (nombre de Hill pour les diversits et ), nombre quivalent de communauts pour la diversit . est la diversit mesure dans la communaut i. () est la diversit phylogntique. : lentropie de Tsallis (ou HCDT). est lentropie mesure dans la communau () est lentropie phylogntique. t i.

: la probabilit quune espce choisie au hasard soit reprsente par individus, =1 =1. Si lespce est choisie explicitement, la probabilit est note . = {1 ; 2 ; ; ; ; } : la distribution des probabilits . : le nombre despces, considr comme . une variable alatoire, estim par

: la probabilit quun individu tir au hasard appartienne lespce s. Son estimateur, est la frquence observe. est la mme probabilit dans la communaut i.

: le nombre de communauts qui constituent une partition de la mta-communaut dans le cadre de la dcomposition de la diversit. Les communauts sont indexes par . ( ) : linformation apporte par lobservation dun vnement de probabilit . ( , ) est le gain dinformation apport par lexprience ( est observ) par rapport aux probabilits attendues.

: le nombre (alatoire) dindividus se trouvant dans laire dtude, estim par le . est la mme variable nombre observ alatoire, mais restreinte aux individus de lespce .

: le nombre despces, considr comme une variable alatoire, observes fois dans lchantillonnage. Lexposant est le nombre de fois o lespce est dtecte : par exemple 1 ou >0. Lindice est la taille de lchantillon : pour la surface ou 0 pour un chantillon de individus. est le nombre despces non rencontres dans la surface . Pour allger les notations, sil ny a pas dambigut, lexposant est omis pour les espces prsentes : >0 est not . Si lindice nest pas not, lchantillon nest pas prcis et peut tre aussi bien un nombre 2 dindividus quune surface. est le nombre despces vues fois dans un chantillon de taille , au carr. : le nombre despces observes, avec les mmes notations que ci-dessus. peut tre considr comme une ralisation de . 5

12 : le quantile dune loi de Student degrs de libert au seuil de risque , classi-

quement 1,96 pour grand et = 5%.

NOTIONS DE DIVERSIT
Le terme biodiversit concerne le plus souvent la diversit en termes despces dun cosystme. On peut bien videmment sintresser dautres niveaux et dautres objets, par exemple la diversit gntique (en termes dallles diffrents pour certains gnes ou marqueurs) lintrieur dune population ou loppos la diversit des cosystmes. On gardera toujours lesprit que la prise en compte de la diversit spcifique nest pas la seule approche, mme si le texte se sy rfre le plus souvent. Lobjectif de ce document est de traiter la mesure de la biodiversit, pas son importance en tant que telle. On se rfrera par exemple Chapin et al. (2000) pour une revue sur cette question. Les calculs ncessaires sont raliss dans R (R Development Core Team, 2013), essentiellement avec le package entropart (Marcon et Hrault, submitted-a). Lensemble du code est disponible sur le site web 1 o se trouvent les mises jour de ce document.

Richesse
La richesse est le nombre (ou une fonction croissante du nombre) de classes diffrentes prsentes dans le systme tudi, par exemple le nombre despces darbres dans une fort. Un certain nombre dhypothses sont assumes plus ou moins explicitement :

Les classes sont bien connues : compter le nombre despces a peu de sens si la taxonomie nest pas bien tablie. Cest parfois une difficult majeure quand on travaille sur les microorganismes. Les classes sont quidistantes : la richesse augmente dune unit quand on rajoute une espce, que cette espce soit proche des prcdentes ou extrmement originale.

Composantes
Une communaut comprenant beaucoup despces mais avec une espce dominante nest pas perue intuitivement comme plus diverse quune communaut avec moins despces, mais dont les effectifs sont proche (Figure 1, colonne de gauche). La prise en compte de deux composantes de la diversit, appeles richesse et quitabilit, est ncessaire (Whittaker, 1965).

Figure 1 : Importances de la richesse (en haut) et de lquitabilit (en bas) pour la dfinition de la diversit

http://www.ecofog.gf/spip.php?article427

Lindice de richesse le plus simple et le plus utilis est tout simplement le nombre despces ou son logarithme ln. 7

Mesures de la biodiversit

Figure 2 : Patrons de biodiversit (Gaston, 2000, figure 1). (a) Le nombre despces de vers de terre augmente en fonction de la surface chantillonne, de 100 m2 plus de 500 000 km2 selon la relation dArrhenius (voir page 16). (b) Nombre despces doiseaux en fonction de la latitude. (c) Relation entre la richesse rgionale et la richesse locale. (d) Nombre despces de chauves-souris en fonction de laltitude dans une rserve au Prou. (e) Nombre despces de vgtaux ligneux en fonction des prcipitations en Afrique du Sud.

quitabilit
La rgularit de la distribution des espces (quitabilit en Franais, evenness ou equitability en Anglais) est un lment important de la diversit. Une espce reprsente abondamment ou par un seul individu napporte pas la mme contribution lcosystme. nombre despces gal, la prsence despces trs dominantes entrane mathmatiquement la raret de certaines autres : on comprend donc assez intuitivement que le maximum de diversit sera atteint quand les espces auront une rpartition trs rgulire. Un indice dquitabilit est indpendant du nombre despces (donc de la richesse).

La plupart des indices courants, comme ceux de Simpson ou de Shannon, valuent la fois la richesse et lquitabilit.

Rgularit et divergence
Les mesures classiques de la diversit ne prennent pas en compte une quelconque distance entre classes. Pourtant, deux espces du mme genre sont de toute vidence plus proches que deux espces de familles diffrentes. Les mesures de diversit phylogntique et de diversit fonctionnelle prennent en compte cette notion, qui ncessite quelques dfinitions supplmentaires (Mouillot et al., 2005 ; Ricotta, 2007 ; Pavoine et Bonsall, 2011).

Notions de diversit

La mesure de la diffrence entre deux classes est souvent une distance, mais parfois une mesure qui na pas toutes les proprits dune distance : une dissimilarit (voir Dissimilarit et distance, page 53). Les mesures de divergence sont construites partir de la dissimilarit entre les classes, avec ou sans pondration par la frquence. Les mesures de rgularit dcrivent la faon dont les espces occupent lespace des niches. Ce concept est quivalent celui dquitabilit dans les mesures classiques.

Diversit , et

La diversit est la diversit locale, mesure lintrieur dun systme dlimit. Plus prcisment, il sagit de la diversit dans un habitat uniforme de taille fixe. De faon gnrale (Gaston, 2000), la richesse spcifique diminue avec la latitude (la diversit est plus grande dans les zones tropicales, et au sein de celles-ci, quand on se rapproche de lquateur), voir Figure 2. La richesse diminue avec laltitude. Elle est gnralement plus faible sur les les, o elle dcrot avec la distance au continent, source de migrations.

Niveaux de ltude

Figure 3 : Diversit , value par la richesse spcifique. Lhabitat B possde la plus grande richesse (figure issue de Morin et Findlay, 2001).

Figure 4 : Diversit , value par le nombre despces nouvelles rencontres dans chaque nouvel habitat (figure issue de Morin et Findlay, 2001).

La diversit est classiquement estime plusieurs niveaux embots, nomms , et par Whittaker (1960, p. 320), qui a nomm la diversit locale quil mesurait avec lindice de Fisher (voir page 14) et a utilis les lettres suivantes selon ses besoins.

La diversit est le taux de remplacement des espces le long dun gradient (topographique ou dhabitats par exemple). Enfin, la diversit est similaire la diversit , prise en compte sur lensemble du systme tudi. Les diversits et se mesurent donc de la mme faon.

Mesures de la biodiversit

50

Nb Espces

40

30

20

ln Ns 0 10 0 2 4 ln Ns 6 8

1 0

10

50

100

500

50

100 Rang

150

200

Figure 5 : Histogramme des frquences (diagramme de Preston) des arbres du dispositif de Barro Colorado Island (Hubbell et al., 2005). En abscisse, le nombre darbres de chaque espce (en logarithme), en ordonne, le nombre despces.

Figure 6 : Diagramme rang-abondance (diagramme de Whittaker) correspondant au diagramme de Preston de la Figure 5. Les points sont les donnes, la courbe est lajustement dune distribution lognormale.

Dcomposition
Whittaker (1977) a propos sans succs une normalisation des chelles dvaluation de la biodiversit, en introduisant la diversit rgionale ( tant rserv au paysage et lhabitat) et la diversit entre les paysages. Seuls les trois niveaux originaux ont t conservs par la littrature, sans dfinition stricte des chelles dobservation. La distinction entre les diversits et dpend de la finesse de la dfinition de lhabitat. La distinction de nombreux habitats diminue la diversit au profit de la . Il est donc important de dfinir une mesure qui ne dpende pas de ce dcoupage, donc une mesure additive (ou multiplicative) dcrivant la diversit totale, dcomposable en la somme (ou le produit) convenablement pondre de toutes les diversits des habitats (diversit intra) et de la diversit interhabitat.

communaut le niveau de regroupement pour lestimation de la diversit .

SAD et SAR
La courbe aire-espces (SAR : Species Area Relationship) reprsente le nombre despces observes en fonction de la surface chantillonne (exemple : Figure 10, page 16). Elle est la base de certaines mesures de diversit. La SAR est parfois remplace par une courbe nombre dindividus-espces (Figure 8, page 15) quand leffort dchantillonnage est mesur de cette faon. La distribution de labondance des espces (SAD) est la loi qui donne labondance attendue de chaque espce dune communaut. Les espces ne sont pas identifies individuellement, mais par le nombre dindividus leur appartenant. Elle peut tre reprsente sous la forme dun histogramme

Nous appellerons communaut le niveau de dcoupage concernant la diversit et mta10

Notions de diversit

des frquences (diagramme de Preston, Figure 5 2) ou bien dun diagramme rangabondance (RAC : Rank Abundance Curve,) ou diagramme de Whittaker, Figure 6 3. Le RAC est souvent utilis pour reconnatre des distributions connues. Izsk et Pavoine (2012) ont tudi les proprits des RAC pour les principales SAD. Les SAD ne sont pas traites en dtail ici : on se reportera Magurran (1988), McGill et al. (2007) et Izsk et Pavoine (2012). Les SAD ncessaires la comprhension de la suite sont :

La distribution en log-sries de Fisher (1943) La distribution log-normale (Preston, 1948), le modle Broken Stick de MacArthur (1957).

Le code R ncessaire pour raliser les figures est: > library(vegan) > data(BCI) > Ns <- sort(colSums(BCI), decr = TRUE) > N <- sum(Ns) > hist(log(Ns), main = NULL , xlab = expression(ln(N[s])), ylab="Nb Espces")

Code complmentaire pour le diagramme de Whittaker : > S=length(Ns) > plot(Ns, type = "b", log = "y", main = NULL, xlab = "Rang", ylab = expression(ln(N[s]))) > ranks.lognormal <- S*(1pnorm(log(Ns), mean(log(Ns)), sd(log(Ns)))) > lines(ranks.lognormal, Ns, col="red", lwd=3)

11

MESURES NEUTRES DE LA DIVERSIT OU


Les mesures classiques considrent que chaque classe dobjets est diffrente de toutes les autres, sans que certaines soient plus ou moins semblables. Dans ce chapitre, les classes seront des espces. Les mesures sont qualifies de neutres au sens o elle ne prennent en compte aucune caractristique propre des espces. Les mesures prsentes ici sont les plus utilises : dans un premier temps, celles fondes sur les relations aire-espces, dont lindice de Fisher, puis les trois mesures dentropie (richesse, Shannon, Simpson). Ces dernires sont sujettes des biais dchantillonnage (Mouillot et Leprtre, 1999) : la correction de ces biais est traite en dtail. Lentropie HCDT permet dunifier ces mesures et les nombres de Hill de leur donner un sens intuitif. nest pas la solution adapte, puisquon rencontre toujours de nouvelles espces (Gotelli et Colwell, 2001), mme en chantillonnant des surfaces considrables (50 hectares pour la Figure 12, au-del du million de km2 pour la Figure 10, page 16). Dans le cas gnral, la SAR ne tend pas vers une asymptote, et nombre despces augmente tant que la surface chantillonne crot (Williamson et al., 2001). Il ne sagit donc pas destimer un nombre despce asymptotique pour une communaut, mais un nombre dpendant de la surface dchantillonnage. Une revue sur la faon dobtenir une SAR est fournie par Scheiner (2003).

Mesures fondes sur les relations aire-espces


En fort tempre, toutes les espces dun habitat sont rencontres sur une surface infrieure lhectare. Laire minimale est la surface ncessaire chantillonner pour caractriser une association vgtale, dans lapproche est de la phytosociologie fonde par Braun-Blanquet (1928) : elle ne contient pas toutes les espces mais un sousensemble caractristique. Elle est de lordre de 200 m2 en Europe (Chytr et Otpkov, 2003). En fort tropicale, il existe de nombreuses espces rares, au sens o la probabilit de ne pas les rencontrer loccasion dun chantillonnage dune certaine taille nest pas ngligeable. Lexprience montre que laugmentation de laire dchantillonnage

Figure 7 : Courbes daccumulation et de rarfaction, obtenues par inventaires individuels ou groups ( samples ). Les courbes de rarfaction permettent de lisser les courbes daccumulation. Les courbes obtenues par inventaire group sont en gnral en dessous des courbes individuelles cause de lagrgation spatiale (Gotelli et Colwell, 2001, Fig. 1).

Gotelli et Colwell (2001) proposent une revue des problmes les plus communment rencontrs dans lestimation et la comparaison de la richesse spcifique. Ils suggrent notamment de calculer la courbe de rarfaction (Figure 7) plutt que dutiliser la courbe daccumulation obtenue en traant simplement le nombre despces dcouvert en fonction de leffort dchantillonnage. La courbe de rarfaction est obtenue en souschantillonnant dans linventaire complet des effectifs de toutes tailles et en calculant 13

Mesures de la biodiversit

le nombre moyen despces trouv pour chacun, ce qui permet de lisser la courbe. Lorsque linventaire est fait par quadrats ou toute autre mthode qui regroupe les individus (piges insectes, filets de pche), les courbes montrent moins despces pour le mme effort dchantillonnage cause de lagrgation spatiale des espces, problme trait plus loin. Il sagit dans un premier temps de mesurer la diversit , lintrieur du mme habitat, et non daugmenter la surface chantillonne le long dun gradient dhabitats (diversit ). Le problme est donc bien la prise en compte des espces rares. Deux cas sont traits largement dans la littrature : lindice de Fisher pour une SAD en log-sries et la relation dArrhenius (loi de puissance) pour une SAD log-normale.

En appliquant son modle des donnes, Fisher remarque que 0, ce qui correspond une distribution comprenant de nombreuses espces et un pseudo-RAC dcroissant rapidement, et retient cette proprit pour la suite de son raisonnement. Dans ce cas, et aprs calcul, le nombre despces chantillonnes pour individus est calculable (pour suffisamment grand) et ne dpend que dun paramtre estim partir des donnes. Le modle est donc applicable pour un grand nombre dobservations et un grand nombre despces, dont les individus sont distribus indpendamment. Alors :

On notera que la distribution de nest pas celle de . La courbe reprsentant en fonction de son rang nest pas un vrai diagramme rang-abondance, mais un pseudoRAC (Izsk et Pavoine, 2012) et la distribution de est une pseudo-SAD.

Fisher (Fisher et al., 1943) a reli le nombre despces au nombre dindividus chantillonns partir du modle suivant :

Indice de Fisher

= ln(1 + )

(1)

La distribution de retenue par Fisher est une loi gamma, ce qui implique que suit une loi binomiale ngative de paramtre . 14

loi de Poisson : = 0

tant donn la taille de lchantillon et la probabilit dchantillonner lespce , lesprance du nombre dindividus chantillonns dans lespce est . Le nombre dindividus rellement observ fluctue alatoirement. Il suit une loi de Poisson desprance , distribution bien connue selon Fisher, dmontre par Pielou (1969, pages 204-205). Cest une consquence directe de lindpendance entre les chantillons. Les probabilits suivent toutes la mme loi. La densit de probabilit de est note (), o = permet dallger lcriture. La probabilit dobserver individus dune espce donne est donc la moyenne sur toutes les valeurs possibles de de la
+ !

est un indicateur de la biodiversit qui peut tre interprt comme le nombre despces nouvelles dcouvertes quand le nombre dindividus chantillonns est multipli par : cest en effet la pente de la courbe de en fonction de ln, qui se stabilise partir dune valeur de suffisante. Kempton (Kempton et Taylor, 1976 ; Kempton et Wedderburn, 1978) a montr quil tait identique sa statistique .

Si le nombre dindividus est proportionnel la surface (saturation de Hubbell, 2001), la relation de lquation (1) est quivalente une courbe aire-espces (SAR). est aussi gal , le nombre fondamental de la biodiversit de Hubbel (2001) quand le nombre despces est grand (Alonso et McKane, 2004) : la SAD de la mtacommunaut (pas celle de la communaut locale si la dispersion est limite) du modle neutre est en log-sries. Dans R, la librairie untb (Hankin, 2007) contient la fonction fishers.alpha. La fonction fisher.alpha de la librairie vegan

()

Mesures neutres de la diversit ou

Figure 8 : Courbes nombre dindividus-espces- simules pour illustrer limportance des paramtres (concentration spatiale) et (nombre total despces) dans le modle de Fisher. est fix 100 pour toutes les courbes. (a) et (b) : la concentration spatiale ( < ) change drastiquement le nombre despces attendu. En pratique, seuls S et N ( et dans nos notations) sont observs. Si est suppos gal 1 par erreur, est sous-estim. (a) et (c) : le nombre despces nest videmment pas infini, ce qui change fortement la forme de la courbe. Si le nombre dobservations est grand, sera aussi trs sous-estim. (in Schulte et al., 2005)

(Oksanen et al., 2012) estime selon Kempton et Taylor (1974)


> library(vegan) > data(BCI) > # Ns est un vecteur contenant les effectifs de chaque espce. > Ns <- colSums(BCI) > fisher.alpha(Ns) [1] 35.05476 > library(untb) > fishers.alpha(sum(Ns),length(Ns)) [1] 35.05477

Si = et = 1, lquation (2) se simplifie pour retrouver lquation (1).

o =

1 ( )

Schulte et al. (2005) ont tendu le modle de Fisher pour prendre en compte un nombre despces fini et une distribution non indpendante des individus, prise en compte par un paramtre dagrgation spatiale c valable pour toutes les espces.
= 1 + ln 1 + () (2)

Appliqu des donnes relles (Figure 9), le modle de Fisher tendu sajuste forcment mieux (il possde trois paramtres au lieu dun). Lapproximation du nombre despces infini parat tre la plus pnalisante parce quelle exclut linflexion de la courbe pour les grandes valeurs de , mme si ces valeurs sont rarement atteinte dans les faits ( 10 > 20 000). 15

Leurs rsultats (Figure 8) montrent que la non prise en compte de ces deux paramtres aboutit une sous-estimation systmatique de , diffrente selon les sites, ce qui invalide les comparaisons inter-sites.

Mesures de la biodiversit

Enfin, lindice de Fisher repose lourdement sur lhypothse que la distribution relle des espces est conforme au modle. Jost (2007) montre par un exemple que des interprtations absurdes de lindice peuvent tre faites si lhypothse nest pas respecte.

La relation dArrhenius
Arrhenius (1921) a tabli le modle de base, dit loi de puissance :

est la surface, est le nombre despces dans , et des paramtres.

(3)

Preston (1962) a montr que si la SAD est log-normale, la SAR suit une loi de puissance, et a tabli que la puissance valait environ 0,25 ( partir de donnes empiriques, pas par ncessit thorique). Les rsultats empiriques ultrieurs (May, 1975 ; May et Stumpf, 2000) ont fourni des valeurs gnralement comprises entre 0,2 et 0,3. Une large mta-analyse conduite par Drakare et al. (2006) partir de 794 SAR dorigine trs diffrentes fournit une moyenne de 0,27, comme la mta-analyse de la Figure 10, mais avec une certaine variabilit que les auteurs relient lchelle spatiale, au type dorganismes et aux habitats chantillonns, mais aussi la technique dchantillonnage.

Figure 9 : Comparaison entre le modle de Fisher et le modle tendu dans trois parcelles forestires connues. Les modles sont ajusts aux donnes observes par Condit et al. (1996). Les courbes lgendes Equation 4 correspondent au modle de Fisher tendu, quation (2), alors que lEquation 5 est le modle intermdiaire, supposant le nombre total despces infini. (in Schulte et al., 2005)

Le paramtre le plus variable de la loi de puissance reste donc , un facteur dchelle dpendant de la richesse de lhabitat.

Figure 10 : Logarithme du nombre despces en fonction du logarithme de la surface chantillonne (Williamson et al., 2001, fig. 1). Les donnes sont des relevs despces natives sur 104 sites de taille variable travers le monde. Les symboles correspondent divers types dhabitats (les ou continent, rserves ou non) sans intrt ici. La valeur de est 0,27. Donnes de Lonsdale (1999).

16

Mesures neutres de la diversit ou

Figure 11 : Les cinq dispositifs de Plotkin et al. (2000). Chaque dispositif mesure 50 ha et toutes les tiges de diamtre suprieur 1 cm sont cartographies et dtermines.

Reprsente en logarithmes, la relation est une droite (Figure 10) :


= ln + ln ln (4)

Plotkin et al. (2000) ont eu accs de grands chantillons (5 placettes de 50 hectares dans lensemble du monde tropical, Figure 11, toutes dtermines correctement sur le plan botanique et dans lesquels chaque arbre est positionn). Ils montrent que le modle log-normal rend mal compte de la ralit (Figure 12a) pour les petites surfaces. Harte et al. (1999) ont montr que la loi de puissance tait quivalente au modle dautosimilarit, driv de la thorie des fractales. On considre un rectangle dont le rapport longueur sur largeur vaut 2. On obtient le rectangle +1 en plaant deux rectangles cte cte (et donc le rectangle 1 en coupant en deux). est le nombre despces rencontres dans . On dfinit enfin = 1 le facteur de diminution du nombre despces (dit paramtre de persistance) li la division par 2 de la taille du rectangle.

Figure 12 : Courbes aire-espces (a) et Paramtre de persistance en fonction de la surface (b) dans 5 forts tropicales (Plotkin et al., 2000). La loi lognormale est reprsente par le trapze sur la figure a, pour une gamme de valeurs de la constante. Elle implique que la relation aire-espces reprsente en logarithmes soit une droite, ce qui nest visiblement pas le cas.

Sil sagit dune constante, , indpendante de la taille du rectangle, lhabitat est dit auto-similaire : laugmentation du nombre despces ne dpend pas de lchelle 17

Mesures de la biodiversit

dobservation Si cette condition est respecte, le nombre despces suit la loi de puissance, et = 2 . Pour la valeur classique de = 0,25, = 0,84. La Figure 12b prsente la valeur de en fonction de la surface chantillonne. Elle augmente avec la surface, ce qui infirme le modle dautosimilarit. Plotkin et al. (2000) ne supposent pas constant et lui imposent simplement dtre une fonction de la surface, choisie arbitrairement pour permettre les calculs ultrieurs, et dont la forme correspond aux observations de la Figure 12b. Aprs calculs, la relation aire-espces est () . () est un polynme de degr de , sans constante. Les monmes sont dautant moins importants que leur degr est lev. Lapproximation de degr 0 est la loi de puissance. Celle de degr 1 est retenue par les auteurs pour estimer le nombre despces rencontres sur la surface : Ce modle contient un paramtre k en plus

de la loi de puissance. Les auteurs ont tabli que les paramtres et taient trs proches pour les cinq forts ( = 0.125 et = 0.0541 Pasoh), et que leur estimation sur une fort permettait de prdire avec une trs bonne prcision la richesse des autres, partir dun chantillon dun hectare ncessaire pour obtenir le paramtre . La Figure 13 compare les performances de cette mthode (persistence method), de la loi de puissance 0,25 (loi log-normale) et du modle de Fisher.

Le modle de Gleason
Gleason (1922) rfute le travail dArrhenius (1921) partir de largument selon lequel le nombre despces doit se stabiliser quand la surface augmente, au risque de prvoir une richesse beaucoup trop leve pour de grandes surfaces. Les travaux ultrieurs lui donneront tort (Williamson et al., 2001). Gleason propose une relation dans laquelle le nombre despces (et non son logarithme) crot avec le logarithme de la surface :

(5)

Figure 13 : Performance du modle de Plotkin et al. (2000) face au modle log-normal. Les autres SAD concurrentes sont le modle alpha de Fisher et le modle Broken Stick de MacArthur. La courbe reprsente le nombre despces rencontres Pasoh sur des surfaces de 0 50 ha. Les donnes observes sont des tirages alatoires dchantillons de la surface souhaite. Lcart-type est reprsent (lintervalle de fluctuation 95% est de lordre de 2 cart-types). Les valeurs issues du modle ont t obtenues par un paramtrage de et sur 25ha, suppos valide galement sur les autres forts. Le paramtrage de c est obtenu par un chantillon dun hectare, rpt 1000 fois pour obtenir un intervalle de confiance. Lintervalle de fluctuation 95% est ici encore de lordre de deux cart-types.

18

Williams (1964) reprend ce modle et affirme sa validit partir darguments sur la variabilit de lhabitat quand la surface dchantillonnage augmente (par opposition la relation dArrhenius applicable dans un habitat homogne, et due la distribution log-normale des espces). Connor et McCoy (1979) discutent de la faon de tester les deux hypothses mais ne disposent pas des donnes pour le faire. Le modle de Fisher (1) peut tre crit sous la forme = ln( + ) ln( ). Pour assez grand et sous lhypothse de saturation de Hubbell, est proportionnel + et le modle de Fisher est quivalent au modle de Gleason. Bordenave (Bordenave et De Granville, 1998 ; Bordenave et al., 2011) propose un indice de richesse spcifique (IRS, ou SDI : Species Diversity Index) gal la pente de la relation de Gleason. Dans le cadre de lapproximation prcdente, il est gal .

= ln + ln

(6)

chelles, ni la forme de la relation aux chelles extrmes. Hubbell (2001, chapitre 6) tablit que le modle de Fisher est pertinent lchelle de la mta-communaut et donc de la communaut locale en absence de limitation de la dispersion (si le taux de migration m vaut 1, la communaut locale est un chantillon de la mta-communaut). Dans ce cas, la SAR a la forme de la courbe de la Figure 14, zone A, et lindice de Fisher est le bon outil de mesure. Mais la dispersion est limite, et la distribution de la communaut locale est plus complique. McGill (2003) montre quune SAD log-normale sajuste mieux aux donnes que le modle neutre selon les rsultats de Hubbel. Volkov et al. (2003) tablissent la SAD neutre de faon analytique qui sajuste mieux aux donnes que le modle log-normal, mais la traduction en SAR nest pas faite.

Mesures neutres de la diversit ou

Synthse

La relation dArrhenius est plus robuste que celle de Gleason, selon les rsultats empiriques et des considrations thoriques (Grcia Martn et Goldenfeld, 2006), y compris de thermodynamique (Wrtz et Annila, 2008). Empiriquement, il est difficile destimer lequel des modles est le plus adapt aux donnes : sur 35 jeux de donnes, Connor et McCoy (1979) montrent que les rgressions de ou ln en fonction de ou ln ont des performances similaires en terme de qualit dajustement (R2), mais Triantis et al. (2012) valident largement le modle dArrhenius pour des SAR insulaires. Preston (1960) argumente en faveur du modle dArrhenius (et en dfaveur de celui de Gleason) aux chelles intermdiaires et montre que la courbe aire-espces est triphasique (Figure 14). Ce rsultat fait maintenant consensus mais pas la dlimitation des trois

Figure 14 : Relation aire-espce triphasique (figure in Grilli et al., 2012). Zone B : relation dArrhenius.

Le meilleur modle lchelle locale est donc celui de Plotkin et al. (2000), qui rfute la fois Gleason et Arrhenius. La SAR est concave sur une chelle log-log (Figure 12 a). Lutilisation de lindice de Fisher est donc sujette caution. Sa valeur calcule plus haut pour BCI est 35, trs diffrente de la valeur de du modle neutre pour les mmes donnes (entre 47 et 50, Volkov et al., 2003, figure 1) Lchelle plus grande (zone B de la Figure 14) est pour Hubbel un assemblage dun 19

Mesures de la biodiversit

certain nombre de communauts composant la mtacommunaut (page 186). La SAR obtenue par simulation suit la loi de puissance dArrhenius. Grilli et al. (2012) dveloppent un modle de SAR valable toutes les chelles. Ses hypothses sont peu ralistes dans la zone A, mais il valide la loi de puissance analytiquement lchelle intermdiaire. La relation dArrhenius est donc systmatiquement valide lchelle rgionale (Figure 10). On remarquera que la distribution de Fisher, valide par Hubbel pour la mta-communaut, nest jamais observe dans la SAR cause de lagrgation spatiale : en augmentant la surface dchantillonnage, de nouvelles communauts sont ajoutes progressivement, mais lchantillonnage de toute la mtacommunaut nest jamais ralis (sauf au point marquant le passage de la zone B la zone C). Enfin, quand lchelle est encore plus grande, le nombre despces augmente nouveau plus vite parce que dautres mtacommunauts sont intgres.

de ne pas rencontrer une espce suit une loi binomiale, les tirages tant indpendants. Ce modle surestime largement la diversit pour les petites surfaces : la probabilit de ne pas rencontrer une espce agrgative est sous-estime. Le biais diminue quand la surface dchantillonnage augmente, parce que la taille relative des agrgats diminue. Les effets de lagrgation peuvent donc tre opposs selon la question pose. Dans tous les cas, il suffit de considrer quun agrgat surestime le nombre darbres de son espce qui devrait tre pris en compte dans le cadre dun modle tirages indpendants. Plotkin et al. (2000) proposent une mthode permettant de prendre en compte la structure spatiale pour fournir des modles de courbes aire-espces fiables, dans un cadre particulier o le nombre total despces et leur structure spatiale sont connus. La mthode ncessite une carte des individus. Le semis de point est considr comme le rsultat dun processus de Neyman-Scott (1958) : des centres dagrgats sont tirs de faon compltement alatoire et les individus sont rpartis autour des centres selon une loi normale en deux dimensions. Les paramtres du processus sont estims partir du semis de points, puis la courbe aire-espces est obtenue par simulation du processus. Malheureusement, aucune mthode gnrale permettant de prendre en compte la structure spatiale nest disponible.

Influence de la structure spatiale


Les modles classiques de courbes aireespces supposent un tirage indpendant des individus. Sur le terrain, par exemple en fort, lchantillonnage est continu : sil existe une structure spatiale comme des agrgats, la probabilit que larbre suivant soit dune espce donne dpend de ses voisins, donc de larbre prcdent. Intuitivement, on comprend bien que le nouvel arbre de la mme espce apporte moins dinformation, ce qui revient surestimer la taille de lchantillon ou sous-estimer la richesse pour une taille dchantillon fixe. Plotkin et al. (2000) traitent un problme un peu diffrent : connaissant le nombre total despces dans les dispositifs de la Figure 11, ils tracent la courbe aire-espces thorique issue du modle de Coleman (1981) qui considre simplement que la probabilit 20

Taux de couverture
Good (1953) dfinit le taux de couverture de lchantillonnage (sample coverage) comme la proportion des espces dcouvertes = =1 ( > 0) o est la fonction indicatrice.

Le taux de couverture augmente avec leffort dchantillonnage. Plus il est lev, meilleures seront les estimations de la diversit. Pour comparer deux communauts par des courbes de rarfaction, Chao et Jost (2012) montrent que le taux de couverture plutt que la taille de lchantillon doit tre

identique. Les estimateurs de la diversit dvelopps plus loin reposent largement sur cette notion pour la correction du biais dchantillonnage (la sous-estimation systmatique de la diversit due aux espces non observes). Lestimateur du taux de couverture, que Good attribue Turing, est :
1 = 1

, classiquement 1,96 pour grand et = 5%.

Mesures neutres de la diversit ou

Richesse spcifique
Lapproche utilise ici est trs diffrente de la prcdente. On suppose que la communaut locale est de taille fixe et contient donc un nombre fixe despces, alors que lapproche par la SAR ne fait pas dhypothse sur les limites de la communaut et fournit un nombre despces dpendant de la surface. On ne fait pas de supposition sur la forme de la SAD quand on utilise des mthodes destimation non paramtriques. Les estimateurs les plus connus sont ceux de Chao (1984 pour Chao1) et le jackknife (Burnham et Overton, 1979). Une alternative consiste infrer partir des donnes les paramtres dune SAD choisie, et particulirement le nombre total despces. Cette approche est bien moins rpandue parce quelle suppose le bon choix du modle et est beaucoup plus intensive en calcul.

(7)

Un meilleur estimateur (son erreur quadratique moyenne est plus faible) est utilis dans SPADE. Il prend en compte les single1 tons ( : le nombre despces observes 2 une seule fois) et les doubletons ( : le nombre despces observes deux fois) :
1 1 ( 1) = 1 1 2 ( 1) + 2

(8)

Les deux estimateurs sont quasiment identiques ds que est grand.


= (1)+1
=1 1

Chao et al. (1988) puis Zhang et Huang (2007) proposent lestimateur suivant :
(9)

Les termes de la somme dcroissent trs vite avec . En se limitant = 1, lestimateur se rduit celui de Good, et une approximation de celui de SPADE en se limitant 2. Le package entropart fournit la fonction Coverage.N, qui calcule les trois estimateurs (celui de Zhang et Huang par dfaut) :
> library(entropart) > # Chargement du jeu de donnes > data(Paracou618) > Coverage.N(Paracou618.MC$Ns) [1] 0.9226675

Techniques destimation non paramtrique


Dans le cadre dun chantillonnage de individus, on observe 1 espces diffrentes parmi les existantes. Chaque individu a une probabilit dappartenir lespce .

Esty (1983) complt par Zhang et Zhang (2009) a montr que lestimateur tait asymptotiquement normal et a calcul : lintervalle de confiance de O 12 est le quantile dune loi de Student degrs de liberts au seuil de risque
1 1 1 + 2 2 1 = 2

(10)

On ne sait rien sur la loi des . On sait seulement, comme les individus sont tirs indpendamment les uns des autres, que le nombre dindividus de lespce observ dans lchantillon suit une loi binomiale dont lesprance est . La loi a une forme en cloche assez prononce qui fait que la probabilit de rencontrer individus dune espce est maximum pour = , reste assez grande quand varie de 1 et devient 21

Mesures de la biodiversit

rapidement trs faible quand sloigne de (Figure 15).


1 0,9 0,8 0,7 Npi=0,1 0,6

1 =
1

est le nombre despces diffrentes observ, le nombre despces observes fois. Lchantillon peut tre une surface ou un nombre dindividus. Si aucune espce nest observe deux fois, 1 = lestimateur est remplac par 1 1 (1 + 1)2 (Chao, 2004).
2 3

1 + 2 2

(11)

P(ni)=r

Npi=0,5 Npi=1,0 Npi=2,0 Npi=5,0

0,5 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 r 6 7 8 9 10

La variance de lestimateur est connue, mais pas sa distribution :


1 1 1 1 = 2 + Var 2 2 2

Figure 15 : Densit de probabilit de la loi de binomiale, pour diffrentes espces plus ou moins rares (valeurs de ). En abscisse, le nombre dobservations dans lchantillon, en ordonne la probabilit.

Si aucune espce nest observe deux fois :


1 = Var
1

1 1 + 2 4

(12)

Pour les espces frquentes, est grand, et les espces sont observes systmatiquement (Figure 15 : pour = 5, la probabilit de ne pas rencontrer lespce est de lordre de 1%). La difficult est due aux espces pour lesquelles , lesprance du nombre dobservations, est petit. La probabilit de les observer est donne par la loi de binomiale : si est proche de 0, la probabilit dobserver un individu est faible (Figure 15 : pour = 0,1, la probabilit de rencontrer lespce une fois est de lordre de 10%, et pratiquement nulle pour des observations multiples). Les estimateurs non paramtriques cherchent tirer le maximum dinformation de la distribution des abondances pour estimer le nombre despces non observes.

Eren et al. (2012) calculent lintervalle de confiance 95% :


1

1 1 12 1 1 + 2 4 4 1 + 1 4
1

(13)

O :

1 1

1 1 +

(14)

Cet intervalle de confiance est plus petit quand la valeur maximum thorique du nombre despces est connue, ce qui est rarement le cas en cologie. Sa formule est donne en quation 8 de Eren et al. (2012). Chao (1987) utilise une mthode diffrente pour obtenir un estimateur du nombre minimum despces tenant compte du nombre dindividus chantillonns :
1

1 ) Var( 1 2 1+ 2 1 1

(15)

Chao1 et Chao2
Chao (1984) estime le nombre despces non observes partir de celles observes 1 ou 2 fois. Il sagit dun estimateur minimum, valide condition que les singletons et doubletons reprsentent une part importante de linformation. Lestimateur est

2 =
1

Si aucune espce nest observe deux fois, 2 = lestimateur est remplac par +
1 11 (1)

1 )2 ( 1)( s 2 2 s

(16)

22

Lestimateur ACE
Chao et Lee (1992) dveloppent lestimateur ACE (Abundance-based coverage estimator) travers lestimation du taux de couverture . Lestimateur ACE utilise toutes les valeurs de correspondant aux espces rares : concrtement, la valeur limite de note est fixe arbitrairement, gnralement 10. Lestimateur prend en compte le coefficient de variation de la distribution des frquences ( ) : plus les probabilits sont htrognes, plus le nombre despces non observes sera grand. Finalement :
=
>
>

Burnham et Overton (1979) ont utilis cette technique pour obtenir des estimateurs du nombre despces, appels jackknife lordre , prenant en compte les valeurs de 1 . Les estimateurs du premier et du deuxime ordre sont les plus utiliss en pratique :
1 ( 1) s 1 2 (2 3) s ( 2)2 s 1 2 = s + ( 1)

Mesures neutres de la diversit ou

1 =

1 s

(18)

Augmenter lordre du jackknife diminue le biais mais augmente la variance de lestimateur. Chao (1984) a montr que les estimateurs jackknife pouvaient tre retrouvs par approximation de lindice Chao1.

est le nombre despces dites abondantes, observes plus de fois, le nombre despces dites rares, observes est le taux de couverfois ou moins. ture ne prenant en compte que les espces rares. Lestimateur du coefficient de variation est :
2 = max =1 ( 1) ( =1 )(=1

(17)

Calcul
Ces estimateurs peuvent tre calculs de faon relativement simple laide du logiciel SPADE (Chao et Shen, 2010) disponible sur internet 4 . Le guide de lutilisateur prsente quelques estimateurs supplmentaires et des directives pour choisir. Il est conseill dutiliser Chao1 pour une estimation minimale, et ACE pour une estimation non biaise de la richesse. Les intervalles de confiance de chaque estimateur sont calculs par bootstrap : mme quand la variance dun estimateur est connue, sa loi ne lest gnralement pas, et le calcul analytique de lintervalle de confiance nest pas possible. Les estimateurs et leurs intervalles de confiance peuvent galement tre calculs sous R. Le package vegan dispose pour cela de deux fonctions specpool() et estimateR(). specpool() est bas sur les incidences des espces dans un ensemble de sites dobservation et donne une estimation unique de la richesse selon les mthodes Chao2, jackknife (ordre 1 et 2) et bootstrap (non dtaille ici). Lcart-type de lestimateur est galement fourni par la fonction, sauf pour le jackknife dordre 2.
4

Lorsque lhtrognit est trs forte, un autre estimateur est plus performant :
2 2 = max 1

1; 0

1)

Chao et Shen (2010) conseillent dutiliser le 2 deuxime estimateur ds que dpasse 0,8. Lestimateur ACE donne normalement une valeur plus grande que Chao1. Si ce nest pas le cas, la limite des espces rares doit tre augmente.

1 =1 ( 1) ; 0 1) (=1

Lestimateur jackknife
La mthode jackknife a pour objectif de rduire le biais dun estimateur en considrant des jeux de donnes dans lesquels on a supprim un certain nombre dobservations (ce nombre est lordre de la mthode).

http://chao.stat.nthu.edu.tw/softwareCE.html

23

Mesures de la biodiversit

estimateR() est bas sur les abondances des espces et retourne un estimateur de la richesse spcifique par site et non global comme specpool. Exemple : On utilise les donnes de Barro Colorado Island (BCI). La parcelle a t divise en carrs de 1ha. Le tableau dentre est un dataframe contenant, pour chaque espce darbres (DBH 10 cm), ses effectifs par carr. On charge le tableau de donnes :
> library(vegan) > data(BCI)

$Nhat [1] 244 $SE [1] 6.164414 $CI lb ub [1,] 232 256 > # Vrification, quation (18) : > sum(DistNs)+DistNs[1]*(sum(BCI)1)/sum(BCI) 1 243.9991

On utilise la fonction estimateR pour calculer la richesse des 2 premiers carrs :


> estimateR(BCI[1:2,]) 1 2 S.obs 93.000000 84.000000 S.chao1 117.473684 117.214286 se.chao1 12.578970 17.841763 S.ACE 122.848959 117.317307 se.ACE 5.736054 5.571998

La valeur du jackknife 1 fournie par specpool() est fausse. La fonction jackknife() de SPECIES donne le bon rsultat, avec un intervalle de confiance calcul en supposant que la distribution est normale (1,96 carttype au seuil de 95%).

Estimation partir de placettes distantes


Krishnamani et al. (2004) dveloppent une mthode permettant lextrapolation de la richesse mesure sur de petites surfaces (48 placettes de 0,25 ha) de trs grandes zones (60 000 km, la taille des Western Ghats en Indes). Partant de la relation dArrhenius (1921) vue prcdemment, le nombre despces dans une surface 1 est
1

Le package SPECIES (Wang, 2011) permet de calculer les estimateurs jackknife dordre suprieur 2 et surtout choisit lordre qui fournit le meilleur compromis entre biais et variance. Comparaison des fonctions sur lensemble du dispositif BCI ( 1 = 225, 1 = 19) :
> specpool(BCI) Species jack1 jack1.se All 225 236.6053 6.659395 > # librairie SPECIES > library(SPECIES) > # Distribution du nombre d'espces (vecteur: > # noms = nombre d'individus > # valeurs = nombres d'espces ayant ce nombre d'individus) > Ns <- colSums(BCI) > DistNs <- tapply(Ns, Ns, length) > # Mise au format requis (matrice: > # colonne 1 = nombre d'individus > # colonne 2 = nombres d'espces ayant ce nombre d'individus) > DistNs.SPECIES <matrix(c(as.integer(names(DistNs)), DistNs), ncol=2) > jackknife(DistNs.SPECIES) $JackknifeOrder [1] 1

c'est--dire le nombre despces dans la surface 0 plus petite multiplie par le rapport des surfaces la puissance . La valeur de est constante pour des variations de surface limites. Lide est donc de procder par tapes, en partant du nombre despces mesur sur les petites placettes, et extrapolant vers une surface plus grande. Cette surface est ensuite prise pour rfrence pour une nouvelle extrapolation avec une nouvelle valeur de . En indiant les surfaces de 0 , on obtient :

= (1 0 ) 0

(19)

(20 = ( 1 )1 (1 2 )2 (1 0 ) 0 )

24

Il reste valuer les diffrentes valeurs de . lintrieur de chaque placette, lquation (19) est suffisante. A plus grande distance, les auteurs utilisent lindice de Srensen, c'est--dire deux fois la fraction despces communes entre deux placettes : = 2 1 2 1 + 2. Lindice dpend principalement de la surface des placettes et de leur loignement . Pour certaines plages de distances [ , ] vrifiant 2 1 (placettes loignes), est proportionnel ( 2 ) . La valeur de peut donc tre calcule en comptant le nombre despces communes entre chaque paire de placettes, et ajustant ln ln(2 ) sur des plages de distances convenables pour que reste constant, et donc que la relation soit linaire. Cette mthode permet lextrapolation de trs grandes surfaces de mesures de richesse faites sur de petites placettes condition quelles soient assez nombreuses et loignes les unes des autres.

incohrents (intervalle des estimations suprieur 50% de leur moyenne), le critre majeur est lquitabilit (voir page 39). Si elle est faible (de lordre de 0,5-0,6), les estimateurs jackknife 2 4 sont performants, lordre diminuant avec lintensit dchantillonnage (forte : 10%, faible : 0,5% de la communaut). Pour une forte quitabilit (0,8-0,9), on prfrera jackknife 1 ou 2.

Mesures neutres de la diversit ou

Figure 16 : Arbre de dcision du meilleur estimateur du nombre despces, in Brose et al. (2003).

Choix de lestimateur
Des tests pousss ont t mens par Brose et al. (2003) pour permettre le choix du meilleur estimateur de la richesse en fonction de la compltude de lchantillonnage 1. Les auteurs appellent cette proportion couverture (coverage). Le terme completeness a t propos par Beck et Schwanghart (2010) pour viter la confusion avec le taux de couverture dfini par Good (vu page 23). La compltude est infrieure la couverture : toutes les espces sont le mme poids alors que les espces manquantes sont plus rares et pnalisent moins le taux de couverture. Dans tous les cas, les estimateurs jackknife sont les meilleurs. Larbre de dcision est en Figure 16. Le choix dpend principalement de la compltude (coverage sur la figure). Une premire estimation est ncessaire par plusieurs estimateurs. Si les rsultats sont cohrents, choisir un estimateur jackknife dordre dautant plus faible que la compltude est grande. Au-del de 96%, le nombre despce observ est plus performant parce que les jackknifes surestiment . Sils sont

Exemple de BCI : le nombre despces estim par jackknife 1 est 244. La compltude est 225244 = 92%, dans le domaine de validit du jackknife 1 (74% 96%) qui est donc le bon estimateur.

Prdiction de la richesse dun nouvel chantillon


dLa prdiction du nombre despces couvert dans une nouvelle placette dun habitat dans lequel on a dj chantillonn est une question importante, par exemple pour valuer le nombre despces prserves dans le cadre dune mise en rserve, ou valuer le nombre despces perdues en rduisant la surface dune fort.

25

Mesures de la biodiversit
> Sprime <- function(Nprime) NonObs*(1-(1-(1-C)/NonObs)^Nprime) > curve(Sprime, 1, 10000)

Le taux de couverture de linventaire de BCI est trs proche de 100%, donc peu de nouvelles espces seront dcouvertes en augmentant leffort dchantillonnage. La courbe obtenue est en Figure 17.

Sprime(x)

Infrence du nombre despces partir de la SAD


0 2000 4000 x 6000 8000 10000

Distribution de Preston
Preston (1948) fournit ds lintroduction de son modle log-normal une technique destimation du nombre total despces par la clbre mthode des octaves. Elle est disponible dans le package vegan :
> library(vegan) > data(BCI) > veiledspec(colSums(BCI)) Extrapolated Observed Veiled 235.40577 225.0000 10.40577

Figure 17 : Nombres de nouvelles espces dcouvertes en fonction de leffort dchantillonnage supplmentaire (donnes de BCI). Seulement 7 nouvelles espces seront observes en chantillonnant 10000 arbres supplmentaires (environ 25 ha en plus des 50 ha de la parcelle qui contiennent 225 espces).

Shen et al. (2003) proposent un estimateur et le confrontent avec succs des estima0 teurs antrieurs. On note lestimateur du nombre despces non observes dans le lestimateur de son premier chantillon, et taux de couverture. Lestimateur du nombre despces du nouvel chantillon de individus est :
1 0 = 1 1 0
0

Lajustement direct du modle aux donnes, sans regroupement par octaves, est galement possible :
> mod.ll <prestondistr(colSums(BCI)) > veiledspec(mod.ll) Extrapolated Observed Veiled 230.931018 225.000000 5.931018 > plot(mod.ll)

(21)
1 2

ou ACE, ou un autre estimateur : dans tous 0 1 les cas = .


> # Espces non observes > (NonObs <jackknife(DistNs.SPECIES)$Nhatlength(Ns)) [1] 19 > # Taux de couverture > (C <- Coverage.N(Ns)) 1 0.9991146 > # Nouvelles espces en fonction du nombre de nouveaux individus

0 peut tre obtenu par Chao1 ( =

2 2

)
30 Species 0 5 10 15 20 25 35

Exemple de BCI, suite du code de la page 23 : combien de nouvelles espces seront dcouvertes en chantillonnant plus ?

16

32

64

128 256

512

2048

Frequency

26

Maximum de vraisemblance dune distribution de Fisher


Norris et Pollock (1998) supposent que la distribution des espces suit le modle de Fisher (voir page 14) et infrent le nombre despces par maximum de vraisemblance non paramtrique (ils ne cherchent pas infrer les paramtres de la loi de probabilit de mais seulement ajuster au mieux le modle de Poisson aux valeurs de observes). Le calcul est possible avec la librairie SPECIES de R :
> library(SPECIES) > # Distribution du nombre d'espces (vecteur: > # noms = nombre d'individus > # valeurs = nombres d'espces ayant ce nombre d'individus) > Ns <- colSums(BCI) > DistNs <- tapply(Ns, Ns, length) > # Mise au format requis (matrice: > # colonne 1 = nombre d'individus > # colonne 2 = nombres d'espces ayant ce nombre d'individus) > DistNs.SPECIES <matrix(c(as.integer(names(DistNs)), DistNs), ncol=2) > # Regroupement de la queue de distribution : la longueur du vecteur est limite 25 pour allger les calculs. > DistNs.SPECIES[25, 2] <sum(DistNs.SPECIES[25:dim(DistNs.SP ECIES)[1],2]) > DistNs.SPECIES <DistNs.SPECIES[1:25,] > unpmle(DistNs.SPECIES) MLE= 239

suivent une loi gamma et en estimant aussi ses paramtres. La souplesse de la loi gamma permet dajuster le modle des lois diverses et lestimateur de Wang est trs performant. Il est disponible dans SPECIES : fonction pcg. Son dfaut est quil ncessite un trs long temps de calcul (plusieurs heures selon les donnes).
> # Calcul long (15 minutes) > pcg(DistNs.SPECIES) MLE= 236 Selected alpha model: Inf

Mesures neutres de la diversit ou

Infrence du nombre despces partir de courbes daccumulation


Cette approche consiste extrapoler la courbe aire-espces, en contradiction avec les modles prsents plus haut (Fisher, Arrhenius) qui prvoient que le nombre despces augmente indfiniment. Le modle le plus connu est celui de Michaelis-Menten (Michaelis et Menten, 1913) propos par Clench (1979). En fonction de leffort dchantillonnage , valu en temps (il sagit de la collecte de papillons), le nombre despces dcouvert augmente jusqu une asymptote gale au nombre despces total :

Le problme de cette mthode destimation est quelle diverge frquemment. Les calculs naboutissent pas si la queue de distribution nest pas regroupe (il existe 108 valeurs diffrentes de dans lexemple de BCI : aucune des fonctions de SPECIES ne fonctionne en ltat). Wang et al. (2005) ont amlior sa stabilit en pnalisant le calcul de la vraisemblance :
> pnpmle(DistNs.SPECIES) MLE= 239

Sobern M. et Llorente B. (1993) dveloppent un cadre thorique plus vaste qui permet dajuster la courbe daccumulation plusieurs modles. Ces modles sont efficaces empiriquement mais manquent de support thorique pour justifier leur forme.

est une constante, que Clench relie la difficult de collecte.

(22)

Enfin, Wang (2010) perfectionne la technique destimation en supposant que les

27

Mesures de la biodiversit

Lestimation empirique du modle de Michaelis-Menten peut tre faite avec R 5. Les 50 carrs de BCI sont utiliss pour fabriquer une courbe daccumulation :
> data(BCI) > # Cumul du nombre darbres > nArbres <- cumsum(rowSums(BCI)) > # Cumul de linventaire > Cumul <- apply(BCI, 2, cumsum) > # Nombre despces cumules > nEspeces <- apply(Cumul, 1, function(x) length(x[x>0])) > plot(nArbres, nEspeces)

Pour calculer lintervalle de confiance, il est plus simple de passer par une transformation linaire du modle (Lineweaver et Burk, 1934) :
1 1 1 = + (23)

Le nombre despce est estim par linverse de lordonne lorigine du modle.


> > > > > y <- 1/nEspeces x <- 1/nArbres plot(y ~ x) lm1 <- lm(y ~ x) abline(lm1$coef)

220

nEspeces

180

On voit assez clairement que le modle sajuste mal quand il est reprsent sous cette forme.
> (S <- 1/lm1$coef[1]) (Intercept) 217.002 > 1/confint(lm1)[1,] 2.5 % 97.5 % 223.0217 211.2987

100

120

140

160

200

5000

10000 nArbres

15000

20000

Le nombre despce estim est infrieur au nombre observ, qui ne se trouve mme pas dans lintervalle de confiance 95%. Le modle de Michaelis-Menten ne convient pas.

Le modle est ajust par nlsfit. Des valeurs . de dpart doivent tre fournies pour et est la valeur de correspondant = 2. 4 est une approximation suffi , le nombre total despces sante. Pour inventories est un bon choix.
> Ajustement du modle > (nlsfit <- nls(nEspeces ~ S * nArbres/(K + nArbres), data = list(nArbres, nEspeces), start = list(K = max(nArbres)/4, S = max(nEspeces)))) K S 1251.0 232.8 > # Courbe ajuste > x <- seq(from=0, to=max(nArbres), length=255) > lines(x = x, y = predict(nlsfit, newdata = list(nArbres = x)))

Combien y a-t-il despces diffrentes sur Terre ?


La question de lestimation du nombre total despces gnre une abondante littrature. Mora et al. (2011, tableau 1) en font une revue et proposent une mthode nouvelle. Dans chaque rgne, le nombre de taxons de niveaux suprieurs (phylums, classes, ordres, familles et mme genres) est estim par des modles prolongeant jusqu leur asymptote les valeurs connues en fonction du temps. Cette mthode est applicable jusquau niveau du genre (Figure 18, A E). Le nombre de taxon de chaque niveau est li celui du niveau prcdent, ce qui est reprsent par la Figure 18, G sous la forme du relation linaire entre le logarithme du logarithme du nombre de taxons et le rang (1 pour phylums, 5 pour genres). La droite est

Fiche TD de J.R. Lobry : http://pbil.univlyon1.fr/R/pdf/tdr47.pdf

28

prolonge jusquau rang 6 pour obtenir le nombre despces. Une faon alternative de dcrire la mthode est de dire que le nombre de taxons du niveau + 1 est gal celui du niveau la puissance . La pente de la droite de la figure est ln. Aucune justification de ce rsultat majeur nest donne par les auteurs, si ce nest leur vrification empirique.

Indice de Simpson
Dfinition

Mesures neutres de la diversit ou

On note la probabilit quun individu tir au hasard appartienne lespce . Lindice de Simpson (1949), ou Gini-Simpson, est :
2 = 1 =1

(24)

Figure 18 : volution du nombre de taxons connus en fonction du temps et valeur estime du nombre total (ligne horizontale grise, A E). Le nombre despces connues est trop faible pour utiliser cette mthode (F). Il est obtenu par extrapolation de la relation du nombre de taxons dun niveau celui du niveau suprieur (G). In Mora et al. (2011), fig. 1, Animalia seulement.

Il peut tre interprt comme la probabilit que deux individus tirs au hasard soient despces diffrentes. Il est compris dans lintervalle [0; 1[. Sa valeur diminue avec la rgularit de la distribution : = 0 si une seule espce a une probabilit de 1, = 1 1 si les espces ont la mme probabilit = 1 . La valeur 1 est atteinte pour un nombre infini despces, de probabilits nulles. Il est parfois interprt comme un indice dquitabilit (Morin et Findlay, 2001 par exemple), mais le nombre despces intervient clairement dans sa valeur : pour une rgularit identique, lindice augmente avec le nombre despces. Deux autres formes de lindice sont utilises. Tout dabord, la probabilit que deux individus soient de la mme espce, souvent appele indice de concentration de Simp-

Le nombre total despces estim est 8,7 millions, tous rgnes confondus, dans la fourchette des estimations prcdentes (de 3 100 millions), et ncessitant prs de 500 ans dinventaires au rythme actuel des dcouvertes (May, 2011).

Tableau 1 : Nombre despces actuellement inventories et nombre estim par Mora et al. (2011, tableau 2).

29

Mesures de la biodiversit

son :
2 = =1

(25)

La fonction Simpson.N de entropart accepte comme argument un vecteur dabondances (et non de probabilits) et propose par dfaut la correction de Lande
> Simpson.N(colSums(BCI)) [1] 0.9737209

Enfin, une forme dite rciproque , plus rare :


= 1 (26)

Indice de Shannon
Dfinition
Lindice de Shannon (Shannon, 1948 ; Shannon et Weaver, 1963), aussi appel indice de Shannon-Weaver ou ShannonWiener, est driv de la thorie de linformation.
= ln
=1

est en ralit la mesure dquitabilit fonde sur lindice de Simpson, not 2 (voir page 40). La nomenclature est assez confuse pour toutes les formes de lindice, il est prudent de vrifier que la formule de calcul correspond bien au nom annonc. Lestimateur du maximum de vraisemblance de lindice est :
2 = 1 =1
1

(27)

(29)

Le calcul de lindice de Simpson peut se faire avec la fonction diversity syntaxe : diversity(x, index = "simpson") disponible en chargeant la librairie vegan de R ou avec la fonction Simpson.P de la librairie entropart :
> library(vegan) > data(BCI) > Ps <- colSums(BCI)/sum(BCI) > Simpson.P(Ps) [1] 0.9736755

Considrons une placette forestire contenant espces vgtales diffrentes. La probabilit quune plante choisie au hasard appartienne lespce est note . On prlve plantes, et on enregistre la liste ordonne des espces des plantes. Si est suffisamment grand, le nombre de plantes de lespce est . On note le nombre de listes respectant ces conditions :
= ! =1( )! (30)

Biais dchantillonnage
est lgrement biais parce Lestimateur que toutes les espces nont pas t chantillonnes. Un estimateur non biais est (Good, 1953 ; Lande, 1996) :
2 = 1 1
=1
1

Dmonstration : Le nombre de positions possibles dans la liste pour les individus de la premire es pce est . Le nombre de positions
1 pour la deuxime espce est . Pour 2 me la s espce, le nombre est 1 1 . 1

(28)

La correction par ( 1) tend rapidement vers 1 quand la taille de lchantillon augmente : lestimateur est trs peu biais.

Les produits de combinaisons se simplifient pour donner lquation (30).

30

On peut maintenant crire le logarithme de : ln = ln ! =1 ln . On utilise lapproximation de Stirling, ln ! ln , pour obtenir aprs simplifications :
ln = ln
=1

Le calcul de lindice de Shannon peut se faire avec la fonction diversity syntaxe : diversity(x, index = "shannon") disponible en chargeant la librairie vegan de R ou avec la fonction Shanon.P de la librairie entropart :
> Ps <- colSums(BCI)/sum(BCI) > Shannon.P(Ps) [1] 4.270409

Mesures neutres de la diversit ou

(31)

Il est possible dobtenir des listes de plantes ne respectant pas les probabilits individuelles, mais comme on suppose assez grand, leur probabilit doccurrence est faible (loi des grands nombres) et elles peuvent tre ngliges. = ln est l'indice de Shannon. Ce rsultat est connu sous le nom de formule de Brillouin (1962). lorigine, Shannon a utilis un logarithme de base 2 pour que soit le nombre moyen de questions binaires (rponse oui ou non) ncessaire pour identifier lespce dune plante (un caractre utilis dans une chane dans le contexte du travail de Shannon). Les logarithmes naturels, de base 2 ou 10 ont t utiliss par la suite (Pielou, 1966a). La formule (31) est celle de lindice de Theil (1967), prsent en dtail par Conceio et Ferreira (2000), lorigine utilis pour mesurer les ingalits de revenu puis pour caractriser les structures spatiales en conomie. Lindice est proportionnel au nombre de plantes choisies, on peut donc le diviser par n et on obtient lindice de biodiversit de Shannon. Ces indices ont t dfinis en choisissant des lettres au hasard pour former des chanes de caractres. Leur valeur est le nombre de chanes de caractres diffrentes que lon peut obtenir avec lensemble des lettres disponibles, c'est--dire la quantit dinformation contenue dans lensemble des lettres. Lindice de Shannon donne une mesure de la biodiversit en tant que quantit dinformation. Lestimateur du maximum de vraisemblance de lindice est :
= ln
=1
1

Bulmer (1974) tablit une relation entre lindice de Shannon et lindice de Fisher, condition que la distribution de labondance des espces soit log-normale :
= ( + 1) (1) (33)

est () est la fonction digamma, et lestimateur de lindice de Fisher (voir page 14) : > digamma(fisher.alpha (colSums(BCI))+1)-digamma(1) [1] 4.148323

La sous-estimation est assez svre sur cet exemple.

Biais dchantillonnage
Basharin (1959) a montr que lestimateur de lindice de Shannon tait biais parce que des espces ne sont pas chantillonnes. Si est le nombre despces rel et le nombre dindividus chantillonns, le biais est :
= 1 + (2 ) 2 (34)

(2 ) est un terme ngligeable. La valeur estime partir des donnes est donc trop faible, dautant plus que le nombre despces total est grand mais dautant moins que lchantillonnage est important. Comme le nombre despces nest pas observable, le biais rel est inconnu. Chao et Shen (2003) tablissent un estimateur non biais partir du taux de couverture de : lchantillonnage 31

(32)

Mesures de la biodiversit
1

ln = 1 1
=1

(35)

Multiplier les frquences observes par le taux de couverture permet dobtenir un estimateur non biais des probabilits prenant en compte les espces non observes. Le terme au dnominateur est la correction de Horvitz et Thompson (1952) : chaque terme de la somme est divis par la probabilit dobserver au moins une fois lespce correspondante. Il tend vers 1 quand la taille de lchantillon augmente. Beck et Schwanghart (2010) montrent que la correction du biais est efficace, mme des niveaux de compltude de lchantillonnage (voir page 25) trs faibles. La fonction Shannon.N de entropart accepte comme argument un vecteur dabondances (et non de probabilits) et permet la correction de Chao et Shen.
> Shannon.N(colSums(BCI), Correction = "ChaoShen") [1] 4.275285

destimation. La fonction logarithme fournit un exemple simple : lesprance de ln( ) nest pas le logarithme de lesprance de parce que la fonction ln est concave. Chaque estimateur fluctue autour de mais vaut en moyenne. cause de la concavit, ln( ) est en moyenne infrieur ln( ) : cette relation est connue sous le nom dingalit de Jensen (1906). Lindice de Shannon est concave (Figure 19) donc son estimateur (32) est biais ngativement, mme sans prendre en considration les espces non observes.

-x * log(x)

Pielou (1966b) a dvelopp une autre mthode de correction de biais lorsque de nombreux relevs de petite taille sont disponibles. ln est calcul pour un relev choisi alatoirement puis les donnes du premier relev sont ajoutes celles dun autre, puis un autre jusqu ce que = ln naugmente plus : la diversit augmente dans un premier temps mais se stabilise quand leffet des espces ajoutes est compens par celui de la diminution de lquitabilit due aux espces prsentes dans tous les relevs. partir de ce seuil, laugmentation de ln par individu ajout est calcule pour chaque relev supplmentaire. Son esprance, estime par sa moyenne calcule en ajoutant tous les rele. vs disponibles, est Enfin, la littrature de physique statistique sest abondamment intresse cette question (Bonachela et al., 2008 en fait une revue). Le problme trait est la nonlinarit de lindice de Shannon par rapport aux probabilits qui entraine un biais 32

0.0 0.0

0.1

0.2

0.3

0.2

0.4 x

0.6

0.8

1.0

Le biais peut tre valu par simulation 7 : 10000 tirages sont raliss dans une loi normale desprance choisie et dcarttype 0.01. Le biais est la diffrence entre
6

Figure 19 : courbe 6 de entre 0 et 1.

Code R : > curve(-x*log(x), 0.0001, 1)

Code R : > Biais.p <- function (p) { + Ps <- rnorm(10000, p, 0.01) + p*log(p)-mean(Ps*log(Ps)) + } > Biais <- function (Ps) { + # Applique Biais.p chaque valeur de Ps + sapply(Ps, Biais.p) + } > curve(Biais, 0.05, .95) > abline(h=0, lty=2)

ln (connu) et la moyenne des 1000 valeurs de ln (la probabilit est estime par sa ralisation chaque tirage). La valeur du biais en fonction de est en Figure 20. Le biais de lindice de Shannon est la somme des biais pour toutes les probabilits spcifiques de la communaut tudie, et son calcul est toujours lobjet de recherches.

Le biais destimation diminue avec mais lerreur quadratique augmente. Schrmann suggre dutiliser = 12 comme meilleur compromis. La fonction Shannon.N permet toutes ces corrections :
> # Grassberger 1988 > Shannon.N(colSums(BCI), Correction = "Grassberger") [1] 4.276599 > Shannon.N(colSums(BCI), Correction = "Grassberger2003") [1] 4.276491 > Shannon.N(colSums(BCI), Correction = "Schurmann") [1] 4.276094

Mesures neutres de la diversit ou

Biais(x)

-0.0006

-0.0004

-0.0002

0.0000

-0.0010

Entropie : introduction
Dfinition de lentropie
0.2 0.4 x 0.6 0.8

-0.0012

-0.0008

Grassberger (1988) a fourni la correction de rfrence :


=
=1
1

entre 0 et 1. Figure 20 : biais de

Les textes fondateurs sont Davis (1941) et surtout Theil (1967) en conomtrie, et Shannon (1948 ; 1963) pour la mesure de la diversit. Une revue est fournie par Maasoumi (1993). Considrons une exprience dont les rsultats possibles sont {1 , 2 , , }. La probabilit dobtenir est , et = {1 ; 2 ; ; }. Les probabilits sont connues a priori. Tout ce qui suit est vrai aussi pour des valeurs de continues, dont on connatrait la densit de probabilit.

Grassberger (2003) la perfectionne :


= () ( )
=1
1

( ) est la fonction digamma.

(1) ln() ( ) + 1

(36)

Enfin, Schrmann (2004) la gnralise pour dfinir une famille de corrections dpendant dun paramtre :
=
=1
1

(1) 0 1 +

1 1

(37)

() ( ) (1)

1 1 1

(38)

1 +

On considre maintenant un chantillon de valeurs de . La prsence de dans lchantillon est peu tonnante si est grande : elle apporte peu dinformation supplmentaire par rapport la simple connaissance des probabilits. En revanche, si est petite, la prsence de est surprenante. On dfinit donc une fonction dinformation, ( ), dcroissante quand la probabilit augmente, de (0) = + (ou ventuellement une valeur strictement positive finie) (1) = 0. Chaque valeur observe dans lchantillon apporte une certaine quantit dinformation, dont la somme est linformation de lchantillon. 33

Mesures de la biodiversit

Entropie relative
10

0.0

0.2

0.4 p

0.6

0.8

1.0

Figure 21 : Fonctions dinformation utilises dans le nombre despces (trait plein), lindice de Shannon (pointills longs) et lindice de Simpson (pointills). Linformation apporte par lobservation despces rares dcrot du nombre despces lindice de Simpson.

La quantit dinformation attendue de lexprience est =1 ( ) = ( ). Si on choisit ( ) = ln( ), ( ) est lindice de Shannon, mais bien dautres formes de ( ) sont possibles. ( ) est appele entropie. Cest une mesure de lincertitude (de la volatilit) du rsultat de lexprience. Si le rsultat est certain (une seule valeur vaut 1), lentropie est nulle. Lentropie est maximale quand les rsultats sont quiprobables. Si est la distribution des probabilit des espces dans une communaut, Patil et Taillie (1982) montrent que :

Considrons maintenant les probabilits formant lensemble obtenues par la ralisation de lexprience. Elles sont diffrentes des probabilits , par exemple parce que lexprience ne sest pas droule exactement comme prvu. On dfinit le gain dinformation ( , ) comme la quantit dinformation supplmentaire fournie par lobservation dun rsultat de lexprience, connaissant les probabilits a priori. La quantit totale dinformation fournie par lexprience, =1 ( , ) = ( , ), est souvent appele entropie relative. Elle peut tre vue comme une distance entre la distribution a priori et la distribution a posteriori. Il est possible que les distributions et soit identiques, que le gain dinformation soit donc nul, mais les estimateurs empiriques ntant pas exactement gaux entre eux, des tests de significativit (, ) seront ncessaires. de la valeur de

I(p) 0 2 4

Quelques formes possibles de (, ) sont : La divergence de Kullback-Leibler (Kullback et Leibler, 1951) connue par les conomistes comme lindice de dissimilarit de Theil (1967) :

= ln

=1

Si ( ) =

Ces trois fonctions dinformation sont reprsentes en Figure 21 8.

despces moins 1, Si ( ) = ln( ), alors ( ) est lindice de Shannon, Si ( ) = 1 , alors ( ) est lindice de Simpson.

, alors ( ) est le nombre

= ln
=1

Sa proche parente, appele parfois deuxime mesure de Theil (Conceio et Ferreira, 2000, p. 34), qui inverse simplement les rles de et :

(39)

(40)

> curve((1-x)/x, 0, 1, lty=1, xlab="p", ylab="I(p)", ylim=c(0,10)) > curve(-log(x), 0, 1, lty=2, add=TRUE) > curve(1-x, 0, 1, lty=3, add=TRUE)

Le code R ncessaire pour raliser la figure est:

34

1 ( , ) = 1 ( + 1)
=1

Lentropie gnralise (Maasoumi, 1993), dordre :

Il montre que respecte les 3 axiomes.

Mesures neutres de la diversit ou

Patil et Taillie (1982) ont montr de plus que : Lintroduction dune espce dans une communaut augmente sa diversit (consquence de la dcroissance de ( )), Le remplacement dun individu dune espce frquente par un individu dune espce plus rare augmente lentropie condition que ( ) soit concave. Dans la littrature conomique sur les ingalits, cette proprit est connue sous le nom de Pigou-Dalton (Dalton, 1920).

(41)

On peut montrer que = 0 et = 1 .

Lentropie relative est essentielle pour la dfinition de la diversit prsente dans le chapitre suivant. En se limitant la diversit , on peut remarquer que lindice de Shannon est la divergence de Kullback-Leibler entre la distribution observe et lquiprobabilit des espces (Marcon et al., 2012).

Entropie et biodiversit : historique


MacArthur (1955) est le premier avoir introduit la thorie de linformation en cologie (Ulanowicz, 2001). MacArthur sintressait aux rseaux trophiques et cherchait mesurer leur stabilit : lindice de Shannon qui comptabilise le nombre de relations possibles lui paraissait une bonne faon de lvaluer. Mais lefficacit implique la spcialisation, ignore dans qui est une mesure neutre (toutes les espces y jouent le mme rle). MacArthur a abandonn cette voie. Les premiers travaux consistant gnraliser lindice de Shannon sont dus Rnyi (1961). Lentropie dordre de Rnyi est :
1 = ln 1
=1

Hill (1973) transforme lentropie de Rnyi en nombres de Hill , qui en sont simplement lexponentielle :

Le souci de Hill est de rendre les indices de diversit intelligibles aprs larticle remarqu de Hurlbert (1971) intitul le nonconcept de diversit spcifique . Hurlbert reprochait la littrature sur la diversit sa trop grande abstraction et son loignement des ralits biologiques, notamment en fournissant des exemples dans lesquels lordre des communauts nest pas le mme selon lindice de diversit choisi. Les nombres de Hill sont le nombre despces quiprobables donnant la mme valeur de diversit que la distribution observe. Ils sont des transformations simples des indices classiques :

=
=1

1 1

(43)

(42)

Rnyi pose galement les axiomes pour une mesure dentropie ( ), o = {1 ; 2 ; ; } :


La symtrie : les espces doivent tre interchangeables, aucune na de rle particulier et leur ordre est indiffrent, La mesure doit tre continue par rapport aux probabilits, La valeur maximale est atteinte si toutes les probabilits sont gales.

Ces rsultats avaient dj t obtenus avec une autre approche par MacArthur (1965) et repris par Adelman (1969) dans la littrature conomique. Tsallis (1988) propose une classe de mesures appele entropie gnralise, dfinie par Havrda et Charvt (1967) pour la premire fois et redcouverte plusieurs fois, 35

est le nombre despces, = , lexponentielle de lindice de Shannon, 2 = 1(1 ), linverse de lindice de concentration de Simpson.
1

Mesures de la biodiversit

notamment par Darczy (1970), do son nom entropie HCDT (voir Mendes et al., 2008, page 451 pour un historique complet) :

= [1 + (1 ) ]1

(46)

Tsallis a montr que les indices de Simpson et de Shannon taient des cas particuliers dentropie gnralise. Ces rsultats ont t complts par dautres et repris en cologie par Keylock (2005) et Jost (2006; 2007). L encore :

1 = 1 1
=1

(44)
0 lnq(p) -10 0.0 -8 -6 -4 -2

Le nombre despces moins 1 est 0 , Lindice de Shannon est 1 , Lindice de Gini-Simpson est 2 .

0.2

0.4 p

0.6

0.8

1.0

Entropie HCDT
Lentropie HCDT est particulirement attractive parce que sa relation avec la diversit au sens strict est simple, aprs introduction du formalisme adapt (les logarithmes dforms). Son biais destimation peut tre corrig globalement, et non seulement pour les cas particuliers (nombre despces, Shannon, Simpson). Enfin, sa dcomposition sera prsente en dtail dans le chapitre suivant.

Figure 22 : Valeur du logarithme dordre de probabilits entre 0 et 1 pour diffrentes valeurs de : = (trait plein), la courbe est une droite ; = (pointills longs) : logarithme naturel ; = (pointills courts) : la courbe a la mme forme que le logarithme naturel pour les valeurs positives de ; = (pointills alterns) : la courbe est convexe pour les valeurs ngatives de .

Enfin, le logarithme dform est subadditif :


lnq () = lnq + lnq ( 1)lnq lnq

(47)

Ses proprits sont les suivantes :

Logarithmes dforms
Lcriture de lentropie HCDT est largement simplifie en introduisant le formalisme des logarithmes dforms (Tsallis, 1994). Le logarithme dordre est dfini par :
1 1 lnq = 1 (45)

1 = 1 lnq lnq () = lnq + 1 lnq 1 lnq = lnq lnq lnq

(48)

Et :

Le logarithme dform converge vers le logarithme naturel quand 1 (Figure 22).

Sa fonction inverse est lexponentielle dordre : 36

Pour > 1, lim+ lnq = 1( 1), donc nest pas dfini pour > 1( 1). Ces fonctions sont implmentes dans le package entropart : lnq(x, q) et expq(x, q). Lentropie dordre scrit :

1+(1 )

(49)

lnq

(50)

Cette forme est bien plus simple que celle de lquation (44) et sinterprte comme une gnralisation de lentropie de Shannon (Marcon et al., submitted). Le calcul de peut se faire avec la fonction Tsallis.P de la librairie entropart :
> Ps <- colSums(BCI)/sum(BCI) > q <- 1.5 > Tsallis.P(Ps, q) [1] 1.715954

communaut, la diversit de la mtacommunaut doit tre .

Mesures neutres de la diversit ou

Lintrt de ces approches est de fournir une dfinition paramtrique de la diversit, qui donne plus ou moins dimportance aux espces rares :

Entropie et diversit
On voit immdiatement que lentropie de Tsallis est le logarithme dordre du nombre de Hill correspondant, comme lentropie de Rnyi en est le logarithme naturel.

= lnq =

(51)

Lentropie est utile pour les calculs : la correction des biais dchantillonnage notamment. Les nombres de Hill, ou nombres despces quivalentes ou nombres despces efficaces permettent une apprhension plus intuitive de la notion de biodiversit (Jost, 2006). En raison de leurs proprits, notamment de dcomposition (voir le chapitre suivant), Jost (2007) les appelle vraie diversit . Hoffmann et Hoffmann (2008) critiquent cette dfinition totalitaire 9 et fournissent une revue historique plus lointaine sur les origines de ces mesures. Quoiquil en soit, les nombres de Hill respectent le principe de rplication (Chao et al., 2010, section 3 pour une discussion et un historique) : si communauts de mme taille, de mme niveau de diversit , mais sans espces en commun sont regroupes dans une mtaJost (2009) reconnat quun autre terme aurait pu tre choisi ( diversit neutre ou diversit mathmatique par exemple).
9

= 1min() est linverse la proportion de la communaut reprsente par lespce la plus rare (toutes les autres espces sont ignores). Le biais dchantillonnage est incontrlable : lespce la plus rare nest pas dans lchantillon tant que linventaire nest pas exhaustif. 0 est le nombre despces (alors que 0 est le nombre despces moins 1) est la mesure classique qui donne le plus dimportance aux espces rares : toutes les espces ont la mme importance, quel que soit leur effectif en termes dindividus. Il est bien adapt une approche patrimoniale, celle du collectionneur qui considre que lexistence dune espce supplmentaire a un intrt en soi, par exemple parce quelle peut contenir une molcule valorisable. Comme les espces rares sont difficiles chantillonner, le biais dchantillonnage est trs important, et sa rsolution a gnr une littrature en soi (voir page 13 et suivantes). 1 est lexponentielle de lindice de Shannon donne la mme importance tous les individus. Il est adapt une approche dcologue, intress par les interactions possibles : le nombre de combinaisons despces en est une approche satisfaisante. Le biais dchantillonnage est sensible (voir page 30). 2 est linverse de lindice de concentration de Gini-Simpson donne moins dimportance aux espces rares. Hill (1973) lappelle le nombre despces trs abondantes . Il comptabilise les interactions possibles entre paires dindividus : les espces rares interviennent dans peu de paires, et influent peu sur lindice. En consquence, le biais dchantillonnage est trs petit (page 31). = 1 est linverse de lindice de Berger-Parker (Berger et Parker, 1970) 37

Mesures de la biodiversit

Le calcul de peut se faire avec la fonction Diversity.P de la librairie entropart :


> Ps <- colSums(BCI)/sum(BCI) > q <- 1.5 > Diversity.P(Ps, q) [1] 49.57724

qui est la proportion de la communaut reprsente par lespce la plus abondante : = max( ). Toutes les autres espces sont ignores.

La conversion de lestimateur dbiais de lentropie en estimateur de la diversit pose un nouveau problme puisque nest pas une transformation linaire de . Ce dernier biais peut tre nglig (Grassberger, 1988) parce que , lentropie, est la valeur moyenne de linformation de nombreuses espces indpendantes et fluctue donc peu cause de lchantillonnage, contrairement aux estimateurs des probabilits. Les fonctions Tsallis.N et Diversity.N de entropart acceptent comme argument un vecteur dabondances (et non de probabilits) et proposent par dfaut la correction combinant Chao et Shen et Grassberger
> Tsallis.N(colSums(BCI), q=1) [1] 4.276599 > Diversity.N(colSums(BCI), q=1) [1] 71.99514

Biais dchantillonnage
La correction du biais dchantillonnage pour lentropie HCDT repose sur deux approches :

Celle de Chao et Shen (2003), tendue audel de lentropie de Shannon (Marcon et al., submitted) qui prend en compte les espces non observes, Celle de Grassberger (1988) qui prend en compte la non-linarit de lestimateur.

Le domaine de validit des deux corrections est diffrent. Quand est petit, les espces rares non observes ont une grande importance alors que est presque linaire : la correction de Grassberger disparat quand = 0. Quand est grand (au-del de 2), linfluence des espces rares est faible, la correction de Chao et Shen devient ngligeable alors que la non-linarit augmente. Un compromis raisonnable consiste utiliser le plus grand des deux estimateurs. Lestimateur de Chao et Shen est :
=
1

Celui de Grassberger est :


1 =1 = 1 O =

1

1 1 =1

lnq

(52)

() est la fonction gamma. Lestimateur est linaire par rapport : le problme est donc rsolu par la construction de lestimateur non biais de . 38

( +1)

( +1)

(1) (1+ ) sin (+1)

(53)

Profils de diversit

Indice de Hurlbert
Dfinition

Mesures neutres de la diversit ou

200

Lindice de Hurlbert (1971) est le nombre despces observes dans un chantillon de taille choisie :
= [1 (1 ) ] =1

Diversit

100

150

(54)

0.0

0.5

1.0 q

1.5

2.0

Chaque terme de la somme est la probabilit dobserver au moins une fois lespce correspondante. Laugmentation de la valeur de permet de donner plus dimportance aux espces rares. Lindice peut tre converti en nombre quivalent despces (Dauby et Hardy, 2012) nots partir de la relation :

Figure 23 : Profil de diversit 10 calcul pour BCI. La correction du biais dchantillonnage est la plus grande de Chao-Shen et Grassberger.

Leinster et Cobbold (2011), aprs Patil et Taillie (1982), Tothmeresz (1995) et Kindt et al. (2006), recommandent de tracer des profils de diversit, c'est--dire la valeur de la diversit en fonction de lordre (Figure 23) pour comparer plusieurs communauts. Une communaut peut tre dclare plus diverse quune autre si son profil de diversit est au-dessus de lautre pour toutes les valeurs de . Si les courbes se croisent, il ny a pas de relation dordre (Tothmeresz, 1995). Pallmann et al. (2012) ont dvelopp un test statistique pour comparer la diversit de deux communauts pour plusieurs valeurs de simultanment.
10

50

Lquation doit tre rsolue pour obtenir partir de la valeur de estime, numriquement pour > 3.

1 1

(55)

Dans deux cas particuliers, les nombres quivalents despces de Hurlbert sont identiques aux nombres de Hill : 2 = 2 et 0 = .

Biais dchantillonnage

Code R :

> q.seq <- seq(0, 2, .1) > Ns <- colSums(BCI) > UBdiversity <- sapply(q.seq, function(q, N, Correction) Diversity.N(N, q, Correction), N=Ns, Correction="Best") > plot(y=UBdiversity, x=q.seq, type="l", col="black", lwd=2, xlab="q", ylab="Diversit", main="")

Hurlbert fournit un estimateur non biais de son indice ( est la taille de lchantillon, le nombre dindividus de lespce ) :

Dauby et Hardy (2012) montrent que cet estimateur est trs peu sensible la taille de lchantillon, et obtient de meilleurs rsultats sur ce point que les estimateurs de Chao et Shen pour lindice de Shannon ou du nombre despces. 39

= 1
=1

(56)

Mesures de la biodiversit

Le calcul de la diversit de Hurlbert est possible avec le logiciel BiodivR 11 (Hardy, 2010).

lity pouvant tre utilis dans un sens plus large) :

quitabilit
La rgularit dune distribution est une notion intuitivement assez simple : la faiblesse de lcart entre la distribution relle et une distribution parfaitement rgulire, vrifiant = 1 (Lloyd et Ghelardi, 1964).

Lquitabilit dordre est le rapport de la diversit dordre sur la richesse. Cette dfinition respecte tous les critres de Dalton (1920) :

(58)

Une expression de lquitabilit est souvent donne partir de lindice de Shannon (Lloyd et Ghelardi, 1964 ; Pielou, 1966a; 1975). La valeur maximale de lindice de Shannon est obtenue quand la distribution est parfaitement rgulire. Alors : = ln. On a donc dfini lindice, parfois appel indice de Pielou :
= (57)

Invariance par duplication : lquitabilit ne change pas si chaque espce est remplace par plusieurs nouvelles espces ayant la mme abondance. Lquitabilit diminue quand un individu est transfr dune espce rare une espce frquente. Lquitabilit diminue quand une espce rare est ajoute. Invariance dchelle : lquitabilit ne dpend que des frquences, pas des abondances absolues.

est compris entre 0 (une seule espce a une probabilit de 1) et 1 (toutes les espces ont la mme probabilit). Mendes et al. (2008) gnralisent lindice de Pielou en remplaant lindice de Shannon par lentropie de Tsallis (ils dfinissent = ) et tracent des profils dquitabilit, c'est--dire la valeur de en fonction de . Ils observent que lquitabilit est minimale pour une valeur particulire de quils notent et explo rent les proprits de et . La limite de cette approche est labsence de correction des biais dchantillonnage et surtout la mauvaise dfinition de lquitabilit (voir cidessous). Dautres mesures dquitabilit existent (Smith et Wilson, 1996 ; Ricotta et al., 2001 ; Ricotta, 2003). Une revue critique en est faite par Tuomisto (2012) qui argumente en faveur dune dfinition stricte de lquitabilit (evenness en Anglais, equitabi11

Figure 24 : Courbes de Lorenz de plusieurs jeux de donnes. Les espces sont classes par frquence croissante, et la courbe reprsente la frquence cumule des espces. Plus la courbe est loin de la bissectrice, plus le jeu de donnes est inquitable. Figure extraite de Tuomisto (2012).

http://ebe.ulb.ac.be/ebe/Software.html

Un critre supplmentaire tabli par Smith et Wilson (1996) est la compatibilit avec la courbe de Lorenz (1905), construite en classant les espces de la moins frquente la plus frquente, et en traant le cumul des frquences en fonction du rang (Figure 12) : une communaut parfaitement quitable est reprsente par la bissectrice, la surface entre la courbe relle et la bissectrice est trs utilise en conomie pour mesurer lingalit sous le nom d indice de Gini

40

(Gini, 1912 ; Ceriani et Verme, 2012). Une mesure dquitabilit compatible doit tre plus grande pour une communaut si sa courbe de Lorenz est plus proche de la bissectrice. Si les courbes de deux communauts se croisent, lordre de leurs quitabilits est imprvisible. Lindice de Pielou est le plus utilis dans la littrature (Tuomisto, 2012) mais nest pas

compatible avec la courbe de Lorenz et nest pas invariant par duplication parce quil ne normalise pas une diversit mais une entropie. Lutilisation de est donc bien prfrable, 1 = remplaant avantageusement .

Mesures neutres de la diversit ou

41

DIVERSIT ET DCOMPOSITION
La notion de diversit a t introduite par Whittaker (1960, p. 320) comme le niveau de changement dans la composition des communauts, ou le degr de diffrentiation des communauts, en relation avec les changements de milieu. La traduction de cette notion intuitive en une dfinition sans ambigut est encore une question de recherche et de dbats. Un forum a t consacr la question dans Ecology (Baselga, 2010 ; Jost, 2010 ; Ricotta, 2010 ; Veech et Crist, 2010a; 2010b ; Wilsey, 2010), conclu par Chao et al. (2012), et une revue a t faite par Tuomisto (2010a; 2010b). Dans la littrature, la diversit est toujours une mesure drive (Ellison, 2010), c'est-dire calcule partir des diversits et , do un abondant dbat sur lindpendance souhaite mais pas toujours observe entre les valeurs de diversit et (Baselga, 2010 ; Jost, 2010 ; Veech et Crist, 2010a). Des exemples montrent comment calculer cette diversit, principalement laide du package entropart. Le package contient les donnes dinventaire de deux hectares du dispositif de Paracou :
> library(entropart) > # Chargement du jeu de donnes > data(Paracou618)

Les donnes sont organises dans le package sous la forme dun objet MetaCommunity qui contient notamment la matrice des . Les parcelles de Paracou sont dans lobjet Paracou618.MC.
> Paracou618.MC

Pour simplifier lexpos, les individus seront chantillonns dans des communauts, appartenant une mta- communaut. Le Tableau 2 rsume les notations.

Tuomisto (2010a) passe en revue lensemble des dfinitions de la diversit dans un article ardu mais trs complet. Toutes ont en commun :

Dfinitions de la diversit

Enfin, toute ambigut sera vite en appelant entropie les indices de diversit qui sont des mesures dentropie (Shannon, Simp son) et diversit leur nombre quivalent .
Communaut communaut . lespce .

Une dfinition de la mesure de diversit, applique la diversit , qui est gnralement une des mesures vues dans le chapitre prcdent,
Total : mta-communaut

: nombre dindividus de lespce dans la Espce = + est lestimateur de la probabilit quun individu de la communaut soit de

+ = =

Total

+ : nombre dindividus de la communaut. : poids de la communaut

: nombre total dindividus chantillonns

43

Mesures de la biodiversit

Lutilisation des nombres de Hill, la mesure locale de la diversit et la dfinition de la diversit comme rapport des diversits et permet de dfinir la vraie diversit (Jost, 2006; 2007) qui est un nombre de communauts quivalentes (compositionnal units) similaire au nombre despces quivalentes des diversits et . Tuomisto (2011) milite pour que le terme diversit soit rserv la vraie diversit (homogne un nombre despces) et que les autres mesures soient appeles diffremment : entropie de Shannon ou probabilit de GiniSimpson notamment.

Une dfinition de la diversit , qui peut tre par exemple : La diversit locale mesure dans chaque communaut, indpendamment de toute rfrence hors de la communaut, De faon quivalente, le nombre despces efficaces dans les communauts. Une faon de combiner les diversits et pour obtenir la diversit , par exemple : = =

la somme pondre des diversits (intracommunauts) et (inter-communauts), toutes les diversits tant positives ou nulles. Il note que la partition serait plus facilement interprtable si les diffrentes composantes de la diversit pouvaient tre exprims au moyen de la mme formule (ce qui nest en fait jamais le cas). Une revue sur les avantages de la dcomposition additive est propose par Veech et al. (2002). Un dbat assez strile est dcoul de lopposition entre les deux approches, principalement d la transformation logarithmique (Jost, 2006), des dfinitions imprcises et des dmonstrations empiriques remises en question (Baselga, 2010 ; Veech et Crist, 2010a). Il reste que la dcomposition multiplicative permet seule la dfinition de la diversit en tant que vraie diversit (Chao et al., 2012). Jurasinski et al. (2009) distinguent plusieurs types de mesures de diversit :

Le dbat sur la dcomposition


Lobjectif est de dcomposer la diversit totale, note en une composante intergroupes, note et une composante intragroupes note . Lande (1996) a une approche additive et postule que les mesures de diversits doivent tre concaves : la diversit dun jeu de donnes regroupant plusieurs communauts doit tre suprieure ou gale la somme pondre des diversits dans chaque communaut. De cette faon, il est possible de dfinir une diversit totale gale 44 Whittaker (1960; 1972) est lauteur de ce concept. Il a pos le principe que la diversit devait tre le produit des diversits et .

Marcon et al. (2012) montrent que lentropie de Shannon est une mesure de diversit de diffrentiation en donnant sa dfinition indpendamment de et . Cest galement une diversit proportionnelle, comme toutes les mesures passes en revue par Tuomisto : la diversit de Shannon permet dunifier les deux approches. Lindice de Shannon, coupl son expression sous forme de nombre de Hill, respecte finalement tous les critres imposs ou souhaits. Sa dcomposition est dtaille cidessous. Enfin, Marcon et al. (submitted) gnralisent ce rsultat toutes les mesures

La diversit dinventaire (inventory diversity), qui traite des donnes rcoltes sur une unit spatiale, ce qui correspond la dfinition des diversits et . La diversit de diffrentiation (differentiation diversity), qui mesure quel point les units spatiales sont diffrentes, ce qui correspond la dfinition de la diversit donne plus haut La diversit proportionnelle (proportional diversity), diversit qui se construit par diffrence ou rapport des diversits et .

de diversits drives de lentropie gnralise de Tsallis.

dans une seule, / serait cet indice de chevauchement. Pour 1 (Chao et al., 2012) :
= 1
1

Diversit et dcomposition

Dcomposition multiplicative de la diversit


Jost (2007) et Chao et al. (2012) ont montr que la dcomposition des nombres de Hill en lments indpendants est multiplicative :

Et :
1

1 1 1 1 1

(60)

et sont les nombre de Hill dordre gaux aux diversits et . Ce sont des nombres quivalents despces (cf. page 35). est le nombre de communauts efficaces ou nombres de communauts quivalentes , c'est--dire le nombre de communauts de poids gal ne possdant aucune espce en commun, qui fourniraient la mme valeur de diversit .

(59)

a t dfini lorigine pour 2. Chao et al. (2012) ltendent sans prcaution quelconque. Sa valeur peut tre ngative pour < 1, on se limitera donc 1.

1 = ln 1 + ln =1 =1 =1 ln

(61)

Dcomposition de lindice de Shannon


La dcomposition explicite (Tableau 3) est due Marcon et al. (2012) : la diversit est la divergence de Kullback-Leibler entre la distribution des espces dans chaque parcelle et la distribution moyenne, appele divergence de Jensen-Shannon (Lin, 1991). Les diversits et sont les complments ln des indices de dissimilarit de Theil (39), divergences de Kullback-Leibler entre les distributions des espces et leur quiprobabilit. La forme de avait t tablie par Ricotta et Avena (2003), sans la relier celle de et . Enfin, lide de la dcomposition de la divergence de Kullback-Leibler, mais avec une approche diffrente, sans rapprochement avec lindice de Shannon, a t publie par Ludovisi et Taticchi (2006). Les mta-communauts peuvent leur tour tre regroupes un niveau suprieur, la diversit du niveau infrieur devenant diversit pour le niveau suprieur. La dcomposition ou le regroupement peuvent tre effectus sur un nombre quelconque de niveaux. 45

La mesure de diversit est le nombre quivalent de communauts totalement distinctes qui fourniraient le niveau de diversit .

Lindice de chevauchement

Cette mesure na de sens que compare nombre de communauts (not ici et non I pour conserver le nom de lindice tabli dans la littrature). Plutt quune simple normalisation suggre par Jost (2007), Chao et al. (2008) dfinissent un indice de chevauchement, c'est--dire la proportion despces partages en moyenne par une communaut. Si les communauts de mmes diversits et que les donnes, contenaient chacune espces quifrquentes, dont seraient communes toutes les communauts et les autres reprsentes

Mesures de la biodiversit

Indice

Distribution observe Frquence des espces dans la communaut

Distribution attendue Frquences gales, hors formule

Formule = ln =

Frquence des espces dans la communaut

Frquence totale des espces

= ln

Tableau 3 : Dfinition explicite de la diversit de Shannon en tant que divergence entre une distribution observe et une distribution attendue. Les indices et sont les complments au logarithme du nombre despces de cette divergence.

Frquence des espces dans la mta-communaut

Frquences gales, hors formule

= ln

Calcul sous R : La fonction BetaEntropy.MC calcule lentropie de la mtacommunaut (largument = 1 permet de choisir lentropie de Shannon).
> # Pas de correction du biais dchantillonnage > BetaEntropy.MC(Paracou618.MC, q=1, Correction = "None") $Communities P006 P018 0.3499358 0.5771645 $Total [1] 0.4471751

0.2949188 0.4514132 $Total [1] 0.3618884

Tests
Test de significativit
Lobjectif est de tester si deux communauts ne sont pas simplement deux chantillons dune mme communaut, dont les diffrences ne sont que des fluctuations dues au hasard. Sous lhypothse nulle, les observations sont des ralisations des mmes probabilits . Le test est ralis de la faon suivante :

Biais dchantillonnage
Lestimateur du taux de couverture de la , le taux de couvercommunaut est not . Lestimateur sans biais de ture total est :
+ 1 ln + + = =1 1 1 + (62)

Tous les estimateurs de diversit doivent tre dbiaiss (voir page 31). Calcul sous R : BetaEntropy.MC applique cette correction :
> BetaEntropy.MC(Paracou618.MC, q=1, Correction="ChaoShen") $Communities P006 P018

Les effectifs de chaque communaut sont tirs dans une loi multinomiale est calcul, (+ , + ) et La simulation est rpte un grand nombre de fois, par exemple 10 000, et les valeurs extrmes sont limines. Au seuil de risque = 5%, les 251me et 9750me valeurs simules dfinissent les bornes de lintervalle de confiance de lhypothse nulle.

Lhypothse nulle est rejete si la valeur nest pas dans cet intervalle, observe de en gnral au-del de la borne suprieure. Il peut arriver que les deux communauts soient plus semblables que sous lhypothse

46

nulle, c'est--dire que les frquences varient moins que dans le tirage dune loi multinomiale, si deux communauts ont t cres artificiellement avec le mme nombre dindividus de chaque espce par exemple. Lorsque les donnes sont issues de communauts relles, le sens mme de ce type de test est remis en question (Jones et Matloff, 1986) : les communauts relles ne pouvant pas tre exactement identiques, il suffit daugmenter la taille de lchantillonnage pour prouver leur diffrence.

Correction des biais

Diversit et dcomposition

Intervalle de confiance de

Lintervalle de confiance de lestimateur de peut tre calcul de la mme manire en simulant les communauts par des tirages dans des lois multinomiales suivant leurs frquences : (+ , + ). Si lintervalle de confiance ne contient pas 0, lgalit des distributions est rejete. Calcul sous R : la fonction DivEst produit un graphique avec lintervalle de confiance :
> DivEst(q = 1, Paracou618.MC, Simulations = 1000, Graphic = TRUE)
Beta Diversity

Les simulations ncessaires aux tests crent un biais dchantillonnage : les espces les plus rares dans les communauts souvent limines par les tirages. La correction du biais des tirages recentre leur distribution autour des valeurs originales des communauts non dbiaises. Il nexiste pas de correction analytique pour corriger successivement le biais d aux simulations (d la perte des espces rares des communauts relles) puis celui d lchantillonnage des communauts elles-mmes (d la nonobservation des espces rares de la communaut). Marcon et al. (2012) effectuent la deuxime correction par un recentrage de la distribution de simule autour de sa valeur observe dbiaise, ce qui permet dobtenir lintervalle de confiance de lestimateur de . La distribution de lestimateur sous lhypothse nulle ne peut pas tre dbiaise compltement : elle est systmatiquement surestime.

Dcomposition de lentropie gnralise


La dcomposition additive de lentropie selon Lande (1996) doit tre la suivante :

Density

10

15

1.50

1.55

1.60 Diversity

1.65

Par dfaut, DivEst corrige les biais. Les rsultats sont prsents sous forme de diversit et non dentropie, la valeur attendue en cas dgalit des communauts est 1.

La diversit est la somme pondre des diversits des groupes constituant la population totale. Le poids de chaque groupe est , souvent choisi gal au nombre dindividus de la communaut divis par le nombre total ou la surface de chaque groupe, mais qui peut tre arbitraire, tant que = . Deux faons de pondrer la somme mergent de la littrature (Chao et al., 2012). La dfinition classique est selon Routledge (1979) :

= +

(63)

47

Mesures de la biodiversit

La pondration propose par Jost (2007) est :


1(1 )

(64)

La premire est la pondration naturelle. La seconde, qui pondre par les poids la puissance , prsente des avantages dtaills par Chao et al. mais son utilisation ne garantit pas que la diversit soit suprieure la diversit si les poids des communauts ne sont pas gaux. Bourguignon (1979) comme Lande (1996) dfinissent une mesure dingalit dcomposable comme respectant les proprits suivantes :

1(1 )

(65)

Ceci est la dcomposition de Jost (2007). Jost dsigne sous le nom de composante de lentropie le logarithme dordre de la diversit, quil note . La dcomposition nest pas additive, mais est indpendant de lentropie .

= + lnq ( 1) lnq

(66)

Les deux derniers termes peuvent tre regroups et rarrangs pour obtenir conformment la dcomposition additive de lquation (63) :

= lnq

Lentropie est la somme pondre par (et pas autrement) des contributions de chaque communaut :

(67)

En passant par les nombres de Hill, Jost (2007) montre que lindice de Shannon est le seul pouvant tre dcompos de cette faon.

La population totale tant partitionne, chaque partition recevant un poids , la composante intra-groupe de la mesure est gale la somme pondre des mesures dans chaque-groupe = ,. La composante intergroupe est la mesure dingalit entre les groupes. La mesure totale est la somme des mesures intra et intergroupes.

est une divergence de Kullback-Leibler gnralise (Borland et al., 1998). De mme, peut scrire sous la forme = ln : la formalisation de la dcomposition est une gnralisation de la dcomposition de lentropie de Shannon, rsume dans le Tableau 4. Il est intressant dcrire et sous la forme dentropies, pour faire apparatre leur fonction dinformation. Pour diffrent de 1, lentropie est :

= lnq

(68)

La dmonstration de Jost repose sur le postulat que la transformation de lentropie en nombre de Hill, dfinie pour la diversit , doit avoir la mme forme pour la diversit . La remise en cause de ce postulat (Marcon et al., submitted) permet de dcomposer la diversit dordre quelconque quel que soit le poids des communauts. La dcomposition de lentropie est faite en crivant le logarithme dordre de la dcomposition de la diversit, quation (59) :

Sa fonction dinformation a t trace Figure 21, page 34. Lentropie est :


1 1

(69)

(70)

48

Diversit et dcomposition
Indice Shannon
1

Entropie = ln
1

Diversit =
1

Entropie gnralise

1 = ln

= lnq

= lnq

Tableau 4 : Entropie et diversit. Lentropie de chaque communaut se calcule comme lentropie .

1 1

1+(1 )

Calcul sous R : Les fonctions AlphaEntropy.MC, BetaEntropy.MC, GammaEntropy.MC et AlphaDiversity.MC, BetaDiversity.MC, GammaDiversity.MC permettent de calculer les entropies et diversits. DivPart calcule tout en mme temps :
> DivPart(q = 1, Paracou618.MC, Biased = FALSE) $TotalAlphaDiversity [1] 91.70413 $TotalBetaDiversity [1] 1.464258 $GammaDiversity [1] 134.2786 $CommunityAlphaDiversities P006 P018 81.6996 107.0175 $TotalAlphaEntropy [1] 4.518567 $TotalBetaEntropy [1] 0.3813489 $GammaEntropy [1] 4.899916 $CommunityAlphaEntropies P006 P018 4.403049 4.672992

Dcomposition du nombre despces


Les rsultats gnraux se simplifient pour = 0. Lentropie est le nombre despces de la mta-communaut moins un ( 0 = 1), lentropie est la moyenne pondre du nombre despces des communauts moins un ( 0 = 1), lentropie est la diffrence : 0 = . En termes de diversit :
0

peut tre suprieur au nombre de communauts (Chao et al., 2012) si les poids sont trs ingaux, ce qui complique son interprtation. La pondration de Jost donne pour le nombre despces le mme poids toutes les communauts et garantit 0 , ce qui constitue pour Chao et al. un argument en faveur de son utilisation.

(71)

49

Mesures de la biodiversit

Dcomposition de lindice de GiniSimpson


Lentropie de Simpson peut aussi tre dcompose comme une variance. La probabilit quun individu appartienne lespce est . Elle suit une loi de Bernoulli, dont la variance est (1 ). Cette variance peut tre dcompose entre les communauts, o la probabilit est . La dcomposition entre variance intra et inter-communauts est :
(1 )

la dcomposition multiplicative permet lindpendance, et Jost propose dutiliser une transformation de 2 comme mesure de diffrentiation (voir page 45).

Jost postule que la diversit de Simpson a la mme relation que les diversits et :

1 1 1 = 1 1 1

(74)

Do une dcomposition additive diffrente, qui correspond sa dcomposition gnrale (66) :


= + (75)

= [ (1 ) + ( )2 ]

(72)

Cette galit peut tre somme sur toutes les espces pour donner :
= + ( )2 = +

(73)

Lentropie de Simpson peut tre dcompose en sa diversit , somme pondre des entropies des communauts, et son entropie , gale la somme pondre des distances 2 entre la distribution des frquences dans chaque communaut et celle de lensemble de la communaut. En gntique, lgalit scrit = + (Nei, 1973). est lhtrozygotie totale, dcompose en , lhtrozygotie moyenne des populations et la diffrentiation absolue entre populations. = est la diffrentiation relative.

Il ny a en ralit aucune raison pour que le nombre quivalent de la diversit ait la mme forme que celle de la diversit : les deux diversits sont par nature trs diffrentes, et Hill ne traitait pas la diversit . La diversit de Shannon est exceptionnelle parce que, pour des raisons diffrentes, son nombre de Hill est lexponentielle de lentropie, et lexponentielle de la dcomposition additive (63) est la dcomposition multiplicative (59). Le nombre quivalent de communauts a une forme lgrement diffrente dun nombre de Hill (Tableau 4).

Synthse
La diversit mesure par lentropie gnralise peut tre dcompose dans tous les cas de figure, y compris lorsque les poids des communauts ne sont pas gaux. Les formules dentropie et de diversit sont rsumes dans le Tableau 4. Lentropie de Shannon est un cas particulier dans lequel toutes les controverses disparaissent : lentropie est indpendante de lentropie , et la pondration de Jost se confond avec celle de Routledge.

Lentropie calcule de cette manire est gale 2 calcule lquation (70) pour le cas gnral, mais la contribution de chaque communaut est diffrente : la dcomposition de la variance est une faon alternative de dcomposer lentropie, valable uniquement pour lentropie de Simpson. Cette dcomposition est remise en cause par Jost (2007; 2008). tant infrieur ou gal 1, nest pas indpendant de : seule 50

Lentropie de Simpson peut tre dcompose de deux faons : comme une variance quand les poids des communauts sont donns par leurs effectifs, ou selon le cas gnral. Les deux dcompositions produisent les mmes valeurs dentropie , mais la contribution de chaque communaut nest pas la mme. Lentropie peut tre dcompose hirarchiquement sur plusieurs niveaux (Crist et al., 2003 ; Marcon et al., 2012). Les probabilits doccurrence des espces ne sont pas connues mais estimes partir des donnes. Les diversits et sont sousestimes, la diversit surestime (Marcon et al., 2012), dautant plus que lordre de diversit est faible (le biais est ngligeable au-del de lindice de Simpson). Des mthodes de correction existent (voir le chapitre prcdent), mais pas pour lentropie lexception de Shannon. La mthode gnrale consiste donc corriger les entropies et , calculer lentropie par diffrence et transformer les rsultats en nombres quivalents (Marcon et al., submitted). Enfin, il est possible (Crist et al., 2003) mais controvers (Jones et Matloff, 1986) de tester la significativit de la diffrence entre communauts. Une meilleure approche consiste calculer lintervalle de confiance de la diversit due lincertitude sur les estimateurs de probabilits.

Le partitionnement de la diversit selon Plissier et Couteron


Cadre

Diversit et dcomposition

Un cadre gnral de partitionnement de la diversit, applicable aux trois indices classiques, est propos par Plissier et Couteron (2007), en conclusion dune srie darticles (Plissier et al., 2003 ; Couteron et Plissier, 2004). Les donnes sont dsagrges jusquau niveau de lindividu. Suivant les notations prcdentes, les placettes sont considres comme le regroupement darbres, indics par . Le Tableau 5 est appel tableau doccurrence des espces. Il ne contient que des 0 et des 1. Chaque arbre (colonne) a une seule valeur 1 dans la cellule correspondant son espce.

Un arbre moyen sil pouvait exister appartiendrait partiellement chaque espce, proportionnellement son effectif. Chaque arbre apporte une quantit dinformation gale la somme sur toutes les espces des carts quadratiques entre la valeur , indicatrice de son appartenance lespce , et la valeur correspondant larbre moyen :
Parcelle Arbre Fort Total

Placette Famille Total Genre Espce = 1 si larbre appartient lespce , 0 sinon. = +

Tableau 5 : Tableau doccurrence des espces.

+ = + = 1

51

Mesures de la biodiversit

( )2. La somme peut tre pondre pour donner une importance plus ou moins grande des espces selon leur frquence : ( )2. La mesure totale, somme sur tous les arbres, est note :
= ( )2

tifs), note , alors que la diversit est rsiduelle, note . La diversit totale est . La diversit est calcule de la mme manire, en prenant pour rfrence la frquence des espces lintrieur de chaque placette. Dans la placette :

(76)

Si le poids vaut toujours 1, est lindice de Simpson. Si = ln(1 )(1 ), on obtient lindice de Shannon, et = 1 donne le nombre despces moins 1.

Dcomposition
Lintrt de la mthode est de permettre lutilisation de modles linaires et des outils informatiques associs classiques pour dcomposer la diversit de diffrentes manires (Plissier et Couteron, 2007). Nous nous intresserons ici la dcomposition de la diversit totale en diversits et . Dans ce cadre, la diversit est la partie explique par le modle (les diffrentes communauts sont les paramtres explica-

La diversit est calcule de faon similaire par la diffrence entre les frquences des espces dans chaque placette ( ) et leur frquence aprs regroupement .

(77)

Le problme est que le poids attribu chaque espce, , dpend de la distribution totale des espces. nest donc pas une diversit puisque sa valeur dpend de donnes extrieures la placette. Le poids = 1 pour toutes les espces rgle le problme. Le modle est alors celui de la dcomposition de lindice de Simpson prsent plus haut.

52

DIVERSIT FONCTIONNELLE ET
PHYLOGNTIQUE

Les mesures neutres de la diversit considrent que toutes les classes auxquelles les objets appartiennent sont diffrentes, sans que certaines soient plus diffrentes que dautres. Par exemple, toutes les espces sont quidistantes les unes des autres, quelles appartiennent au mme genre ou des familles diffrentes. Intuitivement, lide quune communaut de espces toutes de genres diffrents est plus diverse quune communaut de espces du mme genre est satisfaisante. Il sagit donc de caractriser la diffrence entre deux classes dobjets, puis de construire des mesures de diversit en rapport (Cousins, 1991).

Cadre
Dissimilarit et distance
Une similarit ou dissimilarit est toute application valeurs numriques qui permet de mesurer le lien entre les individus dun mme ensemble ou entre les variables. Pour une similarit le lien est dautant plus fort que sa valeur est grande. Un indice de dissimilarit (on peut dire une dissimilarit) vrifie ( et sont deux individus) :

De nombreuses mesures de diversit ont t cres et plusieurs revues permettent den faire le tour (Ricotta, 2007 ; Pavoine et Bonsall, 2011). Les mesures prsentes ici sont les plus utilises, et notamment celles qui peuvent tre ramenes aux mesures classiques en fixant une distance gale entre toutes les espces. Des exemples montrent comment calculer cette diversit, principalement laide du package entropart. Le package contient les donnes dinventaire de deux hectares du dispositif de Paracou et la taxonomie des espces concernes :
> library(entropart) > # Chargement du jeu de donnes > data(Paracou618)

Une distance vrifie en plus :

La dissimilarit dun individu avec luimme est nulle : (, ) = 0. La dissimilarit entre deux individus diffrents est positive : (, ) 0. La dissimilarit est symtrique : (, ) = (, ) La distance entre deux individus diffrents est strictement positive : (, ) = 0 = . Lingalit triangulaire : (, ) (, ) + (, ). De nombreux indices de dissimilarit ne vrifient pas cette proprit.

Une distance est euclidienne si elle peut tre reprsente par des figures gomtriques. On peut rendre toute distance euclidienne par ajout dune constante (Cailliez, 1983). Dans R, utiliser is.euclid() pour vrifier quune distance est euclidienne, et cailliez() pour la transformation. Enfin, une distance est ultramtrique si (, ) max (, ), (, ). Les distances obtenues en mesurant les longueurs 53

Mesures de la biodiversit

des branches dun dendrogramme (arbre) rsultant dune classification hirarchique sont ultramtriques. La faon exacte de mesurer les longueur de branche est illustr par la Figure 26, page 56 : la distance entre les espces 1 et 2 est + + .

Distance phylogntique

La faon la plus vidente de dfinir une distance entre espces est dutiliser la taxonomie, en attribuant une distance arbitraire (par exemple 1) deux espces du mme genre, une autre (par exemple 2) deux espces de la mme famille, etc. La distance dfinie est ultramtrique. La taxonomie peut tre remplace avantageusement par une phylognie. La phylognie idale contiendrait lhistoire volutive de toutes les espces et les distances seraient les temps de divergence depuis le premier anctre commun. En pratique, les phylognies sont tablies partir dun nombre de marqueurs gntiques limits, sans datation prcise (mais avec des calages partiels partir de fossiles), et ne sont pas toujours ultramtriques. Elles peuvent prendre en compte chaque individu, sans regroupement par espce. Dans tous les cas, la distance est une mesure de la divergence volutive.

La premire tape consiste donc choisir un ensemble de traits pertinents et les mesurer de faon standardise (Cornelissen et al., 2003). Toute la stratgie relative la photosynthse peut tre par exemple assez bien rsume par la masse surfacique des feuilles (Wright et al., 2004), mais, en fort tropicale, ce trait est dcorrl de la densit du bois (Baraloto et al., 2010a). Dans des communauts trs diverses, la stratgie dchantillonnage est soigner particulirement (Baraloto et al., 2010b). La prise en compte de variables qualitatives ou de rangs et la possibilit de donnes manquantes pose un problme pratique de construction du dendrogramme, trait par Gower (1971). La formule de Gower, tendue par Podani (1999) dautres types de variables, calcule la dissimilarit entre deux espces par la moyenne des dissimilarits calcules pour chaque trait, dont la valeur est comprise entre 0 et 1 :

Pour une variable quantitative, la diffrence de valeur entre deux espces est normalise par ltendue des valeurs de la variable, Les variables ordonnes sont remplaces par leur rang et traites comme les variables quantitatives Pour des variables qualitatives, la dissimilarit vaut 0 ou 1, Les valeurs manquantes sont simplement ignores et nentrent pas dans la moyenne.

Distance fonctionnelle
Lapproche fonctionnelle est diffrente. Chaque espce ou individu est reprsent par ses valeurs de traits dans un espace multidimensionnel. Le vecteur de traits est considr comme un proxy de la niche cologique. Les individus proches dans lespace des traits sont donc considrs comme proche cologiquement. Les distances entre les points peuvent tre calcules directement dans lespace des traits ou, plus frquemment, un arbre est construit par classification automatique hirarchique.

Une matrice de dissimilarits est construite de cette faon. Podani et Schmera (2006) suggrent dutiliser une classification hirarchique par UPGMA (Sokal et Michener, 1958) quils montrent tre la plus robuste (pour le calcul de FD, voir page 56) lajout ou au retrait dun trait ou dune espce. Un dendrogramme fonctionnel na pas dinterprtation aussi claire quun arbre phylogntique qui reprsente le processus de lvolution. Il peut tre interprt comme la reprsentation des chelles de plus en plus grossires en allant vers le haut de larbre de regroupements fonctionnels dans des niches de plus en plus vastes.

54

Diversit fonctionnelle et phylogntique

quivalence des deux diversits


Lapproche fonctionnelle tant particulirement complexe et lourde mettre en uvre (notamment pour la mesure des traits sur chaque individu), la tentation a t grande de considrer que la phylognie contenait plus dinformation fonctionnelle que ce qui pouvait tre mesur, et donc de considrer la diversit phylogntique comme proxy de la diversit fonctionnelle. Webb (2000) a montr que des communauts darbres tropicaux avaient une moins grande diversit phylogntique locale quattendue sous lhypothse nulle dune distribution alatoire des espces, et a suppos que la cause en tait le filtrage environnemental local, agissant sur les traits et observables par la phylognie, sous lhypothse de conservation phylogntique des traits fonctionnels. La discipline appele cologie phylogntique des communauts cherche encore comprendre quels traits sont conservs et lesquels sont convergents (Cavender-Bares et al., 2009). Swenson et Enquist (2009) ont montr que la relation entre les deux diversits tait faible. Lutilisation de la diversit phylogntique comme proxy de la diversit fonctionnelle est maintenant dconseille

(Pavoine et Bonsall, 2011).

Typologie des mesures


partir de la littrature (Ricotta, 2007 ; Pavoine et Bonsall, 2011), une typologie des mesures de diversit merge. Elle tend les notions classiques de richesse et quitabilit. La richesse est laccumulation de classes diffrentes dans les mesures classiques. Dans un arbre phylogntique, la longueur des branches reprsente un temps dvolution : la richesse en est la somme. FD, et PD sont des mesures de richesse. La rgularit est une notion plus complexe (Figure 25). Elle mesure la faon dont les espces occupent uniformment lespace des niches (Pavoine et Bonsall, 2011). Cette notion est simple dans un espace multidimensionnel (par exemple, lespace des traits fonctionnels). Dans un arbre phylogntique, la rgularit de larbre est un premier critre, complt ventuellement par les abondances. Dans un arbre parfaitement rgulier, la rgularit se rduit lquitabilit. Les mesures de divergence sont des fonctions croissantes de la dissimilarit entre les espces, gnralement considres par paire. Certaines sont pondres par les abondances, dautres non. Dans un arbre parfai-

Figure 25 : Rgularit contre irrgularit (Regularity vs. Skewness). Les arbres de A D sont de plus en plus irrguliers. Larbre A, parfaitement rgulier, est le cadre des mesures classiques de la diversit. La phylognie tant donne, trois vecteurs dabondance (P1 P3) sont de moins en moins rguliers : dans les cas C et D, la rgularit maximale nest pas obtenue pour des effectifs identiques, mais en augmentant les effectifs des espces originales (voir Maximum thorique, page 57). La figure est issue de Pavoine et Bonsall (2011, fig. 1)

55

Mesures de la biodiversit

tement rgulier, lindice de Simpson est une mesure de divergence pondre. Ces mesures sont influences par la richesse et la rgularit. Lentropie phylogntique permet dunifier ces notions.

les espces sont lies la mme racine (on dira que larbre est parfaitement rgulier), PD et FD sont gales la richesse spcifique. Le package entropart fournit la fonction PDFD.P :
> # Vecteur des probabilits > Ps <- Paracou618.MC$Ps > PDFD.P(Ps, Paracou618.Taxonomy) [1] 395

Biais dchantillonnage
Les mesures de diversit fonctionnelle et phylogntique sont sujettes aux biais dchantillonnage, mais il nexiste pas de technique de correction dans la littrature. Les mesures dentropie phylogntique peuvent tre corriges.

Indice de Rao
Lindice de Rao est une mesure de divergence pondre.

FD et PD
Les indices les plus simples sont la diversit phylogntique (Faith, 1992) et sa transposition, la diversit fonctionnelle (Petchey et Gaston, 2002). tant donn un arbre contenant toutes les espces ou tous les individus tudis, PD ou FD sont gaux la somme de la longueur des branches (Figure 26).

Principe
partir de relevs fournissant la frquence de chaque espce par communaut et dune matrice de dissimilarit entre paires despces, lindice de Rao (1982) donne la dissimilarit moyenne entre deux individus choisis au hasard. Lindice de Rao est souvent appel entropie quadratique en raison de sa forme mathmatique.

Formalisation
Les espces sont prises deux deux et sont donc indices ici par et

Figure 26 : Mesure de la diversit fonctionnelle FD dune communaut hypothtique de 7 espces. FD est la somme des longueurs des branches ( + + + + ). La ligne pointille horizontale reprsente la mthode plus ancienne de regroupement des espces un niveau arbitraire (Petchey et Gaston, 2002, figure 1)

On note la matrice de dissimilarit dont les lments sont , la dissimilarit entre lespce et lespce . Il nest pas ncessaire ce stade que soit une distance. est le vecteur des probabilits dont et dont des lments : Lindice de Rao est :
( ) =

(78)

Dans le cas particulier ou toutes les branches sont de longueur 1, c'est--dire que toutes 56

Discussion
La dfinition de la distance est essentielle :

Diversit fonctionnelle et phylogntique

Pavoine et al. (2005b) ont montr que lutilisation de distances ordinaires fait que la valeur maximale de lentropie quadratique pour un effectif donn est obtenue en liminant les espces intermdiaires en ne retenant que les espces extrmes (le rsultat est vident en une dimension : la variance est maximale en ne retenant que les valeurs extrmes dun chantillon). Ce rsultat est contraire aux proprits attendues dun indice de diversit. Les auteurs ont tabli que lutilisation de distances ultramtriques corrige ce dfaut. Lindice atteint alors son maximum pour des frquences dautant plus grandes que lespce est originale (Pavoine et al., 2005a). Lestimation empirique de lindice se fait simplement en estimant les probabilits par les frquences. Le biais destimation na pas t tudi, mais il est probablement trs faible, par analogie avec lestimateur de lindice de Simpson : les espces rares interviennent peu.

en fixant = 1 si deux espces sont diffrentes, on obtient lindice de GiniSimpson(Gini, 1912 ; Simpson, 1949). Sa valeur peut tre interprte comme la probabilit quune paire dindividus choisie au hasard soit de deux espces diffrentes. Dans un espace unidimensionnel o la valeur associe lespce est une variable quantitative , choisir = ( )2 2 rend lindice de Rao gal la variance de .

vaut 2 pour des raisons propres ADE4) au lieu de larbre lui-mme :


> divc(as.data.frame(Ps), Paracou618.Taxonomy$Wdist)

divc peut traiter plusieurs communauts simultanment ; Rao.P peut tre utilis avec la fonction apply :
> divc(as.data.frame (Paracou618.MC$Psi), Paracou618.Taxonomy$Wdist) diversity P006 2.820856 P018 2.876405 > apply(Paracou618.MC$Psi, 2, Rao.P, Paracou618.Taxonomy) P006 P018 2.820856 2.876405

Maximum thorique
Pavoine et al. (2005a) ont dfini loriginalit dune espce comme sa frquence maximisant lentropie quadratique, sachant la matrice de distances entre espces. Les espces les plus originales sont celles ayant le moins despces proches dans la classification. Loriginalit nest pas intressante dans une taxonomie : une phylognie doit tre cre pour illustrer cette notion. Le fichier rao.traits.csv contient une espce par ligne, identifie par le champ Code, et un certain nombre de valeurs de traits en colonnes.
> # Lecture des donnes : traits pour 34 espces > read.csv2 ("http://www.ecofog.gf/IMG/csv/rao. traits.csv", row.names=1, header=T)-> traits

Calcul sous R
Le package entropart fournit la fonction Rao.P :
> # Vecteur des probabilits > Ps <- Paracou618.MC$Ps > Rao.P(Ps, Paracou618.Taxonomy) [1] 0.9593776

Le rsultat est un data frame nomm traits 8 lignes (espces) et 6 colonnes (traits) :
> # Aperu > traits[1:4, 1:3] SLA Am Ess 10.10341 97.88627 Me 14.27473 63.52255 S1 13.71211 73.57748 Sr 10.71081 68.03988

Le package ADE4 permet le calcul avec la fonction divc qui utilise un format diffrent pour les probabilits et surtout la matrice des racines carres du double des distances de lobjet phylog (chaque lment de $Wdist

Gm 1.454455 1.493502 1.963457 1.305796

La matrice de distances est cre par classification automatique hirarchique. 57

Mesures de la biodiversit
> # ACP sur les traits foliaires > pcaf <- dudi.pca(traits, scale=T, scannf=FALSE, nf=2) # Figure 27 > scatter(pcaf)
d=

Le rsultat de la classification est un objet hclust qui doit tre transform en phylog pour la suite de lanalyse :
> # Transformation de l'arbre du format hclust au format phylog > phyf <- hclust2phylog(hf) > # Affichage avec poids des variables, Figure 29. > table.phylog(pcaf$tab[names (phyf$leaves),], phyf)
CvsN Thick SLA

Ef

Gm

Am

Vm

Sr
Me Ess S1 Sr Bg Dg

Ess

SLA

Me

Thick Am CvsN

S1

Bg
Gm

Figure 27 : ACP sur les traits foliaires

Ef

Vm

pcaf est une liste qui contient les rsultats de lACP, utiliser pour la classification :
-1.5 -0.5 0.5 1.5 2.5

Dg

> # CAH Ward des traits foliaires > hf <- hclust(dist(pcaf$tab), "ward")

Figure 29 : Classification automatique des espces, reprsente par table.phylog

Cluster Dendrogram
10

La limite des distances ultramtriques est leur tendance dformer le jeu de points. Dans cet exemple, les deux premiers axes de lACP rendent compte de presque toute linertie. Le nuage de points est pratiquement contenu dans un plan alors que sa reprsentation en distance ultramtrique est une hypersphre en 7 dimensions (voir Pavoine et al., 2005b). Le calcul de loriginalit des espces utilise la fonction originality :
> dotchart.phylog(phyf, originality(phyf, 5))

Height 2 4

Ess

Vm

Me

Dg

S1

Bg

Sr

Ef

dist(pcaf$tab) hclust (*, "ward")

Figure 28 : Classification automatique des espces > # Figure 28 > plot(hf, h=-1)

La fonction a pour paramtres lobjet phylog contenant la classification et le numro de la mthode de calcul utiliser, 5 pour lentropie quadratique. Sa reprsentation graphique est faite par dotchart.phylog :

58

Diversit fonctionnelle et phylogntique


QEbased

Le deuxime terme de la somme est la diversit inter-communauts. Cest un indice de Rao : les poids des communauts sont quivalents aux tableaux de frquences et les dissimilarits entre communauts sont quivalentes aux dissimilarits entre espces de lquation (78). La divergence entre communauts est construite partir des entropies de chacune : lentropie est dfinie comme la diffrence entre les entropies et . Lexemple suivant utilise les communauts du fichier rao.effectifs.csv :
> # Vecteur contenant 8 espces... > (read.csv2 ("http://www.ecofog.gf/IMG/csv/rao. effectifs.csv", row.names=1, header=T)-> effectifs) P1 P2 P3 P4 Ess 97 36 34 61 Me 62 24 49 4 S1 4 6 6 75 Sr 71 78 99 36 Vm 76 29 34 2 Bg 58 49 47 19 Ef 9 34 91 35 Dg 98 14 95 14

-1

Figure 30 : Originalit des espces

Loriginalit (Figure 30) ne repose que sur larbre, pas sur la frquence des espces. Si la distance utilise nest pas ultramtrique, il existe plusieurs distributions possibles despces qui maximisent la diversit (Pavoine et Bonsall, 2009), le concept doriginalit na pas de sens dans ce cas.

Il contient 4 communauts.

Dcomposition
La diversit de la mta-communaut, peut tre dcompose en une somme (pondre) de diversits intra et une diversit inter (Pavoine et al., 2004) en dfinissant une dissimilarit entre les communauts et :
, = 2

Pour obtenir tous les lments de lquation (80) :

() : diversit totale. Calculer en sommant les communauts. Calculer ensuite lentropie quadratique avec divc :
> (tabF<-apply(effectifs [names (phyf$leaves), ],MARGIN=1,sum)) Sr Ess Me S1 Bg Ef Vm Dg 284 228 139 91 173 169 141 221 > divc(as.data.frame(tabF), phyf$Wdist) diversity tabF 5.870667

Elle est dfinie par Rao (1982) comme la diffrence entre lentropie quadratique du mlange des deux communauts et celles des deux communauts prises individuellement. Elle peut tre utilise pour calculer un indice de diversit entre communauts, de la mme faon quon calcule la diversit entre espces dune communaut :
( ) = ( )

+ 2

(79)

+ ,

(80)

> divc(effectifs [names (phyf$leaves), ], phyf$Wdist) diversity P1 5.816719 P2 5.897210 P3 5.744483 P4 4.790586

( ) : diversit de chaque communaut, fournie par divc :

59

Mesures de la biodiversit

La variabilit inter-communauts peut tre calcule par divc en utilisant la distance fournie par disc, en dfinissant la matrice des poids (gale aux effectifs) :
> divc(as.data.frame (colSums(effectifs)), disc(effectifs[names(phyf$leaves),] , phyf$Wdist)) diversity colSums(effectifs) 0.2362187

$TotalBetaEntropy [1] 0.2362187 $GammaEntropy [1] 5.870667

Alternatives
Guiasu et Guiasu (2011) proposent lindice introduit plus haut :
GSW = (1 )

La fonction disc calcule 2 , :


> disc(effectifs[names (phyf$leaves), ], phyf$Wdist) P1 P2 P3 P2 0.4698121 P3 0.4888729 0.6487916 P4 1.0018983 0.8776582 1.3157902

(81)

Izsk et Pavoine (2011) proposent deux variantes de lindice de Rao dans lesquelles la distance entre espces dpend de leurs probabilits :
L1 = ( )2

Cette partition suppose que les poids des communauts sont proportionnels leur nombre dindividus (Rao, 1982 ; Villeger et Mouillot, 2008). Hardy et Senterre (2007) dcomposent (par diffrence entre et ) lindice de Rao de communauts de poids gaux. Hardy et Jost (2008) montrent que les deux pondrations sont valides mais labsence de cadre gnral assurant que la diversit de Rao est suprieure la diversit motive Guiasu et Guiasu (2011) proposer une alternative lindice de Rao, lindice de Gini-Simpson quadratique pondr, dont la concavit est dmontre (ce qui implique que ), mais dont les autres proprits restent explorer. La pondration peut en fait tre quelconque tant que larbre est ultramtrique, ce rsultat sera obtenu dans le cadre plus gnral de la dcomposition de lentropie phylogntique (page 63). La partition peut tre faite avec la fonction DivPart :
> # Cration d'une mtacommunaut, poids gaux aux effectifs > MC <- MetaCommunity(effectifs, colSums(effectifs)) > DivPart(q=2, MC, Tree=phyf, Normalize=FALSE) $TotalAlphaEntropy [1] 5.634448 $CommunityAlphaEntropies P1 P2 P3 P4 5.816719 5.897210 5.744483 4.790586

L2 = (ln ln )2

(82)

FAD et MFAD
Les indices FAD et MFAD sont des mesures de divergence non pondres. FAD a t propos par Walker et al. (1999), partir dune matrice de distances dans lespace des traits (non ultramtrique). est la distance entre deux espces indices par et l, alors :
FAD =

(83)

FAD est trs sensible au nombre despces. Sa version normalise, MFAD (Schmera et al., 2009) est :
MFAD = (84)

Les deux indices ont t dvelopps pour lcologie fonctionnelle. Ils ne prennent pas en compte la frquence des espces. un facteur de normalisation prs, ce sont des cas particuliers de lindice de Rao pour des effectifs gaux.

60

Diversit fonctionnelle et phylogntique

Le calcul sous R est simple avec un arbre au format phylog dADE4 :


> Tree <- Paracou618.Taxonomy > (FAD <- sum(Tree$Wdist^2/2)) [1] 264159 > (MFAD <- FAD/length(Tree$leaves)) [1] 621.5506

Mesures dentropie phylogntique


Gnralisation de lentropie HCDT

Hp et I1
Simultanment, Pavoine et al. (2009) et Allen et al. (2009) ont propos la gnralisation de lindice de Shannon la diversit phylogntique. La prsentation de Allen et al. est donne ici, celle de Pavoine et al., plus gnrale, sera dtaille dans le paragraphe suivant. tant donn une phylognie, comme celle de la Figure 26, on dfinit pour la branche : (), la somme des probabilits des feuilles de la branche, () la longueur la branche. Par exemple, sur la figure, la branche a une valeur () gale la somme des probabilits doccurrence des espces 4 et 5 alors que ( ) est seulement la probabilit de lespce 5. Lindice dentropie phylogntique est :
= () () ln ()
b

Figure 31 : Arbre phylogntique hypothtique (Chao et al., 2010, figure 1a).

(85)

Dans un arbre parfaitement rgulier, toutes les branches sont de longueur 1 et est lindice de Shannon.

Pavoine et al. (2009) dcoupent larbre phylogntique en priodes. partir de la racine de larbre, une nouvelle priode est dfinie chaque ramification dune branche quelconque. Les dbuts et fins de priodes sont nots , la racine de larbre est fixe 0 = 0. Larbre est ultramtrique.

Lentropie HCDT ( de lquation (44)) est calcule chaque priode. Figure 31, la deuxime priode (2 ), larbre a trois feuilles, avec des probabilits gales celle de lespce 1, la somme de celles des espces 2 et 3, et celle de lespce 4. peut tre calcule avec ces valeurs de probabili ts. On notera cette valeur dentropie o le quantime de la priode. 61

Nous suivrons plutt les notations de Chao et al. (2010) en numrotant les priodes partir du prsent et en notant leur dure. Figure 31, la premire priode se termine quand les branches des espces 2 et 3 se rejoignent. Larbre comprend = 3 priodes.

Mesures de la biodiversit

Lindice de Pavoine et al. (2009) est la somme des pondre par la dure de chaque priode. Nous le normalisons par la hauteur totale de larbre () pour dfinir () :

babilit ou dabondances. Dans le dernier cas, la correction de Tsallis.N est applique chaque priode. Exemple : le package contient les donnes dinventaire de deux hectares du dispositif de Paracou et la taxonomie des espces concernes. Le calcul de lindice de Rao, corrig du biais dchantillonnage utilise le code suivant :
> data(Paracou618) > PhyloEntropy.N(Paracou618.MC$Ns, 2, Paracou618.Taxonomy) $Cuts 1 2 3 0.9863382 0.9710063 0.9234575 $Total [1] 0.9602673

Dans un arbre parfaitement rgulier, toutes les branches sont de longueur 1, il ny a quune seule priode, et = .

() =

=1

(86)

(), gnralisent les mesures Les indices dentropie classique la diversit phylog () + 1 est gal PD ou ntique : 0 1 () est lindice de FD, () est et 2 Rao. On peut les interprter intuitivement comme une somme pondre par la longueur des priodes des valeurs de lentropie chaque priode. la dernire priode (prs des feuilles), toutes les classes sont prsentes, la diversit est donc maximale. En remontant dans larbre, les classes se confondent et la diversit diminue progressivement. Deux classes peu distantes, comme les espces 2 et 3 de la Figure 26, apportent peu de diversit supplmentaire par rapport une situation o les deux espces seraient confondues (et leurs effectifs ajouts), contrairement aux espces 4 et 5.

Shimatani (2001), puis Ricotta (2005) avaient montr que lindice de Rao est la somme pondre sur chaque priode de lindice de Simpson, c'est--dire lgalit (86) pour le cas particulier = 2.

La fonction retourne la valeur de dans chaque intervalle (larbre est ici une taxonomie espce-genre-famille, correspondant aux limites (Cuts) 1, 2 et 3 dont lentropie (). va en dcroissant) et la valeur de

Entropie et diversit
Lentropie

diversit de la mme faon que = (Marcon et Hrault, submitted-b) :


() peut tre transforme en

() =

( )

(87)

Biais dchantillonnage
La correction du biais dchantillonnage applicable lentropie gnralise lest aussi chaque priode de larbre. Les biais sont de moins en moins importants quand on se rapproche de la racine de larbre (il est de moins en moins probable de ne pas observer une classe quand les classes sont de plus en plus vastes). Le package entropart fournit les fonctions PhyloEntropy.P et PhyloEntropy.N pour () partir dun vecteur de procalculer 62

Chao et al. (2010) obtiennent ce rsultat sans recourir lentropie, mais en moyen nant la diversit chaque priode de faon respecter le principe de rplication (voir page 37) :

est lensemble des branches de larbre. Chaque branche, indexe par , se situe dans une priode : toutes les branches de la priode sont de mme longueur . Les probabilits associes aux branches, , sont la somme des probabilits des espces situes

() =

1 1

(88)

Diversit fonctionnelle et phylogntique

sur les feuilles lies la branche. Figure 31, larbre possde 9 branches dont les probabilits sont notes en dessous de leur nud basal. Attention : les entropies ont un comportement linaire : elles sadditionnent tout au (). Les long de larbre pour donner diversits calcules chaque priode ne peuvent pas tre sommes sur le modle de () nest pas la lquation (86) : moyenne pondre des diversits aux diffrentes priodes, sauf dans le cas particulier = 1 o, comme pour la dcomposition de lindice de Shannon, il en est la moyenne gomtrique pondre. Les fonctions PhyloDiversity.P et PhyloDiversity.N de entropart permettent de calculer (). la suite de lexemple prcdent, les rsultats sont prsents sous forme de diversit au lieu dentropie :
> PhyloDiversity.N( Paracou618.MC$Ns, 2, Paracou618.Taxonomy) $Cuts 1 2 3 73.19676 34.49020 13.06463 $Total [1] 25.16819

Lentropie est :
()

o est la probabilit dobserver une des espces de la branche de larbre la priode (Figure 32) dans la mta communaut, la mme probabilit dans la communaut .
1

= lnq

= ( ) =

(91)

Figure 32 : Notations pour la dcomposition de lentropie phylogntique. En haut : arbre entier, en bas gauche, arbre sans la premire priode, en bas droite, dernire priode seule.

Dcomposition
Lentropie phylogntique est une combinaison linaire de lentropie HCDT donc sa dcomposition est identique (Marcon et Hrault, submitted-b). En combinant lquation (86) et le Tableau 4, on obtient :
( ) = () + ( )

La fonction DivPart de entropart permet de dcomposer lentropie. Les rsultats contiennent la valeur de la diversit :
> data(Paracou618) > DivPart(q = 1, Paracou618.MC, Biased = FALSE, Tree=Paracou618.Taxonomy) $TotalAlphaDiversity [1] 42.70238 $TotalBetaDiversity [1] 1.291119 $GammaDiversity [1] 55.13383 $CommunityAlphaDiversities P006 P018 37.22132 51.31045 $TotalAlphaEntropy [1] 3.754255 $TotalBetaEntropy [1] 0.2555089 $GammaEntropy [1] 4.009764

(89)

Lentropie est celle de la mta communaut, lentropie est la somme pondre de celles des communauts, la pondration est libre mais doit respecter = :
()

() =

(90)

63

Mesures de la biodiversit

$CommunityAlphaEntropies P006 P018 3.616882 3.937894

diversity

t. La diffrence de taille entre les rectangles hachurs et les rectangles transparents est due la prise en compte de la phylognie. La diversit (rectangles de hauteur 1) est gale au produit des diversits et (cts du rectangle plus haut). Si les communauts taient compltement diffrentes, la hauteur du rectangle serait gal leur nombre (2 ici).

1.0

1.5

2.0

Arbres non ultramtriques


0 20 40 60 80 100 120 / diversity

0.0

0.5

Figure 33 : Reprsentation graphique de la diversit des deux parcelles du jeu de donnes Paracou618. Les rectangles transparents reprsentent la diversit neutre, les rectangles hachurs la diversit phylogntique (larbre est la taxonomie des espces, = ). Dans chaque cas, le rectangle le plus large, de hauteur 1, reprsente la diversit . Le rectangle plus haut a pour largeur et longueur les diversits et . Les surfaces des deux rectangles sont identiques.

Chao et al. (2010) dfinissent la diversit phylogntique selon lquation (86) quelle que soit la forme de larbre, y compris sil nest pas ultramtrique. Dans ce cas, est , la longueur moyenne des remplac par branches pondre par la frquence des espces. Cette gnralisation est trs discutable : son sens nest pas clair sur le plan de la mesure de la diversit au-del du paralllisme de la forme mathmatique. Larbre de la Figure 34 peut tre dcoup en priodes mais les deux premires (1 : seule lespce 2 est prsente ; 2 : les espces 1 et 2 sont prsentes) sont incompltes au sens o la somme des probabilits ny est pas gale 1 donc 1 ne dfinit pas une diversit ces priodes.

La Figure 33 12 donne une reprsentation graphique de la dcomposition de la diversi12

Code pour raliser la figure :

> data(Paracou618) > q <- 1 > (Neutre <- DivPart(q, Paracou618.MC, Biased = FALSE)) > plot(c(0, Neutre$GammaDiversity), c(0, Paracou618.MC$Ncommunities), type = "n", xlab = expression(paste(alpha, " / ", gamma, " diversity")), ylab = expression(paste(beta, " diversity"))) > rect(0, 0, Neutre$GammaDiversity, 1, lty=2) > rect(0, 0, Neutre$TotalAlphaDiversity, Neutre$TotalBetaDiversity, lty=2) > (Phylo <- DivPart(q, Paracou618.MC, Biased = FALSE, Tree=Paracou618.Taxonomy)) > rect(0, 0, Phylo$GammaDiversity, 1, angle=135, density=10) > rect(0, 0, Phylo$TotalAlphaDiversity, Phylo$TotalBetaDiversity, density=10)

Figure 34 : Arbre phylogntique hypothtique non ultramtrique (Chao et al., 2010, figure 1b).

Pavoine et Bonsall (2009) traitent en dtail les rsultats aberrants que cause un arbre

64

Diversit fonctionnelle et phylogntique

non ultramtrique dans le cas particulier de lentropie de Rao. Dans ltat actuel des connaissances, aucune mthode nest applicable de faon satisfaisante aux arbres non ultramtriques.

2 = ( 1) +

(92)

Cadotte et al. (2010) proposent 6 autres mesures de rgularit. Comme le montrent Mrigot et Gaertner (2011), les mesures de rgularit nont absolument pas les mmes proprits que les mesures de diversit : elles peuvent par exemple augmenter quand on retire des espces originales.

Rgularit
Lindice + (Clarke et Warwick, 2001) mesure la variance des distances entre paires despces :

65

CONCLUSION
La biodiversit peut tre mesure de faon claire et rigoureuse en utilisant lentropie phylogntique.
Diversit phylogntique
PD / FD Entropie phylogntique I1 / Hp Rao

transformation en diversit au sens strict permet dinterprter les valeurs sous une forme unique : un nombre quivalent despces et un nombre quivalent de communauts. Le package entropart permet de calculer avec R la diversit dune mta-communaut partir de donnes dabondances et dun arbre phylogntique ou fonctionnel. Dautres mesures de diversit ont t prsentes ici, dautres encore peuvent tre trouves dans la littrature. Elles ont en gnral un moins bon support mathmatique, surtout les mesures de diversit , ne peuvent pas tre dcomposes, corriges ou interprtes. La diversit de Hurlbert possde toutes ses proprits et une correction trs efficace du biais destimation, mais elle nest pas gnralise la diversit phylogntique. La recherche sur la mesure de la diversit est trs active, ce document volue donc rgulirement pour prendre en compte les avances rcentes.

q quelconque

q =0, 1 ou 2
Richesse

Entropie de Tsallis

Shannon Simpson

Diversit neutre Figure 35 : Arbre phylogntique hypothtique non ultramtrique (Chao et al., 2010, figure 1b).

Cette mesure gnralise les indices de diversit classique (Figure 35), traduit clairement la correspondance entre lentropie et la diversit au sens strict, intgre si ncessaire la distance entre espces, peut tre dcompose et corrige des biais destimation. Sa

67

BIBLIOGRAPHIE
Adelman, M. A. (1969). Comment on the "H" Concentration Measure as a Numbers-Equivalent. The Review of Economics and Statistics 51(1): 99-101. Allen, B., Kon, M. et Bar-Yam, Y. (2009). A New Phylogenetic Diversity Measure Generalizing the Shannon Index and Its Application to Phyllostomid Bats. American Naturalist 174(2): 236-243. Alonso, D. et McKane, A. J. (2004). Sampling Hubbell's neutral theory of biodiversity. Ecology Letters 7(10): 901-910. Arrhenius, O. (1921). Species and Area. Journal of Ecology 9(1): 9599. Baraloto, C., Paine, C. E. T., Poorter, L., Beauchene, J., Bonal, D., Domenach, A. M., Herault, B., Patino, S., Roggy, J. C. et Chave, J. (2010a). Decoupled leaf and stem economics in rain forest trees. Ecology Letters 13(11): 1338-1347. Baraloto, C., Paine, C. E. T. P., Patio, S., Bonal, D., Hrault, B. et Chave, J. (2010b). Functional trait variation and sampling strategies in species rich plant communities. Functional Ecology 24: 208-216. Baselga, A. (2010). Multiplicative partition of true diversity yields independent alpha and beta components; additive partition does not. Ecology 91(7): 1974-1981. Basharin, G. P. (1959). On a Statistical Estimate for the Entropy of a Sequence of Independent Random Variables. Theory of Probability and its Applications 4(3): 333-336. Beck, J. et Schwanghart, W. (2010). Comparing measures of species diversity from incomplete inventories: an update. Methods in Ecology and Evolution 1(1): 38-44. Berger, W. H. et Parker, F. L. (1970). Diversity of planktonic foraminifera in deep-sea sediments. Science 168(3937): 1345-1347. Bonachela, J. A., Hinrichsen, H. et Muoz, M. A. (2008). Entropy estimates of small data sets. Journal of Physics A: Mathematical and Theoretical 41(202001): 1-9. Bordenave, B. G. et De Granville, J. J. (1998). Les mesures de la biodiversit : un outil de conservation en fort guyanaise. JATBA, Revue d'Ethnobiologie 40(1-2): 433-446. Bordenave, B. G., De Granville, J. J. et Steyn, K. (2011). Quantitative botanical diversity descriptors to set conservation priorities in Bakhuis Mountains rainforest, Suriname. Botanical Journal of the Linnean Society 167(1): 94-130. Borland, L., Plastino, A. R. et Tsallis, C. (1998). Information gain within nonextensive thermostatistics. Journal of Mathematical Physics 39(12): 6490-6501. Bourguignon, F. (1979). Decomposable Income Inequality Measures. Econometrica 47(4): 901920. Braun-Blanquet, J. (1928). Pflanzensoziologie: Grundzge der Vegetationskunde. Springer, Berlin Brillouin, L. (1962). Science and information theory. Academic Press, Oxford Brose, U., Martinez, N. D. et Williams, R. J. (2003). Estimating species richness: Sensitivity to sample coverage and insensitivity to spatial patterns. Ecology 84(9): 2364-2377. 69

Mesures de la biodiversit

Bulmer, M. G. (1974). On Fitting the Poisson Lognormal Distribution to Species-Abundance Data. Biometrics 30(1): 101-110. Burnham, K. P. et Overton, W. S. (1979). Robust Estimation of Population Size When Capture Probabilities Vary Among Animals. Ecology 60(5): 927936. Cadotte, M. W., Davies, T. J., Regetz, J., Kembel, S. W., Cleland, E. et Oakley, T. H. (2010). Phylogenetic diversity metrics for ecological communities: integrating species richness, abundance and evolutionary history. Ecology Letters 13(1): 96-105. Cailliez, F. (1983). The analytical solution of the additive constant problem. Psychometrika 48: 305-310. Cavender-Bares, J., Kozak, K. H., Fine, P. V. A. et Kembel, S. W. (2009). The merging of community ecology and phylogenetic biology. Ecology Letters 12(7): 693-715. Ceriani, L. et Verme, P. (2012). The origins of the Gini index: extracts from Variabilit e Mutabilit (1912) by Corrado Gini. Journal of Economic Inequality 10(3): 421-443. Chao, A. (1984). Nonparametric estimation of the number of classes in a population. Scandinavian Journal of Statistics 11: 265-270. Chao, A. (1987). Estimating the population size for capture-recapture data with unequal catchability. Biometrics 43(4): 783-791. Chao, A. (2004). Species richness estimation. in N. Balakrishnan, C. B. Read et B. Vidakovic, (Eds), Encyclopedia of Statistical Sciences. Wiley, New York. Chao, A., Chiu, C.-H. et Hsieh, T. C. (2012). Proposing a resolution to debates on diversity partitioning. Ecology 93(9): 2037-2051. Chao, A., Chiu, C.-H. et Jost, L. (2010). Phylogenetic diversity measures based on Hill numbers. Philosophical Transactions of the Royal Society B 365(1558): 3599-609. Chao, A. et Jost, L. (2012). Coverage-based rarefaction and extrapolation: standardizing samples by completeness rather than size. Ecology 93(12): 2533-2547. Chao, A., Jost, L., Chiang, S. C., Jiang, Y. H. et Chazdon, R. L. (2008). A Two-Stage Probabilistic Approach to Multiple-Community Similarity Indices. Biometrics 64(4): 11781186. Chao, A. et Lee, S.-M. (1992). Estimating the Number of Classes Via Sample Coverage. Journal of the American Statistical Association 87(417): 210-217. Chao, A. et Shen, T.-J. (2010). Program SPADE: Species Prediction And Diversity Estimation. Program and users guide. CARE. http://chao.stat.nthu.edu.tw/softwareCE.html. Chao, A. et Shen, T. J. (2003). Nonparametric estimation of Shannon's index of diversity when there are unseen species in sample. Environmental and Ecological Statistics 10(4): 429443. Chapin, F. S., Zavaleta, E. S., Eviner, V. T., Naylor, R. L., Vitousek, P. M., Reynolds, H. L., Hooper, D. U., Lavorel, S., Sala, O. E., Hobbie, S. E., Mack, M. C. et Diaz, S. (2000). Consequences of changing biodiversity. Nature 405(6783): 234-242. Chytr, M. et Otpkov, Z. (2003). Plot sizes used for phytosociological sampling of European vegetation. Journal of Vegetation Science 14(4): 563-570. Clarke, K. R. et Warwick, R. M. (2001). A further biodiversity index applicable to species lists: variation in taxonomic distinctness. Marine Ecology-Progress Series 216: 265-278.

70

Bibliographie

Clench, H. K. (1979). How to make regional lists of butterflies: some thoughts. Journal of the Lepidopterists' Society 33(4): 216-231. Coleman, B. D. (1981). On random placement and species-area relations. Mathematical Biosciences 54(3-4): 191-215. Conceio, P. et Ferreira, P. (2000). The Young Persons Guide to the Theil Index: Suggesting Intuitive Interpretations and Exploring Analytical Applications. UTIP Working Paper, 14, Austin, Texas: 54 p. Condit, R., Hubbell, S. P., Lafrankie, J. V., Sukumar, R., Manokaran, N., Foster, R. B. et Ashton, P. S. (1996). Species-Area and Species-Individual Relationships for Tropical Trees: A Comparison of Three 50-ha Plots. Journal of Ecology 84(4): 549-562. Connor, E. F. et McCoy, E. D. (1979). The Statistics and Biology of the Species-Area Relationship. The American Naturalist 113(6): 791-833. Cornelissen, J. H. C., Lavorel, S., Garnier, E., Diaz, S., Buchmann, N., Gurvich, D. E., Reich, P. B., Steege, H. t., Morgan, H. D., Heijden, M. G. A. v. d., Pausas, J. G. et Poorter, H. (2003). A handbook of protocols for standardised and easy measurement of plant functional traits worldwide. Australian Journal of Botany 51(4): 335-380. Cousins, S. H. (1991). Species diversity measurement: Choosing the right index. Trends in Ecology and Evolution 6(6): 190-192. Couteron, P. et Plissier, R. (2004). Additive apportioning of species diversity: towards more sophisticated models and analyses. Oikos 107(1): 215-221. Crist, T. O., Veech, J. A., Gering, J. C. et Summerville, K. S. (2003). Partitioning species diversity across landscapes and regions: A hierarchical analysis of alpha, beta, and gamma diversity. The American Naturalist 162(6): 734-743. Dalton, H. (1920). The measurement of the inequality of incomes. The Economic Journal 30(119): 348-361. Darczy, Z. (1970). Generalized information functions. Information and Control 16(1): 36-51. Dauby, G. et Hardy, O. J. (2012). Sampled-based estimation of diversity sensu stricto by transforming Hurlbert diversities into effective number of species. Ecography 35(7): 661672. Davis, H. T. (1941). The theory of econometrics. The Principia Press, Bloomington, Indiana Drakare, S., Lennon, J. J. et Hillebrand, H. (2006). The imprint of the geographical, evolutionary and ecological context on speciesarea relationships. Ecology Letters 9(2): 215-227. Ellison, A. M. (2010). Partitioning diversity. Ecology 91(7): 1962-1963. Eren, M. I., Chao, A., Hwang, W. H. et Colwell, R. K. (2012). Estimating the Richness of a Population When the Maximum Number of Classes Is Fixed: A Nonparametric Solution to an Archaeological Problem. PLoS One 7(5). Esty, W. W. (1983). A Normal Limit Law for a Nonparametric Estimator of the Coverage of a Random Sample. The Annals of Statistics 11(3): 905-912. Faith, D. P. (1992). Conservation evaluation and phylogenetic diversity. Biological Conservation 61(1): 1-10.

71

Mesures de la biodiversit

Fisher, R. A., Corbet, A. S. et Williams, C. B. (1943). The relation between the number of species and the number of individuals in a random sample of an animal population. Journal of Animal Ecology 12: 42-58. Grcia Martn, H. et Goldenfeld, N. (2006). On the origin and robustness of power-law species-area relationships in ecology. Proceedings of the National Academy of Sciences 103(27): 10310-10315. Gaston, K. J. (2000). Global patterns in biodiversity. Nature 405(6783): 220-227. Gini, C. (1912). Variabilit e mutabilit. Studi Economico-Giuridici dellUniversit di Cagliari, Universit di Cagliari. 3: 1-158. Gleason, H. A. (1922). On the Relation Between Species and Area. Ecology 3(2): 158-162. Good, I. J. (1953). On the Population Frequency of Species and the Estimation of Population Parameters. Biometrika 40(3/4): 237-264. Gotelli, N. J. et Colwell, R. K. (2001). Quantifying biodiversity: procedures and pitfalls in the measurement and comparison of species richness. Ecology Letters 4(4): 379-391. Gower, J. C. (1971). A General Coefficient of Similarity and Some of Its Properties. Biometrics 27(4): 857-871. Grassberger, P. (1988). Finite sample corrections to entropy and dimension estimates. Physics Letters A 128(67): 369-373. Grassberger, P. (2003). Entropy Estimates from Insufficient Samplings. ArXiv Physics e-prints 0307138. Grilli, J., Azaele, S., Banavar, J. R. et Maritan, A. (2012). Spatial aggregation and the speciesarea relationship across scales. Journal of Theoretical Biology 313(0): 87-97. Guiasu, R. C. et Guiasu, S. (2011). The weighted quadratic index of biodiversity for pairs of species: a generalization of Raos index. Natural Science 3(9): 795-801. Hankin, R. K. S. (2007). Introducing untb, an R Package For Simulating Ecological Drift Under the Unified Neutral Theory of Biodiversity. Journal of Statistical Software 22(12): 1-15. Hardy, O. J. (2010). BiodivR 1.2. A program to compute statistically unbiased indices of species diversity within sample and species similarity between samples using rarefaction principles. http://ebe.ulb.ac.be/ebe/Software.html. Hardy, O. J. et Jost, L. (2008). Interpreting and estimating measures of community phylogenetic structuring. Journal of Ecology 96(5): 849-852. Hardy, O. J. et Senterre, B. (2007). Characterizing the phylogenetic structure of communities by an additive partitioning of phylogenetic diversity. Journal of Ecology 95(3): 493-506. Harte, J., Kinzig, A. et Green, J. (1999). Self-similarity in the distribution and abundance of species. Science 284(5412): 334-336. Havrda, J. et Charvt, F. (1967). Quantification method of classification processes. Concept of structural -entropy. Kybernetika 3(1): 30-35. Hill, M. O. (1973). Diversity and Evenness: A Unifying Notation and Its Consequences. Ecology 54(2): 427-432. Hoffmann, S. et Hoffmann, A. (2008). Is there a true diversity? Ecological Economics 65(2): 213-215. Horvitz, D. G. et Thompson, D. J. (1952). A generalization of sampling without replacement from a finite universe. Journal of the American Statistical Association 47(260): 663-685. 72

Bibliographie

Hubbell, S. P. (2001). The unified neutral theory of biodiversity and biogeography. Princeton University Press Hubbell, S. P., Condit, R. et Foster, R. B. (2005). Barro Colorado Forest Census Plot Data. https://ctfs.arnarb.harvard.edu/webatlas/datasets/bci. Hurlbert, S. H. (1971). The Nonconcept of Species Diversity: A Critique and Alternative Parameters. Ecology 52(4): 577-586. Izsk, J. et Pavoine, S. (2011). New concentration measures as kinds of the quadratic entropy. Ecological Indicators 11(2): 540-544. Izsk, J. et Pavoine, S. (2012). Links between the species abundance distribution and the shape of the corresponding rank abundance curve. Ecological Indicators 14(1): 1-6. Jensen, J. L. W. V. (1906). Sur les fonctions convexes et les ingalits entre les valeurs moyennes. Acta Mathematica 30(1): 175-193. Jones, D. et Matloff, N. (1986). Statistical Hypothesis Testing in Biology: A Contradiction in Terms. Journal of Economic Entomology 79(5): 1156-1160. Jost, L. (2006). Entropy and diversity. Oikos 113(2): 363-375. Jost, L. (2007). Partitioning diversity into independent alpha and beta components. Ecology 88(10): 2427-2439. Jost, L. (2008). GST and its relatives do not measure differentiation. Molecular Ecology 17(18): 4015-4026. Jost, L. (2009). Mismeasuring biological diversity: Response to Hoffmann and Hoffmann (2008). Ecological Economics 68: 925-928. Jost, L. (2010). Independence of alpha and beta diversities. Ecology 91(7): 1969-1994. Jurasinski, G., Retzer, V. et Beierkuhnlein, C. (2009). Inventory, differentiation, and proportional diversity: a consistent terminology for quantifying species diversity. Oecologia 159(1): 15-26. Kempton, R. A. et Taylor, L. R. (1974). Log-series and log-normal parameters as diversity discriminators for Lepidoptera. Journal of Animal Ecology 43(2): 381-399. Kempton, R. A. et Taylor, L. R. (1976). Models and statistics for species diversity. Nature 262(5571): 818-820. Kempton, R. A. et Wedderburn, R. W. M. (1978). A comparison of three measures of species diversity. Biometrics 34: 25-37. Keylock, C. J. (2005). Simpson diversity and the Shannon-Wiener index as special cases of a generalized entropy. Oikos 109(1): 203-207. Kindt, R., Van Damme, P. et Simons, A. J. (2006). Tree diversity in western Kenya: Using profiles to characterise richness and evenness. Biodiversity and Conservation 15(4): 12531270. Krishnamani, R., Kumar, A. et Harte, J. (2004). Estimating species richness at large spatial scales using data from small discrete plots. Ecography 27(5): 637-642. Kullback, S. et Leibler, R. A. (1951). On Information and Sufficiency. The Annals of Mathematical Statistics 22(1): 79-86. Lande, R. (1996). Statistics and partitioning of species diversity, and similarity among multiple communities. Oikos 76: 5-13. 73

Mesures de la biodiversit

Leinster, T. et Cobbold, C. (2011). Measuring diversity: the importance of species similarity. Ecology. Lin, J. (1991). Divergence Measures Based on the Shannon Entropy. IEEE Transactions on Information Theory 37(1). Lineweaver, H. et Burk, D. (1934). The Determination of Enzyme Dissociation Constants. Journal of the American Chemical Society 56(3): 658-666. Lloyd, M. et Ghelardi, R. J. (1964). A Table for Calculating the `Equitability' Component of Species Diversity. Journal of Animal Ecology 33(2): 217-225. Lonsdale, W. M. (1999). Global Patterns of Plant Invasions and the Concept of Invasibility. Ecology 80(5): 1522-1536. Lorenz, M. O. (1905). Methods of Measuring the concentration of Wealth. Quarterly Publications of the American Statistical Association 9: 209-219. Ludovisi, A. et Taticchi, M. I. (2006). Investigating beta diversity by Kullback-Leibler information measures. Ecological Modelling 192(1-2): 299-313. Maasoumi, E. (1993). A compendium to information theory in economics and econometrics. Econometric Reviews 12(2): 137-181. MacArthur, R. (1955). Fluctuations of Animal Populations and a Measure of Community Stability. Ecology 36(3): 533-536. MacArthur, R. H. (1957). On the Relative Abundance of Bird Species. Proceedings of the National Academy of Sciences of the United States of America 43(3): 293-295. MacArthur, R. H. (1965). Patterns of species diversity. Biological Reviews 40(4): 510-533. Magurran, A. E. (1988). Ecological diversity and its measurement. Princeton University Press, Princeton, NJ Marcon, E. et Hrault, B. (submitted-a). entropart, an R package to partition diversity. Methods in Ecology and Evolution. Marcon, E. et Hrault, B. (submitted-b). Partitioning phylodiversity. Methods in Ecology and Evolution. Marcon, E., Hrault, B., Baraloto, C. et Lang, G. (2012). The Decomposition of Shannons Entropy and a Confidence Interval for Beta Diversity. Oikos 121(4): 516-522. Marcon, E., Scotti, I., Herault, B., Rossi, V. et Lang, G. (submitted). Generalization of the partitioning of Shannon diversity. PLOS One. May, R. M. (1975). Patterns of species abundance and diversity. in M. L. Cody et J. M. Diamond, (Eds), Ecology and Evolution of Communities. Harvard University Press: 81120. May, R. M. (2011). Why Worry about How Many Species and Their Loss? PLoS Biol 9(8): e1001130. May, R. M. et Stumpf, M. P. H. (2000). Species-Area Relations in Tropical Forests. Science 290(5499): 2084-2086. McGill, B. J. (2003). A test of the unified neutral theory of biodiversity. Nature 422(6934): 881885. McGill, B. J., Etienne, R. S., Gray, J. S., Alonso, D., Anderson, M. J., Benecha, H. K., Dornelas, M., Enquist, B. J., Green, J. L., He, F., Hurlbert, A. H., Magurran, A. E., Marquet, P. A., Maurer, B. A., Ostling, A., Soykan, C. U., Ugland, K. I. et White, E. 74

Bibliographie

P. (2007). Species abundance distributions: moving beyond single prediction theories to integration within an ecological framework. Ecology Letters 10(10): 995-1015. Mendes, R. S., Evangelista, L. R., Thomaz, S. M., Agostinho, A. A. et Gomes, L. C. (2008). A unified index to measure ecological diversity and species rarity. Ecography 31(4): 450456. Mrigot, B. et Gaertner, J.-C. (2011). Incorporation of phylogeny in biological diversity measurement: Drawbacks of extensively used indices, and advantages of quadratic entropy. BioEssays 33(11): 819-822. Michaelis, L. et Menten, M. L. (1913). Die Kinetik der Invertinwirkung. Biochemische Zeitschrift 49: 333-369. Mora, C., Tittensor, D. P., Adl, S., Simpson, A. G. B. et Worm, B. (2011). How Many Species Are There on Earth and in the Ocean? PLoS Biol 9(8): e1001127. Morin, A. et Findlay, S. (2001). Biodiversit : tendances et http://simulium.bio.uottawa.ca/bio3515/pdf/presentations/02-Biodiversite.pdf. processus.

Mouillot, D. et Leprtre, A. (1999). A comparison of species diversity estimators. Researches on Population Ecology 41(2): 203-215. Mouillot, D., Mason, W. H. N., Dumay, O. et Wilson, J. B. (2005). Functional regularity: a neglected aspect of functional diversity. Oecologia 142(3): 353-359. Nei, M. (1973). Analysis of Gene Diversity in Subdivided Populations. Proceedings of the National Academy of Sciences of the United States of America 70(12): 3321-3323. Neyman, J. et Scott, E. L. (1958). Statistical Approach to Problems of Cosmology. Journal of the Royal Statistical Society B 20(1): 1-43. Norris, J. L. et Pollock, K. H. (1998). Non-parametric MLE for Poisson species abundance models allowing for heterogeneity between species. Environmental and Ecological Statistics 5(4): 391-402. Oksanen, J., Blanchet, F. G., Kindt, R., Legendre, P., Minchin, P. R., O'Hara, R. B., Simpson, G. L., Solymos, P., Stevens, M. H. H. et Wagner, H. (2012). vegan: Community Ecology Package. http://CRAN.R-project.org/package=vegan. Pallmann, P., Schaarschmidt, F., Hothorn, L. A., Fischer, C., Nacke, H., Priesnitz, K. U. et Schork, N. J. (2012). Assessing group differences in biodiversity by simultaneously testing a user-defined selection of diversity indices. Molecular Ecology Resources 12(6): 1068-1078. Patil, G. P. et Taillie, C. (1982). Diversity as a concept and its measurement. Journal of the American Statistical Association 77(379): 548-561. Pavoine, S. et Bonsall, M. B. (2009). Biological diversity: Distinct distributions can lead to the maximization of Rao's quadratic entropy. Theoretical Population Biology 75(2-3): 153163. Pavoine, S. et Bonsall, M. B. (2011). Measuring biodiversity to explain community assembly: a unified approach. Biological Reviews 86(4): 792-812. Pavoine, S., Dufour, A.-B. et Chessel, D. (2004). From dissimilarities among species to dissimilarities among communities: a double principal coordinate analysis. Journal of Theoretical Biology 228(4): 523537. Pavoine, S., Love, M. S. et Bonsall, M. B. (2009). Hierarchical partitioning of evolutionary and ecological patterns in the organization of phylogenetically-structured species assemblages: 75

Mesures de la biodiversit

Application to rockfish (genus: Sebastes) in the Southern California Bight. Ecology Letters 12(9): 898-908. Pavoine, S., Ollier, S. et Dufour, A.-B. (2005a). Is the originality of a species measurable? Ecology Letters 8: 579586. Pavoine, S., Ollier, S. et Pontier, D. (2005b). Measuring, diversity from dissimilarities with Rao's quadratic entropy: Are any dissimilarities suitable? Theoretical Population Biology 67(4): 231-239. Plissier, R. et Couteron, P. (2007). An operational, additive framework for species diversity partitioning and beta-diversity analysis. Journal of Ecology 95(2): 294-300. Plissier, R., Couteron, P., Dray, S. et Sabatier, D. (2003). Consistency between ordination techniques and diversity measurements: Two strategies for species occurrence data. Ecology 84(1): 242-251. Petchey, O. L. et Gaston, K. J. (2002). Functional diversity (FD), species richness and community composition. Ecology Letters 5: 402-411. Pielou, E. C. (1966a). The measurement of diversity in different types of biological collections. Journal of Theoretical Biology 13(C): 131-144. Pielou, E. C. (1966b). Species-diversity and pattern-diversity in the study of ecological succession. Journal of Theoretical Biology 10(2): 370-383. Pielou, E. C. (1969). An Introduction to Mathematical Ecology. Wiley, New York. 286 Pielou, E. C. (1975). Ecological Diversity. Wiley, New York Plotkin, J. B., Potts, M. D., Yu, D. W., Bunyavejchewin, S., Condit, R., Foster, R. B., Hubbell, S. P., LaFrankie, J., Manokaran, N., Lee, H.-S., Sukumar, R., Nowak, M. A. et Ashton, P. S. (2000). Predicting species diversity in tropical forests. Proceedings of the National Academy of Sciences of the United States of America 97(20): 10850-10854. Podani, J. (1999). Extending Gower's General Coefficient of Similarity to Ordinal Characters. Taxon 48(2): 331-340. Podani, J. et Schmera, D. (2006). On dendrogram-based measures of functional diversity. Oikos 115(1): 179-185. Preston, F. W. (1948). The Commonness, And Rarity, of Species. Ecology 29(3): 254-283. Preston, F. W. (1960). Time and Space and the Variation of Species. Ecology 41(4): 611-627. Preston, F. W. (1962). The Canonical Distribution of Commonness and Rarity: Part I. Ecology 43(2): 185-215. R Development Core Team (2013). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing. http://www.R-project.org. Rao, C. R. (1982). Diversity and dissimilarity coefficients: a unified approach. Theoretical Population Biology 21(24-43). Rnyi, A. (1961). On Measures of Entropy and Information. 4th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, USA, University of California Press. Ricotta, C. (2003). On parametric evenness measures. Journal of Theoretical Biology 222(2): 189-197. Ricotta, C. (2005). Additive partitioning of Rao's quadratic diversity: a hierarchical approach. Ecological Modelling 183(4): 365-371. 76

Bibliographie

Ricotta, C. (2007). A semantic taxonomy for diversity measures. Acta Biotheoretica 55(1): 2333. Ricotta, C. (2010). On beta diversity decomposition: Trouble shared is not trouble halved. Ecology 91(7): 1981-1983. Ricotta, C. et Avena, G. (2003). An information-theoretical measure of -diversity. Plant Biosystems 137(1): 57 - 61. Ricotta, C., De Zuliani, E. et Pacini, A. (2001). On the mutual relatedness of evenness measures. Community Ecology 2(1): 51-56. Routledge, R. D. (1979). Diversity indices: Which ones are admissible? Journal of Theoretical Biology 76(4): 503-515. Scheiner, S. M. (2003). Six types of species-area curves. Global Ecology and Biogeography 12(6): 441-447. Schmera, D., Ers, T. et Podani, J. (2009). A measure for assessing functional diversity in ecological communities. Aquatic Ecology 43(1): 157-167. Schulte, R. P. O., Lantinga, E. A. et Hawkins, M. J. (2005). A new family of Fisher-curves estimates Fisher's alpha more accurately. Journal of Theoretical Biology 232(3): 305-313. Schrmann, T. (2004). Bias analysis in entropy estimation. Journal of Physics A: Mathematical and Theoretical 37(27): L295-L301. Shannon, C. E. (1948). A Mathematical Theory of Communication. The Bell System Technical Journal 27: 379423, 623656. Shannon, C. E. et Weaver, W. (1963). The Mathematical Theory of Communication. University of Illinois Press Shen, T.-J., Chao, A. et Lin, C.-F. (2003). Predicting the number of new species in a further taxonomic sampling. Ecology 84: 798-804. Shimatani, K. (2001). On the measurement of species diversity incorporating species differences. Oikos 93(1): 135-147. Simpson, E. H. (1949). Measurement of diversity. Nature 163(4148): 688. Smith, B. et Wilson, J. B. (1996). A consumer's guide to evenness indices. Oikos 76(1): 70-82. Sobern M., J. et Llorente B., J. (1993). The Use of Species Accumulation Functions for the Prediction of Species Richness. Conservation Biology 7(3): 480-488. Sokal, R. R. et Michener, C. D. (1958). A statistical method for evaluating systematic relationships. The University of Kansas Science Bulletin 38(22): 1409-1438. Swenson, N. G. et Enquist, B. J. (2009). Opposing assembly mechanisms in a Neotropical dry forest: Implications for phylogenetic and functional community ecology. Ecology 90(8): 2161-2170. Theil, H. (1967). Economics and Information Theory. Rand McNally and Company, Chicago Tothmeresz, B. (1995). Comparison of different methods for diversity ordering. Journal of Vegetation Science 6(2): 283-290. Triantis, K. A., Guilhaumon, F. et Whittaker, R. J. (2012). The island speciesarea relationship: biology and statistics. Journal of Biogeography 39(2): 215-231. Tsallis, C. (1988). Possible generalization of Boltzmann-Gibbs statistics. Journal of Statistical Physics 52(1): 479-487. 77

Mesures de la biodiversit

Tsallis, C. (1994). What are the numbers that experiments provide? Qumica Nova 17(6): 468471. Tuomisto, H. (2010a). A diversity of beta diversities: straightening up a concept gone awry. Part 1. Defining beta diversity as a function of alpha and gamma diversity. Ecography 33(1): 222. Tuomisto, H. (2010b). A diversity of beta diversities: straightening up a concept gone awry. Part 2. Quantifying beta diversity and related phenomena. Ecography 33(1): 23-45. Tuomisto, H. (2011). Commentary: do we have a consistent terminology for species diversity? Yes, if we choose to use it. Oecologia 167(4): 903-911. Tuomisto, H. (2012). An updated consumers guide to evenness and related indices. Oikos 121(8): 1203-1218. Ulanowicz, R. E. (2001). Information theory in ecology. Computers & Chemistry 25(4): 393399. Veech, J. A. et Crist, T. O. (2010a). Diversity partitioning without statistical independence of alpha and beta. Ecology 91(7): 1964-1969. Veech, J. A. et Crist, T. O. (2010b). Toward a unified view of diversity partitioning. Ecology 91(7): 1988-1992. Veech, J. A., Summerville, K. S., Crist, T. O. et Gering, J. C. (2002). The additive partitioning of species diversity: recent revival of an old idea. Oikos 99(1): 3-9. Villeger, S. et Mouillot, D. (2008). Additive partitioning of diversity including species differences: a comment on Hardy & Senterre (2007). Journal of Ecology 96(5): 845-848. Volkov, I., Banavar, J. R., Hubbell, S. P. et Maritan, A. (2003). Neutral theory and relative species abundance in ecology. Nature 424(6952): 1035-1037. Walker, B., Kinzig, A. et Langridge, J. (1999). Original Articles: Plant Attribute Diversity, Resilience, and Ecosystem Function: The Nature and Significance of Dominant and Minor Species. Ecosystems 2(2): 95-113. Wang, J.-P. (2010). Estimating species richness by a Poisson-compound gamma model. Biometrika 97(3): 727-740. Wang, J.-P. (2011). SPECIES: An R Package for Species Richness Estimation. Journal of Statistical Software 40(9): 1-15. Wang, J.-P., Lindsay, B., Cui, L., Wall, P. K., Marion, J., Zhang, J. et dePamphilis, C. (2005). Gene capture prediction and overlap estimation in EST sequencing from one or multiple libraries. BMC Bioinformatics 6(1): 300. Webb, C. O. (2000). Exploring the phylogenetic structure of ecological communities: An example for rain forest trees. American Naturalist 156(2): 145-155. Whittaker, R. H. (1960). Vegetation of the Siskiyou Mountains, Oregon and California. Ecological Monographs 30(3): 279-338. Whittaker, R. H. (1965). Dominance and diversity in land plant communities. Science 147(3655): 250-260. Whittaker, R. H. (1972). Evolution and Measurement of Species Diversity. Taxon 21(2/3): 213251. Whittaker, R. H. (1977). Evolution of species diversity in land communities. Evolutionary Biology 10: 1-67. 78

Bibliographie

Williams, C. B. (1964). Patterns in the balance of nature. Academic. 324 Williamson, M., Gaston, K. J. et Lonsdale, W. M. (2001). The speciesarea relationship does not have an asymptote! Journal of Biogeography 28(7): 827-830. Wilsey, B. J. (2010). An empirical comparison of beta diversity indices in establishing prairies. Ecology 91(7): 1984-1988. Wright, I. J., Reich, P. B., Westoby, M., Ackerly, D. D., Baruch, Z., Bongers, F., CavenderBares, J., Chapin, T., Cornelissen, J. H. C., Diemer, M., Flexas, J., Garnier, E., Groom, P. K., Gulias, J., Hikosaka, K., Lamont, B. B., Lee, T., Lee, W., Lusk, C., Midgley, J. J., Navas, M.-L., Niinemets, U., Oleksyn, J., Osada, N., Poorter, H., Poot, P., Prior, L., Pyankov, V. I., Roumet, C., Thomas, S. C., Tjoelker, M. G., Veneklaas, E. J. et Villar, R. (2004). The worldwide leaf economics spectrum. Nature 428: 821-827. Wrtz, P. et Annila, A. (2008). Roots of Diversity Relations. Journal of Biophysics 2008: Article ID 654672. Zhang, C. H. et Zhang, Z. Y. (2009). Asymptotic Normality of a Nonparametric Estimator of Sample Coverage. Annals of Statistics 37(5A): 2582-2595. Zhang, Z. et Huang, H. (2007). Turing's formula revisited. Journal of Quantitative Linguistics 14(2-3): 222-241.

79