Vous êtes sur la page 1sur 26

Annexe 1.

Quelques principes d’échantillonnage en écologie


Annexe 1. Quelques principes d’échantillonnage en écologie ................................................................. 1
A1.1 Pourquoi échantillonner? ............................................................................................................. 1
A1.2 Structure d’un plan d’échantillonnage ......................................................................................... 3
A1.3 Biais, erreur d’échantillonnage, précision et exactitude .............................................................. 4
A1.4 Quelques sources de biais et de variabilité .................................................................................. 5
A1.4.1 Détectabilité .......................................................................................................................... 5
A1.4.2 Forme des parcelles............................................................................................................... 6
A1.4.3 Taille des parcelles................................................................................................................ 7
A1.4.4 Disposition spatiale des parcelles.......................................................................................... 8
A1.4.5 Hétérogénéité temporelle et autocorrélation temporelle ....................................................... 9
A1.4.6 Hétérogénéité spatiale et autocorrélation spatiale................................................................. 9
A1.5 Pseudoréplication ....................................................................................................................... 10
A1.6 Randomisation et réplication ..................................................................................................... 10
A1.7 Erreur type et intervalle de confiance ........................................................................................ 11
A1.8 Échantillonnage aléatoire simple ou échantillonnage aléatoire sans remise.............................. 11
A1.8.1 Estimation de la moyenne de la population ........................................................................ 12
A1.8.2 Estimation du total de la population.................................................................................... 13
A1.8.3 Estimation d’une proportion ............................................................................................... 14
A1.8.4 Estimation d’un ratio........................................................................................................... 15
A1.8.5 Estimations pour des sous-populations ............................................................................... 16
A1.9 Échantillonnage aléatoire avec remise ....................................................................................... 16
A1.10 Échantillonnage stratifié........................................................................................................... 17
A1.10.1 Estimation du total de la population.................................................................................. 18
A1.10.2 Estimation de la moyenne de la population ...................................................................... 18
A1.10.3 Allocation des unités d’échantillonnage entre les strates.................................................. 19
A1.10.4 Stratification post-échantillonnage ................................................................................... 19
A1.11 Échantillonnage par grappes et échantillonnage systématique ................................................ 19
A1.11.1 Estimation du total et de la moyenne de la population ..................................................... 20
A1.12 Échantillonnage multi-stades ................................................................................................... 21
A1.12.1 Échantillonnage aléatoire simple à tous les stades............................................................ 21
A1.13 Échantillonnage adaptatif......................................................................................................... 21
A1.14 Estimation par régression......................................................................................................... 21
A1.15 Échantillonnage double ou en deux phases.............................................................................. 21
A1.16 Échantillonnage par distance.................................................................................................... 21
A1.17 Échantillonnage par capture-marquage-recapture.................................................................... 22
A1.18 Références (et autres lectures d’intérêt)................................................................................... 23

A1.1 Pourquoi échantillonner?


En écologie, il est généralement impossible de mesurer une ou des caractéristiques sur l’ensemble des
unités d’un groupe d’intérêt. Ceci peut résulter de plusieurs causes, telles des contraintes de temps,
d’argent ou un manque de personnel qualifié. Ou encore, il peut être impossible de mettre la main sur
l’ensemble des individus d’une population. De fait, il est probablement impossible de mesurer la
hauteur de tous les arbres d’une forêt de plusieurs milliers d’hectares, de visiter tous les lacs d’une
région de plusieurs milliers de km2. L’échantillonnage, lorsque bien fait, permet de mesurer des
1
caractéristiques sur un nombre restreint d’unités du groupe d’intérêt et d’arriver à une estimation des
paramètres à l’étude qui sera non seulement précise et exempte de biais, mais aussi représentative de
l’ensemble des unités du groupe. On entend par paramètre une caractéristique quantifiable de la
population dont la valeur est fixe au sein d’une région et d’une période de temps donnée, mais qui
demeure inconnue.
À titre d’exemple, une biologiste estimera la densité de Grenouille léopard (Rana pipiens) au
sein des étangs du Parc du Mont Saint-Bruno en ne choisissant que quelques étangs et/ou encore, en
n’évaluant la densité que sur une portion de chaque étang. Mais combien et quels étangs choisir?
Quelle portion des étangs devrait être échantillonnée? La densité des grenouilles varie-t-elle selon la
taille des étangs? Diffère-t-elle selon que nous sommes en marge ou au centre de l’étang? Est-ce que la
probabilité que l’on observe ou capture les grenouilles varie en fonction de ces mêmes facteurs? Et si
cela variait aussi en fonction des observateurs? Voilà bien des questions à prendre en compte avant
même de pouvoir estimer une simple densité de grenouilles. Et ensuite, quels étangs sélectionner pour
estimer le niveau de corrélation qu’il peut y avoir entre la densité de grenouilles et le pH des étangs?
Est-il pertinent de choisir des étangs ayant différentes tailles pour répondre à cette question?
Il est aussi primordial de bien identifier les paramètres dont une estimation est requise avant de
définir une méthode d’échantillonnage. Doit-on obtenir une estimation de la distribution spatiale, de la
probabilité d’occurrence, de la densité des individus, de la taille de la population, du sexe ratio, de la
structure d’âge, des taux de natalité ou de mortalité, des taux d’immigration et d’émigration, et/ou
encore, de l’influence de certains facteurs environnementaux sur ces quantités. Certaines méthodes
permettent d’estimer un seul paramètre, alors que d’autres permettent d’en estimer plusieurs, mais
parfois avec des niveaux de biais et de précision variables. Il faut donc considérer les différentes
options en fonction des besoins et des contraintes.
Plus souvent qu’autrement, les écologistes sont en course folle. Les niveaux de financement
sont souvent faibles et de courtes durées. De plus, les phénomènes étudiés sont saisonniers. La
planification de l’échantillonnage est donc souvent escamotée avec pour conséquence que les
conclusions des études sont trop souvent de faible portée. En effet, il n’est pas rare que des chercheurs,
dit d’expérience, se retrouvent avec une base de données qui ne peut être analysée proprement et qui ne
permet pas de répondre à leurs questions de recherche. Il est toujours possible d’avoir recours à un
statisticien pour nous aider à extirper l’information contenue dans une base de données issue d’un
échantillonnage bien fait. À l’opposée, les statisticiens sont impuissants si l’échantillonnage a été mal
fait. Il est donc plus qu’important de prendre le temps de planifier son échantillonnage. Il en va du
succès de vos travaux!
2
Cette annexe n’offre qu’un survol des principes d’échantillonnage en écologie et des méthodes
qui en découlent. De plus, seule l’estimation de certains types de paramètres est ici abordée. Vous
devrez donc faire un peu de lecture lors de journées pluvieuses pour approfondir vos connaissances sur
le sujet.

A1.2 Structure d’un plan d’échantillonnage


Un plan d’échantillonnage est caractérisé par une structure hiérarchique qui va de la population cible
jusqu’à l’élément qui sera caractérisé (Figure A1.1). La population cible consiste en la totalité des
éléments d’intérêt qui sont visés par l’étude. Cette collection d’éléments doit être circonscrite dans
l’espace et dans le temps. Par exemple, l’ensemble des Grenouille léopard se trouvant à l’intérieur des
limites du Parc du Mont Saint-Bruno au cours de la saison de reproduction de 2005. L’élément est
l’objet sur lequel une mesure sera prise. Dans l’exemple précédent, un individu de l’espèce Grenouille
léopard est un élément.

Population cible
Population statistique
Cadre d’échantillonnage
Unité d’échantillonnage
Éléments

Figure A1.1. Structure d’un plan d’échantillonnage.

L’unité d’échantillonnage représente une collection unique d’éléments. À titre d’exemple, un


étang habité ou non par des Grenouille léopard. En écologie, l’unité d’échantillonnage consiste
fréquemment en une superficie de terrain délimitée plus ou moins arbitrairement (i.e., une parcelle).
Les Grenouille léopard mesurées au sein d’une parcelle choisie aléatoirement parmi un groupe de
parcelles constitueraient donc les éléments et la parcelle, l’unité d’échantillonnage. Notons que
l’élément peut également être l’unité d’échantillonnage. De fait, un échantillon de Grenouille léopard
pourrait être pris sur un ensemble de grenouilles capturées et les mesures prises sur ces individus. La
structure du plan d’échantillonnage détermine la probabilité avec laquelle une unité d’échantillonnage
sera contenue dans l’échantillon. Cette probabilité doit être connue pour que l’estimation des

3
paramètres d’intérêt ne soit pas biaisée. Le cadre d’échantillonnage consiste en la totalité des unités
d’échantillonnage qui ont la possibilité de constituer un échantillon. À titre d’exemple, l’ensemble des
étangs se trouvant au sein du Parc du Mont Saint-Bruno et qui sont accessibles pour des fins
d’échantillonnage. Il s’ensuit que les paramètres qui seront estimés ne pourront caractériser que ce
cadre d’échantillonnage ou population statistique. Il est donc préférable que le cadre d’échantillonnage
soit le plus représentatif possible de la population cible. L’estimation de paramètres caractérisant le
cadre d’échantillonnage ou population statistique est une inférence statistique basée sur des éléments
théoriques. Étendre les conclusions jusqu’à la population cible revient aux chercheurs et ne dépend
donc que de leur jugement.

A1.3 Biais, erreur d’échantillonnage, précision et exactitude


Contrairement à une erreur d’échantillonnage qui est aléatoire, un biais consiste en une erreur
systématique. Il y a biais lorsque les estimations d’un paramètre à partir des différentes combinaisons
d’unités d’échantillonnage qu’il est possible de former sont systématiquement au-dessus ou au-dessous
de la vraie valeur de la population statistique. Il existe différents types de biais. Parmi ceux-ci, on
compte les biais de sélection, les erreurs de couverture ainsi que les erreurs de réponse et de non-
réponse. Les biais de sélection résulte d’une sélection non-aléatoire des unités d’échantillonnage. Les
erreurs de couverture proviennent d’une mauvaise définition du cadre d’échantillonnage. Elles sont
commises lorsque des unités d’échantillonnage sont inclues alors qu’elles ne font pas partie du cadre
d’échantillonnage, sont exclues alors qu’elles devraient faire partie du cadre d’échantillonnage, ou
encore, du fait qu’elles sont inclues plus d’une fois (e.g., superposition totale ou partielle des parcelles).
Une sélection aléatoire des unités d’échantillonnage au sein d’un cadre d’échantillonnage non-défini
(e.g., une sélection aléatoire de points sur lesquels seront centrés des quadrats) peut donné lieu à un tel
biais. Les erreurs de réponse sont causées par une mauvaise mesure des éléments (e.g., une erreur de
lecture, un mauvais calibrage de l’instrument de mesure, une mauvaise identification de l’espèce). Les
erreurs de non-réponse résultent de la non-détection d’individus présents au sein d’une unité
d’échantillonnage. (voir section A1.4.1). Quoique négligé à torts, ce type de biais peut être pris en
compte et en partie corrigé (voir sections A1.16 et A1.17).
Tel que mentionné ci-haut, l’erreur d’échantillonnage est aléatoire. Elle résulte de trois sources
principales : variabilité temporelle, variabilité spatiale et variabilité d’échantillonnage. Les deux
premières étant approfondies aux sections A1.4.5 et A1.4.6, nous nous concentrerons ici sur la
variabilité d’échantillonnage qui peut être subdivisée en deux sources additionnelles. La première
provient de la sélection aléatoire d’une portion des unités d’échantillonnage contenues dans le cadre
4
d’échantillonnage. Advenant que les unités d’échantillonnage varient entre-elles, il s’ensuit que
l’estimation d’un paramètre variera en fonction de la combinaison d’unités d’échantillonnage qui
auront été inclues dans l’échantillon. L’autre cause de variabilité d’échantillonnage est la variabilité
d’énumération. Cette source de variabilité origine d’un dénombrement incomplet des éléments
contenus au sein des unités d’échantillonnage. On peut donc arriver à différentes valeurs d’un
paramètre lorsque les mêmes unités d’échantillonnage sont caractérisés de façon répétitive.
La précision d’une estimation d’un paramètre quantifie le niveau de variation (dispersion) entre
les estimations qui auraient été obtenues suite à plusieurs échantillonnage du même cadre
d’échantillonnage (voir Boîte 5.1). La précision d’une estimation est affectée par les diverses sources
d’erreur d’échantillonnage. Enfin, l’exactitude d’une estimation est affecté à la fois par les biais et les
erreurs d’échantillonnage. Une estimation exacte sera à la fois non-biaisée et précise. Notez toutefois
qu’une estimation peut à la fois être non-biaisée et imprécise ou encore, biaisée et précise.
Une façon de limiter les biais est la randomisation, la sélection aléatoire des unités
d’échantillonnage qui formeront l’échantillon. La réplication ne permet pas d’éliminer les biais, mais
d’estimer ces derniers par des méthodes spécifiques et de corriger les estimations (e.g., dans le cadre
d’un plan par capture-marquage-recapture). La réplication permet aussi de quantifier le niveau de
variabilité entre les unités d’échantillonnage. Ce niveau de variabilité est nécessaire au calcul de la
précision d’une estimation d’un paramètre caractérisant une population statistique. La réplication est le
principal moyen d’accroître la précision d’une estimation. À ce titre, c’est le nombre absolu d’unités
d’échantillonnage compris dans l’échantillon qui compte, et non le nombre relatif (i.e., la proportion du
cadre d’échantillonnage qui est couvert). Néanmoins, accroître la proportion du cadre
d’échantillonnage qui est couvert augmentera généralement la représentativité de l’échantillon. La
stratification (voir section A1.10) et l’utilisation de covariables par le biais d’un modèle de régression
permettent aussi de limiter les sources et le niveau de variabilité d’une estimation. Plus une estimation
sera précise, plus on pourra avoir confiance en cette estimation.

A1.4 Quelques sources de biais et de variabilité


A1.4.1 Détectabilité
Le fait que tous les éléments au sein d’une unité d’échantillonnage puissent ne pas être détectés pose
problème. Par exemple, le nombre d’individus d’une espèce donnée qui sera compté (Ci) au sein de la
parcelle i ne représentera qu’une proportion (δi) du nombre présent (Ni) :

5
E (C i ) = δ i N i .

En d’autres termes, la détectabilité ou probabilité de détection sera incomplète (i.e., δ < 1); une
détectabilité complète impliquerait que δi = δ = 1. Dans une situation où la détectabilité est incomplète,
mais constante dans l’espace, le temps ou une autre dimension (i.e., δi = δ < 1), l’estimation de la
densité d’individus ou de la taille d’une population sera biaisée, mais il sera possible d’effectuer des
comparaisons dans l’espace, le temps ou toute autre dimension. Lorsque la détectabilité est incomplète
et variable dans l’espace, le temps ou une autre dimension (i.e., δi ≠ δj et δ < 1), il est par contre
impératif d’utiliser une méthode qui estimera la probabilité de détection et corrigera les estimations des
paramètres d’intérêt. Sans quoi, les conclusions de l’étude seront probablement truffées d’erreurs
causées par des effets confondants. Malheureusement, il est difficile de distinguer les cas où la
probabilité de détection est constante ou variable. Il s’ensuit que celle-ci devrait toujours être prise en
considération. Les méthodes d’échantillonnage par distance, double-observateurs, ou par capture-
marquage-recapture offrent des solutions aux problème de détection incomplète (voir sections A1.15 et
A1.16).

A1.4.2 Forme des parcelles


La forme des parcelles influence l’estimation des paramètres par le biais du ratio périmètre : surface
des parcelle, de la méthode de dénombrement des éléments, ainsi que via la détectabilité et la
distribution spatiale des éléments.
Le ratio périmètre : surface de la parcelle affecte principalement le dénombrement des éléments
situés en marge des parcelles. Plus une parcelle aura un fort ratio périmètre : surface, plus il y aura
d’éléments situés en marge de la parcelle et pour lesquelles une décision à savoir s’ils sont contenus ou
non dans la parcelle devra être prise. En effet, une parcelle ayant un fort ratio périmètre : surface a plus
de chance de contenir des éléments situés le long de son périmètre, voire de part et d’autres de celui-ci.
Il s’ensuit que la possibilité d’erreurs d’inclusion augmentera avec le ratio périmètre : surface des
parcelles. Ce type d’erreur fait partie des effets dits de bordure.
L’influence de la méthode de dénombrement sur les estimations dépend à la fois de la forme de
la parcelle, de la mobilité des organismes d’intérêt et des patrons de mouvement adoptés par ces
derniers. Un dénombrement complet pouvant se faire rapidement, voire instantanément, limitera les
effets de bordure liés au fait que individus puissent entrer et sortir des parcelles. Ce type de
dénombrement est par contre rare en écologie animale. De plus, les facteurs corrigeant pour la

6
probabilité de détection dans le cadre de dénombrements partiels (e.g., par capture-marquage-
recapture) ne peuvent éliminer les effets de bordure.
La probabilité de détection des organismes est aussi affectée par la forme des parcelles. De fait,
il est généralement plus facile de repérer des individus en parcourant une parcelle longue et étroite (i.e.,
ayant un fort ratio périmètre : surface) qu’une parcelle ayant une forme carrée ou circulaire.
Néanmoins, la probabilité de détection peut diminuer si la présence et le comportement des
observateurs rendent les organismes plus discrets.
La forme des parcelles joue sur la précision des estimations en fonction de la distribution
spatiale des éléments. Plus les éléments seront distribués de façon contagieuse, plus la fréquence des
parcelles incluant, soit aucun ou un grand nombre d’éléments, sera importante. Par conséquent, les
valeurs observées différeront grandement de la valeur attendue de la population statistique. En d’autres
termes, l’estimation de la valeur moyenne sera affligée d’une grande erreur type. Toute chose étant
égale par ailleurs, la précision d’une estimation sera meilleure si les éléments sont disposés
aléatoirement et encore meilleure si ceux-ci sont distribués uniformément. L’utilisation d’une parcelle
présentant un fort ratio périmètre :surface permet d’accroître la précision lorsque les éléments sont
distribués de façon contagieuse. De fait, une parcelle rectangulaire sera plus susceptible de croiser un
groupe d’éléments (en traversant divers habitats, par exemple) qu’une parcelle carrée ou circulaire, et
ce, si la parcelle n’est pas disposée parallèlement à des isoplèthes (e.g., de courbes de niveau ou de
profondeur, ou encore un écotone). Dans un tel cas, une parcelle carrée ou circulaire aurait plus de
chance d’inclure divers habitats et donc de contenir des éléments.

A1.4.3 Taille des parcelles


La taille des parcelles affecte le ratio périmètre : surface de celles-ci et, par conséquent, module les
effets de bordure (voir section A1.4.2). L’influence de la taille des parcelles sur l’estimation des
paramètres dépend aussi de l’échelle spatiale à laquelle le phénomène ou l’organisme d’intérêt
évoluent, de la méthode de dénombrement et de la distribution spatiale des éléments d’intérêt. Le fait
d’utiliser des parcelles de même taille ou de tailles différentes doit aussi être considéré car des
variations de tailles peuvent influencera la probabilité qu’une parcelle soit choisie ou qu’elle contienne
des éléments d’intérêt.
Connaître l’échelle spatiale à laquelle évolue un phénomène ou un organisme d’intérêt est
primordiale afin de déterminer la taille optimale des parcelles à utiliser. En effet, la parcelle doit avoir
une probabilité relativement élevée d’inclure des éléments (si tant est qu’il y en ait au sein du cadre
d’échantillonnage), sans quoi, les estimations peuvent être entachées de biais et manquer de précision.
7
Tout comme dans le cas de la forme de la parcelle, l’influence de la méthode de dénombrement
sur les estimations dépend à la fois de la taille de la parcelle, de la mobilité des organismes d’intérêt et
des patrons de mouvement adoptés par ces derniers. Si un dénombrement complet doit être effectué, la
parcelle doit être assez petite pour que le dénombrement soit possible, mais assez grande pour limiter le
nombre de parcelles sans individus. Lors d’un dénombrement incomplet (e.g., par capture-marquage-
recapture), la parcelle doit être assez grande pour contenir un nombre suffisant d’individus permettant
d’estimer la probabilité de détection ou limiter les biais.
L’influence de la taille des parcelles sur la précision des estimations dépend fortement de la
distribution spatiale des éléments. Par exemple, lorsque les organismes à dénombrer sont rares et/ou
possèdent une distribution contagieuse, il sera avantageux d’accroître la taille des parcelles afin de
limiter le nombre de parcelles contenant aucun individu ou des densités exceptionnellement élevées.
Lorsque les parcelles varient en taille, il est important de considérer la possibilité que la taille
des parcelles et l’abondance des éléments contenus dans les parcelles soient corrélées. Si tel est le cas,
ne pas tenir compte de la taille des parcelles accroîtra la variance des observations et donc l’erreur type
des paramètres estimés. Dans un tel cas, il existe des méthodes pour tenir compte de la taille des
parcelles. Parmi ces méthodes on compte des estimateurs particulièrement complexes (e.g., l’estimateur
de Horvitz-Thompson) dont le calcul nécessite l’utilisation d’algorithmes informatiques et l’utilisation
d’une stratification basée sur la taille des parcelles (voir section A1.10). Cette dernière méthode est
efficace tout en étant celle qui est le plus facile à utiliser.
Déterminer la combinaison optimale de forme et de taille d’une parcelle est particulièrement
difficile. Ceci résulte du fait que plusieurs des sources de biais et d’imprécision agissent de façon
contraire sur la qualité des estimations, exigeant ainsi la recherche d’un compromis. À titre d’exemple,
une parcelle rectangulaire peut accroître la probabilité de détection, mais en même temps, accroître les
effets de bordure. Par conséquent, il est généralement nécessaire d’effectuer un pré-échantillonnage
pour déterminer la meilleure combinaison de forme et de taille des parcelles (ainsi que le nombre de
parcelles à échantillonner). Il existe toutefois des méthodes permettant de déterminer la taille et la
forme des parcelles en fonction de la variabilité du système à l’étude et des coûts associés à
l’échantillonnage (voir Krebs 1989 : 67-72).

A1.4.4 Disposition spatiale des parcelles


La disposition spatiale des parcelles peut avoir un impact important sur l’estimation des paramètres
d’une population, particulièrement en présence d’hétérogénéité spatiale (voir sections A1.4.6 et A1.11).
Cet aspect est traité davantage dans les sections concernant les différents plans d’échantillonnage.
8
A1.4.5 Hétérogénéité temporelle et autocorrélation temporelle
Les conditions abiotiques ainsi que les populations d’organismes changent dans le temps. Il en est de
même des caractéristiques des individus. Il s’ensuit que les valeurs des paramètres caractérisant ces
conditions et organismes varient dans le temps. Il est donc important de prendre en compte cette
variation lors de l’échantillonnage. Un soin particulier doit donc être porté à la période de temps au
cours de laquelle l’échantillonnage sera effectué. Il est généralement préférable de minimiser cette
période afin de limiter l’hétérogénéité temporelle. De plus, les observations rapprochées dans le temps
ont tendance à se ressembler. On dira ici que les données sont autocorrélées positivement dans le
temps. Il faut donc s’assurer que l’ordre des visites aux sites d’échantillonnage ne donne pas lieu à des
effets confondants. À titre d’exemple, l’humidité du sol d’une érablière est mesurée le matin alors que
celle d’une hêtraie est mesurée l’après-midi suite à une petite averse sur l’heure du midi. L’humidité du
sol des deux peuplements diffère-t-elle à cause de la pluie qui est tombée entre les deux séances
d’échantillonnage ou à cause de facteurs intrinsèques aux peuplements (ou du sol…)? Et dans le cas
d’une mesure de densité de grenouilles, il se peut que ces dernières soient plus actives après l’averse, et
donc que la probabilité de détecter les individus varie dans le temps. Pour des organismes dont la
probabilité de détection varie dans le temps (e.g., les oiseaux chanteurs), il est préférable de concentrer
les périodes d’échantillonnage durant les pics d’activité des organismes. Enfin, il est important de
considérer l’aspect cyclique que peut avoir certaines conditions abiotiques, certains comportements, ou
encore, certains effectifs de population. Par exemple, on obtiendra qu’un portrait incomplet de la
variance des effectifs d’une population de lemmings qui fluctue selon un cycle d’environ 4 ans si l’on
mesure l’abondance que lors des creux ou des pics de population.

A1.4.6 Hétérogénéité spatiale et autocorrélation spatiale


Alors que le temps ne comporte qu’une seule dimension, l’espace en possède (jusqu’à) trois. Les
conditions abiotiques, la densité des organismes et les caractéristiques des individus peuvent, par
exemple, varier selon leur position par rapport à la berge et aux entrées et sorties d’eau au sein d’un lac,
mais également en fonction de la profondeur de celui-ci. Les valeurs des paramètres caractérisant ces
conditions et organismes varient donc non seulement dans le temps, mais aussi dans l’espace. De plus,
cette variabilité peut changer dans le temps selon la situation des unités d’intérêt dans l’espace et selon
l’échelle spatiale à laquelle les phénomènes sont mesurés. Il est ici important de distinguer le fait que
des unités situées proches les unes des autres puissent se ressembler ou différer à cause de patrons
spatiaux sous-jacents ou du fait qu’elles sont intrinsèquement autocorrélées positivement ou
9
négativement dans l’espace. En effet, il est possible que des organismes soient agrégés simplement
parce que les ressources qu’ils exploitent le sont. Par exemple, on pourra expliquer la présence d’une
plante à l’aide de la distribution spatiale des types de sols, ou encore, la taille des groupes d’animaux en
quête alimentaire en fonction de la distribution spatiale des ressources alimentaires. Il demeure que des
processus tels que la territorialité donnent lieu à des espacements réguliers entre les individus au sein
d’un habitat relativement homogène. Aussi, une espèce d’arbres dont les fruits sont massifs et, par
conséquent, dont la dispersion ne se fait pas par le vent ou l’eau, risque de présenter une distribution
contagieuse. Ces deux derniers exemples illustrent respectivement l’absence et la présence
d’autocorrélation spatiale. Enfin, la probabilité de détection des individus peut varier dans l’espace. En
effet, il est plausible que la probabilité de détection puisse varier entre les habitats. Les oiseaux
chanteurs occupant des habitats pauvres et, par conséquent, ayant une probabilité moindre d’être
accouplé, pourraient chanter plus fréquemment et ainsi être plus facile à détecter. Il est définitivement
important de prendre en compte la variation spatiale des phénomènes d’intérêt lors de la planification
d’un échantillonnage. Le type et le niveau de variation spatiale peuvent suggérer un plan
d’échantillonnage qui limitera les biais et assurera une bonne précision. Les plans d’échantillonnage
systématiques sont particulièrement peu performants en présence d’hétérogénéité spatiale (voir section
A1.11).

A1.5 Pseudoréplication
La pseudoréplication est le fait de considérer les mesures prises sur des éléments comme étant
indépendantes alors que ces derniers ont pour origine la même unité d’échantillonnage. Dans un tel cas,
les mesures risquent fort probablement d’être corrélées entre-elles. La pseudoréplication a pour effet de
sous-estimer la variance des paramètres et donc de surestimer leur précision. Il s’ensuit que les
inférences statistiques basées sur ces paramètres auront une erreur de type I (α) qui sera plus élevée que
la valeur nominale.

A1.6 Randomisation et réplication


La randomisation consiste en une sélection aléatoire des unités d’échantillonnage. Elle constitue la
meilleure façon de se prémunir contre les biais et de s’assurer que l’échantillonnage soit représentatif
de la population statistique. La randomisation, lorsque couplée à la réplication, permet d’obtenir une
estimation de la variabilité de mesure entre les unités d’échantillonnage. La réplication résulte de la
sélection de plus d’une unité d’échantillonnage. Il faut un minimum de deux unités d’échantillonnage
pour évaluer la variabilité de mesure entre les unités d’échantillonnage. Toute chose étant égale par
10
ailleurs, accroître le niveau de réplication mènera à un gain de précision lors de l’estimation de
paramètres.

A1.7 Erreur type et intervalle de confiance


Toute estimation d’un paramètre devrait être accompagnée de la taille d’échantillon ayant permis cette
estimation et d’une mesure de sa variance. Quoique les paramètres d’une population soient considérés
fixes, ils demeurent inconnus et doivent être estimés à partir d’un échantillon. L’estimation d’un
paramètre dépend donc directement de l’échantillon sélectionné. En effet, les estimations varieront
d’un échantillon à un autre. Par conséquent, ces estimations sont considérées comme des variables
aléatoires ayant leur propre distribution. La variance d’un paramètre et son écart type, nommé erreur
type, caractérisent la dispersion des estimations autour de la valeur attendue pour la population
statistique (voir section 5.15 et Boîte 5.1). Ce qui est intéressant, est le fait qu’il soit possible d’estimer
cette dispersion à partir d’un seul échantillon. Plus la variance et l’erreur type d’un paramètre seront
faibles, plus l’estimation de celui-ci sera considérée précise. L’erreur type sert aussi au calcul d’un
intervalle de confiance autour de l’estimation d’un paramètre. Un intervalle de confiance est
intéressant, car 100(1-α)% des intervalles de confiance basés sur des échantillons de taille n
contiendront la vraie valeur de la population pour ce paramètre. En d’autres termes, si l’on réplique un
échantillonnage un grand nombre de fois, 100(1-α)% des intervalles contiendront la vraie valeur du
paramètre. Le seuil α représente l’erreur de type I d’une inférence statistique. Il faut ici faire très
attention à l’interprétation faite d’un intervalle de confiance. En effet, on entend trop souvent à torts
qu’un intervalle de confiance à 100(1-α)% représente une étendue de valeurs au sein de laquelle le
paramètre d’intérêt (e.g., µ) est compris avec une probabilité de 100(1-α)%.

A1.8 Échantillonnage aléatoire simple ou échantillonnage aléatoire sans remise


L’échantillonnage aléatoire simple consiste à sélectionner aléatoirement n unités d’échantillonnage
d’un cadre d’échantillonnage en contenant N au total, et ce, sans remise et de manière à ce que toutes
les combinaisons possibles de n unités d’échantillonnage aient la même probabilité d’être choisies.
Dans un tel cas, chaque unité d’échantillonnage possède une probabilité de n/N d’être inclue dans un
échantillon. La caractéristique voulant que chaque unité d’échantillonnage ait la même probabilité de
faire partie de l’échantillon n’est pas exclusive à l’échantillonnage aléatoire simple. Par contre, le fait
que chaque combinaison de n unités d’échantillonnage ait la même probabilité d’être choisie est

11
exclusive à ce plan d’échantillonnage. Puisque le nombre de combinaisons de n unités
d’échantillonnage est donné par :
N!
C nN =
n!( N − n)!
la probabilité qu’une combinaison de n unités d’échantillonnage soit sélectionnée est donnée par :
−1
⎛ N! ⎞
⎜⎜ ⎟⎟
⎝ n!( N − n)! ⎠

A1.8.1 Estimation de la moyenne de la population


La valeur attendue ou moyenne de toutes les unités d’un cadre d’échantillonnage (i.e., de la population
statistique) est donnée par :
N

∑y i
µ= i =1

N
Un estimateur non biaisé de µ est :
n

∑y i
y= i =1

n
La variance de la population entière est exprimée par :
N 2

∑ (y i − µ)
σ =
2 i =1

N −1
y

L’estimateur non biaisé de cette variance, en d’autres termes, la variance de l’échantillon, est
simplement :

∑ (y )
n 2

i −y
s =
2 i =1

n −1
y

La variance de l’échantillon représente la variabilité des mesures prises entre les différentes unités
d’échantillonnage. Il ne faut pas confondre cette variance avec celle de la moyenne de l’échantillon. La
variance de la moyenne de la population se calcule selon :

⎛ N − n⎞σ y
2

σ =⎜
2
y ⎟
⎝ N ⎠ n
Un estimateur non biaisé de cette variance est :

12
⎛ N − n ⎞ sy
2

s y2 = ⎜ ⎟
⎝ N ⎠n
L’erreur type est simplement la racine carrée de la variance de la moyenne de l’échantillon :

⎛ N − n ⎞ sy
2

sy = ⎜ ⎟
⎝ N ⎠ n
L’intervalle de confiance à 100(1-α)% de la moyenne de la population µ s’estime approximativement
selon :
y ± tα 2, n −1s y

Cet intervalle suppose une distribution normale de la moyenne de l’échantillon. Cette supposition n’est
pas très contraignante du fait que si l’on échantillonne à plusieurs reprise la population selon un plan
d’échantillonnage aléatoire simple, la distribution des moyennes des échantillons devraient tendre vers
la normalité.
On peut estimer la taille de l’échantillon n requis pour estimer la moyenne de la population µ
avec une marge d’erreur de d unités, et ce, avec une erreur α donnée selon :
1
n=
d 2
z α 2σ 2 + 1 N
2

où z est la borne supérieure d’une distribution normale centrée réduite pour un seuil α/2 (voir section
6.6.3). Cette formule implique que la variance de la population soit connue, ce qui est généralement pas
le cas. On doit donc se référer à des valeurs publiées ou encore à une estimation (i.e., s2) qui découle
d’un pré-échantillonnage.

A1.8.2 Estimation du total de la population


Dans le cadre de l’estimation de l’abondance ou de l’effectif d’une population (i.e., représentés par N
dans la plupart des modèles démographiques en écologie), la moyenne de l’échantillon vue à la section
précédente représente la densité des individus (i.e., le nombre d’individus par unité de surface ou de
volume). L’abondance d’une population τ est donc simplement le produit de la densité par la superficie
ou le volume du cadre d’échantillonnage :
N
τ = ∑ y i = Nµ
i =1

L’estimateur non biaisé de cette quantité est :


n
N
τˆ = Ny =
n
∑y
i =1
i

13
La variance du total de la population est décrit par :
σ y2
σ = N σ = N ( N − n)
2
τˆ
2 2
y
n
L’estimateur non biaisé de cette variance est :
s y2
sτ2ˆ = N 2 s y2 = N ( N − n)
n
Enfin, on peut calculer un intervalle de confiance approximatif du total de la population à l’aide de la
formule suivante :
τˆ ± tα 2,n−1 sτˆ

On peut estimer la taille de l’échantillon n requis pour estimer le total de la population τ avec
une marge d’erreur de d unités, et ce, avec une erreur α donnée selon :
1
n=
d 2
N z α 2σ 2 + 1 N
2 2

où z est la borne supérieure d’une distribution normale centrée réduite pour un seuil α/2 (voir section
6.6.3).

A1.8.3 Estimation d’une proportion


L’estimation d’une proportion à l’aide d’un plan d’échantillonnage aléatoire simple suit les mêmes
règles que pour une moyenne. De fait, la variable mesurée sur les unités d’échantillonnage est une
variable catégorique où yi = 0 si l’unité i ne possède pas la caractéristique d’intérêt et yi = 1 si elle la
possède. Il s’ensuit que le total de la population indique le nombre d’unités qui possèdent la
caractéristique au sein de la population, alors que la moyenne indique la proportion des unités
possédant la caractéristique au sein de la population.
La valeur attendue ou moyenne de toutes les unités d’un cadre d’échantillonnage (i.e., de la
population statistique) est donnée par :
N

∑y i
p=µ= i =1

N
Un estimateur non biaisé de p est :
n

∑y i
pˆ = i =1

n
La variance de la population entière est exprimée par :

14
N 2

∑ ( yi − p ) N
σ y2 = i =1
= p(1 − p)
N −1 N −1
L’estimateur non biaisé de cette variance, en d’autres termes, la variance de l’échantillon, est
simplement :
n 2

∑ (y i − pˆ )
n
s =
2 i =1
= pˆ (1 − pˆ )
n −1 n −1
y

La variance de l’échantillon représente la variabilité des mesures prises entre les différentes unités
d’échantillonnage. Il ne faut pas confondre cette variance avec celle de la moyenne de l’échantillon. La
variance de la moyenne de la population se calcule selon :
⎛ N − n ⎞ p(1 − p)
σ p2ˆ = ⎜ ⎟
⎝ N −1 ⎠ n
Un estimateur non biaisé de cette variance est :
⎛ N − n ⎞ pˆ (1 − pˆ )
s 2pˆ = ⎜ ⎟
⎝ N ⎠ n −1
L’intervalle de confiance à 100(1-α)% de la moyenne de la population p s’estime approximativement
selon :
pˆ ± tα 2, n −1s pˆ

On peut estimer la taille de l’échantillon n requis pour estimer la moyenne de la population p


avec une marge d’erreur de d unités, et ce, avec une erreur α donnée selon :
Np (1 − p)
n=
( N − 1)(d 2 zα2 2 ) 2 + p(1 − p)

où z est la borne supérieure d’une distribution normale centrée réduite pour un seuil α/2 (voir section
6.6.3). Notez qu’il existe des formules permettant d’évaluer la taille d’échantillon nécessaire au calcul
de plusieurs proportions caractérisant une même population (voir Thompson 2002 : 42). Une telle
situation peut se présenter lorsque l’on veut évaluer la proportion d’individus au sein de différentes
classes d’âge (e.g., juvénile, immature, adulte).

A1.8.4 Estimation d’un ratio


L’estimation d’un ratio pose un problème particulier du fait qu’elle implique plus d’une variable
aléatoire. À titre d’exemple, notre biologiste pourrait s’intéresser au ratio de tétards : grenouilles

15
adultes. Ce ratio nécessite l’estimation de deux variables aléatoires : le nombre de tétards et le nombre
d’adultes. On peut calculer le ratio d’une population r à l’aide de l’estimateur :
n

∑y i
y
r= i =1
n
=
∑x
x
i
i =1

Cet estimateur est par contre légèrement biaisé dans le cadre d’un plan d’échantillonnage aléatoire
simple. Je vous réfère à Thompson (2002) pour les formules à utiliser dans le cadre de l’estimation des
ratios.

A1.8.5 Estimations pour des sous-populations


Une autre situation particulière est l’estimation de paramètres (e.g., moyenne, total ou proportion)
concernant une sous-population. En effet, si notre biologiste veut estimer la proportion d’individus
ayant des malformations chez les mâles et les femelles, et ce à partir d’un même échantillon, et bien
elle devra calculer cette proportion pour deux sous-populations caractérisées par des sexes différents.
La proportion de mâles et la proportion de femelles présentant des malformations seront alors :
a femelle a mâle
p femelle = et p mâle =
n femelle n mâle


n = n femelle + nmâle et asexe représente le nombre d’individus ayant des malformations. Tout comme dans

le cas des ratios, asexe et nsexe sont des variables aléatoires. Je vous réfère à Thompson (2002) pour les
formules à utiliser dans le cadre de l’estimation de paramètres basés sur des sous-populations.

A1.9 Échantillonnage aléatoire avec remise


L’échantillonnage aléatoire avec remise est beaucoup moins efficace que l’échantillonnage aléatoire
simple. Par manque d’efficacité, on entend que pour une taille d’échantillon donnée, la variance des
paramètres sera plus élevée. Ceci est causé par le fait qu’il n’y a pas de facteur de correction pour
population finie qui est appliqué au calcul de la variance de la moyenne de la population :

⎛ N −1⎞ σ y
2

σ =⎜
2
y ⎟
⎝ N ⎠ n
L’estimateur non biaisé de cette variance est simplement :
s y2
s =
2
y
n
16
L’échantillonnage aléatoire avec remise et l’échantillonnage aléatoire simple donnent des résultats
similaires lorsque n/N -> 0.

A1.10 Échantillonnage stratifié


L’hétérogénéité spatiale observée en écologie implique souvent que les unités d’échantillonnage situées
dans des habitats ou des régions similaires possèdent des caractéristiques similaires. Dans une telle
situation, il est possible de regrouper les unités d’échantillonnage partageant une série de
caractéristiques au sein de strates à partir desquelles des unités seront sélectionnées selon un plan
d’échantillonnage donné. Stratifier ainsi l’échantillonnage confère deux avantages. Premièrement, les
paramètres d’intérêt pourront être estimés avec plus de précision. Deuxièmement, les unités
d’échantillonnage sélectionnées risquent d’être mieux réparties sur l’ensemble du cadre
d’échantillonnage. La stratification ne peut qu’amener un gain de précision. Ce gain sera fonction de
l’homogénéité des unités d’échantillonnage au sein des strates. Ceci résulte du fait que la variance des
estimateurs est simplement la somme des variances estimées pour toutes les strates. Notez ici que la
sélection des unités d’échantillonnage doit être indépendante d’une strate à l’autre. Dans le cas où les
strates sont mal définies, la précision des estimations tendra vers celle que l’on peut obtenir via un
échantillonnage aléatoire simple. Définir judicieusement les strates est donc crucial pour justifier les
coûts associés à la stratification.
Comme mentionné ci-haut, on suppose ici que les unités d’échantillonnage sont sélectionnées
selon un plan d’échantillonnage probabiliste et que cette sélection est faite de façon indépendante entre
les strates. La variable d’intérêt qui sera mesurée sur l’unité i au sein de la strate h est dénotée yhi. Le
nombre d’unités d’échantillonnage contenues dans la strate h est Nh et nh est le nombre d’unités
échantillonnées au sein de cette strate. Le nombre d’unités d’échantillonnage contenues dans le cadre
d’échantillonnage est donc :
L
N = ∑ Nh
h =1

et la taille de l’échantillon :
L
n = ∑ nh
h =1

Le total des yhi au sein de la strate h est :


Nh
τ h = ∑ y hi
i =1

et la moyenne des yhi au sein de la strate h :

17
τh
µh =
Nh
Par conséquent, le total de la population est :
L
τ = ∑τ h
h =1

et la moyenne de la population :
τ
µ=
N

A1.10.1 Estimation du total de la population


Si τˆh est un estimateur non biaisé du total d’une strate τh, alors le total d’une population τ est estimé

par :
L
τˆ = ∑τˆh
h =1

Et si sτ2ˆh est un estimateur non biaisé de la variance de l’estimateur du total d’une strate σ τ2ˆh , alors la

variance de l’estimateur du total de la population est :


L
σ τ2ˆ = ∑σ τ2ˆ h
h =1

et son estimateur :
L
sτ2ˆ = ∑ sτ2ˆh
h =1

Un intervalle de confiance approximatif à 100(1-α)% peut être construit selon :


τˆ ± tα 2, n−1sτˆ

A1.10.2 Estimation de la moyenne de la population


Un estimateur non biaisé de la moyenne de la population µ :
τˆ
µˆ =
N
La variance de cet estimateur est :
σ τ2ˆ
σ µ2ˆ =
N2
Et a pour estimateur :

18
sτ2ˆ
sµ2ˆ =
N2
Un intervalle de confiance approximatif à 100(1-α)% peut être construit selon :
µˆ ± tα 2, n−1sµˆ

A1.10.3 Allocation des unités d’échantillonnage entre les strates


L’allocation des unités d’échantillonnage qui maximisera le gain de précision dû à la stratification, et
ce, pour une taille d’échantillon n, est donnée par :
nN hσ h
nh = L

∑N σ
k =1
k k

Si aucune estimation de la variance des strates est disponible, alors on peut utiliser des tailles
d’échantillon identiques pour chaque strate ou encore, sélectionner un nombre d’unités
d’échantillonnage proportionnel à la taille du cadre d’échantillonnage de chaque strate. Cette deuxième
option implique un rapport nh/Nh constant entre les strates.

A1.10.4 Stratification post-échantillonnage


Il n’est pas nécessaire que la stratification s’effectue avant que l’échantillonnage soit exécuté sur le
terrain. En effet, une fois les unités d’échantillonnage sélectionnées et mesurées, il se peut que des
caractéristiques de ces dernières suggèrent une stratification. Un telle stratification implique que les
tailles d’échantillon des strates nh constituent des variables aléatoires. Ceci complique l’estimation des
paramètres. Vous êtes référés à Thompson (2002) pour les formules à utiliser dans un cadre de
stratification post-échantillonnage.

A1.11 Échantillonnage par grappes et échantillonnage systématique


Dans le cadre d’un échantillonnage stratifié, les unités d’échantillonnage étaient regroupés au sein de
groupes (i.e., de strates) les plus homogènes possible, et ce, afin de minimiser la variance au sein des
groupes et de maximiser la variance entre les groupes. L’échantillonnage par grappes, dont
l’échantillonnage systématique est un cas particulier, fonctionne à l’inverse. L’idée est ici de
sélectionner des groupes (i.e., grappes) d’unités d’échantillonnage dont la variance intra-groupe sera
maximisée alors que la variance inter-groupe sera minimisée. La variance de la population dépendra
donc principalement de la variance intra-groupe, plutôt qu’inter-groupe comme c’était le cas pour
l’échantillonnage stratifié. De plus, seul un échantillon des groupes potentiels d’unités
19
d’échantillonnage doit être sélectionné pour estimer les paramètres de la population d’intérêt à l’aide
d’un échantillonnage par grappes. Dans le cas de l’échantillonnage stratifié, des unités
d’échantillonnage devaient être sélectionnés au sein de chaque groupe (i.e., strate).
L’échantillonnage par grappes se distingue aussi du fait que toutes les unités d’échantillonnage
faisant partie d’un groupes doivent être inclues dans l’échantillon. Il s’ensuit que les unités
d’échantillonnage faisant partie d’une grappe donnée ne sont pas indépendantes les unes des autres. Par
conséquent, il est important que plus d’une grappe soit sélectionnée pour obtenir une estimation de la
variance des paramètres. Enfin, notez que la taille et la forme des grappes affecteront l’efficacité du
plan d’échantillonnage.
Il est important de noter que l’échantillonnage systématique n’est pas recommandé dans les cas
où l’hétérogénéité spatiale est significative et caractérisée par patrons périodiques. Puisqu’il est
généralement difficile de caractériser l’hétérogénéité spatiale au sein d’une aire d’étude, et que cette
hétérogénéité peut donner lieu à des biais importants, on suggère d’utiliser une stratification pour
répartir les unités d’échantillonnage dans l’espace plutôt qu’un plan systématique.

A1.11.1 Estimation du total et de la moyenne de la population

EN CONSTRUCTION. À venir. 2007?

n
N
τˆ = Ny =
n
∑y
i =1
i

σ u2
σ τ2ˆ = N ( N − n)
n
N 2

∑(y i − µ1 )
σ =
2 i =1

N −1
u

su2
sτ2ˆ = N ( N − n)
n
n 2

∑ ( yi − y )
su2 = i =1
n −1

20
A1.12 Échantillonnage multi-stades
Il est possible de combiner plusieurs plans d’échantillonnage (probabilistes) selon une hiérarchie
d’échelles, le plus souvent spatiales. Par exemple, on pourra choisir selon un plan d’échantillonnage
aléatoire simple une série d’étangs, au sein desquels un plan d’échantillonnage stratifié selon la
profondeur sera utilisé pour prendre des carottes de sols et mesurer la densité de bactéries. Un tel
emboîtement de plans d’échantillonnage est sans limite, mais au coût d’accroître la complexité du
calcul des paramètres et, surtout, de leur variance.

A1.12.1 Échantillonnage aléatoire simple à tous les stades


Un exemple d’échantillonnage aléatoire simple pour deux stades est celui de notre biologiste qui
d’abord choisirait une série d’étangs selon un plan d’échantillonnage aléatoire simple. Cette première
sélection serait suivie d’un échantillonnage aléatoire simple des Grenouille des marais habitant les
étangs choisis au premier stade. Enfin des mesures morphologiques seraient prises pour dériver un
indice de condition de santé des grenouilles.

EN CONSTRUCTION. À venir. 2005 ou 2006?

A1.13 Échantillonnage adaptatif


À venir. 2007?

A1.14 Estimation par régression


À venir. 2007?

A1.15 Échantillonnage double ou en deux phases


À venir. 2007?

A1.16 Échantillonnage par distance


L’échantillonnage par distance permet de corriger les estimations d’abondance et de densité lorsque la
détectabilité est imparfaite et que la méthode de dénombrement s’effectue à partir de points
d’observation ou le long de transects. L’idée à la base de l’échantillonnage par distance est que la
probabilité de détection diminue en fonction de la distance séparant l’observateur de l’élément d’intérêt
(e.g., animal, nid, terrier). Connaissant le taux auquel la probabilité de détection diminue avec cette
distance, de même que la distance séparant les éléments d’intérêt observés de l’observateur (ou du
21
transect), il devient possible de corriger le nombre d’éléments d’intérêt qui ont été détectés. Notez que
dans le cas d’un point d’observation, on mesurera simplement la distance séparant le point où se tient
l’observateur de l’élément d’intérêt. Dans le cas d’un transect, par contre, on mesurera la plus petite
distance séparant l’élément d’intérêt du transect. Ces distances (observées) serviront à estimer la
relation entre la probabilité de détection et la distance.
L’outil informatique par excellence pour analyser des dénombrements effectués à partir de
points d’observation ou le long de transects est le logiciel DISTANCE. Ce logiciel développé par un
groupe dirigé par Len Thomas est disponible gratuitement sur le site http://www.ruwpa.st-
and.ac.uk/distance/. Un bon manuel d’introduction à ce type d’échantillonnage est celui de Buckland et
al. (2001).

A1.17 Échantillonnage par capture-marquage-recapture


Ce type d’échantillonnage est basé sur la capture et le marquage d’individus, lesquels seront recapturés
avec une certaine probabilité qui dépendra de plusieurs facteurs. Parmi ces derniers, on note le fait que
la population puisse être affectée par les processus de natalité, de mortalité, d’immigration et
d’émigration, l’effort de capture, le fait que les individus marqués s’habituent ou craignent les
observateurs ou les dispositifs de capture, etc. En faisant des suppositions sur ces facteurs, il est
possible d’estimer des variables telles que l’abondance des individus, leur taux de survie ou de
migration. La capture et le marquage des individus ne sont pas nécessairement physiques peuvent être
visuels. En effet, en notant des caractéristiques physiques permettent de reconnaître les individus
visuellement, il sera possible de les recapturer visuellement (i.e., les revoir). L’échantillonnage par
capture-marquage-recapture étant particulièrement complexe, il est impossible d’en traiter sur le sens
du monde dans le cadre du cours BIO300… car il nous reste encore bien des concepts de base à voir, et
ce, sans compter qu’il faut s’attaquer au logiciel R!!! Pour les maniaques, vous trouverez une superbe
synthèse des divers modèles de capture-marquage-recapture dans Williams et al. (2002).
Un des outils informatiques les plus utilisés pour analyser les données de capture-marquage-
recapture est le logiciel MARK développé par Gary White et disponible gratuitement sur le site
http://www.cnr.colostate.edu/~gwhite/mark/mark.htm. En guise d’introduction à ce logiciel, je vous
recommande fortement le bouquin de Cooch and White (2005) qui est lui aussi disponible gratuitement
sur le site http://www.phidot.org/software/mark/docs/book/.

22
A1.18 Références (et autres lectures d’intérêt)
Anderson, D. R., K. P. Burnham, B. C. Lubow, L. Thomas, P. S. Corn, P. A. Medica, and R. W.
Marlow. 2001. Field trials of line transect methods applied to estimation of desert tortoise
abundance. Journal of Wildlife Management 65:583-597.
Bart, J., and S. Earnst. 2002. Double sampling to estimate density and population trends in birds. Auk
119:36 - 45.
Bibby, C. J., N. D. Burgess, and D. A. Hill. 1992. Bird census techniques. Academic Press, London.
Buckland, S. T., D. R. Anderson, K. P. Burnham, J. L. Laake, D. L. Borchers, and L. Thomas. 2001.
Introduction to distance sampling. Estimating abundance of biological populations. Oxford
University Press, Oxford, UK.
Buckland, S. T., D. R. Anderson, K. P. Burnham, J. L. Laake, D. L. Borchers, and L. Thomas. 2004.
Advanced distance sampling. Estimating abundance of biological populations. Oxford University
Press, Oxford, UK.
Burnham, K. P., D. R. Anderson, G. C. White, C. Brownie, and K. H. Pollock. 1987. Design and
analysis methods for fish survival experiments based on release-recapture. American Fisheries
Society, Bethesda, Maryland, USA.
Cochran, W. G. 1977. Sampling techniques, 3rd edition. Jhon Wiley & Sons, New York, New York,
USA.
Cooch, E., and G. C. White. 2005. Program MARK. A gentle introduction.
http://www.phidot.org/software/mark/docs/book/.
Farnsworth, G., K. Pollock, J. Nichols, T. Simons, J. Hines, and J. Sauer. 2002. A removal model for
estimating detection probabilities from point-count surveys. Auk 119:414 - 425.
Fortin, M.-J. 1999. Effects of sampling unit resolution on the estimation of spatial autocorrelation.
Écoscience 6:636-641.
Fortin, M.-J., P. Drapeau, and P. Legendre. 1989. Spatial autocorrelation and sampling design in plant
ecology. Vegetatio 83:209-222.
Hurlbert, S. H. 1984. Pseudoreplication and the design of ecological field experiments. Ecological
Monographs 54:187-211.
Knapp, R. A., K. R. Matthews, H. K. Preisler, and R. Jellison. 2003. Developing probabilistic models
to predict amphibian site occupancy in a patchy landscape. Ecological Applications 13:1069-
1082.
Krebs, C. J. 1989. Ecological methodology. Harper and Row, New York.

23
Lebreton, J.-D., K. P. Burnham, J. Clobert, and D. R. Anderson. 1992. Modeling survival and testing
biological hypotheses using marked animals: A unified approach with case studies. Ecological
Monographs 62:67-118.
Legendre, P. 1993. Spatial autocorrelation: trouble or new paradigm? Ecology 74:1659-1673.
Legendre, P., M. Troussellier, V. Jarry, and M.-J. Fortin. 1989. Design for simultaneous sampling of
ecological variables: from concepts to numerical solutions. Oikos 55:30-42.
Legendre, P., M. R. T. Dale, M. J. Fortin, J. Gurevitch, M. Hohn, and D. Myers. 2002. The
consequences of spatial structure for the design and analysis of ecological field surveys.
Ecography 25:601-615.
MacKenzie, D. I., and W. L. Kendall. 2002. How should detection probability be incorporated into
estimates of relative abundance? Ecology 83:2387-2393.
MacKenzie, D. I., and W. L. Kendall. 2002. How should detection probability be incorporated into
estimates of relative abundance? (vol 83, pg 2387, 2002). Ecology 83:3532.
MacKenzie, D. I., J. D. Nichols, G. B. Lachman, S. Droege, J. A. Royle, and C. A. Langtimm. 2002.
Estimating site occupancy rates when detection probabilities are less than one. Ecology 83:2248-
2255.
MacKenzie, D. I. 2005. What are the issues with presence-absence data for wildlife managers? Journal
of Wildlife Management 69:849-860.
MacKenzie, D. I. 2006. Modeling the probability of resource use: The effect of, and dealing with,
detecting a species imperfectly. Journal of Wildlife Management 70:367-374.
MacKenzie, D. I., and L. L. Bailey. 2004. Assessing the fit of site-occupancy models. Journal of
Agricultural Biological and Environmental Statistics 9:300-318.
MacKenzie, D. I., L. L. Bailey, and J. D. Nichols. 2004. Investigating species co-occurrence patterns
when species are detected imperfectly. Journal of Animal Ecology 73:546-555.
MacKenzie, D. I., J. D. Nichols, J. E. Hines, M. G. Knutson, and A. B. Franklin. 2003. Estimating site
occupancy, colonization, and local extinction when a species is detected imperfectly. Ecology
84:2200-2207.
MacKenzie, D. I., J. D. Nichols, N. Sutton, K. Kawanishi, and L. L. Bailey. 2005. Improving
inferences in population studies of rare species that are detected imperfectly. Ecology 86:1101-
1113.
Mackenzie, D. I., and J. A. Royle. 2005. Designing occupancy studies: general advice and allocating
survey effort. Journal of Applied Ecology 42:1105-1114.

24
MacKenzie, D. I., J. D. Nichols, J. A. Royle, K. H. Pollock, L. L. Bailey, and J. E. Hines. 2006.
Occupancy estimation and modeling. Academic Press, New York, New York, USA.
Mazerolle, M. J., A. Desrochers, and L. Rochefort. 2005. Landscape characteristics influence pond
occupancy by frogs after accounting for detectability. Ecological Applications 15:824-834.
Rosenstock, S., D. Anderson, K. Giesen, T. Leukering, and M. Carter. 2002. Landbird counting
techniques: Current practices and an alternative. Auk 119:46 - 53.
Royle, J. A. 2004. Modeling abundance index data from anuran calling surveys. Conservation Biology
18:1378-1385.
Royle, J. A. 2004. N-mixture models for estimating population size from spatially replicated counts.
Biometrics 60:108-115.
Royle, J. A. 2006. Site occupancy models with heterogeneous detection probabilities. Biometrics
62:97-102.
Royle, J. A., and J. D. Nichols. 2003. Estimating abundance from repeated presence-absence data or
point counts. Ecology 84:777-790.
Royle, J. A., and W. A. Link. 2006. Generalized site occupancy models allowing for false positive and
false negative errors. Ecology 87:835-841.
Royle, J. A., D. K. Dawson, and S. Bates. 2004. Modeling abundance effects in distance sampling.
Ecology 85:1591-1597.
Royle, J. A., J. D. Nichols, and M. Kery. 2005. Modelling occurrence and abundance of species when
detection is imperfect. Oikos 110:353-359.
Seber, G. A. F. 1982. The estimation of animal abundance and related parameters. MacMillan, New
York, New York, USA.
Seber, G. A. F. 1986. A review of estimating animal abundance. Biometrics 42:267-292.
Seber, G. A. F. 1992. A review of estimating animal abundance II. International Statistical Review
60:129-166.
Sutherland, W. J., editor. 1996. Ecological census techniques: a handbook. Cambridge University
Press, Cambridge, UK.
Thompson, S. K. 2002. Sampling, 2nd edition. John Wiley & Sons, New York, New York, USA.
Thompson, S. K., and G. A. F. Seber. 1996. Adaptive sampling. John Wiley & Sons, New York, New
York, USA.
Thompson, W. 2002. Towards reliable bird surveys: Accounting for individuals present but not
detected. Auk 119:18 - 25.

25
Thompson, W. L., C. Gowan, and G. C. White. 1998. Monitoring vertebrate populations. Academic
Press, New York, New York, USA.
Williams, B. K., J. D. Nichols, and M. J. Conroy. 2002. Analysis and management of animal
populations. Academic Press, New York, New York, USA.

26

Vous aimerez peut-être aussi