Académique Documents
Professionnel Documents
Culture Documents
DOCUMENT TECHNIQUE N° 06
1ére édition : 1986
2ème édition : 1996
Reformatage : 2011
Le document technique ci-après, a été établi par les membres de la Commission des Essais
Biologiques de l’Association Française de Protection des Plantes.
Ce document peut être révisé par la Commission, compte tenu de l’évolution des méthodes
d'expérimentation et des techniques agricoles.
Reproduction partielle interdite. Reproduction intégrale soumise à l’agrément préalable de l’ Association Française de Protection des Plantes
SOMMAIRE
1. INTRODUCTION ................................................................................................................ 1
2. QUESTIONS POSEES - ILLUSTRATIONS A TRAVERS DEUX EXEMPLES........ 1
2.1. Exemple 1 :................................................................................................................ 1
2.2. Exemple 2 :................................................................................................................ 4
3. LES DIFFERENTES NATURES DE VARIABLES ........................................................ 5
3.1. Nature des variables .................................................................................................. 5
3.2. Importance de l'étude de la distribution de chaque variable .................................. 7
4. LES TRANSFORMATIONS DE VARIABLES ............................................................... 9
4.1. Principales transformations : comment choisir ? ................................................... 9
4.2. Quand transformer ? ................................................................................................ 9
4.3. Quelles données transformer ?................................................................................. 9
4.4. Comment interpréter et présenter les résultats ? ................................................... 10
5. GENERALITES SUR LES TESTS .................................................................................. 11
5.1. Introduction ............................................................................................................ 11
5.2. Les étapes d'un test statistique................................................................................ 11
5.2.1. Définition de l'hypothèse nulle H0 (et de l'alternative H1) .............................. 11
5.2.2. Choix du test statistique ................................................................................... 12
5.2.3. Choix des risques ............................................................................................. 12
5.2.4. Distribution d'échantillonnage ......................................................................... 15
5.2.5. Construction de la région de rejet .................................................................... 15
5.2.6. Réalisation du test sur les données et conclusions ........................................... 17
5.3. Exemple ................................................................................................................... 18
6. CHOIX D'UN TEST .......................................................................................................... 19
6.1. Classification des tests usuels ................................................................................. 19
6.2. Exemples ................................................................................................................. 20
7. CONCLUSION ET APPLICATION AUX METHODES DE LA COMMISSION DES
ESSAIS BIOLOGIQUES ................................................................................................ 21
8. BIBLIOGRAPHIE ............................................................................................................. 22
De nombreux ouvrages existent sur les tests statistiques ; le présent document a pour objet de
mettre en évidence les deux principaux critères de choix d'un test :
la question posée
la nature de la variable analysée
Dans une première partie, nous verrons, sur deux exemples volontairement simplifiés,
comment formuler une question. Ensuite, nous examinerons les différentes natures de
variables que l'on peut rencontrer.
Après quelques généralités, nous donnerons une classification des tests les plus usuels.
En conclusion, nous formulerons quelques conseils pour les concepteurs et rédacteurs de
méthodes d'expérimentation de produits phytosanitaires.
2.1. Exemple 1
1 - Tout d'abord, il faut se demander si l'essai est capable de fournir des données utiles.
Ceci n'est le cas que si l'infestation dans le témoin non traité atteint un niveau suffisant.
C'est en général une appréciation subjective, mais on peut disposer de seuils dans
quelques cas particuliers (exemple : Botrytis de la vigne).
3 - Si ces 2 conditions sont remplies, il est alors possible de comparer statistiquement les
produits à étudier et le produit de référence et éventuellement entre eux en utilisant un
test statistique adapté.
OUI NON
Récupération
2.2. Exemple 2
1 - L'essai est-il réaliste, c'est-à-dire capable de fournir des données utiles ? Pour cela, il
faut que le témoin soit suffisamment propre. C'est en général une appréciation
subjective, mais on peut disposer de seuils dans quelques cas particuliers.
2 - Les résultats sont-ils cohérents ? Pour cela il faut que, par comparaison au témoin non
traité, le produit de référence donne des résultats attendus.
4 - Parmi les produits non phytotoxiques à la dose N, lesquels sont phytotoxiques à une
dose kN ?
En premier lieu, il faut faire une distinction entre les variables observées et celles qui sont
interprétées. Ainsi, on observe un poids parcellaire, une humidité et on interprète un
rendement ramené à l'hectare et aux normes commerciales d'humidité. De même, dans un
essai conduit avec des témoins adjacents, on interprète par exemple un écart de rendement
entre la parcelle traitée et la parcelle témoin.
Il est alors essentiel de savoir dans quel ensemble la variable interprétée peut prendre ses
valeurs, parmi les différents types de variables. En effet, ces types conditionnent souvent les
tests statistiques réalisables. Dans le tableau ci-après, nous avons défini cinq types de
variables. Cette classification est bien sûr critiquable, car à un type donné de variables ne
Exemples d'ensembles de
NATURE DES
TYPE valeurs prises
VARIABLES
par les variables
OUI ou NON
DICHOTOMIE BINAIRES VRAI ou FAUX
PRESENCE ou
ABSENCE
VARIABLES Précédent cultural (blé,
QUALITATIVES POLYTOMIE NON NOMINALES maïs, betteraves ...)
ORDONNEE couleur (bleu, blanc,
rouge ...)
POLYTOMIE ORDINALES Mauvais, moyen, bon
ORDONNEE
DISCRETES Nombre
ENTIERES A VALEURS d'inflorescences, de
ENTIERES fruits, d'insectes
VARIABLES CONTINUES pouvoir germinatif
QUANTITATIVE BORNEES
S CONTINUES
(proportions) rendement en grain
hauteur de plante
CONTINUES NON
BORNEES
Remarques :
1 - Une proportion est une fréquence relative. Elle est traduite parfois abusivement en
pourcentage. Mais on parle aussi de pourcentage lorsque l'on exprime une valeur
(un rendement, une note d'infestation) par rapport à une autre déterminée à l'avance.
Attention ! Ces deux variables ne sont pas de même nature. Une proportion varie
entre 0 et 1. Par exemple, le pouvoir germinatif est le rapport du nombre de grains
germés au nombre de grains examinés. Pour qu'une proportion ait un sens, il faut
que la taille de l'échantillon soit suffisante. Dans tous les cas, on doit préciser cette
taille.
Un pourcentage en revanche n'est pas borné. Il n'est qu'exceptionnellement utilisé
dans l'analyse des résultats, mais souvent, pour des raisons de commodité, dans leur
présentation (exemple : coefficient d'efficacité d'un produit par rapport à un témoin).
Là aussi, pour que ce pourcentage soit interprétable, il faut préciser le dénominateur.
2 - Dans les variables ordinales, il faut faire une distinction entre celles où les
intervalles entre valeurs de la variable sont connus (elles proviennent en général de
Dans la majorité des méthodes de la CEB, l'analyse statistique des résultats se traduit par une
analyse de variance selon le schéma expérimental retenu (essentiellement le dispositif bloc).
Cette analyse est éventuellement suivie de tests de comparaisons de moyennes (test t, test de
DUNNETT ou de NEWMAN-KEULS).
La distinction entre variable interprétée et variable analysée est aussi très importante, car
l'utilisation correcte de ces analyses exige que les données analysées vérifient certaines
suppositions :
La normalité des distributions est une condition moins contraignante statistiquement (l'analyse
de variance est une méthode robuste vis à vis de la non-normalité) que l'égalité des variances
intra-traitements. En pratique, ces deux conditions sont souvent étroitement liées l'une à l'autre
(dans le cas de la Loi Normale, il y a indépendance entre la moyenne et la variance, ce qui
n'est pas le cas pour beaucoup d'autres Lois où une liaison existe).
Si la distribution n'est pas Normale, on conseille souvent d'utiliser un test non paramétrique,
mais la perte de puissance est souvent très importante. En pratique, si la variable analysée est
quantitative, on utilise l'analyse de variance, après une transformation éventuelle pour
stabiliser la variance. L'utilisation de tests non paramétriques (FRIEDMAN, KRUSKALL-
WALLIS) étant réservée au cas où la variable est qualitative.
L'indépendance des observations (indépendance des résultats de deux parcelles voisines) est
assurée par :
la randomisation,
la définition de la taille de l'unité expérimentale (taille suffisamment grande,
présence de bordures, ...) afin d'éviter des effets de voisinage ou de
compétition,
la réalisation des observations à l'aveugle, ...
OUI NON
NON OUI
Changement de
variable
VARIABLE INTERPRETEE
OUI NON
NON OUI
Nous venons de voir avec les principales transformations utilisables en pratique, les
conditions du choix de l'une d'entre elles. La décision de transformer ou non doit se faire sur
une série d'essais d'un même thème et conduits selon la même méthodologie. Si dans la
majorité des cas, l'hypothèse d'égalité des variances est rejetée, il est ensuite souhaitable de
réaliser systématiquement une transformation de variable sur des données similaires.
Dans une méthode CEB, on ne peut donc que conseiller la nature d'une éventuelle
transformation.
Dans le cas où une transformation est nécessaire, les résultats que l'on doit interpréter sont
bien sûr les résultats transformés car l'analyse de variance et les tests de comparaisons de
moyennes portent sur les données transformées.
Une pratique commune et généralement admise, est de présenter les résultats moyens par objet
sur les données brutes et les résultats des tests de comparaisons de moyennes sur les données
transformées en "collant" les deux analyses, comme dans l'exemple ci-après et en donnant
l'écart-type résiduel détransformé.
Nombre
Objets
moyen
expériment
d'adventice
és
s
P1 30.50 A
P4 23.75 A B
P7 18.25 A B
P2 14.75 A B
P3 12.00 A B
P6 11.75 A B
P8 10.75 A B
P5 8.00 A B
P9 4.25 B
5.12
Ecart-type résiduel
détransformé
Remarque : Attention, les tests ont été réalisés sur les données transformées, le
tableau précédent peut donc quelquefois montrer des incohérences apparentes : deux
objets avec un même écart peuvent être significativement différents ou non selon le
niveau de la valeur absolue du résultat.
5.1. Introduction
Réaliser un test, c'est faire le procès d'une hypothèse. Cette démarche appartient à l'inférence
statistique, opération réfléchie par laquelle on admet une proposition en vertu de sa liaison
avec d'autres propositions tenues pour vraies.
Généralement, on tente de tirer des conclusions sur un grand nombre d'événements possibles à
partir d'observations faites sur un échantillon des événements. Ces conclusions ne sont pas
strictes, mais on leur attache des probabilités.
Pour vérifier une théorie, nous avons toujours une hypothèse qui nous paraît pertinente et nous
collectons des données qui portent une certaine information relative à cette hypothèse.
Au vu des données, nous pouvons retenir, modifier ou rejeter l'hypothèse, donc la théorie.
Le test statistique nous permettant d'arriver à l'une de ces conclusions est une procédure
définie a priori et objective de décision ; elle comporte plusieurs étapes.
La formulation de l'hypothèse nulle, que l'on note généralement H0, dépend du problème posé.
Elle est fondée soit sur des observations antérieures, soit sur des considérations a priori. Dans
la comparaison de deux traitements A et B 1, cette hypothèse nulle est souvent celle de
l'égalité (A = B) ou différence nulle (A - B = 0), mais, si elle est fréquente, ce n'est pas la seule
: on peut aussi poser par exemple :
A - B = 4, ou : A - B > 0.
Pour des raisons de commodité, l'hypothèse nulle est toujours simple. Car lorsqu'elle est
complexe, il est difficile, sinon impossible, de construire un test permettant d'arriver à une
décision concrète.
La formulation d'une hypothèse nulle est toujours suivie d'une alternative que l'on note H1.
Elle peut être simple (A - B = 10) ou composite (A > B ; A B ; ...).
Exemple :
H0 : A = B
H1 : A > B
1
Dans la suite du test, A et B désigneront indifféremment les traitements, les variables
mesurées sur ces traitements ou les valeurs prises par ces variables.
Mais dans la plupart des cas et c'est souvent une erreur, H1 n'est pas clairement
formulée.
On pose alors :
H0 : A = B
et l'alternative H1 implicitement retenue est : A B
Il est évident que non seulement le problème posé, mais aussi la structure de la population
dont est issu l'échantillon, la manière d'obtenir celui-ci et le type de variable mesurée vont
intervenir dans le choix d'une catégorie de tests. Alors, l'idée la plus simple pour choisir un
test à l'intérieur de celle-ci est de prendre le plus puissant, c'est-à-dire celui qui permettra de
rejeter une hypothèse nulle fausse avec la plus grande probabilité.
L'hypothèse nulle étant formulée, ainsi que l'hypothèse alternative, le test statistique approprié
étant choisi, il faut se fixer des niveaux de probabilités (ou seuils de signification)
correspondant aux risques tolérables de mauvaises conclusions.
(A - B)
0
(en moyenne les différences sont nulles) et on admet dans la plupart des cas qu'elle est
Normale.
Parmi ces différences, certaines sont grandes en valeur absolue et leur probabilité d'apparition
est très faible ; dans ces cas extrêmes, nous rejetterons l'hypothèse nulle en faveur de
l'alternative H1. Ce seuil de probabilité extrême ou "seuil de signification" est généralement
noté : c'est le risque de 1ère espèce ou risque de rejeter l'hypothèse nulle alors que
celle-ci est vraie :
(A - B)
0
Mais ce risque n'est pas le seul. En effet, si nous reprenons notre exemple de comparaison
de 2 traitements A et B, on recherche la distribution des différences (A - B) sous l'hypothèse
que cette différence est nulle. Mais, en réalité, cette différence n'est peut-être pas négligeable
et peut avoir une distribution illustrée par la courbe (2) ci-dessous, centrée autour de la
valeur .
(1) (2)
(A - B)
/2 0 /2
On peut donc être conduit à accepter l'hypothèse nulle H0 (A - B = 0), alors qu'en fait elle est
fausse (A - B = ) : c'est le risque de 2e espèce, que l'on note . En effet, au départ de
l'expérience, on ne sait pas s'il existe une différence, on fait l'hypothèse que cette différence
est nulle et on raisonne à partir de la courbe (1).
Si A est un témoin et B un produit phytosanitaire dont on veut juger l'efficacité, le risque de
2e espèce () est le risque de déclarer sans action un produit qui est en réalité efficace.
Les définitions de ces deux risques sont habituellement résumées dans le tableau suivant :
Réalité
(hypothèse H0 H1
Hypothèse vraie)
retenue
Conclusion bonne Erreur de
H0
(1 - ) 2e espèce
1 - : puissance
(A - B)
0
La puissance
diminue quand la
(A - B)
variabilité
0 augmente
La puissance
diminue quand le
risque de 1re
(A - B) espèce diminue
0
En théorie, on doit, compte tenu des objectifs de l'expérience, se fixer les deux risques et .
Les valeurs de ces deux risques permettent de déterminer a priori la taille de l'échantillon (ou
le nombre de répétitions ou le nombre de blocs nécessaires) dans un essai, en fonction de la
variabilité du matériel expérimental et de la différence entre traitements que l'on souhaite
mettre en évidence.
Mais, en pratique, si la variabilité du matériel expérimental est souvent imposée, de même,
pour des raisons financières, la taille de l'échantillon est fixée. Aussi, peut-on calculer pour un
donné :
C'est la distribution de probabilité, sous l'hypothèse nulle H0, de toutes les valeurs possibles
qu'une statistique (une fonction quelconque des données : moyenne ...) peut prendre. C'est la
distribution théorique que nous obtiendrions si nous pouvions tirer aléatoirement de la
population tous les échantillons possibles de même taille. Dans notre exemple de comparaison
de 2 traitements A et B, on peut utiliser comme statistique la différence des moyennes
x A xB ou tout autre critère pertinent.
La région de rejet est une région de la distribution d'échantillonnage. C'est celle constituée des
événements dont les probabilités d'apparition sont faibles, du moins inférieures au seuil
retenu, au risque de première espèce.
Le graphique suivant illustre cette notion :
(A - B)
0
Région
Région de rejet Région de rejet
d ’acceptation de
de l ’hypothèse de l ’hypothèse
l ’hypothèse
nulle nulle
nulle
/2 /2
(A - B)
0
En revanche, si B est un produit connu dont l'usage est très répandu et A une nouvelle
spécialité, ou si B est un témoin non traité et A un traitement phytosanitaire, on veut savoir si
A est meilleur que B. L'hypothèse alternative est H1 : A > B et le risque ne se trouve qu'à
une extrémité de la distribution des différences. On parle alors de test unilatéral.
(A - B)
0
si celle-ci est faible : nous n'avons pas rejeté l'hypothèse nulle, mais nous
n'avions pas les moyens de le faire
si la puissance est élevée : nous n'avons pas rejeté l'hypothèse nulle, mais si la
différence existait réellement, nous avions les moyens de la mettre en
évidence : on peut donc conclure, avec une certaine probabilité, que la
différence est inférieure à .
(A - B)
0
S1 S2
(A - B) (A - B)
0 0
5.3. Exemple
Produit Témoin
Bloc 1 80 78
Bloc 2 85 80
Bloc 3 72 73
Bloc 4 86 80
Bloc 5 87 84
Dans le tableau ci-après, nous avons réalisé une classification des tests les plus usuels.
Elle est fonction de la nature de la variable et du nombre de traitements comparés.
Ce tableau est loin d'être exhaustif.
Nombre de
traitements DEUX TRAITEMENTS k TRAITEMENTS (k > 2)
comparés
Nature
de la Blocs de FISHER Randomisation totale Blocs de FISHER Randomisation totale
variable
Test global
Test de FISHER (3) test ² (3.4)
BINAIRE Test de Mac NEMAR (3) Test Q de COCHRAN (3-4)
NOMINALE Test ² (3.4) Comparaisons multiples
décomposition du ² (4)
( ) Les numéros après chaque test correspondent aux références bibliographiques citées en
annexe.
(*) Le domaine de variation des variables entières doit être suffisant pour qu'on les considère
comme continues, sinon
On peut les traiter comme des variables ordinales.
1 - Dans le premier exemple, si la variable qui mesure l'efficacité des produits est
quantitative - un rendement - on peut utiliser les tests suivants pour répondre aux
différentes questions.
P3
P2
R Terminé
P5
Test de DUNNETT
2 - Dans le deuxième exemple, si la variable qui mesure la sélectivité des produits est
quantitative - un rendement - on peut utiliser les tests suivants pour répondre aux
différentes questions.
P3
P4
Produits non
R
P2 phytotoxiques Test t
P4 - kP4
Test de DUNNETT
P5 - kP5
Remarque : Lorsque les tests sont déclarés "non significatifs", il est important dans
ce type d'essai, de calculer la puissance car on cherche non pas des différences, mais
des similitudes.
Dans toutes les méthodes de la Commission des Essais Biologiques, on doit donc trouver :
de la question posée,
de la nature de la variable analysée.
Vous avez des problèmes pour indiquer sa route à une personne qui ne sait pas où elle veut
aller ... En revanche, si elle connaît sa destination, votre réponse n'est pas indépendante de son
mode de locomotion !
8. BIBLIOGRAPHIE
TESTS PARAMETRIQUES
o DAGNELIE P. - 1969(*)
Théorie et Méthodes statistiques. Vol. 2. Duculot Gembloux
o GOUET J.P. - 1974
Les comparaisons de moyennes et de variances. Application à
l'agronomie. Brochure ITCF.
o BACHACOU J. - MASSON J.P. - MILLIER C. - 1981
Manuel de la programmathèque statistique AMANCE. INRA-Biométrie.
TRANSFORMATIONS DE VARIABLES
DAGNELIE P. - 1969
Théorie et Méthodes statistiques. Vol. 2, Chap. 22. Duculot Gembloux.