Vous êtes sur la page 1sur 24

ASSOCIATION FRANÇAISE DE PROTECTION DES PLANTES

COMMISSION DES ESSAIS BIOLOGIQUES


UTILISATION DES TESTS STATISTIQUES
DANS L'INTERPRÉTATION DES ESSAIS
DE PRODUITS PHYTOPHARMACEUTIQUES
Use of statistical tests in the interpretation of trials of plant protection products

DOCUMENT TECHNIQUE N° 06
1ére édition : 1986
2ème édition : 1996
Reformatage : 2011

Le document technique ci-après, a été établi par les membres de la Commission des Essais
Biologiques de l’Association Française de Protection des Plantes.

Cette commission groupe des spécialistes :


- ayant pour tutelle le Ministère chargé de l’Agriculture : INRA, Service de la
Protection des Végétaux, Anses ;
- des Organismes professionnels de l’agriculture ;
- de l’Industrie des produits phytopharmaceutiques

Ce document peut être révisé par la Commission, compte tenu de l’évolution des méthodes
d'expérimentation et des techniques agricoles.

Rapporteurs : J. ARNOUX, J.P. GOUET

Texte élaboré avec le concours de : J. BEY, D. CHAUSSE, J.B. DENIS, C. DUBY,


G. DOUAIRE, A. HORELLOU, P. JAN, G. LECHAPT, J.M. MONCORGE,
R. NORDEY, Y. REGNAULT, J. TRANCHEFORT.

Reproduction partielle interdite. Reproduction intégrale soumise à l’agrément préalable de l’ Association Française de Protection des Plantes
SOMMAIRE

1. INTRODUCTION ................................................................................................................ 1
2. QUESTIONS POSEES - ILLUSTRATIONS A TRAVERS DEUX EXEMPLES........ 1
2.1. Exemple 1 :................................................................................................................ 1
2.2. Exemple 2 :................................................................................................................ 4
3. LES DIFFERENTES NATURES DE VARIABLES ........................................................ 5
3.1. Nature des variables .................................................................................................. 5
3.2. Importance de l'étude de la distribution de chaque variable .................................. 7
4. LES TRANSFORMATIONS DE VARIABLES ............................................................... 9
4.1. Principales transformations : comment choisir ? ................................................... 9
4.2. Quand transformer ? ................................................................................................ 9
4.3. Quelles données transformer ?................................................................................. 9
4.4. Comment interpréter et présenter les résultats ? ................................................... 10
5. GENERALITES SUR LES TESTS .................................................................................. 11
5.1. Introduction ............................................................................................................ 11
5.2. Les étapes d'un test statistique................................................................................ 11
5.2.1. Définition de l'hypothèse nulle H0 (et de l'alternative H1) .............................. 11
5.2.2. Choix du test statistique ................................................................................... 12
5.2.3. Choix des risques ............................................................................................. 12
5.2.4. Distribution d'échantillonnage ......................................................................... 15
5.2.5. Construction de la région de rejet .................................................................... 15
5.2.6. Réalisation du test sur les données et conclusions ........................................... 17
5.3. Exemple ................................................................................................................... 18
6. CHOIX D'UN TEST .......................................................................................................... 19
6.1. Classification des tests usuels ................................................................................. 19
6.2. Exemples ................................................................................................................. 20
7. CONCLUSION ET APPLICATION AUX METHODES DE LA COMMISSION DES
ESSAIS BIOLOGIQUES ................................................................................................ 21
8. BIBLIOGRAPHIE ............................................................................................................. 22

CEB, Document technique N° 6, Utilisation des tests statistiques


1. INTRODUCTION

De nombreux ouvrages existent sur les tests statistiques ; le présent document a pour objet de
mettre en évidence les deux principaux critères de choix d'un test :

 la question posée
 la nature de la variable analysée

Dans une première partie, nous verrons, sur deux exemples volontairement simplifiés,
comment formuler une question. Ensuite, nous examinerons les différentes natures de
variables que l'on peut rencontrer.
Après quelques généralités, nous donnerons une classification des tests les plus usuels.
En conclusion, nous formulerons quelques conseils pour les concepteurs et rédacteurs de
méthodes d'expérimentation de produits phytosanitaires.

2. QUESTIONS POSEES - ILLUSTRATIONS A TRAVERS DEUX


EXEMPLES

2.1. Exemple 1

Considérons un essai portant sur plusieurs produits phytopharmaceutiques appliqués à une


seule dose et comparés à un produit de référence, ainsi qu'à un témoin non traité inclus.
Supposons que la variable mesurée traduise l'efficacité des produits et que le problème soit de
positionner ceux-ci par rapport à la référence et éventuellement de trouver ceux qui lui sont
supérieurs.

Quelles sont alors les questions posées ?

1 - Tout d'abord, il faut se demander si l'essai est capable de fournir des données utiles.
Ceci n'est le cas que si l'infestation dans le témoin non traité atteint un niveau suffisant.
C'est en général une appréciation subjective, mais on peut disposer de seuils dans
quelques cas particuliers (exemple : Botrytis de la vigne).

2 - Ensuite, il faut vérifier la cohérence des résultats : le produit de référence est-il


supérieur au témoin non traité et la différence est-elle conforme à celle habituellement
obtenue ?
Remarque : Dans cet exemple, c'est la seule justification du témoin inclus ! Dans le
cas où une autre technique permet de tester la cohérence, l'inclusion du témoin ne se
justifie plus (exemple : dans l'étude de produits herbicides de post-levée stricts, un
comptage des adventices avant et après le traitement peut permettre de vérifier cette
cohérence : la parcelle recevant le produit de référence est son propre témoin).

3 - Si ces 2 conditions sont remplies, il est alors possible de comparer statistiquement les
produits à étudier et le produit de référence et éventuellement entre eux en utilisant un
test statistique adapté.

CEB, Document technique N° 6, Utilisation des tests statistiques 1


4 - Si aucune différence significative n'est décelée entre les produits à étudier et le produit
de référence, il est utile d'examiner si l'essai est assez puissant pour déceler une
différence intéressante.
S'il ne l'est pas, on ne peut tirer aucune conclusion du résultat !

L'enchaînement de ces questions est schématisé sur l'organigramme ci-après :

CEB, Document technique N° 6, Utilisation des tests statistiques 2


LE TEMOIN EST-IL SUFFISAMMENT INFESTE ?

OUI NON FIN

LA REFERENCE EST-ELLE SUFFISAMMENT SUPERIEURE AU TEMOIN ?

OUI NON

A t-on une explication


Positionnement des produits par agronomique acceptable du
rapport à la référence phénomène (l'essai peut-il être
considéré comme valide ?)

OUI NON FIN

Récupération

Eventuellement, classement Positionnement des produits


des produits meilleurs par rapport au témoin
que la référence

Eventuellement, classement des


produits meilleurs que le témoin

CEB, Document technique N° 6, Utilisation des tests statistiques 3


Remarque : Dans le cas où l'essai ne comporte pas plusieurs produits à une seule
dose, mais un seul produit à plusieurs doses, même si pratiquement la réalisation est
la même, les questions sont différentes. Le problème peut être :

 de rechercher la meilleure dose d'emploi,


 de vérifier une dose d'emploi,
 ...

2.2. Exemple 2

Examinons maintenant un essai portant sur différents produits phytopharmaceutiques


appliqués à dose normale (N) et à dose plus élevée (kN ; k > 1) et un témoin non traité inclus.
Supposons que la variable mesurée traduise la sélectivité des produits et que le problème soit
essentiellement de vérifier que les produits ne sont pas phytotoxiques pour la plante cultivée à
la dose N, et éventuellement à la dose kN.

Quelles sont les questions posées ?

1 - L'essai est-il réaliste, c'est-à-dire capable de fournir des données utiles ? Pour cela, il
faut que le témoin soit suffisamment propre. C'est en général une appréciation
subjective, mais on peut disposer de seuils dans quelques cas particuliers.

2 - Les résultats sont-ils cohérents ? Pour cela il faut que, par comparaison au témoin non
traité, le produit de référence donne des résultats attendus.

3 - Quels produits sont phytotoxiques à la dose N ?

4 - Parmi les produits non phytotoxiques à la dose N, lesquels sont phytotoxiques à une
dose kN ?

On peut schématiser ces questions sur l'organigramme ci-après :

CEB, Document technique N° 6, Utilisation des tests statistiques 4


LE TEMOIN EST-IL SUFFISAMMENT PROPRE ?

OUI NON FIN

QUELS SONT LES PRODUITS PHYTOTOXIQUES A LA DOSE N ?

Produits non phytotoxiques Produits phytotoxiques


à la dose N à la dose N

QUELS SONT LES PRODUITS


PHYTOTOXIQUES
A LA DOSE kN ?

Produits non Produits


phytotoxiques à phytotoxiques à
la dose kN la dose kN

3. LES DIFFERENTES NATURES DE VARIABLES

3.1. Nature des variables

En premier lieu, il faut faire une distinction entre les variables observées et celles qui sont
interprétées. Ainsi, on observe un poids parcellaire, une humidité et on interprète un
rendement ramené à l'hectare et aux normes commerciales d'humidité. De même, dans un
essai conduit avec des témoins adjacents, on interprète par exemple un écart de rendement
entre la parcelle traitée et la parcelle témoin.
Il est alors essentiel de savoir dans quel ensemble la variable interprétée peut prendre ses
valeurs, parmi les différents types de variables. En effet, ces types conditionnent souvent les
tests statistiques réalisables. Dans le tableau ci-après, nous avons défini cinq types de
variables. Cette classification est bien sûr critiquable, car à un type donné de variables ne

CEB, Document technique N° 6, Utilisation des tests statistiques 5


correspond pas un seul test ou un seul groupe de tests : bien souvent, une variable entière peut
être traitée de la même façon qu'une variable continue, surtout si l'ensemble des valeurs
possibles est important. De même, les valeurs d'une variable continue peuvent être réparties en
classes, et donc traitées comme des variables discrètes.

Exemples d'ensembles de
NATURE DES
TYPE valeurs prises
VARIABLES
par les variables
 OUI ou NON
DICHOTOMIE BINAIRES  VRAI ou FAUX
 PRESENCE ou
ABSENCE
VARIABLES  Précédent cultural (blé,
QUALITATIVES POLYTOMIE NON NOMINALES maïs, betteraves ...)
ORDONNEE  couleur (bleu, blanc,
rouge ...)
POLYTOMIE ORDINALES  Mauvais, moyen, bon
ORDONNEE
DISCRETES  Nombre
ENTIERES A VALEURS d'inflorescences, de
ENTIERES fruits, d'insectes
VARIABLES CONTINUES  pouvoir germinatif
QUANTITATIVE BORNEES
S CONTINUES
(proportions)  rendement en grain
 hauteur de plante
CONTINUES NON
BORNEES

Remarques :

1 - Une proportion est une fréquence relative. Elle est traduite parfois abusivement en
pourcentage. Mais on parle aussi de pourcentage lorsque l'on exprime une valeur
(un rendement, une note d'infestation) par rapport à une autre déterminée à l'avance.
Attention ! Ces deux variables ne sont pas de même nature. Une proportion varie
entre 0 et 1. Par exemple, le pouvoir germinatif est le rapport du nombre de grains
germés au nombre de grains examinés. Pour qu'une proportion ait un sens, il faut
que la taille de l'échantillon soit suffisante. Dans tous les cas, on doit préciser cette
taille.
Un pourcentage en revanche n'est pas borné. Il n'est qu'exceptionnellement utilisé
dans l'analyse des résultats, mais souvent, pour des raisons de commodité, dans leur
présentation (exemple : coefficient d'efficacité d'un produit par rapport à un témoin).
Là aussi, pour que ce pourcentage soit interprétable, il faut préciser le dénominateur.
2 - Dans les variables ordinales, il faut faire une distinction entre celles où les
intervalles entre valeurs de la variable sont connus (elles proviennent en général de

CEB, Document technique N° 6, Utilisation des tests statistiques 6


cotations) et celles où les intervalles sont inconnus (elles proviennent en général de
notations ou de classements).

3.2. Importance de l'étude de la distribution de chaque variable

Dans la majorité des méthodes de la CEB, l'analyse statistique des résultats se traduit par une
analyse de variance selon le schéma expérimental retenu (essentiellement le dispositif bloc).
Cette analyse est éventuellement suivie de tests de comparaisons de moyennes (test t, test de
DUNNETT ou de NEWMAN-KEULS).
La distinction entre variable interprétée et variable analysée est aussi très importante, car
l'utilisation correcte de ces analyses exige que les données analysées vérifient certaines
suppositions :

 normalité de la distribution des "erreurs expérimentales" (elles sont estimées


par les résidus du modèle additif de l'analyse de variance)
 égalité des variances intra-traitements de ces erreurs
 indépendance des observations

La normalité des distributions est une condition moins contraignante statistiquement (l'analyse
de variance est une méthode robuste vis à vis de la non-normalité) que l'égalité des variances
intra-traitements. En pratique, ces deux conditions sont souvent étroitement liées l'une à l'autre
(dans le cas de la Loi Normale, il y a indépendance entre la moyenne et la variance, ce qui
n'est pas le cas pour beaucoup d'autres Lois où une liaison existe).
Si la distribution n'est pas Normale, on conseille souvent d'utiliser un test non paramétrique,
mais la perte de puissance est souvent très importante. En pratique, si la variable analysée est
quantitative, on utilise l'analyse de variance, après une transformation éventuelle pour
stabiliser la variance. L'utilisation de tests non paramétriques (FRIEDMAN, KRUSKALL-
WALLIS) étant réservée au cas où la variable est qualitative.
L'indépendance des observations (indépendance des résultats de deux parcelles voisines) est
assurée par :

 la randomisation,
 la définition de la taille de l'unité expérimentale (taille suffisamment grande,
présence de bordures, ...) afin d'éviter des effets de voisinage ou de
compétition,
 la réalisation des observations à l'aveugle, ...

Sur l'organigramme ci-après, est schématisé l'ensemble de la démarche.

CEB, Document technique N° 6, Utilisation des tests statistiques 7


LES OBSERVATIONS SONT-ELLES INDEPENDANTES ?

OUI NON

VARIABLE OBSERVEE Méthodologie


expérimentale à revoir

Cette variable traduit-elle bien le


phénomène étudié ?

NON OUI

Changement de
variable

VARIABLE INTERPRETEE

Existe-t-il des tests disponibles pour répondre à l'aide de


cette variable à la question posée dans le protocole ?

OUI NON

Peut-on admettre les


suppositions nécessaires à Consulter un Statisticien ! ...
l'utilisation du test retenu ?

NON OUI

Transformation VARIABLE ANALYSEE

Choix d'un autre test


Réalisation du test

Retour à la variable interprétée


pour les conclusions
CEB, Document technique N° 6, Utilisation des tests statistiques 8
4. LES TRANSFORMATIO NS DE VARIABLES

4.1. Principales transformations : comment choisir ?

Dans la majorité des problèmes pratiques en expérimentation phytosanitaire, trois


transformations sont utilisables.

 La transformation logarithmique : y = Log (x)


Elle est utilisable chaque fois que la moyenne et l'écart-type de la variable sont
proportionnels : le coefficient de variation est constant. En pratique, elle va
s'utiliser quand des processus de croissance ou de multiplication sont en jeu, ou
pour des dénombrements de populations d'insectes par exemple.
Remarque : en présence de données nulles, on peut utiliser : y = Log (x + 1).

 La transformation Racine Carrée : y  x


Elle est utilisable chaque fois que la moyenne et la variance de la variable sont
proportionnelles. En pratique, c'est souvent le cas lors de comptages de
plantes : comptages d'adventices, de pieds malades, ...
Remarque : lorsque les valeurs observées sont relativement faibles, il est
3
toutefois préférable d'utiliser y  x
8

 La transformation angulaire : y  arc sin x


La transformation arc sin racine carrée, plus souvent appelée transformation
angulaire (de BLISS), s'applique aux variables binomiales, aux proportions (0 
x  1) : c'est-à-dire à la majorité des estimations visuelles réalisées. En effet,
ces estimations visuelles sont des appréciations en proportion d'un témoin non
traité (proportion de réduction de volume d'adventices, proportion d'individus
disparus, ...) ou dans l'absolu (proportion de surface de feuilles atteinte par une
maladie, ...).

4.2. Quand transformer ?

Nous venons de voir avec les principales transformations utilisables en pratique, les
conditions du choix de l'une d'entre elles. La décision de transformer ou non doit se faire sur
une série d'essais d'un même thème et conduits selon la même méthodologie. Si dans la
majorité des cas, l'hypothèse d'égalité des variances est rejetée, il est ensuite souhaitable de
réaliser systématiquement une transformation de variable sur des données similaires.
Dans une méthode CEB, on ne peut donc que conseiller la nature d'une éventuelle
transformation.

4.3. Quelles données transformer ?

On transforme les données analysées, c'est-à-dire les données parcellaires.

CEB, Document technique N° 6, Utilisation des tests statistiques 9


Dans le cas où on réalise un échantillonnage pour appréhender une variable au niveau d'une
parcelle, on transforme la moyenne des résultats intra-parcellaires et non chaque résultat
élémentaire.

4.4. Comment interpréter et présenter les résultats ?

Dans le cas où une transformation est nécessaire, les résultats que l'on doit interpréter sont
bien sûr les résultats transformés car l'analyse de variance et les tests de comparaisons de
moyennes portent sur les données transformées.
Une pratique commune et généralement admise, est de présenter les résultats moyens par objet
sur les données brutes et les résultats des tests de comparaisons de moyennes sur les données
transformées en "collant" les deux analyses, comme dans l'exemple ci-après et en donnant
l'écart-type résiduel détransformé.

Nombre
Objets
moyen
expériment
d'adventice
és
s
P1 30.50 A
P4 23.75 A B
P7 18.25 A B
P2 14.75 A B
P3 12.00 A B
P6 11.75 A B
P8 10.75 A B
P5 8.00 A B
P9 4.25 B

5.12

moyennes calculées sur les Test de NEWMAN-KEULS au seuil 5 %,


données brutes parcellaires réalisé sur les données après
transformation x

Ecart-type résiduel
détransformé

Remarque : Attention, les tests ont été réalisés sur les données transformées, le
tableau précédent peut donc quelquefois montrer des incohérences apparentes : deux
objets avec un même écart peuvent être significativement différents ou non selon le
niveau de la valeur absolue du résultat.

CEB, Document technique N° 6, Utilisation des tests statistiques 10


Une autre pratique est de présenter les résultats moyens par objet sur les données
détransformées et les résultats des tests de comparaisons de moyennes sur les données
transformées et en donnant l'écart-type résiduel détransformé.

5. GENERALITES SUR L ES TESTS

5.1. Introduction

Réaliser un test, c'est faire le procès d'une hypothèse. Cette démarche appartient à l'inférence
statistique, opération réfléchie par laquelle on admet une proposition en vertu de sa liaison
avec d'autres propositions tenues pour vraies.
Généralement, on tente de tirer des conclusions sur un grand nombre d'événements possibles à
partir d'observations faites sur un échantillon des événements. Ces conclusions ne sont pas
strictes, mais on leur attache des probabilités.

5.2. Les étapes d'un test statistique

Pour vérifier une théorie, nous avons toujours une hypothèse qui nous paraît pertinente et nous
collectons des données qui portent une certaine information relative à cette hypothèse.
Au vu des données, nous pouvons retenir, modifier ou rejeter l'hypothèse, donc la théorie.
Le test statistique nous permettant d'arriver à l'une de ces conclusions est une procédure
définie a priori et objective de décision ; elle comporte plusieurs étapes.

5.2.1. Définition de l'hypothèse nulle H0 (et de l'alternative H1)

La formulation de l'hypothèse nulle, que l'on note généralement H0, dépend du problème posé.
Elle est fondée soit sur des observations antérieures, soit sur des considérations a priori. Dans
la comparaison de deux traitements A et B 1, cette hypothèse nulle est souvent celle de
l'égalité (A = B) ou différence nulle (A - B = 0), mais, si elle est fréquente, ce n'est pas la seule
: on peut aussi poser par exemple :
A - B = 4, ou : A - B > 0.
Pour des raisons de commodité, l'hypothèse nulle est toujours simple. Car lorsqu'elle est
complexe, il est difficile, sinon impossible, de construire un test permettant d'arriver à une
décision concrète.
La formulation d'une hypothèse nulle est toujours suivie d'une alternative que l'on note H1.
Elle peut être simple (A - B = 10) ou composite (A > B ; A  B ; ...).

Exemple :

 Si dans la comparaison de 2 traitements, on pose :

H0 : A = B
H1 : A > B

1
Dans la suite du test, A et B désigneront indifféremment les traitements, les variables
mesurées sur ces traitements ou les valeurs prises par ces variables.

CEB, Document technique N° 6, Utilisation des tests statistiques 11


on teste l'hypothèse d'égalité contre celle que le premier traitement est
supérieur.

 Mais dans la plupart des cas et c'est souvent une erreur, H1 n'est pas clairement
formulée.
On pose alors :

H0 : A = B
et l'alternative H1 implicitement retenue est : A  B

5.2.2. Choix du test statistique

Il est évident que non seulement le problème posé, mais aussi la structure de la population
dont est issu l'échantillon, la manière d'obtenir celui-ci et le type de variable mesurée vont
intervenir dans le choix d'une catégorie de tests. Alors, l'idée la plus simple pour choisir un
test à l'intérieur de celle-ci est de prendre le plus puissant, c'est-à-dire celui qui permettra de
rejeter une hypothèse nulle fausse avec la plus grande probabilité.

5.2.3. Choix des risques

L'hypothèse nulle étant formulée, ainsi que l'hypothèse alternative, le test statistique approprié
étant choisi, il faut se fixer des niveaux de probabilités (ou seuils de signification)
correspondant aux risques tolérables de mauvaises conclusions.

 Risque de 1ère espèce

Reprenons notre exemple de comparaison de deux traitements A et B, l'hypothèse nulle H0


est :
A = B, soit A - B = 0. Si elle est vraie, la distribution des différences est centrée autour de 0

(A - B)
0
(en moyenne les différences sont nulles) et on admet dans la plupart des cas qu'elle est
Normale.

Distribution des différences sous l'hypothèse nulle H0

Parmi ces différences, certaines sont grandes en valeur absolue et leur probabilité d'apparition
est très faible ; dans ces cas extrêmes, nous rejetterons l'hypothèse nulle en faveur de
l'alternative H1. Ce seuil de probabilité extrême ou "seuil de signification" est généralement
noté  : c'est le risque de 1ère espèce ou risque de rejeter l'hypothèse nulle alors que
celle-ci est vraie :

CEB, Document technique N° 6, Utilisation des tests statistiques 12


/2 /2

(A - B)
0

Si A est un témoin et B un produit phytosanitaire dont on veut juger l'efficacité, le risque de


1re espèce () est le risque de déclarer efficace un produit qui ne l'est pas.

 Risque de deuxième espèce

Mais ce risque  n'est pas le seul. En effet, si nous reprenons notre exemple de comparaison
de 2 traitements A et B, on recherche la distribution des différences (A - B) sous l'hypothèse
que cette différence est nulle. Mais, en réalité, cette différence n'est peut-être pas négligeable
et peut avoir une distribution illustrée par la courbe (2) ci-dessous, centrée autour de la
valeur .

(1) (2)

(A - B)
/2 0 /2 

On peut donc être conduit à accepter l'hypothèse nulle H0 (A - B = 0), alors qu'en fait elle est
fausse (A - B = ) : c'est le risque de 2e espèce, que l'on note . En effet, au départ de
l'expérience, on ne sait pas s'il existe une différence, on fait l'hypothèse que cette différence
est nulle et on raisonne à partir de la courbe (1).
Si A est un témoin et B un produit phytosanitaire dont on veut juger l'efficacité, le risque de
2e espèce () est le risque de déclarer sans action un produit qui est en réalité efficace.
Les définitions de ces deux risques sont habituellement résumées dans le tableau suivant :

Réalité
(hypothèse H0 H1
Hypothèse vraie)
retenue
Conclusion bonne Erreur de
H0
(1 - ) 2e espèce 

H1 Erreur de Conclusion bonne


1re espèce  (1 - )

CEB, Document technique N° 6, Utilisation des tests statistiques 13


La quantité complémentaire (1 - ) du risque de 2e espèce est appelée "puissance du test".
C'est la probabilité de rejeter l'hypothèse nulle H0 (A - B = 0) alors que cette hypothèse est
fausse. On définit aussi cette quantité comme la "puissance de l'expérience" ; c'est la
probabilité que l'on a, au début d'une expérience, de conclure à juste titre à une différence
donnée entre les traitements. Cette puissance est une fonction de l'écart à l'hypothèse nulle,
c'est-à-dire de la différence entre les traitements.

Comment raisonner cette puissance ?

On a cinq paramètres qui sont liés :

 : le risque de première espèce


 : le risque de deuxième espèce (ou 1 -  la puissance)
 : la différence entre les traitements
s² : la variance ou variabilité des résultats
n : le nombre d'observations par traitement

Les schémas suivants illustrent leur influence :

1 -  : puissance

(A - B)
0 

La puissance
diminue quand la
(A - B)
variabilité
0  augmente

La puissance
diminue quand le
risque de 1re
(A - B) espèce diminue
0 

CEB, Document technique N° 6, Utilisation des tests statistiques 14


La puissance
diminue quand la
différence entre les
(A - B) traitements
0  diminue

En théorie, on doit, compte tenu des objectifs de l'expérience, se fixer les deux risques  et .
Les valeurs de ces deux risques permettent de déterminer a priori la taille de l'échantillon (ou
le nombre de répétitions ou le nombre de blocs nécessaires) dans un essai, en fonction de la
variabilité du matériel expérimental et de la différence entre traitements que l'on souhaite
mettre en évidence.
Mais, en pratique, si la variabilité du matériel expérimental est souvent imposée, de même,
pour des raisons financières, la taille de l'échantillon est fixée. Aussi, peut-on calculer pour un
 donné :

 soit la puissance si la différence intéressante à mettre en évidence est connue,


 soit la différence pour une puissance fixée

5.2.4. Distribution d'échantillonnage

C'est la distribution de probabilité, sous l'hypothèse nulle H0, de toutes les valeurs possibles
qu'une statistique (une fonction quelconque des données : moyenne ...) peut prendre. C'est la
distribution théorique que nous obtiendrions si nous pouvions tirer aléatoirement de la
population tous les échantillons possibles de même taille. Dans notre exemple de comparaison
de 2 traitements A et B, on peut utiliser comme statistique la différence des moyennes
 
x A  xB ou tout autre critère pertinent.

La connaissance de cette distribution permet de définir les probabilités d'apparition des


valeurs numériques de cette statistique.

5.2.5. Construction de la région de rejet

La région de rejet est une région de la distribution d'échantillonnage. C'est celle constituée des
événements dont les probabilités d'apparition sont faibles, du moins inférieures au seuil
retenu, au risque  de première espèce.
Le graphique suivant illustre cette notion :

CEB, Document technique N° 6, Utilisation des tests statistiques 15


/2 /2

(A - B)
0

Région
Région de rejet Région de rejet
d ’acceptation de
de l ’hypothèse de l ’hypothèse
l ’hypothèse
nulle nulle
nulle

Dans notre exemple, si A et B sont deux traitements phytosanitaires, l'hypothèse alternative


peut être :
A  B, car les deux traitements jouent le même rôle. On répartit alors le risque aux deux
extrémités de la distribution des différences et on parle de test bilatéral : on rejette H0 si la
différence est grande en valeur absolue.

/2 /2

(A - B)
0

Répartition du risque  dans le cas d'un test bilatéral

En revanche, si B est un produit connu dont l'usage est très répandu et A une nouvelle
spécialité, ou si B est un témoin non traité et A un traitement phytosanitaire, on veut savoir si
A est meilleur que B. L'hypothèse alternative est H1 : A > B et le risque  ne se trouve qu'à
une extrémité de la distribution des différences. On parle alors de test unilatéral.

(A - B)
0

Répartition du risque  dans le cas d'un test unilatéral

CEB, Document technique N° 6, Utilisation des tests statistiques 16


5.2.6. Réalisation du test sur les données et conclusions

La distribution d'échantillonnage étant connue et la zone de rejet délimitée, la décision à


prendre est simple : si la statistique calculée sur l'échantillon observé n'appartient pas à la
région de rejet, on dit que le test est "non significatif" et rien ne nous empêche d'accepter H0
du moins de ne pas la rejeter.
Mais on ne prouve nullement que cette hypothèse nulle est exacte. On peut seulement dire que
les données recueillies, lorsqu'elles sont examinées dans les conditions fixées pour réaliser le
test, ne sont pas en contradiction avec H0.
Dans ce cas, pour une différence  que nous jugeons intéressante, il faut examiner la
puissance a priori :

 si celle-ci est faible : nous n'avons pas rejeté l'hypothèse nulle, mais nous
n'avions pas les moyens de le faire
 si la puissance est élevée : nous n'avons pas rejeté l'hypothèse nulle, mais si la
différence  existait réellement, nous avions les moyens de la mettre en
évidence : on peut donc conclure, avec une certaine probabilité, que la
différence est inférieure à .

En revanche, si la statistique (S2) calculée sur l'échantillon observé appartient à la région de


rejet, on dit que le test est "significatif". L'hypothèse nulle est rejetée. On ne prouve nullement
que cette hypothèse est erronée, mais elle a de grandes chances de l'être.

(A - B)
0
S1 S2

Test « non significatif » Test « significatif »


rejet de H0

Examen de la puissance a priori

(A - B) (A - B)

0  0 

Puissance élevée : la différence est


Puissance faible : on ne peut pas conclure
très probablement inférieure à 

Un test statistique ne conduit donc jamais à une certitude ;


la conclusion est toujours suivie d'une probabilité d'erreur.

CEB, Document technique N° 6, Utilisation des tests statistiques 17


Enfin, notons l'importance de l'hypothèse nulle dans tout le raisonnement qui précède. Dans
tous les cas, il convient de réfléchir à sa pertinence car son choix est déterminant dans la
construction et la réalisation du test.

5.3. Exemple

Un expérimentateur désirant connaître l'efficacité d'un produit phytosanitaire a découpé un


champ de blé tendre d'hiver en 5 blocs. Il a traité à chaque fois au hasard la moitié d'un bloc
en gardant l'autre moitié comme témoin. La variable interprétée pour juger de l'effet du
traitement est le rendement.

Résultats en quintaux/ha aux normes commerciales d'humidité :

Produit Témoin

Bloc 1 80 78
Bloc 2 85 80
Bloc 3 72 73
Bloc 4 86 80
Bloc 5 87 84

Un test t de Student sur les différences (Produit-Témoin), donne : 2.449.


Sous l'hypothèse nulle que le produit n'a pas d'action (Produit = Témoin) et en prenant comme
hypothèse alternative que le produit est différent, la probabilité d'observer une telle valeur de t
ou une valeur supérieure est de 7 % [on a réalisé un test bilatéral].
Si, dans le protocole, nous avons choisi un risque de 1re espèce de 10 %, on conclut que
l'essai est "significatif".
Dans ce cas particulier (2 traitements selon un dispositif bloc à 5 blocs), une analyse de la
variance suivie d'un test F (F observé = 5.997) donne exactement la même conclusion
(Probabilité = 7 %).
En revanche, si dans le protocole le risque de 1re espèce est de 1 %, on déclare l'essai "non
significatif".
Dans ce dernier cas, le calcul de la puissance est intéressant. Pour mettre en évidence une
différence de 3 q/ha entre la parcelle traitée et la parcelle témoin, avec un risque de 1re espèce
de :
1 % et dans les conditions de réalisation de l'essai (5 blocs, écart-type résiduel = 2.738), la
puissance pour un test unilatéral est de l'ordre de 4 % ! Si il y a réellement une différence de 3
q/ha, on a seulement 4 chances sur 100 de la mettre en évidence. Il est hasardeux de conclure
que le produit est sans action : on ne s'est pas donné (avec 5 blocs et un écart-type résiduel de
2.738) des moyens suffisants pour détecter une différence de 3 q/ha.

CEB, Document technique N° 6, Utilisation des tests statistiques 18


6. CHOIX D'UN TEST

6.1. Classification des tests usuels

Dans le tableau ci-après, nous avons réalisé une classification des tests les plus usuels.
Elle est fonction de la nature de la variable et du nombre de traitements comparés.
Ce tableau est loin d'être exhaustif.

Nombre de
traitements DEUX TRAITEMENTS k TRAITEMENTS (k > 2)
comparés

Nature
de la Blocs de FISHER Randomisation totale Blocs de FISHER Randomisation totale
variable

Test global
Test de FISHER (3)  test ² (3.4)
BINAIRE Test de Mac NEMAR (3) Test Q de COCHRAN (3-4)
NOMINALE Test ² (3.4) Comparaisons multiples
 décomposition du ² (4)

Test global Test global


Test W de WILCOXON (2.4)
 test de FRIEDMAN (3.1.2.4)  test de KRUSKAL-WALLIS
Test U de MANN-WHITNEY (3.2.1.4)
Test W de WILCOXON (3.4) Comparaisons multiples
 test de la médiane (3.1)
ORDINALE (3.2.1)  comparaisons multiples
Test des suites de WALD- basées sur la somme des rangs Comparaisons multiples
WOLFOWITZ (3) du test de FRIEDMAN (avec  comparaisons multiples
Test du signe (3.1.4)
Test de KOLMOGOROV- ou sans témoin) (3.4) basées sur la somme des rangs
SMIRNOV (3)  test de PAGE (test d'un ordre du test de KRUSKAL-
prédéterminé) (4) WALLIS (2.4)
Test de la médiane (3.1)

Test global Test global


 test F (5.6)  test F (5.6)
Comparaisons multiples avec Comparaisons multiples avec
témoin témoin
 test de DUNNETT (5.6)  test de DUNNETT (5.6)

Test de WALSH (3) Comparaisons multiples sans Comparaisons multiples sans


Test de randomisation (3) témoin témoin
ENTIERE(*) Test de randomisation (3)  test de TUKEY  test de NEWMAN-KEULS
CONTINUE (5.6)
Test t (5.6)  test de NEWMAN-KEULS
Test t (5.6) (5.6)  test de DUNCAN (5.6)
 test de DUNCAN (5.6)  test t de BONFERRONI (7)
 test t de BONFERRONI (7) Comparaisons particulières
Comparaisons particulières  test de SCHEFFE (5.6.7)
 test de SCHEFFE (5.6.7)  méthode des contrastes (5.6)
 méthode des contrastes (5.6)

( ) Les numéros après chaque test correspondent aux références bibliographiques citées en
annexe.
(*) Le domaine de variation des variables entières doit être suffisant pour qu'on les considère
comme continues, sinon
On peut les traiter comme des variables ordinales.

CEB, Document technique N° 6, Utilisation des tests statistiques 19


6.2. Exemples

Reprenons les deux exemples du 2e paragraphe :

1 - Dans le premier exemple, si la variable qui mesure l'efficacité des produits est
quantitative - un rendement - on peut utiliser les tests suivants pour répondre aux
différentes questions.

 Vraisemblance : le témoin est-il suffisamment infesté ? Pas de test statistique,


appréciation subjective.
 Cohérence : le produit de référence est-il suffisamment supérieur au témoin
non traité ? : test t de Student, unilatéral, de comparaison de la référence (R) au
témoin non traité (T).
 Quelle est la position des produits par rapport à la référence ? : test de Dunnett,
bilatéral, de comparaison des produits (P1, P2, P3 ...) à la référence (R).
 Eventuellement, comment se situent les produits meilleurs que la référence ? :
Test de Newman-Keuls sur les produits meilleurs que la référence.

On peut schématiser l'enchaînement des tests sur l'organigramme ci-après :

P3

R-T P1 >R Test de Newman-Keuls


Test t P4

P2
R Terminé
P5

Test de DUNNETT

2 - Dans le deuxième exemple, si la variable qui mesure la sélectivité des produits est
quantitative - un rendement - on peut utiliser les tests suivants pour répondre aux
différentes questions.

 Vraisemblance : le témoin est-il suffisamment propre ? Pas de test statistique


en général, appréciation subjective.
 Cohérence : le produit de référence donne-t-il le résultat attendu ? Test t de
Student, unilatéral de comparaison de la référence (R) au témoin non traité (T).
 Quels sont les produits phytotoxiques à la dose N ? Test de Dunnett, unilatéral
de comparaison des produits à la dose N (P1, P2, P3, ...) au produit de
référence.
 Parmi les produits non phytotoxiques à la dose N, lesquels sont phytotoxiques à
une dose kN ? Test t, unilatéral, de comparaison de chaque produit (P1, P2,
P3, ...) à la dose N au même produit à la dose kN (kP1, kP2, kP3, ...).

CEB, Document technique N° 6, Utilisation des tests statistiques 20


On peut schématiser l'enchaînement des tests sur l'organigramme ci-après :

P3

R-T P5 >R Produits Terminé


phytotoxiques
Test t P1

P4
Produits non
R
P2 phytotoxiques Test t
P4 - kP4
Test de DUNNETT
P5 - kP5

Remarque : Lorsque les tests sont déclarés "non significatifs", il est important dans
ce type d'essai, de calculer la puissance car on cherche non pas des différences, mais
des similitudes.

7. CONCLUSION ET APPLICATION AUX METHODE S DE LA


COMMISSION DES ESSAI S BIOLOGIQUES

Dans toutes les méthodes de la Commission des Essais Biologiques, on doit donc trouver :

1 - Dans le paragraphe "Objet de la méthode", la formulation claire et précise des


questions posées.

2 - Dans le paragraphe "Observations et notations", pour chaque variable à collecter, la


description de la méthode d'échantillonnage et d'observation.

3 - Dans le paragraphe "Analyses statistiques des variables et interprétation des


résultats" :

 pour chaque variable interprétée, la manière de l'obtenir à partir des données


observées,
 pour chaque variable analysée, la transformation éventuelle à effectuer et son
domaine d'utilisation,
 et enfin, le ou les tests utilisables avec les seuils de signification à retenir
(risques  de première espèce et  de deuxième espèce pour un écart choisi a
priori entre les traitements) et des références bibliographiques aussi bien sur les
tests eux-mêmes que sur les tables ou abaques permettant leur emploi.

4 - Dans le paragraphe "Présentation des résultats", un exemple commenté est souvent


souhaitable : cette illustration des résultats traite d'un cas standard, son commentaire
permet éventuellement de donner des réponses à certains problèmes particuliers.

CEB, Document technique N° 6, Utilisation des tests statistiques 21


Les différents aspects que nous venons d'aborder s'appliquent à tout type d'expérimentation.
Le choix d'un test est fonction :

 de la question posée,
 de la nature de la variable analysée.

Vous avez des problèmes pour indiquer sa route à une personne qui ne sait pas où elle veut
aller ... En revanche, si elle connaît sa destination, votre réponse n'est pas indépendante de son
mode de locomotion !

8. BIBLIOGRAPHIE

 TESTS NON PARAMETRIQUES

o DAGNELIE P. - 1969 (*)


Théorie et Méthodes statistiques. Vol. 2, Chap. 23. Duculot Gembloux.
o HOLLANDER M. - WOLFE D.A. - 1973(*)
Nonparametrics statistical methods. Wiley & sons.
o SIEGEL S. - 1956(*)
Nonparametrics statistics for the behavioral sciences. Mac Graw Hill.

o GOUET J.P. - 1980(*)


Recueil de quelques tests non paramétriques usuels. Polycopié ITCF.

 TESTS PARAMETRIQUES

o DAGNELIE P. - 1969(*)
Théorie et Méthodes statistiques. Vol. 2. Duculot Gembloux
o GOUET J.P. - 1974
Les comparaisons de moyennes et de variances. Application à
l'agronomie. Brochure ITCF.
o BACHACOU J. - MASSON J.P. - MILLIER C. - 1981
Manuel de la programmathèque statistique AMANCE. INRA-Biométrie.

 TRANSFORMATIONS DE VARIABLES

DAGNELIE P. - 1969
Théorie et Méthodes statistiques. Vol. 2, Chap. 22. Duculot Gembloux.

CEB, Document technique N° 6, Utilisation des tests statistiques 22

Vous aimerez peut-être aussi