Prambule
Quiconque voulant dcouvrir le test de Dixon va vite se trouver confront un obstacle : la
multiplicit des sources, des mthodes, notations et tables.
L'objectif de cet article est de proposer une mthode simple comprendre et utiliser au
niveau BTSA, afin duniformiser les pratiques pdagogiques ce niveau.
Le contexte
Au cours d'une exprimentation, il peut arriver qu'un des rsultats semble s'carter
notablement des autres. Un graphique peut tre dune grande utilit pour sen apercevoir.
Une attitude classique, que l'on rencontre trop souvent, consiste liminer cette valeur en la
considrant comme aberrante. Une bonne attitude avoir est dessayer de trouver la cause
de l'cart (erreur de lecture, faute de calcul, etc) ; dans ce cas, il est tout fait normal de
l'liminer. En revanche, si aucune cause accidentelle n'a pu tre dtecte, on sabstiendra
d'liminer brutalement la valeur incrimine. Pour cela, il faut avoir recours un test
statistique permettant de justifier l'limination de la valeur aberrante avec un risque de se
tromper choisi au pralable. Le test de Dixon, que nous allons exposer, permet de raliser
cela, sous condition de normalit du caractre.
Principe du test
Notons tout dabord quil peut sappliquer aussi bien pour une srie statistique une variable
(xi) que pour une srie statistique bivarie (xi ; yi).
Dans le premier cas, les valeurs xi tant ranges dans lordre croissant, le test de Dixon va
dtecter la (ou les) valeur(s) aberrante(s), aux extrmits de la distribution.
?
x1
x2
x3 x4 x5
xn
57
Si la valeur aberrante suspecte est trs suprieure aux autres ( droite du graphique), les
valeurs peuvent tre alors classes dans lordre dcroissant.
Dans le second cas, les observations sont reprsentes par un nuage de points disperss
autour de la droite de rgression de y en x d'quation y = a x + b (obtenue par la mthode
des moindres carrs), le test est bas sur la distribution des rsidus.
Ces derniers sont nots, pour tout entier i, ei = yi yi, cest--dire ei = yi (a xi + b).
8
7
6
5
4
3
2
1
0
0
x1
x3 x4 x5
xn
Hypothses
H0 : "La valeur douteuse nest pas une valeur aberrante."
H1 : "La valeur douteuse est une valeur aberrante."
n 10
n > 10
x3 x1
xn 2 x1
xn xn 2
xn x3
Remarque
-
58
Plus la valeur observe de R est leve, plus la valeur suspecte est aberrante.
On distingue n 10 et n > 10 pour dtecter les cas o il y a plus d'une valeur
aberrante (voir troisime exemple suivant).
ENFA - Bulletin n 22 du groupe PY-MATH - Juin 2013
Contact : Conf PY-MATH@educagri.fr
Valeur critique
On se fixe un seuil de risque . La valeur critique est note r1 , elle est dfinie par :
P(R r1 ) = 1 et elle est donne par la table en fin d'article.
Exemple dutilisation de la table : n = 8 et = 0,01.
Dans le cas de la recherche dune valeur aberrante, la table de Dixon indique que pour
n = 8 et = 0,01, la valeur critique est r0,99 = 0,59.
Cela signifie que si lon prlve alatoirement un chantillon de taille 8 dans une
population dans laquelle les donnes sont distribues normalement alors la probabilit
que R prenne une valeur infrieure ou gal 0,59 est 0,99.
Rgle de dcision
Si Robs > r1 , on rejette H0, donc la valeur suspecte est aberrante.
Si Robs r1 , on n'est pas en mesure de rejeter H0.
Exemple 1
Dans la fabrication de comprims effervescents, il est prvu que chaque comprim doit
contenir 1 625 mg de bicarbonate de sodium. Afin de contrler la fabrication de ces
mdicaments, on a prlev un chantillon de 10 comprims et on a mesur la quantit de
bicarbonate de sodium en mg pour chacun deux. Les rsultats obtenus sont rsums dans le
tableau suivant:
1 620
1 621
1 623
1 628
1 633
1 635
1 637
1 641
1 643
1 659
On peut demander aux tudiants de raliser un graphique sur un axe gradu pour dtecter
quelle(s) valeur(s) semble(nt) aberrante(s).
On effectue un test de Dixon au seuil de risque 0,05 pour tester si la valeur suprieure 1 659
est aberrante.
On teste les deux hypothses :
H0 : "1 659 nest pas une valeur aberrante."
H1 : "1 659 est une valeur aberrante."
n = 10 donc on utilise la variable alatoire R qui prend comme valeur observe
x x
x x
Robs = n n 1, soit Robs = 10 9 qui est gale 0,410.
xn x1
x10 x1
Daprs la table, la valeur critique est r0,95 = 0,412. Comme 0,41 < 0,412 : on n'est pas en
mesure de rejeter H0. La valeur 1 659 ne peut pas tre considre comme aberrante, au seuil
de 0,05.
59
Exemple 2
Lors dun dosage de sodium par photomtrie de flamme, on a procd un talonnage (fond
de flamme 0 et solution concentre 100).
Les mesures figurent dans le tableau suivant :
0
0
5
18
10
34
15
55
20
70
25
70
30
100
La valeur observe pour une concentration de 25 mg/L peut-elle tre considre comme
aberrante ?
Un petit coup dil sur le graphique :
y = 3,1429x + 2,4286
100
90
Indication photomtre
80
70
60
50
40
30
20
10
0
0
10
15
20
25
30
5
18
10
34
15
55
20
70
25
70
30
100
Estimation : Y
2,4
17,9
33,4
48,9
64,4
79,9
95,4
Rsidus : e
2,4
0,1
0,6
6,1
5,6
9,9
4,6
X
Y
1
9,9
2
2,4
3
0,1
4
0,6
5
4,6
6
5,6
7
6,1
e2 e1
0,75.
e7 e1
60
Exemple 3
Une entreprise tudie la possibilit de lancer sur le march un yaourt la rhubarbe. Elle
ralise des mesures de pH sur un chantillon de 11 pots. Les mesures observes sont les
suivantes :
5,40
5,70
6,15
6,16
6,18
6,25
6,43
6,45
6,45
6,60
6,75
x3 x1
xn 2 x1
prend en compte la possibilit davoir deux valeurs aberrantes infrieures (x1 et x2).
61
Sil sagit de xn 1 et xn, aprs avoir limin xn, on applique le test xn 1en prenant
x x
Robs = n 1 n 3.
xn 1 x4
Si le test conduit considrer x2 (respectivement xn 1) comme aberrantes, alors x1
(respectivement xn) lest aussi. Sinon on lui applique le test son tour.
x x1
x x
ou G = n
.
s
s
Bibliographie
Article de Dean et Dixon :
http://depa.pquim.unam.mx/amyd/archivero/ac1951_23_636_13353.pdf
62
n
3
4
5
6
7
8
9
10
0,01
0,05
0,988
0,889
0,780
0,698
0,637
0,590
0,555
0,527
0,941
0,765
0,642
0,560
0,507
0,468
0,437
0,412
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0,745
0,704
0,670
0,641
0,616
0,595
0,577
0,561
0,547
0,535
0,524
0,514
0,505
0,497
0,489
0,486
0,475
0,469
0,463
0,457
0,637
0,600
0,570
0,546
0,525
0,507
0,490
0,475
0,462
0,450
0,440
0,430
0,421
0,413
0,406
0,399
0,393
0,387
0,381
0,376
63