Académique Documents
Professionnel Documents
Culture Documents
12:39:24
Client : SONATRACH - Complexe CP1Z - Division PEC
NORME ISO
INTERNATIONALE 5725-2
Deuxième édition
2019-12
Numéro de référence
ISO 5725-2:2019(F)
© ISO 2019
Date livraison : mercredi 6 mai 2020 12:39:25
12:39:24
Client : SONATRACH - Complexe CP1Z - Division PEC
ISO 5725-2:2019(F)
Sommaire Page
Avant-propos.................................................................................................................................................................................................................................v
Introduction................................................................................................................................................................................................................................. vi
1 Domaine d’application.................................................................................................................................................................................... 1
2 Références normatives.................................................................................................................................................................................... 2
3 Termes et définitions........................................................................................................................................................................................ 2
4 Symboles........................................................................................................................................................................................................................ 2
5 Estimations des paramètres dans le modèle de base..................................................................................................... 4
6 Exigences relatives à une expérience de fidélité.................................................................................................................. 5
6.1 Schéma de l’expérience.................................................................................................................................................................... 5
6.2 Recrutement des laboratoires.................................................................................................................................................... 6
6.3 Préparation des matériaux............................................................................................................................................................ 6
7 Personnel impliqué dans une expérience de fidélité...................................................................................................... 8
7.1 Panel d’experts......................................................................................................................................................................................... 8
7.2 Fonctions statistiques........................................................................................................................................................................ 9
7.3 Fonctions exécutives........................................................................................................................................................................... 9
7.4 Superviseurs........................................................................................................................................................................................... 10
7.5 Opérateurs................................................................................................................................................................................................ 10
8 Analyse statistique d’une expérience de fidélité..............................................................................................................11
8.1 Considérations préliminaires................................................................................................................................................... 11
8.2 Tabulation des résultats et notations utilisées.......................................................................................................... 12
8.2.1 Cellules................................................................................................................................................................................... 12
8.2.2 Données redondantes................................................................................................................................................ 12
8.2.3 Données manquantes................................................................................................................................................ 12
8.2.4 Valeurs aberrantes....................................................................................................................................................... 12
8.2.5 Laboratoires aberrants............................................................................................................................................. 12
8.2.6 Données erronées......................................................................................................................................................... 12
8.2.7 Résultats d’essai à niveau uniforme équilibrés................................................................................... 13
8.2.8 Recueil des données et des valeurs intermédiaires......................................................................... 13
8.2.9 Résultats d’essai d’origine..................................................................................................................................... 13
8.2.10 Moyennes de cellule (Formulaire B de la Figure 2)......................................................................... 13
8.2.11 Mesures de la dispersion de cellule (Formulaire C de la Figure 2).................................... 14
8.2.12 Données corrigées ou rejetées........................................................................................................................... 14
8.3 Examen des résultats pour la cohérence et les valeurs aberrantes........................................................ 14
8.3.1 Approches pour l’examen des données..................................................................................................... 14
8.3.2 Technique graphique de cohérence............................................................................................................... 15
8.3.3 Technique numérique pour les valeurs aberrantes......................................................................... 18
8.3.4 Test de Cochran............................................................................................................................................................... 18
8.3.5 Tests de Grubbs............................................................................................................................................................... 20
8.3.6 Tests répétés relatifs aux moyennes aberrantes ou données aberrantes..................... 22
8.3.7 Méthodes alternatives de contrôle et de test de valeurs aberrantes................................ 22
8.4 Calcul de la moyenne générale et des variances...................................................................................................... 23
8.4.1 Méthode d’analyse........................................................................................................................................................ 23
8.4.2 Données de base............................................................................................................................................................. 23
8.4.3 Cellules non vides......................................................................................................................................................... 23
8.4.4 Calcul de la moyenne générale, m̂ ................................................................................................................. 23
8.4.5 Calcul des variances.................................................................................................................................................... 23
8.4.6 Méthodes alternatives de calcul pour les variances........................................................................ 25
8.4.7 Dépendance des variances par rapport à m........................................................................................... 25
8.5 Établissement d’une relation fonctionnelle entre les valeurs de fidélité, s, et le
niveau moyen, m.................................................................................................................................................................................. 25
8.5.1 Choix de la relation fonctionnelle................................................................................................................... 25
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes
nationaux de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est
en général confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l’ISO participent également aux travaux.
L’ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui
concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www
.iso.org/directives).
L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant
les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de
l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de
brevets reçues par l’ISO (voir www.iso.org/brevets).
Les appellations commerciales éventuellement mentionnées dans le présent document sont données
pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un
engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion
de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles
techniques au commerce (OTC), voir le lien suivant: www.iso.org/iso/f r/avant-propos.
Le présent document a été élaboré par le comité technique ISO/TC 69, Application des méthodes
statistiques, sous-comité SC 6, Méthodes et résultats de mesure.
Cette deuxième édition annule et remplace la première édition (ISO 5725-2:1994), qui a fait l’objet d’une
révision technique. Elle intègre également le Rectificatif technique ISO 5725-2:1994/Cor 1:2002.
Les principales modifications par rapport à l’édition précédente sont les suivantes:
— l’utilisation de tests alternatifs pour l’examen des résultats et la détection des valeurs aberrantes
est admise, sous réserve que la performance soit similaire;
— l’application des méthodes statistiques récentes disponibles est admise, pour le calcul des
caractéristiques applicables de fidélité et de justesse;
— des recommandations relatives au nombre de laboratoires requis pour une étude de fidélité ont été
incluses;
— des informations sur le calcul des valeurs critiques ont été incluses.
Une liste de toutes les parties de la série ISO 5725 se trouve sur le site web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes
se trouve à l’adresse www.iso.org/f r/members.html.
Introduction
L’ISO 5725 utilise deux termes, «justesse» et «fidélité», pour décrire l’exactitude d’une méthode de
mesure. La «justesse» désigne l’étroitesse de l’accord entre la moyenne arithmétique obtenue à partir
d’une large série de résultats d’essai et la valeur de référence acceptée ou vraie. La «fidélité» désigne
l’étroitesse de l’accord entre les résultats d’essai.
Des considérations générales relatives à ces grandeurs sont données dans l’ISO 5725-1 et ne sont donc
pas reprises dans le présent document. Il convient de consulter l’ISO 5725-1 conjointement à toutes les
autres parties de l’ISO 5725, y compris la présente partie, car elle spécifie les définitions sous-jacentes
et principes généraux.
Le présent document vise seulement à estimer l’écart-type de répétabilité et l’écart-type de
reproductibilité, en se basant sur un plan d’expérience interlaboratoires dans lequel chaque laboratoire
effectue un certain nombre de mesures indépendantes du même échantillon, dans les conditions
de répétabilité. Il existe d’autres plans (par exemple les expériences imbriquées, les expériences
factorielles ou les expériences à niveau fractionné) pouvant être utilisés pour estimer la fidélité: ceux-
ci ne sont pas abordés dans le présent document, mais sont le sujet d’autres parties de l’ISO 5725. De la
même manière, le présent document ne tient pas compte des mesures de fidélité intermédiaires, entre
les deux mesures principales; celles-ci sont couvertes par l’ISO 5725-3.
Dans certaines circonstances, les données obtenues à partir d’une expérience visant à estimer la
fidélité sont également utilisées pour estimer la justesse, et peuvent aussi être utilisées pour évaluer
l’incertitude de mesure. L’estimation de la justesse n’est pas prise en compte dans le présent document;
tous les aspects relatifs à l’estimation de la justesse sont couverts dans l’ISO 5725-4. L’évaluation de
l’incertitude de mesure, en utilisant des estimations interlaboratoires de la justesse et de la fidélité, est
couverte dans l’ISO 21748.
L’Annexe C donne des exemples pratiques de l’estimation de la fidélité de méthodes de mesure. Ces
exemples sont donnés pour décrire des plans uniformes équilibrés de résultats d’essai, bien que dans
un exemple un nombre variable de répétitions par cellule soit fourni (plan non équilibré), et que dans
un autre exemple, certaines données soient manquantes. Cela est dû au fait qu’une expérience planifiée
pour être équilibrée peut devenir non équilibrée. Les valeurs isolées et les valeurs aberrantes sont
également prises en compte.
1 Domaine d’application
1.2 Il traite exclusivement des méthodes de mesure qui fournissent des mesures sur une échelle
continue et qui donnent comme résultat d’essai une seule valeur, bien que cette valeur unique puisse être
le résultat d’un calcul effectué à partir d’un ensemble d’observations.
1.3 Il prend pour hypothèse que pour la planification et l’exécution de l’expérience de fidélité, tous les
principes donnés dans I’ISO 5725‑1 sont suivis. La méthode de base utilise le même nombre de résultats
d’essai dans chaque laboratoire, chacun analysant les mêmes niveaux d’échantillons d’essai, c’est-à-dire
une expérience à niveau uniforme équilibrée. La méthode de base s’applique à des procédures qui ont
été normalisées et qui sont régulièrement utilisées dans un certain nombre de laboratoires.
1.4 Le modèle statistique de l’ISO 5725-1:1994, Article 5, est considéré comme une base appropriée
pour l’interprétation et l’analyse des résultats d’essai dont la distribution est approximativement
normale.
1.5 La méthode de base, telle que décrite dans le présent document, estime (généralement) la fidélité
d’une méthode de mesure:
1.6 Une approche similaire peut être appliquée à l’estimation préliminaire de la fidélité pour des
méthodes de mesure qui n’ont pas atteint le stade de normalisation ou qui ne sont pas d’utilisation
courante.
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique.
Pour les références non datées, la dernière édition du document de référence s’applique (y compris les
éventuels amendements).
ISO 3534-1, Statistique — Vocabulaire et symboles — Partie 1: Termes statistiques généraux et termes
utilisés en calcul des probabilités
ISO 3534-2, Statistique — Vocabulaire et symboles — Partie 2: Statistique appliquée
ISO 3534-3, Statistique — Vocabulaire et symboles — Partie 3: Plans d'expériences
ISO 5725-1, Exactitude (justesse et fidélité) des résultats et méthodes de mesure — Partie 1: Principes
généraux et définitions
3 Termes et définitions
Pour les besoins du présent document, les définitions de l’ISO 3534-1, l’ISO 3534-2, l’ISO 3534-3 et
l’ISO 5725-1 s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en
normalisation, consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https://w ww.iso.org/obp;
— IEC Electropedia: disponible à l’adresse http://w ww.electropedia.org/.
4 Symboles
α Probabilité associée à une valeur critique d’une statistique de test, également désignée
comme niveau de signification
N Nombre d’itérations
P Probabilité
r Limite de répétabilité
R Limite de reproductibilité
s Estimation de l’écart-type
ŝ Écart-type prédit
y Résultat d’essai
L Interlaboratoires
P Probabilité
r Répétabilité
R Reproductibilité
v Termes utilisés dans le calcul d’une relation entre variance moyenne et variance com-
binée (voir 8.5.1.3, relation III)
W Intralaboratoire
1, 2, 3... Pour les résultats d’essai, numérotation dans l’ordre de leur obtention; pour les autres
cas (laboratoires), identificateurs arbitraires
(1), (2), (3)... Pour les résultats d’essai, (1), (2)… désignent la 1re, 2e, etc. statistique d’ordre, c’est-à-
dire la 1re, 2e, etc. valeur numérotée dans l’ordre d’amplitude croissante
5.1 Les procédures données dans le présent document sont basées sur le modèle donné à l’Article 5 de
l’ISO 5725-1:1994, et sont élaborées conformément à l’ISO 5725-1:1994, 1.2. Plus particulièrement, ces
procédures sont basées sur les Formules (2) à (6) données dans l’ISO 5725-1:1994, Article 5.
e désigne l’erreur aléatoire survenant dans chaque mesure dans des conditions de répétabilité.
NOTE La composante laboratoire du biais, B, représente l’écart d’une moyenne de laboratoire par rapport à
la moyenne générale, m.
5.2 Les Formules (2) à (6) de l’ISO 5725-1:1994 sont exprimées en fonction des écarts-types vrais des
populations considérées. Dans la pratique, les valeurs exactes de ces écarts-types ne sont pas connues et
il faut que des estimations des valeurs de fidélité soient établies à partir d’un échantillon relativement
petit de tous les laboratoires possibles, et à l’intérieur de ces laboratoires, à partir d’un petit échantillon
de tous les résultats d’essai possibles.
5.3 Dans la pratique statistique, lorsque la valeur vraie d’un écart-type, σ, n’est pas connue et
qu’elle est remplacée par une estimation basée sur un échantillon, le symbole σ est alors remplacé
par s pour signaler qu’il s’agit d’une estimation. Cela s’applique à chacune des Formules (2) à (6) de
l’ISO 5725-1:1994, d’où les symboles suivants:
— sW
2 désigne l’estimation de la variance intralaboratoire;
— sr2 est la moyenne arithmétique de sW2 et désigne l’estimation de la variance de répétabilité. Cette
moyenne arithmétique est calculée en tenant compte de tous les laboratoires participant à
l’expérience d’exactitude, et après avoir exclus les valeurs aberrantes;
6.1.1 Dans le schéma utilisé dans la méthode de base, des échantillons provenant de q lots de
matériaux, représentant q niveaux différents de l’essai, sont envoyés à p laboratoires qui effectuent
chacun exactement n résultats d’essai répétés, dans des conditions de répétabilité à chacun des q niveaux.
Ce type d’expérience est appelé une expérience à niveau uniforme équilibrée.
6.1.2 L’exécution de ces mesures doit être organisée et les instructions fournies comme suit:
a) tout contrôle préliminaire des équipements doit être effectué comme spécifié dans la méthode
normalisée;
b) chaque groupe de n mesures appartenant à un niveau donné doit être effectué dans des conditions
de répétabilité, c’est-à-dire dans un court intervalle de temps et par le même opérateur, et sans
aucun réétalonnage intermédiaire de l’appareillage, à moins que ceci ne fasse partie intégrante de
l’exécution de la mesure;
c) il est essentiel qu’un groupe de n essais, menés dans des conditions de répétabilité, soit exécuté
indépendamment, comme s’il y avait n essais sur des matériaux différents. L’opérateur sait
cependant qu’il réalise des essais sur un matériau identique, mais il convient d’insister, dans les
instructions, sur le fait que tout l’objectif de l’expérience est de déterminer quelles différences
peuvent survenir dans les résultats lors d’essais réels. S’il est à craindre que, en dépit de cet
avertissement, des résultats précédents puissent influencer les résultats d’essai suivants, et
donc la variance de répétabilité, il convient de considérer s’il faut ou non utiliser n échantillons
indépendants à chacun des q niveaux, codés de telle façon que l’opérateur ne sache pas quelles sont
les répétitions pour un niveau donné. Cependant, une telle procédure peut poser des problèmes
quant à l’assurance que les conditions de répétabilité s’appliquent entre les répétitions. Cela n’est
possible que si les mesures sont effectuées de façon que les qn mesures puissent être exécutées
dans un court intervalle de temps;
d) iI n’est pas essentiel que tous les q groupes de n mesures chacun soient effectués strictement dans
un court intervalle de temps; différents groupes de mesures peuvent être effectués à des jours
différents;
e) les mesures de tous les q niveaux doivent être effectuées par un seul et même opérateur. En
outre, les n mesures à un niveau donné doivent être effectuées en utilisant constamment le même
équipement;
f) si, durant les mesures, un opérateur devenait indisponible, un autre opérateur peut terminer les
mesures, sous réserve que le changement n’intervienne pas au sein d’un groupe de n mesures à un
niveau donné, mais seulement entre deux des q groupes. Un tel changement doit être consigné avec
les résultats;
g) un temps limite doit être donné, au bout duquel toutes les mesures doivent être terminées. Cela
peut s’avérer nécessaire pour limiter le temps alloué entre le jour de réception des échantillons et le
jour d’exécution des mesures;
h) tous les échantillons doivent être clairement étiquetés avec le nom de l’expérience et l’identification
de l’échantillon.
6.1.3 En 6.1.2, et partout ailleurs dans le présent document, il est fait référence à l’opérateur. Pour
certaines mesures, il peut s’agir en fait d’une équipe d’opérateurs, chacun d’entre eux effectuant une
partie spécifique de la procédure. Dans ce cas, l’équipe doit être considérée comme l’«opérateur», et tout
changement dans l’équipe doit être considéré comme donnant un «opérateur» différent.
6.1.4 Dans un cadre commercial, les résultats d’essai peuvent être arrondis sans trop de précision, mais
dans une expérience de fidélité, les résultats d’essai doivent être consignés avec au moins une décimale
de plus que ce qui est spécifié dans la méthode normalisée. Si la méthode ne spécifie pas le nombre
de décimales, l’arrondissage ne doit pas être plus imprécis que la moitié de l’estimation de l’écart-type
de répétabilité. Lorsque la fidélité dépend du niveau m, différentes règles d’arrondissage peuvent être
nécessaires pour les différents niveaux.
6.2.1 Les principes généraux concernant le recrutement des laboratoires amenés à participer à une
expérience interlaboratoires sont donnés dans l’ISO 5725-1. Des recommandations relatives au nombre
de laboratoires sont données dans l’Annexe A. Lors de l’enregistrement du nombre de laboratoires requis
à des fins de coopération, les responsabilités de ceux-ci doivent être clairement énoncées. Un exemple de
questionnaire d’enregistrement approprié est représenté à la Figure 1.
6.2.2 Dans le cadre du présent document, un «laboratoire» est considéré comme étant la combinaison
de l’opérateur, de l’équipement et du site d’essai. Un même site d’essai (ou laboratoire dans le sens
conventionnel) peut donc fournir plusieurs «laboratoires», s’il peut disposer de plusieurs opérateurs,
chacun avec des ensembles indépendants d’équipement et de situations dans lesquels ils effectuent le
travail.
6.3.1 Des informations sur les points à prendre en considération lors de la sélection des matériaux à
utiliser dans une expérience de fidélité sont données dans l’ISO 5725-1.
6.3.2 Lors de la détermination de la quantité de matériau à fournir, une marge de manœuvre doit être
prévue pour tenir compte des accidents ou erreurs dans l’obtention de certains résultats d’essai, qui
peuvent nécessiter l’utilisation de matériau supplémentaire. La quantité de matériau préparée doit être
suffisante pour couvrir l’expérience et permettre de constituer un stock adéquat.
6.3.3 Il convient de déterminer s’il est préférable pour certains laboratoires d’obtenir des résultats
d’essai préliminaires afin de se familiariser avec la méthode de mesure avant d’obtenir les résultats
d’essai officiels, et si tel est le cas, s’il convient que du matériau supplémentaire (mais pas des échantillons
de l’expérience de fidélité) soit fourni pour cet objectif.
6.3.4 Lorsqu’un matériau est à homogénéiser, cela doit être fait de la façon la plus appropriée pour
ce matériau. Lorsque le matériau soumis à essai n’est pas homogène, il est important de préparer les
échantillons comme spécifié par la méthode, en commençant de préférence avec un lot de matériau
commercial pour chaque niveau. Dans le cas de matériaux non stables, des instructions spécifiques sur le
stockage et le traitement doivent être données.
NOTE Le Guide ISO 35 donne des informations sur l’évaluation de l’homogénéité et de la stabilité des
matériaux de référence.
6.3.5 Pour les échantillons à chaque niveau, n contenants indépendants doivent être utilisés pour
chaque laboratoire, s’il existe un danger de détérioration des matériaux une fois que le contenant a été
ouvert (par exemple par oxydation, par perte de composants volatiles ou en présence d’un matériau
hygroscopique). Dans le cas de matériaux non stables, des instructions spécifiques sur le stockage et
le traitement doivent être données. Des précautions peuvent être nécessaires pour s’assurer que les
échantillons restent identiques le temps que les mesures soient effectuées. Si le matériau à mesurer est
constitué d’un mélange de poudres présentant des densités relatives différentes ou des grosseurs de
grains différentes, des précautions sont nécessaires, car les secousses, par exemple pendant le transport,
peuvent entraîner une ségrégation. Lorsqu’une réaction avec l’atmosphère est possible, les spécimens
peuvent être enfermés dans des ampoules, soit sous vide, soit remplies avec un gaz inerte. Pour des
matériaux périssables, tels que des échantillons de nourriture ou de sang, il peut être nécessaire de les
expédier en état de congélation aux laboratoires participants, avec des instructions détaillées sur la
procédure de décongélation.
7.1.1 Il convient que l’expérience de fidélité soit supervisée par un panel d’experts, dont il convient
qu’il soit constitué d’experts familiarisés avec la méthode de mesure et son application.
7.3.1 Il convient que l’organisation concrète de l’expérience ne soit confiée qu’à un seul laboratoire. Il
convient qu’un membre du personnel de ce laboratoire en assume l’entière responsabilité; il est appelé
le responsable exécutif et est nommé par le panel d’experts.
7.4 Superviseurs
7.4.1 Il convient qu’un membre du personnel dans chaque laboratoire participant soit responsable de
la mise en œuvre concrète des mesures, en respectant les instructions reçues du responsable exécutif, et
de la consignation des résultats d’essai.
a) s’assurer que les opérateurs retenus sont ceux qui effectuent normalement les mesures lors des
opérations de routine;
b) distribuer les échantillons à l’opérateur ou aux opérateurs, en respectant les instructions du
responsable exécutif (et de fournir des matériaux pour se familiariser avec l’expérience, si
nécessaire);
c) superviser l’exécution des mesures (le superviseur ne doit pas prendre part à l’exécution des
mesures);
d) s’assurer que les opérateurs effectuent le nombre de mesures nécessaires;
e) s’assurer que l’exécution des mesures respecte le planning défini;
f) collecter les résultats d’essai enregistrés avec le nombre de décimales (ou le nombre de chiffres
significatifs) convenu, en y faisant figurer toutes les anomalies et difficultés rencontrées, et les
commentaires faits par les opérateurs.
7.4.3 Il convient que le superviseur de chaque laboratoire écrive un rapport complet, dont il convient
qu’il contienne les informations suivantes:
a) les résultats d’essai, écrits lisiblement par leurs auteurs sur les formulaires fournis, sans être
transcrits ou tapés (les éléments de sortie émanant d’un ordinateur ou d’une machine d’essai
peuvent constituer une alternative acceptable);
b) les observations ou données d’origine (le cas échéant) à partir desquelles les résultats d’essai ont été
établis, écrites lisiblement par l’opérateur sur les formulaires fournis, sans être transcrites ou tapées;
c) les commentaires des opérateurs sur la méthode de mesure normalisée;
d) des informations sur les irrégularités ou les perturbations qui ont pu survenir pendant les mesures,
y compris tout changement d’opérateur, en stipulant quelles mesures ont été effectuées par quel
opérateur, et les raisons de tout résultat manquant;
e) la ou les dates de réception des échantillons;
f) la ou les dates de mesure des échantillons;
g) des informations sur l’équipement utilisé, si cela est pertinent;
h) toute autre information pertinente.
NOTE Les éléments de sortie et les formulaires cités aux alinéas a) et b) de 7.4.3 peuvent être au format
électronique (par exemple une feuille de calcul protégée de manière appropriée contre les modifications
indésirables).
7.5 Opérateurs
7.5.1 Dans chaque laboratoire, les mesures doivent être effectuées par un seul opérateur, retenu
comme étant représentatif de ceux susceptibles d’effectuer les mesures dans des opérations normales.
7.5.2 Comme l’objet de l’expérience est de déterminer la fidélité qui peut être obtenue par l’ensemble de
la population des opérateurs travaillant avec la méthode de mesure normalisée, il convient généralement
de ne pas donner aux opérateurs des développements sur la méthode de mesure normalisée. Cependant,
il convient de signaler aux opérateurs que le but de cet exercice est de connaître dans quelle mesure les
résultats peuvent varier dans la pratique, de façon qu’ils soient moins tentés d’éliminer ou de reprendre
les résultats qu’ils estiment incohérents.
7.5.3 Bien que normalement, il convient de ne pas donner aux opérateurs des développements
supplémentaires sur la méthode de mesure normalisée, il convient de les encourager à commenter la
norme et, en particulier, à indiquer si les instructions qui y sont contenues sont suffisamment dénuées
d’ambiguïtés et suffisamment claires.
8.1.1 II convient de considérer l’analyse des données comme un problème statistique, à résoudre par
un expert statisticien, impliquant trois étapes successives:
a) un examen critique des données afin d’identifier et traiter les valeurs aberrantes ou autres
irrégularités, et de vérifier l’adéquation du modèle;
b) le calcul des valeurs préliminaires de fidélité et de moyennes, indépendamment pour chaque niveau;
c) l’établissement des valeurs finales de fidélité et de moyennes, y compris l’établissement de la
relation entre la fidélité et le niveau m lorsque l’analyse indique qu’une telle relation peut exister.
8.1.2 L’analyse calcule d’abord les estimations suivantes, indépendamment pour chaque niveau:
8.2.1 Cellules
Chaque combinaison d’un laboratoire avec un niveau est appelée cellule de l’expérience de fidélité. Dans
le cas idéal, les résultats d’une expérience avec p laboratoires et q niveaux consistent en un tableau avec
pq cellules, chacune contenant n résultats d’essai répétés qui peuvent tous être utilisés pour le calcul de
l’écart-type de répétabilité et de l’écart-type de reproductibilité. Cette situation idéale n’est cependant
pas toujours obtenue dans la pratique, où des écarts sont constatés, dus aux données redondantes, aux
données manquantes et aux valeurs aberrantes.
II arrive parfois qu’un laboratoire effectue et signale un nombre de résultats d’essai supérieur aux
n résultats d’essai officiellement spécifiés. Dans ce cas, le superviseur doit en signaler la raison, et quels
sont les résultats d’essai corrects. Si la réponse est qu’ils sont tous autant valides les uns que les autres,
alors une sélection aléatoire peut être effectuée parmi les résultats disponibles pour choisir le nombre
prévu de résultats d’essai pour l’analyse.
NOTE Les calculs des valeurs de fidélité qui sont autorisées dans le présent document peuvent gérer un
nombre variable de résultats d’essai par cellule (voir 8.2.7). Cependant, une variation substantielle du nombre
d’observations signalées peut affecter défavorablement l’interprétation des essais de valeurs aberrantes et des
statistiques de Mandel, et peut altérer la fiabilité de la moyenne générale.
Dans d’autres cas, certains résultats peuvent manquer, par exemple en raison de la perte d’un
échantillon ou d’une erreur dans l’exécution de la mesure. L’analyse recommandée dans le présent
document est telle que les cellules complètement vides peuvent être simplement ignorées, tandis que
les cellules partiellement vides peuvent être prises en compte par la procédure de calcul normalisée.
Ce sont, parmi les résultats d’essai d’origine ou dans les tableaux qui en découlent, les valeurs
qui s’écartent tellement des valeurs comparables enregistrées dans le même tableau qu’elles sont
considérées comme incompatibles avec ces dernières. L’expérience a montré que les valeurs aberrantes
ne peuvent pas toujours être évitées, et qu’elles sont à prendre en considération de la même façon que
les données manquantes.
Lorsque plusieurs résultats anormaux et inexpliqués surviennent à différents niveaux au sein du même
laboratoire, alors ce laboratoire peut être considéré comme étant aberrant, car il présente une variance
intralaboratoire trop élevée et/ou une erreur systématique trop grande dans le niveau de ses résultats
d’essai. II peut alors être raisonnable d’écarter certaines ou toutes les données d’un tel laboratoire
aberrant.
Le présent document ne fournit pas de test statistique qui permette de juger les laboratoires suspects.
Il convient que la décision principale relève de la responsabilité de l’expert statisticien, mais tous les
laboratoires rejetés doivent être signalés au panel d’experts, en vue d’engager des actions ultérieures.
Le cas idéal est p laboratoires appelés i (i = 1, 2..., p), chacun soumettant à essai q niveaux appelés j ( j = 1,
2..., q) avec n répétitions à chaque niveau (chaque combinaison ij), donnant un total de pqn résultats
d’essai. Cette situation idéale n’est pas toujours obtenue à cause de résultats d’essai manquants (8.2.3)
ou aberrants (8.2.4), ou bien de laboratoires aberrants (8.2.5), ou bien encore de données erronées
(8.2.6). Dans ces conditions, les notations données de 8.2.9 à 8.2.11 et les procédures de 8.4 autorisent
un nombre variable de résultats d’essai.
Des exemples de formulaires recommandés pour l’analyse statistique sont donnés à la Figure 2. Le
Formulaire A est destiné au recueil des résultats individuels, le Formulaire B contient les moyennes
calculées pour les cellules, et le Formulaire C contient les écarts-types calculés. À des fins pratiques, ces
formulaires sont simplement désignés comme étant les Formulaires A, B et C (de la Figure 2).
NOTE L’utilisation des Formulaires A, B et C pour l’analyse statistique ne constitue pas une exigence du
présent document. En revanche, ces Formulaires A, B et C présentent un intérêt pour le recueil des valeurs
intermédiaires, dans le cadre de calculs manuels, et ils peuvent aisément être adaptés en vue d’être utilisés
dans un tableur. Des dispositions alternatives sont souvent plus appropriées en vue d’un usage avec des logiciels
d’analyse statistique.
nij désigne le nombre de résultats d’essai dans une cellule pour le laboratoire i au niveau j;
pj désigne le nombre de laboratoires consignant au moins un résultat d’essai pour le niveau j (après
élimination de tous les résultats d’essai considérés comme des valeurs aberrantes ou erronées).
Ces moyennes sont calculées à partir des résultats contenus dans le Formulaire A, en appliquant la
Formule (2) comme suit:
nij
1
yij =
nij ∑ yijk (2)
k =1
II convient d’enregistrer les moyennes de cellule avec au moins un chiffre significatif de plus que les
résultats d’essai consignés (Formulaire A).
Ces mesures sont calculées à partir des résultats individuels (Formulaire A, voir 8.2.9) et des moyennes
(Formulaire B, voir 8.2.10), comme suit. Pour le cas général, utiliser l’écart-type intracellule, comme
dans la Formule (3):
nij
∑( )
1 2
sij = y −y (3)
nij −1 k =1 ijk ij
ou de façon équivalente:
nij nij
2
1
∑( ) ∑
2 1
sij = y − y (4)
nij −1 k =1 ijk nij k =1 ijk
Lors de l’utilisation de ces formules, il doit être fait en sorte de prendre un nombre de décimales suffisant
dans les calculs, c’est-à-dire, chaque valeur intermédiaire doit être calculée avec au moins deux fois plus
de chiffres significatifs que les données d’origine consignées[voir 7.3.2 alinéa b), 7.4.3 alinéa f)].
Lorsque le Formulaire C est utilisé, il convient de consigner l’écart-type avec un chiffre significatif de
plus que les résultats consignés dans le Formulaire A. Pour les valeurs de nij inférieures à 2, il convient
d’insérer un tiret dans le Formulaire C.
NOTE 1 Si une cellule ij contient deux résultats d’essai, l’écart-type intracellule est calculé comme suit:
Par conséquent, par souci de simplicité, les différences absolues peuvent être consignées dans
le Formulaire C et utilisées à la place des écarts-types pour le test de Cochran si toutes les cellules
contiennent deux résultats d’essai.
NOTE 2 La Formule (4) est propice à des erreurs d’arrondi dans le cadre de calculs informatiques; pour ces
derniers, la Formule (3) assure une plus grande exactitude.
Comme certaines données peuvent être corrigées ou rejetées sur la base des essais mentionnés en 8.3.3
et en 8.3.4, les valeurs yijk, nij et pj utilisées pour la détermination finale de la fidélité et de la moyenne
peuvent être différentes des valeurs se référant aux résultats d’essai d’origine, tels qu’ils ont été
consignés dans les Formulaires A, B et C de la Figure 2. Dès lors, pour consigner les valeurs finales de
fidélité et de justesse, les données ayant été corrigées ou écartées, le cas échéant, doivent toujours être
signalées.
8.3.2.1 Deux mesures sont utilisées, appelées les statistiques h et k de Mandel. Ces mesures contribuent
aussi bien à décrire la variabilité de la méthode de mesure, qu’à aider dans l’évaluation de laboratoire.
yij − y j
hij = (6)
pj
∑( )
1 2
y − yj
p j −1 i =1 ij
où yij est défini en 8.2.10 et y j en 8.4.4.
Tracer les valeurs hij pour chaque cellule dans l’ordre des laboratoires, par groupes correspondant à
chaque niveau (et en définissant des groupes indépendants pour les différents niveaux examinés par
chaque laboratoire) (voir Figure C.7).
a Le Formulaire A contient les résultats individuels. Chaque cellule contient l’ensemble des n résultats
pour le laboratoire.
b Le Formulaire B contient les moyennes de cellule, calculées conformément à 8.2.10.
c Le Formulaire C contient les mesures de dispersion (écarts-types), calculées conformément à 8.2.11.
Figure 2 — Formulaires recommandés pour le recueil des résultats à des fins d’analyse
∑ sij2 (7)
pj
Calculer cet écart-type intracellule commun pour chaque niveau, puis calculer:
sij p j
kij = (8)
∑ sij2
pour chaque laboratoire à chaque niveau.
Tracer les valeurs kij pour chaque cellule dans l’ordre des laboratoires, par groupes correspondant à
chaque niveau et en définissant des groupes indépendants pour les différents niveaux examinés par
chaque laboratoire (voir Figure C.8).
8.3.2.4 L’examen des graphiques de h et de k peut indiquer que des laboratoires spécifiques présentent
des ensembles de résultats nettement différents des autres dans l’étude. Cela est indiqué par exemple par
une variation intracellule constamment forte ou faible, et/ou des moyennes de cellule extrêmes sur un
grand nombre de niveaux. Le cas échéant, il convient de contacter le laboratoire concerné pour essayer
de déterminer la cause du comportement divergeant. Sur la base des conclusions, l’expert statisticien
peut alors:
8.3.2.5 Différentes tendances peuvent apparaître dans les graphiques de h. Tous les laboratoires
peuvent avoir à la fois des valeurs positives et négatives de h à différents niveaux de l’expérience. Des
laboratoires individuels peuvent tendre à ne donner que des valeurs positives ou que des valeurs
négatives de h, et le nombre de laboratoires donnant des valeurs négatives est approximativement
égal à celui donnant des valeurs positives. Aucune de ces tendances n’est inhabituelle ou ne nécessite
d’investigation, bien que la seconde puisse suggérer qu’il existe une source commune de biais de
laboratoire. D’un autre côté, si toutes les valeurs de h pour un laboratoire sont d’un signe et que les
valeurs de h pour les autres laboratoires sont toutes du signe contraire, il convient alors d’en rechercher
la raison. De la même manière, si les valeurs de h pour un laboratoire sont extrêmes et qu’elles paraissent
dépendre relativement systématiquement du niveau expérimental, il convient alors d’en rechercher la
raison. Des lignes correspondant aux indicateurs donnés dans le Tableau 7 et le Tableau 8 sont tracées
sur les graphiques de h. Ces lignes servent de guides lors de l’examen des tendances au sein des données.
8.3.2.6 Si un laboratoire apparaît sur le graphique de k comme ayant beaucoup de valeurs élevées, il
convient alors d’en rechercher la raison: cela indique qu’il a une plus faible répétabilité que les autres
laboratoires. Un laboratoire peut engendrer des valeurs de k constamment faibles en raison de facteurs
tels qu’un arrondissage excessif de ses données, ou une échelle de mesure non adaptée. Des lignes
correspondant aux indicateurs donnés dans le Tableau 7 et le Tableau 8 sont tracées sur les graphiques
de k. Ces lignes servent de guides lors de l’examen des tendances au sein des données.
8.3.2.7 Lorsqu’un graphique de h ou de k regroupé par laboratoire suggère qu’un laboratoire présente
plusieurs valeurs de h ou de k proches de la ligne de l’indicateur, il convient d’étudier le graphique
correspondant regroupé par niveau. Souvent, une valeur qui paraît élevée dans un graphique regroupé
par laboratoire semble raisonnablement cohérente par rapport aux autres laboratoires pour le même
niveau. Si elle se révèle fortement différente des valeurs des autres laboratoires, il convient alors d’en
rechercher la raison.
8.3.3.1 La pratique suivante est recommandée pour traiter les valeurs aberrantes:
a) les tests recommandés en 8.3.4 et en 8.3.5 sont appliqués afin d’identifier les valeurs isolées ou
aberrantes:
— si la statistique de test est inférieure ou égale à sa valeur critique à 5 %, l’individu soumis à essai
est accepté comme correct;
— si la statistique de test est supérieure à sa valeur critique à 5 % et inférieure ou égale à sa valeur
critique à 1 %, l’individu soumis à essai est appelé valeur isolée et est signalé par un astérisque;
— si la statistique de test est supérieure à sa valeur critique à 1 %, l’individu est appelé valeur
statistique aberrante et est signalé par un double astérisque;
b) iI est ensuite recherché si les valeurs isolées et/ou les valeurs statistiques aberrantes peuvent être
expliquées par des erreurs techniques, par exemple:
— une faute dans l’exécution de la mesure;
— une erreur de calcul;
— une simple erreur d’écriture lors de la transcription d’un résultat d’essai; ou
— l’analyse d’un mauvais échantillon.
Lorsque l’erreur est une erreur de calcul ou d’écriture, il convient de remplacer le résultat suspect
par la valeur correcte; lorsque l’erreur résulte de l’analyse d’un mauvais échantillon, il convient de
replacer le résultat dans sa cellule appropriée. Après avoir effectué ces corrections, il convient de
répéter l’examen des valeurs isolées ou aberrantes. Si la cause de l’erreur technique est telle qu’elle
rend impossible le remplacement du résultat d’essai suspect, il convient de l’écarter en le désignant
comme une valeur aberrante «authentique», qui n’appartient pas en propre à l’expérience.
c) lorsqu’il reste des valeurs isolées et/ou des valeurs statistiques aberrantes qui n’ont pas été
expliquées, ni rejetées comme appartenant à un laboratoire aberrant, les valeurs isolées sont
conservées comme correctes et les valeurs statistiques aberrantes sont écartées, à moins que le
statisticien ait de bonnes raisons pour les conserver;
d) lorsque les données d’une cellule ont été rejetées pour le Formulaire B de la Figure 2, conformément
à la procédure ci-dessus, alors les données correspondantes doivent être rejetées pour le
Formulaire C de la Figure 2, et vice versa.
8.3.3.2 Les tests donnés en 8.3.4 et en 8.3.5 sont de deux types. Le test de Cochran est un test sur les
variabilités intralaboratoires et il convient de l’appliquer en premier. Il convient ensuite de prendre les
actions nécessaires, en répétant les tests si nécessaire. L’autre test (test de Grubbs) est principalement
un test de variabilité interlaboratoires, et peut également être utilisé (si n > 2) lorsque le test de Cochran
a mis en évidence que la forte variation intralaboratoire est potentiellement attribuable à un seul des
résultats d’essai de la cellule.
8.3.4.1 Le présent document prend pour hypothèse qu’entre les différents laboratoires, seules de
petites différences existent au niveau des variances intralaboratoires. L’expérience montre cependant
que ce n’est pas toujours le cas. Un test est donc introduit pour vérifier la validité de cette hypothèse.
Plusieurs essais peuvent être utilisés dans ce but, mais c’est le test de Cochran qui a été choisi.
8.3.4.2 Soit un ensemble de p écarts-types si, tous calculés à partir du même nombre (n) de résultats
répétés. La statistique de test de Cochran, C, est donnée par la Formule (9):
smax
2
C= (9)
p
∑ si2
i =1
où smax désigne l’écart-type le plus élevé de l’ensemble.
a) Si la statistique de test est inférieure ou égale à sa valeur critique à 5 %, l’individu soumis à essai
est accepté comme correct.
b) Si la statistique de test est supérieure à sa valeur critique à 5 % et inférieure ou égale à sa valeur
critique à 1 %, l’individu soumis à essai est appelé valeur isolée et est signalé par un astérisque.
c) Si la statistique de test est supérieure à sa valeur critique à 1 %, l’individu est appelé valeur
statistique aberrante et est signalé par un double astérisque.
Les valeurs critiques pour le test de Cochran sont données dans le Tableau 5.
Le test de Cochran doit être appliqué au Formulaire C de la Figure 2, indépendamment à chaque niveau.
8.3.4.3 Le critère de Cochran ne s’applique strictement que lorsque tous les écarts-types sont calculés
à partir du même nombre (n) de résultats d’essai obtenus dans des conditions de mesure identiques (soit
les conditions de répétabilité, dans le présent document). Dans des cas concrets, ce nombre peut varier
en raison de données manquantes ou écartées. Le présent document prend cependant pour hypothèse
que dans une expérience correctement organisée, de telles variations dans le nombre de résultats d’essai
par cellule sont limitées et peuvent être ignorées, et que par conséquent le critère de Cochran s’applique
en utilisant pour n le nombre de résultats d’essai obtenus dans la majorité des cellules.
8.3.4.4 Le critère du test de Cochran ne soumet que la valeur la plus élevée d’un ensemble d’écarts-
types et constitue donc un test de valeur aberrante unilatéral. L’hétérogénéité de la variance peut
également se manifester dans certains écarts-types qui sont comparativement trop faibles. Cependant,
de faibles valeurs d’écart-type peuvent être fortement influencées par l’arrondi des données d’origine
et à ce titre elles ne sont pas très fiables. En outre, il ne semble pas raisonnable de rejeter les données
d’un laboratoire parce qu’il a obtenu une meilleure fidélité que les autres laboratoires dans ses résultats
d’essai. Le critère de Cochran est donc considéré adéquat.
8.3.4.5 Un examen critique du Formulaire C de la Figure 2 peut parfois révéler que les écarts-types
d’un laboratoire spécifique sont inférieurs à ceux des autres laboratoires, pour tous les niveaux ou pour
la plupart d’entre eux. Cela peut indiquer que ce laboratoire travaille avec un écart-type de répétabilité
inférieur aux autres laboratoires, ce qui, à son tour, peut résulter soit d’une meilleure technique ou d’un
meilleur équipement, soit d’une application modifiée ou incorrecte de la méthode de mesure normalisée.
En pareil cas, il convient de le signaler au panel d’experts et il convient que celui-ci décide si ce point
mérite de faire l’objet d’une recherche plus poussée. (Un exemple en est donné avec le laboratoire 2 dans
l’expérience détaillée en B.1).
8.3.4.6 Si l’écart-type le plus élevé est classé comme une valeur aberrante, il convient alors de
supprimer la valeur et de répéter le test de Cochran sur les valeurs restantes. Ce processus peut être
répété, mais il peut conduire à des rejets excessifs, comme c’est parfois le cas lorsque l’hypothèse sous-
jacente de normalité n’est pas suffisamment respectée. L’application répétée du test de Cochran est
proposée ici uniquement en tant qu’outil d’aide, en vue de combler l’absence d’un test statistique planifié
pour soumettre simultanément plusieurs valeurs aberrantes de variance. Le test de Cochran n’a pas
été conçu dans ce but, et il convient de prendre de grandes précautions pour en tirer des conclusions.
Lorsque deux ou trois laboratoires donnent des résultats ayant des écarts-types élevés, notamment si
cela se produit au sein d’un seul niveau, il convient d’examiner soigneusement les conclusions du test
de Cochran. D’un autre côté, si plusieurs valeurs isolées et/ou valeurs statistiques aberrantes sont
identifiées à différents niveaux d’un même laboratoire, cela peut être un indicateur fort que la variance
intralaboratoire du laboratoire est exceptionnellement forte, et il convient de rejeter toutes les données
de ce laboratoire.
Soit un ensemble de données x(1), x(2)…, x(p), constitué à partir de x1, x2…, xp rangées par ordre croissant.
Dès lors, pour déterminer si la plus grande observation est une valeur aberrante en utilisant le test de
Grubbs, calculer la statistique de test, Gp, en utilisant la Formule (10):
x( p ) − x
Gp = (10)
s
où:
p
∑
1
x= x (11)
p i =1 ( i )
et
p
∑( )
1 2
s= x −x (12)
p −1 i =1 ( i )
Pour vérifier la signification de la plus petite observation, calculer la statistique de test, G1, en utilisant
la Formule (13):
G1 =
( x − x(1 ) ) (13)
s
a) Si la statistique de test est inférieure ou égale à sa valeur critique à 5 %, l’individu soumis à essai
est accepté comme correct.
b) Si la statistique de test est supérieure à sa valeur critique à 5 % et inférieure ou égale à sa valeur
critique à 1 %, l’individu soumis à essai est appelé valeur isolée et est signalé par un astérisque.
c) Si la statistique de test est supérieure à sa valeur critique à 1 %, l’individu est appelé valeur
statistique aberrante et est signalé par un double astérisque.
Pour vérifier si les deux plus grandes observations peuvent être des valeurs aberrantes, calculer la
statistique de test, G, en utilisant la Formule (14):
s2p−1 ,p
G= (14)
s02
où:
p
∑ ( x( i ) − x )
2
s02 = (15)
i =1
et
p−2
∑ ( x( i ) − xp−1 ,p )
2
s2p−1 ,p = (16)
i =1
et
p−2
∑
1
x p−1 ,p = x (17)
p − 2 i =1 ( i )
Alternativement, pour vérifier les deux plus petites observations, calculer la statistique de test, G, en
utilisant la Formule (18):
s12,2
G= (18)
s02
où:
p−2
∑ ( x( i ) − x1 ,2 )
2
s12,2 = (19)
i =1
et
p
∑
1
x1 ,2 = x (20)
p − 2 i =3 ( i )
Lors de l’analyse d’une expérience de fidélité, le test de Grubbs peut être appliqué à ce qui suit.
a) Les moyennes par cellule (Formulaire B de la Figure 2) pour un niveau donné j, auquel cas:
xi = yij (21)
et
p = pj (22)
la plus élevée est une valeur aberrante, tenir compte alors de la plus faible en excluant la plus
élevée), mais ne pas appliquer le test double de Grubbs décrit en 8.3.5.2. Si le test simple de Grubbs
ne montre pas qu’une moyenne de cellule est une valeur aberrante, appliquer alors le test double de
Grubbs décrit en 8.3.5.2.
b) Un résultat unique à l’intérieur d’une cellule, dans laquelle le test de Cochran a montré que l’écart-
type de la cellule est suspect.
NOTE Conformément à 8.3.3.1, un individu est appelé valeur statistique aberrante si la statistique
de test est supérieure à sa valeur critique à 1 %. Si le test de Grubbs est d’abord appliqué à un groupe de
moyennes de cellule, une valeur critique issue du Tableau 6 est utilisée afin de vérifier la moyenne de cellule
la plus élevée, en appliquant un essai à 0,5 %, et de vérifier la moyenne de cellule la plus faible à 0,5 %. Ce
qui donne un essai de la moyenne de cellule la plus extrême à 1 %, conformément à 8.3.3.1. Si la moyenne de
cellule la plus extrême est identifiée comme étant une valeur statistique aberrante, le test de Grubbs est alors
appliqué à l’autre moyenne de cellule extrême. Il peut être opposé à ceci qu’il convient maintenant d’utiliser
un test unilatéral. Cependant, la procédure recommandée dans le présent document est de n’utiliser que les
valeurs critiques figurant dans le Tableau 6 (les valeurs critiques pour les essais bilatéraux au niveau de
signification de 1 %), afin d’assurer un traitement homogène de toutes les moyennes de cellule. Un argument
similaire peut être utilisé pour justifier l’utilisation de valeurs critiques bilatérales à 5 % dans le Tableau 6,
pour tous les tests relatifs à des valeurs statistiques isolées.
8.3.6.1 Il est souvent constaté qu’une seule application d’un test, par exemple le test de Grubbs, suivie
de l’élimination d’une valeur aberrante, conserve un plus petit ensemble de données qui semble, lors
du contrôle, contenir d’autres valeurs extrêmes relatives au reste de l’ensemble. Dans ces circonstances,
l’application d’autres tests pour identifier les données ou moyennes de laboratoire aberrantes est admise.
8.3.6.2 Il convient d’interrompre les tests et rejets répétés de valeurs aberrantes pour un niveau donné,
lorsque cela entraîne le rejet d’une proportion excessive de données pour ce niveau. Le panel d’experts
doit déterminer si la proportion de données rejetées est à considérer comme excessive.
NOTE 1 Il peut être utile de fixer une limite supérieure pour la proportion des données rejetées, préalablement
à l’analyse statistique.
NOTE 2 L’Union internationale de chimie pure et appliquée (UICPA)[15] recommande qu’il convient que la
proportion de données rejetées pour un niveau donné d’une étude ne dépasse pas les 2/9, cette fraction étant
considérée après élimination de tous les résultats considérés comme non valides sur un plan technique, avant le
contrôle des valeurs aberrantes.
Des méthodes alternatives de contrôle et des tests statistiques, autres que ceux énumérés de 8.3.3
à 8.3.5, peuvent être utilisés sous réserve que:
— le même ensemble de méthodes de contrôle et de tests statistiques des valeurs aberrantes soit
appliqué à tous les niveaux au sein d’une étude donnée;
— les méthodes retenues soient en mesure d’identifier les données individuelles aberrantes au sein
d’un laboratoire, les moyennes de laboratoire aberrantes et la dispersion aberrante d’un laboratoire;
— un quelconque biais dans les estimations de la variance, pour des données suivant une distribution
normale et découlant du rejet de valeurs aberrantes, ne soit pas supérieur à celui résultant de
l’application des paragraphes 8.3.3 à 8.3.5.
NOTE Toutes les procédures de rejet de valeurs aberrantes entraînent une part de biais négatif dans
les estimations de fidélité, à moins d’effectuer une correction explicite du biais engendré. Des procédures de
statistiques robustes, bien moins sensibles au biais dans les estimations de fidélité pour les données suivant une
distribution normale, sont décrites dans l’ISO 5725-5.
Les données de base nécessaires pour les calculs sont présentées dans les trois formulaires de la
Figure 2:
— le Formulaire A contient les résultats d’essai d’origine;
— le Formulaire B contient les moyennes de cellule;
— le Formulaire C contient les mesures de la dispersion intracellule.
Comme conséquence de la règle établie à l’alinéa d) de 8.3.3.1, le nombre de cellules non vides à utiliser
dans les calculs, pour un niveau spécifique, est généralement le même dans les Formulaires B et C. II
peut y avoir une exception si, à cause d’une donnée manquante, une cellule du Formulaire A contient
un seul résultat d’essai, ce qui va entraîner une cellule vide dans le Formulaire C mais pas dans le
Formulaire B. Dans ce cas, il est admis:
a) d’écarter le résultat d’essai solitaire, ce qui donne des cellules vides tant dans le Formulaire B que
dans le Formulaire C; ou
b) si cela est considéré comme une perte d’information indésirable, d’insérer un tiret (valeur
manquante) dans le Formulaire C.
Le nombre de cellules non vides peut varier selon les différents niveaux, d’où l’indice j dans pj.
p nij
∑ ∑ yijk
i =1 k =1
m̂ j = y j = (24)
p
∑ nij
i =1
8.4.5 Calcul des variances
Trois variances sont calculées pour chaque niveau: la variance de répétabilité, la variance
interlaboratoires et la variance de reproductibilité.
sdj
2 − s2
rj
sL2j = (26)
nj
où:
p
∑ ( )
1 2
sdj
2 = n y − yj
p −1 i =1 ij ij
p p
1
=
p −1 i =1
2
∑
nij yij − y 2
∑
nij
(27)
i =1
et
p
1
p nij2
∑
nj = nij − p
p −1 i =1
i =1
∑ (28)
nij ∑
i =1
Ces calculs sont illustrés par les exemples donnés en C.1 et C.3.
NOTE La deuxième forme de la Formule (27), qui suppose de calculer la différence entre deux valeurs
additionnées, est mathématiquement identique à la première, mais peut entraîner de graves erreurs
d’arrondissage si elle est utilisée dans le cadre de calculs informatiques. La première forme est bien moins sujette
aux erreurs d’arrondissage.
8.4.5.3 Pour le cas particulier où toutes les valeurs de nij = n = 2, les formes plus simples des
Formules (29) et (30) peuvent être utilisées:
p
∑( )
1 2
srj
2 = y −y (29)
2 p i =1 ij 1 ij 2
et
p srj
2
∑( )
1 2
sL2j = y − yj − (30)
p −1 i =1 ij 2
Ces calculs sont illustrés par l’exemple donné en C.2.
8.4.5.4 Lorsque, en raison d’effets aléatoires, une valeur négative pour sL2j est obtenue à partir de ces
calculs, il convient de prendre pour hypothèse une valeur de zéro.
sRj
2 = s2 + s2
rj Lj (31)
8.4.6.1 Dans les cas où tous les laboratoires présentent le même nombre de répétitions (après l’examen
des résultats pour les valeurs aberrantes et les quelconques éliminations de données individuelles qui
s’ensuivent), les calculs de variance ci-dessus peuvent être remplacés par l’analyse de la variance, telle
qu’elle est décrite à l’Annexe B.
8.4.6.2 Le processus de calcul en 8.4.4 à 8.4.5 peut être remplacé par l’estimation du maximum de
vraisemblance restreint (REML),[13],[14] fournie par un logiciel approprié. Un logiciel qui reproduit les
estimations de la variance par REML, telles qu’elles sont données dans les exemples de l’Annexe B, avec
trois chiffres significatifs ou davantage, peut être utilisé.
NOTE 1 Une procédure pour l’estimation REML des composantes de la variance est donnée à l’Annexe B.
NOTE 2 Il peut exister de légères différences entre les résultats de l’estimation REML et les calculs fournis
dans les autres paragraphes de la présente partie. Ces différences sont généralement sans conséquence.
8.4.6.3 Lorsqu’une méthode alternative pour le calcul de la variance est choisie, la même méthode de
calcul doit être appliquée à tous les niveaux de l’expérience de fidélité.
Après avoir calculé la fidélité pour chaque niveau m, il convient de vérifier si la fidélité dépend de m, et
si oui, il convient de déterminer la relation fonctionnelle. Cette opération est décrite en 8.5.
8.5.1.1 Il ne peut pas toujours être garanti qu’il existe une relation fonctionnelle régulière entre la
fidélité et m. En particulier lorsque l’hétérogénéité du matériau forme une partie indissociable de la
variabilité des résultats d’essai, il n’existe de relation fonctionnelle que si cette hétérogénéité est une
fonction régulière du niveau m. Avec des matériaux solides de compositions différentes et provenant de
différents processus de production, une relation fonctionnelle régulière n’est en aucun cas certaine. II
convient de considérer ce point, en se basant sur les connaissances relatives aux matériaux et la méthode
de mesure, avant que la procédure suivante ne soit appliquée.
8.5.1.2 Lorsqu’aucune relation fonctionnelle ne peut être établie, des valeurs de fidélité indépendantes
peuvent être consignées pour chaque matériau étudié. Lorsque les différentes valeurs de fidélité sont
similaires entre les différents niveaux, une valeur moyenne de fidélité peut être déclarée.
8.5.1.3 Le raisonnement et les procédures de calcul présentés en 8.5.2 à 8.5.4 s’appliquent à la fois à
l’écart-type de répétabilité et à l’écart-type de reproductibilité, mais par souci de concision, ils ne sont
présentés ici que pour la répétabilité. Seuls quatre types de relations sont pris en considération:
Il peut être attendu que dans la majorité des cas, au moins une de ces formules donne un ajustement
correct. Dans le cas contraire, il convient que l’expert statisticien effectuant l’analyse trouve une
solution alternative. Pour éviter toute confusion, les constantes a, b, c, C et d intervenant dans ces
formules peuvent être distinguées par des indices, par exemple ar, br... pour la répétabilité et aR, bR ...
pour la reproductibilité, mais cela n’a pas été fait dans le présent paragraphe, afin ici aussi de simplifier
les notations. sr a également été simplifié en s pour permettre l’apposition d’un suffixe pour le niveau j.
8.5.1.4 En général, d > 0, de sorte que les relations I et IV conduisent à s = 0 pour m = 0, ce qui peut
sembler inacceptable d’un point de vue expérimental. Cependant, lors de la consignation des données
de fidélité, il convient de clarifier que celles-ci ne s’appliquent qu’à l’intérieur des niveaux couverts par
l’expérience de fidélité interlaboratoires.
8.5.1.5 Pour a = 0 (ou av = 0) et d = 1, l’ensemble des quatre relations sont algébriquement identiques
(elles peuvent toutes être réduites à la relation I), de sorte que lorsque a est proche de zéro et/ou d est
proche de l’unité, trois ou l’ensemble de ces quatre relations donnent dans la pratique des ajustements
équivalents. Il convient en pareil cas de privilégier la relation I, car elle permet la déclaration simple
suivante:
«Deux résultats d’essai sont considérés comme suspects lorsqu’ils diffèrent de plus de (100 b) %.»
En terminologie statistique, cette déclaration correspond à spécifier que le coefficient de variation
(100 s/m) est une constante pour tous les niveaux.
8.5.2.1 D’un point de vue statistique, l’ajustement à une ligne droite est compliqué par le fait qu’à la
fois m̂ j et sj sont des estimations, et à ce titre sujettes à erreur. Mais comme la pente b est généralement
petite (de l’ordre de 0,1 ou moins), les erreurs dans m̂ ont alors une faible influence et les erreurs
prédominent dans l’estimation de s.
8.5.2.2 Une bonne estimation des paramètres de la droite de régression nécessite une régression
pondérée, car l’erreur type de s est proportionnelle à la valeur prédite de sj ( ŝ j ). Les facteurs de
T1 = ∑W j (32)
j
T2 = ∑ W j mˆ j (33)
j
T3 = ∑ W j mˆ 2j (34)
j
T4 = ∑W j s j (35)
j
T5 = ∑ W j mˆ j s j (36)
j
Pour la relation I (s = bm), la valeur de b est alors donnée par T5/T3.
Pour la relation II (s = a + bm):
T3T4 −T2T5
a= (37)
T1T3 −T22
et
T1T5 −T2T4
b= (38)
T1T3 −T22
8.5.2.4 Pour la relation I, la simplification algébrique des facteurs de pondération W j = 1 / ˆs2j avec
ˆs2 = bm
ˆ conduit à l’expression simplifiée suivante:
j j
∑ (sj m
ˆ
j )
j
b= (39)
q
et aucune itération n’est nécessaire.
8.5.2.5 Pour la relation II, les valeurs initiales ŝ0 j correspondent aux valeurs d’origine de s obtenues
par les procédures données en 8.4. Celles-ci sont utilisées pour calculer:
( )
2
W0 j = 1 s0 j ( j = 1 , 2 ,..., q ) (40)
ˆs = a + b m
ˆ (41)
1j 1 1 j
ˆs = a + b m
ˆ (42)
2j 2 2 j
La même procédure peut, une fois encore, être répétée avec les facteurs de pondération W2 j = 1 ˆs22 j
calculés à partir de ces formules, mais ceci ne conduit qu’à des modifications sans importance. Le
passage de W0j à W1j est efficace pour l’élimination d’erreurs grossières dans les pondérations et il
convient de considérer les formules pour ŝ2 j comme un résultat final.
EXEMPLE 1 Un exemple d’application de la relation d’ajustement I aux données de répétabilité est donné dans
le Tableau 1. Les données proviennent de l’étude de cas donnée en C.3 et ne sont utilisées ici que pour illustrer la
procédure numérique. Les relations sont abordées plus en détail en C.3.
EXEMPLE 2 Un exemple d’application de la relation d’ajustement II aux données de répétabilité est fourni dans
le Tableau 2. Les données mj, sj sont les mêmes que pour le Tableau 1.
8.5.3.1 Pour la relation III, l’approche la plus simple consiste à ajuster les variances observées s2j
comme étant fonction des moyennes des carrés, ce qui donne une relation linéaire dans laquelle
l’ordonnée à l’origine av2 correspond à la variance à la moyenne zéro, et la pente bv2 peut être considérée
comme étant le carré de l’écart-type relatif à mesure que m augmente. Cependant, comme pour la
relation II, si une régression linéaire simple peut fournir une estimation exploitable, une bonne
estimation exige une régression pondérée, et comme pour la relation II, les pondérations optimales
dépendent des valeurs ajustées.
8.5.3.2 Une procédure approximative pour la relation d’ajustement III, similaire à celle donnée en 8.5.2,
se présente comme suit:
Tv 1 = ∑Wvj (43)
j
Tv 2 = ∑ Wvj mˆ 2j (44)
j
Tv 3 = ∑ Wvj mˆ 4j (45)
j
iii) les valeurs initiales a12v et b12v sont ensuite utilisées pour prédire les valeurs ajustées de sj selon la
formule suivante:
ˆs2 = a2 + b2 m
ˆ2 (50)
1j 1v 1v j
iv) les calculs i) à iii) sont ensuite répétés une fois avec W1vj = 1 / ˆs14 j , afin d’obtenir la relation:
ˆs2 = a2 + b2 m
ˆ2 (51)
2j 2v 2v j
Il convient de considérer les formules obtenues pour ŝ2 j comme le résultat final.
NOTE Les pondérations Wvj s’appuient sur le principe selon lequel, pour des données suivant une distribution
normale, la distribution de la variance des échantillons est une distribution du khi carré, dont la variance est
proportionnelle à σ4.
EXEMPLE Un exemple d’application de la relation d’ajustement III aux données de répétabilité est fourni dans
le Tableau 3. Les données mj, sj sont les mêmes que pour le Tableau 1, et proviennent de l’exemple donné en C.3.
8.5.4.1 L’erreur type de lg s est indépendante de s; une régression non pondérée de lg s sur lg m̂ est
donc appropriée.
8.5.4.2 Pour la relation IV, les formules de calcul sont les suivantes:
T1 = ∑ lg mˆ j (52)
j
∑ ( lg mˆ j )
2
T2 = (53)
j
T3 = ∑ lg s j (54)
j
T4 = ∑ ( lg mˆ j ) ( lg s j ) (55)
j
et donc:
T2T3 −T1T4
c= (56)
qT2 −T12
et
qT4 −T1T3
d= (57)
qT2 −T12
EXEMPLE Un exemple d’application de la relation d’ajustement IV aux données de répétabilité est fourni dans
le Tableau 4. Les données mj, sj sont les mêmes que pour le Tableau 1, et proviennent de l’exemple donné en C.3.
Tableau 1 — Relation I, s = bm
∑ (sj m
ˆ
j ) 0 , 094 8
= 0 , 019
k 5
b=
q
s = bm 0,075 0,157 0,269 0,296 0,388
W1j 116 57 29 26 17
s2 = 0,030 + 0,015 4 m
ŝ2 j 0,092 0,159 0,251 0,273 0,348
W2j 118 40 16 13 8
s3 = 0,032 + 0,015 4 ma
ŝ3 j 0,093 0,160 0,251 0,273 0,348
NOTE Les valeurs des facteurs de pondération ne sont pas critiques. Deux chiffres significatifs sont suffisants.
a La différence avec s2 est négligeable.
lg s = −1,506 5 + 0,772 lg m
ou s = 0,031 m0,772
s 0,089 0,158 0,239 0,257 0,316
8.6.1 Collecter tous les résultats d’essai disponibles dans un même Formulaire A de la Figure 2
(voir 8.2). Il est recommandé que ce formulaire soit présenté avec p lignes, dotées d’indices i = 1, 2..., p
(représentant les p laboratoires ayant fourni des données), et de q colonnes, dotées d’indices j = 1, 2..., q
(représentant les q niveaux dans un ordre croissant).
Dans une expérience à niveau uniforme, il n’est pas nécessaire de distinguer les résultats d’essai au sein
d’une cellule du Formulaire A; ils peuvent être inscrits dans un ordre quelconque.
8.6.2 Examiner le Formulaire A pour déceler des irrégularités évidentes, rechercher, et écarter si
nécessaire, ces données manifestement erronées (par exemple des données en dehors de la plage de
l’instrument de mesure ou des données impossibles à obtenir pour des raisons techniques), et en faire
rapport au panel d’experts. II est parfois évident que les résultats d’essai d’un laboratoire spécifique ou
d’une cellule spécifique se trouvent à un niveau non cohérent avec les autres données. De telles données
manifestement discordantes doivent être écartées immédiatement, mais ce fait doit en être rapporté au
panel d’experts pour examen ultérieur (voir 8.7.1).
8.6.3 À partir du Formulaire A, corrigé conformément à 8.6.2 si nécessaire, calculer le Formulaire B, qui
contient les moyennes de cellule, et le Formulaire C, qui contient les mesures de dispersion intracellule.
Lorsqu’une cellule du Formulaire A ne contient qu’un seul résultat d’essai, il convient de choisir l’une
des options en 8.4.3.
8.6.4 Préparer les graphiques h et k de Mandel, comme décrit en 8.3.1, et les examiner pour la cohérence
des données. Ces graphiques peuvent indiquer la pertinence des données pour la suite des analyses, la
présence d’une valeur aberrante potentielle ou d’un laboratoire aberrant potentiel. Cependant, aucune
décision définitive n’est prise à ce stade; la décision est repoussée jusqu’à ce que les paragraphes 8.6.5
à 8.6.9 soient traités.
8.6.5 Contrôler les Formulaires B et C (voir Figure 2) niveau par niveau, pour y détecter les valeurs
isolées et/ou valeurs statistiques aberrantes potentielles [voir 8.3.3.1, alinéa a)]. Appliquer les tests
statistiques donnés en 8.3 à tous les individus suspects, en signalant les valeurs isolées par un simple
astérisque et les valeurs statistiques aberrantes par un double astérisque. S’il n’y a ni valeur isolée, ni
valeur statistique aberrante, ignorer les paragraphes 8.6.6 à 8.6.10 et passer directement à 8.6.11.
8.6.6 Rechercher s’il existe ou s’il peut y avoir une explication technique à la présence de valeurs isolées
et/ou de valeurs statistiques aberrantes, et vérifier si possible ces explications. Corriger ou éliminer,
suivant le cas, les valeurs isolées et/ou les valeurs statistiques aberrantes pour lesquelles une explication
satisfaisante a été trouvée, et effectuer les corrections correspondantes dans les formulaires. S’il ne reste
plus de valeur isolée ni de valeur statistique aberrante non expliquée, ignorer les paragraphes 8.6.7
à 8.6.10 et passer directement à 8.6.11.
Un grand nombre de valeurs isolées et/ou de valeurs statistiques aberrantes peut indiquer une forte
hétérogénéité des variances ou de fortes différences entre les laboratoires, ce qui peut jeter un doute
sur l’adéquation de la méthode de mesure. Il convient de le rapporter au panel d’experts.
8.6.7 Si la distribution des valeurs isolées et/ou des valeurs statistiques aberrantes non expliquées
dans le Formulaire B ou le Formulaire C ne suggère aucun laboratoire aberrant (voir 8.2.5), ignorer le
paragraphe 8.6.8 et passer directement à 8.6.9.
8.6.8 S’il existe une raison suffisamment forte de suspecter certains laboratoires comme étant
aberrants, justifiant le rejet de certaines ou de toutes les données de ces laboratoires, éliminer alors
les données en question et le rapporter au panel d’experts. La décision de rejeter certaines ou toutes
les données d’un laboratoire spécifique relève de la responsabilité de l’expert statisticien effectuant
l’analyse, mais cela doit faire l’objet d’un rapport au panel d’experts, pour examen ultérieur (voir 8.7.1).
8.6.9 S’il subsiste des valeurs isolées et/ou des valeurs statistiques aberrantes qui ne sont ni expliquées
ni attribuées à un laboratoire aberrant, éliminer les valeurs statistiques aberrantes, mais conserver les
valeurs isolées.
8.6.10 Si, dans les étapes précédentes, une donnée du Formulaire B a été rejetée, alors la donnée
correspondante du Formulaire C doit également être rejetée, et vice versa.
8.6.11 À partir des données retenues comme correctes dans les Formulaires B et C, calculer,
conformément aux procédures données en 8.4, indépendamment pour chaque niveau, le niveau moyen
m̂ j ainsi que l’écart-type de répétabilité et l’écart-type de reproductibilité.
8.6.12 Si un seul niveau a été utilisé pour l’expérience, ou s’il a été décidé qu’il convient de donner
indépendamment pour chaque niveau (voir 8.5.1) les écarts-types de répétabilité et de reproductibilité,
et non pas comme étant fonction du niveau, ignorer le paragraphe 8.6.13 et passer directement à 8.6.14.
6) Si aucune relation satisfaisante n’a été établie à l’étape 3) ou 4), il convient que l’expert statisticien
détermine si une quelconque autre relation peut être établie entre s et m, ou alternativement, si les
données sont à ce point irrégulières que l’établissement d’une relation fonctionnelle est considéré
comme étant impossible. Lorsque les données sont trop irrégulières pour fournir une relation
fonctionnelle, des valeurs de fidélité peuvent être consignées indépendamment pour chaque niveau.
8.6.14 Préparer un rapport présentant les données de base ainsi que les résultats et conclusions de
l’analyse statistique, et le soumettre au panel d’experts. La technique graphique décrite en 8.3.2 peut être
utile pour présenter la cohérence ou la variabilité des résultats.
8.7 Rapport destiné au panel d’experts et décisions à prendre par le panel d’experts
Une fois l’analyse statistique achevée, il convient que l’expert statisticien rédige un rapport qui sera
soumis au panel d’experts. Il convient de fournir les informations suivantes dans ce rapport:
a) une liste complète des observations reçues des opérateurs et/ou des superviseurs, concernant la
méthode de mesure normalisée;
b) une liste complète des laboratoires qui ont été rejetés car définis comme des laboratoires aberrants
lors des étapes 8.6.2 et 8.6.8, avec les raisons justifiant leur rejet;
c) une liste complète des valeurs isolées et/ou valeurs statistiques aberrantes qui ont été identifiées,
en mentionnant si celles-ci ont été expliquées et corrigées, ou bien rejetées;
d) un formulaire des résultats finaux m̂ j , sr et sR , et une liste des conclusions obtenues à l’étape 8.6.13,
illustrées par l’un des graphiques recommandés pour cette étape;
e) les Formulaires A, B et C (Figure 2) utilisés dans l’analyse statistique, éventuellement sous forme
d’annexe.
Il convient que le panel d’experts discute alors du rapport et prenne des décisions concernant les
questions suivantes:
a) Les résultats discordants, les valeurs isolées ou les valeurs aberrantes, le cas échéant, sont-ils dus à
une mauvaise description de la méthode de mesure normalisée?
b) Quelles actions convient-il de prendre vis-à-vis des laboratoires aberrants rejetés?
c) Les résultats des laboratoires aberrants et/ou les remarques provenant des opérateurs et des
superviseurs indiquent-ils la nécessité d’améliorer la méthode de mesure normalisée? Si oui, quelles
sont les améliorations nécessaires?
d) Les résultats de l’expérience de fidélité justifient-ils l’établissement de valeurs d’écarts-types pour
la répétabilité et la reproductibilité? Si oui, quelles sont ces valeurs, sous quelle forme convient-il de
les publier et dans quel domaine les données relatives à la fidélité s’appliquent-elles?
II convient qu’un rapport donnant les raisons des travaux et leur mode d’organisation, comprenant le
rapport de l’expert statisticien et énonçant les conclusions obtenues, soit préparé par le responsable
exécutif pour approbation par le panel d’experts. Des représentations graphiques de la cohérence ou
de la variabilité sont souvent utiles. Il convient que ce rapport soit diffusé aux personnes chargées
d’autoriser les travaux et aux autres parties intéressées.
9 Tables statistiques
9.1 Les valeurs critiques pour le test de Cochran (voir 8.3.4) sont données dans le Tableau 5.
9.2 Les valeurs critiques pour le test de Grubbs (voir 8.3.5) sont données dans le Tableau 6.
Pour le test simple de Grubbs (une observation aberrante), les valeurs aberrantes et les valeurs
isolées entraînent des valeurs qui sont plus grandes que les valeurs critiques tabulées à 1 % et à 5 %,
respectivement.
Pour le test double de Grubbs (deux observations aberrantes), les valeurs aberrantes et les valeurs
isolées entraînent des valeurs qui sont plus petites que les valeurs critiques tabulées à 1 % et à 5 %,
respectivement.
9.3 Les indicateurs pour les statistiques h et k de Mandel (voir 8.3.2) sont donnés dans le Tableau 7 et
le Tableau 8.
Tableau 5 (suite)
p n=2 n=3 n=4 n=5 n=6
1% 5% 1% 5% 1% 5% 1% 5% 1% 5%
21 0,465 0,377 0,318 0,261 0,255 0,212 0,220 0,185 0,197 0,167
22 0,450 0,365 0,307 0,252 0,246 0,204 0,212 0,178 0,189 0,160
23 0,437 0,354 0,297 0,243 0,238 0,197 0,204 0,172 0,182 0,155
24 0,425 0,343 0,287 0,235 0,230 0,191 0,197 0,166 0,176 0,149
25 0,413 0,334 0,278 0,228 0,222 0,185 0,190 0,160 0,170 0,144
26 0,402 0,325 0,270 0,221 0,215 0,179 0,184 0,155 0,164 0,140
27 0,391 0,316 0,262 0,215 0,209 0,173 0,179 0,150 0,159 0,135
28 0,382 0,308 0,255 0,209 0,202 0,168 0,173 0,146 0,154 0,131
29 0,372 0,300 0,248 0,203 0,196 0,164 0,168 0,142 0,150 0,127
30 0,363 0,293 0,241 0,198 0,191 0,159 0,164 0,138 0,145 0,124
31 0,355 0,286 0,235 0,193 0,186 0,155 0,159 0,134 0,141 0,120
32 0,347 0,280 0,229 0,188 0,181 0,151 0,155 0,131 0,138 0,117
33 0,339 0,273 0,224 0,184 0,177 0,147 0,151 0,127 0,134 0,114
34 0,332 0,267 0,218 0,179 0,172 0,144 0,147 0,124 0,131 0,111
35 0,325 0,262 0,213 0,175 0,168 0,140 0,144 0,121 0,127 0,108
36 0,318 0,256 0,208 0,172 0,165 0,137 0,140 0,118 0,124 0,106
37 0,312 0,251 0,204 0,168 0,161 0,134 0,137 0,116 0,121 0,103
38 0,306 0,246 0,200 0,164 0,157 0,131 0,134 0,113 0,119 0,101
39 0,300 0,242 0,196 0,161 0,154 0,129 0,131 0,111 0,116 0,099
40 0,294 0,237 0,192 0,158 0,151 0,126 0,128 0,108 0,114 0,097
p = nombre de laboratoires à un niveau donné.
n = nombre de résultats d’essai par cellule (voir 8.3.4.3).
NOTE L’Annexe D, basée sur la Référence [16], fournit une méthode de calcul de ces valeurs critiques, par voie logicielle.
Tableau 6 (suite)
p Une observation aberrante, Deux observations aberrantes,
la plus grande ou la plus petite les plus grandes ou les plus petites
Valeur supérieure à la Valeur supérieure à la Valeur inférieure à la Valeur inférieure à la
valeur critique à 1 % valeur critique à 5 % valeur critique à 1 % valeur critique à 5 %
10 2,482 2,290 0,115 0 0,186 4
11 2,564 2,355 0,144 8 0,221 3
12 2,636 2,412 0,173 8 0,253 7
13 2,699 2,462 0,201 6 0,283 6
14 2,755 2,507 0,228 0 0,311 2
15 2,806 2,549 0,253 0 0,336 7
16 2,852 2,585 0,276 7 0,360 3
17 2,894 2,620 0,299 0 0,382 2
18 2,932 2,651 0,320 0 0,402 5
19 2,968 2,681 0,339 8 0,421 4
20 3,001 2,709 0,358 5 0,439 1
21 3,031 2,733 0,376 1 0,455 6
22 3,060 2,758 0,392 7 0,471 1
23 3,087 2,781 0,408 5 0,485 7
24 3,112 2,802 0,423 4 0,499 4
25 3,135 2,822 0,437 6 0,512 3
26 3,157 2,841 0,451 0 0,524 5
27 3,178 2,859 0,463 8 0,536 0
28 3,199 2,876 0,475 9 0,547 0
29 3,218 2,893 0,487 5 0,557 4
30 3,236 2,908 0,498 5 0,567 2
31 3,253 2,924 0,509 1 0,576 6
32 3,270 2,938 0,519 2 0,585 6
33 3,286 2,952 0,528 8 0,594 1
34 3,301 2,965 0,538 1 0,602 3
35 3,316 2,979 0,546 9 0,610 1
36 3,330 2,991 0,555 4 0,617 5
37 3,343 3,003 0,563 6 0,624 7
38 3,356 3,014 0,571 4 0,631 6
39 3,369 3,025 0,578 9 0,638 2
40 3,381 3,036 0,586 2 0,644 5
Table reproduite avec l’autorisation de l’American Statistical Association, à partir de la Référence [4].
p = nombre de laboratoires à un niveau donné.
NOTE 1 Les valeurs critiques données dans cette table sont appropriées lorsque des essais bilatéraux sont exigés. Il
s’agit des valeurs critiques exigées par la procédure pour l’application des essais de valeurs aberrantes du test de Grubbs,
décrits en 8.3.5 du présent document. Elles ont été calculées à partir des valeurs critiques relatives aux essais unilatéraux
correspondants, tels qu’ils sont donnés dans la Référence [5].
NOTE 2 L’Annexe D, basée sur la Référence [16], fournit une méthode de calcul de ces valeurs critiques, par voie logicielle,
à partir d’autres distributions bien connues.
Annexe A
(informative)
A.1 Les différentes grandeurs représentées par le symbole σ dans les différentes formules du corps du
présent document sont des écarts-types vrais, dont les valeurs ne sont pas connues, l’une des finalités
d’une expérience de fidélité étant de les estimer. Si une estimation (s) d’un écart-type vrai (σ) est à
réaliser, des conclusions peuvent être tirées quant à la plage autour de σ au sein de laquelle il peut être
attendu que l’estimation (s) se situe. Il s’agit d’un problème statistique bien connu, dont la résolution
passe par l’utilisation de la distribution du khi carré et du nombre de résultats sur lequel l’estimation s
est basée. Voici l’une des formules fréquemment utilisées:
s −σ
P − A < < + A = P (A.1)
σ
A est souvent exprimé en pourcentage, ce qui permet de spécifier qu’il peut être attendu que les écarts-
types estimés (s) se situent au sein de A, de part et d’autre de l’écart-type vrai (σ) et avec une certaine
probabilité P.
A.2 Pour un seul niveau de l’essai, l’incertitude de l’écart-type de répétabilité dépend du nombre de
laboratoires (p) et du nombre de résultats d’essai au sein de chaque laboratoire (n). Concernant l’écart-
type de reproductibilité, la procédure est plus complexe, en ce sens qu’il est déterminé à partir de deux
écarts-types [voir Formule (A.1)]. Un facteur supplémentaire γ est nécessaire, qui représente le rapport
de l’écart-type de reproductibilité sur l’écart-type de répétabilité [voir Formule (A.2)], à savoir:
γ =σ R σ r (A.2)
Pour la répétabilité:
1
A = Ar = 1 , 96 (A.3)
2 p ( n −1)
Pour la reproductibilité:
2
p 1 + n( γ 2 −1 ) +( n −1 )( p −1 )
A = AR = 1 , 96 (A.4)
2γ 4 n2 ( p −1 )p
NOTE Il peut être pris pour hypothèse qu’une variance d’échantillon comportant v degrés de liberté et un σ2
attendu peut présenter approximativement une distribution normale avec la variance 2σ 4 ν . Les Formules (A.3)
et (A.4) ont été dérivées de cette hypothèse concernant les variances impliquées dans l’estimation de σr et σR .
L’adéquation de l’approximation a été vérifiée par un calcul exact.
A.4 La valeur de γ n’est pas connue, mais souvent, des estimations préliminaires sont disponibles pour
les écarts-types intralaboratoires et interlaboratoires obtenus lors de la normalisation de la méthode de
mesure. Les valeurs d’incertitude (telles qu’une fraction décimale) pour les écarts-types de répétabilité
et de reproductibilité, avec un nombre de laboratoires différent (p) et un nombre différent de résultats
par laboratoire (n), sont données dans le Tableau A.1 et sont également représentées sous forme de
graphique, où elles sont exprimées en pourcentage, à la Figure A.1 pour l’écart-type de répétabilité et à la
Figure A.2 pour l’écart-type de reproductibilité.
Légende
X p
Y Ar (%)
Figure A.1 — Grandeur dont sr peut différer de la valeur vraie, pour un niveau de probabilité
de 95 %
Légende
X p
Y AR (%)
Figure A.2 — Grandeur dont sR peut différer de la valeur vraie, pour un niveau de
probabilité de 95 %
Annexe B
(informative)
B.1.1 Les logiciels d’analyse de la variance (ANOVA, ANalysis Of VAriance) sont largement disponibles
pour le cas «à un facteur» exigé par l’ISO 5725-2. L’application de l’ANOVA aux données d’un seul niveau j
d’une étude interlaboratoires génère classiquement un tableau reprenant la disposition représentée
dans le Tableau B.1. Les composantes pertinentes de la variance, srj 2 et s2 , peuvent être déterminées à
Lj
partir des carrés moyens de la table.
B.1.3 La variance interlaboratoires, pour une expérience équilibrée dans laquelle toutes les cellules
contiennent n valeurs consignées, est calculée en appliquant la Formule (B.2):
Mb − Mw
sL2j = (B.2)
n
B.2.1 L’approche du maximum de vraisemblance restreint (REML) est une forme spécifique
d’estimation du maximum de vraisemblance, qui ne base pas les estimations sur un ajustement du
maximum de vraisemblance selon l’ensemble des informations, mais qui utilise plutôt une fonction de
vraisemblance, calculée à partir des données transformées n’incluant pas les paramètres associés aux
effets fixes. Une procédure appropriée au présent document est décrite ci-après.
dans laquelle XT est la transposée de X et est créée en se basant sur la matrice X. Pour la disposition
simple à un facteur utilisée à chaque niveau j de l’expérience dans l’ISO 5725-2, X est un vecteur de
p ni
longueur n j = ∑ ∑ nijk et tous les éléments sont égaux à 1. Cela correspond à la matrice pour un modèle
i =1 k =1
à effets fixes, pour une seule valeur moyenne. M est alors une matrice carrée de dimensions nj par nj, de
sorte que tous les éléments de la diagonale soient égaux à 1 −1 n j et tous les éléments hors diagonale
soient égaux à −1 n j .
B.2.3 La dernière ligne de M est supprimée afin d’obtenir une matrice modifiée Mm. Après une
prémultiplication par Mm du vecteur des résultats Y, le seul effet fixe est efficacement retiré du modèle.
Par conséquent, l’estimation porte seulement sur les paramètres à effets aléatoires.
B.2.4 L’approche REML estime les composantes de la variance θ = (sL, sr) en maximisant le log-
vraisemblance du vecteur de mesure MmY redéfini, dont la distribution est par hypothèse normale, avec
une moyenne de 0 et une matrice de covariance V(θ). V(θ) est construite de sorte que:
— tous les éléments de la diagonale sont fixés à sL2 + sr2 (en utilisant leurs estimations actuelles dans un
schéma itératif);
— tous les éléments hors diagonale pour les observations issues d’un même laboratoire sont fixés à sL2 ;
— tous les autres éléments hors diagonale sont fixés à zéro.
Le log-vraisemblance L(θ) de MmY pour un paramètre θ donné peut alors être calculée comme suit:
T − 1 Y T MT M V ( θ ) MT −1 M Y
L ( θ ) = − ln det ( Mm V ( θ ) Mm
1
2
) 2 m ( m m) m (B.4)
B.2.5 Les composantes de la variance sont déterminées en maximisant L(θ) de manière itérative,
en fonction de θ. Les valeurs de début pour θ peuvent être par exemple zéro, ou bien (pour fournir
aux algorithmes de recherche une limite supérieure simple) deux fois l’écart-type des données. Dans
les exemples de la présente annexe, les mises en œuvre qui appliquent les estimations REML des
composantes de la variance avec trois chiffres significatifs ou plus, sont généralement suffisantes.
NOTE 1 Il peut être utile d’effectuer une itération sur les valeurs de L(θ) pour s’assurer que les estimations des
écarts-types restent strictement positives.
NOTE 2 L’estimation REML est déjà disponible dans les packages de logiciels d’analyse statistique les plus
génériques, y compris certains packages open source diffusés gratuitement.
B.2.6 L’estimation REML de l’écart-type de reproductibilité est ensuite calculée à partir des estimations
REML de sL et de sr en utilisant la Formule (31).
B.2.7 L’estimation correspondante de la moyenne xREML peut être estimée en utilisant les estimations
REML de s, et de sr, à partir des Formules (B.5) et (B.6):
p
∑ xi wi
xREML = i =1 (B.5)
p
∑ wi
i =1
où:
1
wi = (B.6)
sL2 + sr2 ni
B.2.8 Une erreur type s ( xREML ) pour la moyenne xREML peut si nécessaire être obtenue à partir de la
Formule (B.7):
p
s ( xREML ) = 1 ∑ wi (B.7)
i =1
Annexe C
(informative)
Détermination de la teneur en soufre du charbon avec les résultats d’essai exprimés en pourcentage
massique.
C.1.1.2 Source
C.1.1.3 Description
Huit laboratoires ont participé à l’expérience et ont effectué l’analyse selon une méthode de mesure
normalisée décrite dans la source citée. Le laboratoire 1 a donné quatre résultats d’essai et le
laboratoire 5, quatre ou cinq; les autres laboratoires ont tous effectué trois mesures.
Il convient de tracer les graphiques h et k de Mandel, mais comme dans cet exemple ils ne fournissent
que peu d’informations, cela n’a pas été fait, afin de laisser de la place pour un exemple différent de
représentation graphique de données. Les graphiques de Mandel sont représentés et commentés de
façon exhaustive dans l’exemple donné en C.3.
Pour le niveau 2, la plus grande valeur de s est associée au laboratoire 5 (variance 0,001 849):
Pour le niveau 3, la plus grande valeur de s est associée au laboratoire 5 (variance 0,001 024):
Pour le niveau 4, la plus grande valeur de s est associée au laboratoire 4 (variance 0,001 444):
Cela veut dire qu’une cellule au niveau 3 peut être considérée comme une valeur isolée et qu’il n’y a pas
de valeurs aberrantes. La valeur isolée est conservée pour les calculs ultérieurs.
Légende
X fraction massique, %
Légende
X fraction massique, %
Légende
X fraction massique, %
Légende
X fraction massique, %
Les tests de Grubbs (test simple et test double, décrits respectivement en 8.3.5.1 et en 8.3.5.2) sont
appliqués aux moyennes de cellule, donnant les valeurs représentées dans le Tableau C.4. Ce tableau
inclut les statistiques de test de Grubbs pour les moyennes les plus faibles et les plus élevées, ou,
pour le test double, les paires de moyennes les plus faibles/les plus élevées. Il n’y a ni valeurs isolées,
ni valeurs aberrantes. Aux niveaux 2 et 4, les résultats élevés des laboratoires 3 et 6 apparaissent
isolés, selon le test double avec les valeurs les plus élevées: ceux-ci sont conservés pour l’analyse. Voici
quelques exemples de calcul pour le test simple et le test double de valeurs aberrantes, pour le niveau 2
uniquement et en utilisant les moyennes de cellule du Tableau C.2.
Pour le test simple de Grubbs (voir 8.3.5.1):
p
∑
1 1
x= xi = ×10 , 036 = 1 , 255 (C.5)
p i =1 8
p
∑
1
s= ( xi − x )2 = 0,057 (C.6)
p −1 i =1
Pour la valeur la plus élevée (1,373):
( x1 − x ) (1 , 373 −1 , 255)
G1 = = = 2 , 07 (C.7)
s 0 , 057
Pour la valeur la plus faible (1,203):
( x1 − x ) (1 , 255 −1 , 203)
G1 = = = 0 , 91 (C.8)
s 0 , 057
Pour le test double de Grubbs (voir 8.3.5.2):
p
s02 = ∑ ( xi − x )2 = 0, 022 61 (C.9)
i =1
Pour les deux valeurs les plus élevées (1,297 et 1,373, qui ont été supprimées de la somme des carrés
ci-après):
p−2
∑ ( xi − xp−1 ,p )
2
s2p−1 ,p = = 0 , 002 44 (C.10)
i =1
s2p−1 ,p 0 , 002 44
G= = = 0 , 108 (C.11)
s02 0 , 022 61
Pour les deux valeurs les plus faibles (1,203 et 1,205):
p−2
∑ ( xi − x1 ,2 )
2
s12,2 = = 0,015 81 (C.12)
i =1
s12,2 0 , 015 81
G= = = 0 , 699 (C.13)
s02 0 , 022 61
NOTE Certaines valeurs de ces exemples de calculs diffèrent des valeurs tabulées. Cela est dû à une légère
modification de l’arrondissage, à des fins de lisibilité pour l’exemple donné. Ces différences sont sans conséquence.
Nombre de laboratoires, p = 8
T1 = ∑ ni yi = 18 , 642 (C.14)
T2 = ∑ ni ( yi )2 =12,883 7 (C.15)
T3 = ∑ ni = 27 (C.16)
T4 = ∑ ni2 = 95 (C.17)
T5
sr2 = = 0 , 000 232 2 (C.19)
T3 − p
T T −T 2 T ( p −1)
sL2 = 2 3 1 − sr2 3
T3 ( p −1) T32 −T4 (C.20)
= 0 , 000 460 5
sR2 = sL2 + sr2 = 0 , 000 692 7 (C.21)
T1
m
ˆ= = 0, 690 44 (C.22)
T3
sr =0 , 015 24 (C.23)
sR =0 , 026 32 (C.24)
Tableau C.5 — Valeurs calculées de m̂ j , srj et sRj pour la teneur en soufre du charbon
Niveau j pj m̂ j s
rj
s
Rj CVr a CVR a
1 8 0,690 0,015 0,026 0,022 0,038
2 8 1,252 0,029 0,061 0,023 0,049
3 8 1,667 0,017 0,035 0,010 0,021
4 8 3,250 0,026 0,058 0,008 0,018
a «CV» désigne le coefficient de variation, c’est-à-dire l’écart-type s divisé par la moyenne m pour le niveau.
Les calculs pour les niveaux 2, 3 et 4 peuvent être effectués de manière similaire, afin d’obtenir les
résultats donnés dans le Tableau C.5.
C.1.8 Conclusions
II convient de spécifier la fidélité de la méthode de mesure, exprimée en pourcentage massique, via ces
deux valeurs:
— écart-type de répétabilité, sr = 0,022;
— écart-type de reproductibilité, sR = 0,045.
Ces valeurs peuvent être appliquées au sein d’une plage allant de 0,69 % (fraction massique) à 3,25 %
(fraction massique). Elles ont été déterminées à partir d’une expérience à niveau uniforme, impliquant
8 laboratoires couvrant cette plage de valeurs, dans laquelle quatre valeurs isolées ont été détectées et
conservées.
Tableau C.6 — Estimations REML de m̂ j , srj et sRj pour la teneur en soufre du charbon
Niveau p m̂ sr sR
1 8 0,690 0,015 0,027
2 8 1,254 0,029 0,062
3 8 1,668 0,017 0,036
4 8 3,253 0,026 0,060
C.2.1.2 Source
Standard Methods for Testing Tar et its Products; section «Pitch»; méthode PT3 utilisant de la glycérine
neutre (voir la Référence [6]).
C.2.1.3 Matériau
Le matériau a été choisi parmi des lots de goudron du commerce, rassemblés et préparés comme
spécifié au chapitre «Samples» de la section «Pitch» de la Référence [6].
C.2.1.4 Description
réaliser plus d’une seule détermination. Le laboratoire 8 a constaté qu’il ne disposait pas d’échantillon
pour le niveau 1 (il disposait de deux spécimens pour le niveau 4).
Il convient de tracer les graphiques h et k de Mandel, mais à nouveau, dans cet exemple, cela n’a pas été
fait, afin de fournir un autre type de représentation graphique de données. Les graphiques de Mandel
sont représentés et commentés de façon exhaustive dans l’exemple donné en C.3.
Légende
X température (°C)
Y fréquence
L1 – L4 niveau 1 à niveau 4
Tableau C.9 — Différences absolues dans les cellules — Point de ramollissement du goudron (°C)
Laboratoire i Niveau j
1 2 3 4
1 1,4 0,2 0,5 0,0
2 0,1 1,3 0,2 1,0
3 0,5 3,3 1,6 3,5
4 0,7 0,7 2,0 1,0
5 1,0 — 0,3 0,8
6 2,0 0,6 3,7 0,2
7 0,7 0,9 0,8 0,6
8 — 1,5 1,0 1,3
9 1,7 1,3 1,5 0,8
10 0,2 0,2 1,8 1,0
11 3,2 0,2 0,3 0,4
12 0,8 0,4 0,4 0,5
13 0,6 1,3 1,0 1,1
14 0,3 1,5 0,5 3,4
15 0,1 0,2 1,4 0,6
16 3,8 1,8 0,6 0,3
Légende
X température (°C)
Y fréquence
L1 – L4 niveau 1 à niveau 4
Figure C.6 — Point de ramollissement du goudron — Différences absolues dans les cellules
T3 = ∑ ( yi 1 − yi 2 )2 = 36 , 910 0 (C.27)
T3
sr2 = = 1 , 2303 (C.28)
2p
pT −T 2 s2
sL2 = 2 1 − r = 1 , 557 5 (C.29)
p ( p −1) 2
T1
m
ˆ= (add 80,00) = 88, 396 7 (C.31)
p
sr =1 , 109 2 (C.32)
sR =1 , 6697 (C.33)
Les valeurs pour l’ensemble des quatre niveaux sont données dans le Tableau C.12.
Tableau C.12 — Valeurs calculées de m̂ j , srj et sRj pour le point de ramollissement du goudron
C.2.8 Conclusions
Pour les applications pratiques, les valeurs de fidélité pour la méthode de mesure peuvent être
considérées comme étant indépendantes du niveau du matériau, et sont les suivantes:
— écart-type de répétabilité, sr = 1,0 °C;
— écart-type de reproductibilité, sR = 1,8 °C.
Tableau C.13 — Estimations REML de m̂ j , srj et sRj pour le point de ramollissement du goudron
Niveau p m̂ sr sR
1 15 88,40 1,109 1,670
2 15 96,27 0,925 1,597
3 16 97,07 0,993 2,010
4 16 101,96 1,004 1,918
C.3.1.1 Source
Standard Methods for Testing Tar et its Products; section «Creosote oil»; méthode Co. 18 (voir la
Référence [6]).
C.3.1.2 Matériau
Le matériau a été choisi parmi des lots de créosote du commerce, rassemblés et préparés comme
spécifié au chapitre «Samples» de la section «Creosote oil» de la Référence [6].
C.3.1.3 Description
Il s’agissait d’une méthode de mesure normalisée pour une analyse chimique impliquant un titrage
par voie thermométrique, les résultats étant exprimés en pourcentage massique. Neuf laboratoires
ont participé, en mesurant cinq spécimens dupliqués, ceux-ci ayant été choisis de façon à couvrir la
plage normale des valeurs attendues dans les applications commerciales courantes. Ces spécimens ont
été choisis pour se trouver aux niveaux approximatifs de 4 %, 8 %, 12 %, 16 % et 20 %. La pratique
habituelle consiste à consigner les résultats d’essai avec une seule décimale, mais dans cette expérience,
les opérateurs ont reçu l’instruction de travailler avec deux décimales.
Légende
X numéro de laboratoire
h statistique h de Mandel
Légende
X numéro de laboratoire
k statistique k de Mandel
test de Cochran, elles ont toutes deux été considérées comme des valeurs isolées et marquées d’un
astérisque. Les preuves retenues contre elles jusqu’ici ne peuvent cependant pas être considérées
comme suffisantes pour les rejeter, bien que le graphique k de Mandel (Figure C.8) amène également à
suspecter ces valeurs.
L’application du test de Grubbs aux moyennes de cellule donne les résultats représentés dans le
Tableau C.17.
Pour les niveaux 3 et 4, puisque le test simple de Grubbs indique une valeur aberrante, le test double de
Grubbs n’est pas appliqué (voir 8.3.5).
Les moyennes de cellule pour le laboratoire 1 aux niveaux 3 et 4 sont constatées comme étant des
valeurs aberrantes. La moyenne de cellule pour ce laboratoire pour le niveau 5 est également élevée.
Cela est également clairement indiqué sur le graphique h de Mandel (Figure C.7).
Après enquête, il a été découvert qu’au moins un des échantillons du laboratoire 6, pour le niveau 5
pouvait à la suite d’une erreur provenir du niveau 4. Étant donné que la différence absolue pour cette
cellule était également suspecte, il a été décidé d’admettre le rejet de ce couple de résultats d’essai.
Sans «l’aide» de ces deux valeurs, le résultat d’essai du laboratoire 1 au niveau 5 est maintenant
définitivement suspect.
À cause de ces résultats d’essai, il a été décidé de rejeter le couple de résultats d’essai du laboratoire 6,
pour le niveau 5, car il n’y avait pas de certitude sur le matériau qui avait été mesuré, et de rejeter tous
les résultats d’essai du laboratoire 1, au motif qu’ils proviennent d’un laboratoire aberrant.
Sans ces résultats d’essai, la statistique de test de Cochran au niveau 4 a alors été comparée à la valeur
critique pour 8 laboratoires (0,680 à 5 %): celle-ci n’apparaît plus comme une valeur isolée et a donc été
conservée.
Les valeurs de m̂ j , srj et sRj, calculées sans les résultats d’essai du laboratoire 1, ni le couple de résultats
d’essai du laboratoire 6 pour le niveau 5, sont données dans le Tableau C.18, exprimées en pourcentage
massique et calculées conformément à 8.4.4 et 8.4.5.
Tableau C.18 — Valeurs calculées de m̂ j , srj et sRj pour le titrage par voie thermométrique
de créosote
Niveau j pj m̂ j srj sRj
niveau 3 est fortement divergente et qu’elle ne peut pas être améliorée par une quelconque procédure
alternative (voir 8.5).
Pour la répétabilité, une ligne droite passant par l’origine semble appropriée.
Pour la reproductibilité, les trois lignes semblent s’ajuster de manière adéquate aux données, la
relation IV semblant la mieux adaptée. Une personne connaissant les exigences d’une méthode de
mesure normalisée de la créosote peut choisir la relation la mieux appropriée.
Tableau C.19 — Estimations REML de m̂ j , srj et sRj pour le titrage par voie
thermométrique de créosote
Niveau p m̂ sr sR
Niveau 1 8 3,94 0,092 0,171
Niveau 2 8 8,28 0,179 0,498
Niveau 3 8 14,18 0,127 0,400
Niveau 4 8 15,59 0,337 0,579
Niveau 5 7 20,41 0,393 0,637
Légende
X m (fraction massique, %)
Y sr, sR (fraction massique, %)
× écart-type de reproductibilité, sRj
+ écart-type de répétabilité, srj
Figure C.9 — Graphique de srj et sRj en fonction de m̂ j , à partir des données du Tableau C.18,
représentant l’ajustement à ces données des relations fonctionnelles I à IV décrites en 8.5
Annexe D
(informative)
C p ,n ;1−α désigne la valeur critique supérieure unilatérale pour le test de Cochran, à un niveau
de signification α pour p laboratoires, chacun d’eux signalant n observations répétées;
G1 ,n ;1−α désigne la valeur critique bilatérale pour le test simple de Grubbs, à un niveau de
signification α, pour n résultats ou valeurs moyennes;
NOTE La Formule (D.2) a été adaptée par rapport à celle d’origine issue de la référence,[16] afin de renvoyer
une valeur critique bilatérale telle qu’elle est utilisée dans le Tableau 6; la formule figurant dans la référence[16]
concerne un essai unilatéral.
Gn;α désigne la valeur critique unilatérale pour le test de Grubbs, à un niveau de signi-
fication α, pour n résultats ou valeurs moyennes;
f(n) désigne la fonction donnée dans la Formule (D.4), à associer aux coefficients donnés
dans le Tableau D.1.
f ( n ) = g0 ,α + g1 ,α n + g2 ,α n2 (D.4)
NOTE 1 La Formule (D.3) donne des valeurs critiques unilatérales. Pour reproduire les valeurs du Tableau 6,
le niveau de signification α dans la Formule (D.3) est remplacé par α/2. Par exemple, les valeurs tabulées pour le
niveau de signification de 5 % peuvent être reproduites en appliquant α = 0,025 dans la Formule (D.3), avec les
coefficients correspondants du Tableau D.1.
NOTE 2 La Formule (D.3) et les coefficients du Tableau D.1 ne sont pas exacts, mais ils reproduisent des valeurs
exactes à ± 0,003 pour les niveaux de signification énumérés dans le Tableau D.1[16].
laboratoires p, ou d’autres niveaux de signification α, les valeurs des indicateurs peuvent être calculées
à partir de la Formule (D.5):
( p −1) t p−2;1−α /2
hp ;1−α /2 = (D.5)
(
p p − 2 + t p2−2;1−α /2 )
où:
t p−2;1−α /2 désigne le quantile (1 - α/2) de la distribution t de Student avec p-2 degrés de liberté.
NOTE 1 Les graphiques de h sont élaborés avec les lignes correspondant aux indicateurs situées en hp;1−α /2
et en − hp;1−α /2 .
NOTE 2 Il est attendu que les valeurs individuelles situées au-delà de ± hp;1−α /2 se produisent par hasard
selon une fréquence α. La probabilité pour qu’une ou plusieurs de ces valeurs se produisent par hasard dans un
p
ensemble de données de taille p est en conséquence de 1 − (1 −α ) , cette valeur étant typiquement largement
supérieure à α.
p
kp ,n ;1−α = (D6)
1 +( p −1 )Fν ,ν ;α
1 2
où:
NOTE 1 Les graphiques de k sont élaborés avec une ligne correspondant aux indicateurs située en kp ,n ;1−α .
NOTE 2 Il est attendu que les valeurs individuelles situées au-delà de kp ,n ;1−α se produisent par hasard selon
une fréquence α. La probabilité pour qu’une ou plusieurs de ces valeurs se produisent par hasard dans un
ensemble de données de taille p est en conséquence de 1− (1−α )p , cette valeur étant typiquement largement
supérieure à α.
Bibliographie
[1] Guide ISO 33, Matériaux de référence — Bonne pratique d'utilisation des matériaux de référence
[2] Guide ISO 35, Matériaux de référence — Lignes directrices pour la caractérisation et l'évaluation de
l'homogénéité et la stabilité
[3] ASTM E691-18, Standard Practice for Conducting an Interlaboratory Study to Determine the
Precision of a Test Method (disponible en anglais seulement). American Society for Testing and
Materials (Société américaine pour les essais et les matériaux), Philadelphie, Pennsylvanie, États-Unis
[4] Grubbs F.E., Procedures for detecting outlying observations in samples. Technometrics, 11,
1969, pp. 1–21
[5] Grubbs F.E., Beck G., Extension of sample sizes and percentage points for significance tests of
outlying observations. Technometrics, 14, 1972, pp. 847–854
[6] “Standard Methods for Testing Tar and its Products”. 7e édition. Standardisation of Tar Products
Tests Committee, 1979
[7] Tomkins S.S., Industrial and Engineering Chemistry (Analytical edition), 14, 1942, pp. 141–145
[8] ISO 5725-3, Exactitude (justesse et fidélité) des résultats et méthodes de mesure — Partie 3:
Mesures intermédiaires de la fidélité d'une méthode de mesure normalisée
[9] ISO 5725-4, Exactitude (justesse et fidélité) des résultats et méthodes de mesure — Partie 4:
Méthodes de base pour la détermination de la justesse d’une méthode de mesure normalisée
[10] ISO 5725-5, Exactitude (justesse et fidélité) des résultats et méthodes de mesure — Partie 5:
Méthodes alternatives pour la détermination de la fidélité d'une méthode de mesure normalisée
[11] ISO 5725-6, Exactitude (justesse et fidélité) des résultats et méthodes de mesure — Partie 6:
Utilisation dans la pratique des valeurs d'exactitude
[12] Corbeil R.R., Searle S.R., Restricted Maximum Likelihood (REML) Estimation of Variance
Components in the Mixed Model, Technometrics, 18, 1976, pp. 31-38
[13] Harville D.A., Maximum Likelihood Approaches to Variance Component Estimation and to
Related Problems. Journal of the American Statistical Association, 72 (358), 1977, pp. 320–338
[14] Searle S.R., Casella G., McCulloch C.E., 1992). Variance components, Wiley, New York
[15] Union internationale de chimie pure et appliquée, Protocol for the design, conduct and
interpretation of method-performance studies. Pure and Applied Chemistry, Volume 67, No 2,
1995, pp. 331-343
[16] Wilrich P, Critical values of Mandel’s h and k, the Grubbs and the Cochran test statistic.
Advances in Statistical Analysis, 97, 2013, pp. 1-10, DOI 10.1007/s10182-011-0185-y
[17] ISO 21748, Lignes directrices relatives à l'utilisation d'estimations de la répétabilité, de la
reproductibilité et de la justesse dans l'évaluation de l'incertitude de mesure