Vous êtes sur la page 1sur 10

-1-

NOTIONS de BASE sur les INCERTITUDES et le TRAITEMENT des DONNEES EXPERIMENTALES en PHYSIQUE, CHIMIE, BIOLOGIE

Christian BOURDILLON, Coordinateur, version Juillet 2001

-2-

POSITION du PROBLEME Toutes les sciences, et particulirement les sciences pour l'ingnieur, reposent sur la confrontation entre des rsultats d'expriences supposes reprsentatives et de thories censes dcrire objectivement la ralit du monde. Les deux dmarches, exprimentale ou thorique, sont naturellement accompagnes de la notion de doute, doute qui est un concept fondamental pour un (futur) ingnieur. Le but de ce texte est de prsenter les notions lies aux jugements sur la qualit des dterminations exprimentales. En effet, il n'est pas possible de mesurer une grandeur physique, chimique, biologique... qui soit totalement exempte d'erreur ou d'incertitude. Pourtant, tout rsultat prsente un intrt condition qu'il soit exprim avec ses limites d'incertitude. Il n'existe malheureusement pas de mthode simple pour dterminer la validit de mesures exprimentales. Ce polycopi donne quelques pistes gnrales, dans un nombre limit de pages, afin que l'exprimentateur puisse prsenter ses rsultats avec bon sens. Pour des applications particulires, la consultation d'ouvrages spcialiss tels que ceux proposs en bibliographie est indispensable. I- VOCABULAIRE On confond souvent dans le langage scientifique "erreur" et "incertitude" mme si on utilise plutt le terme "erreur" lorsqu'un processus de mesure est mal matris et "incertitude" lorsque l'valuation de la fiabilit est immdiate et intuitive. Par contre le vocabulaire est prcis pour un certain nombre de notions que vous devez connatre: 1) Incertitude absolue, Incertitude relative: L'incertitude absolue x est l'erreur maximale que l'on est susceptible de commettre dans l'valuation de x. L'incertitude absolue s'exprime donc dans les units de la grandeur mesure.
Exemple 1 : Les physiciens amricains Dumond et Cohen ont propos au dbut des annes 1950 plusieurs valeurs exprimentales pour la vitesse de la lumire : 1948 : c = (299776 4) km.s -1 1951 : c = (299790,0 0,9)km.s -1 1953 : c = (299792,9 0,8) km.s -1. On remarquera l'incompatibilit apparente entre ces rsultats, particulirement entre celui de 1948 et ceux de 1951 et 1953. La conclusion est que ces chercheurs ont t optimistes dans l'apprciation des incertitudes...

L'incertitude relative x/x reprsente l'importance de l'erreur par rapport la grandeur mesure. L'incertitude relative n'a pas d'units et s'exprime en gnral en % (100x/x).
Exemple 2: une balance d'analyse de laboratoire permet de peser typiquement 0,1 mg prs. Si la pese est de 10 mg l'incertitude absolue est 0,1 mg. L'incertitude relative est 1%. Si la pese est de 1000 mg l'incertitude absolue est toujours 0,1 mg. L'incertitude relative est 0,01%. Mais on peut choisir de peser 10 mg prs si on se contente d'une incertitude relative de 1%. Exemple 3: La mesure de la vitesse de la lumire exprime par c = (299792,9 0,8)km.s -1 correspond une incertitude relative c/c = 3.10 -6.

L'incertitude relative est une manire commode de chiffrer la prcision d'une mesure (notion dfinie ci dessous). Dans le langage scientifique, une mesure de frquence est dite trs prcise car mesure avec une incertitude relative meilleure que 0,0001 %. Par contre la mesure d'un paramtre physiologique ne peut tre difficilement apprci mieux que quelques dizaines de % du fait de la variabilit rencontre chez les tres vivants.

-3-

2) prcision et exactitude: Dans le langage habituel, ces deux derniers termes sont souvent confondus tort. La prcision traduit le degr de proximit (ou reproductibilit) que l'on observe entre diffrentes mesures qui ont t obtenues par la mme mthode. L'exactitude exprime la proximit entre un rsultat et sa valeur relle ou prsume telle. Cette notion ncessite la comparaison entre diffrentes mthodes.

Bonne prcision Bonne exactitude

Bonne prcision Mauvaise exactitude

Bonne exactitude Mauvaise prcision

Exemple 4: autre illustration du cas bonne prcision-mauvaise exactitude ci dessus. Une nouvelle mthode est en cours de mise au point pour le dosage d'un compos actif de mdicament par chromatographie (HPLC). La mthode est trouve prcise car la dispersion des mesures est de l'ordre de 1% mais son exactitude est mauvaise car la valeur moyenne est mesure systmatiquement 10% au dessous de la valeur moyenne obtenue par la mthode de rfrence (par exemple un marquage radioactif).

L'idal est videmment une mesure la fois prcise et exacte. Un moindre mal est une mesure exacte et imprcise. 3) Les types d'erreurs dans les donnes exprimentales: On peut distinguer trois types principaux d'erreurs: a) Les erreurs alatoires (ou fortuites) affectent la prcision des mesures. Elles sont tudies soit en effectuant des calculs d'incertitudes soit en comparant statistiquement les rsultats d'expriences soigneusement rptes. b)Les erreurs grossires se produisent rarement et sont facilement identifies car elles conduisent des valeurs excentriques qui diffrent significativement des rsultats dans une srie de mesures. Elles sont naturellement limines avant interprtation des rsultats. c) Il est beaucoup plus dlicat d'identifier les erreurs systmatiques qui affectent l'exactitude. Par exemple une erreur systmatique s'est manifestement glisse dans la mthode chromatographique de l'exemple 4. Elle pourrait tre due, par exemple, un mauvais rendement d'extraction du compos actif dans le mdicament. Il est difficile d'tre exhaustif dans la description des erreurs systmatiques. Les principales sont: - Les erreurs de mthode.
Exemple 5: en volumtrie, le virage d'un indicateur color peut se produire avant ou aprs l'quivalence thorique.

- Les erreurs instrumentales.


Exemple 6: une pipette jauge insuffisamment nettoye ne dlivre pas le volume nominal. Un convertisseur analogique-digital peut tre mal talonn.

- Les erreurs personnelles.


Exemple 7: lors de l'utilisation d'une fiole jauge, le mnisque peut tre systmatiquement ajust trop haut.

Les erreurs systmatiques sont les plus difficiles dtecter et ncessitent une vigilance constante dans les laboratoires. Certaines procdures dites "bonne pratique de laboratoire" permettent de donner un cadre rglementaire cette vigilance. Dans la suite de ce texte seul le traitement des erreurs alatoires sera dtaill.

-4-

4) Le "cot" de la prcision: L'obtention de la meilleure prcision possible n'est pas une fin en soi. L'important quand on entreprend une srie de mesures, est de savoir quoi elles vont servir, d'adapter l'appareillage la prcision souhaite, au moindre cot et le plus rapidement possible (voir l'exemple 11). II- Traitement non statistique des incertitudes (erreurs alatoires) La mthode la plus rigoureuse d'valuation des erreurs alatoires est toujours la mthode statistique (voir III), mais elle exige de rpter un nombre de fois significatif l'exprience et ce n'est pas toujours possible. Un manire simple d'apprhender l'incertitude sur un rsultat est d'utiliser la combinaison des incertitudes de chaque tape, c'est ce qu'on appelle un calcul d'incertitude. Ce calcul n'est lui aussi pas toujours possible car l'identification d'une "relation exprimentale" qui lie toutes les grandeurs mesures n'est pas toujours vidente. Par exemple, lors d'un protocole d'exprimentation sur des animaux de laboratoire, seule une mthode statistique permet d'valuer la prcision de la mesure. 1) le calcul d'incertitude: Il se dcompose en 3 tapes: a) identification de la relation exprimentale qui doit expliciter toutes les grandeurs utilises:
Exemple 8: une solution C 1 = 5,5 10-3 mol l-1 est prpare partir d'une solution mre C 2 = 10-2 mol l-1 par une double prise d'essai de v1 = 5 cm3 et v2 = 0,5 cm3 complte V=10 cm3 . La relation exprimentale qui explicite le calcul de C 1 permettra de calculer l'incertitude sur C 1 :
C1 = v1 + v 2 V C2

b) identification de chacune des incertitudes intermdiaires:


Les incertitudes dpendent du matriel utilis. Dans l'exemple 8 prcdent la solution mre C 2 est une solution commerciale talon (garantie d'une prcision de 0,2%), soit: C 2 = 10-2 mol l-1 C 2 = 0,002 10-2 mol l-1 C 2 /C 2 = 0,2% v1 est prlev par une pipette jauge de classe A (incertitude relative = 0,2 %) soit: v1 = 5 cm3 v1 = 0,01 cm3 v1 /v1 = 0,2% v2 est prlev par une pipette gradue de 1 cm3 , de classe A (incertitude absolue = 1% du volume total) soit: v2 = 0,5 cm3 v2 = 1% de 1 cm3 soit = 0,01 cm3 v2 /v2 = 2% V est obtenu par ajustage d'une fiole jauge de classe A (incertitude relative = 0,2 %) soit: V = 10 cm3 V = 0,02 cm3 V/V= 0,2%

c) calcul de l'incertitude selon quelques rgles simples: La relation exprimentale est diffrencie par rapport chacune des grandeurs, considres comme indpendantes. Dans le cas de produits ou de quotients il est rapide d'effectuer cette diffrenciation en passant par les logarithmes.
Pour l'exemple 8 en cours, on trouve:
dC 1 C1 = dv1 (v1 + v 2 ) + dv2 (v 1 + v 2 ) + dC 2 C2 dV V

Si ncessaire il faut regrouper les termes correspondants la mme variable. Le passage aux incertitudes correspond au passage la plus grande valeur possible en valeur absolue de tous les coefficients multiplicatifs, soit ici:
C1 C1 = v1 1 1 1 1 + v 2 + C2 + V (v 1 + v 2 ) (v 1 + v 2 ) C2 V

-5-

ou encore si les quantits sont positives:


C1

C1

v 1 (v 1 + v 2 )

v 2 (v 1 + v 2 )

C2 C2

V V

L'application numrique donne: C 1 /C 1 = 0,01/5,5 + 0,01/5,5 + 0,2/100 + 0,2/100 0,8 % (on arrondit toujours la valeur suprieure). C = 0,044 10-3 mol l-1 .
1

soit en conclusion: C 1 = 5,50 10-3 0,05 10-3 mol l-1 ou encore C 1 = (5,50 0,05) 10-3 mol l-1 .

Ce type de calcul est facilit par des rgles simples qui se dmontrent aisment partir de ce qui prcde: L'incertitude absolue sur une somme algbrique de mesures est la somme des incertitudes absolues sur chacun des termes.
Exemple 9: pour la relation exprimentale A = a-b+2c on trouve A = a + b + 2c

L'incertitude relative sur le produit ou(et) le quotient de mesures indpendantes est la somme des incertitudes relatives (affects des coefficients ncessaires).
Exemple 10: pour la relation exprimentale: X = ( 2u + 1)3 y le calcul par les logarithmes donne: z2
X 2u 1 y 2 z = + + X 2u +1 3 y 3 z

Exemple complet N11: dtermination de la rsistivit lectrique du cuivre. Identification de la loi exprimentale : un fil lectrique de diamtre d, de longueur l et de rsistance lectrique R d2 est ralis en cuivre dont la conductivit lectrique est donne par : = R . 4 l Identification des incertitudes intermdiaires : les rsultats des mesures nous donnent d = (0,300,01)mm, l = (20,001) m et R = (0,45620,0002) . Calcul de l'incertitude sur la rsistivit lectrique. Le thorme des incertitudes relatives donne : d l R =2 + + d l R Les trois termes intervenant dans le calcul sont d'importance ingale. En effet nous avons : 2d/d=7.10-2, l/l=5.10 -4 et R/R=3.10 -4. Nous pouvons donc ngliger l/l et R/R devant d/d. Donc : / = 2d/d = 7.10 -2. Prsentation finale du rsultat : le calcul de peut alors tre effectu en prenant = 3,14. Nous obtenons : = (1,6 0,1).10 -8 .m. Pour amliorer la mesure de , il faut diminuer si possible l'incertitude sur la mesure du diamtre du fil. Il est alors inutile de mesurer l et surtout R avec une aussi grande prcision.

2) Prsentation de rsultats: Lors de la prsentation finale d'un rsultat il est important d'accorder le nombre de chiffres significatifs la prcision dtermine. Dans le cas ou une incertitude n'est pas explicitement donne, les scientifiques admettent le niveau du dernier chiffre significatif comme ordre de grandeur de l'incertitude.
Exemple 12: Vous trouvez dans une table de constantes: A = 23,0 unit. Vous interprtez que A est connu 0,1 ou 0,2 unit prs (incertitude relative 0,5 1%) B = 0,007 unit. Vous interprtez que B est connu 0,001 unit prs (incertitude relative 15%) C = 59000 unit. Vous interprtez que C est connu 1000 unit prs (incertitude relative 1,7%).

Ceci ne transmet qu'un ordre de grandeur de l'incertitude mais c'est dj important.

-6-

3) Application au dpouillement de rsultats graphiques Il est courant d'tudier graphiquement une proprit en fonction d'un paramtre pour en dduire ou vrifier une loi (linaire par exemple). Les rectangles d'incertitudes (ou barres d'erreurs) doivent tre ports sur le graphe pour juger de la validit de l'interprtation. Soit un point exprimental dfini par les coordonnes: X affect de l'incertitude X Y affect de l'incertitude Y Le trac de ce point sur un graphe correspond au schma suivant:

+Y Y -Y

-X X

+X

La zone grise correspond l'aire d'incertitude du point exprimental. Elle peut se rduire une simple barre si l'une des incertitudes est trs faible.
Exemple 13: interprtation de rsultats graphiques: Pour tudier une cintique chimique dans un racteur, la concentration d'une espce est suivie par prlvements rguliers en fonction du temps. Le dosage aboutit une mesure de la densit optique (absorbance) de la solution. Compte tenu de toutes les contraintes exprimentales, les valeurs mesures sont entaches des incertitudes suivantes: Temps = t (seconde) Concentration =C (mol/l) 60 3 1,12 0,03 120 3 1,03 0,03 180 3 0,98 0,02 240 3 0,88 0,02

Ce qui donne le graphique:


1,3 1,2 1,1 1 0,9 0,8 0 50 100 Temps (s) 150 200 250

-7-

Pour l'interprtation, on trace manuellement la meilleure droite passant au mieux dans tous les rectangles d'incertitude. On trouve l'quation: C 1 = 1,20 - 1,31x10 -3 t Puis, de mme, les deux droites de pentes extrmes possibles (en pointills), respectivement d'quation: C 2 = 1,23 - 1,50x10 -3 t C 3 = 1,16 - 1,06x10 -3 t On peut donc en dduire: pour t = 0 l'extrapolation de la concentration donne: C 0 = 1,20 0,04 mol l-1 La pente de la droite est 1,3 0,3 mol l-1s-1.

Note: cette manire de procder conduit en gnral une surestimation de l'incertitude sur le rsultat final. Elle se justifie si on dispose uniquement de 3 ou 4 points mais ds que le nombre de points est suffisant il vaut mieux utiliser un traitement statistique (rgression linaire). III- Traitement statistique des erreurs alatoires Il n'est pas possible de donner en quelques lignes les principes souvent trs labors des traitements statistiques dont le but est de permettre un jugement objectif d'un ensemble de rsultats mme si les incertitudes ne sont pas a priori connues. Aprs lecture des quelques lignes de prsentation qui suivent, la consultation d'un ouvrage spcialis (voir bibliographie) est indispensable. 1) principes de base: On appelle chantillon de donnes un nombre fini (N) d'observations exprimentales de la grandeur x. Comme les lois statistiques ont t tablies pour une population c'est dire un chantillon de trs grande taille, elles doivent tre modifies quant on les applique un petit chantillon de donnes. On appelle moyenne de l'chantillon le terme suivant:

x= L'cart type (s) d'un chantillon fini est dfini par:

x
i =1

s=

(x
i =1

x)2

N1

Exemple 14: L'analyse de la teneur en plomb d'un chantillon de sang a donn les rsultats suivants: 0,752 0,756 0,752 0,751 0,760 en ppm (partie par million). Les formules prcdentes pour N = 5 donnent: x = 0,754 ppm et s = 0,0038 0,004 ppm

On peut approfondir la signification statistique de l'cart type (par exemple pour exprimer la prcision) condition d'y associer une limite de confiance (LC). La limite de confiance dfinit un intervalle de confiance dans lequel la valeur relle a p % de chance de se trouver. Les calculs thoriques dmontrent que l'cart type doit tre major par un facteur multiplicatif d'autant plus grand que le nombre de mesures est faible et l'exigence de fiabilit grande: ts A une limite de confiance de p % correspond l'intervalle = x N o N, s, x , ont les significations prcdentes et o t est le t statistique ou t de Student. On trouve dans les ouvrages de statistique des tableaux complets donnant t en fonction de N et des limites de confiance.

-8-

Nombre de mesures N 2 3 4 5 6 10 15

Facteur p pour les limites de confiance 80% 90% 99% 3,08 6,31 63,7 1,89 2,92 9,92 1,64 2,35 5,84 1,53 2,13 4,60 1,48 2,02 4,03 1,38 1,83 3,25 1,34 1,76 2,98 1,29 1,64 2,58

99,9% 637 31,6 12,9 8,60 6,86 4,78 4,14 3,29

On retrouve dans ce tableau la notion intuitive qu'il faut multiplier les mesures pour augmenter leur fiabilit.
Dans l'exemple 14 en cours, N=5. Si on choisit une limite de confiance de 99% on trouve t = 4,60 soit

ts = 4,6x0,0038/2,236 = 0,0078 0,008 ppm N

La conclusion est qu'il y a 99% de chance que la valeur soit dans l'intervalle: 0,754 0,008 ppm. On note : LC 99% = 0,7540,008 ppm

Dans le cas ou un rsultat final fait intervenir plusieurs carts types sur des grandeurs indpendantes, ces carts types peuvent tre combins un peu comme dans les calculs d'incertitudes. Nanmoins, les rgles sont diffrentes et plus complexes. Il faut consulter un ouvrage spcialis. 2) Analyse de rgression par la mthode des moindres carrs: Le trac de la meilleure droite au milieu de points exprimentaux est un problme courant au laboratoire. Une mthode numrique objective appele analyse de rgression permet d'tablir cette droite et de calculer les incertitudes associes. On ne considre ici que la mthode de rgression la plus simple, la mthode des moindres carrs. - Hypothses: Soit une relation linaire y = mx + b. On considre que x est affect d'incertitude ngligeable mais que y est entach d'erreurs exprimentales alatoires. Ce cas simple s'applique facilement dans le cas d'une courbe d'talonnage. - Calcul de la droite des moindres carrs: L'cart vertical de chaque point la droite est appel un rsidu. La droite calcule par la mthode des moindres carrs est celle qui minimise la somme des carrs des rsidus de tous les points (voir ouvrage spcialis). En pratique on dfinit trois grandeurs Sxx , Syy , Sxy : Sxx = (x i x )2 = x2 i Syy = (y i y)2 = y 2 i ( x i )2 N ( y i )2

N o xi et yi sont des paires de donnes, N le nombre de paires et x et y sont les valeurs moyennes des variables. On peut en dduire: - la pente de la droite: m = Sxy /Sxx

Sxy = (x i x )(yi y ) = xi yi

x y
i

-9-

- l'ordonne l'origine: - l'cart type des rsidus:

b = y -m x sr = Syy m 2 Sxx (N 2) s2 r Sxx

- l'cart type de la pente:

sm =

- l'cart type de l'ordonne l'origine:

sb = sr

N x 2 ( x i )2 i

2 i

Ces calculs sont facilement accessibles sur calculette. par ailleurs il existe de nombreux logiciels sur micro-ordinateur, tableurs ou graphiques, intgrant ces calculs avec le trac automatique des points et de la droite ce qui permet un contrle visuel du rsultat. Les carts types obtenus sont analogues l'cart type de donnes unidimensionnelles. On peut en dduire d'une manire similaire des limites de confiance comme dans 1). -Le coefficient de corrlation: r ou coefficient de Pearson permet d'tablir le niveau de validit de la relation linaire entre les deux variables x et y: r=

[N x

N x iy i x i yi
2 i

( x i )2 N y2 ( y i )2 i

][

Plus la valeur de r est proche de 1 plus grande est la probabilit d'une corrlation de linarit entre les deux variables x et y. Ainsi un jugement sur la valeur de r peut tre port partir de tables de valeurs critiques de r (voir bibliographie). Nanmoins, le seul calcul de r ne peut suffire, il faut absolument vrifier graphiquement comment la droite passe au milieu des points. Ce contrle est d'autant plus important que le nombre de points est faible.
Exemple 15: La courbe d'talonnage d'une protine spare par chromatographie (HPLC) est obtenue par intgration du pic pour diffrentes solutions talons de cette protine: x = Concentration (mg/l) y = Aire du pic (unit arbitraire) 0,352 1,09 0,803 1,78 1,08 2,60 1,38 3,03 1,75 4,01

L'application des relations prcdentes donne numriquement: S xx = 6,90201 - (5,365)2 /5 = 1,14537 S yy = 36,3775 - (12,51)2 /5 = 5,07748 S xy =15,81992 - 5,365x12,51/5 = 2,39669 L'quation de la droite des moindres carrs est donc: y = 2,09x + 0,26 ce qui donne graphiquement (par exemple en utilisant EXCEL ou votre calculatrice):

-10 -

4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 0 0,5 1 Concentration (mg/l) 1,5 2


y = 2,0925x + 0,2567

avec les carts types: sr = 0,14 sm = 0,13 sb = 0,16 Si on veut exprimer, par exemple la pente, avec une limite de confiance donne, par exemple 90% on trouve dans le tableau du III,1: t = 2,13 soit ts m / N = 0,12. soit: LC 90% pour m = 2,09 0,12 Par ailleurs le coefficient de corrlation trouv est r = 0,994, ce qui permettrait de juger (voir bibliographie) que le rsultat trouv est un rsultat fiable.

Il existe des logiciels plus labors (par exemple Minim 3) qui permettent d'attribuer un poids diffrent (donc une incertitude diffrente) chaque point exprimental. Les calculs de rgression ou d'identification de paramtres sur ces logiciels permettent d'affiner la discussion dans les cas difficiles. CONCLUSION Il existe donc plusieurs approches pour valuer la validit de rsultats exprimentaux. - Au minimum, un rsultat doit tre exprim avec une incertitude calcule l'aide des calculs d'incertitudes simples. Mais l'inconvnient est qu'il n'est pas toujours possible d'identifier la relation exprimentale indispensable pour effectuer ce calcul. - L'utilisation de mthodes statistiques permet d'exprimer plus rigoureusement les limites de fiabilit du rsultat. Elles incitent multiplier le nombre de mesures, ce qui n'est pas toujours possible. - Une solution intermdiaire souvent utilise dans la littrature scientifique est de donner uniquement les carts types (avec le nombre de mesures). Ceci permet au lecteur d'approfondir si ncessaire l'tude statistique en fonction de ses besoins. Ce texte tant une simple introduction aux mthodes d'valuation des incertitudes, la consultation d'ouvrages spcialiss est par ailleurs indispensable. BIBLIOGRAPHIE - Polycopi de PS22 : Mesures physiques - Polycopi de MT09 : Analyse numrique lmentaire - Polycopi de SY02 : Mthodes statistiques pour la fabrication et la recherche Textbook of Quantitative Chemical Analysis par Vogel Chimie Analytique par Skoog-West-Holler Cote BUTC: QD 101.2 VOG Cote BUTC: QD 72-2 SKO

La BUTC propose de nombreux ouvrages de statistiques, par exemple: Aide Mmoire Pratique de Techniques Statistiques (Ceresta) Cote BUTC: QA 276 AID