P. 1
81011755 Analyse Statistique de Donnees Experimentales

81011755 Analyse Statistique de Donnees Experimentales

|Views: 10|Likes:
Publié parsouhasouha

More info:

Published by: souhasouha on Feb 25, 2013
Droits d'auteur :Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

02/26/2013

pdf

text

original

Sections

  • PREFACE
  • 1.1.2 GRANDEURS DISCRETES ET CONTINUES, FONCTIONS DE DISTRIBUTION
  • 1.1.3 PROPRIETES DE LA FONCTION DE DISTRIBUTION
  • 1.1.4 FONCTION DE DISTRIBUTION DE PLUSIEURS VARIABLES
  • 1.2 DISTRIBUTION DE GAUSS
  • 1.3.1 DISTRIBUTION BINOMIALE
  • 1.3.2 DISTRIBUTION DE POISSON
  • 1.3.3 DISTRIBUTION DE LORENTZ
  • 1.4 THEOREME CENTRAL LIMITE
  • 2.1.3 CAS DES VARIABLES CORRELEES
  • 2.2.4 PRECISION DE LA FORMULE DE PROPAGATION DES ERREURS
  • 3.1.1 DEFINITIONS ET PROPRIETES
  • 3.1.2 PRECISION DE LA VARIANCE EXPERIMENTALE ET CHIFFRES SIGNIFICATIFS
  • 3.2 DISTRIBUTION DE STUDENT
  • 3.2.1 PETIT NOMBRE DE MESURES
  • 3.4.1 INCERTITUDES D'APPAREIL
  • 3.4.3 COMMENT EVITER LES ERREURS SYSTEMATIQUES ?
  • 3.4.4 COMMENT TRAVAILLER AVEC LES ERREURS SYSTEMATIQUES ?
  • 4.1.2 EXEMPLE D'UNE FONCTION LINEAIRE
  • CONCLUSION

ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES

oit le soutien du Ministere de 1'Education nationals. FURGET. Puis les auteurs travaillent pendant une annee (en moyenne) avec les membres d'un comite de lecture interactif. Professeur a 1'Institut National Polytechnique.Sciences@ujf-grenoble. du Conseil general de 1'Isere et de la Ville de Grenoble. HOUCHMANDZADEH. Grenoble 1 C.Grenoble Sciences Grenoble Sciences poursuit un triple objectif : • realiser des ouvrages correspondant a un projet clairement defini. Grenoble M. de la Region Rhone-Alpes. Grenoble J. Directeur scientifique de Grenoble Sciences Jean BORNAREL. Chaque projet est selectionne au niveau de Grenoble Sciences avec le concours de referees anonymes.L. Professeur a 1'Universite Joseph Fourier. sans contrainte de mode ou de programme. Grenoble 1 Grenoble Sciences rec. Directeur de recherches au CNRS. • proposer des ouvrages a un prix accessible au public le plus large possible. (Contact: Tel. Celui-ci est ensuite publie chez 1'editeur le plus adapte.fr) Deux collections existent chez EDP Sciences : • la Collection Grenoble Sciences. Professeur a 1'Universite Joseph Fourier. du Ministere de la Recherche. PORTESEIL. traites par des scientifiques de premier plan issus de disciplines differentes. • garantir les qualites scientifique et pedagogique des ouvrages retenus. Maitre de conferences a I'Universite Joseph Fourier. Grenoble 1 P.Rencontres Scientificjues. Directeur de recherches au CNRS. Grenoble 1 B. Grenoble C. ISBN 2-86883-456-6 ISBN 2-86883-590-2 © EDP Sciences.: (33)4 76 51 46 95 . collection presentant des themes de recherche d'actualite. dont les noms apparaissent au debut de 1'ouvrage. Maitre de conferences a 1'Universite Joseph Fourier. Grenoble 1 Comite de lecture pour "Analyse statistique des donnees experimentales" J. MlSBAH. VlLLEMAIN. Professeur a 1'Universite Joseph Fourier. BERTRANDIAS. 2002 . LESIEUR.E-mail: Grenoble. connue pour son originalite de projets et sa qualite • Grenoble Sciences .P.

avenue du Hoggar Pare d'Activite de Courtabceuf.ANALYSE STATISTIQUE DES DONNEES EXPERIMENT ALES Konstantin PROTASSOV SCIENCES 17. BP 112 91944 Les Ulis Cedex A. France .

Analyse numerique et equations differentielles (J.) . Bornarel) .La symetrie en mathematiques. Atteia & J.Du Soleil a la Terre. Kogan) Exercices corriges d'analyse. Alibert) . Fries & D. M. du Tremolet de Lacheisserie) .La turbulence (M. Lesieur) Magnetisme : I Fondements.Chimie organometallique CD.Approximation hilbertienne. Exercices et problemes corriges (E. Vidal) .P. Aeronomie et meteorologie de 1'espace (J.Ouvrages Grenoble Sciences edites par EDP Sciences Collection Grenoble Sciences Chimie. Le corps. Jans) Listening Comprehension for Scientific English (J. Lilensten & P. Sivardiere) . Upjohn) . Lesieur) .Turbulence et determinisme (sous la direction de M. Gignoux & B. Franc et al. Tomes 1 et 2 (V.L'ergomotricite. ondelettes. Lafontaine) . Adaptations physiologiques (/.La plongee sous-marine a 1'air.Mecanique.La cavitation. Soutif) . Pelmont) . Le Coarer) . Mecanismes physiques et aspects industriels (J.Speaking Skills in Scientific English (J. Astruc) . Oturan & M. Le minimum vital a savoir (/. Problemes resolus. source de sciences et de techniques (M. le travail et la sante (M. Vignais) .Sous les feux du Soleil. & J. Demailly) . Catalyseurs du monde vivant (J. Silvestre-Brac) . des origines a nos jours (P. De la Sicile a la Chine CM.]. Astruc) Introduction a la mecanique statistique (E. Splines. Gendrier) .H. Soutif) Minimum Competence in Scientific English (J. de la nature et de la sante (F. Upjohn.Rencontres Scientifiques Radiopharmaceutiques.Mathematiques pour les sciences de la vie.P. S. physique et chimie (J. Bertrandias) . Caches) . Vers une meteorologie de 1'espace (J. Foster) .I. Verdetti) L'Asie. Robert) . Deportes et al.Enzymes. II Materiaux et applications (sous la direction d'E. Blelly) .La mecanique quantique.Introduction aux varietes differentielles (J. Idelman & J. Karnakov & V. De la formulation lagrangienne au chaos hamiltonien (C.Thermodynamique chimique CM.La biologie. Lilensten & J.Endocrinologie et communications cellulaires (S. Tomes 1 et 2 CD.Methodes et techniques de la chimie organique (sous la direction de D. Belorizky & W.Mathematiques pour 1'etudiant scientifique.M. L'adaptation de 1'organisme et ses limites (Ph.P.) . B. Gorecki) . Upjohn.M. fractales (M. Pelmont) . Galitsky. Chimie des radiotraceurs et applications biologiques (sous la direction de M. Belorizky & W. Haug) Bacteries et environnement.Mecanique statistique.Naissance de la physique.Electrochimie des solides (C. Amadis) Grenoble Sciences . Blattes & V. Gorecki) .L. Tomes 1 et 2 (Ph. Comet & M.

Ce livre est ecrit pour permettre au lecteur de choisir le niveau d'analyse necessaire. pour alleger la presentation. on s'efforce de repondre aux questions les plus frequentes qui se posent dans 1'analyse des donnees experimentales. Dans 1'introduction. A la base de toute analyse des donnees experimentales. C'est pourquoi 1'accent est mis non pas sur la demonstration des resultats mathematiques mais sur leur signification et leur interpretation physique. . rares sont les situations ou les conditions experimentales correspondent exactement aux conditions d'application de tel ou tel theoreme. mais aussi par le temps que nous sommes prets a y consacrer. il existe plusieurs niveaux qui sont conditionnes par notre desir d'obtenir une information plus ou moins riche. C'est cet esprit assez "utilitaire" qui a determine le style de presentation.PREFACE Le but de ce petit ouvrage est de repondre aux questions les plus frequentes que se pose un experimentateur et de permettre a un etudiant d'analyser. Le plan du livre est simple. il est consacre aux fonctions de varables aleatoires. Neanmoins. Dans le troisieme chapitre qui est la partie la plus importante. nous voulons juste obtenir la valeur d'une grandeur physique sans nous preoccuper de verifier les hypotheses a la base de notre demarche. Le deuxieme chapitre presente des notions plus complexes de statistique. les resultats obtenus nous paraissent etre en contradiction avec nos estimations preliminaries et ainsi nous sommes obliges d'effectuer un travail plus scrupuleux. Le dernier chapitre est consacre aux methodes les plus frequemment utilisees pour 1'ajustement de parametres. Pexperimentateur n'a pas toujours besoin de connaitre les details et les subtilites mathematiques. La partie "indispensable" du texte correspondant au premier niveau est composee avec une police de caracteres normale. Les questions qui correspondent a une analyse plus approfondie et qui necessitent un appareil mathematique plus complexe sont composees avec une police de caracteres speciale. Le premier chapitre rappelle les principaux resultats de statistique essentiels a 1'analyse des donnees. Parfois. ses resultats et leurs precisions. Parfois. d'une fagon autonome. Cette partie du livre peut etre sautee lors d'une premiere lecture. la rigueur mathematique est volontairement sacrifice et remplacee par une argumentation "physiquement evidente". cependant. Frequemment. De plus. on presente les causes d'erreurs et on definit le langage utilise. on trouve une approche statistique qui exige des considerations mathematiques rigoureuses et parfois complexes. Dans 1'analyse des donnees experiment ales.

aux ingenieurs et a tons ceux qui sont amenes a realiser des mesures.6 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Bien que ce livre soit particulierernent adapte au travail d'etudiants de second cycle. J'airnerais remercier mes collegues enseignants et chercheurs qui ont lu le manuscrit et qui m'ont fait des propositions pour arneliorer son contenu. . Je voudrais exprimer ma profonde gratitude a M. Elie Belorizky qui m'a encourage a ecrire ce livre et avec qui j'ai eu des discussions tres fructueuses. il pourra etre egalement utile aux jeunes chercheurs.

La necessite de cette interrogation prealable devient evidente des qu'on rnesure la meme grandeur plusieurs fois. c'est la temperature ambiante qui peut varier et ainsi faire varier la longueur. parfois sans nous demander prealablement si cette formulation est correcte et si nous serons capables de trouver une reponse. Pour cela on introduit une fonction appelee distribution de probabilite de detection d'une valeur physique. Nous effectuons des mesures et nous avons sou vent a nous poser la question : "quelle est la valeur de telle ou telle grandeur ?". II faut poser cette question de maniere pertinente et trouver des moyens adequats pour decrire les grandeurs physiques. Dans la plupart des cas. il s'apergoit que des mesures repetees de la meme grandeur donnent parfois des resultats qui sont un peu differents de celui de la premiere mesure. on reste proche d'une certaine valeur moyenne. mais elle est inevitable et. ou plus simplement la distribution d'une valeur physique. C'est pourquoi meme la question de savoir quelle est la valeur d'un parametre peut ne pas etre absolument correcte. Pourquoi cette dispersion existe-t-elle ? D'ou vient cette variation ? Une raison de cet effet est evidente : les conditions de deroulement d'une experience varient toujours legerement. La solution est de caracteriser une grandeur physique non pas par une valeur. que les mesures soient simples ou sophist iquees. dans les conditions reelles d'une experience physique. quand on determine plusieurs fois la longueur d'une tige metallique. Ce phenomene est general. L'experimentateur qui le fait est frequemment confronte a une situation assez interessante : s'il utilise des appareils suffisamment precis. Nous sommes "condamnes" a effectuer des mesures de grandeurs qui ne sont presque jamais constantes. Plus les resultats sont eloignes de cette moyenne. Meme les mesures repetees de la longueur d'une tige metallique peuvent donner des valeurs differentes. ce qui modifie la grandeur mesurable. plus ils sont rares. La repetition de 1'experience montre que. qui montre . Cette definition doit refleter le fait que la valeur physique varie toujours. mais que ses variations se regroupent autour d'une valeur moyenne. mais de temps en temps on trouve des valeurs qui sont differentes de celle-ci. d'une part les resultats sont toujours un peu differents et d'autre part cette difference n'est en general pas tres grande. II faut trouver une definition qui puisse exprimer cette particularity physique. Par exemple. on ne peut pas s'en affranchir.POURQUOI LES INCERTITUDES EXISTENT-ELLES ? Le but de la majorite des experiences en physique consiste a comprendre un phenomene et a le modeliser correctement. Cette variation des conditions exterieures (et la variation correspondante de la valeur physique) peut etre plus ou moins importante. mais plutot par la probabilite de trouver dans une experience telle ou telle valeur.

dans la plupart des experiences. Cela signifie que 1'on presente la valeur moyenne et la largeur d'une distribution et que cette reponse a une interpretation precise en termes de probabilites. Comme nous pourrons le voir par la suite. Pour obtenir 1'ensemble des valeurs possibles ainsi que leurs probabilites d'apparition. Le lecteur interesse trouvera dans la bibliographie toutes les references sur les normes actuelles. La solution existe : on appellera valeur physique la valeur moyenne de la distribution et incertitude ou erreur de la valeur physique la largeur de la distribution 1 . dans cette approche. nous tacherons de suivre ces normes. une formule tres connue dans 1'analyse des donnees experimenatles porte le nom de "la formule de propagation des erreurs". On verra par la suite que cette fonction — la distribution d'une valeur physique — est heureusement suffisamment simple (en tout cas. Dans ce livre. Depuis quelques annees. Ce n'est pas tout a fait vrai. on peut reconcilier notre envie de poser cette question et la rigueur de 1'interpretation d'un resultat en termes de probabilites. grosso modo. les deux termes "incertitude" et "erreur" sont utilises en physique pour decrire la largeur d'une distribution. les organismes scientifiques internationaux essaient d'introduire des normes pour utiliser correctement ces deux termes (de la meme fagon que 1'on a introduit le systeme international d'unites). et personne n'en a besoin. qui caracterise la dispersion des valeurs qui peuvent raisonnablement etre attributes a la grandeur mesuree. Le fait que. cette largeur a une interpretation rigoureuse en terme de probabilites. Aujourd'hui. le resultat puisse etre caracterise par seulement deux valeurs. C'est une convention admise de dire que "la grandeur physique a une valeur donnee avec une incertitude donnee". Par exernple. Bien que cette definition ne soit pas parfaitement rigoureuse. la region autour de cette moyenne dans laquelle se regroupe la majorite des resultats des mesures. permet de revenir sur la question avec laquelle nous avons commence notre discussion : "Peut-on se demander quelle est la valeur d'un parametre physique ?" II se trouve que dans le cas ou deux parametres sont necessaires et suffisants pour caracteriser une grandeur physique. au moins. on appelle une erreur la difference entre le resultat d'une mesure et la vraie valeur de la grandeur mesuree. associe au resultat d'une mesure. C'est tres long. II faut souligner une fois encore que. La deuxieme caracteristique de cette fonction de distribution indique. La premiere est sa valeur moyenne qui est aussi la valeur la plus probable. il ne s'agit pas tellement de la valeur concrete d'une grandeur physique. Nous utiliserons toujours ce nom bien connu bien que. mais parfois nous utiliserons des expressions plus habituelles pour un physicien. Bien sur. mais surtout de la probabilite de trouver differentes valeurs. nous aurions du 1'appeller "la formule de propagation des incertitudes". selon les normes actuelles. Pour determiner une distribution on doit repeter plusieurs fois une mesure pour connaitre la frequence d'apparition des valeurs. trop cher. dans la majorite des experiences). on devrait en fait effectuer un nombre infini de mesures. . Elle caracterise la largeur de cette distribution et est appelee 1'incertitude. Elle a deux caracteristiques. elle est tres utile pour la comprehension. On se limite done a un nombre fmi de mesures. Le but des mesures physiques est la determination de cette fonction de distribution ou.8 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES quelles sont les valeurs les plus frequentes ou les plus rares. de ses deux parametres majeurs : la moyenne et la largeur. Pour des raisons de simplicite nous appellerons cette incertitude "1'incertitude naturelle" ou "initiale" de la grandeur physique elle-meme. Tandis que 1'incertitude de mesure est un parametre. cela introduit une erreur Pour des raisons historiques. puisque cette erreur ou incertitude est souvent due aux conditions experimentales.

Evidemment. II est lie au fait que. 1'interference appareil—objet devient plus compliquee et interessante. il est tres difficile de combattre ce type d'erreurs : il est a la fois difficile de les deceler et de les corriger. on peut la rendre negligeable devant I'incertitude initiale de la grandeur physique. dans chaque experience physique existe un appareil. de diminuer cette erreur : il suffit d'augmenter le nombre de mesures. Le decalage de la valeur moyenne est un exemple de ce qu'on appelle les "erreurs systematiques". Par contre. II est possible de negliger I'incertitude naturelle par rapport a I'incertitude d'appareillage. Sans la determination de I'incertitude. la notion de probabilite est non seulement utile et naturelle. Nous avons egalement vu que cette incertitude contient trois contributions possibles. Cette incertitude. en mecanique quantique. ces changements peuvent etre de deux types : I'appareil peut "decaler" la valeur moyenne et il peut elargir la distribution. mais on peut toujours le verifier en faisant des mesures repetitives. entre 1'experimentateur et 1'objet mesurable. 1'experience n'est pas complete : on ne peut la comparer ni avec une theorie ni avec une autre experience. II est assez facile. La . Malheureusement. Cependant nos conclusions generales ne sont pas modifiees puisque. Dans un grand nombre d'experiences. s'appelle 1'erreur statistique ou rerreur accidentelle. II suffit done de faire une seule mesure et de prendre I'incertitude de I'appareil comme incertitude de la mesure. Ce nom exprime que ces erreurs apparaissent dans chaque mesure. La premiere est I'incertitude naturelle liee aux changements des conditions d'experience ou a la nature-meme des grandeurs (en statistique ou en mecanique quantique). L'appareil peu precis ne permettra pas d'obtenir les variations dues a la largeur initiale. il n'y a pas de methodes generates et il faut etudier chaque cas. on ne parle pas des mesures en mecanique quantique. Get appareil apporte inevitablement des modifications de la distribution initiale : il la deforme. L'appareil donne systematiquement une valeur qui est differente (plus grande ou plus petite) de la valeur "reelle". En principe. il est plus facile de maitriser 1'elargissement de la distribution introduit par I'appareil. due a 1'impossibilite de mesurer avec une precision absolue la distribution initiale (naturelle). Pour cela. plus ou moins complique. du moms en theorie. dans ce genre d'experience. Cependant un autre probleme plus delicat apparait. II faut remarquer que la separation entre incertitude d'appareillage et incertitude naturelle reste assez conventionnelle : on peut toujours dire que la variation des conditions d'experience fait partie de I'incertitude d'appareillage. On verra que cette incertitude ayant la meme origine que les incertitudes initiales (naturelles) s'ajoute "simplement" a celles-ci. mais elle est indispensable. Dans ce livre. Nous avons compris que pour determiner experimentalement une valeur physique il est necessaire (mais pas toujours suffisant) de trouver la moyenne (la valeur) et la largeur (I'incertitude). il faut etre sur que I'incertitude de I'appareil domine I'incertitude naturelle. Dans le cas le plus simple. 1'elargissement du a I'appareil permet de simplifier les mesures : supposons que nous commissions I'incertitude (la largeur) introduite par un appareil et que celle-ci soit nettement plus grande que I'incertitude initiale.POURQUOI LES INCERTITUDES EXISTENT-ELLES ? 9 (incertitude) supplementaire. ou existe une incertitude de la valeur physique a cause de la relation d'incertitude de Heisenberg. En mecanique quantique. Mesurer avec un appareil dont le zero est mal regie est 1'exemple le plus frequent de ce genre d'erreurs.

La troisieme est 1'incertitude d'appareillage due a 1'irnperfection des outils de travail de Pexperimentateur. de notre vision du monde. Dans la premiere nous voulons seulement obtenir 1'ordre de grandeur de la valeur mesuree . comment et jusqu'ou faut-il diminuer cette incertitude (largeur) de 1'experience ? C'est pourquoi 1'experimentateur doit comprendre les relations entre les trois composantes de 1'incertitude et trouver comment les minimiser : on peut diminuer 1'incertitude naturelle en changeant les conditions de 1'experience. Dans la seconde nous desirous obtenir une precision de 1'ordre de un a dix pour cent . on ne peut pas reduire les incertitudes infiniment. II existe une limite raisonnable de 1'incertitude. c'est-a-dire les caracteristiques de sa distribution : la moyenne et la largeur ? Deuxiemement. 1'incertitude statistique en augmentant le nombre de mesures. mais c'est aussi une question de physique. car les methodes choisies doivent evoluer en fonction de la precision requise. Dans la troisieme nous cherchons a obtenir une precision du meme ordre de grandeur que celle de Petalon correspondant au parametre physique mesure . il faut alors faire attention en determinant les incertitudes. Le lecteur qui connait les bases de la statistique peut omettre sans probleme les premiers paragraphes et chercher la reponse a sa question. Plus on cherche de precision. comment peuton mesurer une grandeur physique. . 1'incertitude doit aussi etre evaluee grossierement. II ne faut pas oublier que. nous considerons seulement les methodes d'estimation d'erreurs dans la seconde situation. Premierement. Dans cet ouvrage. tous nos raisonnements et discussions sont effectues dans le cadre d'un modele ou. Diverses situations existent selon la precision desiree. nous ne pourrons jamais tenir compte de tous les facteurs physiques qui peuvent influencer sa valeur. quelle que soit la grandeur a mesurer. 1'incertitude d'appareillage en utilisant des appareils plus precis. Dans le cas contraire. L'evaluation de cette limite est non seulement une question de temps et d'argent depenses. Ce cadre peut ne pas etre exact. La plupart des paragraphes apporte reponse a une question concrete : comment calcule-t-on les incertitudes pour une experience avec un petit nombre de mesures ? comment peut-on ajuster les parametres d'une courbe ? comment compare-t-on une experience et une theorie ? quel est le nombre de chiffres significatifs ? etc. De plus.10 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES deuxieme est 1'incertitude statistique due a 1'impossibilite de mesurer precisement la distribution initiale. plus la methode doit etre elaboree. dans ce cas. plus generalement. Cependant. 1'ouvrage lui apporte 1'information necessaire sur les parties de la statistique utiles au traitement des incertitudes. le probleme de 1'incertitude peut alors etre plus important que celui de la valeur. mais le prix a payer est la lenteur des calculs et leur volume. Un experimentateur se pose toujours deux questions. C'est pourquoi notre probleme est de choisir des methodes experimentales et des methodes d'estimation des incertitudes en adequation avec la precision souhaitable et possible.

Dans n cas. Logiquement. 1. Parmi ces distributions. celle de Gauss joue un role tres particulier. alors la probabilite P(a) que la marque a se manifeste est definie comme On voit toute de suite que la probabilite varie de 0 a 1 .1. au moins aux cartes et ainsi la notion de probabilite ne lui est pas etrangere. Pour les mesures les plus frequentes faites en laboratoire nous n'avons pas besoin de toute la panoplie des methodes de la statistique mathematique et notre experience du monde est largement sumsante pour comprendre et assimiler les proprietes fondamentales des probabilites.1 PROBABILITES Pour pouvoir decrire une grandeur physique en termes de probability il faut rappeler les definitions et les proprietes les plus simples. 1.2 et 1. cet evenement est caracterise par une marque distinctive a (appelee aussi caractere).1 DEFINITIONS ET PROPRIETES Supposons que 1'on observe un evenement E repete Ne fois (on dit que 1'on prend un echantillon de Ne evenements). nous avons reuni des notions de base de la theorie des probabilites : la definition d'une probability et ses proprietes elementaires ainsi que 1'introduction des distributions les plus frequemment utilisees dans 1'analyse des donnees experimentales.CHAPITRE 1 RAPPELS SUR LA THEORIE DES PROBABILITES Dans ce chapitre. Si les resultats des evenements dans cette suite sont independants.4) lui est consacree car elle et est indispensable a la comprehension du reste du livre. c'est pourquoi la partie esssentielle de ce chapitre (paragraphes 1. chaque lecteur de ce livre a deja eu 1'occasion dans sa vie de jouer.

carreau ou trefle). c'est-a-dire la probabilite d'observer B sous reserve que A se soit produit. 1'evenement B de n^ manieres et 1'evenement AB de nab manieres. Prenons un jeu de 52 cartes avec 13 cartes dans chaque couleur (le roi.. est egale a 1 Un exemple d'evenement est le tirage d'une carte du jeu. Par exemple. la probabilite d'etre soit le roi soit une carte de cceur (a etant le roi. Pour une carte tiree au hasard. etc. Supposons que 1'evenement A puisse se produire de na manieres differentes.) De plus. . Pour un jeu de 52 cartes. ajouter deux probabilites P(A) et P(B).c. On peut introduire la probabilite correspondante qui s'appelle la probabilite conditionnelle P(A/B) de 1'evenement B. la probabilite d'une categoric de couleur est egale a 1/4. alors On peut reecrire P(AB') comme Parmi les na cas ou 1'evenement A se produit.. sont presentes (ici a et 6 peuvent etre de nature differente). la dame. C'est pourquoi il faut soustraire la probabilite P(AB}.b. Alors. C'est-a-dire. defmissons par AB 1'ensemble des evenements dans lesquels ces deux signes se manifestent simultanement. a est une categoric de couleur. 6 une carte de coeur) est egale a P("soit le roi. coeur. il y a une proportion 1'evenement B s'est egalement produit. 6 est la valeur de la carte (le roi.12 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES et que la somme sur tous les caracteres (de meme nature) possibles {/}.P("roi de cceur") Introduisons une notion un peu plus compliquee. Definissons par A + B 1'ensemble des evenements dans lesquels la marque a ou la marque 6. Si le nombre total de realisations possibles est egal a N (ne pas confondre avec le nombre Ne d'evenements introduit au debut du paragraphe). Cependant. certains evenements peuvent avoir les deux signes en meme temps et on les a comptes deux fois. On notera par A 1'ensemble d'evenements ou ce signe s'est manifested Introduisons deux operations tres simples avec les probabilites. ou les deux. pour trouver la probabilite qu'un evenement possede au moins une des marques nous devons. le valet et 10 cartes numerotees de 1 a 10). La marque distinctive serait la categoric de couleur (pique. la dame.. i = a. soit une carte de coeur") = P("roi") + 7>("cceur") . d'abord.

FONCTIONS DE DISTRIBUTION Une grandeur physique peut avoir une valeur numerique discrete ou continue. Done na = 4. Ajoutons juste une carte a notre jeu — un joker qui n'appartient a aucune categoric de couleur. 77. dans le jeu de 52 cartes.5 = 13. on conclut que et ainsi. n^ a 13. 1. la derniere formule prend la forme 13 Si 1'evenement A n'a pas d'influence sur la probabilite d'evenement B.2 GRANDEURS DISCRETES ET CONTINUES. On utilisera cette propriete plusieurs fois dans ce livre. on obtient pour la probabilite d'apparition de deux evenements a la fois P(AB) une relation tres importante : ce qui montre que les probabilites des evenements independants se multiplient. si . Soit A "un roi". On s'apergoit facilement que et ainsi ces deux evenements ne sont plus independants dans le jeu de 53 cartes ! L'explication de cette difference est relativement simple : si nous savons qu'une carte est un roi alors elle ne peut pas etre le joker. on dit alors que les deux evenements sont independents et Dans ces conditions. a nouveau. dans le deuxieme. Done. Les exemples de grandeurs discretes sont la categoric de couleur. et ainsi nous avons deja obtenu une certaine information pour determiner sa categoric de couleur. N = 52 et les probabilites correspondantes : Vu que P(AB) = "P("roi de cceur") = 1/52.I . la valeur de la carte. mais N est egal a 53.RAPPELS SUR LA THEORIE DBS PROBABILITES Ainsi. Dans le premier cas. na.1. "continue". ces deux evenements sont independants. on 1'appellera grandeur "discrete". est egal a 4. Considerons 1'exemple de notre jeu de 52 cartes. B "une carte de coeur".

par exemple dans le jeu de cartes. on decrit assez souvent une grandeur continue par une valeur discrete et vice versa. Nous observerons par la suite des passages des valeurs d'un type a 1'autre. conventionnelle et les proprietes (ou meme Pecriture) valables pour les valeurs discretes seront utilisees pour les valeurs continues et inversement. le courant. Les proprietes de probabilite resteront les memes dans . Neanmoins. Cependant. On franchira cette frontiere regulierement. Bien sur. De ce point de vue. ou le comptage d'un detecteur. Cette attitude correspond a un parti pris de presentation. on mesure des grandeurs continues. meme parfois sans se rendre compte de ce que Ton fait. comme la longueur. cette separation est.1 : Histogramme de la premiere serie de mesures de la longueur / : sont portees sur 1'axe des abscisses la valeur mesuree et sur 1'axe des ordonnees la frequence de son apparition Ton reprend notre exemple. considerons un exemple de mesure de la longueur d'une chambre (il est evident que la longueur est une grandeur continue) a 1'aide d'un decimetre qui possede aussi des divisions centimetriques. Le fait meme que nous disposions d'un decimetre avec des divisions nous oblige a decrire une grandeur continue a 1'aide de valeurs entieres done discretes (on aura un certain nombre de decimetres ou de centimetres). la duree. si 1'on considere des exemples plus physiques. ces situations sont rares dans les experiences de physique. Le lecteur ne doit pas en deduire que le passage a la limite s'effectue dans tous les cas sans difficulte. etc.14 ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES Figure 1. Pour illustrer le caractere conventionnel de cette distinction. en physique. il existe des situations ou une valeur discrete ne peut pas etre remplacee par une valeur continue. Cette distinction des valeurs (ou des grandeurs) discretes et continues est tout a fait justifiee. en partie. On peut aller plus loin et dire que la representation d'une longueur par un nombre fini de chiffres est un passage oblige d'une valeur continue a une valeur discrete. Mais plus frequemment en physique.

Continuons notre experience mentale. C'est pourquoi nous donnerons les demonstrations generales pour les variables continues et considererons que les resultats s'appliquent aussi aux variables discretes. Figure 1. cinq fois — 324 cm et quatre fois — 325 cm. Chaque histogramme donne le nombre relatif de resultats se trouvant dans un inter- . notre decimetre n'etait pas toujours droit.RAPPELS SUR LA THEORIE DBS PROBABILITIES 15 les deux cas. Supposons qu'apres avoir fait une dizaine de mesures rapides. Sur 1'axe des abscisses. Pour clarifler la situation nous avons pris un instrument de mesure gradue en millimetres et en augmentant sensiblement le nombre de mesures nous avons obtenu les nouveaux resultats representes sur la figure 1. peut etre decrite par une fonction continue f(x) (figure 1. Le sol n'etait pas plat. Avec une autre echelle on retrouve les memes tendances : les resultats sont legerement differents et se regroupent autour d'une certaine valeur.2 : Histogramme de la deuxieme serie de mesures de la longueur / : sont portees sur 1'axe des abscisses la valeur mesuree et sur 1'axe des ordonnees la frequence de son apparition On peut continuer ainsi notre experience en diminuant 1'echelle et en augmentant le nombre de mesures dans chaque serie. lorsque le nombre de mesures tend vers I'infmi.2. nous ayons trouve une fois la longueur de la chambre egale a 323 centimetres. comprise entre 324 et 325 cm et nous ne savions pas dans quel sens il fallait Tarrondir.1 qui s'appelle un "histogramme". la plupart du temps. D'ou la dispersion de nos resultats.3). le nombre relatif (HI mesures de la valeur / par rapport au nombre total N de mesures) c'est-a-dire la frequence d'apparition de chaque valeur. on montre la valeur mesuree et. sur 1'axe des ordonnees.I . La forme des histogrammes tendra vers une forme en cloche qui. la longueur etait. Les resultats sont presentes sur la figure 1.

Selon (2). nous avons pris ici des limites infmies pour 1'integrale. On 1'appellera aussi la fonction de distribution de probabilite. . . Mais une grandeur physique. Pour une grandeur discrete qui prend les valeurs numeriques X{ = {x\. Cela signifie que la fonction /(a?) utilisee pour decrire cette grandeur doit devenir tres petite en dehors des limites que nous choisissons effectivement.3 : Fonction de la densite de probabilite valle donne. dans le cas d'un grand nombre de mesures et selon notre definition (1). . la probabilite P de trouver la valeur dans 1'intervalle compris entre xi et x<i est egale a qui est la somme (1'integrale) de f(x] pour toutes les valeurs de x entre x\ et x^. le produit f(x}dx donne la probabilite que la grandeur mesuree se trouve dans 1'intervalle La fonction f(x) represente la densite de probabilite. peut ne pas varier dans ces limites (elle ne peut pas etre negative). Par commodite mathematique. x varie au hasard et s'appelle variable aleatoire. par exemple la longueur. } nous .16 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Figure 1. Ainsi. D'apres notre definition. x % . f(x) obeit a la condition ce qui signifie que la probabilite de trouver une valeur de x quelconque est egale a 1.

cette fonction f(x] doit etre positive. Pour une variable discrete La barre sur x est la notation standard indiquant la valeur moyenne arithmetique. il faut la connaitre a chaque point x mais il est evident que ceci n'est pas realisable experimentalement : nous ne pouvons pas mesurer la probabilite pour chaque valeur x.3. A priori. position de la courbe (c'esta-dire celle de son maximum) sur 1'axe et son etalement. vu sa relation avec la probabilite. Bien evidemment. On peut souligner que le passage d'un histogramme a une fonction continue est analogue a la notion d'integrale comme limite de la somme des aires de rectangles element aires sous la courbe representant une fonction quand le nombre de divisions tend vers 1'infini.3 PROPRIETES DE LA FONCTION DE DISTRIBUTION Comment pouvons-nous caracteriser la fonction de distribution de probabilite f(x] ? Theoriquement. II est logique d'introduire au moins deux parametres qui decrivent la. L'etalement de la distribution peut etre decrit par la variance ou le carre de I'ecarttype et defini par . et avoir la forme de la courbe presentee sur la figure 1. tendre vers zero a plus l'infini et a moins 1'infini assez rapidement pour que 1'integrale (5) existe. Ainsi la premiere caracteristique de la distribution de probabilite f(x) est la valeur moyenne de x Chaque valeur possible de x est multipliee par la probabilite de son apparition f(x)dx et la somme (1'integrale) est effectuee sur toutes les valeurs possibles.I — RAPPELS SUE LA THEORIE DBS PROBABILITES avons exactement la meme relation de normalisation : 17 ou 'P(xi) est la probabilite de trouver la valeur Xi.1. C'est une hypothese physique naturelle mais nous discuterons aussi d'exemples ou elle n'est pas valable. 1. nous supposons que cette integrate (cette somme) ainsi que les integrates (les sommes) que nous allons definir existent.

II est facile de demontrer qu'avec la definition (7) le carre de 1'ecart-type s'ecrit Prenons 1'exemple le plus simple : une distribution de probability constante (voir figure 1. Pourquoi avoir choisi cette caracteristique plutot qu'une autre ? Parce que la simple valeur moyenne de 1'ecart est nulle. on considere 1'ecart par rapport a la valeur moyenne af et on calcule la valeur moyenne du carre de cet ecart.18 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES pour une variable continue. Nous aurions pu prendre comme caracteristique \x — x mais nous verrons a la fin de ce paragraphe que.4) d'une grandeur x qui peut varier de a a & La valeur de cette constante est definie par la condition de normalisation (5).4 : Distribution constante La valeur moyenne de x pour cette fonction de distribution est et sa variance : . la variance ne presente pas certaines proprietes remarquables et fort utiles. et par pour une variable discrete. sous cette forme. Figure 1. Pour chaque valeur de a?.

il est utile d'introduire des moments sans rapport avec la valeur moyenne Les moments (ou les moments centraux). determinent la distribution f(x) d'une facon unique. La connaissance de tous les moments {fi'n} (ou {pn}} donne une information complete sur la fonction de distribution de probabilite f(x). peuvent ne pas etre suffisantes pour decrire la fonction f(x). Cependant. de la quatrieme puissance de I'ecart etc. Parfois. Notons que. De cette facon. Cette fonction s'appelle la fonction generatrice des moments defmie par : La fonction exponentielle peut etre developpee en serie On voit que [i'n est le coefficient des derivees de la fonction M'x(t} : peut egalement etre determinee a partir . elles sont identiques Laissons au lecteur interesse le soin d'effectuer cette demonstration. on obtient un moment central d'ordre n : Le mot "central" souligne le fait que le moment est calcule par rapport a la valeur moyenne ~x. ainsi defmis. il est plus rationnel de travailler avec une seule fonction contenant tous les moments dans son expression.RAPPELS SUR LA THEORIE DBS PROBABILITIES 19 Les deux seules caracteristiques.I . par definition. On peut alors defmir les valeurs moyennes du cube. On demontre facilement que si deux densites de probabilites fi(x) et /2(x) ont les memes moments.

Ou encore. Ainsi la probabilite de trouver la premiere valeur dans Pintervalle compris entre x\ et x\ + dx\ et la deuxieme valeur dans 1'intervalle compris entre avec la condition de normalisation : . x ^ } . L'introduction de la fonction generatrice peut etre consideree comme une astuce permettant de faciliter les diverses demonstrations (ce que nous verrons plus tard).20 Done pour t = 0. i m p l i q u e I'egalite des deux fonctions de distribution de probabilite : Pour un lecteur interesse par les aspects mathematiques du probleme. Par exemple. 1. notons que cette definition de la fonction generatrice n'est pas la seule utilisee dans la litterature. Dans le premier cas. on doit introduire la densite de probabilite qui depend de deux variables /(a?i. On peut remplacer la fonction exponentielle d'un argument reel e^par la fonction d'un argument purement complexe etxt. Les deux transformations integrates sont tres proches I'une de I'autre : une rotation de 7T/2 dans le plan complexe de t permet de passer d'une transformation a I'autre. on obtient ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES D'une facon analogue. La construction et les definitions sont absolument analogues au cas d'une seule variable. nous faisons deux mesures independantes de la rneme grandeur : dans ce cas nous pouvons aussi dire que nous travaillons avec deux grandeurs. alors que dans le deuxieme elle est liee a la transformation de Fourier. on peut affirmer que I'egalite des deux fonctions g e n e r a t r i c e s .4 FONCTION DE DISTRIBUTION DE PLUSIEURS VARIABLES Examinons maintenant la situation un peu plus complexe ou nous avons affaire a deux grandeurs (variables) x\ et x^. on introduit la fonction generatrice des moments centraux : La relation entre ces deux fonctions est done : Conformement au theoreme que Ton vient d'enoncer. nous mesurons la longueur et la largeur d'une piece.1. Pour deux grandeurs continues. la definition est etroitement liee a la transformation de Laplace. Mais on peut lui donner une interpretation physique plus profonde qui sort du cadre de ce livre.

la fonction f ( x \ . 21 Parmi toutes les fonctions il existe un cas particulierement important et interessant en physique. selon la formule (3). L'hypothese de leur independance nous permet d'utiliser la propriete (16) et.x^. Leur somme nous sera utile pour calculer la valeur moyenne sur deux experiences. Pour calculer la variance on procede aussi par definition : . par definition.RAPPELS SUR LA THEORIE DBS PROBABILITES La generalisation de ces definitions au cas de N variables est evidente. Ces deux grandeurs x\ et x^ peuvent etre deux resultats de mesure de la meme grandeur x. Alors. X 2 ) se separe en un produit de deux fonctions : ou chaque fonction represente la densite de probabilite de la variable correspondante. Etudions les proprietes remarquables des valeurs moyennes et des variances dans un cas particulier mais tres frequent en physique : la somme de deux grandeurs independantes x\ -+. la valeur moyenne de la somme est egale a la somme des deux valeurs moyennes. C'est celui ou deux variables x\ et x-2 sont independantes.I .

. Par analogic. La moyenne de la somme X est egale a c'est-a-dire a la somme des moyennes et la variance de X est donnee par soit la somme des variances. . on a On introduit la somme de ces grandeurs. Mais.22 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES On separe cette expression en trois integrates et on utilise la propriete (16) On obtient finalement une relation simple qui montre que la variance de la somme de deux grandeurs independantes est egale a la somme de leur variance. x % . Pour la fonction generatrice des moments . Nous avons dit qu'il etait "a priori" possible de caracteriser 1'etalement d'une distribution f(x) par par exemple. Cette formule est la base du traitement des incertitudes et elle est utilisee continuellement en physique. . pour TV grandeurs independantes x±. XN. avec cette definition. on ne peut obtenir une relation aussi simple que celle donnee par la formule (17). . On voit d'ailleurs 1'avantage d'une telle definition de la variance.

Ce manque de connaissance de I'appareillage conduit parfois a des erreurs systematiques et meme a de fausses decouvertes. nous n'avons considere que des exemples de grandeurs physiques (variables aleatoires) independantes.}. il existe beaucoup de situations ou. si toutes les grandeurs dans cette somme ont la meme fonction de distribution on a la meme fonction generatrice de moments pour toutes les grandeurs et pour la somme X on obtient une expression encore plus simple 1.1. En effet.1 (voir (4)). La statistique n'est d'aucun secours dans ce type de situations. ce qui entrafne que la probabilite de deux evenements A et B simultanes P(AB) n'est pas egale au produit des probabilites Cette inegalite est le signe de deux evenements correles. De plus. comme la mesure d'un courant avec un amperemetre electromecanique (de mauvaise qualite) dont le ressort est usage et se deforme facilement. il existe des situations ou une mesure peut influencer la suivante. On peut penser que de tels exemples sont relativement rares en physique. on doit utiliser un unique appareil dont on ne connatt pas tres bien les proprietes. dans la plupart des situations reelles. pour une experience precise. C'est un exemple d'erreur systematique qu'il est assez difficile de detecter et de corriger. Bien evidemment. nous avons affaire a des variables aleatoires independantes comme les mesures d'une meme grandeur {x. A la fin du paragraphe 1. . nous avons vu un tel exemple avec une carte ajoutee a un jeu normal de 52 cartes.5 CORRELATIONS Jusqu'a present.1. chaque mesure risque de dependre des precedentes. En physique experimentale. Dans ce cas. Mais on rencontre aussi des variables correlees (c'est-a-dire non independantes).I — RAPPELS SUR LA THEORIE DBS PROBABILITIES 23 on obtient facilement d'apres (18) Cela signifie que la fonction generatrice des moments d'une somme de grandeurs independantes est egale au produit des fonctions generatrices individuelles.

il existe "un mecanisme" tout a fait nature! et frequent d'apparition des correlations. presque trivial. determinons les moyennes de 7/1 et de 7/2 : yT= auxi +012^2 = aii^I+ 012^2"= (an + 012)^ . Nous utiliserons aussi la covariance de deux variables : En particulier. Dans un cas general. en statistique.24 ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES Neanmoins. leurs fonctions peuvent etre correlees. Soient x\ et x^ deux grandeurs physiques independantes avec la meme moyenne /j. Nous caracteriserons la dependance entre deux variables X{ et Xj (avec des valeurs moyennes et des variances par le coefficient de correlation q^j defmi par : Les ecarts quadratiques moyens crz et <TJ sont introduits dans la definition par commodite. Meme si les variables {a??-} sont independantes. y2 = azixi + 022^2 = (<*2i + ^22)^- . Introduisons deux grandeurs y{ et y^ qui leur sont liees par une relation lineaire : Calculons la covariance cov(2/1. Tout d'abord.7/2) (23). le coefficient de correlation est nul : q^j — 0. et la meme variance a2. Prenons un exemple. pour i = j Si les variables X{ et Xj sont independantes. qui donne une illustration de ce mecanisme d'apparition des correlations. c'est-a-dire ce coefficient est egal a ±1 . Si Xi est proportionnelle a X j .

c'est-a-dire que x et x2 sont effectivement correlees. . cette expression est differente de zero. on Tappelle aussi la distribution normale. = 0. nous utiliserons les deux denominations. les composantes de la vitesse (vx. on peut comprendre qualitativement ce resultat : la valeur de x est caracterisee par son module et son signe tandis que x2 n'est caracterise que par le module de x. D'apres la definition (23). pourquoi cette distribution joue un role si particulier. Mais il suffit que Ton prenne le cas particulier d'une fonction de distribution f(x) paire. pour que et pour que la correlation disparaisse ! Get exemple n'est pas tres exotique : dans le cas d'un gaz dont les vitesses des molecules obeissent a la distribution de Maxwell (voir paragraphe 3. dans le paragraphe suivant consacre au theoreme central limite. Les signes + et — sont equiprobables en vertu de la symetrie de f(x). dans le cas general ne sont pas independantes mais sont correlees. Considerons I'exemple simple de la correlation des deux variables x et y = x2.1.3). A priori. dans la litterature.2 DISTRIBUTION DE GAUSS La premiere distribution continue que Ton etudie ici est la distribution de Gauss. la notion d'independance de deux variables n'est pas toujours evidente. A posteriori. Neanmoins. c'est pourquoi x et x2 se trouvent decorrelees.I . Dans cet ouvrage. la covariance est donnee par Dans le cas general. Nous verrons. c'est pourquoi. par exemple la distribution de Gauss (voir paragraphe suivant) avec fj. 1. Pour 1'instant nous etudions surtout ses proprietes. vy et vz) et I'energie ne sont pas correlees.RAPPELS SUR LA THEORIE DBS PROBABILITES 25 On a alors : Autrement dit. les deux variables y\ et yi Get exemple donne une illustration de la notion de correlation. nous pouvons penser qu'elles sont correlees. Cette distribution est la plus frequente en physique.

La densite de probabilite f(x] de trouver la valeur physique aleatoire x pour une distribution normale est donnee par La distribution normale est caracterisee par deux parametres ^ et a. que la plupart des valeurs physiques varient dans des limites finies. <r son etalement. dans les situations experimentales concretes. et a differents : ^ donne la position de la distribution. mais. et <r Supposons qu'une valeur physique varie d'une fagon continue dans un intervalle de moins 1'infmi jusqu'a plus I'mfini 1 .26 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Figure 1. les valeurs reelles ne sont jamais proches des limites et ainsi 1'hypothese d'infinite de 1'intervalle de variation n'a aucune consequence sur 1'applicabilite des resultats obtenus. au paragraphe precedent. Leur sens est clairement visible sur la figure 1. . Notons que le facteur devant la fonction exponentielle est choisi pour que la probabilite totale soit normee : Nous avons deja dit.5 ou nous avons presente plusieurs distributions correspondant a des /j.5 : Les distributions de Gauss pour plusieurs jeux de parametres /j.

I — RAPPELS SUR LA THEORIE DBS PROBABILITIES
Rappelons au lecteur que le calcul de I'integrale

27

qui se rencontre souvent en physique est simple. II suffit de considerer 72 (integrale sur tout le plan xy) et de passer en coordonnees polaires dans Tintegrale double :

Calculons la moyenne et la variance de cette distribution. Par definition, la valeur moyenne de x est egale a

Ainsi, le parametre p peut etre interprete comme la valeur moyenne de x. Notons aussi que x = ^ est le maximum de la fonction f(x] et que cette distribution est symetrique par rapport a ce point. De la meme fagon, on calcule la variance de la distribution normale :

(La derniere integrale peut etre calculee, par integration par parties.) Nous voyons pourquoi, des le debut, nous avons designe par a le deuxieme parametre de cette distribution.
II est relativement facile de calculer des moments d'ordre plus eleve de la distribution de Gauss. II faut introduire la fonction generatrice des moments centraux qui, par definition, est egale a

28

ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES

Pour la calculer il suffit de faire le changement de variable completer ('argument de la fonction exponentielle en faisant apparattre Ces changements de variable nous permettent de retrouver I'integrale (25). Ainsi, pour la fonction generatrice des moments centraux on obtient I'expression

On voit que tous les moments impairs sont nuls ce qui est evident en vertu de la symetrie de la distribution normale par rapport a x = //. Les moments pairs sont

Pour voir I'utilite des fonctions generatrices, prenons un exemple qui interviendra au paragraphe suivant. Considerons la distribution d'une grandeur physique y — ax + b qui est une fonction lineaire d'une autre grandeur x distribute selon la loi normale avec une moyenne /^ et une variance <r2. La fonction generatrice des moments est egale a

done

Selon notre hypothese, la distribution de x est une distribution de Gauss (26). D'ou

Cette expression prouve que la grandeur y a aussi une distribution normale de valeur moyenne a/j, + b et de variance a 2 <r 2 . Les deux resultats sont presque evidents : la translation change juste la valeur moyenne et le changement d'echelle multiplie la moyenne par a et la variance par a 2 (le resultat etait previsible vu les dimensions de ces grandeurs).

Comme la distribution de Gauss est entierement determinee par les deux valeurs //, <r et que la plupart des grandeurs physiques peuvent etre decrites par cette distribution, les resultats experimentaux peuvent etre caracterises par deux valeurs seulement. Par convention, on presente ces derniers sous la forme

II faut expliquer ce que cette ecriture symbolique signifie. Premierement, en presentant un resultat de cette maniere, on suppose que la distribution de la grandeur
2 Les normes ISO proposent d'utiliser la notation ux plutot que Ao\ Cependant, dans ce livre, nous garderons 1'ecriture Ao: plus habituelle pour les physiciens.

I - RAPPELS SUR LA THEORIE DBS PROBABILITES

29

physique mesuree est gaussienne. Deuxiemement, on prend la valeur rnoyenne de la distribution pour la valeur "reelle" de la grandeur x et sa largeur a pour 1'erreur. Cette forme d'ecriture est une convention generate que tout le rnonde accepte en gardant bien en tete ces hypotheses. On ne peut pas dire que la valeur "reelle" de x varie de la valeur minimale xmin = [i — a a une valeur maximale C'est faux ! Sous cette ecriture se cache une interpretation en termes de probabilite. Rappelons que la probabilite de trouver une valeur physique dans un intervalle de x\ a X2 est egale a 1'integrale de la densite de probabilite dans ces limites. Pour une distribution donnee, on peut calculer les integrales qui nous interessent numeriquement. En particulier, pour la distribution de Gauss (figure 1.6), la probabilite de trouver la valeur x dans 1'intervalle

dans 1'intervalle

dans 1'intervalle

Ces resultats montrent encore une fois a quel point 1'interpretation comme valeurs maximale et rninimale possibles de x est approximative. Pour une distribution de Gauss, la probabilite de retrouver x en dehors de cet intervalle est egale a 1/3, c'est-a-dire tres importante ! Autrement dit, si Ton mesure

Figure 1.6 : La distribution de Gauss

± 3u. 1'interpretation d'une telle ecriture est que la probabilite pour que la valeur physique mesuree se trouve dans cet intervalle est egale a 2/3. mais elles sont relativement complexes. il n'y a rien de dramatique si le resultat sort de cet intervalle. environ un tiers des resultats se trouve en dehors de jU ± <T et seulement deux tiers dans I'intervalle. on ne doit pas prendre a la lettre les valeurs des probabilites obtenues avec un a theorique. Dans le paragraphe 3. 1. Plus tard. La probabilite d'un tel evenement pour la distribution de Gauss est seulement de 0. De ce point de vue. La formulation plus rigoureuse de cette propriete sera donnee au paragraphe suivant ou nous demontrerons qu'il s'agit d'un resultat general valable pour presque toutes les . que retenir sur la distribution de Gauss (ou normale) ? D'abord. Cette circonstance explique son importance en physique. C'est la raison pour laquelle le resultat d'une experience s'ecrit sous la forme /L* ± a . Cette "transformation" sera le premier exemple du passage d'une distribution vers une autre.3 %. Cette distribution est caracterisee par deux parametres : la valeur moyenne H associee a la'Vraie" valeur de la grandeur physique et la largeur a associee a 1'erreur experimentale. ainsi que la distribution binomiale et celle du x 2 . de Lorentz.1. La distribution binomiale sera la premiere etudiee parmi celles qui decrivent des grandeurs discretes. elle n'est pas la seule possible. Si 1'on ne peut obtenir la valeur de a experimentale qu'a un facteur 2 pres.30 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES une grandeur x plusieurs fois. le fait qu'une tres grande majorite de grandeurs physiques se decrit. mentionnons en particulier les distributions de Student. nous avons souligne que la distribution de Gauss est la plus frequente dans la nature. alors il est tres probable qu'une erreur se soit glissee dans nos mesures ou dans les calculs de /J ou de a.3 AUTRES DISTRIBUTIONS ELEMENTAIRES Au paragraphe precedent. Cependant. Pour 1'instant. D'autres distributions de probabilite interviennent frequemment dans la vie courante . si le resultat se trouve aussi en dehors de I'intervalle la situation devient beaucoup plus preoccupante. la plupart du temps. Nous obtiendrons la distribution de Poisson comme une certaine limite de la distribution binomiale. nous verrons que ces distributions se transforment en une distribution normale dans la limite d'un grand nombre de mesures. Si le resultat sort de I'intervalle fj. par cette distribution. nous reviendrons sur la definition de fi et de a a partir d'un nombre limite de mesures ainsi que sur la precision d'une telle determination. soit dans les calculs de // et de a. qu'il existe une erreur soit dans le deroulement de 1'experience. L'apparition du resultat en dehors de I'intervalle de 3er signifie. Par centre. c'est-a-dire qu'elle est negligeable. Les distributions de Student et du x2 son^ indispensables en physique. de Poisson. vu le nombre d'experiences realisees habituellement au laboratoire (de quelques unites jusqu'a quelques dizaines). II faut dire qu'elle n'est pas frequemment rencontree dans les experiences mais elle est simple et instructive. au moins en premiere approximation. Nous leur consacrerons les paragraphes speciaux dans le troixeme chapitre du livre ou nous aborderons des problemes plus avances.

Plusieurs exemples de cette distribution sont donnes sur la figure 1. elle est egale a . q = I — p la probabilite de la realisation B.3. Elle est caracterisee par deux parametres N et p. Vu que 1'ordre de realisations . Comme exemple physique simple. c'est-a-dire par Finalement. au moins dans une premiere approche.I .7. La probabilite d'obtenir successivement n fois la realisation A puis N — n fois la realisation B est egale . C'est un probleme pratique car une telle operation peut nous permettre de remplacer. Ici. considerons N particules d'un gaz sans interaction distributes uniformement dans un volume V. plusieurs distributions de probabilite complexes par des distributions plus simples et plus generales et trouver ainsi un langage commun pour une description uniforme de grandeurs physiques tres diverses. Par definition (voir (6')).RAPPELS SUR LA THEORIE DBS PROBABILITES 31 distributions. II est facile de verifier que la densite de probabilite (30) est normee conformement a 1'equation (2) : Determinons la moyenne du nombre n. Dans ces conditions la probabilite P/v(n) de trouver n particules dans v est donnee par (30). La seule exception (physiquement interessante) a cette regie est donnee par la distribution de Lorentz. Si cet evenement se repete N fois.1 DISTRIBUTION BINOMIALE Cette distribution decrit des grandeurs discretes qui peuvent prendre seulement deux valeurs. la probabilite P^(n) que la realisation A se produise n fois est egale a : Cette densite de probabilite est celle de la distribution binomiale. on peut determiner la probabilite PN(H) que la realisation A se produise n fois. Supposons qu'un evenement ait deux realisations possibles ^4 et B.4 et B est sans importance. il faut multiplier cette probabilite par le nombre de possibilites d'extraire n objets parmi N objets. il faut noter que la "transformation" d'une distribution en une autre n'est pas d'un interet purement academique ou pedagogique. Soient p la probability de la realisation A. Chaque particule a une position aleatoire dans ce volume et a une probabilite p = v/V de se manifester dans une partie v du volume V. 1.

prenons la definition (7') et utilisons 1'expression (8) : .7 : La distribution binomiale pour trois valeurs du parametre p. Pour calculer 1'ecart-type. a la suite de Af evenements. le nombre moyen de realisations A doit etre egale a Np. N etant fixe : N = 10 Nous avons utilise le fait que le terme avec n — 0 est nul .32 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Figure 1. changeons la variable de sommation en posant k = n — 1 : Nous aurions pu prevoir ce resultat directement car si la probabilite de realisation A est egale a p.

1'ecart-type est egal a : La fonction generatrice des moments (14) de la distribution binomiale est La premiere et la deuxieme derivees de cette fonction en t = 0 defmissent les moments Ainsi la moyenne et la variance de la distribution binomiale sont donnees par : conformement a (32) et (33).I . Les resultats (32) et (33) peuvent paraitre triviaux mais ils sont fondamentaux pour toute la statistique : la valeur moyenne n est proportionnelle au nombre de mesures .RAPPELS SUR LA THEORIE DBS PROBABILITIES 33 Pour calculer la premiere somme. nous utilisons la meme astuce que pour le calcul de n dans (32) : Autrement dit.

plus la precision est grande : une conclusion evidente. La formule (35) montre que la precision relative decroit seulement comme la racine de N.34 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES tandis que 1'ecart-type est proportionnel a la racine de N Pour comprendre 1'importance de ces resultats. on en comprend la raison. Vu qu'une bonne precision est chere. Nous reviendrons sur cette question au paragraphe 2. rappelons que la valeur moyenne est associee a la valeur d'une grandeur physique xexp et 1'ecart-type a son incertitude (voir la discussion suivant la formule (29)). il faut multiplier le nombre d'experiences.3. 1. ici. C'est une question non triviale et nous y reviendrons a la fin du livre. Nous voulons trouver la probabilite P/^(n) que la realisation A se produise n fois au cours de toutes les mesures : et du fait que . Nous considerons la limite quand N est tres grand mais en imposant que le produit Np reste constant Np = const = // (c'est-a-dire p —>• 0). et ainsi le cout. il faut savoir de quelle precision on a vraiment besoin. par 100 ! Une experience precise peut couter tres cher et. Si Ton definit 1'erreur (1'incertitude) relative 6 comme le rapport on voit que cette valeur est inversement proportionnelle au nombre de mesures TV Cela signifie que. presque triviale. Nous avons obtenu la formule (35) a partir de la distribution binomiale mais elle restera valable quelle que soit la situation experimental. Ce qui est beaucoup moins evident. plus 1'on fait de mesures. Prenons comme point de depart la distribution binomiale dans laquelle nous augmentons le nombre de mesures N. c'est la dependance fonctionnelle de 8 avec N.2 DISTRIBUTION DE POISSON Etudions maintenant un autre phenomene particulierement interessant : la transformation d'une distribution dans une autre.1. Pour augmenter la precision par un facteur de 10.

il est toujours petit par rapport a N. par centre Finalement.. On peut reecrire (1 — p)N~n comme L'expression dans le denominateur tend vers 1 quand N —> oo. La fonction generatrice des moments (14) de la distribution de Poisson est . (soit un ecart-type Nous aurions pu prevoir ces resultats a partir des expressions relatives a la distribution binomiale (32—33). on obtient . pour la probability P^(n).RAPPELS SUR LA THEORIE DBS PROBABILITIES Rappelons que n restant fini. 35 lorsque TV tend vers Pinfini.I . On peut verifier aisement qu'elle est normee : que sa moyenne est egale a // : et que sa variance est p. Done.1 C'est la distribution de Poisson.

En principe.8 : La distribution de Poisson pour plusieurs valeurs du parametre p. Pour le verifier. Les conditions de la limite const) sont satisfaites et la distribution devient une distribution de Poisson avec une moyenne JJL = 8 . disons 1 seconde. Alors la probabilite de detection d'une particule dans un sous-intervalle est egale a p = II est important que cette valeur soit faible pour que Ton puisse negliger la probabilite de detection de deux particules dans un sous-intervalle de temps.8. c'est une distribution binomiale ou la realisation A est 1'apparition d'une particule dans le detecteur et la realisation B est son absence. Supposons que le nombre moyen de particules enregistrees pendant 1 s soit egal a // = 8. car le nombre de particules comptees par un detecteur est distribue selon cette loi a condition que le flux de particules reste constant. Notons que la distribution de Poisson ne depend que d'un seul parametre // = Np. Prenons un exemple.36 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Le lecteur interesse retrouvera aisement la moyenne et la variance de cette distribution a I'aide des deux premieres derivees de la fonction M^{t] prises en t = 0. Cette distribution de probability est souvent rencontree en physique atomique ou en physique nucleaire. Figure 1. Ces mesures seront decrites par la distribution de Poisson. Supposons qu'a I'aide d'un detecteur on compte des particules et que 1'on enregistre leur nombre pendant une certaine duree. La forme de cette distribution pour plusieurs valeurs de p est presentee sur la figure 1. disons de 1 nanoseconde (1 ns = 10~9 s). divisons notre intervalle de temps (de 1 s) en A*" petits sous-intervalles.

une resonance decrit. elle donne un exemple de distribution pour laquelle les definitions standards de la statistique ne sont pas toujours valables. en particulier. C'est pourquoi cette distribution de probabilite se manifeste relativement rarement dans les problemes macroscopiques et. En physique microscopique.3 DISTRIBUTION DE LORENTZ La distribution de Lorentz. qui porte parfois aussi le nom de Cauchy. En ce qui concerne le coefficient a. la fonction de Lorentz apparait comme une distribution de probabilite surtout en mecanique quantique. Le calcul de cette integrate ne represente aucune difficulte car la primitive de cette fonction est bien connue (arctangente). II est connu et utilise en mecanique (pour mettre en marche une balangoire.9). c'est-a-dire en physique microscopique. Get exemple montre un "passage" entre differentes distributions.I .3. Neanmoins. dans les experiences en travaux pratiques. Cette raison a elle seule est suffisante pour que 1'on etudie cette distribution de maniere plus approfondie. on rencontre de vrais problemes quand on veut trouver la moyenne et la variance en utilisant nos definitions habituelles. la fonction de Lorentz (37) est tres importante en physique car elle decrit des systemes qui se trouvent dans un etat dit de resonance. un enfant doit effectuer ses mouvements periodiques avec une certaine frequence) ou en electromagnetisme (tous les postes de radio ou de television utilisent le phenomene de resonance pour choisir une station).RAPPELS SUR LA THEORIE DES PROBABILITES 37 (figure 1. D'une part. On a remplace une distribution a deux parametres (binomiale) par une autre beaucoup plus simple (de Poisson) qui ne contient qu'un seul parametre. entre autres.8). Le coefficient devant la fonction est choisi pour que la probabilite totale de trouver une valeur quelconque de x soit egale a 1. a une place particuliere en statistique. n est le nombre de particules detectees pendant 1 seconde. Cependant. On peut voir facilement que cette distribution est symetrique par rapport a XQ qui est aussi le maximum de cette fonction. la duree de vie d'une particule ou d'un systeme de particules. 1. son interpretation est aussi claire : il represente la moitie de la largeur a mi-hauteur et caracterise ainsi 1'etalement de cette fonction. D'autre part. La distribution de Lorentz est donnee par la fonction qui depend de deux parameteres XQ et a (figure 1. Ce phenomene se caracterise par une grande amplification des parametres du systeme. .

Du point de vue mathematique. Neanmoins. la valeur moyenne peut etre consideree egale a XQ mais 1'on constate que le calcul de 1'integrale est un peu delicat. Autrement dit. n'existe pas au sens de la definition (7).38 ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES Figure 1. car 1'integrale correspondante diverge. Cela signifie que Pecart-type.R) et si Ton calcule ensuite la limite lorsque R —>• oo. la valeur moyenne de x est egale a Pour calculer cette integrale. qui etait pour nous la caracteristique de la largeur d'une distribution. 1'etalement de la fonction de Lorentz peut etre decrit par le parametre a. Elle n'est egale a zero que si 1'on considere ce que Ton appelle sa valeur principale. faisons le changement de variable Le deuxieme terme est egal a XQ en vertu de la normalisation de la distribution. Done. si Ton prend d'abord un intervalle d'integration fini et symetrique (—R. ceci est faux. . On peut dire que la premiere integrale est nulle car la fonction que Ton integre est impaire par rapport a £ — 0. cette integrale est divergente. Le vrai probleme apparait quand on veut etablir la variance. Formellement.9 : La distribution de Lorentz D'apres la definition (6).

on peut obtenir ce resultat indirectement en utilisant le fait qu'en prenant la transformation de Fourier d'une fonction puis la transformation de Fourier inverse de la fonction obtenue.RAPPELS SUR LA THEORIE DES PROBABILITIES 39 La fonction generatrice (14) ou (15) de la distribution de Lorentz n'existe pas non plus a cause de la divergence de I'integrale correspondante. on retrouve la fonction initiale. Cependant. il est possible de remedier a ce probleme. Cependant. Au lieu de la definition issue de la transformation de Laplace. Nous sommes en presence d'une distribution pour laquelle les definitions generates des valeurs moyennes ne sont pas valables. on prend Avec cette definition.1. peut etre calculee directement en utilisant la theorie des fonctions des variables complexes. Ainsi si F(t) est la transformation de Fourier de f(x) alors Dans notre cas. la fonction generatrice existe et elle est egale a : Cette integrale. Cette particularity de la distribution de Lorentz a des consequences tres importantes. Nous verrons au paragraphe suivant que c'est la seule distribution qui ne se transforme pas en une distribution de Gauss lorsque le nombre de mesures devient grand. Ainsi ('expression de la transformation de Fourier directe (40) nous donne la formule (39). . en prenant on obtient ou nous avons utilise le fait que a > 0. on peut choisir pour fonction generatrice une definition issue de la transformation de Fourier (voir la discussion a la fin du paragraphe 1.I . relativement compliquee.3) : ou la fonction exponentielle d'un argument reel a ete remplacee par la fonction exponentielle d'un argument purement complexe (pour simplifier la discussion.

ce qui se verifie facilement a I'aide . comme d'habitude. on rencontre parfois I'ecriture x\ qui signifie T(x + 1)). par la normalisation de la probabilite totale. Nous n'etudierons pas toutes les proprietes de cette fonction. Pour x entier. nous obtenons car Autrement dit. ou meme complexe (dans la litterature. La fonction F est defmie par I'integrale En principe. la fonction F est une generalisation de la fonction factorielle n\ au cas d'un argument non entier.4 DISTRIBUTION GAMMA Cette distribution herite son nom d'une fonction speciale dite fonction F ou integrate d'Euler de deuxieme espece. Cette fonction contient deux parametres 3 . mais nous nous bornerons a la plus interessante : qui se demontre tres simplement : il suffit d'integrer (41) une fois par parties. x = n.40 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES 1. la fonction F peut aussi etre ecrite sous une forme relativement simple car I'integrale Le changement de variable la ramene a I'integrale (25). Notons que pour les valeurs demi-entieres x — n + 1/2. La distribution de probabilite liee a la fonction F est decrite par la fonction pour x > 0.3. Le choix de la constante devant la fonction de x est dicte. x dans cette expression peut etre complexe. Notons que (3 est simplement un parametre d'echelle.

par x/j3. Nous avons utilise la definition de la fonction F et sa propriete (42). . Quelques exemples de la distribution gamma (pour (3 = 1) sont representes sur la figure 1. il ne faut pas oublier que les roles des variables et des parametres sont inverses dans ces distributions. Par definition. Pour calculer la variance. Calculons la moyenne et la variance de cette distribution.10 : La distribution gamma pour plusieurs valeurs du parametre a. /3 etant fixe de (41).10.I — RAPPELS SUR LA THEORIE DES PROBABILITES 41 Figure 1. utilisons ('expression (8) : Le calcul de est relativement simple : Ainsi la variance de cette distribution est donnee par 3 Notons la ressemblance formelle entre la distribution gamma et celle de Poisson : si Ton remplace n par a et jj. Cependant.

Si <72 est fini. Ecrivons /3a+1 sous la forme et introduisons une nouvelle variable L'expression pour M'(t] devient L'integrale dans cette expression est egale a F(a + l)pa+l et fmalement M'(t] s'ecrit Nous verrons un exemple physique de la distribution gamma lie a la distribution de Maxwell des vitesses au paragraphe 2.3 consacre a la distribution % 2 . II affirme que. 1. soulignons un fait tres important : on ne fait aucune hypothese sur la forme de la distribution de la grandeur aleatoire x ! Elle peut meme avoir une distribution discrete.4 THEOREME CENTRAL LIMITE Considerons maintenant un des aspects les plus importants de la statistique qui concerne le theoreme central limite. alors la distribution de la valeur moyenne sur un grand nombre n de mesures tend vers une distribution de Gauss avec une moyenne // et une variance Avant de demontrer ce theoreme. Par definition (14). dans presque toutes les experiences.2. Ce theoreme represente non seulernent un resultat mathematique puissant niais il est particulierement important pour ses applications physiques. on peut travailler avec une distribution de Gauss. Cette condition est presque toujours satisfaite dans la plupart des experiences.42 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Completons I'etude de la distribution gamma par sa fonction generatrice. II faut seulernent que la variance soit finie. La formulation exacte de ce theoreme est la suivante : Soit x une grandeur physique aleatoire avec une moyenne ^ et une variance <r 2 . mais nous citerons un peu plus tard un exemple physique ou cette limitation est violee et ou la .

Neanmoins. Considerons la fonction generatrice des moments centraux pour / —>• 0 : Ici. etre oubliee lors d'une premiere lecture. selon laquelle la fonction generatrice des moments d'une somme de n grandeurs aleatoires ayant la meme distribution est egale a la n-ieme puissance de leur fonction generatrice : .RAPPELS SUE LA THEORIE DBS PROBABILITES 43 distribution ne tend pas vers une distribution normale. nous donnons ici sa demonstration qui peut. Nous pouvons ainsi utiliser le developpement (47) par rapport au parametre t/^/n : Introduisons maintenant une nouvelle variable z liee a la valeur moyenne introduite dans I'enonce du theoreme par une relation lineaire Toute les valeurs Wi apparaissant dans la derniere expression ont la meme distribution car les differents x^ ont des distributions equivalentes. il faut mesurer plusieurs fois la valeur de x et calculer sa moyenne. cette situation reste rare et quand les conditions du theoreme sont remplies. tend vers 0 lorsque n tend vers I'infmi. nous avons fait le developpement limite de la fonction exponentielle et nous avons utilise le fait que la valeur moyenne de x est egale a ^ et que le carre de I'ecart-type est fmi et egal a a2 (13). celui-ci nous garantit que. pour obtenir un resultat precis et fiable. Introduisons d'abord une valeur auxiliaire dont la fonction generatrice des moments est donnee par Pour t fixe. Nous pouvons alors utiliser la propriete (21) de la fonction generatrice des moments. cependant. Vu 1'importance du theoreme central limite.I .

a une distribution de Gauss avec une moyenne p et une variance a2/n. nous obtiendrons tot ou tard une valeur physique ayant une distribution bien connue. alors la distribution de cette grandeur est une distribution de Gauss. que 1'on peut aussi rencontrer dans les livres sous le nom du theoreme central limite : Si une grandeur physique subit Vinfiuence d'un nombre important de facteurs independants et si Vinfiuence de chaque facteur pris separement est petite. la conclusion physique principale du theoreme central limite est que toutes les grandeurs physiques. mais pour n facteurs independants. Ainsi la valeur X. Pour n mesures independantes on peut affirmer que les X{ ont la meme distribution et ainsi la meme valeur de <r2. il s'agit d'un theoreme limite. Les deux formulations du theoreme sont relativement proches I'une de I'autre. c'est-a-dire que le passage vers une distribution de Gauss ne se realise que si n est suffisamment grand. La valeur moyenne X est liee a z par Nous avons deja demontre qu'une fonction lineaire (ici X) d'une grandeur aleatoire z avec une distribution normale a aussi une distribution normale (voir (28)). de plus nous savons ce qu'il faut faire pour que la distribution devienne une distribution normale. donnons-en une autre formulation. n joue le role du nombre de facteurs independants . Soulignons que.peut etre consideree comme la valeur de la grandeur x influencee par un seul facteur i. est inversement proportionnelle a la racine carree de n. ou presque. dans la limite ou n est grand. Dans une situation concrete. art. introduite dans la formule (34). Ainsi on retrouve presque la meme demonstration du theoreme. Pour 1'instant. Pour eclaircir cet aspect du theoreme.44 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Lorsque n tend vers I'infmi. dans la demonstration. plus "physique". aucune hypothese n'a ete faite sur la forme de la fonction de distribution de x et qu'ainsi ce resultat est tres general. si le nombre de mesures est suffisant. dans la limite ou n est grand. leur independance et leur faible influence sur la grandeur physique. Les points importants dans cette formulation du theoreme sont la presence d'un grand nombre de facteurs exterieurs. il faut savoir a quel point la distribution de la grandeur mesuree est proche de la distribution de Gauss et quand le nombre de mesures est suffisant. Nous pouvons encore remarquer que I'erreur relative Sx sur la valeur moyenne X. ont une distribution de Gauss . Autrement dit. on ne peut plus dire qu'ils vont donner la meme distribution a Xi . cette expression tend vers On reconnaft ici la fonction generatrice (26) des moments d'une distribution de Gauss avec une moyenne nulle et une variance a2 = 1. Le theoreme que nous venons de demontrer est particulierement important pour les experiences physiques car il nous donne la garantie que. la grandeur z a une distribution normale avec une moyenne nulle et une variance unite. Dans la deuxieme. Cependant.

reste neanmoins une exception. Toutefois cela n'est pas un obstacle au theoreme. il faut remplacer une simple valeur moyenne arithmetique X par une expression plus complexe. pour la distribution de Lorentz. cette distribution est caracteristique de la forme d'une raie dans les transitions electromagnetiques. II est facile de voir que. Une telle experience a ete effectuee avec "Les Pages Blanches" du departement de 1'Isere de 1'annee 1999 ou nous avons pris les 200 premiers numeros de la page 365. Nous verrons plus tard que 1'appareil avec lequel on efFectue les mesures modifie aussi la forme de la distribution et que. bien qu'il soit tres important en physique. en vertu de (21). Pour le demontrer. que toutes les raies mesurees experimentalement ont une forme lorentzienne.RAPPELS SUR LA THEORIE DBS PROBABILITES 45 avec les memes valeurs de // et de cr2. amateur de rnathematiques. La fonction generatrice de Xi/n defmie par (38) est egale a : (a comparer avec (39)).3 pour laquelle 1'ecart-type diverge. C'est celui de la distribution de Lorentz discutee au paragraphe 1. pourra mener lui-meme cette etude. Autrement dit. Commengons par un exemple numerique simple. Notre exemple de la distribution de Lorentz. pour une distribution de Lorentz initiale. la distribution n'etant pas gaussienne. Get exemple ne signifie pas. sur ces 200 numeros.I . Si x est distribue selon une loi lorentzienne. le nombre de realisations NS4. . le theoreme central limite ne s'applique pas. considerons quelques exernples. on peut mesurer une distribution de Gauss. Done la fonction generatrice de X est. Dans ce cas les conditions du theoreme ne sont pas satisfaites et les calculs de la valeur moyenne ne peuvent sauver la situation. Les resultats sont presenters sur la figure 1. Nous pouvons faire cette experience elementaire a la maison : dans 1'annuaire telephonique. il s'agit d'une lorentzienne et non d'une gaussienne ! En physique. Pour illustrer le theoreme central limite. Donnons maintenant le contre-exemple annonce au debut du paragraphe. pour chaque valeur de 84 calculee.11 sous la forme d'histogramme : nous avons reporte.3. la condition d'existence d'un ecart-type fmi est essentielle a ce theoreme et n'est pas simplement une condition pour faciliter la demonstration. Le lecteur. la valeur moyenne a aussi la distribution de Lorentz. cependant. choisissons 200 numeros au hasard et calculons pour chaque numero la somme s4 des quatre derniers chiffres.

0) 2 /12 = 6. 2. Les valeurs de ces parametres ont ete calculees selon (19) et (20) en supposant que chaque chiffre dans un numero telephonique est distribue selon une distribution discrete constante avec une moyenne (9 + 0)/2 = 4. Nous laissons cet exercice au lecteur. 4 A cause de la ressemblance formelle entre les distributions gamma et de Poisson. pour n termes dans la somme. . la distribution gamma donne une distribution de Gauss. 5 et une variance (9 . dans la limite a —>• oo.S4 = 18 et aS4 w 5.11 : La distribution de la somme 54 des quatre derniers chiffres dans un numero de telephone Un autre exemple classique nous montre comment 1'augmentation de // transforme la distribution de Poisson en une distribution de Gauss4. 75 (a comparer avec (10) et (11)). Dans notre cas. Alors la somme sn. n = 4.46 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES II faut comparer ce resultat avec la distribution de Gauss representee par une ligne discontinue : avec les parametres p. Figure 1. mais nous voyons que la distribution de Gauss est deja une tres bonne approximation de la distribution de §4. La coincidence entre la courbe et 1'histogramme est impressionnante ! Notons que le theoreme central limite suppose que les distributions de Xi doivent etre les memes et independantes (ce qui semble etre credible dans notre experience). aura une distribution proche de celle de Gauss lorsque n —>• oo. on peut utiliser exactement la meme approche pour demontrer que.

nous avons remplace la fonction qui varie lentement avec n par sa valeur au point n = p. Comme nous 1'avons deja remarque.. et nous n'avons garde que le premier terme non nul. on peut ecrire que Dans cette expression. elle est tres petite a cause de la fonction exponentielle decroissante. le produit p = Np restant constant. utilisons une approche assez connue dite "methode du col".3. la probabilite de trouver n evenernents dans un intervalle donne est egale a Augmentons la valeur du parametre //.(n) contient deux facteurs. la probabilite P^(n] ne sera sensiblement differente de zero qu'au voisinage de n — /j. et un ecart-type ^/Ji.n » 1.. D'ailleurs. il est tout a fait normal que la moyenne et la variance restent les memes que pour la distribution de Poisson. Cela signifie egalement que. La distribution ainsi obtenue est une distribution de Gauss avec une moyenne p. dans le cas d'un grand nombre de mesures. Sur la figure 1. pour la distribution de Poisson (36). Nous avons deja vu au paragraphe 1. ici On peut voir aisement que la fonction f^(n) possede un seul minimum pour n — p. Plus la valeur de p est grande. est un minimum de la fonction. nous avons donne quelques exemples de la distribution de Poisson avec plusieurs valeurs de /j.RAPPELS SUR LA THEORIE DBS PROBABILITES 47 Rappelons que. Au-dela de cette region. le premier. Au voisinage de ce point. car n — p. plus la distribution devient symetrique par rapport au maximum qui est aussi la valeur moyenne. qui varie lentement avec n et le deuxieme. ainsi nous considerons la limite n » 1 pour laquelle nous pouvons utiliser la formule de Stirling donnant n\ et ecrire la probabilite P^(n) sous la forme Pour simplifier cette expression dans la limite p. et qu'elle peut etre developpee en serie de Taylor au voisinage de ce point : Nous avons utilise ici le fait que / M (//) = 0 et f'n(^) = 0. la distribution binomiale tend vers .I . I/A/TI. e~^ n \ qui a une variation tres rapide avec n du fait de la fonction exponentielle . Les nombres d'evenements HQ pour lesquels les probabilites P^(UQ} sont sensiblement differentes de zero doivent etre proches de la valeur // .8. Notre fonction P(j.2 que la distribution de Poisson peut etre obtenue a partir de la distribution binomiale lorsque le nombre de mesures N est grand et que p est petit.

ce meme theoreme nous indique comment on peut contourner le probleme : il faut faire plusieurs mesures et travailler sur la valeur moyenne qui est forcement decrite par la distribution normale. les physiciens ont decouvert a un certain stade un phenomene tres etrange : 1'energie du faisceau variait selon les heures de la journee. Get effet gravitationnel est clairernent visible sur 1'ocean : c'est le phenomene des marees. si jamais on a le moindre doute sur la forme de la distribution. cet effet existe aussi pour la croute terrestre et donne lieu a des deplacements d'environ trente centimetres chaque jour. On ne peut pas dire que la distribution de Gauss est un cas particulier de celle de Poisson lorsque fj. et si 1'on ne recherche pas une trop grande precision. C'est le theoreme central limite qui nous le garantit. les changements de pression barometrique. . 1'hypothese selon laquelle la distribution d'une grandeur physique est une distribution de Gauss constitue une tres bonne hypothese de depart. etc. Pour etudier les proprietes fondamentales des particules elementaires. En augmentant la precision de leurs mesures. pour la plupart des experiences physiques faites au laboratoire. Des qu'on veut augmenter la precision d'une experience. Un autre exemple d'une distribution qui tend vers la distribution de Gauss quand le nombre de mesures augmente sera donne plus loin lorsque nous etudierons la distribution de Student (en 4.48 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES la distribution de Gauss. les conditions du theoreme central limite sont satisfaites et la distribution d'une valeur physique reste gaussienne. donne a la fois un exemple d'erreur systematique liee a la negligence d'un phenomene physique et donne une belle illustration du "mecanisme" du theoreme central limite (la necessite d'avoir plusieurs petits facteurs). Sur la figure 1. La distribution de Gauss obtenue de la distribution de Poisson dans la limite // —» oo ne depend que d'un seul pararnetre. II y a beaucoup de facteurs qui peuvent influencer 1'energie des particules dans un accelerateur : les variations du champ magnetique terrestre.12. On a du consacrer beaucoup de temps et d'efforts. Ce cas. D'abord. les facteurs qui auparavant etaient supposes negligeables deviennent importants et se manifestent sous forme d'erreurs systematiques. Pour 1'instant. Cette variation minime cumulee sur toute la longueur de 1'accelerateur modifie sa circonference de 1 mm et change ainsi 1'energie des particules. Chacun de ces facteurs parait etre peu important. rejeter beaucoup d'hypotheses avant d'arriver a comprendre et a demontrer que 1'origine de ce comportement bizarre se trouvait dans le mouvement de la Lune autour de la Terre. Cependant. nous recapitulons les relations entre ces trois distributions. il faut interpreter ces limites avec precaution. —>• oo.3). II s'agit d'une experience recente faite au CERN sur un enorme anneau d'accelerateur de particules dont le perimetre est de 27 kilometres. Cependant. le mouvement de la Lune. Si c'est le cas. les experimentateurs du CERN ont eu besoin de determiner avec une tres grande precision 1'energie des particules qui tournent dans 1'anneau de Paccelerateur. La distribution de Gauss generale est caracterisee par deux parametres independants : la valeur moyenne et 1'ecart-type. assez curieux. Soulignons les conclusions a retenir. De plus. considerons un exemple physique instructif issu d'une experience reelle ou nous verrons le fonctionnement du theoreme central limite dans sa deuxieme formulation ainsi que ses conditions de validite.

. il ne faut pas oublier "le point faible" de ce theoreme : comme c'est un theoreme limite. Pour controler la deviation a la loi gaussienne et savoir combien de mesures sont necessaires. une analyse plus approfondie est indispensable : elle est 1'objet des paragraphes suivants. de Poisson et de Gauss Neanmoins.RAPPELS SUR LA THEORIE DBS PROBABILITES 49 Figure 1.I . le nombre de mesures doit etre grand. et done 1'experience peut devenir chere.12 : Les relations entre les distributions binomiale.

.Cette page est laissée intentionnellement en blanc.

la moyenne de cette distribution sa variance Quelle est alors la fonction de distribution de probabilite g(y) d'une variable aleatoire y (en particulier. Nous nous limitons. en statistique.1. dans le cas de la distribution de Gauss qui est la plus frequemment rencontree dans les experiences.x : . p. pour 1'instant. le phenomene de la propagation des erreurs.1 FORMULE DE PROPAGATION DES ERREURS Commengons simplement par chercher la relation entre px et cr^.1 PROPAGATION DES ERREURS Au chapitre precedent. 2. Developpons cette fonction en serie de Taylor au voisinage de x — p.CHAPITRE 2 FONCTIONS D'UNE VARIABLE ALEATOIRE On peut formuler un probleme assez general et tres important pour les applications physiques. Ceci est vrai. Elles peuvent meme etre suffisantes pour decrire toute la distribution et Ton les interprete alors comme valeur de la grandeur et son incertitude (erreur). d'une part et p.y et <jy) lorsque la relation entre y et x est donnee par une fonction connue y = y(x) ? C'est. au cas d'une seule variable y = y(x). 2. en particulier. C'est pourquoi nous aliens trouver d'abord la relation entre les moyennes et les variances de x et de y — y(x). Supposons que soit connue la fonction de distribution de probability f(x) d'une variable aleatoire x (en particulier.y et <7y. La relation entre les variances porte le nom de la formule de propagation des erreurs. nous avons vu que la valeur moyenne et la variance sont les caracteristiques majeures d'une distribution de probabilites. d'autre part.

52

ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES

La valeur moyenne de y est egale a

L'approximation standard consiste a negliger dans cette expression tons les termes sauf le premier :

C'est un resultat qui pourrait sembler evident mais cette expression est approximative. Elle n'est exacte que si la fonction y(x] est lineaire. D'une fagon tout a fait analogue, nous pouvons calculer la variance de y :

A partir du developpement en serie de Taylor (48) nous avons :

Pour conserver la coherence de nos expressions, gardens uniquement le terme lineaire. Alors,

soit

II s'agit encore d'une expression approchee qui ne prend une valeur exacte que si la fonction est lineaire. Nous reviendrons sur la precision de cette approximation a la fin du chapitre. Nous pouvons generaliser les resultats (49) et (50) au cas de plusieurs variables. Soit une fonction de n variables. Pour abreger, utilisons des notations "vectorielles" :

ici Developpons la fonction en serie de Taylor au voisinage de x = jl. Au premier ordre, on obtient :

Cette expression donne pour la valeur moyenne

II — FONCTIONS D'UNE VARIABLE ALEATOIRE et pour la variance :

53

Supposons que les variables xi soient independantes (nous verrons dans ce chapitre le cas plus general sans cette hypothese supplementaire). Alors

Finalement, pour 1'ecart-type <r y , on obtient :

Nous avons ainsi resolu le probleme pose au debut du paragraphe. L'expression (54) permet de calculer 1'ecart-type ay de y si les ecarts <7Z- de Xi sont connus. Reecrivons cette derniere formule en remplagant 1 ax et ay par Aa? et Ay :

Ici, toutes les derivees sont calculees pour x\ — Hi, x-2 = jJ>2, • • • , xn — Hn, c'est-a-dire que tous les x^ doivent etre remplaces par leurs valeurs moyennes fa. Soulignons encore une fois que pour obtenir cette expression nous avons utilise deux hypotheses importantes : la premiere est 1'independance des grandeurs a?,-, la deuxieme est que, dans le developpement en serie de Taylor de y, nous nous limitons seulement aux deux premiers termes. 2.1.2 EXEMPLES DE PROPAGATION DES ERREURS

Les exemples les plus simples et les plus frequents concernent la somme et le produit (ou le rapport) de deux valeurs physiques. Pour la somme de deux valeurs x\ et x-i

['expression (55) s'ecrit

car les deux derivees sont

1

Rappelons que, dans ce livre, nous conservons les "anciennes" notations A:r au lieu de ux.

54

ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES

Pour le produit de deux variables

les derivees sont

et la formule (55) donne

Dans cette expression ainsi que dans les expressions suivantes nous ecrivons x\ et x% a la place de /^i et ^. Ce choix est volontaire car experimentalement il est possible de determiner mXl et mX2 et non //i et ^2- Pour ne pas introduire chaque fois de nouvelles notations, gardens partout x\ et x-± qui ne representent pas des fonctions mais des valeurs experimentales. D'une fagon analogue, pour le rapport

nous obtenons

Les deux dernieres expressions de Ay peuvent etre reunies sous une forme plus commode si Ton passe a 1'incertitude relative Ay/y :

Cette formule se generalise facilement au cas du produit et du rapport d'un nombre arbitraire de n variables :

Les formulas (56) et (58) ont une structure similaire : la racine carree d'une somme de carres. Pour des estimations rapides et simplifiees, on applique les majorations suivantes :

et

II — FONCTIONS D'UNE VARIABLE ALEATOIRE 55 (on "deduit" parfois cette formule en calculant la derivee de log y). L'expression (55) ou les cas particuliers (56) et (58) donnent une idee sur la fac. Ceci s'explique simplement car 1'augmentation de 1'incertitude en fonction du nombre n des variables est en ^Jn dans 1'expression (58') et en n dans la majoration du type (60). Par exemple. La difference entre la vraie valeur de 1'incertitude (58) et sa majoration (60) peut etre importante. Parfois. Pour le faire nous calculons les derivees : et obtenons 1'expression suivante de 1'incertitude sur y : Le probleme est que. nous obtenons toujours un resultat "complique" et qu'ainsi la probabilite d'avoir une erreur arithmetique lors de la derivation ou lors des applications numeriques est tres grande. nous rencontrons des fonctions plus compliquees. . Cependant 1'utilisation de ces majorations n'est justifiee que si Ton veut une evaluation grossiere de Pincertitude. Cette approximation donne une erreur supplementaire de 10% dans les calculs d'incertitude (c'est une erreur de deuxieme ordre). Prenons un exemple : Nous pouvons appliquer la formule (55) directement. la formule exacte donne une incertitude Ay/y = 7%. pour des fonctions compliquees. II est preferable de proceder autrement : on decompose la fonction initiale en fonctions elementaires et on fait les operations successivement. plus la difference est grande. Si une des incertitudes est seulement trois fois plus petite que les autres. on obtient aisement les incertitudes : La probabilite d'erreur dans cette approche est beaucoup plus faible. tandis que sa majoration conduit a une valeur beaucoup plus grande : 10% ! Plus les variables sont nombreuses. Dans 1'exemple precedent : Pour chaque formule.on de diminuer 1'incertitude : il faut toujours se battre contre la plus grande incertitude. si 1'on suppose des incertitudes relatives sur Xi de 5%. on peut pratiquement la negliger. Le meilleur choix des conditions experimentales (des appareils et des methodes de mesure) consiste a avoir si possible les memes contributions de toutes les variables differentes dans 1'expression (55). ce qui minimise cette incertitude.

pour Azi. par exemple. celle de permettre d'analyser facilement le role et la contribution de chaque variable #. La distribution de Gauss est remplacee par la distribution ^2 (voir paragraphe 3. y est aussi distribute selon une loi normale. II faut en profiter car le gain de temps dans le calcul de 1'incertitude peut etre assez grand. II existe des situations ou la derivee y'(^) s'annule et cette approche n'est plus valable. Dans sa demonstration. II faut souligner que 1'exemple precedent n'est pas artificiel.3). surtout pour des mesures repetitives. Le resultat est y = 2. Autrement dit.56 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES II existe un autre avantage a cette procedure. Par exemple pour la fonction y = cotg x et .-. Ainsi. 1'incertitude sur y est egale a une expression beaucoup plus simple que (61). nous remplagons lafonction y = y(x) par la fonction lineaire : Cette hypothese signifie que la forme de la distribution reste inchangee : si x. De plus. Soient Nous voulons calculer 1'incertitude de y a 10% pres. La raison de ce phenomene un peu etrange est liee au fait qu'il est difficile d'effectuer une experience ou toutes les sources d'incertitudes ont la meme importance : il existe une ou deux incertitudes dominantes.1. 5 ± 0. nous avons suppose que le developpement en serie de Taylor peut etre limite a la derivee premiere. est distribute selon une loi normale. nous obtenons 1'expression Finalement. 2. II existe des situations moins "dramatiques" ou la derivee est non nulle mais ou il faut tenir compte des derivees superieures.1 et ainsi. Notons une fois de plus que notre expression (55) n'est pas une formule exacte. cette analyse par etapes est utile pour elucider les veritables sources d'incertitudes et ainsi prevoir des possibilites d'amelioration de 1'experience. Un exemple est donne par la fonction y = x2 avec // = 0. 1'expression de Az2 peut etre simplifiee par Nous notons aussi que Az% ~ 1 est beaucoup plus grande que Axi = 0. Nous voyons que Ax2/x% est beaucoup plus grande que A£3/£3.

1. Dans notre cas. lors de la discussion sur les intervalles de confiance.II — FONCTIONS D'UNE VARIABLE ALEATOIRE 57 C'est la raison assez differente de pour laquelle. La valeur de y ne suit plus une distribution de Gauss. a peu pres 68%. yexp + A 3/2] reste "gaussienne". C'est pourquoi il faut toujours se souvenir que notre approche approximative n'est correcte que si les incertitudes restent petites. Conformement au (51). a la fin du chapitre. cependant. 1'ecriture yexp i Ay est remplacee par :)| et At/2 = \y(x — Aar) — y(x}\. Nous considerons le passage de n variables {xj} a n variables {yi} liees entre elles par des relations generates : Nous voulons trouver la relation entre les matrices de covariance de x et de y. Ce phenomene peut apparaitre meme pour un monorne y = xn lorsque x n'est pas tres grand par rapport a Ax.3 CAS DES VARIABLES CORRELEES Cherchons a generaliser la formule de propagation des erreurs (54) au cas de plus de deux variables correlees. y). . nous avons : en accord avec (52). pour les fonctions "rapides". Nous reviendrons sur cet aspect du probleme. D(y) = cov(y. 2. Nous utilisons la lettre D pour cette matrice dans le but de souligner sa relation avec la variance (24). De maniere analogue a (23). la probabilite que la vraie valeur de y se trouve dans Pintervalle [yexp — Ayi. on defmit la matrice de covariance par : De meme.

pour les valeurs moyennes apparaissant dans (63). Dans notre exemple illustratif du paragraphe 1.5. nous avons des expressions plus compliquees que (53) : L'expression (assez volumineuse) de la matrice de covariance D(y] peut etre ecrite sous une forme beaucoup plus compacte si Ton introduit la matrice du Jacobien de la transformation (62) : Toutes les derivees sont calculees au point x = jl.58 ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES Un element cov(yi.yj) de la matrice de covariance D(y) s'ecrit lei. nous avons choisi une transformation lineaire Solent xi et x? deux grandeurs physiques independantes avec la meme moyenne /j et la meme variance d1. A I'aide de cette matrice ('expression (63) s'ecrit : la matrice J^ etant la matrice transposee de J.1. Introduisons deux grandeurs y\ et y^ qui leur sont liees par une relation lineaire : la matrice de covariance de x est diagonale : la matrice du Jacobien s'ecrit comme .

Si nous connaissons le courant / qui traverse la resistance et la tension U aux bornes de celle-ci. considerons un exemple dans lequel nous voulons determiner la valeur d'une resistance R ainsi que la puissance P degagee par cette resistance. nous donnerait en contradiction evidente avec (67).I. Done. lei. Ou se trouve I'erreur dans notre raisonnement ? Pour obtenir I'expression (55) nous avons utilise I'independance des variables. compte tenu de (66). Cette relation. nous pouvons determiner P a partir de la formule P = RI2. R : . la relation (68) n'est pas correcte. aux variables P.II .FONCTIONS D'UNE VARIABLE ALEATOIRE et ainsi la matrice de covariance D(y] est donnee par : 59 Comme illustration de la formule de propagation des erreurs dans le cas des variables correllees. En ayant calcule la valeur de la resistance R — U/1. Pour montrer formellement la correlation entre R et P nous utilisons la procedure decrite au debut du paragraphe et nous calculons le Jacobien (64) de passage des variables U. cette hypothese n'est pas satisfaite car R et / ne peuvent pas etre consideres comme variables independantes. nous trouvons immediatement Les incertitudes relatives sur R et P sont selon (58) et Nous aurions pu choisir une autre approche.

P. a partir de P = R. L'incertitude sur P s'ecrit alors : En utilisant les expressions des derivees . calculons d'abord cov(Pt. /). Pour retrouver I'expression correcte de AP. nous avons : En vertu de I'independance de deux variables / et U Done. alors que les elements non diagonaux nous donnent la covariance de R et P II est interessant de remarquer que la correlation entre P et R est nulle lorsque les contributions a I'incertitude AP et A/?. D'apres (63). R) prend la forme Comme il se doit nous retrouvons sur la diagonale les expressions des incertitudes qui peuvent etre reecrites sous les formes (67) et (66) respectivement. de la tension et du courant sont identiques II s'agit d'un argument supplementaire pour effectuer les mesures en faisant en sorte que toutes les contributions des differentes sources d'incertitude soient a peu pres les memes. compte tenu de la correlation entre R et /.60 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES La matrice de covariance (65) D(P.

FONCTIONS D'UNE VARIABLE ALEATOIRE et la formule (69). 2. que cette fonction y = y(x] est biunivoque. Nous presentons sur la figure 2.II .2. c'est-a-dire qu 'a une valeur de x correspond une seule valeur de y et inversement.1 un exemple de fonction de ce type.1 FONCTION BIUNIVOQUE >us Nous supposons.1 : Une fonction biunivoque y = y(x) Nous savons que la probabilite de trouver la valeur de x dans I'intervalle compris entre x et x + dx est egale a : . Figure 2. 2. tout d'abord.2 DISTRIBUTION DE PROBABILITE D'UNE FONCTION DE VARIABLE ALEATOIRE Nous pouvons maintenant resoudre un probleme plus complexe et trouver la fonction de distribution de la variable y = y(x] qui est une fonction d'une variable aleatoire x. nous obtenons 61 en accord avec les expressions (66) et (67).

II faut d'abord introduire toutes les branches univoques pour la fonction inverse : x\ — x\(y\x-2 — x^y]. d'abord.2). . . introduire la fonction inverse : Ceci est possible car notre fonction y(x) est biunivoque. C'est pourquoi nous defmissons si la derivee dx(y)/dy est positive..62 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Nous cherchons la fonction g(y) qui nous donne la meme probabilite de trouver la valeur de y dans I'intervalle compels entre y et y + dy : II suffit de reecrire (70) en remplacant x par y.. la tache devient un peu plus compliquee. puis faire la somme sur toutes ces branches (la probabilite de trouver y dans I'intervalle entre y et y + dy est egale a la somme de toutes les probabilites d'apparition de x entre Xi et Xi -f dxi]. On a alors II nous reste a remplacer dx par dy comme nous le faisons dans les changements de variables d'integration. et si la derivee dx(y]/dy est negative. Pour cela nous devons.Xk = Xk(y).2 CAS GENERAL Si la fonction y = y(x] n'est pas biunivoque (figure 2. Les deux dernieres expressions peuvent etre reunies sous une forme compacte : Les formules (72) et (73) nous donnent La comparaison avec (71) nous permet d'obtenir le resultat final : 2. La seule difference reside dans le fait que la densite de probabilite ne peut jamais etre negative..2.

avec une fonction de distribution de probabilite de x egale a f(x). La fonction y(x) = x2 n'est pas biunivoque car pour deux valeurs de x differentes on peut avoir la meme valeur de y : y(x) — x2 — ( — x } 2 . II existe done deux branches de la fonction inverse : Leurs derivees sont : Ainsi la densite de probabilite g(y] est donnee par soit .II — FONCTIONS D'UNE VARIABLE ALEATOIRE 63 Figure 2.2 : Une fonction non biunivoque y — y(%) Ainsi la generalisation de I'expression (74) s'ecrit Prenons I'exemple y(x) = x2.

1'etude experimentale se fait dans le systeme dit du laboratoire. . .. .3 EXEMPLE PHYSIQUE Pour montrer 1'importance de ce type de problemes. Cependant. . Avant la collision dans le referentiel du laboratoire.yn) = d(y) a I'aide d'une relation qui est la generalisation de (74) etablie dans le cas d'une seule variable. un des corps etait au repos. x < 2 . on introduit un systeme des coordonnees correspondant au centre de masse car c'est dans ce referentiel que la description theorique de 1'interaction entre les deux corps est la plus simple. • . Alors la densite de probabilite /(xi. il faudra faire la somme sur tous les branches comme on I'a fait pour une fonction y — y(x). autrement dit. La densite de probabilite g(y) est ou |5(a?i. Apres la collision. . un corps se deplace avec une vitesse VQ et le deuxieme est fixe. 7/2. II faut introduire la transformation inverse Xi = Xi(yi. . non seulement pour la statistique mais egalement pour la physique en general prenons un exemple illustratif. les deux particules out des vitesses V\ et V<2 qui font les angles 9\ et 9-2 avec le vecteur VQ. Ainsi les lois de conservation de 1'energie et de I'impulsion .3 b).. xn)/d(yi. Pour les fonctions qui ne sont pas biunivoques..2. par exemple. D'apres les principes bien connus de la mecanique. La seule difference est la presence du module deja discutee prcedemment. . # 2 . . Habituellement. £2. xn = x a n variables independantes j/i. . y % .3 a) et dans le systeme du centre de masse (figure 2. Supposons que nous connaissions les caracteristiques de 1'interaction dans le systeme du centre de masse avec. .= y«(a?i. • • • . La collision est elastique. avant la collision. On peut les facilement generaliser au cas ou nous voulons passer de n variables independantes x\. II s'agit d'une collision elastique entre deux corps (deux particules) de meme masse m. rappelons la relation entre les angles de diffusion dans le systeme du laboratoire (figure 2.yn) = X i ( y ) . quelle sera la distribution angulaire dans le systeme du laboratoire ? Avant de chercher la relation entre les deux fonctions de distribution angulaires. • • • 5 #n) = yi(x). Qu'observonsnous experimentalement. x^. yn}\ est la valeur absolue du Jacobien de cette transformation. c'est-a-dire dans le systeme ou.. 2.y2j . • • • > 2/n = y a I'aide d'une transformation y..64 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Les formules obtenues sont valables dans le cas d'une fonction d'une variable y = y(x). . . . Cette formule est analogue a celle utilisee pour un changement de variables d'integration. y 2 . c'est-adire que la structure interne des particules reste intacte et que 1'energie cinetique est conservee. xn) = f(x) (voir (18)) se transforme en une densite de probabilite </(yi. nous savons que le mouvement des deux corps est la resultante du mouvement du centre de masse et du mouvement relatif par rapport a ce centre. une distribution angulaire isotrope des particules apres la collision.

par exemple.II — FONCTIONS D'UNE VARIABLE ALEATOIRE 65 Figure 2. la premiere relation. les vitesses sont egales a : Si Ton represente graphiquement (figure 2. on voit toute de suite que .3 : Les vitesses et les angles dans le systeme du laboratoire (a) et dans le systeme du centre de masse (b) nous montrent que V\ et Vz sont perpendiculaires : La vitesse du centre de masse est egale a Dans le systeme du centre de masse (figure 2.3 b). Dans le systeme du laboratoire apres la collision. les modules des vitesses restent inchanges en vertu de 1'elasticite de la collision : et la collision donne lieu "simplement" a une rotation d'un angle x Qui egt 1'angle de diffusion dans le systeme du centre de masse. les particules ont les vitesses v{ et V2 de modules egaux mais de directions opposees : Apres la collision.4).

Par ailleurs. Du point de vue mathematique.5. bien evidemment. on peut economiser du temps en restreignant les mesures a 9\ < 7T/2. nous pouvons reecrire / C m(X. De plus. Vu la relation entre les angles solides (79). nous avons vu que le changement des variables angulaires implique une modification de la forme de la distribution (la fonction constante a ete remplacee par une fonction lineaire). reste invariant et nous le designerons par <p. Cela signifie que la probabilite dP que la particule 1 parte dans un angle solide dQcm divisee par d£lcm ne depend pas de Tangle : La valeur de cette constante est egale a 1/47T car la probabilite est normee a 1. I'angle solide dans le systeme du centre de masse d$lcm = siuxdxdtp e§t lie a Tangle solide dans le systeme de laboratoire d£liab = sinOidOidp par la relation Comme nous 1'avons dit. V7) s°us la forme Ainsi nous avons la distribution angulaire dans le systeme du laboratoire qui d'apres (78) s'ecrit : Les deux fonctions de distribution sont representees sur la figure 2.66 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Figure 2.4 : Relation entre les angles dans le systeme du laboratoire et dans le systeme du centre de masse Deux relations lient les angles polaires de diffusion dans les deux systemes. La conclusion physique est tres simple : une distribution angulaire isotrope dans le systeme du centre de masse se manifestera experimentalement par une distribution anisotrope dans le systeme du laboratoire. . dans le systeme du centre de masse la distribution angulaire est isotrope. L'angle azimutal.

4 PRECISION DE LA FORMULE DE PROPAGATION DES ERREURS Nous avons deja souligne que la formule de propagation des erreurs. nous pouvons calculer exactement la variance de y : . est une formule approchee (sauf dans le cas presque trivial d'une fonction lineaire).II .2.2. sur 1'importance de la difference entre y — x2 et y ~ ~x2. largement utilisee dans le traitement des resultats experimentaux. nous pouvons obtenir 1'expression exacte de la variance a^ sans utiliser la formule de propagation des erreurs.L'expression (80) contient un nombre fini de termes : une constante Ui «2 . x-2 ~ fJ. les contributions avec les derivees premieres et un seul terme avec les derivees secondes puisque Compte tenu de 1'independance de x\ et #2. alors que toute la statistique est basee. Dans certains cas. Considerons Pexemple tres simple d'une fonction produit de deux variables independantes : Cette fonction peut etre mise sous la forme equivalente : c'est-a-dire sous la forme d'un developpement en serie de Taylor au voisinage du point xi = //!.5: Les distributions angulaires dans le systeme du cnetre de masse (s) et dans le systeme du laboratorie(b) 2. Cette approximation est parfois assez grossiere puisque pour obtenir la formule de propagation des erreurs nous avons utilise la relation (49) : y(x) ~ y(~x).FONCTIONS D'UNE VARIABLE ALEATOIRE 67 Figure 2. par la definition de la variance.

Pour obtenir une expression plus precise de la variance. La valeur moyenne de y prend alors la forme ou apparait le troisieme moment de la distribution pxs = (x — x)3 introduit en (12). si x est decrite par une distribution gaussienne. Ainsi. nous pouvons exprimer tous les moments d'ordres superieurs a 1'aide de la variance (voir (27)). La question qui se pose est de savoir s'il . Cependent des problemes majeurs apparaissent dans cette voie. pour la variance. c'est un exercice simple. Techniquement. mais le probleme vient du fait que la variable y n'est plus gaussienne (on peut verifier que la distribution de y est asymetrique : ny3 7^ 0). qui caracterise I'asymetrie de la distribution de x. que dans la plupart des situations. Cette proposition apparait dans certains livres sur 1'analyse des donnees. bien qu'il soit assez penible (il faut faire tres attention et garder correctement tous les termes de meme ordre dans le developpement et dans les calculs intermediares). developpons cette fonction en serie de Taylor au voisinage de x — px = ~x : Nous conservons volontairement le terme du troisieme ordre car il donnera en fait une contribution a la variance du meme ordre que le terme du seconde ordre.68 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES La formula de propagation des erreurs (57) est obtenue en negligeant le dernier terme dans le developpement (80). un ecart-type <jy a une interpretation precise. nous travaillons avec des distributions gaussiennes. on a sacrifie la simplicite de la description des grandeurs physiques. Ainsi cette formule conduit a une erreur supplemental dans le calcul de (Ay) 2 = a^ egale a 2 9 « • On pourrait penser qu'il est facile d'ameliorer la formule de propadgation des erreurs en poussant plus loin le developpement de la fonction en serie de Taylor. Quand la distribution de y est gaussienne. La prise en compte du terme lineaire dans la formule de propagation des erreurs nous garantit la conservation du langage utilise (la variable y est aussi decrite par la distribution normale). Considerons 1'exemple simple d'une fonction d'une seule variable y — y(x). II est vrai que. Le probleme est resolu formellement mais le prix a payer est 1'introduction de moments centraux d'ordres superieurs non utilises jusqu'a present et dont la determination experimentale peut s'averer delicate. Comme pour la formule de propagation des erreurs. nous obtenons ou est en outre introduit le quatrieme moment ^4 = (x — x}4. Rappelons. Dans le cas contraire il peut la perdre.

. Soient x± et X2 deux variables gaussiennes.II — FONCTIONS D'UNE VARIABLE ALEATOIRE 69 est Pinteressant d'obtenir une expression plus precise de 1'incertitude d'une grandeur physique si Ton ne peut plus 1'interpreter avec precision. II faut passer des variables x\ et x^ aux variables y et z = #2 (cette derniere joue le role d'une variable auxiliaire) et integrer sur z.<C fJ-i).B/2VA. Pour simplifier les relations. B) est classique : il faut utiliser la methode de derivation par rapport au parametre B : La derniere integrale se remene a I'integrale connue (25) par le changement lineaire de variable y = VAz .2. Pour mieux comprendre. la fonction de distribution g(y) de la variable y prend la forme Le Jacobien de la transformation x\ — yz. x% = z est egal a Ainsi I'integrale g(y) prend la forme Cette derniere integrale peut etre calculee si Ton utilise la valeur de I'integrale auxiliaire2 2 L'astuce pour calculer J(A.• sont positives et que les incertitudes sont faibles par rapport aux valeurs moyennes (<rz.Cela signifie que la distribution cherchee reste proche d'une distribution gaussienne. Quelle est la distribution de leur rapport Appliquons 1'approche generale presentee dans le paragraphe 2. supposons que les valeurs moyennes //. Si /(#i) et /(x^) sont les fonctions de distribution des variables x\ et x-z selon (77).2. etudions sur un exemple le "passage" d'une distribution gaussienne a une distribution plus complexe.

lorsque les incertitudes relatives sont faibles (<TJ <C Hi).6 : La fonction de distribution g ( y ) de y = x\jx2 (ligne continue) comparee a une fonction gaussienne (ligne pointillee). Un exemple d'une telle distribution est trace sur la figure 2. Figure 2.6 (pour /^i///2 — 1. On constate que. mais remplacer partout ailleurs y par yo) avec une largeur ay dont le carre est egal a . la fonction de distribution g(y) est tres proche d'une gaussienne : c'est une fonction qui est tres piquee au voisinage de y = yo = pi/Hz (on peut done garder la dependance rapide de y dans la fonction exponentielle.70 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES on trouve finalement apres quelques calculs laborieux mais sans difficulte majeure Dans cette expression La fonction (81) s'ecrit sous une forme qui ressemble beaucoup (surtout si Ton fait 1'approximation supplementaire AQ(y)/A 2 (y) w 1) a la distribution de Gauss. mais sa largeur depend de y.

une telle approche est indispensable pour rester precis dans la description des donnees (sans approximer les distributions de toutes les grandeurs par une loi gaussienne). . en premiere approximation. grace a 1'augmentation du nombre de termes dans le developpement en serie de Taylor. jj. determinees par un ou plusieurs parametres.FONCTIONS D'UNE VARIABLE ALEATOIRE 71 Done. la difference entre ces deux fonctions est evidente. on peut remarquer que la fonction g(y] n'est pas tout a fait symetrique par rapport a y = yo et aucune gaussienne. on constate que "Pamelioration" de la formule de propagation des erreurs. On remarquera que la nouvelle fonction (81) depend de trois variable yo = ^1/^2. meme avec une largeur calculee a partir de la formule de propagation des erreurs amelioree.3 NlVEAU DE CONFIANCE ET INTERVALLE DE CONFIANCE Nous avons deja etudie des distributions tres differentes : symetriques et asymetriques . &2 restera toujours inconnue mais on pourra avoir les rapports entre elle et les autres). des mesures precises de la fonction de distribution g(y) peuvent permettre d'avoir non seulement des informations sur la variable y mais aussi sur x\ et x<± (une des quatre caracteristiques des distributions initiales //i. Sans doute.II . 2. Cependant.2. demi-infini et infini . Mais cela n'a pas beaucoup d'interet puisque 1'interpretation du resultat obtenu en termes de probabilites reste assez limite. Si nous conservons la meme approche. on retrouve une distribution gaussienne avec une moyenne yo = ^1/^2 et une incertitude ay en parfait accord avec la formule de propagation des erreurs (55).6 ou la fonction de distribution (81) est comparee avec une fonction gaussienne pour laquelle la moyenne y sup et la variance <r^u sont calculees a 1'ordre superieur du developpement en serie de Taylor3 Notons que ces valeurs sont tres proches de la moyenne /jy et de la variance cr^ calculees avec la fonction de distribution (81) : Neanmoins. Si Ton veut ne pas se limiter a de cette approximation. la description des donnees experimentales devient assez lourde (pour chaque grandeur physique on est oblige d'indiquer la loi de probabilite et ses parametres). ne peut decrire correctement cette distribution. <TI//-II et o~2/H2i tandis qu'une gaussienne ne depend que de deux variables. definies sur un intervalle fini. il est possible de 3 Nous laissons au lecteur le soin de retrouver ces expressions. ne represente aucune dimculte. Ce fait est illustre sur la figure 2. <TI. En conclusion de ce paragraphe. En principe.

0% correspond r = 1. et cr.2. On pent commencer par le cas le plus simple. 9% correspond r = 3. Bien sur. celui d'une distribution de Gauss. + ra\ pour diverses valeurs de r A 1'inverse. Pour une distribution de Gauss.1 : Probabilite Pr (en %) pour que la valeur d'une variable gaussienne x soit dans 1'intervalle [p. Par exemple. . on peut la decrire par 1'intervalle [#1. on choisit les niveaux de confiance de 68 % ou 95 %. Autrement dit. a une interpretation rigoureuse en termes de probabilites. 00% correspond r .960. 576 et a Pr = 99. on peut choisir une valeur quelconque de r (et la valeur de Pr correspondante). nous avons vu qu'une grandeur decrite par cette loi de probability est entierement definie par deux valeurs [i et a et que le resultat. X? = n + ra] est donnee pour 7 valeurs de r. Plus la probabilite est elevee. par exemple. Cette probabilite s'appelle le niveau de confiance et 1'intervalle correspondant rintervalle de confiance. et cr d'autre part. connaissant Pr. ecrit sous la forme // ± cr. La notion unificatrice sera. 290. x?] et la probabilite Pr. a une probabilite Pr = 95. Pour fj. bien evidemment. celle de probability.72 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES proposer une autre forme de description des donnees experimentales qui permet. Dans le Tableau 2. au moins en premiere approximation. et a donnes et Pr choisie. sont simples. p. — ra. on peut toujours determiner r et ainsi trouver 1'intervalle de confiance. Et inversement. alors r = 2 et on peut calculer // = \(x\ + #2) et <r = \(x-2 — x\). a Pr = 99.2. et les valeurs de fj. Si. on peut retrouver // et a. #2] (voir paragraphe 2. d'unifier les resultats de distributions differentes. Tableau 2. Dans le paragraphe 1. Pr = 95 %. Autrement dit.2:2] et par la probabilite Pr de trouver x dans cet intervalle. les relations entre les niveaux de confiance et les intervalles de confiance correspondants d'une part. mais les intervalles les plus frequemment utilises sont ceux qui correspondent a un (r = 1) ou deux (r = 2) ecart-types. si 1'on connait [#i. si 1'on connait // et a on peut donner la probabilite Pr pour que x prenne une valeur dans 1'intervalle de x\ = n — r<r a #2 — H + rcr (quelle que soit la valeur de r] : Au lieu de caracteriser la variable x par \i. pour presenter un resultat.1). on calcule facilement 1'intervalle [a?i.1 la probabilite Pr pour que x soit incluse dans 1'intervalle symetrique [ # i = / / — rcr. plus grand est 1'intervalle correspondant (pour que 1'on soit certain de trouver x dans cet intervalle).

qu'elle est aisement generalisable aux autres distributions.II — FONCTIONS D'UNE VARIABLE ALEATOIRE 73 Les avantages d'une telle presentation sont. une particule se manifeste par un signal x dans un detecteur. C'est pour ce type de resultats qu'il est utile d'introduire des niveaux de confiance dont 1'intervalle est limite d'un seul cote. Notons qu'un tel language permet de presenter d'une fagon tres informative un autre type de resultats experimentaux : les resultats negatifs. mais on continue jusqu'au jour ou 1'on obtient un resultat positif. Quand un resultat negatif est obtenu. D'habitude. c'est une particule qui serait responsable de 1'existence de la masse de toutes les autres particules) : les recherches de cette particule out debute il y a plus de quarante ans mais n'ont toujours pas abouti. c'est-a-dire le fait qu'un phenomene attendu n'est pas observe. et ce. le nombre de mesures effectuees) ce probleme peut etre resolu. par exemple. que. on peut decrire le resultat observe par le niveau de confiance Pr et 1'intervalle de confiance [xi. avec une certaine probabilitee Pr(x < xi). Des exemples d'utilisation des niveaux et des intervalles de confiance seront presentes lors de la discussion d'utilisation de la distribution de Student (pour un nombre limite de mesures) ou encore de la distribution %2 (pour 1'ajustement des parametres). xz] II est vrai que pour une distribution non gaussienne. On a alors affaire a un intervalle unilateral (contrairement a un intervalle bilateral introduit au depart). La probabilite que x soit plus petit que x\ est alors egale a Avec une distribution de Gauss. par exemple. mais si Ton dispose d'une information exhaustive (forme de la distribution et autres parametres necessaires comme. proposee par Yukawa. la determination de la moyenne et de la variance a partir de Pr et [xi. Quand aucun signal n'est enregistre. Quelle que soit la distribution /(a?). on peut facilement trouver la valeur de xi (ou de r) telle que la probabilite d'obtenir x < x\ = // + rcr. soit egale a Pr : . on peut considerer que ce signal est inferieur a une certaine valeur xi. ou du positon (antiparticule de 1'electron) dont 1'existence avait etc predite par Dirac.X2] peut etre plus complexe que pour une distribution gaussienne . On a cherche ainsi la particule vehiculant 1'interaction forte. qu'elle est suffisamment informative (elle nous donne le domaine de variation de la valeur de x et la probabilite de 1'y trouver) et. Aujourd'hui recherche le boson de Higgs (selon les modeles actuels. d'autre part. dans le domaine de variation des parametres ou la recherche a ete menee. d'une part. on ne la trouve pas. la probabilite de trouver une particule est inferieure a une certaine valeur. Toute la physique des particules en est une bonne illustration : pendant tres longtemps on cherche une particule. on peut quantifier cet echec : on peut dire.

00 69.74 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Evideminent.32 97. par soustraction.5 3. + rcr r 0.5 Pr 50.15 84.5 1.0 2.0 1.0 3. Tableau 2. on obtient facilement les intervalles bilateraux.5 2.0 0. pour une meme probabilite Pr.98 . Quelques exemples numeriques sont donnes dans le Tableau 2.2 : Probabilites Pr (en %) pour que la valeur d'une variable gaussienne x soit inferieure a /j.72 99.38 99. les intervalles unilateraux et bilateraux ne sont pas les memes.13 93. si Ton salt calculer les intervalles unilateraux. Par contre.2.87 99. et vice versa.

et de variance <r 2 . . D'abord.xn. Nous illustrerons ces etapes du travail et repondrons aux diverses questions precedentes.CHAPITRE 3 EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES Ce chapitre presente 1'interet d'expliciter la procedure a adopter dans telle ou telle situation experimentale. qui vont d'une consideration tres simple pouvant prendre quelques minutes jusqu'a une analyse assez sophistiquee a laquelle il faut consacrer beaucoup plus de temps. nous devons nous assurer qu'il est "raisonnable" et que notre analyse est bien autocoherente. A partir de ces mesures nous teutons de construire des valeurs qui tiendront lieu de moyenne fj. par analogic avec les definitions "theoriques". Nous essayons de montrer les differents "niveaux" d'un tel traitement. A priori. II faut souligner qu'en physique comme dans la vie la methode de traitement des resultats est choisie pour minimiser le rapport qualite/prix. nous devrons les interpreter en termes de probabilite. De plus. 3. de 1'effort et du temps que nous sommes prets a y consacrer. Ensuite. il est evident qu'avec un nombre fini de resultats {x^.1 ECHANTILLON. La seule information dont nous disposons est un ensemble de resultats. II comprend plusieurs paragraphes consacres a des questions precises qui apparaissent lors du traitement des resultats experimentaux.X2. nous introduisons la moyenne et la variance experimentales. il est difficile de connaitre la distribution de la valeur physique mesuree x et ainsi de determiner la valeur moyenne de la distribution /j. Le choix d'une analyse depend de la qualite du resultat que nous desirous obtenir. c'est-a-dire un nombre fini de mesures {xi} ~ xi. la moyenne et la variance experimentales ne sont plus suffisantes pour decrire la distribution de la grandeur physique x. . . La solution de ce probleme est construite en deux etapes. lors d'une experience. • .%3. et sa variance <r 2 . ayant obtenu un resultat. VALEUR MOYENNE ET ECART-TYPE En general.

la valeur moyenne de m est egale a (a comparer avec (19)) et la variance cr2^ a (voir la demonstration de la formule (17) et comparer avec (20)). Ainsi. surtout compte tenu du theoreme central limite. (Arm d'alleger les demonstrations nous n'ecrivons pas les integrates multiples pour exprimer les valeurs moyennes qui sont symbolisees par une barre). De plus. Le deuxieme probleme est celui de la variance.76 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Nous aurons done besoin de distributions plus compliquees que celles de Gauss et nous les presentons dans ce chapitre. Get ensemble de resultats {xi} s'appelle un echantillon. la fonction de distribution se factorise en un produit de fonctions de distribution (voir (18)). Soulignons le resultat deja etabli lors de la demonstration du theoreme central limite : 1'ecart-type de la valeur moyenne experimentale crm decroit comme l/^/n.1 DEFINITIONS ET PROPRIETES Une experience de physique donne un nombre fini de mesures. Pour n grandeurs independantes. 3. peut etre construite simplement comme la moyenne arithmetique de tous les resultats {x^} : Nous appellerons cette valeur la moyenne estimee a partir d'un echantillon ou plus simplement la moyenne experimental pour la distinguer de la vraie moyenne // que nous appellerons aussi la moyenne theorique. Comment a partir de ces resultats obtenir des informations sur la valeur moyenne // et sur la variance cr2 ? La reponse intuitive est presque evidente. La valeur qui remplace la moyenne /j. Par analogic avec la valeur moyenne on definit la variance experimentale comme . en vertu de ce theoreme. nous pouvons dire que la distribution de m devient de plus en plus proche de la distribution normale quand le nombre de mesures n augmente (pour 1'instant nous n'avons fait aucune hypothese supplementaire sur la forme de la distribution de x ) .1. Elle est la somme de n grandeurs independantes car nous supposons que les mesures {%i} sont independantes. Cette moyenne experimentale peut etre consideree comme une grandeur physique.

En fait. Pour calculer le deuxieme terme explicitons la difference Alors. la valeur moyenne de la variance experimentale s2 est egale a : Ecrivons le terme sous la somme en utilisant le fait que les valeurs moyennes de Xi et de ra sont identiques et egales a p : Le premier terme dans cette expression donne. en vertu de (84).2. cette valeur tend vers zero comme <r2 /n conformement a (84).EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 77 L'apparition de n — 1 a la place de n dans le denominateur peut paraitre un peu surprenante. Nous avons done a definir la variance s^ de cette grandeur (ou Fecart quadratique moyen] a partir des resultats experimentaux {xi}. Mais nous avons deja decide de travailler avec la moyenne m. II faut maintenant changer les conventions decrites au paragraphe 1. D'apres notre definition (85). le troisieme cr 2 /n.Ill . le veritable argument pour ce choix est la condition d'egalite de la valeur moyenne de la variance experimentale s2 et de la variance a2. nous obtenons la valeur moyenne de la variance : Ainsi nous avons construit une grandeur s2 qui. car dans cette somme il n'existe qu'une seule contribution differente de zero pour k = i. Cette definition est evidente : Lorsque n tend vers 1'infini. Mais on peut la justifier meme qualitativement : une seule mesure est suffisante pour avoir une information concernant la moyenne mais on a besoin d'au moins deux mesures pour pouvoir apprecier 1'ecart par rapport a la valeur moyenne. nous donne la vraie variance <r2 de la grandeur physique x. Desormais un resultat experimental sera caracterise par la valeur moyenne m (82) et par 1'ecart . Finalement. cr 2 . dans la limite d'un grand nombre de mesures. par definition.

78 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES quadratique moyen s^ (88). c'est pourquoi on fait 1'hypothese supplementaire que la grandeur x est distribute selon la loi normale. Nous devons savoir 1'estimer. Nous aurons egalement besoin des moments centraux m^ pour k > 3. 1'incertitude experimentale est donnee par la racine carree de sa variance. de y et du produit xy selon la defmtion (83). les deux valeurs m et sm ne sont plus suffisantes pour presenter toute 1'information experimentale (les deux definitions contiennent explicitement un troisieme parametre. Mais cette valeur sm etant une valeur determinee a partir des donnees experimentales. Le coefficient de correlation est alors egal a ou sx et Sy representent les racines carrees des variances expreimentales de x et de y defmies dans (86).1. la covariance de deux variables x et y est donnee par ou mx. le coefficient de correlation et les moments d'ordre superieur pour un echantillon. my et mxy sont les valeurs moyennes de x. Si 1'on veut calculer 1'erreur de s"L on doit calculer la variance correspondante : . qui peuvent etre defmis par 3. Soulignons que cet ecart est une caracteristique de m et represente ainsi 1'incertitude sur cette derniere valeur et non pas sur x. Ainsi. on peut defmir la covariance. Pour la valeur moyenne m. Par analogic avec les formules (86) et (83). on ne peut pas obtenir un resultat general pour toute distribution . La mesure de 1'incertitude est la racine carree de 1'ecart quadratique moyen. par exemple. le nombre de mesures n). comme cela a deja ete fait pour la distribution de Gauss. Plus tard nous completerons cette description et nous en donnerons une interpretation exacte a 1'aide des probabilites. Malheureusement. Si Ton veut determiner la variance de x il faut utiliser la definition (86). Le probleme devient facile a resoudre bien que sa demonstration soit assez longue. possede sa propre incertitude. autrement dit par sm.2 PRECISION DE LA VARIANCE EXPERIMENTALE ET CHIFFRES SIGNIFICATIFS II faut aller plus loin dans 1'analyse des nouvelles definitions. Bien evidemment.

les moments centraux pour k = 2 et k — 4. en vertu de la condition k ^ I dans la deuxieme somme. Nous obtenons trois termes. il contient seulement les puissances impaires de (xi — /u) dont la valeur moyenne est nulle (voir la remarque apres . en accord avec (12). est donne par ou nous avons introduit.EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES Pour calculer s^ ecrivons d'abord s^ sous la forme 79 peut etre mis sous la forme Ainsi s^ est donnee par Prenons le carre de cette expression et calculons la valeur moyenne s^ a un facteur multiplicatif n2(n — I)2 pres. Le premier. Le deuxieme terme est nul : car.Ill .

pour une distribution normale. Une erreur d'un facteur 2 dans Ax peut modifier completement les conclusions. Le resultat final pour s^ est : Du fait que. Sa connaissance est tres importante dans 1'analyse des resultats car elle est liee directement a leurs interpretations en termes de probabilites. pour le troisieme terme. nous avons du fait que les puissances impaires de (a?. les termes non nuls correspondent ai = k. dans ce produit. Nous reviendrons sur la formule (93) dans un paragraphe special consacre a la precision des incertitudes. Dans certaines situations.j = louj = k. on peut connaitre de maniere assez exacte la precision sur 1'incertitude Aa?. il est assez difficile d'avoir une tres bonne precision sur les incertitudes dans une experience : on a besoin de plusieurs dizaines de mesures pour s'approcher de la precision de 1'ordre de 10%. la variance D(s^) est donnee par Dans cette expression. i = 1. La precision d'une experience Aa? est determinee a partir des donnees experimentales et possede aussi sa propre incertitude..— /u) donnent zero . autrement dit. //2 = v"2 et /i4 = 3cr4 (voir (27)) : L'incertitude relative (34) sur la valeur de la variance experimentale est egale a Une fois de plus nous retrouvons une dependance de la forme \j\fn . on peut utiliser le fait que. ainsi. d'apres (88). Finalement.80 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES I'equation (26)). S'il s'agit d'une incertitude purement statistique nous avons montre que 1'incertitude relative sur la variance experimentale est d'apres (93) .

Pour 5 — 6 mesures. Le nombre de chiffres dans la valeur x doit etre coherent avec le nombre de chiffres dans 1'incertitude. Nous pouvons le regretter mais il faut s'en contenter en gagnant du temps de calcul comme nous 1'avons fait au paragraphe precedent. Si la precision de 1'incertitude est de 1'ordre de 10—30%.1.87611 • 10~5. il faut retenir un chiffre Ax = 5 • 10~5 si 6&x est proche de 30% ou deux chiffres Ax = 4. il faut retenir un ou deux chiffres significatifs dans 1'incertitude. Figure 3. Sa courbe est presentee sur la figure 3. Par exemple. La precision de 1'incertitude et le nombre de chiffres significatifs qu'il faut garder dans un resultat final sont directement lies (il vaut mieux conserver un peu plus de chiffres lors de calculs intermediaries pour eviter les erreurs d'arrondissement). 37685 • 10~3 avec une incertitude Ax = 4. 9 • 10~5 si S&. nous garderons trois ou quatre chiffres pour exprimer la valeur de xm.x est plutot proche de 10%.Ill . 38 • 10~3 ou xm = 1. 6&x est a peu pres egale a 1/3 et il faut effectuer une cinquantaine de mesures pour avoir une incertitude relative de 1'ordre de 10%. . Dans le resultat final de Ax. 377 • 10~3 respectivement.EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 81 Ax est proportionnel a la racine carree de s^ et ainsi son incertitude relative est egale a Soulignons que cette fonction decroit tres lentement avec le nombre de mesures n. Selon ces deux cas. nous obtenons difficilement une precision sur 1'incertitude superieure a 10%.1 : L'erreur relative sur 1'incertitude S^^ en fonction du nombre de mesures n En travaux pratiques. nous avons obtenu un resultat # exp = 1. soit xm = 1.

82 Le resultat final s'ecrit ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES 3. . g(y] represente une distribution gamma avec a — —1/2.xn par la fonction Supposons que les variables xi. . # 2 .2. . . /? = 2 et a une fonction generatrice Pour la somme des n variables independantes (95) nous pouvons utiliser la propriete (21) et ecrire la fonction generatrice de Xn '• Cette expression signifie que Xn a une distribution gamma avec a — n/2 — 1 et j3 = 2 : Ainsi nous avons trouve ce que Ton appelle la distribution de probabilite x2 • Sa valeur moyenne est et sa variance Quelques exemples de la distribution %2 sont donnes sur la figure 3. trouvons lafonction de distribution d'une variable aleatoire y liee aux variables aleatoires a?i. .3 DISTRIBUTION x2 Pour etidier les caracteristiques de la variance experimentale (85). . x % . avec une moyenne nulle et une variance unite.xn sont distributes selon une loi normale.1. . Pour une seule variable y(x) — x2 le resultat general a deja ete exprime par (76). Pour la distribution de Gauss cette formule s'ecrit comrne Autrement dit. . .

Notons simplement que le changement formel de variable y/2 —>• /j et n/2 — I —)• n nous donne la densite de probabilite pour la distribution de Poisson (36) qui tend vers la distribution de Gauss lorsque n —>• oo.Ill — EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 83 Figure 3. conduit a des relations utiles.16 Dans la limite d'un grand nombre de mesures n —> oo.3) pour la distribution de Poisson et pour la distribution x2 sont lies entre eux : Pour demontrer cette relation. les intervalles de confiance (voir paragraphe 2. Par exemple.2 : La distribution Xn P°ur n — 4. comme il se doit. la distribution x 2 tend. deja mentionee lors de la discussion de la distribution gamma. Nous ne demontrons pas ici ce resultat. on fait le changement de variable z = x/2 et on integre n fois par parties : . vers celle de Gauss. Notons que la ressemblance formelle entre ces deux distributions.8.

dvxdvydvz se transforme en 47rv2dv. prenons un exemple bien connu de la physique statistique : un gaz de particules sans interaction qui se trouve a 1'equilibre thermodynamique a la temperature T. Une question assez naturelle peut etre posee : oil et quand les autres variables ont-elles disparu ? Pour mieux voir et comprendre la technique de ce "tour de passe-passe". En posant e = 2E/kT et g(e}de = g(E)dE. z] de la vitesse des particules du gaz a une distribution maxwellienne : ou m est la masse des particules. c'est-a-dire la somme sur toutes les directions possibles. Le dernier pas concerne le passage de la vitesse a 1'energie : v = ^/2E/m et dv = dE/VZmE. on a soit une distribution %2 avec n = 3. Le parametre n dans la distribution de Xn es^ le nombre de degres de liberte. Dans cet exemple. Nous pouvons ecrire 1'element de volume dans 1'espace de vitesses dvxdvydvz sous la forme v dvdQv. Apres une telle sommation. Calculons 1'integrate sur £lv. y. vy et vy + dvy. La probabilite de trouver la particule avec une energie dans 1'intervalle compris entre E et E + dE est egale a : C'est une distribution gamma avec a = 1/2 et (3 = kT. ou v est le module de la vitesse et d£lv 1'angle solide dans cet espace. k la constante de Bolzmann. Chaque composante Vi (i — x. Quelle est la loi de distribution de 1'energie des particules ? L'energie est liee a la vitesse par une relation du type (95) : La probability de trouver les composantes de la vitesse dans les intervalles compris entre vx et vx + dvx. \2 a trois degres de liberte. On en deduit la distribution de probabilite en energie.ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Nous sommes passes d'une distribution a n variables a une nouvelle distribution d'une seule variable. . vz et vz + dvz est egale a Nous ne sommes interesses que par 1'energie des particules et ainsi les directions de la vitesse n'ont aucune importance. Le passage des vitesses a 1'energie fait "disparaitre" deux degres de liberte (deux variables) lors de 1'integration sur Tangle solide.

= Xi — m sont liees par la relation et qu'ainsi dans la formule (100) nous avons n —1 et non pas n variables independantes. .EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 85 Considerons une autre grandeur directenient liee a la variance experimentale (86) : qui peut etre mise sous la forme Nous verrons que cette grandeur est egalement distribute selon %2 mais avec n — 1 degres de liberte ! II est possible de prevoir ce resultat et meme de le comprendre qualitativement. xn = x a n variables independantes yi.Pour cela. . Certains arguments qualitatifs ont ete developpes au paragraphe 2. . Effectuons une transformation lineaire orthogonale avec Une rotation dans I'espace euclidien a n dimensions est un exemple d'une telle transformation. . La formule (101) nous garantit que la forme de la distribution reste gaussienne : La condition (101) peut encore s'exprimer a I'aide des coefficients c ? j sous la forme . x-2. y^.1. la fonction de distribution est inchangee.1. xn) = Hi(%}. • • • . Le principe d'une demonstration plus rigoureuse est le suivant. II faut aussi noter que les n grandeurs z.2. on utilisera la formule (77) introduite a la fin du paragraphe 2. .. en vertu de (77). x?.Ill . Le Jacobien est alors egal a 1 et. . Nous voulons passer de n variables independantes x±..2.yn = y a I'aide d'une transformation yi = y z '(^i. lors de la discussion du facteur n — I dans la definition de la variance experimentale.

IMeanmoins. Ainsi les variables t/» sont distributes selon une loi gaussienne avec une moyenne nulle et une variance a2. Les expressions (101) et (103) nous permettent de reecrire w sous la forme Autrement dit. Notons sans demonstration que. choisissons et les autres yi avec i > 2 de facon arbitraire. les fonctions yi possedent les proprietes suivantes (rappelons que tous les Xj ont les memes // et cr) : et qui ont ete etablies en utilisant I'independance des Xi et la relation (102).86 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Dans le cas particulier ou la condition (102) prend la forme Pour notre fonction w (100). Ainsi nous pouvons utiliser les resultats etablis sur la distribution x2 (98—99) et en deduire immediatement que resultats que nous avons deja obtenus difTeremment (voir (87) et (93)). dans un cas general. . le nombre de degres de liberte v d'une distribution xl pour la somme de carres du type (104) est egale a ou / est le nombre de relations lineaires entre |xz-}. la grandeur w est distribute selon la loi %2 avec n — l degres de liberte.

La solution du probleme est relativement simple si nous exprimons cette fonction sous la forme La variable y\ a une distribution normale (car tous les x± ont la meme distribution normale) avec la moyenne nulle (83) et la variance unite (84).EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 87 3. la nouvelle densite de probabilite h(z\}zi) est .Ill . La densite de probabilite de y\ et y? est egale a : avec 7/1 qui varie de —oo jusqu'a +00 et y% qui varie de 0 jusqu'a +00. on a besoin de la fonction de distribution de la variable ou m et sm sont definies par (82) et (88). conformement a (77). Ainsi nous connaissons les distributions de yi et de y? et nous voulons trouver la distribution du rapport t — yi/^/y^ en utilisant les regies connues de transformation des distributions. d'abord cette densite en faisant le changement de variables Transformons soit par transformation inverse Le module du Jacobien de cette transformation est egal a ^fz^ et.2 DISTRIBUTION DE STUDENT Pour pouvoir interpreter les resultats experimentaux en termes de de m (82) et de sm (88). La variable y^ est distribute selon Xn-i comme nous venons de le demontrer (104).

n = 5. et n = oo (distribution de Gauss) Finalement la distribution f(t] s'ecrit ou t a n — I degres de liberte.3 : La distribution de Student pour n = 2 (distribution de Lorentz). La constante C dans 1'expression (107) est egale a .88 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Pour obtenir la densite de probabilite f(t] nous integrons h(zi. L'integration sur z-i a elimine une variable (un degre de liberte) : l + (n — 1) — I = n — 1. Les variables initiates y\ et y^ (soit Xn-i} en on^ 1 et n — 1 respectivement.Z2) par rapport a z-2 et utilisons la relation f(i) — f(zi}\dz\/dt\ : Le changement de variable ramene cette integrale a une fonction F. Figure 3.

Pour n = 2. Vu la discussion du paragraphe 1. Notons que nous avons regroupe la distribution F (45) et celle de Poisson (36) par suite de la ressemblance formelle de leurs dependances fonctionnelles. Neanmoins.12 . la distribution de Student se transforme en distribution gaussienne.Ill . On peut aussi calculer facilement la valeur moyenne et la variance de cette distribution lorsque cette derniere existe : Dans la limite n —>• oo.4 : Les relations entre les differentes distributions . la distribution t de Student represente. Figure 3. La figure 3. Pour n > 2.3. les fonctions F dans la formule ci-dessus peuvent etre explicitees a 1'aidede (43) et (44).3. une certaine puissance de cette distribution. Plusieurs exemples de la distribution de Student sont presentes sur la figure 3. pour n donne. elle montre les relations qui existent entre les differentes distributions. Cette fonction (107) est relativement simple. on retrouve la distribution de Lorentz.4 est une version elargie de la figure 1. La demonstration est simple et peut etre realisee par le lecteur interesse. seuls les moments p^ avec k < n — 1 peuvent etre definis.EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 89 Pour n donne.3. nous pouvons tout de suite dire que. grosso modo. il ne faut pas oublier que les roles des variables et des parametres sont inverses dans ces distributions.

Nous prenons comme estimation : Dans notre cas.1 PETIT NOMBRE DE MESURES Commengons par un exemple concret : nous mesurons n fois la longueur / d'une plaque metallique et ainsi obtenons des resultats {/i. II est logique de supposer que la vraie valeur de la longueur se trouve entre la valeur minimale et la valeur maximale mesurees et que 1'ecart entre ces deux valeurs donne une estimation de 1'incertitude. Quelle est la longueur de la plaque ? Ier niveau d'analyse L'objectif est d'avoir une idee sur 1'ordre de grandeur des parametres du probleme. alors la valeur est decrite par la distribution de Student / n _i(t) (107). // est la vraie valeur de la grandeur mesuree (dans notre cas.Solent n = 6. ln}. ou Le resultat est simple et rapide. lmax = 4372 mm et lmin — 4330 mm. Peut-on lui donner credit ? Pourquoi pas ? Quels sont les justificatifs mathematiques d'un tel resultat ? Nous ne les avons pas. II est difficile d'interpreter cette analyse en termes de probabilites. en outre. / 2 = 4364 mm.2). /3 = 4342 mm. Supposons de plus que la distribution de la longueur / est celle de Gauss. 14 = 4338 mm. • • • . IP niveau d'analyse Son but est d'obtenir la valeur de la longueur et de 1'incertitude sur cette valeur et. de pouvoir les interpreter en termes de probabilites comme nous 1'avons fait au debut de ce livre (voir le paragraphe 1. m la moyenne estimee a partir des resultats experimentaux (82) et s^ la variance experimentale de cette moyenne (88) . la longueur /). /i = 4372 mm. Avec cette hypothese supplementaire. 15 = 4354 mm et /6 = 4330 mm. l^.2. Nous avons vu que si une grandeur physique est distribute selon une loi normale.2.90 ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES 3. Dans cette expression. nous pouvons utiliser la distribution de Student etudiee au debut du paragraphe 3. Nous avons obtenu une idee de la valeur mesuree et 1'interpretation de la derniere formule ne peut aller au-dela de ce que nous avons fait : la valeur cherchee est la moyenne entre les valeurs maximale et minimale mesurees et 1'incertitude est la moitie de 1'ecart correspondant.

voir la figure 3. Ces resultats numeriques sont representes dans le tableau 3. c'est 1'aire de la surface sous la courbe de la fonction de distribution . La forme de la distribution de Student est relativement proche de celle de Gauss (elle est la meme dans la limite n —>• oo) et ainsi nous aliens vite comprendre par analogic avec la distribution de Gauss comment nous pouvons 1'utiliser. Figure 3.5 : La distribution de Student pour n = 6 . Cette probability est le niveau de confiance et 1'intervalle correspondant. la phrase "t a la distribution de Student" signifie que la probabilite de trouver la vraie valeur /j de / dans 1'intervalle compris entre m — smt^p et m + smivp est egale a : (comme toujours.3.1. En termes de probabilites. FintervaUe de confiance qui ont ete definis dans le paragraphe 2.5). Us donnent la valeur de t^p a prendre pour que. la probabilite de trouver la vraie valeur dans 1'intervalle compris entre m — smtvp et m-\rsmtv-p soit egale a P. pour n = v-}-\ mesures. c'est pourquoi nous pouvons etablir une bijection entre la valeur de t^-p qui nous definit 1'intervalle et la probabilite P (109).Ill — EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 91 Soulignons une fois de plus que m et sm sont entierement definis par les resultats experimentaux. Dans la notation tvp nous avons introduit les deux parametres dont depend ce coefficient : v = n — I qui est le nombre de degres de liberte de notre probleme et la probabilite P desiree. Nous pouvons calculer la probabilite qui nous interesse et determiner numeriquement la valeur correspondante du coefficient tvp qui s'appelle le coefficient de Student. Nous connaissons la fonction fv(t) pour un nombre de mesures donne.

156 1.978 0.782 1.262 2.604 4.1).687 0. pour la meme probabilite il faut prendre Al beaucoup plus grand £t/=2. Desormais.571 2.182 2.690 0.920 2.546 0.257 0.257 0.253 0.093 1.92 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Tableau 3.277 0.674 1.559 0.100 1.2 0.353 2.262 0.303 3.943 1.350 1.576 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 30 oo 0.386 1.271 0.711 0.700 0.267 0.898 2.657 9.689 0.257 0.076 1.1 : Les coefficients de Student tv-p correspondant a un nombre v de degres de liberte et a une probabilite T p V 0.306 2.960 0.258 0. 96.079 1.093 2.963 1.258 0.447 2.584 0.688 0.265 0.941 0.263 0.776 2. les coefficients de Student tv-p coincident avec les valeurs donnees par la distribution de Gauss (voir la derniere ligne du tableau 3.756 2.683 0.688 0.99 63.699 1.549 0.746 1.415 1.860 1.740 1.250 3.925 5.363 1.311 1.539 0.896 0.697 0. notre resultat s'exprimera sous la forme dont 1'interpretation est un peu plus compliquee que dans le cas de la distribution de Gauss : nous sommes obliges de donner le nombre de mesures effectuees et la probabilite choisie pour pouvoir utiliser un coefficient de Student.257 0. 3.878 2.066 1.055 1.95 12.617 0.861 2.376 1.365 2.169 3.727 0.260 0.703 0.5 0.535 0. .895 1.533 0.069 1.537 0.071 1. Par exemple.9 0.569 0.145 2.397 1.067 1.533 1.741 0.816 0.870 0.854 0.289 0.727 0.7>=o.7 0.134 1.868 0.383 1.256 0.706 4.258 0.706 0.106 3.476 1.337 1.718 0.866 0.201 2.889 0.920 0.873 0.083 1.796 1.325 1. pour un nombre fini n de mesures.333 1.761 1.132 2. le coefficient ti/ =0 o.842 1.372 1.729 1.341 1.947 2.6 0.771 1.524 1.921 2.325 0. par exemple n — 3.282 6.542 0.540 0.160 2.055 3.534 0.110 2.734 1.906 0.440 1.691 0.4 0.753 1.861 0.883 0.260 0.95 = 1.074 1.695 0.120 2.259 0.765 0.045 1.879 0.645 En pratique cela signifie que la valeur de 1'incertitude depend du nombre de mesures et de la probabilite avec laquelle nous voulons connaitre la vraie valeur dans 1'intervalle indique : Dans les conditions limites d'un grand nombre de mesures.259 0.330 1.692 0.543 0.499 3.538 0.553 0.261 0.841 4.638 1.845 2.886 1.119 1.250 1.860 0.078 1.061 0.862 0.694 0.190 1.345 1.977 2.086 2.064 1.863 0.088 1.108 1.7>=0.534 0.132 2.179 2.012 2.032 3.015 1.725 1.95 = 4.036 3.836 1.101 2.000 0.533 0.8 0.328 1.228 2.356 1.812 1.865 0. Quand le nombre de mesures n'est pas eleve.536 0.355 3.530 0.876 0.314 2.707 3. pour une probabilite (un niveau de confiance) de 95%.

6 . 6 mm — 16 mm. alors le coefficient de Student ^_ 5 .EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES Dans l'exemple de la longueur de la plaque. par exemple. Pour cela.Ill . Nous voyons que le deuxieme niveau d'analyse est plus rigoureux et plus riche d'information que le premier. Montrons comment evaluer 1'incertitude de 1'incertitude. Si nous voulons avoir une estimation de la veritable variance il nous faut utiliser la definition (85) Dans notre exemple. II est possible d'obtenir une estimation experimental e de cette valeur a partir des donnees obtenues. nous avons garde deux chiffres significatifs mais on aurait pu n'en garder qu'un seul. et conduit pour 1'incertitude relative a Rappelons que pour obtenir cette estimation.3. on utilise les formules (94) et (93) . L'incertitude A/ dans cette expression est 1'incertitude sur la moyenne ra et non pas sur la longueur / elle-meme ! Dans le cas d'un grand nombre de mesures.57 et A/ = 17 mm. la variance de la valeur moyenne s^ tend vers zero et non pas vers la veritable variance cr 2 . choisissons. ime probability de 95%. Soulignons un point tres important deja mentionne au debut du paragraphe 2. mais il est aussi notablement plus lourd dans son traitement et surtout dans son interpretation. L 'estimation "theorique" obtenue dans (94) ne depend que du nombre de mesures n. C'est la raison pour laquelle nous avons ecrit "la valeur moyenne de la longueur" et non pas "la longueur" tout court. chaque mesure Xi est supposee avoir une distribution de Gauss.-p =095 = 2. Ainsi la valeur moyenne de la longueur est : avec un niveau de confiance de 95% pour les 6 mesures effectuees. s — A/6 . Dans le resultat final. 93 et Pour presenter le resultat final (111).

on utilise la formule generale (92) dans laquelle les moments "theoriques" ^ et ^4 sont remplaces par leurs valeurs experimentales m^ et 7714 introduites dans (91). 4335.1). m — 4350 mm. Neanmoins nous pouvons essayer. pour <J^. Est-ce vrai ? Nos mesures correspondent-elles a une telle hypothese ? II n'est pas tres facile de trouver la reponse a ces questions. 4337. Soit ces resultats sont lies a la faible statistique (6 mesures. on mesure deux valeurs differentes). dans la deuxieme serie. Finalement. pour cette deuxieme serie de mesures. on doit s'attendre a avoir a peu pres deux tiers de resultats dans 1'intervalle compris entre fi — cr et {J. Ainsi nous pouvons attendre 2 — 3 mesures dans 1'intervalle compris entre 4342 mm et 4358 mm et 4 dans 1'intervalle compris entre 4334 mm et 4366 mm. II existe deux explications possibles. La moindre des choses est de remesurer la longueur de la plaque pour augmenter sensiblement (!) la statistique. Ceci n'est pas mal. 4365. surtout si 1'on se souvient que s a aussi son incertitude et qu'elle n'est pas negligeable (son incertitude est egale a 5 mm . Dans notre exemple.94 ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES et les valeurs experiment ales de 0(8^) et s^. On peut verifier aisement que. Pour utiliser la distribution de Student. nous pouvons aller plus loin dans notre analyse des donnees experimentales. Une analyse supplementaire n'est pas du tout superflue. Mais dans ces conditions. surtout pour un nombre si faible de mesures. 4363 et 4366 mm. nous avons fait 1'hypothese supplemental que la longueur / est distribute selon la loi normale. . on ne trouve aucune mesure dans 1'intervalle compris entre 4342 mm et 4358 mm et 6 dans 1'intervalle compris entre 4334 mm et 4366 mm (au lieu de 2 — 3 et 4) ! Qu'est-ce que cela signifie ? On peut remarquer que. Soit c'est un veritable phenomene lie probablement a une erreur systematique (par exemple la plaque est legerement courbee et. pour deux cotes. Dans notre exemple. Si la distribution de la longueur est vraiment gaussienne. + <r et un peu moins de la moitie dans 1'intervalle compris entre // — cr/2 et // -f 0"/2 (ceci est facile a verifier en utilisant la derniere ligne du tableau 3. Supposons que dans nos 6 mesures nous ayons trouve les resultats : 4334. ce n'est pas beaucoup). En tout cas. on obtient en parfait accord I'estimation "theorique". L'experience nous donne 2 et 4 respectivement. on obtient exactement les memes valeurs de m et de sm. s = 16 mm. avant de presenter le resultat final. les resultats semblent se regrouper autour de deux valeurs et non autour d'une seule. il faut elucider ce probleme. Pour D(s^). Ill 6 niveau d'analyse En fait. Nous ne connaissons ni n ni <T mais nous pouvons les estimer a partir de m et s. estimation que 1'on obtient a partir de la formule (92)). la conclusion est la meme : nos resultats ne sont apparemment pas coherents avec le traitement choisi et.

c'est cette hypothese qui doit etre verifiee en premier lieu. Dans notre exemple. Compte tenu de fait que pour obtenir 1'estimation "theorique" nous n'avons utilise que 1'hypothese de normalite de la distribution. bien qu'il ne possede pas de bases mathematiques profondes et qu'il ne soit fonde que sur notre "bon sens". nous verrons d'autres exemples ou cette difference est encore plus grande). La plupart du temps. Ces problemes sont importants surtout pour une experience reelle de physique. La valeur "theorique" est tres differente de celle obtenue a partir des donnees experimentales : Cette difference peut servir d'indication sur 1'existence d'un probleme dans les donnees. Par centre. On peut dire que le deuxieme niveau est un niveau fondamental. nous ne presentons pas ces criteres car. . 1'incertitude estimee dans cette methode peut etre assez differente de 1'incertitude exacte par un facteur deux-trois ou meme plus (dans notre exemple. surtout si Ton tient compte de la facilite avec laquelle les resultats sont obtenus. II touche des aspects un peu differents de la statistique : il essaie d'analyser la validite des hypotheses qui forment notre theorie. Jusqu'ici nous n'avons pas considere ce type de problemes en statistique. dans les experiences simples. ils ne sont pas souvent utilises. Le troisieme niveau est presque obligatoire si nous effectuons une veritable experience de physique en laboratoire. Nous avons compris que la methode d'analyse des donnees experimentales depend de la rigueur et de la precision du resultat que nous voulons obtenir. il donne tout a fait correctement la valeur de la grandeur physique (a a pres). y compris pour 1'analyse posterieure plus sophistiquee. Dans ce livre. il existe une procedure relativement simple (criteres de Pearson) qui permet de voir si la distribution a laquelle on a affaire est une gaussienne. donne presque toujours des resultats acceptables. mais ils necessitent des resultats statistiques beaucoup plus fournis que ceux que nous pouvons obtenir lors de travaux pratiques classiques. nous avons tente de verifier 1'hypothese sur la forme de la distribution pour la longueur. Cette etape est indispensable lors d'une experience effectuee en travaux pratiques. Notons que le premier niveau. nous avons obtenu une estimation de 21 mm au lieu de s = 16 mm . Cette procedure est basee sur la verification des relations precises qui existent entre les moments centraux differents d'une distribution gaussienne (voir (27)).Ill — EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 95 On aurait pu voir qu'il y a probablement un probleme dans les donnees experimentales en comparant les estimations "theorique" et experimental de 6<\x. En fait. Le premier niveau d'analyse des donnees est utile. II donne les resultats avec une interpretation precise.

Si la valeur de X est compatible avec 0. Ier niveau d'analyse II est tres simple. 7 °C doit etre comparee avec 0.3. #2. La difference T = TI .. nous ne pouvons pas dire exactement quelle est la probabilite d'avoir cette difference entre les resultats. commenc.1 COMPARAISON DE DEUX RESULTATS EXPERIMENTAUX Comme au paragraphe 3. A partir de deux resultats. il faut introduire leur difference X = x\ — xi qui a egalement une distribution gaussienne avec une moyenne nulle et une variance AX2 = Ax± + Ax%. 2 °C et T2 = 24. Soient deux series de nx et de ny mesures {xi. xHx} et {yi. 3 °C) et 1'on peut raisonnablement conclure que la temperature a effectivement varie. Rappelons que notre resultat. Avant de discuter le cas de deux grandeurs decrites par la distribution de Student. Dans chaque cas. est Ces deux valeurs sont legerement differentes et nous voulons savoir si elles sont compatibles.ons par celui de deux grandeurs decrites par une distribution gaussienne.1. pour n = 6 mesures.. • • • . On voit que les deux resultats se recouvrent compte tenu des incertitudes presentees et notre conclusion est immediate : les deux valeurs sont compatibles.2. Encore une fois. pouvons-nous les regrouper d'une certaine fagon pour augmenter la statistique et ainsi ameliorer la precision ? 3.T2 = 0. nous pouvons calculer les moyennes mx et my (82) et les variances s%lx et s^ (88) experimentales. compte tenu de son incertitude. on veut savoir si la temperature dans une piece varie dans le temps. Etudions maintenant un exemple de deux grandeurs decrites par la distribution de Student.. dans cette approche.96 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES 3. Supposons qu'un collegue ait mesure la longueur de la meme plaque metallique et qu'il ait obtenu la valeur avec la meme probabilite P = 95% mais pour n = 10 mesures. On a effectue deux mesures a une heure d'intervalle et on a obtenu deux valeurs TI = 25. x\ ± A#i et £2 i A#2. y?. 2 ± 0.3 DEUX RESULTATS EXPERIMENTAUX Un autre probleme apparait lorsque Ton veut comparer des resultats experimentaux. . 2 °C. . alors les deux resultats sont compatibles. IIe niveau d'analyse Formulons d'abord cette question d'une fagon plus generale et plus precise. Si oui. nous montrerons deux niveaux de solutions possibles. yny}. 5 ± 0. Par exemple. On voit que cette valeur depasse la? (avec UT = 0.

La moyenne de cette distribution est nulle car elle est proportionnelle a la difference des moyennes rn^ — rn^ — p. La demonstration de cette propriete suit exactement la demonstration utilisee pour obtenir la distribution de Student (voir paragraphic 3. Reecrivons t sous la forme t et Le numerateur Y\ est la somme de deux grandeurs distributes selon la loi normale et sa distribution est done normale.Ill . la somme de deux variables independantes qui ont les distributions Xnx-i avec nx — 1 degres de liberte et %2 _1 avec ny — I degres de liberte respectivement (voir (104)). Le probleme est a nouveau 1'absence d'information sur les veritables valeurs de fi et de <r 2 . Leurs fonctions generatrices des moments sont .EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 97 Nous desirons savoir quelle est la probabilite pour que la valeur absolue de la difference \mx — my | soit superieure ou inferieure a une valeur donnee. a un facteur I/a2 pres. C'est pourquoi ne seront notees que les petites modifications a apporter.2). II peut etre contourne en utilisant le fait que la variable ou a une distribution de Student avec v = nx + ny — 2 degres de liberte. — p — 0. Le denominateur Y? represente. La variance de YI est I'unite car la variance de mx est <r 2 fn x . la variance de my est <T2/ny et la variance de la difference mx — my est done egale a cr 2 /n x + cr 2 /«y (voir eq.(17)).

1. my = 4350 mm. 4. voir la remarque (105)). Ainsi la fonction generatrice de la somme est egale a ou nous avons utilise la propriete (21). Pour connaitre s2 nous devons calculer les sommes (112).98 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES (voir (96)). nx = 10. cette somme a la distribution Xnx+n -2 avec v —nx +ny — 2 degres de liberte (nous avons nx + ny mesures avec deux relations lineaires qui fixent mx et my . mx = 4355 mm. et la valeur de t correspondante a s2 est egale a Dans le tableau 3. Nous sommes maintenant en mesure de repondre a notre question puisque nous avons etabli une relation univoque (109) entre la valeur de t et la probability T. nous voyons que la probabilite qui correspond au coefficient de Student t c± 0. ny = 6. A partir de sa valeur de Ara^. 55 pour v = 14 degres de liberte est P ~ 0. Ensuite nous retrouvons la demonstration du paragraphe 3. Dans notre experience II faut calculer la somme correspondante a Texperience faite par notre collegue. Dans notre exemple.2. Autrement dit. . = 13 mm et des relations nous avons Done.

3. ou inversement la probabilite pour que my se trouve dans 1'intervalle [mx — Ara x . 5<r. II etait meme plus probable (60%) de trouver cette difference superieure a 5 mm. a peu pres 1/3. . Quand nous utilisons de telles notions nous nous referons a la distribution de Gauss et nous examinons la probabilite pour que mx se trouve dans 1'intervalle [my — Ara y . Nous verrons que 1'incertitude dans 1'experience qui accumule les resultats de deux experiences est plutot de 10 mm. Pour cela.2.2 "ADDITION" DE DEUX RESULTATS EXPERIMENTAUX Nous sommes assez convaincus que les deux resultats ne sont pas contradictoires et desirons savoir comment les "reunir" pour avoir une meilleure statistique et plus de precision sur la grandeur mesuree. mx + Ara^]. Ainsi nous retrouvons la coherence entre les deux approches.Ill . cela apparaft surtout sur les moyennes et dans une moindre mesure sur les variances. La conclusion est la suivante : on peut utiliser le critere de recouvrement des incertitudes a condition de les recalculer en utilisant la methode decrite ci-dessous. La methode qualitative basee sur la distribution de Gauss donne une probabilite trois fois plus forte que celle attendue avec notre methode correcte basee sur la distribution de Student ! La contradiction apparente s'explique par le fait que notre estimation de a (pour laquelle nous avons choisi la demi-somme de Am x et de Am y ) etait grossiere. Pour la distribution de Gauss. Notons que le critere qualitatif applique dans la premiere approche (recouvrement des barres d'erreurs) est rapide mais parfois assez dangereux. //+ 1. la probabilite de trouver un evenement en dehors de 1'intervalle \ji — I . Le traitement correct nous donne un coefficient de Student t ~ 1. Pour la distribution de Gauss.3. La valeur de \mx — my\ = 15 mm correspondrait ainsi a 1. qui donne la probabilite pour que le rapport s^/s y soit different de 1. 5«r.2. de 1'ordre de 10%. 5cr] est aussi de 1'ordre de 10%. II existe une methode analogue pour comparer les variances experimentales. Ainsi le "disaccord" de nos deux experiences est tout a fait acceptable et nous pouvons confirmer notre conclusion intuitive par une consideration plus rigoureuse. Cela signifie que la probabilite de trouver une difference de 15 mm ou plus est tres faible. designee par le critere J7 de Fisher. Nous avons montre comment il est possible de comparer les moyennes de deux experiences.ray + Am y ]. Dans ce livre. nous ne presentons pas ce critere car cette distribution est relativement complexe et son utilite pratique bien moindre que la distribution de Student : si deux echantillons sont vraiment incompatibles.EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 99 Ceci signifie que la probabilite de trouver la difference \mx — my\ inferieure a 5 mm etait de 40%. la probabilite d'apparition d'un evenement en dehors de 1'intervalle [fji — cr. il faut introduire une distribution speciale de ce rapport que Ton peut obtenir a partir des distributions connues de s^ et Sy et en utilisant des regies generales formulees au paragraphic 2. ^ + cr] est relativement grande. Meme pour une difference \mx — my — 15 mm notre conclusion basee sur ce critere reste la meme car cette difference est compatible avec les incertitudes des deux series de mesures (A = ^(Amx + Ara y ) = 15 mm). 65 auquel correspond une probabilite de presque 90%.

Alors nous pouvons rmplacer dans (114) et obtenir 1'expression ou est introduite 1'incertitude Amx+y comme ou wx et wy peuvent etre interpretes comme les poids relatifs de deux experiences.100 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Nous obtenons assez facilement la formula exprimant la moyenne pour les deux series de mesures si nous connaissons les moyennes pour les deux experiences separement remplagons les sommes dans (113) par mxnx et myny : II est utile de reecrire cette formule autrement. Cette formule a une signification tres simple : moins 1'experience est precise (grande valeur de Am^). (88) et (110)) Quand le nombre de mesures dans chaque experience est relativement grand. moins importante est sa contribution (faible valeur de l/(Amj) 2 ) dans le calcul de la moyenne (115). . Rappelons les relations entre les variances experimentales s2 de la grandeur et celles de ses valeurs moyennes slm (voir eqs.

EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES Dans notre exemple de deux experiences. on voit que le coefficient de Student varie peu avec v. que mx+y soit plus proche de sa valeur mx. t change seulement de 10% quand v passe de 10 a 30. Dans le tableau 3. cette variation est une correction dans 1'incertitude. ce qui signifie que les erreurs d'appareil s'ajoutent aux erreurs naturelles de la grandeur physique. Nous voulons savoir quelle est Pinfluence de 1'appareil sur la valeur physique ou. 1'erreur introduite par cette procedure est tres faible. S'il a ete possible de verifier auparavant que ces series de mesures sont compatibles (compatibility des moyennes et des variances). Par exemple pour "P = 0. De plus. une autre modification de la fonction de distribution est aussi possible. compte tenu du fait que les mesures du collegue etaient plus precises. en d'autres termes. comment il modifie la fonction de distribution initiale.1.4 AUTRES SOURCES D'ERREURS L'incertitude naturelle d'une grandeur physique n'est pas la seule possible. fait Pobjet de ce paragraphe. .95. L'appareil peut decaler la valeur moyenne. plus generalement. Ces erreurs s'appellent les erreurs systematiques. autrement dit. done 1'appareil mesure une valeur systematiquement plus grande (ou plus petite) que la valeur "reelle". c'est une correction de deuxieme ordre. L'analyse de ce type d'erreurs. Meme 1'hypothese d'egalite des coefficients de Student pour un grand nombre de mesures n'est pas mauvaise. Nous verrons qu'il y a d'abord une modification "triviale" de cette distribution : celle-ci s'elargit. la methode de mesure choisie. nous sousentendons non seulement 1'appareillage utilise pour faire une experience mais. Am r+y = 10 mm. Une autre source importante d'incertitude est 1'appareil de mesure. Elles ne sont pas forcement de nature aleatoire et ne pourront pas etre traitees directement a 1'aide des techniques qui ont ete presentees jusqu'ici. 101 II est logique. Par 1'appareil. nous obtenons mx+y = 4353 mm. Les formules (115) et (116) peuvent etre generalisees facilement pour un nombre arbitraire n d'experiences : II est vrai que cette fagon de calculer la moyenne sur plusieurs experiences n'est pas toujours mathematiquement irreprochable mais elle donne la possibilite d'avancer et de reunir les connaissances obtenues dans des experiences parfois tres differentes. C'est la raison pour laquelle cette approche est tres utilisee en physique quand on veut profiter de resultats d'experiences differentes (parfois assez couteuses) pour obtenir la valeur "universelle" de telle ou telle constante physique fondamentale. Cependant. 3. qui est plus complexe.Ill .

102

ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES

3.4.1

INCERTITUDES D'APPAREIL

Pour etudier 1'influence d'un appareil sur la valeur mesuree, choisissons d'abord un appareil tres simple — un pese-personne mecanique. Son principe de fonctionnement est elementaire : le poids d'un objet dont nous voulons connaitre la masse m est compense par la contraction d'un ressort. Ce dernier est lie a une aiguille qui indique sur un cadran la valeur de la masse. Si le coefficient de raideur est egal a k, le deplacement du ressort et celui de 1'aiguille est

ou g est 1'acceleration du champ de pesanteur. Supposons que 1'incertitude sur la valeur de g soit negligeable devant les autres incertitudes. Ainsi, 1'incertitude sur Ax s'ecrit conformement a (58)

(—) - (-^-J + (-T) •
La particularity de cette formule vient du fait que 1'incertitude de mesure comprend deux contributions, 1'une issue de 1'incertitude naturelle Am et 1'autre issue de 1'appareil de mesure Ak. Une expression analogue peut etre obtenue dans un cas plus general. La probabilite de trouver une valeur physique x, caracterisee par sa fonction de distribution f ( x ) , dans 1'intervalle [ x , x + dx] est egale a f ( x ) d x . Cependant, la probabilite pour que 1'appareil donne cette valeur dans un autre intervalle [x',x' + dx'} n'est pas nulle. Designons cette probabilite par S(x, x'}dx'. Pour determiner la probabilite (F(x')dx'] de detection par 1'appareil de la valeur physique dans 1'intervalle [x', x' + dx'], on doit multiplier la probabilite (f(x}dx] pour que cette valeur se trouve dans [x, x + dx], par la probabilite (S(x, x')dx') pour que 1'appareil donne la valeur dans [x', x' + dx'] et calculer la somme (ou 1'integrate) pour toutes les valeurs x possibles :

/Ax\2_/Am\2

(Ak\2

soit

On peut dire qu'au lieu de la vraie fonction de distribution f ( x ) , 1'appareil nous donne une fonction de distribution modifiee F ( x ) . La fonction S ( x , x ' ) s'appelle la fonction de resolution (la terminologie vient de 1'optique). Quelle est la forme de cette fonction ? La reponse a cette question est difficile. La plupart du temps, la fonction de resolution S(x,x') ne depend que du module de la difference x — x' :

Ill - EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES

103

Cette propriete signifie que 1'appareil n'introduit pas d'erreur systematique, c'est-adire qu'il ne modifie pas la valeur moyenne de la distribution.
La valeur moyenne p,p pour la distribution F(x) est

A I'aide de (120) et en introduisant la variable t = x — x' nous obtenons

Nous avons tenu compte de la normalisation de f(x] et de S(t) :

et du fait que S(\t\) est une fonction paire. II n'y a pas d'erreur systematique :

Dans les memes conditions, nous pouvons montrer facilement que I'appareil ne peut qu'elargir la distribution initiale. La variance de la distribution F(x] est

D'ou

Comme pour les fonctions de distribution, on peut affirmer que si les conditions du theoreme central limite sont satisfaites (c'est-a-dire s'il y a plusieurs facteurs independants qui agissent sur la fonction de resolution et si 1'influence de chacun de ces facteurs est petite), cette fonction a la forme de Gauss :

104

ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES

avec une variance <r|. Cette fonction ne depend que de \x — x'\ et la moyenne de F(x) coincide avec la moyenne de f ( x ) . En resume, dans les conditions du theoreme central limite, il n'y a pas d'erreur systematique et 1'appareil ne change pas la valeur moyenne. Nous ne considererons que le cas ou la fonction de resolution S(x — x'} et la fonction de distribution f(x) sont decrites par des fonctions de Gauss. Soient <r| la variance de S(x-x'), n et d1, la moyenne et la variance de f ( x ) . On peut alors calculer I'integrale (119) et obtenir la fonction de distribution F ( x ) , donnee par 1'appareil, qui a aussi une forme gaussienne :

II existe deux facons de calculer I'integrale

La premiere est directe : on fait le changement de variable

pour retrouver I'integrale bien connue (25). La deuxieme est plus elegante : il faut passer par la transformation de Fourier de cette integrale et utiliser deux proprietes de la transformation de Fourier (la transformee de Fourier d'une gaussienne est une gaussienne et la transformee de Fourier d'une convolution de deux fonctions est le produit de leurs transformees). Nous laissons cet exercice aux lecteurs familiers de la transformation de Fourier.

Ce calcul permet de verifier que la variance ffp de la fonction F(x) est egale a la somme des variances 0-| et crj :

Dans une experience reelle deux situations extremes peuvent etre rencontrees. Celle ou la variance de 1'appareil est negligeable devant la largeur naturelle (<j| <C <r?) et 1'appareil ne change rien ; celle ou la variance d'appareil est plus importante que la variance initiale (<r| ^> <r?) et on peut alors prendre 1'incertitude de 1'appareil comme 1'incertitude de 1'experience. En general, la determination de la fonction de resolution n'est pas aisee. Pour les appareils simples utilises en travaux pratiques, la connaissance precise de la fonction S(x, x') n'est pas indispensable. On peut se limiter a la calibration de 1'appareil avec une fonction f(x] bien defrnie. Dans 1'exemple d'un pese-personne, on doit peser des poids connus (les etalons) et reperer les indications correspondantes. Ainsi on obtient

Les fonctions obtenues de cette maniere se presentent souvent sous la forme d'une courbe ou d'une table d'etalonnage. On peut la mesurer a 1'aide d'un voltmetre ayant une resistance Ry et d'un amperemetre ayant une resistance RASupposons que ces valeurs soient inconnues . etc. telles que Ry ^> Rx ^ RA.Ill — EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 105 une echelle de 1'appareil utilisable pour la mesure de poids inconnus. pour un assez grand domaine de valeurs de la resistance Rx.2 ERREURS SYSTEMATIQUES On peut mentionner trois sources d'erreurs systematiques : la methode de mesure choisie. Erreurs liees a la methode de mesure Un exemple simple d'erreur systematique provenant de la methode de mesure est donne par la determination d'une resistance inconnue Rx.6) ou (II) on peut mesurer la tension aux bornes de la resistance et de 1'amperemetre (figure 3. divise par 100 : classe • pleine echelle incertitude — . 1'incertitude de mesure est indiquee dans la description. 1.Neanmoins. Pour les experiences plus sophistiquees. on a Rexp — Rexp — RX. 3.5 . L'incertitude de 1'appareil est egale au produit de sa classe par la pleine echelle utilisee pour la mesure.0 . on obtient les relations suivantes entre ReXp et Rx : Si les appareils choisis sont de bonne qualite. Pour un appareil a aiguille. On branche 1'amperemetre en serie avec la resistance inconnue. cette procedure simple n'est plus suffisante. L'experimentateur doit faire une etude approfondie du nouvel appareil pour avoir le maximum d'informations sur la fonction de resolution S ( x ' . . la precision est caracterisee par la classe de 1'appareil qui est toujours marquee sur son cadran au-dessus du symbole de position de 1'appareil. 100 Pour diminuer 1'incertitude de mesure. etablir la forme de cette fonction. x ) : verifier si elle ne depend que de \x — x' ou.5. Pour un appareil digital. il faut done toujours travailler avec les echelles les plus sensibles possibles (les echelles qui donnent la deviation maximale acceptable). Nous allons etudier toutes ces sources d'erreurs et de voir ce qu'il faut faire dans ces cas.4. on sait seulement que Ry est grande par rapport a Rx et que RA est petite par rapport a Rx.7).5 ou 2. pour ces deux branchements. Si on determine la valeur experimentale RGXp de la resistance inconnue Rx comme le rapport de la tension amchee sur le voltmetre et du courant traversant 1'amperemetre. on travaille avec des appareils de classe 0. le mauvais fonctionnement de 1'appareillage et les erreurs d'experimentateur. Le branchement du voltmetre peut etre effectue de deux fagons : (I) on peut mesurer la tension aux bornes de la resistance Rx (figure 3. Dans la plupart des cas. 1. sinon.

Pour cela.6 : Premier schema possible pour mesurer la valeur d'une resistance la premiere methode donne toujours des valeurs systematiquement plus petites que la vraie valeur de Rx. au choix). RA e^ RX • (II) Figure 3.106 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Figure 3. Le schema de branchement est presente sur la figure 3. on a une erreur systematique plus ou moins importante en fonction des relations entre Ry. Dans les deux cas. nous avons besoin d'une resistance variable dont nous pouvons etablir la valeur Rv. ou Ra est la resistance de 1'appareil (R^ ou RV)- .8. de deux resistances identiques R et d'un appareil de mesure (d'un amperemetre ou d'un voltmetre. Si Rx est egale a Rv. Cependant les deux methodes donnent une erreur systematique qu'on ne peut eliminer qu'en connaissant les valeurs de Ry et RAProposons une troisieme fagon de mesurer la resistance.7 : Deuxieme schema possible pour mesurer la valeur d'une resistance On peut done dire que la premiere methode est preferable pour mesurer des petites resistances tandis que la deuxieme est plus adaptee aux grandes resistances. tandis que la deuxieme donne des valeurs systematiquement plus grandes. alors le courant Ia qui passe par 1'amperemetre (ou le voltmetre) est nul. On peut le voir a partir de 1'expression de Ia : I etant le courant aux bornes du circuit.

Si nos appareils sont precis nous obtiendrons exactement la valeur . Ia et I\ et obtenons deux equations En eliminant I\. Quels sont les avantages d'une telle methode par rapport aux methodes precedentes ? Premierement.8) et ecrivons le systeme de 5 equations Nous exprimons /„. 1%.EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 107 Figure 3. Ix et /2 en fonction de /. \\ est possible d'ecrire Cette relation nous donne la formule (121). il n'y a pas d'erreurs systematiques liees a la methode. 1-2 (figure 3.8 : Troisieme schema possible pour mesurer la valeur d'une resistance L'expression (121) peut etre obtenue de la facon suivante. Nous introduisons les courants Iv.Ill . Nous devons faire varier la resistance Rv jusqu'a annuler le courant Ia. h.

Ainsi nous pouvons corriger la valeur de Rv pour retablir le zero. Erreurs d'experimentateur Finalement les erreurs de 1'experimentateur constituent le troisieme type d'erreurs systematiques. Par exemple la position du zero d'un wattmetre pent varier lors d'une experience. une erreur systematique peut etre introduite par le fait que des personnes differentes ont des vitesses de reaction differentes. Avant toute mesure il faut s'assurer que le zero est regie correctement. Erreurs liees au fonctionnement d'appareils Le deuxieme type d'erreurs systematiques est lie au mauvais fonctionnement de 1'appareillage ou au changement des conditions de deroulement de 1'experience. Par exemple certaines personnes evitent tel ou tel chiffre lors des estimations de fractions de divisions d'echelle d'un appareil. il suffit d'augmenter le courant exterieur / d'un facteur n. Lors des mesures d'un intervalle de temps. afm que le courant Ia augmente aussi d'un facteur n (voir (121)) et qu'il redevienne detectable. Par exemple nous pouvons mesurer une masse. nos mesures sont extremement simples : nous voulons annuler le courant et nous ne devons faire aucun calcul. quand on modifie les parametres d'une experience. Cette verification ne prend pas beaucoup de temps mais elle permet d'eviter des erreurs grossieres et elle doit devenir une habitude pour 1 'experimentateur. mais tellement petite que notre amperemetre n'arrive pas a le detecter. nous devons d'abord calibrer les appareils de mesure (voltmetre et amperemetre) a 1'aide d'etalons et ensuite les utiliser pour mesurer des valeurs physiques inconnues. Ou encore. Ces deux conceptions de mesure sont utilisees partout dans la vie courante. soit a 1'aide d'un pese-personne qui utilise un ressort prealablement calibre. L'exemple le plus simple est le mauvais reglage du zero de 1'appareil. La deuxieme approche est generalement plus precise mais elle est aussi plus couteuse. Troisiemement. Si cette experience dure longtemps. L'instabilite des conditions de deroulement de 1'experience donne lieu a une derive systematique des mesures. Le choix depend de la precision recherchee et des moyens disponibles. Dans la deuxieme approche. Ces erreurs peuvent etre diverses et elles dependent de 1'experience concrete. Dans 1'example precedent apparaissent deux conceptions differentes d'une experience. II ne faut pas se precipiter pour faire les mesures. le systeme a besoin d'un certain temps pour se mettre en equilibre et les indications des appareils peuvent etre instables pendant quelques secondes. soit a 1'aide d'une balance qui equilibre la masse inconnue par des poids connus. Supposons que la valeur du courant est non nulle Ia — IQ =t 0. Dans la premiere approche. Pour s'affranchir du probleme. il est relativement facile de verifier si le zero est bien etabli. Un autre exemple d'une telle erreur est la mesure de la vitesse d'une boule metallique dans un liquide visqueux.108 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Deuxiemement. la temperature du liquide peut varier avec la variation de la temperature ambiante et ce changement modifie la viscosite du liquide. Les inconvenients possibles de cette methode sont la difficulte de trouver une resistance variable de bonne qualite et la duree d'une telle experience. . nous comparons directement la valeur inconnue a 1'etalon.

1'endroit doit etre bien eclaire. Les appareils alimentes par des piles ont la "mauvaise habitude" de tomber en panne d'alimentation au moment le plus important de 1'experience. Commengons par les questions de planification et de realisation d'une experience sont d'une importance fondamentale. nous avons un schema pour determiner une . la condition importante est 1'alignement de tous les appareils sur un meme axe. la calculatrice. il faut eviter les courants d'air. Les appareils ne doivent pas bouger. Ainsi nous eviterons beaucoup d'erreurs systematiques et le processus experimental sera accelere. Verification des choses evidentes Parfois. au moins.8. Si nous utilisons un circuit electrique alimente directement par le reseau EDF. un stylo. la temperature ambiante ne doit pas etre trop elevee et surtout rester stable.EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 109 Une erreur presque inevitable intervient lors de la lecture des indications des appareils a aiguille : il existe toujours une certaine distance entre 1'aiguille et 1'echelle et le resultat lu depend de 1'angle de vision. Quels sont les points auxquels il faut faire attention ? Les conditions de deroulement de 1'experience Une manipulation dure plusieurs heures et demande un effort mental assez important. En optique. Si la base de 1'appareil est consideree comme horizontale il faut.Ill .3 COMMENT EVITER LES ERREURS SYSTEMATIQUES ? Pour eviter ces erreurs on peut donner quelques recommandations pratiques. Les erreurs systematiques proviennent souvent du mauvais fonctionnement de 1'appareillage ou de 1'experimentateur lui-meme. Pour eviter ce probleme il faut verifier 1'etat des piles avant 1'experience. II faut placer 1'appareillage de fagon telle que les appareils les plus frequemment utilises soient facilement accessibles. sur la figure 3. le verifier a 1'oeil nu. Meme dans le cas d'une manipulation relativement simple en travaux pratiques il faut leur consacrer quelques minutes. Ce dernier paragraphe contient quelques recommandations generates qui permettront d'eviter une grande partie de ces erreurs. il faut les interchanger et repeter la mesure. C'est pourquoi il faut commencer par la preparation de la place de travail : on ne laisse que les objets indispensables (le cahier d'experience. Toutes ces erreurs sont presque inevitables. 3. de la responsabilite de 1'experimentateur.). II faut savoir les estimer en sachant bien que ces estimations sont personnelles. il y aura une erreur liee au choix de la valeur retenue. De plus. nous devons mesurer la tension car elle peut etre differente de 220 V. La stabilite de la temperature rend le travail plus confortable et diminue les erreurs systematiques liees aux changement des conditions de 1'experience. il vaut mieux verifier des choses qui paraissent evidentes. subjectives. etc. L'experimentateur peut etre fatigue et il peut se tromper. Par exemple. Symetrie apparente Si le montage possede des elements identiques.4. si 1'aiguille se trouve entre deux divisions d'echelle.

la tension ou meme la resistance. Si nous voulons augmenter la precision sur ces valeurs. on peut les interchanger et verifier la stabilite du resultat. le courant devient different du zero.). a et b. pendant 1'experience. bien que le temps soit tres limite. II faut s'en assurer experimentalement en permutant ces resistances lorsque le courant qui passe par 1'amperemetre est nul. Quand on mesure la difference de deux temperatures avec deux thermometres differents il faut aussi les interchanger. frequence. il faut changer d'echelle et si on ne sait pas effectuer cette operation. Cette manipulation preliminaire permet de determiner la strategic future pour toute 1'experience. Si 1'un des thermometres (ou les deux) est affecte par une erreur systematique. Si le resultat n'est pas le meme on doit prendre la demi-somme des deux mesures comme valeur experimentale. Six points (entre 0 et 10 A avec un pas de 2 A) sont largement suffisants pour definir les parametres PQ. En travaux pratiques. Si on cherche. avec les resistances interchangees. cette procedure permettra de s'en affranchir. verifie le fonctionnement des divers elements. par exemple. on essaie d'obtenir une idee sur 1'intervalle des valeurs de chaque grandeur physique ainsi que sur leurs incertitudes. Un autre aspect important de la planification est 1'ordre chronologique des mesures lorsqu'il s'agit de determiner une dependance en fonction d'un parametre (courant. Experience preliminaire Une experience scientifique est toujours precedee d'une manipulation preliminaire. Planification d'une experience La manipulation preliminaire fait partie d'un probleme plus general de planification d'une experience. Si. s'entrame a effectuer les operations qui seront les plus frequentes. celle de la fonction lineaire par Feffet Peltier et celle de la fonction quadratique par I'effet Joule. on s'attend a une dependance telle que : La presence de la constante PQ peut etre expliquee par 1'existence de sources de chaleur. II faut. Si. Meme en travaux pratiques il faut essayer d'effectuer une experience preliminaire. En travaux pratiques. il faut soit remplacer les resistances soit augmenter 1'incertitude de mesure. la puissance P degagee par une resistance en fonction du courant / qui passe dans le circuit et qui varie de 0 a 10 A (la limite de notre amperemetre). . au moins.110 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES resistance inconnue Rx dans lequel nous utilisons deux resistances supposees identiques R. Dans cette manipulation. on risque non seulement de perdre du temps mais aussi de perdre une partie des donnees. etc. L'experimentateur "apprend" la manipulation. on utilise frequemment des appareils polyvalents qui peuvent mesurer le courant. Son but est multiple. il faut cerner exactement les points les plus delicats et les plus importants du point de vue physique ainsi que 1'enchainement entre les differentes parties de 1'experience. temperature. prendre connaissance de 1'appareillage et surtout de ses composantes qui n'ont pas ete etudiees auparavant. Si 1'on utilise deux appareils de ce type dans la meme experience.

par exemple. Le remede est trivial : nous devons noter immediatement tous les resultats pour ne rien oublier. si nous choisissons un ordre different des mesures : / = 0. la precision sur les parametres sera la meme. nous nous attendons a une dependance reguliere P(I) et pouvons controler que la puissance varie lentement avec la variation du courant. 4. 15 Hz (quatre points noirs sur la figure 3. 1 A. 10. G'est a Texperimentateur de decider quel est 1'aspect de la manipulation le plus important : la rapidite et la simplicite des mesures ou la securite. Un simple changement de 1'ordre des mesures peut nous aider a detecter une erreur systematique. 8. La tension aux bornes de la resistance peut etre approchee par la formule L'experience comprend deux etapes.9). la recherche de la frequence propre d'un circuit RLC par une mesure de la tension en fonction de la frequence. L'ecriture doit etre simple. elle modifie le parametre PQ). Si nous etudions une grandeur dont la dependance en fonction d'une variable est assez rapide comme. II n'y aucun interet a faire des mesures avec ce petit pas loin de i/o si nous ne nous interessons qu'a la position de la resonance. Si nous mesurons la puissance pour I — 1. 6 A. Ces exemples elementaires montrent que 1'ordre et le pas des mesures dependent de differents facteurs et I'experimentateur doit chaque fois decider quels sont les criteres les plus importants pour effectuer ces choix. Le probleme concernant 1'ordre des mesures apparait quand il existe une source d'erreurs systematiques (par exemple. 2. il ne faut pas perdre de temps en fixant les valeurs de / exactement a 1 A ou 2 A. nous determinons le comportement general U(v} avec un pas qui peut etre assez grand. 00 A. Enregistrement des resultats Lorsque nous enregistrons les resultats. si la temperature de la piece monte progressivement pendant 1'experience. 2 Hz (carres blancs sur la figure 3. Pour accelerer la manipulation nous pouvons faire les mesures en augment ant progressivement le courant avec un pas de 2 A d e O a l O A .EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 111 nous pouvons prendre un pas plus petit.Ill . Le but de cette etape est de determiner approximativement la position de la resonance : nous voyons que z/o se trouve entre 30 et 50 Hz. D'abord. Cependant. . Avec 1'ordre precedent nous ne trouverons jamais cette source d'erreurs : la fonction P(I} sera toujours reguliere et continue.9). 95 A au lieu de / = 2. Par centre. De plus. les points experimentaux "oscilleront" autour d'une courbe continue et ces oscillations seront plus grandes que les incertitudes des mesures. le but est de ne pas introduire d'erreurs supplementaires. L'avantage est que notre systeme trouvera chaque fois son equilibre assez rapidement. Ensuite. Dans notre systeme. la logique doit etre differente. concise et elle doit contenir un minimum d'explications necessaires pour que nous puissions plus tard comprendre et interpreter ces resultats sans aucune ambigui'te. nous devons repeter nos mesures au voisinage de VQ avec un pas beaucoup plus faible. il n'y a pas de dependance rapide en fonction du parametre et il vaut mieux choisir des points de mesures distribues de maniere uniforme sur tout intervalle de variation du courant. Une ecriture claire et facilement lisible depend de notre experience personnelle et elle viendra au fil des annees.

le cahier d'experience reste le meilleur moyen pour eviter la perte d'information. Par exemple. Deuxiemement. Cependant. Mais le danger le plus important vient du fait que. L'avantage principal d'un tel cahier par rapport aux feuilles separees est qu'il est plus difficile de le perdre.9 : Determination de la position d'une resonance La fagon la plus traditionnelle d'enregistrement des resultats est 1'utilisation d'un cahier d'experience. on decide que telle ou telle mesure n'est pas tres parlante ou simplement . par hasard. II est utile de numeroter ses pages et de reserver une page au debut pour la table des matieres. Recopier des resultats est tres dangereux. Dans le bilan d'une experience. Inscription des resultats Tous les resultats doivent etre notes immediatement. si 1'echelle d'un voltmetre est de 5 V. II ne faut jamais utiliser les brouillons pour copier ensuite les resultats dans le cahier de manipulation. nous nous trompons lors de la multiplication par 5 nous ne serons plus capables de corriger cette erreur plus tard. Cette operation est triplement dangereuse.112 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Figure 3. dans leur forme brute et sans la moindre modification. L'inconvenient est que meme les mesures simples ne s'effectuent jamais dans un ordre parfait et que notre enregistrement peut etre assez disparate. nous pouvons introduire des erreurs supplementaires. Si. nous perdons du temps. on n'utilise pas toutes les mesures effectuees. lorsque nous copious les resultats. Assez frequemment. Premierement. dans le cahier d'experience il faut noter le nombre de divisions d'echelle ainsi que la valeur de pleine echelle. nous ne pouvons pas eviter la selection. II n'est pas toujours commode de coller dans ce cahier des feuilles de papier millimetre avec des courbes ou des listings d'ordinateur.

La premiere ligne de chaque colonne doit contenir le nom de la grandeur. Si possible. Nous obtiendrons des resultats differents et determinerons ainsi 1'incertitude en utilisant 1'approche decrite dans ce livre. Si. la vraie taille de la resistance inconnue Rx peut etre de quelques millimetres tandis que la resistance variable Rv represente un appareil d'une dizaine de centimetres. La seule solution a ce probleme est de conserver tous les resultats des mesures. C'est tres bien car il permet d'accelerer 1'acquisition des donnees d'une fagon spectaculaire. il faut comprendre que 1'ordinateur ne peut pas faire des miracles et la precision d'une seule mesure faite avec 1'ordinateur n'augmente pas pour autant ! Quand Pecran de 1'ordinateur afflche huit chiffres significatifs. 1'echelle est consciemment modifiee. nous mesurons des differences de temperatures a 1'aide des deux thermometres. Cependant.Ill . plus tard.EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 113 inutile. une valeur fausse nous pourrons trouver plus facilement cette erreur si nous avons deux enregistrements separes. II vaut mieux noter les valeurs de la meme grandeur physique dans une colonne. car Poeil compare plus facilement deux chiffres ecrits Pun sous Pautre. II doit contenir le minimum necessaire d'informations en expliquant Pidee de Pexperience. en donnant une description de Pappareillage et les notations utiles. Ordinateur L'ordinateur devient de plus en plus present en travaux pratiques. 1'appareil qui sert d'interface entre Pappareil de mesure (un voltmetre. dans le schema presente sur la figure 4. Nous verrons alors les fluctuations dans les indications de ce thermometre. Nous devons enregistrer les indications de deux appareils et ensuite calculer la difference. un thermometre. Si 1'un des appareils fonctionne mal et donne. de temps en temps. Le nombre de chiffres am dies est defini par le nombre de digits d'ordinateur et non par la veritable precision de 1'experience. nous devons savoir qu'en realite le nombre de chiffres significatifs reste le meme que si nous avions fait la mesure nous-memes. La solution consiste a repeter 1'experience ou une partie de celle-ci. Tous les resultats des mesures doivent etre ecrits de preference. etc. nous decidons que nous nous sommes trompes dans le choix des criteres.4. Simplement. Ce phenomene pose un vrai probleme : 1'acquisition automatique des donnees rend difficile la determination de 1'incertitude de mesure car 1'appareil de mesure est souvent inaccessible. On a parfois besoin d'un schema complet dans lequel 1'echelle est soigneusement respectee. Mais dans la plupart des situations. Par exemple. Autrement dit. Par exemple. son symbole et ses unites. Dans cette experience. II . ces resistances jouent le meme role et le dessin souligne leur "equivalence". il faut preparer les tableaux avant la manipulation. Cette procedure est parfaitement correcte a condition que nos criteres de selection soient objectifs et justes. nous devons avoir la possibilite de revoir Fensemble des mesures initiales. sous la forme d'un tableau. Schemas et tableaux Les schemas et les tableaux sont des formes tres pratiques pour limiter Pecriture et eviter ainsi les erreurs inutiles.) et 1'ordinateur ne sait pas arrondir correctement le resultat. nous selectionnons les resultats. Si nous ne notons que la difference nous ne saurons jamais lequel des deux thermometres fonctionne mal. II ne faut pas que le schema d'une experience soit trop detaille et qu'il soit proche d'une photographic.

de plus. Prenons un exemple.) la chaleur specifique est donnee par : ou AT est la difference des temperatures apres et avant le chauffage. la tension aux bornes de celle-ci [/. Pour cela. plus tard. etc. il est utile de reecrire Favant-derniere expression sous la forme . r = 23. nous devons preparer six colonnes : pour la tension et son incertitude. 7 V. En premiere approximation. 36 K. / = 42 mA. Calculs arithmetiques Lors des calculs arithmetiques. Dans 1'expression initiale nous reecrivons toutes les valeurs dans le meme systeme d'unites (par exemple. Nous determinons la valeur de la chaleur specifique C d'un liquide de masse m contenu dans une boite.114 ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES est toujours utile de reserver quelques colonnes supplementaires. Elles peuvent etre necessaires pour noter immediatement les incertitudes sur les valeurs (surtout si elles varient lors de 1'experience) ou. pour le courant et son incertitude et pour la resistance et son incertitude. si nous negligeons les pertes de chaleur (par la surface de la boite ou pour chauffer la resistance elle-meme. Premierement. les resultats obtenus lors du traitement des donnees. 7 s. Soient les valeurs experimentales : m = 17. Le courant qui passe par la resistance est /. trois remarques s'imposent. L'ordre de calculs doit etre le suivant. Par exemple. la duree du chauffage r. U = 10. SI) : nous separons les chiffres et les unites : nous faisons les operations arithmetiques a 1'aide d'une calculatrice et nous transformons les unites : Ici. les echelles de ces appareils ne sont pas des multiples de 10. 6 g. si nous mesurons la resistance inconnue comme rapport de la tension a ses bornes au courant qui la traverse. il vaut mieux preparer des colonnes supplementaires pour noter les mesures brutes comme nous Tavons discute auparavant. nous chauffons ce recipient a 1'aide d'une petite resistance plongee dans le liquide. il ne faut pas se precipiter sur la calculatrice. AT = 0. Si.

par exemple.42 W. verifier la position du zero de Pappareil). S'il indique — 0 . 3. si nous effectuons la mesure d'une puissance electrique supposee constante a 1'aide d'un wattmetre. pour 1'instant. dans le resultat intermediaire nous gardens. nous avons note une valeur de 4. La valeur de la premiere fraction. car nous connaissons la chaleur specifique de 1'eau 4. a la precision de nos mesures. bien que les valeurs de AT et de / n'en contiennent que deux. cela signifie que la difference entre les deux valeurs de la puissance est due a la variation reelle de la puissance dans le circuit. II ne faut pas oublier que.Ill . probablement. au moins. x • 10n+1. nous voyons que le wattmetre indique une valeur de 4. Si 1'appareil debranche indique une valeur 0. nous ne laisserons que le nombre de chiffres significatifs correspondant a cette incertitude (peut etre un seul). dans la plupart des situations. Dans ce cas. Meme si le liquide dans le recipient n'est pas de 1'eau. cette ecriture suppose une interpretation . II faut obligatoirement noter ce phenomene dans le cahier d'experience. nous devons utiliser lors des calculs ulterieurs une valeur de la puissance P = (4.4 COMMENT TRAVAILLER AVEC LES ERREURS SYSTEMATIQUES ? Que faire avec les erreurs systematiques ? Comment peut-on travailler avec ? Si c'est possible. dans la derniere expression.04) W . Deuxiemement. 0 2 ) W. pour des raisons de commodite.50 W et nous savons que 1'incertitude sur cette valeur determinee a partir de la classe de 1'appareil est de 0. Que devons-nous faire dans cette situation ? II faut debrancher le wattmetre du circuit et voir la valeur affichee. 46 ±0. La difference par rapport a la valeur initiale est due. A la fin de notre experience. il vaut mieux les eviter ou. mais pour les calculs ulterieurs on prendra une valeur de la puissance P = (4.68. 0 7 W.1 a 10). nous avons choisi les unites kJ/kg-K et non pas J/kg-K. dans notre cahier d'experience nous devons noter ce phenomene et que 1'incertitude a ete calculee non pas a partir de la classe de 1'appareil mais qu'elle a ete estimee grossierement par AP = (. essayer d'eliminer ces sources d'erreurs (comme.02 W. Parfois. cela signifie que le zero de 1'appareil a derive et que la puissance mesuree a la fin de 1'experience etait egale en fait a 4. pour les erreurs statistiques.49 W. Les erreurs systematiques et statistiques sont de nature differente.4. les deux s'ecrivent sous la meme forme ±Ax. sinon nous ne changeons rien.Pmax — -P m m)/2. 50 ± 0 .18 kJ/kg-K et cette valeur nous est tres familiere.EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES 115 ou nous avons separe les chiffres significatifs et les ordres de grandeur : si la valeur de x • 10n est plus grande que 5 • 10n nous 1'ecrivons cornrne 0. L'avantage d'une telle representation est que nous voyons immediatement 1'ordre de grandeur : 103. Nous le faisons volontairement pour eviter les erreurs supplementaires d'arrondi.00 W. Troisiemement. Au debut de 1'experience. il faut toujours avoir les reperes physiques qui peuvent servir comme moyens de controle de la validite de notre resultat. Cependant. apres avoir calcule 1'incertitude sur C. on ne peut pas eliminer la source de ces erreurs mais on peut introduire une correction permettant de diminuer Ferreur. Dans le resultat final. trois chiffres significatifs 1. Par exemple. sera alors de 1'ordre de 1 (de 0.

Par contre. Nous estimons que notre incertitude de lecture est egale a la moitie de la division d'echelle : Aa?iect = 0. Formellement. 025 A. on peut utiliser la formule de propagation d'erreurs a condition d'introduire les correlations entre les erreurs. A 1'aide d'un voltmetre nous avons mesure deux tensions V\ = 7. le module du coefficient de correlation est egal a 1. Les incertitudes statistiques sont respectivement AVi = 0. Ainsi 1'erreur d'appareil est egale a Aar app = 0. Supposons que notre appareil de mesure soit un amperemetre de la classe 4 avec une pleine echelle de 5 A et que cette echelle possede 100 divisions. Cette formule nous aide a comprendre.1 V. On peut le voir dans un exemple tres simple. En particulier. L'incertitude de mesure est alors . par exemple dans la comparaison rapide de deux resultats experimentaux. C'est pourquoi. dans la litterature scientifique. Neanmoins. ces erreurs n'obeissent pas aux memes lois que les incertitudes statistiques. En principe. par exemple. celle de 1'appareil ou celle de la lecture. 5 V et V-2 = 6. 2 A. quand nous effectuons des mesures avec les appareils a aiguille. quelle incertitude il faut choisir. 3 V.4 V et AV? = 0. C'est pourquoi on introduit aussi une incertitude totale de 1'experience qui reunit toutes les sources d'incertitudes : Cette expression n'est pas mathematiquement irreprochable mais elle est tres pratique. Le decalage du zero d'appareil ne peut pas influencer la difference des deux tensions. En revanche. nous pouvons ecrire Si nous voulons calculer la difference v — V\ — Vz. Ainsi. la formule de propagation des erreurs (55) ne peut pas etre appliquee aux erreurs systematiques.ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES precise en termes de probabilites. nous obtenons la valeur La seule incertitude presente est statistique et calculee selon (56). le resultat final d'une experience se presente sous la forme ou Ax s tat est une erreur statistique et Axi et Aa?2 sont des erreurs systematiques introduites par des raisons differentes. Dans notre cas. si nous voulons calculer la somme V = V\ + V?. le travail avec une telle expression devient complique. le resultat sera Les erreurs systematiques sur la position du zero s'ajoutent dans ce cas. 3 V. Nous conseillons au lecteur interesse d'obtenir la formule correspondante. pour les erreurs systematiques il n'en est pas de meme : leurs valeurs sont obtenues par des estimations parfois grossieres et subjectives. II existe aussi une erreur dans la position du zero du voltmetre que nous estimons a AVb = 0. L'ecriture d'un resultat sous la forme (122) est la seule acceptable.

que les indications de 1'appareil aient ete stables tout le long de la mesure). En pratique. on peut dire que 1'incertitude de mesure est approximativement egale a la division d'echelle.5. pour les appareils avec Paffichage numerique. 1'incertitude peut etre estimee grossierement a 1 dans le dernier digit (a condition. Dans ces conditions.EXPERIENCES AVEC UN NOMBRE LIMITE DE MESURES Si notre amperemetre est de la classe 0. notre amperemetre devrait etre de la classe 1 ou 0. tous les appareils ont une echelle telle que 1'incertitude de lecture soit compatible avec celle de 1'appareil : Autrement dit. Cette estimation est utilisee quand on ne dispose pas d'information sur la classe de 1'appareil. 005 A et 117 Ces deux examples ne sont pas ties realistes : ils servent surtout a illustrer la procedure a appliquer pour estimer les incertitudes. Par exemple.Ill . . alors Aa?app = 0. bien evidemment.1.

.Cette page est laissée intentionnellement en blanc.

on cherche la meilleure valeur du parametre. defmissons quelques propretes generales des parametres deduits des donnees experimentale.CHAPITRE 4 AJUSTEMENT DES PARAMETRES On rencontre des nombreuses situations dans lesquels on des parametres sont determines a partir des donnees experimentales. si Ton fait une serie de TV mesures d'une grandeur1 X pour laquelle on obtient les resultats xi.x^. Si Ici. En principe. La premiere est 1'existence d'une erreur systematique. Par exemple. Par exemple. differentes expressions peuvent etre proposees pour definir la valeur d'un parametre a partir des donnees experimentales. Habituellement. on peut proposer comme valeur de X la moyenne de tous les resultats ou la moyenne des valeurs maximale x max et minimale xmln Xi et X<2 sont des estimations differentes de la meme grandeur X. mais on aurait pu egalement parler d'un parametre X. Avant d'evoquer des approches concretes d'ajustement. • • • . on parle d'une grandeur X pour utiliser les exemples deja abordes dans ce livre.XN. On peut donner quelques importantes caracteristiques des telles estimations. . Cette procedure est appelee ajustement des parametres. son incertitude et une maniere d'evaluer la qualite de la description des donnees par la fonction choisie. les deux estimations peuvent etre utilisees dans des situations differentes. on a une fonction qui depend d'un parametre et on veut trouver la valeur de ce dernier pour que cette fonction reproduit bien les donnees. Comme nous 1'avons deja discute dans ce livre.

On a deja vu 1'importance de cette notion dans la discussion de la variance experimental e au paragraphe 3.3. on a du diviser la somme par N — 1 et non pas par TV.p2. La deuxieme caracteristique importante d'une estimation est son efficacite. • • • ) &XN — VNA partir de ces donnees. Parmi toutes les estimations possibles. en tant que variables aleatoires. • • • >PN-i (pN doit etre exprimee en fonction des autres variables a partir de (123)) : Pour que &'x(piip2.X2.2). &x-2 — °~2.120 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES 1'estimation est dite biaisee. 1'estimation efficace est celle dont la variance est la plus petite. pour eviter une erreur systematique dans cette definition. on cherche a ce que la variance de X soit minimale. — F/v = ^ mais des variances differentes aXl = <TI. • • • . on impose que X ait la meme moyenne fi que les {*.'} : Cette condition donne La variance de X se calcule tres facilement en ecrivant Tindependance des {xj} : cr^x peut etre consideree commefonction de TV—1 variablesindependantes pi.1.. Regardons le role de cette notion d'efficacite sur un exemple deja etudie : 1'addition de resultats experimentaux (voir paragraphe 3. Autrement dit.. Choisissons ces poids en imposant comme condition Pefficacite de 1'estimation. • • -PN-i) soit minimale. il faut que les derivees partielles correspondantes soient nulles : .1. ont la meme moyenne ~x\ — ~x^ = . Dans la definition (86). precisement. Quelle est la meilleure fagon de calculer la moyenne de resultats experimentaux differents ? Soient N resultats a?i. #AT qui. on peut construir une combinaison lineaire dans laquelle les difFerents resultats sont ponderes par des poids inconnus pi. Avant de calculer la variance de X. on dit egalement qu'elle est correcte. Si 1'estimation n'est pas biaisee.

.En faisant la somme de ces equations on obtient : soit Finalement. Ainsi pour X et <r^.IV — AJUSTEMENT DBS PARAMETRES Ainsi on obtient N — 1 conditions : 121 On pent ecrire a nouveau ce systeme sous la forme ou A = pi + Pi + • • • + PN-I. on trouve les poids pi qui sont inversement proportionnels aux variances ~2 . on retrouve 1'expression (118) : On voit que ces caracteristiques (estimation biaisee. Nous allons exposer maintenant deux methodes les plus frequemment utilisees (la methode des moindres carres et celle du maximum de vraisemblance) pour ajuster des parametres. emcacite) sont tres importantes pour pour optimiser le choix des parametres.

c'est un probleme assez complexe. Supposons que notre fonction y = y(x] depende aussi de k parametres {dj} — ai.1 : Trace de la fonction lineaire Nous disposons de n mesures independantes {y^v} = yr P '^2 X p > • • • > ?/nXp d'une grandeur physique y pour n valeurs de son argument {%i} — xi. • • • .sont decrites par les variables aleatoires tandis que les {#. Ainsi les parametres {ctj} sont egalement decrits par les variables aleatoires dont nous devons determiner non seulement les valeurs moyennes mais aussi les variances. C'est pourquoi nous faisons 1'hypothese supplementaire que y est une fonction lineaire de ses parametres {aj} qui s'ecrit .122 ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES 4. akCette formulation du probleme suppose que les valeurs y.1 IDEE DE LA METHODS DES MOINDRES CARRES Dans un cas general. En pratique.xn. cette hypothese signifie que les incertitudes Axt.1 METHODE DES MOINDRES CARREES Revenons sur la question posee au debut de ce chapitre : si dans notre fonction theorique. des parametres libres existent.sont negligeables.1.a?2.1 ? Figure 4.} sont definis d'une fagon deterministe. comment pouvons-nous les choisir pour avoir le meilleur accord avec les points experimentaux ? Par exernple.. • • • . quelle est la meilleure fagon de tracer une droite qui passe par les points experimentaux representes sur la figure 4. 4. 02 .

2 . . Le lecteur interesse peut la retrouver dans les livres de mathematiques.AJUSTEMENT DBS PARAMETRES 123 ou les fonctions {fi(x)} sont connues. Dans ce livre. Plus proches sont la theorie et 1'experience. plus petite est la contribution de ce terme. Nous supposons done que n > k. Par exemple. Cependant. Pour determiner k parametres. De plus. malgre cette hypothese sur la linearite par rapport aux coefficients {ctj}. . . . 0 2 . notre probleme reste assez general et particulierement utile pour les applications physiques. . moins importante est la contribution de ce point. dans ce cas nous cherchons les coefficients de developpement en serie de Taylor ou de fonctions trigonometriques cosinus et sinus et obtenons un developpement en serie de Fourier. Chaque terme est pondere par un poids conformement a son erreur <T. (voir le paragraphe 3. La raison pour cela en est simple : on ne dispose pas d'autre methode presentant la meme simplicite et la meme puissance. Malgre 1'importance de ce theoreme. nous nous sommes surtout interesses a la demarche et nous allons montrer maintenant comment appliquer la methode pour obtenir les valeurs des parametres et leurs incertitudes. Le critere utilise (le minimum de la somme des carres) n'est pas le seul critere possible. En pratique. nous ne donnons pas ici sa demonstration. il n'est pas necessaire de supposer que les l^f XP } s°ient distributes selon la loi normale et le critere reste toujours valable). Cette affirmation reste vraie quelle que soit la forme de la distribution de probabilite (autrement dit. nous supposons que nous connaissons les vraies variances de chaque point af. . .IV . a^'. nous avons besoin d'au moms deux points pour definir la pente et la constante a 1'origine. pour une droite. n qui reunit ainsi la totalite de 1'information experimentale. Plus grande est <rz-. Notons simplement que 1'idee de la demonstration est proche de celle que nous avons utilisee au debut de ce chapitre pour retrouver la formule (118). Xi) calculee pour cette valeur de Xi. . . nous ne pouvons obtenir que les valeurs experimentales (Ay 2 exp ) 2 .2). Ainsi. Chaque terrne de la somme est le carre de la difference entre la valeur mesuree y^xp et la valeur theorique y(a\.2. on peut demontrer un theoreme mathematique (dit de Gauss-Markov) selon lequel les parametres determines par la methode des moindres carres sont les plus precis : leur variance sera plus petite que les variances des coefficients obtenues avec tous autres criteres. Une approche assez generale pour choisir des parametres est donnee par la methode des moindres carres. II faut noter que la methode des moindres carres est souvent utilisee dans des situations ou ses conditions de validite ne sont pas vraiment remplies (ou si 1'on n'est pas sur qu'elles soient remplies). II peut s'agir de monomes comme fi(x] — xl. il faut que le nombre de points experimentaux n soit egal ou superieur a k. Dans cette methode on affirme que les meilleurs parametres {aj} sont tels qu'ils minimisent la somme des carres : C'est une sornme sur tous les points experimentaux i = 1.

introduisons la matrice T de n lignes et de k colonnes : le vecteur (soit la matrice d'une colonne et de n lignes) et le vecteur (soit la matrice d'une colonne et de k lignes) Avec ces notations matricielles. II est plus facile de travailler avec une ecriture matricielle. la somme R (125) s'ecrit et les equations (126) Nous voulons trouver le vecteur A a partir du vecteur connu 3^ En multipliant (127) par la matrice (^7T^7)~1.124 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Pour trouver le minimum de la somme nous devons resoudre un systeme d'equations lineaires : soit Dans le cas general. Pour cela. nous obtenons le resultat : .

IV .j} ne sont pas independants). la matrice D(A) ne Test pas (les parametres {a.77T.AJUSTEMENT DBS PARAMETRES 125 Les vecteurs A et y sont lies par une transformation lineaire avec un Jacobien J. Explicitons (128) et (130) pour les cas les plus simples. c'est pourquoi nous pouvons utiliser la relation (65) pour les variances : La matrice de covariance D(y] est diagonale car toutes les mesures y"p sont independantes. Fonction constants la matrice T se degenere en une seule colonne : La matrice (. Bien que la matrice D(y] soit diagonale. De plus elle est egale a la matrice unitaire vu la normalisation du vecteur y : Ainsi.77) devient un nombre De meme Le resultat (128) prend la forme . I'expression (129) prend la forme Grace aux formules (128) et (130) nous avons trouve les valeurs des parametres {aj} et leurs incertitudes.

= an = a.126 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES et 1'expression (130) pour la variance devient Si toutes les erreurs sont les memes. . nous retrouvons nos formules pour la moyenne (82) et pour la variance (84) : Fonction lineaire la matrice F prend la forme : la matrice (F^F] est une matrice (2 x 2) et La matrice inverse de (J-^ J-} qui est aussi la matrice de covariance (130) s'ecrit ou . <TI = &i = . .

ce qui signifie que les deux parametres a\ et a-i sont correles : Remarque tres importante. la somme Rmin ou nous avons remplace les {aj} par leurs valeurs venant de la minimisation (128) a une distribution x2 avec (n — k) degres de liberte.IV . la notation standard de cette somme est x2 : Rmin = Xmin. si tous nos calculs sont corrects et coherents et si toutes nos hypotheses sont verifiees. Pour les {yjxp} distributes selon une loi normale.AJUSTEMENT DBS PARAMETRES Les expressions (128) donnent 127 Les elements D(A)\\ et D(A}<2-2 de la matrice de covariance defmissent 1'incertitude sur cti et sur 0.3 Dans le cas general. Supposons que toutes les valeurs {yzexp} soient distribuees selon une loi normale. conformement a la formule (105). nous devons obtenir pour la somme de carres jR^Pn une valeur proche de (n — k ) . Les conditions de minimisation (126) ou (128) fixent k relations entre les {yzexp}. La probability dP que les y{ se trouvent dans les . la methode de moindre carres est egalement appelee la methode % 2 . I'element D(A)i2 est different de 0.Rappelons que la valeur moyenne de Xmin sel°n (98) est alors que son erreur est selon (99) Autrement dit. A cause de cette relation avec la distribution % 2 . Ainsi. L'hypothese de la forme gaussienne des distributions y^ donne une autre interpretation du critere du minimum des carres.

. nous avons presente un exemple de donnees experiment ales (10 points) pour lesquelles nous voulons ajuster une droite y = a\ + a-^x. le meme nombre de chifFres significatifs dans a^x et dans 01Nous pouvons estimer aussi le coefficient de correlation (22) de deux parametres Sa valeur absolue est relativement grande. y^xp + dyi] s'ecrit alors ou R est defini par (124). On peut dire que les "meilleures valeurs" de 0 1 .2. .. L'application directe des formules (133) —(134) nous donne le resultat final : Nous gardens deux chifFres significatifs dans 1'incertitude Aa2 afin d'avoir. a^ sont celles qui attribuent la plus grande probabilite au resultat observe.. . pour les grandes valeurs de x. 0 2 . .2.1. Ier niveau d'analyse Pour une estimation rapide on peut utiliser une procedure presque intuitive.a. . 4.2.128 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES intervalles [yj xp . Nous avons pris conscience de cette correlation lors de notre analyse rapide : pour passer . nous avons explicite tous les resultats intermediaires necessaires pour calculer 01 et a 2 .. .2 EXEMPLE D'UNE FONCTION LINEAIRE Sur la figure 4. correspond au maximum de cette probability. a/j). Les valeurs numeriques correspondantes sont reunies dans le tableau 4. . 0 2 . pour les lignes (1) et (2) on obtient IIe niveau d'analyse Dans le tableau 3. A Poeil nu. Ainsi le minimum de R(ai. o&. . on trace toute la famille des courbes lineaires qui passent par les points experimentaux et on choisit les valeurs maximale et minimale de a.1. La valeur approximative et son erreur peuvent etre definies simplement comme : Dans notre cas. done ces parametres sont fortement correles. fonction des parametres 0 1 . . .

5 106.6 (Ay^p 15.2 25 75 4 4.5 4 20 6 2. mais une constante : II applique les formules (131) et (132) et il obtient .2 247.83 1.78 2.4 £ vr ^r (A^F (Ayfxp)2 2.IV .5 10. la somme correspondante est proche de zero.7 (A3/rp)2 (Aj/^ x p P 2/eXP'^i I? 3 15.2 25 225 1 0 1.6 0.7 2025 625 t/r p 27.3 J/*hi 5.L'erreur sur la constante et le coefficient de correlation sont petits dans ce cas-la.3 3.0 1.4 2. IIP niveau d'analyse Dans Interpretation d'une experience de physique.5 0.4 2.78 0.0 1.0 3 3.2 0.1 0.4 4. selon laquelle les resultats experimentaux peuvent etre decrits par une fonction lineaire. nous ne pouvons pas nous limiter aux calculs des parametres et a leurs incertitudes.78 2.3 300 64 70 35 56. est correcte.7 3334 201.4 0.6 2 3.3 1.5 74.7 2. Ceci peut egalement se voir grace a la formule (135).8 0.0 6.1 225 100 64 16 100 14 100 5.6 8 2.3 0.6 6. Nous devons aussi nous assurer que notre hypothese.9 4. Ceci n'est pas toujours le cas.4 13.0 10 (»r (A2/r ) p -vjph42) 2 de la droite (1) a la droite (2) il faut changer non seulement la pente a^ mais aussi la constante a\.6 7 2. le coefficient de correlation est grand. le passage d'une droite extreme a une autre se fait seulement par la modification de la pente 02.0 1.2 : L'ajustement des coefficients ai et a? pour une droite xt 129 1 5.25 445.0 0.1 3 4. Quand I'origine x = 0 se trouve au milieu des points experimentaux. Dans une situation ou I'origine x = 0 se trouve a peu pres au milieu des points experimentaux.4 4.AJUSTEMENT DBS PARAMETRES Tableau 3. Supposons que notre collegue affirme que la meilleure approximation de ces points experimentaux n'est pas une fonction lineaire y(x) = a\ + a^x.6 3.7 19.} sont du meme signe.8 1.8 913. Quand tous les {a?.1 0.1 53 1.0 0.7 0.25 62.0 0.8 0.5 4 16 5 3.7 1.1 0.5 0.8 136 8.0 2.4 6.83 16.9 0.1 9 1.

70 0.30 1.578 0. Par centre. mais comment pouvons-nous le prouver ? La difference entre nos deux resultats se trouve dans la valeur de la somme Xmin clu '' faut calculer apres avoir choisi les valeurs des parametres {a z }. Conformement a (136) et (137).322 18.340 12.001 0.684 15.906 8. pour v degres de liberte pour une droite T V 0.191 37.651 12. II faut se rappeler que la distribution X 2 est asymetrique et que ('interpretation des resultats avec cette distribution est un peu particuliere.50 0.351 5.211 0.219 4.594 5.10 2.Xmin = 4.455 1.366 3.148 9.393 7. dans notre ajustement de 10 points avec 2 parametres.475 20.059 3.342 10.558 9.304 7.242 13.064 0.822 4.412 0.926 10.90 0.204 28.645 12.752 1.865 11.542 24. Son hypothese est fausse.790 8.312 10.900 25.000 33.343 3.527 6.409 34.341 11.812 18.634 9.168 4.070 3.706 4.2 (Xmm)exp — 10 est en tres bon accord avec cette estimation (les valeurs de y\^ sont calculees avec les parametres (139)).016 0.610 2.086 16.002 12.338 18.775 0.237 0.987 17.119 16.343 9.179 6.178 4. nous presentons les valeurs %2 et les probabilites P pour que %2 soit plus grande ou egale a %2 avec un nombre donne de degres de liberte.307 23.338 19.828 4. Pour notre collegue. Pour illustrer ses proprietes dans notre cas.134 1.01 6.760 23.688 29.444 0.145 ! Voi|a la contradiction ! Nous pouvons reformuler ces conclusions en termes de probabilite car nous avons deja etudie la distribution %2 au paragraphe 2.011 15. En fait.090 21.236 10.085 10.418 19.339 15.584 1.656 11.642 5.038 0.130 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES II suffit de regarder la figure 3.803 11.781 12.368 5.467 10.307 11.532 3.380 6.547 9.490 4.899 14.185 0.362 14.352 16.209 24.985 6.074 2.337 0.635 9. La probabilite de trouver x2 proche de 100 est alors negligeable.042 7.812 16.98 0.615 22.980 7.609 4.671 5.713 1.064 22.195 3.141 30. cette valeur est assez grande.231 8.20 1.689 22.383 9.277 15. la probabilite de trouver x2 P'US grand que 21.151 19.821 11.631 15.985 18.442 14.040 0.064 7.339 14.152 12.779 9.531 14.251 7.725 26.440 15.289 8.017 13.578 6.032 2.601 21.275 18.3.566 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Dans notre cas.765 5.204 2.267 8.386 2. on obtient Xmin = & avec une incertitude A.348 6.064 1.266 0. on s'attendrait a obtenir Xmin = ® avec ^Xmin — ^ tandis que la valeur experimental est (Xmm)eXP .80 0.833 3.989 7.721 12.511 20.345 13.005 1.338 17.564 2.524 10.222 17. Dans le tableau 3.338 16.614 7. la probabilite de trouver x2 > 10 Pour v — 8 est approximativement egale a 25%.429 0.642 3. pour I'analyse de notre collegue.857 13.465 21.357 4.812 21.989 27.255 7.034 9.3 pour voir qu'il se trompe.340 13.La valeur obtenue dans la derniere ligne du tableau 3.716 14. Ainsi son hypothese est refutee.030 12.311 20.549 19.562 9.210 11.344 8. divisons les valeurs de %2 en 4 .665 4.624 13.3 : Les valeurs x^> et les probabilites P pour que \2 > x?.346 7. Tableau 3.578 32.769 25.3.424 2.878 6.446 1.807 8.805 36.000 3.865 5.7 pour v — 9 est inferieure a 1%.217 27.2.605 6.148 0.649 2.408 3.666 23.

Rappelons que nous avons remplace partout dans nos calculs les vraies variances cr? par les valeurs experimentales (Ay^ xp ) 2 . ^2 — 0.15. Le pas correspond a la racine carree de la variance. Ainsi nous sommes capables de determiner %2 a 10 — 20% pres.3. La methode des moindres carres est une approche tres efficace et elle est largement suffisante pour les experiences faites en travaux pratiques. En conclusion. . 4. on utilise une autre approche plus generale basee sur la fonction dite de vraisemblance.1 L'IDEE DE LA METHODE DU MAXIMUM DE VRAISEMBLANCE L'idee de la methode du maximum de vraisemblance est assez simple (pour simplifier encore la presentation. C'est pourquoi on peut chercher a proposer une approche plus generale du probleme.12[ et 74 = [12. car nous ne connaissons que ces dernieres.. Neanmoins. 72 = [4. 30. On peut demontrer que cette condition peut etre legerement affaiblie mais que.3. Utilisons la demarche adaptee a la fin du paragraphe 4.IV . il existe des situations ou on ne peut pas 1'appliquer. La difference entre a^ et Ay^xp peut etre de I'ordre de 10%. 73 = [8.4[.8[. on considere que le choix d'une fonction est correct si la valeur de x2 Par degre de liberte est proche de 1.40.2. ou nous avons interprete la methode des moindres carres comme celle qui donne la probabilite maximale de retrouver les valeurs experimentales avec une fonction theorique.1. ou quand les incertitudes sur x ne sont pas negligeables x\.1. par exemple lorsque le nombre d'evenements est petit et que Ton ne peut pas evaluer correctement les incertitudes. cette approche n'est pas valable pour une distribution quelconque. mais les incertitudes sur ces valeurs peuvent etre tres differentes des valeurs exactes. II existe un autre argument important qui conduit a interpreter ces probabilites avec beaucoup de prudence.xn. PI ~ 0. PS ~ 0. L'avantage du troisieme niveau reside en la possibilite de confirmer ou d'infirmer le choix de la dependance fonctionnelle. notons que la comparaison des deux premiers niveaux d'analyse montre bien deux particularity caracteristiques de ce genre d'evaluation rapide : 1'approche simple reproduit assez bien les valeurs de 01 et de 0.oo[.AJUSTEMENT DBS PARAMETRES 131 intervalles : /i = [0.. . Nous voyons que les probabilites d'obtenir de tres grandes et de tres petites valeurs de x2 sont faibles. nous evaluons les probabilites pour que la valeur de x2 se trouve dans I'intervalle correspondant : P\ ~ 0. nous supposons qu'il n'y qu'un seul parametre a .2 METHODE DU MAXIMUM DE VRAISEMBLANCE Une des hypotheses utilisees pour developper la methode des moindres carres etait la forme gaussienne de la distribution des y t -.xi. Dans ces situations. de toute facon. En physique. la generalisation au cas de plusieurs parametres est relativement simple).. A I'aide du tableau 3. 4. Leur apparition signifie que le choix de la fonction etait mauvais.15.

. trouver la moyenne /j. Cette fonction s'appelle la fonction de vraisemblance. autrement dit. Bien evidemment. + dxi] Pour que cette probabilite soit maximale. inconnue d'une fonction de distribution gaussienne. il faut que la fonction ait un maximum. on peut trouver la valeur la plus vraisemblable 2 Pour avoir la meme ecriture qu'au debut du chapitre. pour une distribution binomiale (qui est une distribution discrete !). la variable aleatoire est representee par la lettre x. a) des variables 2 independantes X{. II est parfois plus commode de minimiser le logarithme de cette fonction que la fonction elle-meme. et la condition du maximum de vraisemblance prend naturellement la forme A partir de cette condition. dans ce cas simple. on ecrit la probabilite de trouver les valeurs de Xi dans les intervalles [#. on retrouve une expression connue de la moyenne. Mais cette methode est vraiment tres generale. Par exemple. on trouve la valeur du parametre a.. elle fournit une estimation. Supposons que la fonction de distribution est la meme pour tous les Xi (avec la meme variance inconnue cr2) : Le logarithme de la fonction de vraisemblance s'ecrit alors et sa derivee s'annule pour Le signe^sur p souligne que la methode du maximum de vraisemblance nous indique comment estimer ce parametre . On desire.132 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES En utilisant les fonctions de distribution /(# z .£. par exemple.

par exemple. Revenons a I'exemple d'une distribution gaussienne avec le logarithme de la fonction de vraisemblance et determinons I'estimation pour la variance. un evenement se produit x fois. nous avons volontairement omis une constante qui ne depend pas de p). donnons quelques remarques concernant les relations entre les deux methodes proposes d'ajustement des parametres.AJUSTEMENT DES PARAMETRES 133 de la probabilite inconnue p si. la methode des moindres carres peut etre consideree comme un cas particulier de la methode du maximum de vraisemblance : si Ton prend comme fonction de . La derivation de cette expression par rapport a u conduit a ('equation soit Comme nous I'avons deja vu plusieurs fois. En conclusion de ce paragraphe. la valeur la plus vraisemblable de p est Malheureusement. (85)). au cours de N experiences. Tout d'abord. s'ecrit et son maximum correspond au maximum du logarithme (dans cette expression. pour avoir une estimation correcte (non biaisee) il faut diviser la somme par TV — 1 et non pas par N (voir. d'apres (30). les estimations obtenues par cette methode peuvent etre biaisees. la methode du maximum de vraisemblance ne peut pas resoudre tous les problemes. En particulier. Autrement dit. La fonction de vraisemblance. Alors pour np = x.IV .

par exemple. Nous avons deja calcule le logarithme de la fonction de vraisemblance dans (141) de cette distribution. Pour N = 1. Enfm. Rappelons que la methode des moindres carres (par la valeur de x2 obtenue) peut nous dire si notre hypothese sur la forme de la fonction a ajuster est correcte ou non. on a et le logarithme de la fonction de vraisemblance donne (a une constante pres) la somme R (125) avec le signe moins. De plus. dans la methode du maximum de vraisemblance. Ainsi le maximum de vraisemblance correspond au minimum de la somme des carres. elle permet d'utiliser la puissance de la methode des rnoindres carres pour evaluer. 4.2 INEGALITE DE CRAMER-RAO-FRECHET Un aspect important de la methode du maximum de vraisemblance est le calcul des incertitudes sur les valeurs des parametres. ce type de critere n'existe pas. Cette correspondance n'est pas surprenante. la parabole correspondante est presentee sur la Figure 4. On obtient alors La representation de cette fonction de p est une parabole dont le maximum se trouve au point p = p.2. on doit se souvenir qu'elle n'est pas parfaite : les estimations qu'elle propose peuvent etre biaisees et il est plus difficile d'avoir un jugement sur la qualite de I'ajustement des parametres. par exemple. on reprend les . 3 Pour retrouver exactement les meme expressions que dans la methode de x 2 > notations yj pour les variables aleatoires et x^ pour 1'argument des fonctions. les incertitudes sur les valeurs des parametres (voir le paragraphe suivant).2. Au contraire. ou p est defmi par (142). On peut ajouter a cette expression une constante independante de p comme.134 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES distribution3 de y"p une gaussienne avec des "moyennes" y th (a. compte tenu de ('argumentation choisie pour developper la methode du maximum de vraisemblance.x z ) dependant de un (ou plusieurs) parametre(s). Commencons par la fonction de vraisemblance d'une distribution normale (140) et cherchons ('incertitude sur p. si la methode du maximum de vraisemblance soit plus souple que la methode des moindres carres.

Ce n'est pas une parabole mais elle lui ressemble quelque peu. on peut souvent approximer les fonctions de ce type par des paraboles au voisinage du maximum (ce qui signifie qu'on peut approcher la . On peut demontrer pour une classe assez large de distributions (pas forcement gaussiennes) qui ne dependent que d'un seul parametre.2 : Le logarithme de la fonction de vraisemblance d'une distribution gaussienne Cette courbe est a la base de ('analyse des fonctions de vraisemblance dependant d'un parametre. cette fonction est presentee sur la Figure 4.IV — AJUSTEMENT DES PARAMETRES 135 Figure 4. caracterise un intervalle de confiance correspondant a une probabilite de 68. D'une facon analogue. on a ajoute une constante pour que la valeur maximale de InL(p) soit egale a 0). Par exemple.45 %. Pour x = 2 et A" = 10. Le segment de droite reliant les deux branches de la parabole pour InL = — 1/2. on peut tracer le logarithme de la fonction de vraisemblance en fonction de p.27 %. D'ailleurs. pour une distribution gaussienne. le segment de droite reliant les deux branches de la parabole pour \nL = —2 correspond a un intervalle de confiance de 95. dans le cas d'une distribution binomiale abordee dans le paragraphe precedent.3 (dans cette expression. qu'il est possible de trouver les intervalles de confiance de la meme facon.

La position du maximum de cette fonction nous donne la valeur de I'estimation (143) : p= 0.2. Parexemple.2. la solution de I'equation donne [0.136 ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES fonction de distribution par une gaussienne). On remarque que cet intervalle n'est pas symetrique par rapport ap=0. Cette approche porte le nom d'inegalite de Cramer-Rao-Frechet.3 : Le logarithme de la fonction de vraisemblance pour une distribution binomiale avec x = 2 et N = 10 A partir de cette courbe. 0. surtout lorsque la fonction de vraisemblance depend de plusieurs parametres. c'est-a-dire que la valeur moyenne de a est egale a 4 4 Pour simplifier la presentation des formule.505]. Donnons sa demonstration dans le cas ou la vraisemblance L(a) ne depend que d'un seul parametre a. Soit a I'estimation du parametre a.036 . Cette estimation est biaisee par une erreur systernatique f3(a). nous utiliserons 1'ecriture / • • • dX qui signifie une integrate multiple sur toutes les variables xt. pour un intervalle de confiance de 95. nous pouvons facilement trouver tous les intervalles de confiance desires.45 %. . Figure 4. Elle est beaucoup plus pratique. mais le resultat peut etre generalise au cas de plusieurs parametres. Une autre approche existe pour determiner ("incertitude sur la valeur des parametres dans la methode du maximum de vraisemblance.

il suffit de remarquer que 1'integrale f ( X f ( x ) positive quelque soit la valeur de A. Cette condition nous donne I'inegalite recherchee. on obtient Cette relation peut encore s'ecrire sous la forme Calculons maintenant la derivee par rapport a a de la relation de normalisation de la vraisemblance que Ton peut mettre sous la forme En multipliant cette relation par a et en le soustrayant de (145). le discriminant doit etre negatif. Ainsi 1'equation + g(x))2dx est n'a pas de racines reelles non nulles. on obtient Si Ton applique I'inegalite de Schwartz 5 aux fonctions on trouve La premiere integrale represente la variance <r% du parametre a. pour laquelle on obtient fmalement I'inegalite recherchee : 5 Pour demontrer cette inegalite.IV . .AJUSTEMENT DBS PARAMETRES 137 En derivant cette relation par rapport a a et utilisant le fait que I'estimation a n'est fonction que des donnees experimentales {xi}. Done.

Ainsi I'inegalite (147) prend une autre forme equivalente Pour que cette inegalite devient une egalite. Supposons que soit mesure le module de la vitesse des molecule d'un gaz et que nous voulions determiner la temperature a partir des resultats de N mesures effectuees : i.3.138 ANALYSE STATISTIQUE DES DONNEES EXPERIMENTALES La valeur moyenne du carre de la derivee logarithmique de la vraisemblance peut etre mise sous la forme (pour obtenir cette relation. on obtient soit Comme exemple d'utilisation de la formule de Cramer-Rao-Frechet. . pour la variance. les fonctions / et g soient les memes a un facteur multiplicatif A pres. dans I'inegalite de Schwartz. il faut que. considerons la distribution de Maxwell deja etudiee dans le paragraphe 3. la vraisemblance doit avoir une forme gaussienne (a comparer avec 1'equation (144)) Notons que. c'est-a-dire que Autrement dit. il suffit de calculer la derivee de 1'equation (146) par rapport a a).. dans ce cas. N).1. . la derivee seconde du logarithme de la vraisemblance est une constante : Ainsi...? (i — 1.

est d'apres (27). egale a On obtient. ce qui signifie que sa valeur moyenne est egale a T : Pour demontrer ce resultat.AJUSTEMENT DBS PARAMETRES 139 La fonction de distribution f(v) du module de vitesse v s'ecrit done.IV . done. ainsi pour Le parametre T n'est pas biaise. calculons la valeur moyenne de T en utilisant la forme explicite de la distribution de Maxwell (151). on obtient Cette expression correspond a I'intrepretation physique bien connue de la temperature comme mesure de I'energie cinetique moyenne des molecules. La valeur moyenne du carre de la vitesse pour chaque molecule i. le logarithme de la vraisemblance prend (a une constante pres qui ne nous interesse pas) la forme L'estimation de la temperature T s'obtient en annulant la derivee par rapport a T de cette expression : Ainsi. On peut verifier aisement que cette estimation n'est pas biaisee (elle ne contient pas d'erreur systematique). De meme. on calcule la variance de ce parametre en utilisant la procedure appliquee pour obtenir la formule (84) : .

140 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES Pour obtenir ce resultat. nous avons utilise I'independance des variables Vi et le fait que. d'apres (27). D'apres la formule de Cramer-Rao-Frechet. dans le cas de la distribution de Maxwell. la variance de la temperature est donnee par On peut calculer facilement la denominateur de cette expression : Ainsi. . On voit que I'estimation de la temperature defmie par (152) est une estimation non biaisee et efficace. I'inegalite devient I'egalite. IMous laissons au lecteur le soin de retrouver la valeur de A correspondante ainsi que le coefficient de normalisation. On peut aisement verifier que la condition (149) est satisfaite et que la vraisemblance peut encore s'ecrire sous la forme (150).

En fait. notamment dans les pays anglo-saxons.CONCLUSION En conclusion. L'approche statistique est une approche extremement puissante et informative. la distribution de probabilite n'est pas gaussienne). de 1'erreur experimentale. En utilisant ce langage probabiliste. On comprend ainsi qu'il est toujours necessaire d'avoir une estimation. par exemple. . Finalement. mais souvent tres specialisee ou dispersee. nous apportons une information plus riche et surtout plus coherente. mais les problemes les plus courants ont ete traites dans cet ouvrage volontairement synthetique. Quelques ouvrages de reference sont donnes dans la bibliographic pour permettre d'approfondir certaines questions ou pour trouver d'autres exemples d'application. il faut souligner que rien ne peut remplacer le bon sens de 1'experimentateur. Sans connaitre 1'incertitude il est impossible de savoir si Ton peut avoir confiance en une valeur mesuree : avons-nous obtenu seulement un ordre de grandeur ou avons-nous reussi a avoir plusieurs chiffres significatifs ? C'est 1'incertitude qui donne 1'information sur la fiabilite des resultats et sur leur qualite. C'est tres important dans les applications car il doit y avoir adequation entre la methode choisie pour obtenir la valeur moyenne avec son erreur et la precision recherchee : il ne faut pas utiliser des methodes lourdes et complexes si 1'on cherche une precision de 10%. ni dans le choix de la methode d'analyse ni dans 1'appreciation des resultats. II existe. certes. L'incertitude est evaluee avec sa propre precision. la determination de 1'incertitude n'est pas plus difficile que la determination de la valeur elle-meme. Nous esperons que les differents aspects qui ont ete abordes contribueront a demystifier un domaine qui rebute souvent les experimentateurs. nous ne pouvons plus repondre facilement a la question par laquelle nous avons commence cet ouvrage : "Quelle est la valeur de telle grandeur ?" Mais en donnant comme reponse la valeur et son erreur (et les autres parametres si. mais elle a ses limites : elle doit etre appliquee avec beaucoup de precautions aux erreurs systematiques qui mettent en jeu des parametres plus difficiles a analyser. on retiendra les points suivants. meme grossiere. Le probleme de la determination de la valeur d'une grandeur physique est inseparable de celle de son incertitude car toutes deux font partie d'une description unique en termes de probabilites. une litterature abondante sur ce domaine.

.Cette page est laissée intentionnellement en blanc.

"Statistical Data Analysis". "Guidelines for Evaluating and Expressing the Uncertainty ofNIST Measurement Results". Cambridge University Press. Barlow. G. Lyons.J. Technique et Documentation. Oxford. Paris. M. G.J. Paris. Brisbane. "Theorie et applications de la statistique". . ISO. Londres. Dunod. Londres. Toronto. 1964.nist. "Statistics for nuclear and particle physicists".ch/iso/fr/prods-services/otherpubs/Metrology. Paris.html). Cowan. Squires. 1987. New York. McGraw-Hill. "Guide pour .E. CERN 64-18.iso.L. Hudson. 1968. Londres. Nathan. Taylor. 1994 (http://physics. UIPPA. 1987. Neuilly et CETAMA. Spiegel. M. OIML.BlBLIOGRAPHIE R. Van der Waerden. "Modelisation et estimation des erreurs de mesure". 1989. CEI. Hudson. B. Belorizky. Chichester. FICC. Jonh Wiley fe Sons.L. L.gov/cuu/Uncertainty/bibliography. L. "A Guide to the Use of Statistical Methods in the Physical Sciences". D. "Statistique mathematique". NIST Technical Note 1297. 1967. E. "Practical Physics".J. "A practical guide to Data Analysis for Physical Sciences Students". "Lectures on Elementary Statistics and Probability". New York. Cambridge University Press. ISBN 92-67-20188-3. "Statistics Lectures II: Maximum Likelihood and Least Squares Theory". Lavoisier. 1998. 1998. 1986. 1963 . 1995 (http://www. 1991 . Oxford.html) . B. BIPM. UICPA. Londres.R. Ch./'expression de 1'incertitude de mesure". Mc-Graw-Hill. CERN 63-29. Kuyatt. "Probabilites et statistiques dans les sciences experiment ales". Clarendon Press. Lyons. Singapore.N. D.

Cette page est laissée intentionnellement en blanc.

INDEX
"Addition" de deux mesures Ajustement des parametres Chiffres significatifs Coefficient de correlation Coefficient de Student Comparaison de deux resultats Correlations Covariance (voir aussi matrice de covariance) Degre de liberte Distribution binomiale Distribution constante Distribution gamma Distribution de Gauss (normale) Distribution de Lorentz (de Cauchy) Distribution de Maxwell Distribution de Poisson Distribution de Student Distribution x2 Ecart quadratique moyen Ecart-type Echantillon Erreur Erreur systematique Estimation 99 119 78 24, 127 91, 97 96 23, 57, 125 29 91, 97, 127, 130 31,49 18, 66 40, 89 25, 42, 89 37, 45, 89 25, 84, 139 34, 49, 89 87, 89, 90 82, 89, 127, 130 77 18 76 8 9, 101, 105, 116 119

146

ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES

Estimation biaisee Estimation efficace Fonction de distribution Fonction de distribution de plusieurs variables Fonction generatrice des moments Fonction generatrice des moments centraux Incertitude d'appareil Incertitude naturelle Incertitude statistique Intervalle de confiance Matrice de covariance Methode de moindres carres (% ) Methode de maximum de vraisemblance Moments Moments centraux Moyenne Moyenne experimentale Niveau de confiance Probabilite Propagation des erreurs Precision de la variance experimentale Theoreme central limite Variable (grandeur) continue Variable (grandeur) discrete Variables independantes Variance Variance experimentale Vraisemblance
2

120, 140 120, 140 16, 17 20 19 20 9, 102 8, 101 9, 116 72, 91 57, 125 122 131 19 19 17 76 72, 91 11 51, 53 78 42 14, 16, 17 14, 16, 17 13, 21, 23 18 77 132

1.1. Propagation des erreurs 2.3.2. Cas general 2.2.3.3. Correlations 1.1.5. Probabilites 1. Cas des variables correlees 2.3.4. Formule de propagation des erreurs 2. Distribution de Lorentz 1. Distribution de probabilite d'une fonction de variable aleatoire 2. Auitres distributions elementaires 1.3. Fonctions d'une variable aleatoire 2. Fonction biunivoque 2. Distribution binomiale 1.2.1.4. fonction de distribution 1. Distribution gamma 1.1.1.4. Proprietes de la fonction de distribution 1.1. Rappels sur la theorie des probabilites 1.3.TABLE DES MATIERES Preface 5 Pourquoi les incertitudes existent-elles ? Chapitre 1.3. Theoreme central limite Chapitre 2. Exemple physique 7 11 11 11 13 17 20 23 25 30 31 34 37 40 42 51 51 51 53 57 61 61 62 64 .2.1. Distribution de Gauss 1.2.1.1.1.1. Distribution de Poisson 1.3. Grandeurs discretes et continues. Definitions et proprietes 1.2.2.1. Exemples de propagation des erreurs 2.2. Fonction de distribution de plusieurs variables 1.1.3.2.

2.2.1. valeur moyenne et ecart-type 3. Comparaison de deux resultats experimentaux 3.4.1. Incertitudes d'appareil 3.1. Niveau de confiance et intervalle de confiance 67 71 75 75 76 82 87 90 96 96 99 101 102 105 109 115 119 122 122 128 131 131 134 141 143 145 147 Chapitre 3.4.148 ANALYSE STATISTIQUE DBS DONNEES EXPERIMENTALES 2. Idee de la methode du maximum de vraisemblance 4. " Addition " de deux resultats experimentaux 3. Idee de la methode des moindres carres 4. Erreurs systematiques 3. Methode du maximum de vraisemblance 4.2.2.1.3.2. Methode des moindres carres 4.2.1.3. Autres sources d'erreurs 3.3.1.4. 78 .3. Comment eviter les erreurs systematiques ? 3. Ajustement des parametres 4. Precision de la variance experimentale et chifFres significatifs .1. Deux resultats experimentaux 3. Distribution x2 3. Petit nombre de mesures 3.1.2.. Definitions et proprietes 3.4.2.4.1.3. Distribution de Student 3.1.1.4. Precision de la formule de propagation des erreurs 2. Echantillon.2. Exemple d'une fonction lineaire 4.2.1. Inegalite de Cramer-Rao Conclusion Bibliographie Index Table des matieres 3.2.3.1. Experiences avec un nombre limite de mesures 3.3. Comment travailler avec les erreurs systematiques ? Chapitre 4.

You're Reading a Free Preview

Télécharger
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->