Vous êtes sur la page 1sur 46
POURQUOI LA LOI NORMALE ? " Séance 1: POURQUOI LA LOI DE LAPLACE-GAUSS EST-ELLE NORMALE ? “ S S gz 3g = 2 g 2 2 ZEHN DEUTSCHE MARK A propos de la loi normale : "Tout le monde y croit cependant, me disait un jour Monsieur Lippmann, car les expérimentateurs Slimaginent qu'il s'agit d'un théoréme de mathématiques et les ‘mathématiciens que c'est un fait expérimental."" Boutade rapportée par Henri Poincaré — 1912. La loi de Laplace~Gauss joue un rdle central en statistique (on la désigne souvent comme la "reine des statistiques"). Ii s‘agit ici de voir pourquoi, et comment on peut le faire comprendre aux étudiants de B.T.S La statistique inférentielle dans les programmes de B.TS. est axée sur cette loi (sauf pour ce qui concerne la fiabilité). Bien sir ce n'est pas la seule loi utile en statistique, mais on ne peut pas, dans un horaire limité, trop embrasser, et les méthodes statistiques d'estimation ou de tests basées sur d'autres lois reposent sur des principes analogues a celles fondées sur la loi normale et faisant partie du programme. Ce sont ces méthodes quiil sagit de bien faire comprendre & propos du modéle “normal”, en se laissant la possibilité d'envisager d'autres modéles, pour répondre aux sollicitations des matiéres techniques ou des études rencontrées par les étudiants en stage. R IREM PARIS-NORD ~ STATISTIQUE INFERENTIELLE EN B.T.S. Extraits du programme de BTS 2001 : A propos des variables aléatoires continues : "Liexemple de Ia loi normale est suffisant. On pourra, en vue de Uétude de la fiabilité, présenter la loi exponentielle." A propos de la statistique inférentielle : "Sous Vimpulsion notamment du mouvement de la qualité, les méthodes statistiques sont aujourd'hui largement utilisées dans les miliewx économique, social ou professionnel." "1. Vobjectif essentiel est d'initier les étudiants, sur quelques cas simples, au raisonnement et méthodes statistiques et & l'interprétation des résultats obtenus." "ll s‘agit de faire percevoir, a partir d'exemples figurant au programme, ce que sont les procédures de décision en milieu aléatoire, ainsi que leur pertinence." ... dans le cadre de [la liaison avec les enseignements d'autres disciplines} on pourra donner quelques exemples d'autres procédures que celles figurant au programme de mathématiques (par exemple l'utilisation du test du khi 2, de la loi de Student) (...] mais aucune connaissance & leur sujet n'est exigible dans le cadre de ce programme." Avant d'étudier le role de la loi normale, se pose le probléme pédagogique (délicat) de introduction des variables aléatoires continues : passage du discret au continu, notion de densité de probabilité, approximations et correction de continuité. A-INTRODUIRE LES VARIABLES ALEATOIRES CONTINUES II sagit dintroduire la notion de fonction de densité, en montrant que, dans ce cadre, les calculs, liés a la notion dire, sont des calculs d'intégrales, On fera en particulier remarquer que l'aire totale entre l'axe des abscisses et la courbe vaut I, que la probabilité d'une valeur ponctuelle est nulle... © On pourra commencer par une étude de la Joi uniforme sur (0, 1], oft les calculs sont simples et peuvent étre reliés & une étude statistique du "random" de la calculatrice. © Voir le T.D. "éléve" en annexe, Soit Y une variable aléatoire de loi @% [0 , 1]. Si son espérance fixar=4 tombe sous le 2 sens, il n'en est pas de méme pour son écart type o(X) = fo-pee = Ee ~0,29 On peut valider ce calcul barbare, par une expérimentation statistique de la fonction random de la calculatrice ou la fonction ALEA d'Excel. [ Le programme incite au recours 4 la simulation : "La réalisation de simulations dans le cadre du modéle probabiliste de référence peut fournir un éclairage intéressant."” l POURQUOI LA LOI NORMALE ? 13 La moyenne affichée ¥ et I'écart type calculé s_ sont obtenus sur un échantillon de taille 1 = 100 extrait aléatoirement d'une Population répartie selon la loi @% [0, 1] de moyenne 1 = 5 et décart type o ~ 0,29. On observe des fluctuations entre les différents échan- WU (0, 1] H=05 c~029 | n= 100 tillons choisis. Savoir si n = 100 est suffisant pour des observations correctes, demande de connaitre les lois de ces fluctuations (données par la "loi des grands nombres" et le "théoréme limite central"), ce que l'on abordera en fin de séance. ® On peut ensuite se placer sur le terrain de l'analyse, pour rechercher des fonctions de densités de variables aleatoires. © Voir le TD. "éleve" en annexe. © Voir les exercices corrigés d'épreuves de B.T-S. (exercices d'analyse). B~- LE ROLE DE LA LOI NORMALE “Linvention", au début du XIX* siécle, de la loi "normale", dont usage est fondamental en statistique, s'est faite par deux voies : ~ celle, dans le cadre de la "théorie des erreurs", de la méthode des moindres carrés, Qui aboutit avec Carl Friedrich Gauss (1777-1855), * et celle des théorémes limites, avec l'énoneé d'une premiére version du théoréme limite central par Pierre Simon Laplace (1749-1827), |-LA LOI DES ERREURS * La moyenne est la meilleure "estimation" du point de vue de la géométrie cuclidienne : Adrien-Marie Legendre (1752-1833) publie en 1805, dans ses "Nouvelles méthodes pour la détermination des orbites des cométes”, la méthode consistant minimiser la somme des carrés des écarts. Cette méthode correspond & Yajustement optimal pour a structure géométrique euclidienne. Soit une quantité 9 inconnue, pour laquelle on posséde plusieurs mesures différentes xy .X2, w., X» (il y a toujours des erreurs aléatoires iméductibles, il ne s'agit pas des erreurs "systématiques" que l'on sait détecter et évaluer). On cherche a “résumer" au plus proche le vecteur ja, Xr) par une valeur unique @ c'est a dire par le vecteur (@,..., 0). Pour la distance euclidienne, on a : BP((8, 8.0.9) (Sp Xun) = De-x).