Vous êtes sur la page 1sur 5

La loi normale (ou loi de Laplace-Gauss ou loi de Gauss) 1 Les fondamentaux La distribution normale est une distribution thorique,

, en ce sens qu'elle est une idalisation mathmatique qui ne se rencontre jamais exactement dans la nature. Mais de nombreu ses distributions rellement observes sen rapprochent et ont cette fameuse forme de cloche (beaucoup dindividus autour de la moyenne, de moins en moins au fur mesure quon sen loigne, et ceci de faon symtrique). D'autre part, elle est trs utilise en statistiques infrentielles : nous verrons en particulier quune moyenne calcule sur un chantillon est une v.a. qui tend suivre une loi normale qua nd la taille de lchantillon augmente, mme si la population initiale a une tout autre distribution. a Sa forme : la courbe en cloche La loi normale de paramtres m et s, note N(m,s), est dfinie sur R par la densit : 2 2 1 2 1 ( )

= s s p x m f x e dont la reprsentation graphique est la suivante : Notons que : - la droite x= m est axe de symtrie - les points dinflexion sont situs une distance s de cet axe de symtrie b Le thorme Central-limit Le TCL sera trs prcieux puisquil nous explique que si on fait la somme dun trs grand nombre de variables alatoires de loi quelconque, cette somme suit approximativement une loi normale (en fait, sans rentrer dans le dtail des hypothses, il nous dit que la variable X = X1 + X2+ Xn tend suivre une loi normale quand n tend vers linfini). Dune part, cela nous permet de comprendre pourquoi autant de distributions observe s dans la ralit ont approximativement cette forme de cloche : elles dcrivent des phnomnes qui rs ultent de laddition dun grand nombre de causes de fluctuation indpendantes. Exemple : la t aille dun individu. Dautre part, cela nous permettra dapprocher beaucoup de lois par une loi normale, pour peu que la variable tudie sexprime comme une somme dun grand nombre de variables indpendantes. Cest le cas notamment de la variable binomiale (somme de n variables de Bernoulli indpendantes), dont la loi tend prendre la forme dune cloche quand n augmente. Cela reste possible mme quand on ne connat pas loi des variables Xi. 2 Esprance et variance Soit X une v.a. qui suit la loi N(m,s). Par raison de symtrie: E(X) = m et on mon tre facilement que

V(X) = s2 , donc le paramtre s correspond lcart type (do les notations) Ainsi grce ses 2 paramtres, la loi normale permet de dcrire des distributions de mo yenne quelconque (on translate la courbe vers la gauche ou vers la droite), et de disp ersion quelconque (on rapproche ou on carte le point dinflexion) 3 Calculs de probabilits sur une loi normale a Un gros inconvnient : on ne sait pas exprimer F(x) en fonctions de x On ne connat pas de primitive de la fonction 2 x e , donc on ne sait pas donner lexpression algbrique de la fonction de rpartition F(x). b La loi normale centre-rduite Centrer et rduire une variable, cest raisonner en nombre dcarts types par rapport la moyenne. Par ex., si le poids dun foie gras est une variable de moyenne 550 g et dcart type 100 g, on dira dun foie de canard de x=650 g que, en donne centre-rduite, il pse t=1 (sous-entendu : 1 carttype de plus que la moyenne), alors que le poids centr-rduit dun foie de x=500g sera de t= -0,5 (un demi-cart-type en dessous de le moyenne). Tous les vnements relatifs X peuvent tre aussi bien exprims en fonction de T . Ainsi , il est quivalent de dire : le poids dun foie est compris entre 500g et 650g : (500 < X < 660) ou le poids centr-rduit est compris entre -0,5 et 1 : ( -0,5 < T < 1) avec T gal ici : 100 X 550 , et plus gnralement : s X m T = Comment dans ces conditions calculer les probabilits de tomber entre telle ou telle valeur? Par des techniques de calcul numrique (en mesurant laire sous la courbe pour diffrentes valeurs de x), on a pu constituer des tables donnant F(x). Ces tables figurent en annexe de la plupart des manuels de probabilits, et sont intgres dans certains logiciels (fonctions dExcel par exemple). Pour tous les calculs, on se ramne la fonction de rpartition de la loi N(0,1), dite loi normale centrerduite. La variable centre-rduite T a pour esprance 0 et pour cart-type 1 car : E(T)= E( s X m ) = (E(X ) m) s 1 = 0 puisque E(X)=m V(T) = V( s X m ) = (V(X)) 2 1

s = 1 puisque V(X)=s 2 Donc la densit de probabilit de la loi normale centre-rduite N(0,1) scrit : 2 2 1 2 1 t y( t ) e = p Plutt que f et F, on note gnralement y la densit, et P la fonction de rpartition de l a loi N(0,1). La table donnant, pour diffrentes valeurs de t, les valeurs de P(t), soit P(Tt) es t jointe en annexe. On y lit par exemple : P(0) = 0,5 P(1) = 0,8413 P(0,5) = 0,6915 P(1,96) = 0,9750 dont on dduit par symtrie : P(-1) = 1- P(1) = 1 - 0,8413 = 0,1587 P(-0,5) = 1 - P(0,5) = 1 - 0,6915 = 0,3085 P(-1,96) = 1 - P(1,96) = 1- 0,9750= 0,0250 c Exemples de calcul sur une loi normale La v.a. X, poids dun foie gras, suit une loi N(550 ;100). Quelle est la probabili t pour quun foie gras pse moins de 650g, plus de 746g, moins de 500g, entre 550 et 600g ? P(X<650) = P(T< 100 650 550 ) = P(T<1) = P(1) = 84,13% P(X>746) = P(T> 100 746 550 ) = P(T>1,96) = 1- P(T1,96) = 1 - P(1,96) = 1- 0,9750= 2,5% P(X<500) = P(T< 100 500 550 ) = P(T<-0,5) = P(-0,5) = 1 - P(0,5) = 1 - 0,6915 = 30,85% P(550<X<600) = P(0<T<0,5) = P(0,5) -P(0) = 0,8413 0,5= 34,13% Rappelons que pour une variable continue, il ny a pas de diffrence entre P(X<k) et P(Xk) car la probabilit attache la valeur k est nulle. d- Quelques ordres de grandeur utiles retenir 3 Stabilit de la loi normale Une combinaison linaire de variables normales indpendantes est elle-mme une variabl e normale. Ainsi si X1 N(m1,s1) et X2 N(m2,s2) , X1 et X2 tant indpendantes si a1 et a2 sont 2 rels alors : X = a1 X1+ a2 X2 suit galement une loi normale (dont les paramtres peuvent tre calculs en utilisant les proprits de lesprance et de la variance). Par exemple, S = X1+ X2 est une variable normale de paramtres : E(S) = E(X1+ X2) = E(X1)+ E(X2) = m1+ m2 V(S) = V(X1+ X2) = V(X1)+ V(X2) car les variables sont indpendantes = s 1 2+ s 2 2

donc sS= 2 2 2 s 1 +s et finalement : S N(m1+ m2, 2 2 2 s 1 +s ) 4 Approximation de la loi binomiale et de la loi de Poisson par la loi normale Nous avons vu que la loi binomiale B(n,p) est dautant plus symtrique que p est pro che de 50% et quelle prend une forme en cloche quand n augmente (dautant plus vite que p est pro che que 0,5) Le TCL donne une justification ce phnomne. Une valeur de p trs diffrente de 0,5 (p petit ou alors q=1-p petit) pourra tre comp ense par une grande valeur de n et on accepte gnralement de remplacer la loi binomiale par la l oi normale Une variable normale a 95 chances sur 100 dtre situe entre : moyenne moins 2 carts-types et moyenne plus 2 cartstypes (la vraie valeur nest pas 2 mais 1,96) Une variable normale est presque certainement situe entre : moyenne moins 3 carts-types et moyenne plus 3 carts-types lorsque les produits np et nq sont suprieurs 15 ou 20. Dans ce cas, on approchera la loi B(n,p) par la loi normale de mme esprance et de mme cart-type, soit N(np, npq ) De mme on pourra remplacer la loi de Poisson P(m) par une loi normale N(m, m ) ds que m est suprieur 15 ou 20. Exemple : on estime que la probabilit pour quune graine ait perdu son pouvoir germ inatif aprs 3 ans de conservation est de 70%. Sur un chantillon de 100 graines conserves depuis 3 ans quelle est la probabilit pour que moins de 25 germent ? Notons p la probabilit quune graine germe :p= 0,3 et considrons que lchantillon est i ndpendant. Notons X la v.a. nombre de graines qui germent parmi les 100 . X suit la loi B(100 ; 0,3) et on cherche : P(X<25) qui peut scrire aussi P(X24) = p 0 + p1 + .+p24 avec pk= k k , , k

100 0 3 0 7 100 Le calcul exact est trop fastidieux pour tre fait la main. On peut alors : - soit utiliser un logiciel, par exemple la fonction dExcel=LOI.BINOMIALE(24;100; 0,3;1) qui donne P(X24) = 0,114 - soit calculer une valeur approche en remplaant cette loi binmiale par une loi nor male. Cest possible car les produits np et nq sont assez grands ( resp. 30 et 70). Les paramtres de cette loi seront : o m = np = 30

o s = npq = 100 *0,3 *0,7 = 4,5826 La variable alatoire discrte X B(100 ;0,3) sera alors remplace par la variable cont inue : Xc N(30 ; 4,5826) Un problme se pose alors : faut-il calculer P(Xc<25) ou P(Xc24) ? Pour une variabl e continue, ces valeurs ne sont pas identiques La meilleure approximation sera obtenue en prenant la valeur intermdiaire 24,5. Cest ce quon appelle la correction de continuit . Voir la justific ation page suivante. P(X<25) = P(X24) @ P(Xc24,5) = P 4 5826 24 5 30 , , = P(-1,20)= 1 - P(1,20)= 1-0,885 = 0,115 On peut constater que ceci fournit une excellente approximation de la vraie vale ur puisque lerreur est de lordre du millime. Bibliographie : http://neumann.hec.ca/~p240/c162096/documents/NotesLoiNormale1x1.pdf http://www.astro.ulg.ac.be/cours/magain/stat/stat52.html http://www.astro.ulg.ac.be/cours/magain/stat/stat51.html http://www.up.univ-mrs.fr/veronis/cours/INFZ16/index.html?http://www.up.univ-mrs .fr/veronis/cours/INFZ16/ch6.html Annexes Correction de continuit En jaune: la valeur exacte que lon veut calculer. En effet P(X24) = p0 + p1 + .+p24 , ce qui correspond la somme des hauteurs de btons rouges du diagramme en bton de la loi bi nmiale. Cette somme est gale la surface des rectangles jaunes puisque ces rectangles ont pour hauteur les pi et pour base 1. En bleu : ce quon calcule en prenant P(Xc24,5), qui correspond la surface sous la courbe de densit gauche du point 24,5. On voit bien que lapproximation serait moins bonne en sarrtant 24 ou en allant jusqu 25. On pratique la correction de continuit chaque fois quon approche une loi discrte pa r une loi continue (en fait chaque fois quon hsite entre 2 valeurs comme entre 24 et 25 ici

Vous aimerez peut-être aussi