Vous êtes sur la page 1sur 7

Cours de probabilits statistiques infrentielles

M. Raffestin

La loi normale (ou loi de Laplace-Gauss ou loi de Gauss)

1 Les fondamentaux La distribution normale est une distribution mathmatique qui ne se rencontre jamais distributions rellement observes sen cloche (beaucoup dindividus autour de la sen loigne, et ceci de faon symtrique). thorique, en ce sens qu'elle est une idalisation exactement dans la nature. Mais de nombreuses rapprochent et ont cette fameuse forme de moyenne, de moins en moins au fur mesure quon

D'autre part, elle est trs utilise en statistiques infrentielles : nous verrons en particulier quune moyenne calcule sur un chantillon est une v.a. qui tend suivre une loi normale quand la taille de lchantillon augmente, mme si la population initiale a une tout autre distribution. a Sa forme : la courbe en cloche La loi normale de paramtres m et , note N(m,), est dfinie sur R par la densit :

f ( x) =

1 2

1 x m e 2

dont la reprsentation graphique est la suivante :

Notons que :

- la droite x= m est axe de symtrie - les points dinflexion sont situs une distance de cet axe de symtrie

b Le thorme Central-limit Le TCL sera trs prcieux puisquil nous explique que si on fait la somme dun trs grand nombre de variables alatoires de loi quelconque, cette somme suit approximativement une loi normale (en fait, sans rentrer dans le dtail des hypothses, il nous dit que la variable X = X1 + X2+ Xn tend suivre une loi normale quand n tend vers linfini). Dune part, cela nous permet de comprendre pourquoi autant de distributions observes dans la ralit ont approximativement cette forme de cloche : elles dcrivent des phnomnes qui rsultent de laddition dun grand nombre de causes de fluctuation indpendantes. Exemple : la taille dun individu.

Dautre part, cela nous permettra dapprocher beaucoup de lois par une loi normale, pour peu que la variable tudie sexprime comme une somme dun grand nombre de variables indpendantes. Cest le cas notamment de la variable binomiale (somme de n variables de Bernoulli indpendantes), dont la loi tend prendre la forme dune cloche quand n augmente. Cela reste possible mme quand on ne connat pas loi des variables Xi. 2 Esprance et variance Soit X une v.a. qui suit la loi N(m,). Par raison de symtrie: E(X) = m et on montre facilement que 2 V(X) = , donc le paramtre correspond lcart-type (do les notations) Ainsi grce ses 2 paramtres, la loi normale permet de dcrire des distributions de moyenne quelconque (on translate la courbe vers la gauche ou vers la droite), et de dispersion quelconque (on rapproche ou on carte le point dinflexion)

3 Calculs de probabilits sur une loi normale a Un gros inconvnient : on ne sait pas exprimer F(x) en fonctions de x On ne connat pas de primitive de la fonction algbrique de la fonction de rpartition F(x).

e x , donc on ne sait pas donner lexpression

Comment dans ces conditions calculer les probabilits de tomber entre telle ou telle valeur? Par des techniques de calcul numrique (en mesurant laire sous la courbe pour diffrentes valeurs de x), on a pu constituer des tables donnant F(x). Ces tables figurent en annexe de la plupart des manuels de probabilits, et sont intgres dans certains logiciels (fonctions dExcel par exemple). Pour tous les calculs, on se ramne la fonction de rpartition de la loi N(0,1), dite loi normale centrerduite.

b La loi normale centre-rduite Centrer et rduire une variable, cest raisonner en nombre dcarts-types par rapport la moyenne. Par ex., si le poids dun foie gras est une variable de moyenne 550 g et dcart-type 100 g, on dira dun foie de canard de x=650 g que, en donne centre-rduite, il pse t=1 (sous-entendu : 1 carttype de plus que la moyenne), alors que le poids centr-rduit dun foie de x=500g sera de t= -0,5 (un demi-cart-type en dessous de le moyenne). Tous les vnements relatifs X peuvent tre aussi bien exprims en fonction de T . Ainsi, il est quivalent de dire : le poids dun foie est compris entre 500g et 650g : (500 < X < 660) ou le poids centr-rduit est compris entre -0,5 et 1 : ( -0,5 < T < 1) avec T gal ici :

X 550 , et plus gnralement : 100

T =

X m

La variable centre-rduite T a pour esprance 0 et pour cart-type 1 car : E(T)= E( X m )= 1

(E( X ) m ) = 0
1

puisque

E(X)=m

V(T)

= V(

X m

)=

(V (X )) = 1

puisque

V(X)=

Donc la densit de probabilit de la loi normale centre-rduite N(0,1) scrit :

y( t ) =

1 2

1 t2 e 2

Plutt que f et F, on note gnralement y la densit, et la fonction de rpartition de la loi N(0,1). La table donnant, pour diffrentes valeurs de t, les valeurs de (t), soit P(Tt) est jointe en annexe. On y lit par exemple :

(0) = 0,5 (1) = 0,8413 (0,5) = 0,6915 (1,96) = 0,9750


dont on dduit par symtrie :

(-1) = 1- (1) = 1 - 0,8413 = 0,1587 (-0,5) = 1 - (0,5) = 1 - 0,6915 = 0,3085 (-1,96) = 1 - (1,96) = 1- 0,9750= 0,0250

c Exemples de calcul sur une loi normale

La v.a. X, poids dun foie gras, suit une loi N(550 ;100). Quelle est la probabilit pour quun foie gras pse moins de 650g, plus de 746g, moins de 500g, entre 550 et 600g ? P(X<650) = P(T<

650 550 ) = P(T<1) = (1) = 84,13% 100 746 550 P(X>746) = P(T> ) = P(T>1,96) = 1- P(T1,96) = 1 - (1,96) = 1- 0,9750= 2,5% 100 500 550 P(X<500) = P(T< ) = P(T<-0,5) = (-0,5) = 1 - (0,5) = 1 - 0,6915 = 30,85% 100 P(550<X<600) = P(0<T<0,5) = (0,5) -(0) = 0,8413 0,5= 34,13%

Rappelons que pour une variable continue, il ny a pas de diffrence entre P(X<k) et P(Xk) car la probabilit attache la valeur k est nulle.

d- Quelques ordres de grandeur utiles retenir

Une variable normale a 95 chances sur 100 dtre situe entre : moyenne moins 2 carts-types et moyenne plus 2 cartstypes (la vraie valeur nest pas 2 mais 1,96)

Une variable normale est presque certainement situe entre : moyenne moins 3 carts-types et moyenne plus 3 carts-types

3 Stabilit de la loi normale

Une combinaison linaire de variables normales indpendantes est elle-mme une variable normale. Ainsi si X1 N(m1,1) et X2 si a1 et a2 sont 2 rels N(m2,2) , X1 et X2 tant indpendantes

alors : X = a1 X1+ a2 X2 suit galement une loi normale (dont les paramtres peuvent tre calculs en utilisant les proprits de lesprance et de la variance). Par exemple, S = X1+ X2 est une variable normale de paramtres : E(S) = E(X1+ X2) = E(X1)+ E(X2) = m1+ m2 V(S) = V(X1+ X2) = V(X1)+ V(X2) car les variables sont indpendantes 2 2 = 1 + 2 donc S= 12 + 2 2 et finalement : S N(m1+ m2,

12 + 2 2 )

4 Approximation de la loi binomiale et de la loi de Poisson par la loi normale

Nous avons vu que la loi binomiale B(n,p) est dautant plus symtrique que p est proche de 50% et quelle prend une forme en cloche quand n augmente (dautant plus vite que p est proche que 0,5) Le TCL donne une justification ce phnomne. Une valeur de p trs diffrente de 0,5 (p petit ou alors q=1-p petit) pourra tre compense par une grande valeur de n et on accepte gnralement de remplacer la loi binomiale par la loi normale

lorsque les produits np et nq sont suprieurs 15 ou 20. Dans ce cas, on approchera la loi B(n,p) par la loi normale de mme esprance et de mme cart-type, soit N(np, npq ) De mme on pourra remplacer la loi de Poisson P(m) par une loi normale N(m, m ) ds que m est suprieur 15 ou 20.
Exemple : on estime que la probabilit pour quune graine ait perdu son pouvoir germinatif aprs 3 ans de conservation est de 70%. Sur un chantillon de 100 graines conserves depuis 3 ans quelle est la probabilit pour que moins de 25 germent ?

Notons p la probabilit quune graine germe :p= 0,3 et considrons que lchantillon est indpendant. Notons X la v.a. nombre de graines qui germent parmi les 100 . X suit la loi B(100 ; 0,3) et on cherche : P(X<25) qui peut scrire aussi P(X24) = p0 + p1 + .+p24 100 k 100 k avec pk= k 0,3 0,7 Le calcul exact est trop fastidieux pour tre fait la main. On peut alors : - soit utiliser un logiciel, par exemple la fonction dExcel=LOI.BINOMIALE(24;100;0,3;1) qui donne P(X24) = 0,114 - soit calculer une valeur approche en remplaant cette loi binmiale par une loi normale. Cest possible car les produits np et nq sont assez grands ( resp. 30 et 70). Les paramtres de cette loi seront : o m = np = 30
o

npq =

100 0,3 0,7 = 4,5826 B(100 ;0,3) sera alors remplace par la variable continue :

La variable alatoire discrte X Xc

N(30 ; 4,5826)

Un problme se pose alors : faut-il calculer P(Xc<25) ou P(Xc24) ? Pour une variable continue, ces valeurs ne sont pas identiques La meilleure approximation sera obtenue en prenant la valeur intermdiaire 24,5. Cest ce quon appelle la correction de continuit . Voir la justification page suivante. 24,5 30 = (-1,20)= 1 - (1,20)= 1-0,885 = 0,115 4,5826 On peut constater que ceci fournit une excellente approximation de la vraie valeur puisque lerreur est de lordre du millime. P(X<25) = P(X24)

P(Xc24,5) =

Bibliographie :
http://neumann.hec.ca/~p240/c162096/documents/NotesLoiNormale1x1.pdf http://www.astro.ulg.ac.be/cours/magain/stat/stat52.html http://www.astro.ulg.ac.be/cours/magain/stat/stat51.html http://www.up.univ-mrs.fr/veronis/cours/INFZ16/index.html?http://www.up.univ-mrs.fr/veronis/cours/INFZ16/ch6.html

Annexes

Correction de continuit

En jaune: la valeur exacte que lon veut calculer. En effet P(X24) = p0 + p1 + .+p24 , ce qui correspond la somme des hauteurs de btons rouges du diagramme en bton de la loi binmiale. Cette somme est gale la surface des rectangles jaunes puisque ces rectangles ont pour hauteur les pi et pour base 1. En bleu : ce quon calcule en prenant P(Xc24,5), qui correspond la surface sous la courbe de densit gauche du point 24,5. On voit bien que lapproximation serait moins bonne en sarrtant 24 ou en allant jusqu 25. On pratique la correction de continuit chaque fois quon approche une loi discrte par une loi continue (en fait chaque fois quon hsite entre 2 valeurs comme entre 24 et 25 ici)

Vous aimerez peut-être aussi