Vous êtes sur la page 1sur 7

Cours de probabilits statistiques infrentielles

M. Raffestin

La loi normale (ou loi de Laplace-Gauss ou loi de Gauss)

1 Les fondamentaux
La distribution normale est une distribution
mathmatique qui ne se rencontre jamais
distributions rellement observes sen
cloche (beaucoup dindividus autour de la
sen loigne, et ceci de faon symtrique).

thorique, en ce sens qu'elle est une idalisation


exactement dans la nature. Mais de nombreuses
rapprochent et ont cette fameuse forme de
moyenne, de moins en moins au fur mesure quon

D'autre part, elle est trs utilise en statistiques infrentielles : nous verrons en particulier quune
moyenne calcule sur un chantillon est une v.a. qui tend suivre une loi normale quand la taille de
lchantillon augmente, mme si la population initiale a une tout autre distribution.
a Sa forme : la courbe en cloche
La loi normale de paramtres m et , note N(m,), est dfinie sur R par la densit :

f ( x) =

1
2

1 x m

e 2

dont la reprsentation graphique est la suivante :

Notons que :

- la droite x= m est axe de symtrie


- les points dinflexion sont situs une distance de cet axe de symtrie

b Le thorme Central-limit
Le TCL sera trs prcieux puisquil nous explique que si on fait la somme dun trs grand nombre de
variables alatoires de loi quelconque, cette somme suit approximativement une loi normale (en fait,
sans rentrer dans le dtail des hypothses, il nous dit que la variable X = X1 + X2+ Xn tend suivre
une loi normale quand n tend vers linfini).
Dune part, cela nous permet de comprendre pourquoi autant de distributions observes dans la
ralit ont approximativement cette forme de cloche : elles dcrivent des phnomnes qui rsultent
de laddition dun grand nombre de causes de fluctuation indpendantes. Exemple : la taille dun
individu.

Dautre part, cela nous permettra dapprocher beaucoup de lois par une loi normale, pour peu que la
variable tudie sexprime comme une somme dun grand nombre de variables indpendantes.
Cest le cas notamment de la variable binomiale (somme de n variables de Bernoulli indpendantes),
dont la loi tend prendre la forme dune cloche quand n augmente.
Cela reste possible mme quand on ne connat pas loi des variables Xi.
2 Esprance et variance
Soit X une v.a. qui suit la loi N(m,). Par raison de symtrie: E(X) = m et on montre facilement que
2
V(X) = , donc le paramtre correspond lcart-type (do les notations)
Ainsi grce ses 2 paramtres, la loi normale permet de dcrire des distributions de moyenne
quelconque (on translate la courbe vers la gauche ou vers la droite), et de dispersion quelconque (on
rapproche ou on carte le point dinflexion)

3 Calculs de probabilits sur une loi normale


a Un gros inconvnient : on ne sait pas exprimer F(x) en fonctions de x
2

On ne connat pas de primitive de la fonction


algbrique de la fonction de rpartition F(x).

e x , donc on ne sait pas donner lexpression

Comment dans ces conditions calculer les probabilits de tomber


entre telle ou telle valeur? Par des techniques de calcul
numrique (en mesurant laire sous la courbe pour diffrentes
valeurs de x), on a pu constituer des tables donnant F(x). Ces
tables figurent en annexe de la plupart des manuels de
probabilits, et sont intgres dans certains logiciels (fonctions
dExcel par exemple). Pour tous les calculs, on se ramne la
fonction de rpartition de la loi N(0,1), dite loi normale centrerduite.

b La loi normale centre-rduite


Centrer et rduire une variable, cest raisonner en nombre dcarts-types par rapport la moyenne.
Par ex., si le poids dun foie gras est une variable de moyenne 550 g et dcart-type 100 g, on dira
dun foie de canard de x=650 g que, en donne centre-rduite, il pse t=1 (sous-entendu : 1 carttype de plus que la moyenne), alors que le poids centr-rduit dun foie de x=500g sera de t= -0,5
(un demi-cart-type en dessous de le moyenne).
Tous les vnements relatifs X peuvent tre aussi bien exprims en fonction de T . Ainsi, il est
quivalent de dire :
le poids dun foie est compris entre 500g et 650g : (500 < X < 660)
ou
le poids centr-rduit est compris entre -0,5 et 1 : ( -0,5 < T < 1)
avec T gal ici :

X 550
, et plus gnralement :
100

T =

X m

La variable centre-rduite T a pour esprance 0 et pour cart-type 1 car :


E(T)= E(

V(T)

X m

= V(

)=

X m

)=

(E( X ) m ) = 0
1

(V (X )) = 1

puisque

E(X)=m

puisque

V(X)=

Donc la densit de probabilit de la loi normale centre-rduite N(0,1) scrit :

y( t ) =

1
2

1
t2
e 2

Plutt que f et F, on note gnralement y la densit, et la fonction de rpartition de la loi N(0,1).


La table donnant, pour diffrentes valeurs de t, les valeurs de (t), soit P(Tt) est jointe en annexe.
On y lit par exemple :

(0) = 0,5
(1) = 0,8413
(0,5) = 0,6915
(1,96) = 0,9750
dont on dduit par symtrie :

(-1) = 1- (1) = 1 - 0,8413 = 0,1587


(-0,5) = 1 - (0,5) = 1 - 0,6915 = 0,3085
(-1,96) = 1 - (1,96) = 1- 0,9750= 0,0250

c Exemples de calcul sur une loi normale

La v.a. X, poids dun foie gras, suit une loi N(550 ;100). Quelle est la probabilit pour quun foie gras
pse moins de 650g, plus de 746g, moins de 500g, entre 550 et 600g ?

650 550
) = P(T<1) = (1) = 84,13%
100
746 550
P(X>746) = P(T>
) = P(T>1,96) = 1- P(T1,96) = 1 - (1,96) = 1- 0,9750= 2,5%
100
500 550
P(X<500) = P(T<
) = P(T<-0,5) = (-0,5) = 1 - (0,5) = 1 - 0,6915 = 30,85%
100
P(550<X<600) = P(0<T<0,5) = (0,5) -(0) = 0,8413 0,5= 34,13%

P(X<650) = P(T<

Rappelons que pour une variable continue, il ny a pas de diffrence entre P(X<k) et P(Xk) car la
probabilit attache la valeur k est nulle.

d- Quelques ordres de grandeur utiles retenir

Une variable normale a 95 chances sur


100 dtre situe entre : moyenne moins 2
carts-types et moyenne plus 2 cartstypes (la vraie valeur nest pas 2 mais 1,96)

Une
variable
normale
est
presque
certainement situe entre : moyenne moins 3
carts-types et moyenne plus 3 carts-types

3 Stabilit de la loi normale

Une combinaison linaire de variables normales indpendantes est elle-mme une variable normale.
Ainsi

si X1
N(m1,1) et X2
si a1 et a2 sont 2 rels

N(m2,2) , X1 et X2 tant indpendantes

alors : X = a1 X1+ a2 X2 suit galement une loi normale (dont les paramtres peuvent tre calculs en
utilisant les proprits de lesprance et de la variance).
Par exemple, S = X1+ X2 est une variable normale de paramtres :
E(S) = E(X1+ X2) = E(X1)+ E(X2) = m1+ m2
V(S) = V(X1+ X2) = V(X1)+ V(X2) car les variables sont indpendantes
2
2
= 1 + 2
donc

S= 12 + 2 2

et finalement :

N(m1+ m2,

12 + 2 2 )

4 Approximation de la loi binomiale et de la loi de Poisson par la loi normale

Nous avons vu que la loi binomiale B(n,p) est dautant plus symtrique que p est proche de 50% et
quelle prend une forme en cloche quand n augmente (dautant plus vite que p est proche que 0,5)
Le TCL donne une justification ce phnomne.
Une valeur de p trs diffrente de 0,5 (p petit ou alors q=1-p petit) pourra tre compense par une
grande valeur de n et on accepte gnralement de remplacer la loi binomiale par la loi normale

lorsque les produits np et nq sont suprieurs 15 ou 20. Dans ce cas, on approchera la loi B(n,p) par
la loi normale de mme esprance et de mme cart-type, soit N(np, npq )
De mme on pourra remplacer la loi de Poisson P(m) par une loi normale N(m, m ) ds que m est
suprieur 15 ou 20.
Exemple : on estime que la probabilit pour quune graine ait perdu son pouvoir germinatif aprs 3
ans de conservation est de 70%. Sur un chantillon de 100 graines conserves depuis 3 ans quelle
est la probabilit pour que moins de 25 germent ?

Notons p la probabilit quune graine germe :p= 0,3 et considrons que lchantillon est indpendant.
Notons X la v.a. nombre de graines qui germent parmi les 100 .
X suit la loi B(100 ; 0,3) et on cherche : P(X<25) qui peut scrire aussi P(X24) = p0 + p1 + .+p24
100
0,3 k 0,7100k
avec pk=
k

Le calcul exact est trop fastidieux pour tre fait la main. On peut alors :
- soit utiliser un logiciel, par exemple la fonction dExcel=LOI.BINOMIALE(24;100;0,3;1) qui
donne P(X24) = 0,114
- soit calculer une valeur approche en remplaant cette loi binmiale par une loi normale.
Cest possible car les produits np et nq sont assez grands ( resp. 30 et 70). Les paramtres
de cette loi seront :
o m = np = 30
o

npq =

100 0,3 0,7 = 4,5826

La variable alatoire discrte X


Xc

B(100 ;0,3) sera alors remplace par la variable continue :

N(30 ; 4,5826)

Un problme se pose alors : faut-il calculer P(Xc<25) ou P(Xc24) ? Pour une variable continue, ces
valeurs ne sont pas identiques La meilleure approximation sera obtenue en prenant la valeur
intermdiaire 24,5. Cest ce quon appelle la correction de continuit . Voir la justification page
suivante.
24,5 30
= (-1,20)= 1 - (1,20)= 1-0,885 = 0,115
4,5826
On peut constater que ceci fournit une excellente approximation de la vraie valeur puisque lerreur est
de lordre du millime.
P(X<25) = P(X24)

P(Xc24,5) =

Bibliographie :
http://neumann.hec.ca/~p240/c162096/documents/NotesLoiNormale1x1.pdf
http://www.astro.ulg.ac.be/cours/magain/stat/stat52.html
http://www.astro.ulg.ac.be/cours/magain/stat/stat51.html
http://www.up.univ-mrs.fr/veronis/cours/INFZ16/index.html?http://www.up.univ-mrs.fr/veronis/cours/INFZ16/ch6.html

Annexes

Correction de continuit

En jaune: la valeur exacte que lon veut calculer. En effet P(X24) = p0 + p1 + .+p24 , ce qui
correspond la somme des hauteurs de btons rouges du diagramme en bton de la loi binmiale.
Cette somme est gale la surface des rectangles jaunes puisque ces rectangles ont pour hauteur
les pi et pour base 1.
En bleu : ce quon calcule en prenant P(Xc24,5), qui correspond la surface sous la courbe de
densit gauche du point 24,5. On voit bien que lapproximation serait moins bonne en sarrtant 24
ou en allant jusqu 25.
On pratique la correction de continuit chaque fois quon approche une loi discrte par une loi
continue (en fait chaque fois quon hsite entre 2 valeurs comme entre 24 et 25 ici)

Vous aimerez peut-être aussi