Vous êtes sur la page 1sur 19

1

PREMIERE PARTIE NOTIONS ELEMENTAIRES DE STATISTIQUE PROBABILISTE

1. Dfinitions de la probabilit Afin d'viter des dmonstrations trs thoriques, nous donnons les dfinitions tires de la norme NF X06-002. a) Dfinition dterministe de la probabilit (ou priori) Lors de la ralisation dun vnement dont le nombre dissues favorables peut tre calcul au moyen de lanalyse combinatoire (compte tenu de lhypothse dquiprobabilit des issues), on dfinit la probabilit de cet vnement par le rapport du nombre d'issues favorables (h) au nombre d'issues possibles (n) :

P=

h n

Cest la dfinition classique que lon utilise pour valuer les issues dun jeu de hasard. Exemple : La probabilit pour obtenir "pile" aprs un lanc dune pice parfaitement symtrique est de 0,5. b) Dfinition empirique de la probabilit Si aprs un grand nombre de ralisations dune exprience (n ralisations) on observe h fois lissue souhaite, la probabilit de cet vnement est la limite de la frquence des observations de l'issue souhaite :

h P = n lim n
En ralit, la frquence observe en fonction de n oscille autour de sa valeur thorique et s'en rapproche indfiniment lorsque n conformment la "loi des grands nombres".

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

2 2. Variables alatoires a) Dfinition Considrons un vnement comportant un certain nombre dissues. Si on associe un nombre chaque issue, ou chaque ensemble dissues, ce nombre est appel variable alatoire ou ala numrique. On la note par une lettre majuscule X, par contre les valeurs particulires de la variable alatoire sont notes x ou xi. Exemple : jeu de pile ou face : Les issues du jeu sont "pile" ou "face". On peut associer "pile" X = 1 et "face" X = -1 ou encore 0 et 1 ou tout autre nombre. X est alors une variable alatoire. b) Continuit et discontinuit dune variable alatoire, notion de densit de probabilit Variable discontinue ou discrte Cest une variable qui ne peut prendre que des valeurs isoles spares par un intervalle fini, cest--dire non infinitsimal. Elle est gnralement reprsente par un entier. On peut associer une probabilit une variable alatoire discrte. Variable continue Cest une variable qui peut prendre toutes les valeurs dun intervalle fini ou infini. Cela signifie que la diffrence entre deux valeurs voisines peut tre aussi petite que lon peut limaginer. Cest un nombre rel. On ne peut pas associer une probabilit une variable alatoire continue. La probabilit pour que X prenne une valeur particulire x dans R (l'ensemble des nombres rels) est toujours nulle. Par contre on peut associer x une densit de probabilit f(x) et on peut associer un intervalle [x, x+x] une probabilit non nulle. La densit de probabilit est dfinie de la mme manire que la densit dun milieu continu.

Fig.1

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

3 P(x X x + x) x

f(x) = lim x0

Si lintervalle est assez petit pour quon puisse considrer f(x) comme constant :

P(x X x + x) = f(x) x

On constate bien que cette probabilit tend vers 0 lorsque x tend vers 0. Exemple : On sintresse la taille des personnes dun certain ge. Si la taille est considre comme une variable alatoire continue, donc un nombre rel (un nombre rel est un nombre infiniment prcis), rien nempche dexaminer la probabilit pour rencontrer un individu de taille 1,7500 m ou mme 1,7543 m. La probabilit de rencontrer dans la population une valeur numrique aussi prcise est nulle. Il est dailleurs impossible de mesurer la taille dune personne avec une telle prcision. Par contre il existe un certain nombre dindividus ayant une taille comprise entre 1,75 et 1,76 m si lchantillon est suffisamment grand. Il faut donc "discrtiser" une variable alatoire continue pour pouvoir en dfinir une probabilit non nulle. 3. Gnralits sur les lois de probabilits a) Dfinition Une loi de probabilit est une relation permettant dassocier une probabilit ou une densit de probabilit chaque valeur dune variable alatoire. b) Reprsentation dune loi de probabilit Si la variable est discrte : reprsentation comme un diagramme en btons. p(x)

X
Fig. 2 Diagramme en btons

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

- Pour une variable continue on reprsente la fonction densit de probabilit (voir figure 1) c) Fonction de rpartition dune loi de probabilit La fonction cumulative de distribution, ou plus simplement fonction de distribution F ou fonction de rpartition F est dfinie par :

F(x) = P(X < x)

d) Reprsentation graphique de la fonction de rpartition La courbe est encore appele "courbe des probabilits cumules". Dans le cas dune loi continue F(x) reprsente la surface dlimite par la courbe reprsentation de la loi entre - et labscisse x.

Fig. 3 Lois de probabilit et fonctions de rpartition (variables discrtes et continues) e) Fractile d'ordre : t() Dans le cas dune loi continue le fractile t() est labscisse x telle que la surface dlimite par la loi de probabilit entre - et t() soit gale . Les fonctions F(t) et t() sont des fonctions rciproques lune de lautre.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

Si t est le fractile dordre on a les relations :

P( X t ) =

P( X t ) = 1 - ou F(t ) =

Fig. 4 Fractile t dune loi statistique encore appel fractile infrieur

Fig. 5 Fractile t(1-) dune loi statistique encore appel fractile suprieur

On sintresse galement au fractile t(1-) qui joue le mme rle que t sur la partie des x levs (Fig5). On dmontre que :

P( X t 1-) =

P( X t 1-) = 1 - ou 1 - F(t 1-) =

Si la loi statistique est symtrique et centre on a la relation t = -t(1-) Les fractiles symtriques dlimitent chacun une surface extrieure de /2. La surface totale intrieure lintervalle interfractile est 1-.

Fig. 6 Fractiles symtriques Remarques : les fractiles des lois de probabilits ont une importance considrable dans les

tests statistiques. Les lois de probabilits discrtes nont pas de fractiles

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

6 4. Paramtres statistiques des variables alatoires a) Esprance mathmatique Dfinition L'esprance mathmatique est un paramtre de position (ou paramtre de tendance centrale) dfini par les relations Variable discrte E(X) =

Xi .P(Xi )
i =1

Les indices 1 N doivent englober tout le domaine de variation de X. Variable continue Variable continue
+

E(X) =

X f(X)

dX

Physiquement, l'esprance mathmatique est le centre de gravit de la loi de probabilit. Fig. 7 Signification physique de lesprance mathmatique

Quelques proprits de lesprance mathmatique E () = ( est une constante)

E (X + Y) = E(X) + E(Y)
Par contre E(XY) = E(X) . E(Y) uniquement si les variables x et y sont indpendantes. La variable Z = X - E(X) est appele variable alatoire centre. Son esprance mathmatique est nulle.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

7 b) Variance et cart-type Dfinitions La variance est lesprance du carr de la variable centre.

V(X) = E((X - E(X))2)

Pour une variable discrte V(X) =

P(Xi )(Xi E(X))2


i =1

Pour une variable continue

V(X) =

(x E(x)) 2 f(x)dx

Enfin, lcart-type est la racine carre de la variance.

= V(X)
La variance et lcart-type sont des paramtres de dispersion. Physiquement, la variance est assimilable un moment d'inertie (les masses tant gales aux probabilits) et lcart-type est assimilable un rayon de giration. Quelques proprits de lesprance mathmatique V(X) = 2 V(X) Pour deux variables alatoires indpendantes V(X + Y) = V(X) + V(Y) V(X - Y) = V(X) + V(Y) Les proprits dadditivit ne sappliquent quaux variances ; Elles ne sappliquent pas aux carttypes. (une somme (X) + (Y) na aucun sens statistique)

La variable alatoire Z =

X E( X ) admet une esprance nulle et une variance de 1, Z est appele

variable centre et rduite (ou variable normalise).

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

c) Moments dordre suprieur, dissymtrie et aplatissement Dfinitions On appelle moment dordre n la grandeur :

Mn = E (Xn)
Le moment centr dordre n est le moment dordre n de la variable centre :

n = E[(X - E(X))n]
On a donc

M1 = E(X) , 1 = 0 et 2 = V(X)
Tous les moments centrs dordre impair (>1) donnent une indication sur la dissymtrie de la loi de probabilit. On nutilise que le moment dordre 3 et on appelle coefficient dasymtrie le coefficient :

3 2

3 = 3 2 3

Le coefficient dasymtrie est une grandeur sans dimension, sa valeur donne une ide de limportance de la dissymtrie et son signe montre si la dissymtrie provient de valeurs leves de X (dissymtrie droite ) ou des valeurs petites de X (dissymtrie gauche). Tous les moments centrs dordre pair sont des variables de dispersion. On nutilise que le moment

4 et son coefficient associ, le coefficient coefficient de Kurtosis ou aplatissement compar la loi


Normale qui est galement sans dimension:

= 4 3= 4 3 2 4 2
Ce facteur permet donc de montrer quune distribution est plus aplatie ou moins aplatie quune distribution gaussienne, toutes choses gales par ailleurs (mme esprance et mme variance).

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

9 d) Autres paramtres de position Mode Le mode est la valeur de X dont la probabilit est maximale. Cette valeur peut ne pas tre unique. Une distribution unimodale est une distribution nayant quun seul mode, sinon elle est bimodale, trimodale ou multimodale. Mdiane La mdiane Med est la valeur de x pour laquelle P (X x) = P (X x) =

1 2

Pour une distribution continue cest la valeur qui spare la courbe de densit de probabilit en deux portions de surface gale. La mdiane est le fractile d'ordre

1 2

5. Etude de quelques lois de probabilits discrtes a) Loi de Binomiale Ralisation On considre un jeu comportant 2 issues : - une issue favorable S avec la probabilit p - une issue dfavorable S avec la probabilit q = 1 - p On fait n ralisations du jeu de faon que les preuves soient indpendantes. On veut calculer la probabilit pour avoir k issues favorables appeles S, sans tenir compte de lordre de leur ralisation. Probabilit pour la ralisation de S : pk Probabilit pour n - k ralisations de S : (1 - p)n-k Probabilit pour que S se ralise k fois et S n - k fois : pk (1 - p) n-k

(Si on nassocie pas n-k ralisations de S k ralisations de S, le nombre total de ralisations est variable et ne dpend pas de n, parce que lordre des ralisations est indiffrent)
k Nombre de combinaisons de k objets parmi n : C n

P(X = k) = Ckpk (1 p)nk n

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

10

Paramtres statistiques

E(X) = np V(X) = np(1- p)


= np(1- p)

Coefficients dasymtrie et daplatissement

qp npq 1 6pq npq

= 3+
Reprsentation graphique

On reprsente la loi binomiale laide dun diagramme en btons. Le diagramme est symtrique lorsque p = q = 0,5 . Dans ce cas, la mdiane et le mode sont gaux E(X). Lorsque p et la mdiane et le mode deviennent < E(X) Nous verrons ultrieurement limportance de cette proprit. La figure ci-dessous reprsente le diagramme en btons de la loi binomiale pour n = 40 et p = 0,1 (m = 4, = 1,9) Enfin, lorsque n est grand et p petit, les valeurs de P(X=k) diminuent trs vite partir dune certaine valeur de k, ce qui signifie que le diagramme en btons ne dpasse jamais une vingtaine de valeurs . et q la dissymtrie augmente

Fig. 8 Diagramme en btons de la loi binomiale

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

11

b) Loi de Poisson Expression de la loi de probabilit On obtient la loi de Poisson partir de la loi binomiale lorsque n est trs grand et p trs petit, le produit np ntant pas trs grand, (1 < np < 20) Exemple : p = 0,05 et n = 100 fournit une trs bonne approximation dune loi de Poisson. Moyennant quelques approximations, on meut dmontrer :

P(k) =
Paramtres statistiques

mk m e k!

On tire ces valeurs de la loi binomiale dont la loi de Poisson est une approximation. En posant np = m dans les quations correspondantes de la loi binomiale on obtient :

E(X) V(X)

= m = m m 1 m 1 m

= 3 +
Reprsentation graphique

Le diagramme est toujours dissymtrique vers les valeurs leves de X, la mdiane et le mode sont infrieurs la moyenne. Pour les grandes valeurs de n, 0 et 3, la loi se rapproche dune loi de Gauss. La figure ci-dessous reprsente la loi de Poisson pour m = 3 ( = 1,73).

Fig. 9 Diagramme en btons de la loi de Poisson

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

12

Intrt de la loi de Poisson la loi de Poisson est la loi suivie par les dsintgrations radioactives ainsi que par dautres vnements rares comme les pannes sur les chanes de fabrication ou les objets dfectueux dans une production. Les files dattente suivent galement une loi de Poisson.

6. Etude de quelques lois de probabilits continues utiles pour linterprtation de donnes exprimentales a) Loi de Gauss (Loi Normale et Loi Normale Rduite) Expression de la densit de probabilit La loi Normale est une fonction continue dpendant des deux paramtres m et
(x m)2 2 2

g(x) =

Loi Normale Rduite N(0,1) Si on remplace x par la variable alatoire rduite

xm la fonction g devient :
x2 2

g(x) =

1 2

Cest lquation de la loi Normale Rduite. On a videmment E(x) = 0, V(x) = 1, = 0 et = 3 Paramtres statistiques

Loi Normale N(m,)


E(X) = m V(X) = 2

Loi Normale rduite N(0,1)


E(X) = 0 V(X) = 1

La loi est donc symtrique et le mode et la mdiane sont gaux la moyenne. Laplatissement prend une valeur caractristique, = 3 qui est prise comme rfrence lorsquon veut comparer les autres lois statistiques la loi Normale.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

13

Fig.10 Reprsentation graphique de la loi Normale rduite et valeur des surfaces S(u) Valeurs remarquables de g(x) et de la surface comprises entre u et u

+u

S(u) =

-u

f(x)dx = F(u) - F(-u)

F est la fonction de rpartition de g(x). Ces valeurs ont une importance majeure pour la comprhension des tests statistiques. u 0 0.6740 1 g(u) 0.40 0.318 0.242 0.20 0.054 0.014 4.4 10
-3

S(u) 0 0.5 0.68 0.75 0.95 0.99 0.995

Remarque Maximum de la courbe Erreur quiprobable Point d'inflexion Largeur mi-hauteur Intervalle de confiance 95 % Intervalle de confiance 99 % Intervalle de confiance 99.5 %

2 ln 2
2 2.6 3

Intrt de la Loi Normale Beaucoup de mesures physiques se distribuent suivant une loi Normale. Il existe des tests statistiques permettant de prouver le caractre normal dun ensemble de mesures et la normalit d'une distribution exprimentale est souvent une condition ncessaire pour l'application des tests statistiques sur les moyennes ou sur les variances.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

14

b) Loi de Student Sa densit de probabilit dpend dun paramtre , appel "nombre de degrs de libert". Elle est symtrique et a pour reprsentation graphique la famille de courbes dont quelques unes sont reprsentes ci-dessous :

Fig. 11 reprsentation graphique de la loi de Student Les courbes prsentent la mme allure quune courbe de Gauss mais elles sont plus aplaties. Lorsque (en pratique lorsque > 40) la loi de Student est quasiment quivalente la loi de Gauss. Fractiles de la loi de Student Les valeurs des fractiles t(,) et t(,1-) de la loi de Student sont donnes dans les tables de Student-Fisher. Puisque la loi est symtrique t(,) = -t(,1-). Comme pour toute loi statistique, la valeur t(,1-) constant augmente lorsque diminue, mais constant les valeurs de t(,1-) augmentent sensiblement lorsque diminue (voir fig 11 et 12). Ceci sexplique facilement par l augmentation de laplatissement de la courbe. En effet, plus une courbe est aplatie, plus il faut prendre une abscisse t(1-) leve pour que lintgrale :
t(1 )

f(x)dx

ait une valeur donne. Lorsque = 0, la valeur de t est infinie pour toutes les valeurs de , sauf pour = 100 %.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

15

Fig. 12 Fractiles de la loi de Student (dispersion bilatrale) en fonction de pour = 10%, 5% et 1% et 0,5% Remarque : Les tables de Student-Fisher sont prsentes de diffrentes manires : les tables de fractiles appeles encore "tables unilatrales" donnent t(1-, ) en fonction de 1- et de pour des valeurs < 0,5. Gnralement on pose P = 1 - (P > 0,5) et on donne la table en fonction de P. On trouve galement des tables donnant la valeur de t(P) de faon que :
t(P)

t(P)

f(x)dx = P = 1

Ces tables sont appeles "tables bilatrales de Student-Fisher" Intrt de la loi de Student On peut montrer que pour un chantillon de n observations indpendantes dune grandeur X distribue alatoirement suivant une loi Normale N(m,)

la grandeur

xm o s = s n

( xi m )
i

n1

suit une loi de Student = n - 1 degrs de libert.

Cette loi prsente donc un intrt considrable dans tous les tests statistiques relatifs aux moyennes de petits chantillons.

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

16 c) Loi de Fisher-Sndecor Expression de la densit de probabilit Cest la loi dune variable alatoire continue appele F dont la densit de probabilit dpend de deux paramtres 1 et 2 (nombre de degrs de libert) : Les reprsentations graphiques sont donnes la figure 13 en fonction de ses deux paramtres 1 et 2. La loi est dissymtrique et dautant plus aplatie que 1 et 2 sont petits.

Fig.13 Reprsentation graphique de la loi de Fisher-Snedecor Fractiles de la loi de Fisher Les tables donnent les valeurs des fractiles suprieurs F(1, 2, 1-) pour une valeur donne de , cest dire que les deux entres de la table sont 1 et 2. On prend gnralement = 0,05 ou = 0,01 et on a toujours P = 1 - Les fractiles infrieurs peuvent tre calculs sachant que F ( 2 , 1 , ) = lchange des degrs de libert 1, et 2) Comme pour toutes les lois statistiques, les fractiles deviennent infinis lorsque 1 et 2 sont nuls. Numriquement, les valeurs sont trs leves lorsque 2 < 3. Intrt de la loi de Fisher-Snedecor Par consquent, la loi de Fisher-Snedecor intervient dans tous les problmes qui font intervenir des comparaisons de variances, cest dire les problmes de prcision et de qualit des mesures physico-chimiques.

1 (attention F ( 1, 2 ,1 )

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

17 d) Loi du Khi-deux Densit de probabilit La densit de probabilit dpend dun paramtre appel "nombre de degrs de libert". La loi de Khi-deux, appele aussi loi de Pearson, a pour reprsentation graphique en fonction de , une famille de courbes reprsentes la figure 14 :

fig.14 Reprsentation graphique de la loi du khi-deux

E(2) =
rapport aux autres lois.) Fractiles de la loi du 2

V(2) = 2

Elle est dissymtrique et dautant plus aplatie que est plus lev (volution contraire par

Comme pour la loi de Fisher, reprsente la surface de la courbe entre 2 et linfini. On reprsente les fractiles soit en fonction de P, soit en fonction de = 1 - P Intrt de la loi de Khi-deux Dans le cas dun chantillon de observations indpendantes dune grandeur X qui suit une loi Normale N(m, ), la somme : ( < 0,5 et P > 0,5).

x m i suit une loi de 2 degrs de libert.


1

La somme ci-dessus est dautant plus petite que les valeurs de xi sont proches de la moyenne. La loi du 2 est donc utilise dans les problmes dadquation, cest dire lorsquil faut prouver que des valeurs exprimentales xi sont proches de valeurs modles (xi (thoriques).

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

18 7. Calcul des lois de probabilits, Fonctions de rpartition et fractiles laide du logiciel EXCEL. Le logiciel EXCEL permet de calculer toutes les lois de probabilits classiques, leurs fonctions de rpartition et leurs fractiles. Toutefois les explications concernant ces lois sont souvent incompltes ou errones. On accde ces fonctions par : Insertion dune fonction/fonctions statistiques Fonctions Loi.Binomiale Paramtres k, n, p VRAI/FAUX Significations n : nombre de tirages, p : probabilit dun tirage Si VRAI on renvoie la probabilit cumule de 0 k, valeur P(X=k) comprise. Si FAUX, on renvoie la probabilit, P(X=k) Si VRAI on renvoie la probabilit cumule de 0 X (entier) , valeur P(X) comprise. Si FAUX, on renvoie la probabilit, P(X) Si VRAI on renvoie la fonction de rpartition pour labscisse X. Si FAUX, on renvoie lordonne de la loi Normale pour labscisse x Renvoie la fonction de rpartition de la loi Normale rduite pour labscisse z. Loi.Normale.Inverse Loi.Normale Standard.Inverse Loi.Student P, E(x), P X, , 1 ou 2 Fractile de la loi Normale desprance E et dcarttype pour la probabilit P Fractile de la loi Normale rduite pour la probabilit P Renvoie la probabilit cumule de X linfini pour une loi de Student degrs de libert. Si 1 : distribution unilatrale, si 2 : distribution bilatrale, la fonction renvoie la probabilit totale extrieure ATTENTION, cette fonction renvoie le fractile bilatral dune loi de Student degrs de libert, P tant la probabilit extrieure lintervalle X, +X . Pour le fractile unilatral introduire 2P Renvoie la probabilit cumule de X linfini pour une loi de Fisher 1, et 2 degrs de libert. Renvoie le fractile unilatral dune loi de Fisher 1, et 2 degrs de libert pour la probabilit 1-P. Renvoie la probabilit cumule de X linfini pour une loi de Pearson degrs de libert. Renvoie le fractile unilatral dune loi de Pearson degrs de libert pour la probabilit 1-P

Loi.Poisson

X, E(X), VRAI/FAUX

Loi.Normale

X, E(X), , VRAI/FAUX

Loi.Normale Standard

Loi.Student.Inverse

P,

Loi.F Inverse.loi.F Loi.Khideux Khideux.inverse

X, 1, 2 P, 1, 2

, X
P,

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens

19

STATISTIQUES PROBABILISTES CE QUIL FAUT ABSOLUMENT RETENIR


Calcul de lEsprance mathmatique Calcul de la variance Variable centre rduite Proprits dadditivit de lesprance et de la variance E (X + Y) = E(X) + E(Y) V(X) = 2 V(X) V(X Y) = V(X) + V(Y) (X et Y : variables indpendantes) Loi de probabilit Fonction de rpartition

Fractiles unilatraux,

Fractiles bilatraux

Allure gnrale des lois Binomiale, Poisson, Normale, Student, Fisher-Snedecor, Khi-deux Signification de: u(), u(1-), u(/2), u(1-/2) t(), t(1-), t(/2), t(1-/2) F(), F(1-), 2 (), 2(1-), 2 (/2), 2(1-/2) Savoir lire les tables statistiques

Pierre Jost

Statistiques lusage des ingnieurs et des techniciens