Vous êtes sur la page 1sur 31

Introduction aux Tests Statistiques

Philippe Briand
Universit Rennes 1
philippe.briand@univ-rennes1.fr
http://perso.univ-rennes1.fr/philippe.briand/
cole daudioprothse J. Bertin
Cours de 2
e
anne
Tests Statistiques Cours 2
e
anne, 2006/2007 1/31
Introduction
On lance une pice de monnaie 500 fois
On observe la suite des rsultats X
1
, X
2
, . . . , X
500
X
1
= Pile, X
2
= Pile, X
3
= Face, . . .
Sur les 500 lancers, 245 fois Pile et 255 fois Face
Peut-on dcider laide de ces rsultats si la pice est quilibre ?
Une fois cette dcision prise, quelle est la probabilit de stre tromp ?
Pour rpondre ces questions, on met en place un test statistique
Tests Statistiques Cours 2
e
anne, 2006/2007 2/31
Premire partie I
Rudiments de probabilits
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 3/31
Plan de la premire partie
1 Espace de probabilit
2 Variable alatoire
Variables discrtes
Variables alatoires densit
3 Moyenne et Variance
4 Indpendance et lois
5 Thormes limite
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 4/31
Espace de probabilit
Une exprience alatoire est une exprience dont on ne peut prdire le
rsultat avant de raliser lexprience
lancer dun d ;
sexe dun enfant natre ;
temps dattente un bureau de poste ;
russite un examen.
Comment dcrire de tels phnomnes mathmatiquement ? ?
Modle retenu
Un triplet (, F, P) .
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 5/31
Le couple (, F)
reprsente toutes les ventualits possible de lexprience
on note les points de ;
un point est une exprience ou preuve lmentaire.
Lancer dun d six faces
= {1, 2, 3, 4, 5, 6}
Ce nest pas le seul choix possible ! !
F reprsente lensemble des vnements qui nous intressent :
le d est pair
attendre plus dun quart dheure la poste
russir mon examen
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 6/31
Les vnements de F
On reprsente un vnement par un sous-ensemble de
A= le d est pair
= {1, 2, 3, 4, 5, 6}, A = {2, 4, 6}
ralise lvnement A si A
Temps dattente un guichet de poste
On peut prendre = [0, +[.
B = attendre moins de 15 minutes correspond lintervalle [0, 15]
= 5 ralise B mais = 45 ne ralise pas B
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 7/31
La mesure de probabilit P
chaque vnement A, on associe un nombre P(A)
P(A) est compris entre 0 et 1 ;
P(A) mesure les chances que lvnement A se ralise.
La probabilit davoir les 6 bons numrons au loto est
P(6 bons numros) =
1
13 983 816
La probabilit P doit vrier certaines proprits
P
_
A
_
= 1 P(A)
Si A et B sont disjoints, P(A B) = P(A) +P(B)
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 8/31
La mesure de probabilit P
Thorme
Soit (, F) un espace probabilisable.
Une application P : F [0, 1] est une probabilit si
1 P() = 0 ;
2 P() = 1 ;
3 Si A
n
A
m
= pour tous n = m, alors
P
_
_
nN

A
n
_
=

n1
P(A
n
).
La dernire proprit est une gnralisation de
P(A B) = P(A) +P(B), si A B =
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 9/31
Proprits de P
Une mesure de probabilit vrie toujours :
P
_
A
_
= 1 P(A) ;
Si A B, P(A) P(B) ;
Si A B, P(B\A) = P(B) P(A) ;
P(A B) = P(A) +P(B) P(A B) ;
Si A B = , P(A B) = P(A) +P(B).
Tout est clair si on fait un dessin ! !
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 10/31
Notion de variable alatoire
On na pas besoin de dcrire lespace (, F, P) !
Il faut juste savoir quil existe.
Lancer dun d : X le rsultat du d
Ce qui est important cest de savoir que
P(X = 1) = P(X = 2) = . . . = P(X = 6) =
1
6
pas qui est ou qui est F.
On suppose toujours quil existe un espace (, F, P)
On reprsente une exprience alatoire ou plutt son rsultat X
comme une fonction du hasard soit X() ! !
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 11/31
Variable alatoire
Dnition
Soit (, F, P) un espace probabilis.
Une variable alatoire est une application X : R vriant :
t R, { : X() t} F.
On ne vrie pas la condition technique en pratique.
On ncrit jamais de i.e.
{ : X() t} = {X t}
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 12/31
Types de variables alatoires
Variables alatoires discrtes :
X prend un nombre ni de valeurs distinctes
Si X reprsente le rsultat du d, X prend les six valeurs 1, 2 . . . 6
X prend un nombre dnombrable de valeurs : X dans N ou Z.
On lance une pice de monnaie et on note X le premier instant o on
obtient pile. X prend ses valeurs dans N

et P(X = n) = 2
n
Variables alatoires continues :
X prend ses valeurs dans R ou un intervalle de R.
Par exemple, si X reprsente la dure de vie dune ampoule, X prend
ses valeurs dans R
+
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 13/31
Exemples de variables discrtes
Variable de Bernoulli B(p) : X prend les valeurs 0 et 1
P(X = 1) = p, P(X = 0) = 1 p
On modlise le succs ou lchec dune exprience
Variable binomiale B(n, p) : X prend les valeurs 0, 1,. . . , n
P(X = k) =
_
n
k
_
p
k
(1 p)
nk
, k = 0, . . . , n
On rpte n fois une exprience dont la probabilit de succs est p ; X
est alors le nombre total de succs au cours des n ralisations
Loi uniforme sur {1, . . . , N} :
P(X = 1) = P(X = 2) = . . . = P(X = N) =
1
N
quiprobabilit : comme un d quilibr
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 14/31
Exemples de variables discrtes
Variable gomtrique G(p), p (0, 1) : X dans N

k N

, P(X = k) = p(1 p)
k1
On rpte une exprience : X reprsente le premier instant o
lexprience est ralise avec succs
Variable de Poisson P(), > 0 : X dans N
k N, P(X = k) = e


k
k!
Typiquement, X est le nombre de clients qui arrive un guichet de
poste ou de requtes informatiques arrivant sur un serveur
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 15/31
Variables discrtes
X variable discrte valeurs dans V
V = {v
1
, . . . , v
N
} ou V = {v
1
, v
2
, . . .}
On a toujours

vV
P(X = v) = 1 mme si la somme est innie.
Pour tout ensemble A :
P(X A) =

vVA
P(X = v)
X variable gomtrique
P(X [1, 3]) = P(X = 1) +P(X = 2) +P(X = 3) = p + p(1 p) + p(1 p)
2
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 16/31
Variables alatoires densit
Situation trs dirente des variables discrtes
X v.a. valeurs dans R, R
+
ou un intervalle I R
Dnition
Une fonction p : R R
+
est une densit de probabilit si
1 p est positive ;
2
_
R
p(x)dx = 1
p(x) = e
x
1
x0
est une densit de probabilit ;
p(x) =
1

2
e

x
2
2
est aussi une densit de probabilit.
Dnition
X une v.a.r. et p une densit de probabilit. X a pour densit p si
I , P(X I ) =
_
I
p(x) dx.
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 17/31
Exemples de v.a.r. densit
X de loi uniforme sur [a, b]
p(x) =
1
b a
1
[a,b]
(x)
On tire un nombre au hasard entre a et b
X de loi exponentielle de paramtre > 0, E()
p(x) = e
x
1
x0
Temps dattente un bureau de poste
X de loi normale centre rduite, N(0, 1)
p(x) =
1

2
e

x
2
2
Cest la cloche de Gauss
X de loi gaussienne N(,
2
)
p(x) =
1

2
2
exp
_
(x )
2
/(2
2
)
_
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 18/31
Moyenne (ou esprance) dune v.a.r.
Cest la premire information sur une v.a.r. X que lon cherche
Quelle somme est-ce que je peux esprer gagner au Loto ?
Combien de temps vais-je attendre en moyenne la poste ?
X discrte valeurs dans V
La moyenne de X, note E[X], est
E[X] =

vV
v P(X = v).
X de loi B(p)
E[X] = 1 P(X = 1) + 0 P(X = 0) = P(X = 1) = p
Calculer E[X] quand X est de loi uniforme sur {1, . . . , N}
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 19/31
Moyenne dune v.a.r.
Dnition
Si X a pour densit p,
E[X] =
_
R
x p(x)dx
X de loi uniforme sur [a, b]
E[X] =
1
b a
_
R
x1
[a,b]
(x)dx =
1
b a
_
b
a
xdx =
a + b
2
X de loi exponentielle E()
E[X] =
_
+
0
xe
x
dx =
1

Rudiments de probabilits Tests Statistiques Cours 2


e
anne, 2006/2007 20/31
Moyennes des lois classiques
Lois discrtes :
B(p) E[X] = p
B(n, p) E[X] = np
P() E[X] =
G(p) E[X] =
1
p
Lois densit
U(a, b) E[X] =
a+b
2
E() E[X] =
1

N(0, 1) E[X] = 0
N(,
2
) E[X] =
Proprits
1 E[X + Y] = E[X] +E[Y]
2 E[X
1
+ . . . + X
n
] = E[X
1
] + . . . +E[X
n
]
3 E[aX + b] = aE[X] + b
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 21/31
Gnralisation
Si X est une v.a.r. et f une fonction, on peut calculer lesprance de f (X)
Si X est discrte :
E[f (X)] =

vV
f (v)P(X = v)
En particulier, f (x) = x
2
E
_
X
2

vV
v
2
P(X = v)
Si X suit la loi B(p)
E
_
X
2

= 1
2
P(X = 1) + 0
2
P(X = 0)
Si X a pour densit p :
E[f (X)] =
_
R
f (x) p(x)dx
En particulier, f (x) = x
2
E
_
X
2

=
_
R
x
2
p(x)dx
Si X suit la loi uniforme sur [a, b]
E
_
X
2

=
1
b a
_
b
a
x
2
dx
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 22/31
Variance
On veut faire la dirence entre
Moyenne de la classe 10 : la moiti des tudiants ont 20, lautre moiti 0
Moyenne de la classe 10 : tous les tudiants ont 10
On mesure la dispersion des notes autour de leur moyenne

2
=
1
N
N

k=1
(x
k
10)
2
=
_
100, dans le premier cas
0, dans le second

2
mesure lcart quadratique moyen des notes la moyenne

2
grand : les notes sont loignes de la moyenne

2
petit : les notes sont concentres prs de la moyenne
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 23/31
Variance dune v.a.r.
Dnition
On appelle variance dune v.a.r. X le nombre positif

2
= V(X) = E
_
(X E[X])
2
_
0
La racine carre positive, , sappelle lcart type.
reprsente lcart typique (caractristique) de X par rapport sa moyenne
Autre formule
V(X) = E
_
X
2

E[X]
2
Proprits
V(aX + b) = a
2
V(X), (aX + b) = |a| (X)
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 24/31
Variance des lois classiques
Lois discrtes :
B(p) V[X] = p p
2
B(n, p) V[X] = np(1 p)
P() V[X] =
G(p) V[X] =
1p
p
2
Lois densit
U(a, b) V[X] =
(ba)
2
12
E() V[X] =
1

2
N(0, 1) V[X] = 1
N(,
2
) V[X] =
2
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 25/31
Indpendance de variables alatoires
On rpte une exprience : les rsultats de la premire exprience
ninuence pas la seconde, . . .
Lancers dune pice de monnaie
Taux de cholesterol de dirents malades
Intention de vote pour tel ou tel candidat (plus discutable)
Dnition
Des variables alatoires X
1
, . . . , X
n
sont indpendantes si
P(X
1
B
1
, . . . , X
n
B
n
) = P(X
1
B
1
) . . . P(X
n
B
n
)
Exemple
P(X
1
= Face, X
2
= Pile) = P(X
1
= Face) P(X
2
= Pile) =
1
4
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 26/31
Indpendance et v.a.r. gaussiennes
Si X
1
, . . . , X
n
sont indpendantes
E[f
1
(X
1
) . . . f
n
(X
n
)] = E[f
1
(X
1
)] . . . E[f
n
(X
n
)]
V(X
1
+ . . . + X
n
) = V(X
1
) + . . . +V(X
n
)
X et Y indpendantes
X de loi N(,
2
), Y de loi N(,
2
) alors X + Y est aussi gaussienne
N( +,
2
+
2
)
retenir
Si X est gaussienne, X est caractrise entirement par sa moyenne et sa
variance
Si X suit la loi N(,
2
), alors Y = (X )/ suit la loi N(0, 1)
Si Y suit la loi N(0, 1), X = +Y suit la loi N(,
2
)
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 27/31
Loi dune variable alatoire
Pour dcrire entirement le comportement statistique dune v.a.r. X, il faut
calculer
P(X B) pour tout ensemble B
Dnition
On appelle loi de la variable alatoire X la mesure de probabilit P
X
dnie
par
P
X
(B) = P(X B).
Pour caractriser, la loi dune variable alatoire, il sut de calculer
P(X I ) pour tout intervalle I .
Dnition
On appelle fonction de rpartition de X la fonction F
X
suivante :
t R, F
X
(t) = P(X t)
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 28/31
Proprits des fonctions de rpartition
Soient s t deux rels.
P(X t) = F
X
(t)
P(s < X t) = F
X
(t) F
X
(s)
P(s X t) = F
X
(t) F
X
(s)
lim
t+
F
X
(t) = 1
F
X
est croissante
P(X < t) = F
X
(t)
P(s < X < t) = F
X
(t) F
X
(s)
P(s X < t) = F
X
(t)F
X
(s)
lim
t
F
X
(t) = 0
F
X
est continue droite
P(X = t) = F
X
(t) F
X
(t)
En particulier, si F
X
est continue, alors P(X = t) = 0 pour tout t
F
X
caractrise la loi de X
Si on connat F
X
, on peut calculer la P(X I ) pour tout intervalle
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 29/31
Loi des grands nombres
Ide intuitive des probabilits = Frquence empirique
Fr
n
(Pile) =
Nombre de Pile
Nombre total de lancers
Dpend de n
Si on refait lexprience avec le mme n, on nobtient pas le mme
rsultat
Si n est grand, Fr
n
(Pile) est proche de 1/2
Thorme (Loi des grands nombres)
X
1
, X
2
, X
n
, . . . des variables alatoires indpendantes et de mme loi.
lim
n+
X
1
+ . . . + X
n
n
= E[X
1
]
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 30/31
Thorme central limite
Thorme (TCL)
X
1
, X
2
, X
n
, . . . des v.a.r. i.i.d. ; = E[X
1
],
2
= V(X
1
). G de loi N(0, 1).
Pour tout intervalle I R,
lim
n+
P
_
n

_
X
1
+ . . . + X
n
n

_
I
_
= P(G I )
On note la fonction de rpartition de G i.e.
(t) =
1

2
_
t

e
x
2
/2
dx
Si n est grand
P
_
a

n
<
X
1
+ . . . + X
n
n

b

n
_
(b) (a)
Rudiments de probabilits Tests Statistiques Cours 2
e
anne, 2006/2007 31/31

Vous aimerez peut-être aussi