Vous êtes sur la page 1sur 3

Fiche sur les tests dadquation de lois et dindpendance

Tran Viet Chi


1 Tests dadquation une loi
Bien sr, si on se place dans une famille de lois donnes (par exemple des lois exponentielles
de paramtres ), le test dadquation la loi exponentielle de paramtre
0
revient un test de
paramtres =
0
.
1.1 Tests du
2
Cest lun des tests les plus classiques pour tester lindpendance ou ladquation une loi.
Thorme 1.1. Test du
2
pour ladquation une loi P
0
Le test du
2
consiste dcouper lespace des observations en k classes, et comparer les
frquences empiriques de chaque classe i :
ni
n
, avec la probabilit thorique P
0
donne par H
0
, p
i
.
La statistique de test est :

2
n
=
k

j=1
(n
j
np
j
)
2
np
j
=
k

j=1
n
_
nj
n
p
j
_
2
p
j
Elle converge en loi vers un
2
(k 1) sous H
0
et vers sous H
a
.
La rgion de rejet est donc :
W
n
=
_

2
q
1
_

2
(k 1)
_
_
On essaie de choisir les classes de faon ce que np
j
5.
Si la loi thorique est donne, on peut choisir les classes de sorte que la probabilit de chaque
classe soit
5
n
.
Sinon, on se base sur la loi empirique pour diviser lchantillon...
Thorme 1.2. Test du
2
pour ladquation une famille de lois paramtriques (P

On suppose o est une partie de R


d
.
On remplace les p
j
prcdents par p
j
(

), o

est lEMV de . Ceci revient tester ladquation
la loi la plus vraisemblable de la famille :

2
n
=
k

j=1
_
n
j
np
j
(

)
_
2
np
j
(

)
=
k

j=1
n
_
nj
n
p
j
(

)
_
2
p
j
(

)
Quand cette statistique est trop complique, on peut la remplacer par la statistique suivante de
mme loi :

2
n
=
k

j=1
_
n
j
np
j
(

)
_
2
n
j
=
k

j=1
n
_
nj
n
p
j
(

)
_
2
nj
n
Ces statistiques convergent en loi vers un
2
(k d 1) sous H
0
et vers sous H
a
. Il faut
faire attention au fait que le nombre de degr de libert eset dirent du test dadquation une
loi simple.
La rgion de rejet est donc :
W
n
=
_

2
q
1
_

2
(k d 1)
_
_
1
1.2 Tests de Kolmogorov-Smirnov
(X
i
) sont des variables iid. La fonction de rpartition empirique est :
F
n
(x) =
1
n
n

i=1
1
],x]
(X
i
)
On note F la fonction de rpartition thorique (donne par H
0
).
Thorme 1.3. Glivenko-Cantelli
Presque srement, quand n :
sup
xR
|F
n
(x) F(x)| 0
Thorme 1.4. Kolmogorov-Smirnov
On a la convergence en loi pour les statistiques suivantes :
D
n
=

n sup
x
|F
n
(x) F(x)| (loi) D
1
D
+
n
=

n sup
x
(F
n
(x) F(x)) (loi) D
2
D

n
=

n sup
x
(F(x) F
n
(x)) (loi) D
2
o les lois de D
1
et D
2
ne dpendent pas de F (ces lois sont tabules) et sont caractrise par leur
survie :
P (D
1
> ) = 2

k=1
(1)
k+1
exp
_
2k
2

2
_
P (D
2
> ) = exp
_
2
2
_
Pour tester F = F
0
contre F = F
0
, on prend le test de rgion de rejet :
W
n
= {D
n
> q
1
(D
1
)}
Pour tester F F
0
contre F > F
0
, on prend le test de rgion de rejet :
W
n
=
_
D
+
n
> q
1
(D
2
)
_
Pour tester F F
0
contre F < F
0
, on prend le test de rgion de rejet (attention au signe
et au quantile choisi) :
W
n
=
_
D

n
< q

(D
2
)
_
Pour tester lappartenance de F un modle (F

, on remplace comme prcdemment F


donn par H
0
prcdente par F(

), o

est lEMV. Il faut alors corriger les statistiques prcdentes,
et toujours selon le mme principe, les comparer aux quantiles tabuls. Les corrections sont prcises
dans les tabulations (on prcise par exemple que la quantit tabule est D
n
_

n + 0,12 +
0.11

n
_
:
dans ce cas, on calcule cette fonction de D
n
et on la compare la valeur du tableau).
2 Tests dindpendance
2.1 Tests du
2
Ce test est un test peut se voir (cf poly de P. Doukan ou livre de Monfort) comme un test
dadquation une famille de lois. On dispose des deux faons de tester vues prcdemment.
Thorme 2.1. Test du
2
pour lindpendance de X et Y
Le croisement des variables X et Y discrtises peut sillustrer par un tableau de contingence,
avec k
x
lignes et k
y
colonnes. On compare les frquences empiriques de chaque case ij,
nij
n
, aux
produit des probabilits marginales, p
i.
p
.j
qui est la probabilit de la case dans le cas indpendant.

2
n
=

i,j
_
n
ij

ni.n.j
n
_
2
ni.n.j
n
=

i,j
n
_
nij
n

ni.
n
n.j
n
_
2
ni.
n
n.j
n
2
Une statistique de mme loi (sous H
0
) est :

2
n
=

i,j
_
n
ij

ni.n.j
n
_
2
n
ij
=

i,j
n
_
nij
n

ni.
n
n.j
n
_
2
nij
n
Cette statistique a pour loi asymptotique un
2
((k
x
1)(k
y
1)) sous H
0
et vers sous H
a
.
La rgion de rejet est donc :
W
n
=
_

2
q
1
_

2
((k
x
1)(k
y
1))
_
_
3