Vous êtes sur la page 1sur 13

STT3700

Cours 3

Tests dhypoth`se e

Le but dun test dhypoth`se est de dterminer, ` laide dun chantillon provenant e e a e dune population, laquelle de deux hypoth`ses complmentaires est la vraie. e e H0 : hypoth`se nulle e H1 : hypoth`se alternative e u Par exemple, nous pourrions tester H0 : 0 contre H1 : c , o` 0 est un 0 sous-ensemble de lespace param`tre . e Lors dun test dhypoth`se, le statisticien examine les donnes et dcide daccepe e e ter ou de rejeter H0 . Le test dhypoth`se est une r`gle de dcision qui spcie pour e e e e quelles donnes lhypoth`se H0 sera accepte. Gnralement, le statisticien calculera e e e e e une statistique T (X) sur laquelle sa dcision reposera. Lensemble des chantillons e e pour lesquels H0 est accepte est la rgion dacceptation, alors que son complment e e e est la rgion de rejet (ou rgion critique). e e Comme au chapitre prcdent, nous verrons tout dabord des mani`res de trouver des e e e tests et nous fournirons ensuite des outils permettant dvaluer ces tests. e

1.1

Test du ratio des vraisemblances

Cette mthode est tr`s gnrale, presque toujours applicable et a galement lavantage e e e e e dtre optimale dans certains cas. Elle est relie aux estimateurs ` vraisemblance e e a maximale, et donc cest une mthode qui peut tre applique lorsquil est possible e e e dobtenir ces estimateurs. Dnition 1. La statistique du test du ratio des vraisemblances utilise dans le but e e de confronter les hypoth`ses H0 : 0 et H1 : c est e 0 (x) = sup0 L(|x) L(0 |x) = , sup L(|x) L(|x)

STT3700

Cours 3

o` est lEVM et 0 est lEVM lorsque lespace param`tre est restreint ` 0 . u e a Le test du ratio des vraisemblances est un test dont la rgion de rejet prend la forme e {x : (x) c}, o` 0 c 1. u Dans un contexte discret, le numrateur du test peut tre vu comme la probabie e lit maximum de lchantillon x si lhypoth`se H0 est vraie. Le dnominateur est la e e e e probabilit maximum de lchantillon, peu importe quelle hypoth`se est vraie. Par e e e consquent, sil existe une trop grande dirence entre ces deux quantits, cest-`-dire e e e a si le ratio est petit, alors lalternative est plus probable que lhypoth`se nulle et donc e H0 devrait tre rejete. Des mthodes an de slectionner c, le seuil de rejet, seront e e e e discutes plus loin. e Notons cependant quan de dterminer la valeur de c pour laquelle lerreur de e type I (cest-`-dire P (rejeter H0 |H0 vraie)) est une certaine valeur spcie , il faut a e e conna la distribution de la statistique (X) (soit exactement, soit de mani`re aptre e proximative). Parfois, (X) est fonction dune autre statistique, disons T (X), dont on conna la distribution et qui peut tre utilise comme statistique de test. t e e Exemple 2. En classe. Exemple 3. En classe. Comme le test du ratio des vraisemblances est bas sur la fonction de vraisemblance, e il est quivalent de travailler avec lchantillon X ou avec toute statistique exhaustive e e T (X). Thor`me 4. Si T (X) est une statistique exhaustive pour et que (t) et (x) sont e e les ratios de vraisemblance respectivement bass sur T et X, alors (T (x)) = (x) e pour tout x dans lespace chantillonnal X . e Dmonstration. En classe. e Exemple 5. En classe.

STT3700 Exemple 6. En classe. Exemple 7. En classe.

Cours 3

1.2

Tests baysiens e

Sous lapproche baysienne, est considr comme une variable alatoire et linfore ee e mation disponible sur avant dobtenir lchantillon est rsume dans la distribution e e e a priori (). Pour faire une infrence sur , nous utilisons donc la distribution la plus ` e a jour possible, soit la distribution ` postriori (|x). ` a e En particulier, nous pouvons utiliser (|x) pour calculer les probabilits que H0 et e H1 soient respectivement vraies : P (H0 est vraie |x) = P ( 0 |x) P (H1 est vraie |x) = P ( c |x) 0 En statistique classique, ces probabilits nont pas de signication puisque est consie dr comme tant une valeur xe mais inconnue. ee e Une mthode utilise an de prendre une dcision dans un contexte baysien est e e e e daccepter H0 si P ( 0 |x) P ( c |x). La statistique de test ` calculer est a 0 e donc P ( c |x) et la rgion de rejet est {x : P ( c |x) > 1/2} puisque 0 0 P ( 0 |x) + P ( c |x) = P ( |x) = 1. 0 Cette mthode de tester une hypoth`se peut tre vue comme une r`gle de dcision : e e e e e 0 si P ( c |x) 1/2 0 (x) = , 1 si P ( c |x) > 1/2
0

o` 0 signie accepter H0 et 1 signie accepter H1 . u

STT3700

Cours 3

Cette r`gle de dcision est en fait lestimateur de Bayes obtenu avec la fonction de e e perte 0-1 : 0, 1, si (x) = 0 et H0 est vraie ou si (x) = 1 et H1 est vraie . sinon

L(, (x) =

Autrement dit, on attribue une erreur de 1 lorsque lon prend la mauvaise dcision. e Les erreurs de type I et II sont donc pnalises de la mme mani`re (cest-`-dire e e e e a P (rejeter H0 |H0 vraie) et P (ne pas rejeter H0 |H0 fausse) respectivement). Il est galement possible de considrer des fonction de perte plus labores (par e e e e exemple, une fonction de perte o` les erreurs de type I et II sont pnalises de u e e mani`re dirente) et dobtenir dirents estimateurs de Bayes dans un contexte e e e de test dhypoth`se. Si le statisticien souhaite se protger contre le fait de rejeter e e faussement H0 (erreur de type I), il pourrait par exemple choisir la rgion de rejet e {x : P ( c |x) > 0.99}. Cela revient a considrer une nouvelle fonction de perte, ` e 0 soit la fonction de perte 0 1 c 0, L(, (x) = c, 1, : si (x) = 0 et H0 est vraie ou si (x) = 1 et H1 est vraie si (x) = 1 et H0 est vraie si (x) = 0 et H1 est vraie
c }. 1+c

La rgion de rejet pour cette fonction de perte est alors {x : P ( c |x) > e 0

En ajustant c, on peut dcider de limportance quon attribue a un type derreur e ` relativement a lautre. ` Exemple 8. En classe. Exemple 9. En classe.

STT3700

Cours 3

1.3

Tests union-intersection et intersection-union

Lorsque H0 a une forme complexe, il est parfois possible de scinder lhypoth`se nulle e en plusieurs tests plus simples. Dans la mthode union-intersection, lhypoth`se nulle satisfait : e e H0 :

Il est possible de scinder cette hypoth`se nulle en plusieurs hypoth`ses plus simples e e e de la forme H0, : contre H1, : c . Si la rgion de rejet du test H0, est de la forme {x : T (x) R }, alors la rgion de rejet du test H0 est e {x : T (x) R } .

Exemple 10. En classe. De mani`re similaire, une hypoth`se nulle de la forme e e H0 :

nous m`ne ` un test de type intersection-union. e a En utilisant la mme notation que pour la mthode union-intersection, la rgion de e e e rejet du test H0 devient {x : T (x) R } .

Exemple 11. En classe.

1.4

Probabilit des erreurs et fonction de puissance e

Dans un contexte de test dhypoth`se, il est videmment possible de se tromper et de e e prendre la mauvaise dcision. Supposons que H0 : 0 contre H1 : c et que e 0 la rgion de rejet est R. Il existe deux types derreurs possibles : e

STT3700

Cours 3

Erreur de type I : H0 est vraie, cest-`-dire 0 , mais le test dcide de rejeter a e H0 . Cette erreur survient avec probabilit P (x R) lorsque 0 . e e Erreur de type II : H1 est vraie, cest-`-dire c , mais le test dcide daccepter a 0 H0 . Cette erreur survient avec probabilit P (x Rc ) = 1P (x R) lorsque c . e 0 Dnition 12. La fonction de puissance dun test dhypoth`se avec rgion de rejet e e e R est la fonction de dnie par () = P (X R). e Un bon test aura une fonction de puissance proche de 0 lorsque 0 et proche de 1 lorsque c . 0 Il arrive souvent que la fonction de puissance dun test dpende de la taille chane e tillonnale n. Dans certains contextes, il est donc possible de xer lerreur de type I tolre et de contrler lerreur de type II en augmentant la taille chantillonnale. ee o e Cependant, pour une taille chantillonnale xe, il faut habituellement faire des come promis entre les deux types derreurs. En tentant de diminuer lerreur de type I, nous prenons le risque daugmenter lerreur de type II et vice versa. Exemple 13. En classe. Exemple 14. En classe. Une mthode populaire est de contrler lerreur de type I a un certain niveau et, e o ` tant donn cette contrainte, de chercher le test pour lequel lerreur de type II est e e aussi petite que possible. Dnition 15. Pour 0 1, un test avec fonction de puissance () est un test e de niveau si sup0 () . Le niveau dun test est donc la probabilit maximale dune erreur de type I. e Lorsque lon dcide de contrler lerreur de type I en choisissant le niveau du test de e o mani`re approprie, il faut se rappeler que lerreur de type II nest pas contrle. Par e e oe

STT3700

Cours 3

consquent, il est conseill de poser les hypoth`ses H0 et H1 de faon a ce quil soit e e e c ` plus important de contrler lerreur de type I que lerreur de type II. Par exemple, il o est commun de placer lhypoth`se que lon esp`re vrier dans lalternative H1 . De e e e cette mani`re, comme lerreur de type I est petite, si H0 est rejete, on pourra avoir e e conance que H1 est rellement la bonne hypoth`se. Si H0 nest pas rejete, alors le e e e test nest pas concluant : soit H0 est vraie, ou encore H1 est vraie mais que le test na pas la puissance requise pour le dtecter. e Puisque la dimension de 0 est habituellement plus petite que celle de , cette approche nous prot`ge contre le fait dutiliser des mod`les trop compliqus sans justie e e cation (la probabilit dutiliser un mod`le plus complexe tant dau plus lorsque e e e le mod`le plus simple est valide). Cependant, tout dpendant de la puissance du test, e e cette approche peut nous empcher didentier des mod`les plus complexes qui see e raient appropris. e Exemple 16. En classe. En plus de xer le niveau dun test, dautres caractristiques dun test peuvent aussi e tre dintrt. Par exemple, il est raisonnable de rechercher un test pour lequel il est e ee plus probable de rejeter H0 si c que si 0 . 0 Dnition 17. Un test avec fonction de puissance () est dit sans biais si ( ) e ( ) pour tout c et 0 . 0 Il existe certaines situations pour lesquelles il y a un seul test du ratio des vraisemblances de niveau . Cependant, pour un probl`me donn, il existe habituellement e e plusieurs tests sans biais, plusieurs tests de niveau , plusieurs tests du ratio des vraisemblances, etc. Dans les sections suivantes, nous prsentons dautres mthodes pour e e choisir un test en particulier parmi les tests disponibles. Ces mthodes sont toutes e bases sur la fonction de puissance. e

STT3700

Cours 3

1.5

Tests les plus puissants

Dans la section prcdente, nous nous sommes concentrs sur les tests qui contrlent e e e o lerreur de type I. Par exemple, un test de niveau nous assure que lerreur de type I est au plus pour tout 0 . Dnotons par C lensemble des tests de niveau . e Un bon test faisant partie de cette classe devrait avoir une petite probabilit derreur e de type II ; autrement dit, un bon test devrait avoir une grande fonction de puissance pour c . 0 Dnition 18. Posons C, un ensemble de tests pour confronter H0 : 0 et e H1 : c . Un test faisant partie de la classe C, avec fonction de puissance (), est 0 un test uniformment le plus puissant (UPP) dans C si () () pour tout c e 0 et toute fonction de puissance () dun test faisant partie de la classe C. Lorsque C est lensemble de tous les tests de niveau , le test dcrit dans la dnition e e prcdente est dit un test UPP de niveau . Dans plusieurs situations, un test UPP e e nexiste pas. Lorsquun tel test existe cependant, il peut tre considr comme tant e ee e le meilleur test de la classe C. Le thor`me ci-dessous nous permet didentier les tests UPP lorsque les hypoth`ses e e e sont simples. Thor`me 19 (Lemme de Neyman-Pearson). Confrontons les hypoth`ses H0 : e e e = 0 et H1 : = 1 , o` les fonctions de densit (ou de probabilit) sont respectiveu e e ment f (x|0 ) et f (x|1 ). Utilisons un test avec rgion de rejet R satisfaisant e x R si f (x|1 ) > kf (x|0 ) et x Rc si f (x|1 ) < kf (x|0 ) pour un certain k 0, et = P0 (X R).

STT3700

Cours 3

Alors, un test satisfaisant les conditions prcdentes est un test UPP de niveau . e e

Dmonstration. En classe. e Le lemme de Neyman-Pearson nous dit quun choix optimal de statistique pour confronter H0 : = 0 et H1 : = 1 est T (X) = f (X|1 )/f (X|0 ). Pour un niveau spci, il faut rejeter H0 si T (X) k, o` k est choisi de faon ` ce que le e e u c a niveau du test soit . Cependant, le lemme de Neyman-Pearson ne garantit pas lexistence dun test UPP pour lequel lerreur de type I est gale ` pour tout . Il dit simplement que pour e a un certain choix k, nous obtiendrons un test UPP pour un certain niveau . Exemple 20. En classe. Lorsque la statistique T (X) est continue, alors un test UPP existe pour nimporte quel niveau . Lorsque la statistique T (X) nest pas continue, on peut utiliser un test alatoire an de trouver un test UPP pour lequel lerreur de type I est exactement : e 1 si f (x|1 ) > kf (x|0 ) (X) = c si f (x|1 ) = kf (x|0 ) , 0 si f (x| ) < kf (x| )
1 0

o` k et 0 c 1 sont choisis de faon a ce que E0 [(X)] = . u c ` Exemple 21. En classe. Exemple 22. En classe. Exemple 23. En classe. Nous pouvons relier le lemme de Neyman-Pearson avec le concept de statistique exhaustive.

STT3700

Cours 3

10

Corollaire 24. Confrontons les hypoth`ses H0 : = 0 et H1 : = 1 . Supposons e que T (X) est une statistique exhaustive pour et que les fonctions de densit (ou de e probabilit) de T sont respectivement g(t|0 ) et g(t|1 ). Un test bas sur T avec rgion e e e de rejet S est un test UPP de niveau si t S si g(t|1 ) > kg(t|0 ) et t S c si g(t|1 ) < kg(t|0 ) pour un certain k 0, o` u = P0 (T S). Dmonstration. En classe. e Le lemme de Neyman-Pearson permet didentier un test UPP de niveau lorsque les hypoth`ses sont simples. Ce contexte est rarement applicable en pratique et il est e plus courant de travailler avec des hypoth`ses composes. Dans ce cas, un test UPP e e est un test qui doit tre le plus puissant pour chaque c . Malheureusement, les e 0 tests UPP existent seulement pour certains types de probl`mes. Par exemple, pour e tester H0 : = 0 contre H1 : = 0

les tests UPP nexistent gnralement pas. Pour obtenir un test UPP, un test doit tre e e e le plus puissant pour tester H0 : = 0 contre H1 : = 1 pour tout 1 = 0 . Puisque la forme dun test le plus puissant di`re gnralement lorsque 1 > 0 ou 1 < 0 , les e e e tests UPP nexistent gnralement pas dans le cas dhypoth`ses bilatrales. e e e e Exemple 25. En classe. Exemple 26. En classe.

STT3700

Cours 3

11

` A partir des exemples prcdents, il est possible de dduire certaines conditions ne e e e cessaires pour obtenir un test UPP. De faon gnrale, nous devrons travailler avec c e e un param`tre unidimensionnel ainsi que des hypoth`ses unilatrales. Considrons les e e e e hypoth`ses suivantes : e H0 : 0 contre H1 : > 0 .

Il est possible, mais non garanti, quun test UPP de niveau existe pour ces hypoth`ses. Pour trouver une condition susante qui nous garantirait lexistence dun e test UPP pour H0 contre H1 , nous introduisons le concept de ratio de vraisemblances monotone pour une famille de densits {f (x; ) : }. e Dnition 27. Une famille de fonctions de densit (ou fonctions de probabilit) e e e {g(t|) : } pour une variable alatoire univarie T avec param`tre unidimensione e e nel poss`de un ratio de vraisemblances monotone (RVM) si, pour chaque 2 > 1 , e g(t|2 )/g(t|1 ) est une fonction monotone (non-croissante ou non-dcroissante) de t e sur {t : g(t|1 ) > 0 ou g(t|2 ) > 0}. Notons que c/0 est dni comme si c > 0. e Exemple 28. En classe. Il est possible dutiliser le lemme de Neyman-Pearson pour trouver des tests UPP dans le cadre dhypoth`ses unilatrales, lorsque la famille de densits considre poss`de e e e ee e un RVM. Thor`me 29 (Karlin-Rubin). Confrontons les hypoth`ses H0 : 0 et H1 : e e e > 0 . Supposons que T (X) est une statistique exhaustive pour et que la famille de fonctions de densit (ou fonctions de probabilit) {g(t|) : } poss`de un RVM e e e non-dcroissant. Alors, pour tout t0 , le test qui rejette H0 si et seulement si T > t0 e est un test UPP de niveau , o` = P0 (T > t0 ). u Dmonstration. En classe. e

STT3700

Cours 3

12

Un rsultat similaire peut tre prouv pour confronter les hypoth`ses H0 : 0 et e e e e H1 : < 0 . Dans ce cas, sous les hypoth`ses du thor`me de Karlin-Rubin, le test e e e qui rejette H0 si et seulement si T < t0 est un test UPP de niveau = P0 (T < t0 ). Finalement, des rsultats similaires peuvent galement tre prouvs dans le cas de e e e e ratios de vraisemblances monotones non-croissants. Exemple 30. En classe. Exemple 31. En classe. Dans plusieurs situations, il nexiste pas de test UPP de niveau . En fait, il arrive frquemment que la classe des tests de niveau soit si grande quaucun test ne domine e tous les autres. Dans ce cas, il est possible de restreindre la classe de tests qui nous intressent en ne considrant que les tests de niveau qui sont sans biais. Un test e e e sans biais est un test pour lequel la fonction de puissance pour c est suprieure 0 au niveau du test. Parfois, il nexiste pas de test sans biais. Lorsque les tests sans biais existent, nous pouvons tenter de trouver un test UPP sans biais (UPPSB). Confrontons les hypoth`ses H0 : = 0 et H1 : = 0 au niveau . Il pourrait tre e e possible de construire un test UPPSB en combinant les tests UPP lorsque H0 : 0 et H0 : 0 . Nous nabordons pas en profondeur la mani`re de trouver des tests UPPSB, mais nous e illustrons le principe avec un exemple. Exemple 32. En classe.

1.6

Niveau de signication

Jusqu` prsent, nous avons travaill avec un niveau xe pour les tests dhypoth`ses. a e e e Autrement dit, tant donn , nous dnissons une fonction de test ; ensuite, tant e e e e donn lchantillon X = x, nous rejetons lhypoth`se nulle au niveau si (x) = 1. e e e

STT3700

Cours 3

13

Le niveau est une information importante puisquil nous dit ` quel point la dcision a e est convaincante. Une mthode alternative de divulguer les rsultats est de fournir le e e niveau de signication du test. Pour ce faire, nous considrons une famille de fonctions de test pour 0 < < 1, e o` la fonction de test poss`de un niveau . Supposons que ces fonctions de test u e satisfont 1 (x) = 1 2 (x) = 1 pour tout 1 < 2 . Le niveau de signication observ est alors e p(x) = inf{ : (x) = 1} Le degr de signication observ est donc la plus petite valeur pour laquelle lhypoe e th`se nulle serait rejete tant donn lchantillon X = x. Cette valeur nous indique e e e e e a quel point notre chantillon contredit notre hypoth`se nulle. Elle permet galement ` e e e a direntes personnes de prendre une dcision selon le niveau de leur choix. ` e e Exemple 33. En classe. Exemple 34. En classe.