Vous êtes sur la page 1sur 3

Universit de Nice e Dpartement de Mathmatiques e e Option Statistique : Deux autres tests du Khi Deux

Anne 2003-2004 e MP2-MI2

Test dhomognit e e e

Dans une population forme dindividus rpartis en direntes catgories (hommes/femmes, classes e e e e dages, niveaux socio-conomiques, etc...), on observe une variable (eet dun mdicament, prsence dun e e e comportement ` risque, performances ...) et on se demande si ses variations selon les direntes catgories a e e de la population sont simplement dues au uctuations dchantillonnage ou si au contraire elles rv`lent e e e des comportements dirents de la variable dans chacune de ces catgories. Nous allons conclure grace ` e e a un test dhomognit dont nous expliquons tout dabord le principe sur un exemple. e e e

1.1

Un exemple

Dans une universit o` les initiatives pdagogiques direncies sont vivement encourages trois e u e e e e groupes de professeurs ont mis au point trois mthodes direntes dapprentissage des Mathmatiques e e e quon a appliqu ` trois chantillons dtudiants ayant sensiblement le mme niveau initial. A lexamen ea e e e les rsultats furent les suivants : e Observs e Mthode 1 e Mthode 2 e Mthode 3 e sommes Admis 51 38 86 Ajourns e 29 12 34 sommes

Peut-on armer que lune des trois mthodes est plus ecace que les autres en termes de russite ` e e a lexamen ? Pour rpondre ` cette question, on teste lhypoth`se H0 : il ny a pas de dirence signicative e a e e entre les pourcentages de russite de ces trois groupes dtudiants, contre lhypoth`se H1 : une au moins de e e e ces mthodes est signicativement plus ecace que les autres. Pour eectuer ce test on compare le tableau e des eectifs observs ci-dessus au tableau des eectifs thoriques ci-dessous correspondant ` une e e a population, regroupant les trois groupes, qui serait parfaitement homog`ne si H0 tait vrai. Le nombre e e thorique dadmis parmi les tudiants ayant suivi la mthode 1 sera gal ` 56 = 175 80 car il y a un taux e e e e a 250 de russite global de 175/250 = 70% et le nombre total dtudiants ayant suivi la mthode 1 est de 80. e e e Thoriques e Mthode 1 e Mthode 2 e Mthode 3 e sommes Admis 56 Ajourns e sommes 80 50 120 250

175

36 75

On calcule alors le Khi Deux de ces tableaux l c deectifs, not X 2 de la faon suivante : e c
l c

X2 =
i=1 j=1

(34 36)2 (Oij Tij )2 (51 56)2 +...+ = Tij 56 36

2, 51.

Sous des hypoth`ses gnralement satisfaites dans la pratique (chantillons disjoints, slectionns de faon e e e e e e c indpendante et de taille suisante), on peut considrer que la quantit X 2 qui est alatoire (car elle e e e e dpend du choix des chantillons) suit une loi du 2 (dl) ayant un nombre de degr de libert dl gal ` e e e e e a dl = (c 1)(l 1). Pour tout choix dun seuil , on peut construire alors un intervalle dacceptation I() = [0 ; x()], o` u x() est dni par P (X 2 > x()) = . On conclut, au risque (cest-`-dire avec une probabilit de rejet e a e a ` tord de ), que : Si X 2 x(), lhypoth`se H0 doit tre rejete, cest-`-dire que les trois mthodes dapprentissage e e e a e ne peuvent tre considres comme quivalentes. e e e e e a e e Si X 2 < x(), on ne peut pas rejeter lhypoth`se H0 , cest-`-dire que, malgr les dirences de rsultats ` lexamen, les mthodes se valent. e a e

1.2

Exercice 1

1. Sur une feuille de calcul, saisir et complter le tableau des eectifs observs en compltant les e e e sommes. Calculer les taux de russite et dchec pour lensemble de la population. e e 2. Saisir et complter le tableau des eectifs thoriques. e e 3. Confectionner le tableau 2 3 des
(Oij Tij )2 . Tij

4. Calculer le X 2 . Quel est le nombre de degr de libert dl ? e e 5. Calculer x() pour = 0, 05 et pour ce dl. 6. Conclure : indiquer le rsultat de votre test. e 7. Reprendre ce test avec un seuil de 10% cette fois. Votre conclusion est-elle t modie ? ee e 8. Reprendre ce test avec un seuil de 1% cette fois. Votre conclusion est-elle t modie ? ee e

1.3

Exercice 2

Deux parcelles identiques de vignes atteintes de phylloxera ont t traites, la premi`re avec un Traiteee e e ment 1 et la seconde avec un Traitement 2. En vous inspirant de lexercice prcdent tester lhypoth`se e e e H0 : les deux traitements ont le mme eet. e Observs e Traitement 1 Traitement 2 Eradication 280 220 Amlioration e 210 90 Sans eet 110 90

Test dindpendance e

Rappelons que deux variables alatoires X et Y prenant les valeurs {x1 , . . . , xi , . . . , xl } et {y1 , . . . , yj , . . . , yc } e avec les probabilits P(X = xi ) = pi et P(Y = yj ) = qj sont dites indpendantes si et seulement si e e e e P(X = xi , Y = yj ) = P(X = xi )P(Y = yj ) = pi qj . Pour tester lindpendance de deux caract`res, on peut utiliser un test du Khi Deux de la faon suivante : on runit dans un tableau les eectifs Oi,j c e dindividus donnant ` X et Y les valeurs (xi ) et (yj ) et on calcule les eectifs thoriques ` partir de la a e a proportion thorique produit pi qj . Expliquons le principe de ce test sur un exemple. e

2.1

Exemple

On veut savoir si lecacit dun vaccin contre la grippe est indpendante du fait quon ladministre e e a ` des patients de moins de 55 ans ou ` des patients strictement plus ags. Considrons un chantillon A a e e e de personnes vaccines de 55 ans ou moins, et un chantillon B de personnes vaccines de plus de 55 ans. e e e Observs e A B sommes Gripps e 38 72 110 Non-gripps e 82 108 190 sommes 120 180 300

Sous lhypoth`se H0 : les deux caract`res sont indpendants, les proportions conjointes sont : e e e Pr. thoriques e A B Proportions Gripps e 0,15 0,22 0,37 Non-gripps e 0,25 0,38 0,63 Proportions 0,4 0,6 1

Comme la population totale est de 300, on en dduit que les eectifs thoriques sous lhypoth`se H0 sont e e e Eec. thoriques e A B Gripps e 44 ..... Non-gripps e ..... 114

On calcule alors le X 2 de ces chantillons, qui suit une loi du 2 ` (l1)(c1) = 1 degrs de liberts : e a e e (3844)2 (108114)2 2 X = + ... + = 2, 15. Au risque = 10%, lintervalle dacceptation I() = [0 ; x()] 44 114 est I() = [0 ; 2, 71]. Nous voyons donc quici on ne peut pas rejeter H0 : il est bien possible que malgr e les dirences dge, lecacit du vaccin soit la mme. e a e e 2

2.2

Exercice 3
(Oij Tij )2 Tij

1. Retrouver les trois tableaux en ne saisissant que le minimum de dones. e 2. Confectionner le tableau 2 2 des et en dduire le X 2 . e

3. Retrouver la valeur de x() = x(10%) indique. Conclure e 4. Refaire le test au seuil de 5%. Que concluez-vous ?

2.3

Exercice 4

Dans une population de 500 personnes (300 hommes et 200 femmes), on a mesur la tension artrielle e e de chaque individu, ce qui a donn les eectifs suivants : e Eec. observs e Hommes Femmes Hypertension 72 38 Tension normale 192 118 Hypotension 36 44

A-t-on, au risque de 5%, une liaison entre le sexe de lindividu et sa tension artrielle ? e

Vous aimerez peut-être aussi