Vous êtes sur la page 1sur 6

BTS DOMOTIQUE

Statistiques infrentielles : tests dhypothse

2008-2010

Statistiques infrentielles : tests dhypothse

Table des matires


I Tests dhypothse I.1 Test bilatral relatif une moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.2 Test unilatral relatif une moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I.3 Test unilatral relatifs une frquence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 4 5 5 6

II Test de comparaison II.1 Comparaison de deux moyennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . II.2 Comparaison de deux frquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Pour remplir des paquets de farine de 10 kg, on utilise une ensacheuse rgle avec prcision, mais on ne peut esprer que tous les paquets sortant de la machine psent exactement 10 kg. On peut seulement exiger que lesprance mathmatique des masses de tous les paquets produits soit de 10 kg. Ainsi, une palette de 50 paquets psera par exemple 497 kg. Doit-on en conclure que la machine est mal rgle ? Si, aprs avoir rgl diremment la machine, une nouvelle palette de50 paquets pse 502 kg, peut-on en conclure que la machine est mieux rgle ? Ce sont les tests de validit dhypothse qui permettent de prendre une dcision. Ces dcisions seront prises avec un certain risque a priori. Dans tout ce chapitre, les notions seront abordes grce des exemples. Pour chaque test, on appliquera le cheminement suivant : Construction du test de validit dhypothse. tape 1 : dtermination de la variable alatoire de dcision et de ses paramtres, tape 2 : choix des deux hypothses : lhypothse nulle Ho et lhypothse alternative Hl , tape 3 : lhypothse nulle tant considre comme vraie et compte tenu de lhypothse alternative, dtermination de la zone critique selon le niveau de risque donn, tape 4 : rdaction dune rgle de dcision. Utilisation du test dhypothse. tape 5 : calcul des caractristiques dun chantillon particulier puis application de la rgle de dcision.
http://mathematiques.daval.free.fr -1-

BTS DOMOTIQUE

Statistiques infrentielles : tests dhypothse

2008-2010

I
I.1

Tests dhypothse
Test bilatral relatif une moyenne

Exemple 1 Une machine produit des rondelles dont lpaisseur est une variable alatoire X dcart type 0, 3 mm. La machine a t rgle pour obtenir des paisseurs de 5 mm. Un contrle portant sur un chantillon de 100 rondelles a donn 5, 07 mm comme moyenne des paisseurs de ces 100 rondelles. Peut-on armer que la machine est bien rgle au seuil de risque de 5% ?

1. Variable alatoire de dcision. Soit m lesprance mathmatique de X, cest--dire la moyenne des paisseurs de toutes les rondelles produites par la machine ainsi rgle. Considrons la variable alatoire M qui, chaque chantillon de taille 100, associe sa moyenne. 0, 3 La taille des chantillons tant susamment grande, on considre que M suit la loi N m; , cest--dire 100 N (m; 0, 03). M sera la variable alatoire de dcision. 2. Choix des hypothses. On estime que la machine est bien rgle, si la moyenne de toutes les rondelles produites par la machine est 5 mm. Cest donc lhypothse m = 5 que nous allons tester. On lappelle lhypothse nulle H0 . Sinon, on choisit comme hypothse alternative lhypothse H1 : m = 5 . Recherchons comment la moyenne me , dun chantillon de 100 rondelles peut conrmer ou non lhypothse H0 . 3. Zone critique. Dons le cas o lhypothse H0 est vraie, la variable alatoire M suit la loi N (5; 0, 03). On cherche alors le rel d tel que P (5 d M 5 + d) = 0, 95. (E) M 5 la variable alatoire T = suit la loi normale centre rduite N (0, 1), on a alors : 0, 03 d d (E) P (5 d 0, 03T + 5 5 + d) = 0, 95 P T = 0, 95 0, 03 0, 03 d d (E) 2 1 = 0, 95 = 0, 975 0, 03 0, 03 d On trouve alors = 1, 96 soit d = 0, 0588 0, 06. 0, 03 Lintervalle de conance est donc lintervalle : [5 0, 06; 5 + 0, 06] = [4, 94; 5, 06]. zone critique hypothse H0 accepte zone critique

0, 025 4, 94

0, 95 5

0, 025 5, 06

d d La probabilit quun chantillon ait une moyenne situe hors de cet intervalle tant 0, 05, on peut considrer que cet vnement est rare. Ainsi, la moyenne de notre chantillon me = 5, 07 nous amne douter de la validit de lhypothse H0 . Ne perdons pas de point de vue quil se peut, malgr tout, que la machine soit bien rgle et que notre chantillon fasse partie des 5% de ceux ayant une moyenne hors de lintervalle trouv. Cest pourquoi cette rgion est appele zone critique. 4. Rgle de dcision. Si la moyenne de lchantillon nest pas situe dans la zone critique, on accepte H0 , sinon, on refuse H0 et on accepte H1 . 5. Conclusion. Puisque 5, 07 appartient la zone critique, on dcide de rejeter lhypothse H0 et daccepter lhypothse alternative Hl : m = 5 (la machine nest pas bien rgle). Dans un test de validit dhypothse, le seuil de risque est la probabilit de rejeter H0 alors quelle est vraie.
http://mathematiques.daval.free.fr -2-

BTS DOMOTIQUE

Statistiques infrentielles : tests dhypothse

2008-2010

I.2

Test unilatral relatif une moyenne

Exemple 2 La dure de vie (en heures) des ampoules lectriques produites par une usine est une variable alatoire X dcart type 120. Le fabricant annonce quen moyenne, les ampoules ont une dure de vie de 1120 heures. On demande de rdiger une rgle de dcision pour vrier larmation du fabriquant, au seuil de risque de de 5%, en testant un chantillon de 36 ampoules.

1. Variable alatoire de dcision. Soit m lesprance mathmatique de X, cest--dire la moyenne des dure de vie de toutes les ampoules produites par lusine. Considrons la variable alatoire M qui, chaque chantillon de 36 ampoules associe la moyenne de dure de vie des 36 ampoules. 120 La taille des chantillons tant susamment grande, on considre que M suit la loi N m; , cest--dire 36 N (m; 20). 2. Choix des hypothses. Soit lhypothse nulle H0 : m = 1120 (larmation du fabricant est vraie). Dans lexemple prcdent, les rondelles devaient avoir une paisseur moyenne de 5 mm et cette mesure ne supportait ni excs, ni dcit. Ici, lacheteur ne se plaindra que si la dure de vie des ampoules est infrieure 1120 heures ; dans le cas o la moyenne me , de lchantillon est suprieure 1 120, lhypothse du fabricant se trouve immdiatement conrme. Lhypothse alternative Hl est donc m < 1120 (larmation du fabricant est fausse). 3. Zone critique. La zone critique se trouve donc dun seul ct de la moyenne. On dit alors que le test est unilatral par opposition au test bilatral eectu au paragraphe prcdent. Dans le cas o hypothse H0 est vraie, la variable alatoire M suit la loi N (1120; 20) On cherche alors le rel d tel que P (M < 1120 d) = 0, 05. (E) M 1120 la variable alatoire T = suit la loi normale centre rduite N (0, 1), on a alors : 20 d (E) P (20T + 1120 < 1120 d) = 0, 05 P T < = 0, 05 20 d d d (E) P T > = 0, 05 1 P T = 0, 05 = 0, 95 20 20 20 d On trouve alors = 1, 645 soit d = 32, 9 33. 20 La zone critique est donc lintervalle ] ; 1120 33] =] ; 1087]. zone critique au seuil de 5% hypothse H0 accepte

0, 95 0, 05 1087 d La zone critique est lintervalle ] ; 1087[ : 5% seulement des chantillons de taille 36 ont en moyenne une dure de vie infrieure 1087 heures. 4. Rgle de dcision. Si la moyenne me de lchantillon observ est infrieure 1087, on rejette lhypothse H0 et on accepte lhypothse alternative H1 (larmation du fabricant est fausse). Si la moyenne me de lchantillon observ est suprieure 1087, on accepte lhypothse H0 . 1120

http://mathematiques.daval.free.fr

-3-

BTS DOMOTIQUE

Statistiques infrentielles : tests dhypothse

2008-2010

I.3

Test unilatral relatifs une frquence

On donne ici un exemple de test unilatral relatif une frquence, mais dautres cas peuvent amener envisager des tests bilatraux relatifs une frquence.
Exemple 3 un joueur qui doit choisir au hasard une carte dans un jeu de 32 cartes obtient certains avantages sil dcouvre un roi. On constate quil a retourn 134 fois un roi sur 800 essais. Peut-on prsumer, au seuil de risque de 1%, que ce joueur est un tricheur ?

1. Variable alatoire de dcision. Soit p la frquence de rois que le joueur dcouvrirait sil jouait une innit de fois. Soit F la variable alatoire qui, chaque chantillon de 800 essais, associe la frquence dapparition du roi. La p(1 p) taille des chantillons tant susamment grande, on considre que F suit la loi N p; . F sera la 800 variable alatoire de dcision. 4 = 0, 125. 32 Donc, lhypothse nulle H0 est p = 0, 125 (le joueur nest pas un tricheur). Si p < 0, 125, on considrera que le joueur nest pas un tricheur non plus, donc : lhypothse alternative H1 est p > 0, 125 (le joueur est un tricheur). 3. Zone critique. 0, 125 0, 875 soit Dans le cas o lhypothse H0 est vraie, la variable alatoire F suit la loi N 0, 125; 800 N (0, 125; 0, 0117). On cherche alors le rel d tel que P (F > 0, 125 + d) = 0, 01. (E) F 0, 125 la variable alatoire T = suit la loi normale centre rduite N (0, 1), on a alors : 0, 0117 d (E) P (0, 0117T + 0, 125 > 0, 125 + d) = 0, 01 P T > = 0, 01 0, 0117 d d (E) 1 P T = 0, 01 = 0, 99 0, 0117 0, 0117 d On trouve alors = 2, 33 soit d = 0, 027261 0, 027. 0, 0117 La zone critique est donc lintervalle [0, 125 + 0, 027; +[= [0, 152; +[. Si le joueur nest pas un tricheur, la valeur de p est hypothse H0 accepte zone critique au seuil de 1% 2. Choix des hypothses.

0, 99 0, 01 0, 125 d Donc la zone critique est ]0, 152; +[. 4. Rgle de dcision. Si la frquence de lchantillon est suprieure 0, 152, on rejette lhypothse H0 et on accepte lhypothse H1 : lhypothse H0 nest pas valide. Si la frquence de lchantillon est infrieure 0, 152, on accepte lhypothse H0 : lhypothse H0 est valide. 5. Conclusion. 134 Lchantillon observ a une frquence gale = 0, 1675. 800 Daprs la rgle de dcision, puisque 0, 1675 > 0, 152, on accepte lhypothse H1 : on dcide que le joueur est un tricheur.
http://mathematiques.daval.free.fr -4-

0, 152

BTS DOMOTIQUE

Statistiques infrentielles : tests dhypothse

2008-2010

II
II.1

Test de comparaison
Comparaison de deux moyennes

Exemple 4 Une entreprise fabrique des sacs en plastique pour dchets. An de surveiller la production, elle eectue des contrles rguliers portant sur le poids maximum que les sacs peuvent supporter. une premire date t1 , le contrle de 100 sacs a donn une moyenne de 58 kg et un cart type de 3 kg. la seconde date t2 , le contrle de 150 sacs a donn une moyenne de 56 kg et un cart type de 5 kg. Peut-on considrer, au risque de 4%, que la qualit des sacs a volu entre les deux dates ?

1. Variable alatoire de dcision. Appelons E1 (resp. E2 ) lensemble de tous les sacs produits par lentreprise la date t1 (resp. t2 ). Soit M1 la variable alatoire qui, chaque chantillon de 100 sacs issus de la population E1 , associe sa moyenne. 100 . Une estimation ponctuelle de la moyenne et de lcart-type de la date t1 est : m1 = 58, et 1 = 3 99 1 1 La taille des chantillons tant susamment grande, M1 suit la loi N m1 ; = N 58; . 100 11 Soit M2 la variable alatoire qui, chaque chantillon de 150 sacs issus de la population E2 , associe sa moyenne. 150 Une estimation ponctuelle de la moyenne et de lcart-type la date t2 est : m2 = 56, et 2 = 5 . 149 5 2 = N 56; . La taille des chantillons tant susamment grande, M2 suit la loi N m2 ; 150 149 La variable alatoire D = M1 M2 suit galement une loi normale de paramtres : E(D) = E(M1 ) E(M2 ) = m1 m2 . 1 25 V (D) = V (M1 ) + V (M2 ) = + = 0, 2587. Do D = 0, 51. 11 149 Donc D suit la loi N (m1 m2 ; 0, 51). D est la variable alatoire de dcision. 2. Choix des hypothses. Lhypothse nulle H0 est m1 = m2 (la qualit na pas volu). Lhypothse alternative H1 est m1 = m2 (la qualit a volu). 3. Zone critique. Supposons que lhypothse H0 soit vraie, on a alors m1 m2 = 0 ; alors D suit la loi normale N (0; 0, 51). On cherche alors le rel d tel que P (d D d) = 0, 95. (E) D la variable alatoire T = suit la loi normale centre rduite N (0, 1), on a alors : 0, 51 d d (E) P (d < 0, 51T < d) = 0, 96 P T = 0, 96 0, 51 0, 51 d d d (E) 2 1 = 0, 96 = 0, 98. On trouve alors = 2, 05 soit d = 1, 0455 1, 05. 0, 51 0, 51 0, 51 Pour un seuil de risque de 4%, la zone critique est : ] ; 1, 05 [ ] 1, 05 ; +[. zone critique hypothse H0 accepte zone critique

d 4. Rgle de dcision. Si la dirence des moyennes des deux chantillons est infrieure 1, 05 ou suprieure 1, 05, alors lhypothse H0 , nest pas valide. Si la dirence des moyennes des deux chantillons est comprise entre 1, 05 et 1, 05,lhypothse H0 est valide. 5. Conclusion. La dirence des moyennes des deux chantillons est 58 56 = 2. Daprs la rgle de dcision, on rejette H0 et on dcide que la qualit des sacs a volu entre les dates t1 et t2 .

0, 02 1, 05

0, 96 0 d

0, 02 1, 05

http://mathematiques.daval.free.fr

-5-

BTS DOMOTIQUE

Statistiques infrentielles : tests dhypothse

2008-2010

II.2

Comparaison de deux frquences

Exemple 5 A lissue dun examen, il y a 23 reus et 17 ajourns dans une classe et 15 reus et 25 ajourns dans une autre classe. La dirence observe entre les deux pourcentages de russite est-elle signicative dune dirence de niveau entre les deux classes, au seuil de 5%

1. Variable alatoire de dcision. On suppose que la premire classe est issue dune population C1 pour laquelle la frquence de succs est p1 , et que la deuxime classe est issue dune population C2 pour laquelle la frquence de succs est p2 . Soit F1 la variable qui, chaque chantillon de 40 lves de la population C1 , associe sa frquence de succs. p1 (1 p1 ) . La taille des chantillons tant susamment grande, on considre que F1 , suit la loi N p1 ; 40 Une estimation ponctuelle de la frquence et de lcart-type pour la population C1 est : 23 40 0, 545(1 0, 545) p1 = = 0, 545, et 1 = = 0, 079. Donc, F1 suit la loi N (p1 ; 0, 079). 40 39 40 Soit F2 la variable qui, chaque chantillon de 40 lves de la population C2 , associe sa frquence de succs. p2 (1 p2 ) . La taille des chantillons tant susamment grande, on considre que F2 , suit la loi N p2 ; 40 Une estimation ponctuelle de la frquence et de lcart-type pour la population C2 est : 15 40 0, 375(1 0, 375) p1 2 = = 0, 375, et 2 = = 0, 078. Donc, F2 suit la loi N (p2 ; 0, 078). 40 39 40 La variable alatoire D = F1 F2 suit galement une loi normale de paramtres : E(D) = E(F1 ) E(F2 ) = p1 p2 . V (D) = V (F1 ) + V (F2 ) = 0, 0772 + 0, 0782. Do D = 0, 11. Donc D suit la loi N (p1 p2 ; 0, 11). D est la variable alatoire de dcision. 2. Choix des hypothses. Lhypothse nulle H0 est p1 = p2 (les deux populations ont le mme niveau), lhypothse alternative H1 est p1 = p2 (les deux populations nont pas le mme niveau). 3. Zone critique. Supposons que lhypothse H0 soit vraie, on a alors p1 p2 = 0 ; alors D suit la loi normale N (0; 0, 11). On cherche alors le rel d tel que P (d D d) = 0, 95. (E) D suit la loi normale centre rduite N (0, 1), on a alors : la variable alatoire T = 0, 11 d d (E) P (d < 0, 11T < d) = 0, 95 P T = 0, 95 0, 11 0, 11 d d d (E) 2 1 = 0, 95 = 0, 975. On trouve alors = 1, 96 soit d = 0, 2156 0, 22. 0, 11 0, 11 0, 11 Pour un seuil de risque de 5%, la zone critique est : ] ; 0, 22[]0, 22; +[. zone critique hypothse H0 accepte zone critique

d d 4. Rgle de dcision. Si la dirence des moyennes des deux chantillons est infrieure 0, 22 ou suprieure 0, 22, alors lhypothse H0 nest pas valide. Sinon, lhypothse H0 est valide. 5. Conclusion. 23 15 La dirence des frquences de succs des deux chantillons est = 0, 2. 40 40 Daprs la rgle de dcision, on en conclut quau seuil de risque de 5%, la dirence observe entre les deux chantillons nest pas signicative dune dirence de niveau entre les deux classes. (lhypothse H0 est valide).

0, 025 0, 22

0, 95 0

0, 025 0, 22

http://mathematiques.daval.free.fr

-6-