Vous êtes sur la page 1sur 17

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

Universit de Picardie Jules Verne UFR des Sciences

2011-2012

Licence mention Mathmatiques et mention Informatique parcours MIAGE - Semestre 3 Statistique et Probabilits

Estimation, intervalle de confiance, test statistique (suite) Cas dune ou de deux moyennes, dune ou de deux variances
1. Introduction
On sintresse ltude dun caractre (quantitatif ou qualitatif) des N individus dune population. Pour chacun des individus de la population, le caractre peut a priori prendre des valeurs alatoirement diffrentes. Ainsi, le caractre peut tre reprsenter par une variable alatoire X. Lorsque le caractre est quantitatif (taille des individus,...), X sera une variable alatoire gale aux valeurs du caractre ; on supposera en gnral que X est une variable alatoire desprance mathmatique (moyenne) , dcart-type , et ventuellement de loi normale. Lorsquon na pas accs lensemble de la population, on procde un chantillonnage, i.e. au choix de n individus dans la population, sur lesquels on observe la valeur x du caractre X. On aura ainsi un chantillon X 1 , X 2 , . . . , X n est un chantillon de taille n de X ; pour tout i 1, . . . , n, la variable alatoire X i correspond aux valeurs du caractre du i-me individu obtenu par chantillonage, et aura donc la mme loi de probabilit que X. De plus, lchantillonnage tant non-exhaustif (tirages avec remise), les variables alatoires X i sont indpendantes. Exemple introductif sur la moyenne On considre un groupe de quatre enfants, Alexis, Benjamin, Cyril et David, dges respectifs 12, 13, 14 et 15 ans. Lorsquon choisit un enfant au hasard dans le groupe, on peut considrer : - X, ge de lenfant, variable alatoire de loi uniforme sur 12, 13, 14, 15 : 1 , de moyenne P X 12 P X 15 13, 5 et dcart-type 1. 25 1. 118 ; 4 Cherchons retrouver ou approcher ces rsultats partir dchantillons non-exhaustifs (avec remise) de taille n 3. Il y en a 4 3 64, ils forment un univers , ensemble des rsultats possibles de lexprience alatoire "choisir un chantillon". On peut munir de la tribu des vnements A P et de lquiprobabilit P sur , A . A chacun des rsultats (chantillons) , on peut associer la moyenne X x des ges de lchantillon. On obtient les rsultats prsents dans le tableau page 2. On dfinit ainsi une variable alatoire X, dont on peut obtenir la loi de probabilit : xi 12, 00 12, 33 12, 67 13, 00 13, 33 13, 67 14, 00 14, 33 14, 67 15, 00 PX xi 1/64 3/64 xi X xi 6/64 10/64 12/64 12/64 10/64 6/64 3/64 1/64 On peut alors calculer : xiP X -E X - Var X x2 iP

13, 5 : on remarque que E X EX . 2 5 EX : on remarque que Var X 12

Var X n .

2. Estimateur - Estimation
2.1. Moyenne et variance dchantillon Considrons un caractre quantitatif reprsent par une variable alatoire X desprance mathmatique , dcart-type , et un chantillon X 1 , X 2 , . . . , X n de taille n de X. n 1 Pour chaque chantillonnage on peut calculer la moyenne observe du caractre x xi , n x 1 n
n i 1 i 1

x i , ... Ces moyennes observes peuvent tre considres comme les valeurs observes de la Xn 1 n
n

variable alatoire X
Stphane Ducay

X i , moyenne dchantillon.
i 1

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

x A, A, A A, A, B A, A, C A, A, D A, B, A A, B, B A, B, C A, B, D A, C, A A, C, B A, C, C A, C, D A, D, A A, D, B A, D, C A, D, D On dmontre que E X 12 12, 33 12, 67 13 12, 33 12, 67 13 13, 33 12, 67 13 13, 33 13, 67 13 13, 33 13, 67 14 B, A, A B, A, B B, A, C B, A, D B, B, A B, B, B B, B, C B, B, D B, C, A B, C, B B, C, C B, C, D B, D, A B, D, B B, D, C B, D, D

x 12, 33 12, 67 13 13, 33 12, 67 13 13, 33 13, 67 13 13, 33 13, 67 14 13, 33 13, 67 14 14, 33 C, A, A C, A, B C, A, C C, A, D C, B, A C, B, B C, B, C C, B, D C, C, A C, C, B C, C, C C, C, D C, D, A C, D, B C, D, C C, D, D

x 12, 67 13 13, 33 13, 67 13 13, 33 13, 67 14 13, 33 13, 67 14 14, 33 13, 67 14 14, 33 14, 67 D, A, A D, A, B D, A, C D, A, D D, B, A D, B, B D, B, C D, B, D D, C, A D, C, B D, C, C D, C, D D, D, A D, D, B D, D, C D, D, D

x 13 13, 33 13, 67 14 13, 33 13, 67 14 14, 33 13, 67 14 14, 33 14, 67 14 14, 33 14, 67 15
2

(on dit que X est un estimateur sans biais de ) et Var X n . n 1 Pour une observation x 1 , x 2 , . . . , x n de lchantillon, on dit que x xi est une estimation n i 1 ponctuelle de . n n 2 2 1 1 De mme, on considre la variance dchantillon S 2 S 2 X X X2 X . i n i n n i 1 i 1 n 1 2 et S 2 est un estimateur avec biais de 2 . On considre alors la variance On a alors E S 2 n n S 2 : on a alors E S 2 2 2 corrige dchantillon S 2 et S 2 . c c c est un estimateur sans biais de n 1 2 Pour une observation x 1 , x 2 , . . . , x n de lchantillon, une estimation ponctuelle de est n 2 n s2 1 s2 avec s 2 x2 x2. c i n n 1 i 1 2.2. Loi de probabilit des estimateurs 30 et X de loi normale N ; X Si est connu (cas peu utile en pratique), alors U suit la loi normale N 0; 1 . n X Si est inconnu, alors T suit la loi de Student n 1 degrs de libert. Sc n Cas dun grand chantillon : n 30 (et X de loi quelconque) X Dans ce cas, U suit approximativement la loi normale N 0; 1 . Sc n Cas dun chantillon gaussien : X de loi normale N ; n 1 S 2 suit la loi de khi deux n 1 degrs de libert. Dans ce cas, Y 2 c 2 Cas dun petit chantillon gaussien : n

Stphane Ducay

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

3. Intervalle de confiance
3.1. Pour une moyenne Considrons un caractre quantitatif reprsent par une variable alatoire X desprance mathmatique , n 1 dcart-type , et un chantillon X 1 , X 2 , . . . , X n de taille n de X. La moyenne dchantillon est X Xi n et la variance corrige dchantillon est S2 c n n 1 S , avec S
2 2

1 n

Xi
i 1

1 n

i 1

X2 i
i 1

X .

3.1.1. Cas dun petit chantillon gaussien : n 30 et X de loi normale N ; 3.1.1.1. Cas connu (peu utile en pratique) X suit la loi normale N 0; 1 . On sait que U n On fixe une valeur 0, 1 . On peut trouver un rel u tel que P u U On a alors 1 P X u X P u X X n n n u P X u P n n u u X X n n u u

(voir table 2).

. (ou au

u , X u est un intervalle de confiance de au niveau 1 n n seuil ). En pratique, on a une observation x de X, do une observation de cet intervalle : i 3.1.1.2. Cas x n u , x n u .

On dit que I

inconnu X On sait que T suit la loi de Student n 1 degrs de libert. Sc n On dtermine alors le rel t tel que P t T t 1 (table 3). On en dduit un intervalle de confiance de au niveau 1 : sc t , x sc t . x i n n 3.1.2. Cas dun grand chantillon : n 30 X suit approximativement la loi normale N 0; 1 . On procde alors comme au On sait que U Sc n 3.1.1.1. en remplaant par s c et on obtient un intervalle de confiance approch de au niveau 1 : s s c c i x u , x u n n 3.2. Pour une variance 2 Considrons un caractre quantitatif reprsent par une variable alatoire X de loi normale N ; , et un chantillon X 1 , X 2 , . . . , X n de taille n de X. La moyenne dchantillon est X et la variance corrige n S2. dchantillon est S 2 c n 1 n 1 S 2 suit la loi de khi deux n 1 degrs de libert. Alors Y 2
2 c

On dtermine alors les rels a et b tels que P Y 2 a 1 et P Y 2 b 2 On a alors 2 n 1 S2 c n 1 S2 b 1 1 P a P P c 2 a b b n 1 S2 c : On en dduit un intervalle de confiance de la variance 2 au niveau 1 n 1 s2 , n 1 s2 . i 2 c c a b

2
2

(table 4). n a 1 S2 c .

Stphane Ducay

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

3.3. Exemple Un chantillon de 30 enfants dune ville donne fourni les tailles suivantss (en cm) : 70 85 93 99 101 105 110 121 138 166 74 85 93 99 102 106 110 125 140 180 79 87 94 99 102 107 114 128 147 180 On peut considrer la situation suivante. Population : les enfants de la ville considre. Caractre : la taille, variable alatoire de moyenne et de variance 2 (cart-type ). Echantillon X 1 , X 2 , . . . , X n de taille n 30 de X. Observation de lchantillon : x 1 , x 2 , . . . , x n 70, 74, 79, . . . , 180 . 1) Estimateurs a) de la moyenne 2) :X 1 n
n n

Xi ;
i 1

b) de la variance

: S2 c

n n 1

S 2 , avec S 2

1 n

X2 i
i 1

X .

Estimations ponctuelles a) de la moyenne b) de la variance et donc s 2 c


2

:x : s2

1 n

xi
i 1 n

1 30

3339

111, 3 ; 111, 3
2

n s2 n 1 c) de lcart-type : s c 3) Intervalle de confiance a) de la moyenne

1 x2 x2 i n i 1 30 790, 54 29 s2 28, 60. c

1 395347 30 817, 80 ;

790, 54 ;

1re mthode : X suppose de loi normale N ; , inconnu X T suit la loi de Student n 1 degrs de libert. Sc n On dtermine le rel t tel que P t T t 1 (table 3). On en dduit un intervalle de confiance de au niveau 1 :i x sc t ; x n sc t n .

On a n 30 et n 1 29. Pour 0, 05 (i.e. 5% , on a t 2, 045, et donc un intervalle de confiance de au niveau 0, 95 (i.e. 95%) est i 100, 6 ; 122, 0 . 2me mthode : grand chantillon (n 30, pas dhypothse sur la loi de X) X U suit approximativement la loi normale N 0; 1 . Sc n On dtermine le rel u tel que P u U u 1 . sc u ; x sc u On en dduit un intervalle de confiance de au niveau 1 :i x n n On a n 30. Pour 0, 05 (i.e. 5% , on a u 1, 96, 101, 1 ; 121, 5 . et donc un intervalle de confiance de au niveau 0, 95 (i.e. 95%) est i b) de la variance 2 : X suppose de loi normale N ; n 1 S 2 suit la loi de khi deux n 1 degrs de libert. Y2 c 2

et P Y 2 b (table 4). 2 n 1 s2 ; n 1 s2 . :i 2 On en dduit un intervalle de confiance de 2 au niveau 1 c c a b On a n 30 et n 1 29. Pour 0, 05 (i.e. 5% , on a a 16, 05 et b 45, 72, et donc un intervalle de confiance de 2 au niveau 0, 95 (i.e. 95%) est i 2 518, 73 ; 1477, 65 . a 1 2
Stphane Ducay

On dtermine alors les rels a et b tels que P Y 2

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

4. Test de conformit
4.1. Pour une moyenne Considrons un caractre quantitatif reprsent par une variable alatoire X desprance mathmatique ,
n

dcart-type , et un chantillon X 1 , X 2 , . . . , X n de taille n de X. La moyenne dchantillon est X


n n

1 n
i 1

Xi

et la variance corrige dchantillon est S 2 c

n n 1

S 2 , avec S 2

1 n
i 1

Xi

1 n
i 1

X2 i

X .

4.1.1. Cas dun petit chantillon gaussien : n 30 et X de loi normale N ; 4.1.1.1. Cas connu (exemple introductif) Il sagit de faire un choix entre plusieurs hypothses possibles sur sans disposer dinformations suffisantes pour que ce choix soit sr. On met en avant deux hypothses privilgies : lhypothse nulle H 0 et lhypothse alternative H 1 . Par exemple, on testera H 0 : 0 contre H 1 : 0 , avec 0 fix arbitrairement. On veut savoir si lon doit rejeter H 0 ou pas. Test (bilatral) de H 0 : 0 contre H 1 : 0. On utilise alors une variable alatoire dont on connait la loi de probabilit lorsque H 0 est vraie. Par X X 0 exemple U , car lorsque H 0 est vraie, on sait que U suit la loi N 0; 1 . n n On fixe une valeur 0, 1 . En gnral, on prend petit, le plus souvent 0, 05, 0, 01, 0, 001. On peut trouver un rel u tel que P u U u 1 . Ce rel u peut tre trouv dans la table 2. On est donc amen comparer la moyenne X de lchantillon la moyenne thorique 0. Lhypothse H 0 signifiera que les diffrences observes sont seulement des aux fluctuations dchantillonnage (i.e. ne sont pas significatives). On ne rejettera pas H 0 si les diffrences observes ne sont pas significatives, cest--dire si U est "petite", ce que lon peut traduire par u U u , cest--dire |U | u . On rejetera donc H 0 si les diffrences observes sont significatives, ce que lon peut traduire par U u ou U u , cest--dire |U | u . Par construction de u , on a P U u PU u , soit encore 2 , i.e. P U u ,u . P |U | u x 0 En pratique, on calcule u et on dcide n u , u , car si H 0 tait vraie, lvnement U u , u aurait une probabilit - de rejeter H 0 si u faible de se raliser ; on pourra dire que la valeur observe x nest pas conforme la valeur thorique 0 mais on ne pourra pas donner de valeur acceptable de ; - de ne pas rejeter H 0 si u u , u , car si H 0 tait vraie, lvnement U u , u aurait une probabilit forte de se raliser ; on pourra dire que la valeur observe x est conforme la valeur thorique 0 et que la valeur 0 ne peut tre rejeter. Attention : dautres valeurs 0 , 0 , ... peuvent galement convenir. Erreurs de dcision. Lorsquon rejette H 0 alors que H 0 est vraie, on commet une erreur. On a donc une probabilit de se tromper : est appele erreur de premire espce. En effet, lorsque H 0 est vraie, on a PU u ,u . Lorsque lon ne rejette pas H 0 alors que H 0 est fausse, on commet une erreur. On a une probabilit de se tromper : est appele erreur de deuxime espce. Cette erreur est difficilement calculable. La plupart du temps, on ne connait pas la loi de U lorsque H 0 est fausse. La valeur 1 est appele la puissance du test. Test (unilatral) de H 0 : 0 contre H 1 : 0. , i.e. P U u 1 , i.e. u On dtermine u tel que P U u que : - si u u , alors on ne peut rejeter H 0 ; - si u u , alors on rejette H 0 avec une probabilit de se tromper.
Stphane Ducay

u 2 , et on dcide

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

4.1.1.2. Cas

inconnu X suit la loi de Student n 1 degrs de libert. On sait que T Sc n On dtermine alors le rel t tel que P t T t 1 (table 3). Test (bilatral) de H 0 : 0 contre H 1 : 0. x 0 On calcule t . On dtermine t tel que P t sc
n

et on dcide que :

- si t - si t

t , t , alors on ne peut rejeter H 0 ; t , t , alors on rejette H 0 avec une probabilit

de se tromper.

Test (unilatral) de H 0 : 0 contre H 1 : 0. On dtermine t tel que P T t 1 , i.e. t t 2 , et on dcide que : - si t t , alors on ne peut rejeter H 0 ; - si t t , alors on rejette H 0 avec une probabilit de se tromper. Test (unilatral) de H 0 : 0 contre H 1 : 0. 1 , i.e. t t2 2 t 2 , et on dcide que : On dtermine t tel que P T t - si t t , alors on ne peut rejeter H 0 ; - si t t , alors on rejette H 0 avec une probabilit de se tromper. 4.1.2. Cas dun grand chantillon : n 30 X On sait que U suit approximativement la loi normale N 0; 1 . Sc n Test (bilatral) de H 0 : 0 contre H 1 : 0. x 0 On calcule u U u 1 s c . On dtermine u tel que P u

, et on dcide que :

n - si u u , u , alors on ne peut rejeter H 0 ; - si u u , u , alors on rejette H 0 avec une probabilit de se tromper. Test (unilatral) de H 0 : 0 contre H 1 : 0. 1 1 , i.e. u 1 u 2 , et on dcide que : On dtermine u tel que P U u - si u u , alors on ne peut rejeter H 0 ; - si u u , alors on rejette H 0 avec une probabilit de se tromper. Test (unilatral) de H 0 : 0 contre H 1 : 0. 1 On dtermine u tel que P U u 1 , i.e. u u2 2 - si u u , alors on ne peut rejeter H 0 ; - si u u , alors on rejette H 0 avec une probabilit de se tromper.

u 2 , et on dcide que :

4.1.3. Exemple Dans une usine du secteur de lagroalimentaire, une machine embouteiller est alimente par un rservoir deau et par une file dapprovisionnement en bouteilles vides. Pour contrler le bon fonctionnement de la machine, on veut construire un test dhypothse bilatral qui sera mis en oeuvre toutes les heures. Pour une production dune heure, on suppose que la variable alatoire X qui toute bouteille, prise au hasard dans cette production, associe le volume deau (en litres) quelle contient, est une variable alatoire desprance et dcart-type inconnus. On considre que la machine est bien rgle lorsque le volume deau moyen dans une bouteille est 1, 5 l. On a prlev un chantillon de 100 bouteilles, et on a obtenu un volume deau moyen de 1,495 l et un cart-type corrig de 0, 01. Peut-on conclure, au risque 5%, que la machine est bien rgle ? On peut considrer la situation suivante.
Stphane Ducay

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

Population : bouteilles produites Variable X : volume deau, variable alatoire de moyenne et dcart-type Echantillon E X 1 , X 2 , . . . , X n de taille n 100 de X. Observation de lchantillon : e x1, x2, . . . , xn . n n 1 n 1 2 2 2 2 X de et S S de , avec S X2 Estimateurs X i c i n n 1 n i 1 i 1 Estimations ponctuelles : x 1, 495 et s c 0, 01.

0, 01.

X .

On a n 100 30 donc un grand chantillon. On effectue un test (bilatral) de H 0 : 0 contre H 1 : 0. X On sait que U suit approximativement la loi normale N 0; 1 . Sc n x 1, 495 1, 5 0 5. On calcule u sc 0, 01 n 100 On dtermine u tel que P u U u 1 (table 2) : pour 0, 05, on trouve u 1; 96. u , u , on rejette H 0 avec une probabilit de se tromper : la machine nest pas bien Comme u rgle. 4.2. Pour une variance 2 Considrons un caractre quantitatif reprsent par une variable alatoire X de loi normale N ; chantillon X 1 , X 2 , . . . , X n de taille n de X. La moyenne dchantillon est X et la variance corrige n S2. dchantillon est S 2 c n 1 n 1 S 2 suit la loi de khi deux n 1 degrs de libert. Alors Y 2
2 c 2 2 2 Test (bilatral) de H 0 : 2 0 contre H 1 : 0. n 1 2 2 On calcule y s c . On dtermine a et b tels que P Y 2 2 0 2 2

, et un

a
2

(table 4). On a donc P Y a ,b Pa Y b 1 et P Y - si y 2 a , b , alors on ne peut rejeter H 0 ; - si y 2 a , b , alors on rejette H 0 avec une probabilit de se tromper.
2 2 2 Test (unilatral) de H 0 : 2 0 contre H 1 : 0. 2 On dtermine b tel que P Y b , i.e. b b 2 et on dcide que : - si y 2 b , alors on ne peut rejeter H 0 ; - si y 2 b , alors on rejette H 0 avec une probabilit de se tromper.

2 a ,b

et P Y 2

2 . On dcide que :

2 2 2 Test (unilatral) de H 0 : 2 0 contre H 1 : 0. 2 On dtermine a tel que P Y a 1 , i.e. a a 2 et on dcide que : 2 - si y a , alors on ne peut rejeter H 0 ; - si y 2 a , alors on rejette H 0 avec une probabilit de se tromper.

Stphane Ducay

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

5. Test dhomognit
Dans deux populations P 1 et P 2 , on tudie un mme caractre. On cherche comparer les deux populations quant ce caractre, et donc savoir si elles sont homognes ou pas. 5.1. Comparaison de deux variances Soient X 1 et X 2 des variables alatoires reprsentant le caractre dans chaque population, de moyennes respectives 1 et 2 , dcart-types respectifs 1 et 2 . De P 1 et P 2 on extrait un chantillon E1 X 1,1 , X 1,2 , . . . , X 1,n 1 de taille n 1 de X 1 et un chantillon E 2 X 2,1 , X 2,2 , . . . , X 2,n 2 de taille n 2 de X 2 . Les moyennes dchantillon sont alors X 1 dchantillon S2 c,1 n1 n1 1 S2 1 et S2 c,2 n2 n2 1 1 n1 S2 2,
n1

X 1,i et X 2
i 1

1 n2
n1

n2

X 2,i , et les variances corriges


i 1

avec

S2 1

1 n1

X2 1,i
i 1

X 1 et

S2 2

1 n2

n2

X2 2,i
i 1

X2 .

5.1.1. Cas dchantillons indpendants Les chantillons E 1 et E 2 sont supposs indpendants. On suppose de plus que X 1 et X 2 suivent les lois normales N 1 ; 1 et N 2 ; 2 .
2 contre H 1 : 2 1 2. 2 S c,1 suit la loi de Sndcor n 1 1, n 2 1 degrs de libert. Sous lhypothse H 0 , F S2 c,2 s2 c,1 On calcule f . Si ncesaire, on permute les chantillons de sorte que f 1. On dtermine f tel que s2 c,2 PF f (table 5 ou 6), et on dcide que : 2 - si f f , alors on ne peut rejeter H 0 ; - si f f , alors on rejette H 0 avec une probabilit de se tromper.

Test de H 0 :

2 1

2 2

5.1.2. Cas dchantillons apparis Deux chantillons E 1 et E 2 sont dits apparis lorsque chaque observation x 1,i de E 1 est associe une valeur x 2,i de E 2 (apparis associs par paires). Cest par exemple le cas lorsque E 1 et E 2 proviennent dun mme groupe de malades avant et aprs traitement. Deux chantillons apparis ont donc la mme taille n 1 n 2 n. On suppose que E 1 et E 2 sont apparis et que X 1 et X 2 suivent les lois normales N 1 ; 1 et N 2 ; 2 . Test de H 0 :
2 1 2 2

contre H 1 :

2 1

2 2.

Sous lhypothse H 0 , T
2 2 S2 c,1 S c,2

S2 c,1 1 1 s2 c,1
2

S2 c,2
n

n X 1,i

2 X 1 X 2,i 2 X2

suit la loi de Student n

degrs de libert. On calcule t


2 2 s2 c,1 s c,2

i 1 s2 c,2 n

. On dtermine t tel que

P t T - si t - si t

x 1,i x 1 x 2,i x 2 n 1 2 i1 t 1 (table 3), et on dcide que : t , t , alors on ne peut rejeter H 0 ; t , t , alors on rejette H 0 avec une probabilit de se tromper.

Stphane Ducay

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

5.2. Comparaison de deux moyennes 5.2.1. Cas de grands chantillons indpendants On suppose que n 1 30 et n 2 30, et que les chantillons E 1 et E 2 sont indpendants. Test (bilatral) de H 0 : Sous lhypothse H 0 , U
1 2

contre H 1 : 1 2. X1 X2 suit approximativement la loi normale N 0; 1 . Le rsultat


2 1 n1 2 2 2 2 n2

reste valable si on remplace

2 1

et

2 par leurs estimations s 2 c,1 et s c,2 . On calcule u

x1 2 s c,1 n1

x2 s2 c,2 n2

. On

1 dtermine u tel que P u U u 1 , i.e. u 1 (table 2) et on dcide que : 2 - si u u , u , alors on ne peut rejeter H 0 ; u , u , alors on rejette H 0 avec une probabilit de se tromper. - si u

Test (unilatral) de H 0 : 1 2 contre H 1 : 1 On dtermine u tel que P U u 1 , i.e. u - si u u , alors on ne peut rejeter H 0 ; - si u u , alors on rejette H 0 avec une probabilit Test (unilatral) de H 0 : 1 2 contre H 1 : 1 On dtermine u tel que P U u 1 , i.e. u - si u u , alors on ne peut rejeter H 0 ; - si u u , alors on rejette H 0 avec une probabilit

2. 1

u 2 , et on dcide que :

de se tromper.
2. 1

u2

u 2 , et on dcide que :

de se tromper.

5.2.2. Cas de petits chantillons indpendants extraits de populations gaussiennes On suppose que n 1 30 ou n 2 30, et que les chantillons E 1 et E 2 sont indpendants. On suppose de plus que X 1 et X 2 suivent les lois normales N 1 ; 1 et N 2 ; 2 , et que 1 . 2 contre H 1 : 1 2. X X 1 2 Sous lhypothse H 0 , T suit approximativement la loi de Student n 1 n 2 2 1 1 n1 n2 2 2 degrs de libert. Comme on ne connait pas 1 2 , on doit dabord tester lgalit des variances 1 2 2 (paragraphe 2.1.1.). Si cette hypothse est retenue, alors cette valeur commune peut tre estimer par n1 1 s2 n2 1 s2 c,1 c,2 s2 c,1,2 n1 n2 2 x1 x2 On calcule t . On dtermine t tel que P t T t 1 (table 3) et on 1 1 s c,1,2 n1 n2
1 2

Test (bilatral) de H 0 :

dcide que - si t - si t

t , t , alors on ne peut rejeter H 0 ; t , t , alors on rejette H 0 avec une probabilit


2.

de se tromper.

Test (unilatral) de H 0 : 1 2 contre H 1 : 1 On dtermine t tel que P T t 1 , i.e. t - si t t , alors on ne peut rejeter H 0 ; - si t t , alors on rejette H 0 avec une probabilit Test (unilatral) de H 0 : 1 2 contre H 1 : 1 On dtermine t tel que P T t 1 , i.e. t - si t t , alors on ne peut rejeter H 0 ; - si t t , alors on rejette H 0 avec une probabilit
Stphane Ducay

t 2 , et on dcide que : de se tromper.


2. t2 2

t 2 , et on dcide que :

de se tromper. 9

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

5.2.3. Cas de petits chantillons indpendants : test de Mann et Whitney Non trait ici. 5.2.4. Cas de grands chantillons apparis On suppose que n 1 n 2 n 30, et que les chantillons E 1 et E 2 sont apparis. On considre la variable alatoire D X 1 X 2 , dont un chantillon est D 1 , D 2 , . . . , D n , avec n 1 n S2, D i X 1,i X 2,i . Les moyenne et variance corrige dchantillon sont alors D D i et S 2 c,d n n 1 d avec S 2 d 1 n
n1 i 1

D2 i
i 1

D . Dsignons par D S c,d n

la moyenne de D.

Puisque n

30, U

suit approximativement la loi normale N 0; 1 .

Test (bilatral) de H 0 : 1 2 contre H 1 : 1 Ce test est quivalent au test (bilatral) de H 0 : Test (unilatral) de H 0 : 1 2 contre H 1 : 1 Ce test est quivalent au test (unilatral) de H 0 : Test (unilatral) de H 0 : 1 2 contre H 1 : 1 Ce test est quivalent au test (unilatral) de H 0 :

2.

0 contre H 1 :
2. 0 contre H 1 : 2. 0 contre H 1 :

0 (paragraphe 4.1.2.).

0 (paragraphe 4.1.2.).

0 (paragraphe 4.1.2.).

5.2.5. Cas de petits chantillons apparis extraits de populations gaussiennes On suppose que n 1 n 2 n 30, que les chantillons E 1 et E 2 sont apparis et que X 1 et X 2 suivent les lois normales N 1 ; 1 et N 2 ; 2 . D Les notations sont les mmes que dans le paragraphe 5.2.4. Dans ce cas, T suit la loi de Student S c,d n n 1 degrs de libert. On adapte alors les rsultats ci-dessus (paragraphes 5.2.4. et 4.1.1.2.). 5.2.6. Cas de petits chantillons apparis : test de Wilcoxon Non trait ici. 5.3. Exemples 5.3.1. Comparaison de deux moyennes (1) Dans un article de la revue "Biometrica", le biologiste Latter donne la longueur (en mm) des oeufs de Coucou trouvs dans les nids de deux espces doiseaux : 19,8 22,1 21,5 20,9 22,0 21,0 22,3 21,0 - dans des nids de petite taille (Roitelet) : 20,3 20,9 22,0 22,0 20,8 21,2 21,0 - dans des nids de taille plus grande (Fauvette) : 22,0 23,9 20,9 23,8 25,0 24,0 23,8 21,7 22,8 23,1 23,5 23,0 23,0 23,1 On se demande si le Coucou adapte la taille de ses oeufs la taille du nid. On peut considrer la situation suivante. Population 1 : oeufs de Coucou dans des nids de Roitelet. Variable X 1 : la longueur, variable alatoire de moyenne 1 et de variance 2 1. Echantillon E 1 X 1,1 , X 1,2 , . . . , X 1,n 1 de taille n 1 15 de X 1 . Observation de lchantillon : e 1 x 1,1 , x 1,2 , . . . , x 1,n 1 19, 8 , 22, 1 , . . . , 21, 0 .
Stphane Ducay

10

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

Estimateurs X 1

1 n1

n1

X 1,i de
i 1

et S 2 c,1

n1 n1 1

S2 1 de

2 1,

avec S 2 1

1 n1

n1

X2 1,i
i 1

X1 .

Population 2 : oeufs de Coucou dans des nids de Fauvette. Variable X 2 : la longueur, variable alatoire de moyenne 2 et de variance 2 2. Echantillon E 2 X 2,1 , X 2,2 , . . . , X 2,n 2 de taille n 2 14 de X 2 . Observation de lchantillon : e 2 x 2,1 , x 2,2 , . . . , x 2,n 2 22, 0 , 23, 9 , . . . , 23, 1 . n2 n2 2 n 2 S 2 de 2 , avec S 2 1 1 2 X de et S X2 X2 . Estimateurs X 2 2, i 2 c ,2 2 2 2 2,i n2 n2 n2 1
i 1 i 1

1) Estimations ponctuelles a) observation sur lchantillon e 1 de taille n 1 b) observation sur lchantillon e 2 de taille n 2

15 : x 1 14 : x 2

21, 25 et s 2 c,1 23, 11 et s 2 c,2

0, 516 ; 1, 101.

2 2 2 2) Test de H 0 : 2 1 2 contre H 1 : 1 2. Les chantillons E 1 et E 2 sont indpendants et on suppose que X 1 et X 2 suivent les lois normales N 1 ; 1 et N 2 ; 2 . S2 c,1 Sous lhypothse H 0 , F suit la loi de Sndcor n 1 1, n 2 1 degrs de libert. S2 c,2 s2 c,1 Comme f 1, on permute les chantillons. s2 c,2 S2 c,2 suit la loi de Sndcor n 2 1, n 1 1 13, 14 degrs de libert. Sous lhypothse H 0 , F S2 c,1 s2 c,2 On calcule f 2, 14. On dtermine f tel que P F f (table 5 ou 6) : pour 0, 05, 2 s2 c,1 on trouve f compris entre 2, 95 et 3, 15 (table 5). f , on ne peut rejeter H 0 et les variances des deux populations ne sont pas diffrentes Comme f significativement au risque 5%. Pour cette dcision de non-rejet, on ne connait pas la probabilit de se tromper (erreur de deuxime espce).

3) Test (bilatral) de H 0 : 1 2 contre H 1 : 1 2. On a n 1 30 ou n 2 30, et les chantillons E 1 et E 2 sont indpendants. On suppose que X 1 et X 2 suivent les lois normales N 1 ; 1 et N 2 ; 2 . On est alors dans le cas de petits chantillons gaussiens indpendants. Daprs le test prcdent, on peut admettre 1 . 2 X1 X2 Sous lhypothse H 0 , T suit approximativement la loi de Student 1 1 n1 n2 n1
2 2 27 degrs de libert. Comme on a retenu 2 peut tre estimer 1 2 , cette valeur commune 2 2 n 1 s n 1 s 1 2 c ,1 c ,2 par s 2 0, 798, et en remplaant par s 2 c,1,2 c,1,2 dans T, on ne modifie pas la loi n1 n2 2 approche de T. x1 x2 On calcule alors t 5, 61. 1 1 s c,1,2 n1 n2

n2

On dtermine t tel que P t T t 1 (table 3) : pour 0, 05, on trouve t 2, 052. Comme t t , t , on rejette H 0 avec une probabilit 0, 05 de se tromper. La taille moyenne des oeufs de Coucou sont diffrentes dans les nids de Roitelet et de Fauvettes. Comme on observe x 1 x 2 , on aurait pu faire le test unilatral de H 0 : 1 2 contre H 1 : 1 2. On dtermine t tel que P U t 1 , i.e. t t2 2 t 2 : pour 0, 05, on trouve t 1, 703. Comme t t , on rejette H 0 avec une probabilit de se tromper. La taille moyenne des oeufs de Coucou dans les nids de Roitelet est infrieure celle dans les nids de Fauvettes. Ainsi, on peut conclure que le Coucou adapte la grosseur de ses oeufs la taille du nid. (Il sagit dun phnomne de mimtisme qui permet aux oeufs de Coucou de passer plus facilement inaperus.)
Stphane Ducay

11

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

5.3.2. Comparaison de deux moyennes (2) Chez un groupe de 10 malades, on exprimente les effets dun traitement destin diminuer la pression artrielle. On observe les rsultats suivants (valeur de la tension artrielle systolique en cm Hg) : sujet n 1 2 3 4 5 6 7 8 9 10 avant traitement 15 18 17 20 21 18 17 15 19 16 aprs traitement 12 16 17 18 17 15 18 14 16 18 On se demande si le traitement une action significative. On peut considrer la situation suivante. Population 1 : malades avant traitement. Variable X 1 : la tension, variable alatoire de moyenne 1 et de variance 2 1. Echantillon E 1 X 1,1 , X 1,2 , . . . , X 1,n 1 de taille n 1 10 de X 1 . Observation de lchantillon : e 1 x 1,1 , x 1,2 , . . . , x 1,n 1 15, 18, . . . , 16 . Population 2 : malades aprs traitement. Variable X 2 : la tension, variable alatoire de moyenne 2 et de variance 2 2. X 2,1 , X 2,2 , . . . , X 2,n 2 de taille n 2 10 de X 2 . Echantillon E 2 Observation de lchantillon : e 2 x 2,1 , x 2,2 , . . . , x 2,n 2 12, 16, . . . , 18 . On a n 1 n 2 n 10 30 et les chantillons E 1 et E 2 sont apparis. On suppose que X 1 et X 2 suivent les lois normales N 1 ; 1 et N 2 ; 2 . On a donc de petits chantillons apparis extraits de populations gaussiennes. On considre la variable alatoire D X 1 X 2 , dont un chantillon est D 1 , D 2 , . . . , D n , avec n 1 n S2, D i X 1,i X 2,i . Les moyenne et variance corrige dchantillon sont alors D D i et S 2 c,d n 1 d n i 1 n1 2 1 avec S 2 D2 D . Dsignons par 1 2 la moyenne de D. i d n i 1 3, 2, 0, 2, 4, 3, 1, 1, 3, 2 , on obtient les A partir de lobservation de lchantillon d 1 , d 2 , . . . , d n 2 estimations d 1, 5 et s c,d 1, 96. Test (unilatral) de H 0 : 1 2 contre H 1 : 1 2. Ce test est quivalent au test (unilatral) de H 0 : 0 contre H 1 : 0 (test de conformit). D suit la loi de Student n 1 degrs de libert. Sous lhypothse H 0 , on sait que T S c,d n d On calcule t 2, 42. s c,d n On dtermine t tel que P T t 1 , i.e. t t 2 (table 3) : pour 0, 05, on trouve t 1, 833. Comme t t , alors on rejette H 0 avec une probabilit de se tromper. On conclut que la tension a dimin aprs le traitement et donc que ce dernier a une action significative.

6. Exercices
Exercice 1. Une usine fabrique des pices mtalliques. Le client rceptionne sa commande. Dans le lot reu, il prlve un chantillon de 20 billes choisies au hasard et avec remise, et mesure les diamtres suivants : 24,7 24,9 25,0 25,0 25,1 25,1 25,1 25,2 25,3 25,4 24,8 24,9 25,0 25,0 25,1 25,1 25,2 25,3 25,3 25,5 1) Prciser la population et le caractre tudis. 2) Expliquer pourquoi on peut considrer que ce caratre est une variable alatoire. Prciser en particulier lexprience alatoire et lespace probabilis permettant cette modlisation. 3) Prciser la taille dchantillon, le(s) estimateur(s) mis en jeu et leur loi. 4) Donner une estimation ponctuelle de la moyenne et de la variance du diamtre.
Stphane Ducay

12

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

Exercice 2. On admet que le taux de cholestrol chez une femme suit une loi normale N ; chantillon de 10 femmes, on a obtenu les taux de cholesttol (en g/l) suivants : 3,0 1,8 2,1 2,7 1,4 1,9 2,2 2,5 1,7 2,0 1) Dterminer une estimation ponctuelle de la moyenne et de lcart-type du taux. 2) Dterminer un intervalle de confiance pour la moyenne du taux au seuil 1%. 3) Dterminer un intervalle de confiance pour lecart-type du taux au seuil 5%.

. Sur un

Exercice 3. Dans la fabrication de comprims effervescents, il est prvu que chaque comprim doit contenir 1625 mg de bicarbonate de sodium. Afin de contrler la fabrication de ces mdicaments, on a prlev un chantillon de 150 comprims, et on a mesur la quantit de bicarbonate de sodium pour chacun deux. On a obtenu les rsultats suivants : Classes Effectifs 1610; 1615 7 1615; 1620 8 1620; 1625 42 1625; 1630 75 1630; 1635 18

1) Dterminer une estimation ponctuelle de la moyenne et de lcart-type de la quantit de bicarbonate de sodium. 2) Dterminer un intervalle de confiance au seuil 5% de la moyenne de la quantit de bicarbonate de sodium. 3) Quelle devrait-tre le taille n de lchantillon pour connatre la quantit moyenne de bicarbonate de sodium 1 mg prs ? Exercice 4. On a mesur, avant et aprs une course de 400 mtres, le pouls (en battements par minute) de 7 tudiants suivants un cours dducation physique : Avant 74 87 77 99 103 81 60 Aprs 83 96 99 110 130 95 74 On suppose que laccroissement du pouls est une variable alatoire de loi normale N ; . Dterminer un intervalle de confiance au niveau 95 % pour la moyenne de laccroissement du pouls. Exercice 5. Le temps (exprim en minutes) mis par une machine A pour fabriquer une pice suit une loi Normale N 48, 5 . La machine A tombant en panne, on fabrique la mme pice avec une machine B. On suppose que le temps de fabrication suit encore une loi Normale de mme cart-type. Pour un chantillon de 25 pices, on a obtenu un temps moyen de fabrication de 51 min. La machine B a-t-elle les mmes performances que la machine A ? Exercice 6. On suppose que chez les femmes non malades, la teneur en hmoglobine du sang (en g pour 100 mL) est une variable alatoire de loi normale de moyenne 14,5 et dcart-type 1,1. Sur un chantillon de 20 femmes, on trouve une teneur moyenne en hmoglobine de 13,8 et un cart-type corrig de 1,2. Au risque de 5%, peut-on conclure que la population de femmes dont est extrait cet chantillon prsente une teneur en hmoglobine normale ? trop faible ? Exercice 7. Le volume dune pipette dun type donn suit une loi normale N ; . Le fabriquant annonce un cart-type 0, 2 l. Pour le vrifier, on pipette 20 fois un liquide. On observe une moyenne de 10 l et un cart-type de 0, 4 l. Tester laffirmation du fabricant. Exercice 8. Des dosages de lacide aspartique total de lurine, en mg/24h, ont t effectus sur deux groupes dadultes rgime alimentaire normal. Les dosages ont donn les rsultats suivants : Hommes Femmes Effectif du groupe Moyenne Ecart-type
Stphane Ducay

53 91, 13 30, 49

48 112, 9 48, 99 13

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

1) Prciser la(les) population(s) et le(s) caractre(s) tudi(s), ainsi que la(les) taille(s) dchantillon. Indiquer le(s) estimations(s) mises en jeu dans la suite. 2) Peut-on considrer, au risque 5%, que les deux populations tudies ont le mme dosage dacide aspartique ? Justifier votre rponse. 3) Si les deux groupes avaient les mmes moyennes et cart-types que dans le tableau ci-dessus, mais ntaient constitus que de 12 hommes et 10 femmes, chacun, pourrait-on encore appliquer la mthode suivie au 2) ? En cas de rponse ngative, indiquer la dmarche suivre. Exercice 9. Sur un groupe de 10 malades, on exprimente les effets dun traitement destin diminuer la pression artrielle. On observe les rsultats suivants (valeurs de la tension artrielle systolique en cm Hg) : Sujet n 1 2 3 4 5 6 7 8 9 10 avant traitement 15 18 17 20 21 18 17 15 19 16 aprs traitement 12 16 17 18 17 15 18 14 16 18 Le traitement a-t-il une action significative, au risque de 5% ? On supposera les populations gaussiennes. Exercice 10. La dure de gestation humaine est en moyenne de 40,5 semaines. 1) Dans une maternit, on a not lge gestationnel de 100 nouveaux-ns successifs. On a observ une moyenne de 38,5 semaines et un cart-type de 5 semaines. On pense que cette maternit est spcialise dans les accouchements prmaturs. Tester cette hypothse au risque 5%. 2) Dans cette mme maternit, les mres des 100 nouveaux-ns suivants ont reu un traitement inhibant les contractions utrines. Pour ces nouveaux-ns, on a observ une moyenne de 39,5 semaines et un cart-type de 4 semaines. Tester lgalit des moyennes des dures de gestation des 2 groupes au risque 2%. Exercice 11. Daprs examen de mars 2011 1) Un fabricant de tlviseurs achte un certain composant lectronique un fournisseur A. Laccord entre le fabricant et le fournisseur stipule que les composants doivent avoir une dure de vie au moins gale 600 heures. Le fabricant reoit un lot important de composants et (ayant des doutes) dcide de tester la dure de vie (en heures) sur un chantillon de 16 composants choisis au hasard dans le lot. Il obtient les rsultats suivants : 565 620 570 525 605 590 590 560 590 575 625 560 550 625 570 515 a) Prciser la population et le caractre tudis. Prciser la taille dchantillon, le(s) estimateur(s) mis en jeu et leur loi. Prciser les hypothses ventuelles faire sur la variable tudie pour connatre la loi des estimateurs. b) Donner une estimation ponctuelle de la moyenne et de lcart-type de la dure de vie dun composant. c) Donner un intervalle de confiance au niveau 95% de la dure de vie moyenne dun composant. Peut-on en dduire que laccord entre le fabricant et le fournisseur nest pas respect ? Expliquer. d) Effectuer un test statistique au risque 5% pour savoir si laccord est respect ou pas. 2) Le fabricant a ralis un autre test de dure de vie sur un chantillon de 16 composants prlevs au hasard dans un lot dun autre fournisseur B annonant une dure de vie plus longue que celle de A. Les rsultats obtenus sur la dure de vie de ces 16 composants donnent une moyenne de 600 h et un cart-type corrig de 30 h. Effectuer le(s) test(s) statistique(s) adquat(s) pour savoir si on peut considrer, au risque 5%, que les composants du fournisseur B ont une dure de vie plus longue que ceux du fournisseur A.

Stphane Ducay

14

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

Stphane Ducay

15

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

Stphane Ducay

16

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Estimation, intervalle de confiance, tests - Moyenne

Stphane Ducay

17

Vous aimerez peut-être aussi