Vous êtes sur la page 1sur 43

Cours de Tests parametriques

F. Muri-Majoube et P. Cenac
2006-2007
Licence
Ce document est sous licence ALC TYPE 2. Le texte de cette licence est egalement consul-
table en ligne `a ladresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Article 1
La presente licence sadresse `a tout utilisateur de ce document. Un utilisateur est toute
personne qui lit, telecharge ou reproduit ce document.
Article 2
La licence rappelle les droits de lauteur sur son document et les prerogatives quil a entendu
conceder aux utilisateurs. Chaque utilisateur est donc tenu de lire cette licence et den respecter
les termes.
Article 3
La licence accompagne le document de mani`ere intrins`eque. Tout utilisateur qui reproduit le
document et le c`ede `a un tiers est tenu de ceder la licence. La licence simpose alors `a ce tiers,
et ce meme en cas de cessions successives. En outre, cette licence ne peut en aucun cas etre
modiee.
Article 4
Toute concession accordee par lauteur sur ses droits, conformement `a lobjet de lassociation
qui est de promouvoir lenseignement et le partage des connaissances, ne vaut que tant que
lexploitation du document est faite `a titre gratuit. Lutilisation du document dans le cadre
dun enseignement payant ne constitue pas une utilisation `a titre commerciale au sens de la
presente licence. Le recouvrement de sommes correspondant `a des frais de port ou de mise sur
support na pas pour eet dattribuer un caract`ere commercial `a lexploitation du document.
Ces frais ne peuvent en aucun cas exceder les sommes deboursees pour ces services.
Article 5
Lauteur autorise tout utilisateur `a reproduire et representer son oeuvre, sur tout support,
d`es lors que lutilisation, privee ou publique, est non commerciale, et sous reserve du respect
des dispositions de larticle 6. La reproduction partielle du document est autorisee sous reserve
du respect des dispositions de ce meme article.
Article 6
Lutilisateur doit respecter les droits moraux de lauteur : aussi bien la paternite de lauteur
que lintegrite de loeuvre. Ainsi, le nom de lauteur doit toujours etre clairement indique, meme
en cas de reproduction ou representation partielle. En cas de reproduction ou representation
partielle, il devra etre precise quil ne sagit que dun extrait, et reference devra etre faite `a
loeuvre integrale. Aucune modication du document nest autorisee, `a lexception des modi-
cations apportees par lauteur lui-meme.
Article 7
Aucun apport ou actualisation nest autorise pour ce document. Lutilisateur qui desirerait
apporter une precision ou actualiser le document, nest pas autorise `a le faire. Il peut toutefois
soumettre sa proposition `a lauteur, via lassociation, an dobtenir une autorisation. Ainsi,
cette licence nouvre aucun droit `a contribution. De meme, toute traduction est interdite, ou
soumise `a laccord de lauteur.
Article 8
Toute infraction `a la presente licence pourrait constituer une atteinte aux droits de lauteur
sur son oeuvre. Dans tous les cas, le non-respect de la licence sera susceptible de fonder une
action en justice.
Article 9
En cas de litige, la loi francaise sera la seule applicable.
Table des mati`eres
1 Demarche 1
1.1 Objectifs du cours . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Exemple introductif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Cadre general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Description et nature des hypoth`eses . . . . . . . . . . . . . . . . . . . . 8
1.3.2 Erreurs commises, qualite dun test . . . . . . . . . . . . . . . . . . . . . 9
1.4 Construction dun test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 Degre de signication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2 Tests sur les moyennes 15
2.1 Comparaison dune moyenne observee `a une moyenne theorique . . . . . . . . . 15
2.1.1 Grands echantillons de loi quelconque . . . . . . . . . . . . . . . . . . . . 16
2.1.2 Petits echantillons gaussiens . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Comparaison dune proportion observee `a une proportion theorique . . . . . . . 23
2.3 Test degalite dune variance `a une valeur xe . . . . . . . . . . . . . . . . . . . 25
2.3.1 Cas des grands echantillons de loi quelconque . . . . . . . . . . . . . . . 25
2.3.2 Cas des petits echantillons gaussiens . . . . . . . . . . . . . . . . . . . . 26
3 Tests de comparaison 27
3.1 Comparaison de deux moyennes observees . . . . . . . . . . . . . . . . . . . . . 27
3.1.1 Grands echantillons de loi quelconque . . . . . . . . . . . . . . . . . . . . 27
3.1.2 Petits echantillons gaussiens . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Comparaison de deux proportions . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.3 Comparaison de deux variances (cas gaussien) . . . . . . . . . . . . . . . . . . . 35
i
Chapitre 1: Demarche
1.1 Objectifs du cours
Un test statistique est un procede dinference : son but est denoncer des proprietes de la
population en sappuyant sur un echantillon dobservations. A laide dun test, on construit
aussi des intervalles de conance qui expriment le degre dincertitude associe `a une simulation.
Lobjectif du test est de repondre `a des probl`emes decisionnels dans un environnement incertain.
Par exemple, on peut se demander `a partir dun echantillon si la taille des hommes est dierente
de la taille des femmes, si un nouveau medicament est vraiment plus ecace ou encore si
lincidence du cancer du poumon est plus elevee actuellement quil y a vingt ans. On ne dispose
en pratique que dun echantillon soumis aux uctuations pour repondre `a ces questions. Lobjet
des tests statistiques est de distinguer ce qui est plausible de ce qui est trop peu vraisemblable.
Ce cours introduit les concepts necessaires pour developper et appliquer les tests parametri-
ques.
1.2 Exemple introductif
Presentation du probl`eme
On suppose que la teneur en cacao (en grammes par kg) des tablettes dun certain fabricant
est une v.a. X de loi N(600, 75
2
). Le fabricant declare avoir trouve un nouveau procede de
conception qui assure une qualite superieure du chocolat en garantissant une plus grande teneur
en cacao, cest-`a-dire que la teneur en cacao de ses tablettes est une variable aleatoire de loi
N(, 75
2
), avec > 600, disons = 650 pour xer les idees.
On eectue un controle de qualite sur n = 9 tablettes fabriquees avec le nouveau procede, et
les teneurs en cacao (en grammes par kg) sont les suivantes :
580 ; 614 ; 700 ; 590 ; 660 ; 630 ; 640 ; 645 ; 620
Ces donnees, notees x
1
, . . . , x
n
, sont les realisations de n variables aleatoires independantes
(X
1
, . . . , X
n
), de meme loi N(, 75
2
), o` u X
i
represente la teneur en cacao de la i
eme
tablette
testee (1 i n). Lindependance implique labsence dinuence dune variable sur les autres
et le fait que les X
i
aient la meme loi implique en particulier que
E(X
1
) = E(X
2
) = = E(X
n
) =
Var(X
1
) = Var(X
2
) = = Var(X
n
) =
2
= (75)
2
On veut savoir si le fabricant dit la verite, cest-`a-dire determiner laquelle des deux hypoth`eses
est la bonne entre
1
= 600, le nouveau procede nest pas meilleur
= 650, le nouveau procede est meilleur comme le pretend le fabricant.
Pour cela, on va eectuer un test statistique. : on va tester lhypoth`ese
H
0
: = 600 contre H
1
: = 650.
Principe du test
On se place du point de vue du consommateur qui hesite `a opter pour le nouveau procede
qui co ute plus cher. Lexperience doit etre convaincante : il nabandonnera H
0
quen presence de
faits experimentaux contredisant nettement la validite de H
0
. On va etablir une procedure qui
va permettre de conclure quant `a lacceptation ou le rejet de H
0
avec un risque xe `a lavance.
Comment decider ?
La question porte sur lesperance de la variable. Pour prendre en compte les 9 experiences, il
est logique de raisonner `a partir dun estimateur de . On pense de facon naturelle `a lestimateur
empirique

X =
1
n
9

i=1
X
i
, dont on connat la loi sous H
0
(et sous H
1
). On rappelle que

X est un
estimateur sans biais de , E(

X) = (il vise bien en moyenne), et que Var(

X) =

2
n
= 25
2
.
Ceci decoule des proprietes suivantes.
Rappel 1 : Soient Y et Z deux v.a. et soient a et b deux reels, alors
E(aY +bZ) = aE(Y ) +bE(Z) et Var (aY +b) = a
2
Var(Y ).
Si de plus, Y et Z sont independantes, Var (Y +Z) = Var(Y ) + Var(Z).
Vous avez vu (cf. cours destimation) que dune part

X converge en moyenne quadratique vers
et dautre part que

X converge en probabilite vers . Lestimateur

X est donc un estimateur
consistant.
De plus,

X N(, 25
2
) car les X
i
sont independants et de meme loi N(, 75
2
). En eet,
Rappel 2 : Soient Y et Z deux v.a. gaussiennes independantes telles que Y N(
1
,
2
1
) et
Z N(
2
,
2
2
), alors
aY +bZ N
_
a
1
+b
2
, a
2

2
1
+b
2

2
2
_
.
Autrement dit, la somme de deux v.a. gaussiennes independantes est gaussienne, ce qui
setend aux n v.a. X
1
, X
2
, . . . , X
n
, qui sont iid, avec E(X
i
) = et Var(X
i
) =
2
.
Rappel 3 : Soit X
1
, . . . , X
n
un n-echantillon de la loi N(,
2
), alors
n

i=1
X
i
N
_
n, n
2
_
,
soit encore

X =
1
n
n

i=1
X
i
N
_
,

2
n
_
.
2
Ainsi, sous H
0
,

X N
_
600, 25
2
_
, et sous H
1
,

X N(650, 25
2
). On notera

X
H
0
N(600, 25
2
) et

X
H
1
N(650, 25).
Si

X est petit , on choisira H
0
.
Si

X est grand, on rejettera H
0
, pour choisir H
1
.
Le probl`eme est de savoir `a partir de quelle valeur on choisit H
1
plutot que H
0
, i.e. de
determiner la zone de rejet et la zone dacceptation de H
0
, i.e. de determiner le reel c

tel que
si

X c

, on accepte H
0
,
si

X > c

, on rejette H
0
.
Erreurs commises
Lors de la prise de decision, on peut commettre deux erreurs :
Decision H
0
H
1
Realite
H
0
Decision correcte Erreur de premi`ere esp`ece
proba 1 proba
H
1
Erreur de seconde esp`ece Decision correcte
proba proba 1
Lerreur de premi`ere esp`ece est lerreur que lon commet lorsquon rejette H
0
`a tort, cest-
`a-dire lorsquon choisit H
1
alors que H
0
est vraie.
La probabilite de commettre cette erreur, que lon appelle le risque de premi`ere esp`ece,
est notee P(rejeter H
0
`a tort) = P
H
0
(rejeter H
0
). Pour un niveau de test , on impose que
P
H
0
(rejeter H
0
) .
Pour notre exemple, lerreur de premi`ere esp`ece est
= P(rejeter H
0
`a tort) = P
H
0
(rejeter H
0
) = P
H
0
(

X > c

).
Lerreur de deuxi`eme esp`ece est lerreur que lon commet lorsquon accepte H
0
`a tort, cest-
`a-dire lorsquon ne rejette pas H
0
alors quelle est fausse ; la probabilite de commettre cette
erreur, que lon appelle le risque de deuxi`eme esp`ece, est notee erreur, que lon appelle
le risque de deuxi`eme esp`ece, est notee avec
= P(accepter H
0
`a tort) = P
H
1
(accepter H
0
).
Dans notre exemple, lerreur de deuxi`eme esp`ece est
= P
H
1
(

X c

).
3
On introduit une dissymetrie dans ces erreurs. On consid`ere que lerreur de premi`ere esp`ece
est plus grave. On construit le test `a partir de cette erreur. On xe tout dabord le risque de
premi`ere esp`ece , puis on cherche `a minimiser celui de deuxi`eme esp`ece, qui servira `a juger de
la qualite du test construit.
On commence par choisir c

pour que la probabilite de rejeter H


0
`a tort, i.e. de se tromper
en acceptant H
1
, soit petite, par exemple egale `a 0, 05. Autrement dit, on xe c

pour quil y
ait 5 chances sur 100 que, si H
0
est vraie, lechantillon ne donne pas une valeur de

X comprise
dans la zone dacceptation de H
0
. H
0
est donc privilegiee : on veut avant tout controler le risque
de rejeter H
0
`a tort. On est donc pret `a rejeter H
0
si le resultat fait partie dune eventualite
improbable nayant que 5% de chances de se produire.
On cherche donc c

tq
P
H
0
(rejeter H
0
) = P
H
0
(

X > c

) = = 0, 05
(ce seuil c

na que 5% de chances detre depasse). Or pour notre exemple, on a vu que sous


H
0
,

X N(600, 25
2
) et

X 600
25
N(0, 1). Ainsi,
P
H
0
(

X > c

) = P
H
0
_

X 600
25
>
c

600
25
_
= P
_
Y >
c

600
25
_
,
o` u Y N(0, 1). Dans la table de la loi N(0, 1), on lit la valeur
c

600
25
telle que
P
H
0
_
Y >
c

600
25
_
= 0, 05
On trouve
c

600
25
= 1, 645, soit encore c

= 600 + 25 1, 645 = 641, 125.


On en deduit la r`egle de decision suivante :
Si

X 641, 125, on accepte H
0
;
Si

X > 641, 125, on rejette H
0
pour accepter H
1
(avec une proba de 5% de se tromper).
Lensemble {

X > 641, 125} sappelle la zone ou region de rejet de H


0
au niveau 5%, que lon
notera ZR
5%
, et {

X 641, 125} la zone dacceptation de H


0
, notee ZA
5%
, au risque 5%.
Mise en oeuvre : on observe que x = 631 < 641, 125, donc on conserve H
0
: = 600
(au risque 5%).
Attention : accepter H
0
ne signie pas que cette hypoth`ese est vraie mais seulement que
les donnees ne sont pas incompatibles avec H
0
, et que lon na pas de raison susante de lui
preferer H
1
compte-tenu des resultats de lechantillon. Ce nest pas parce quune experience ne
conduit pas au rejet de H
0
, que H
0
est vraie (dautres experiences pourraient la rejeter).
4
On a choisi c

pour que la probabilite de se tromper en rejetant H


0
soit 0, 05. Quelle est
la probabilite de se tromper en acceptant H
0
? Sous H
1
, on a vu que

X N(650, 25
2
) et donc

X 650
25
N(0, 1). On en deduit
P
H1
(accepter H
0
) = P
H1
(

X 641, 125)
= P
H1
_

X 650
25
0, 12
_
= P
H1
_

X 650
25
0, 12
_
= 1 P
H1
_

X 650
25
< 0, 12
_
= 1 0, 5478 = 0, 4522
ce qui est considerable. La forme de ZR

est indiquee par la nature de H


1
mais le seuil c

ne
depend que de H
0
et de , la deuxi`eme erreur nintervient pas. H
0
est privilegiee : on veut
avant tout controler le risque de rejeter H
0
`a tort. On voit donc que les 2 hypoth`eses H
0
et H
1
ne jouent pas le meme role.
La probabilite de rejeter H
0
`a tort est choisie au depart
P
H
0
(rejeter H
0
) = (parfois on a seulement une inegalite )
o` u est le niveau du test.
La probabilite daccepter H
0
`a tort
= P
H
1
(accepter H
0
)
peut donc etre relativement grande. On va chercher `a minimiser cette erreur , ce qui
revient `a maximiser la puissance du test
= P(rejeter H
0
quand elle est fausse) = 1 = P
H
1
(rejeter H
0
).
La puissance mesure laptitude du test `a rejeter une hypoth`ese fausse. Dans notre exemple, la
puissance est
1 = P
H
1
(

X > 641, 125) = 1 0, 4522 = 0, 5478
La puissance du test est dautant plus grande que la duree de vie des ampoules est importante
(on seloigne de H
0
). Le test de niveau 5% a 55 chances sur 100 de detecter une duree de vie
de 650 (ou plus).
Que se passe-til quand le niveau du test varie ?
Si grandit, P
H
0
(rejeter H
0
) grandit, on tol`ere donc une plus grosse probabilite derreur en
acceptant H
1
: on accepte plus facilement H
1
; ainsi diminue, et la puissance augmente.
Si diminue (decrot vers 0), 1 augmente, et la r`egle de decision est plus stricte : on
nabandonne H
0
que dans des cas rarissimes, et on conserve H
0
bien souvent `a tort. A force
de ne pas vouloir abandonner H
0
, on la garde presque tout le temps, ainsi augmente,
et la puissance diminue.
5
Lideal serait davoir un niveau petit, et une grande puissance. Un moyen dy parvenir
est daugmenter le nombre n dobservations (n ).
Nombre dobservations necessaires pour obtenir, `a un niveau xe, une puissance donnee
Pour le niveau = 5% xe, calculons le nombre dobservations necessaires pour avoir une
puissance de 80%. On a
= 0, 05 = P
H
0
(

X c

)
1 = 0, 80 = P
H
1
(

X > c

)
On a vu que sous H
0
,

X N
_
600,
75
2
n
_
et sous H
1
,

X N
_
650,
75
2
n
_
. On en deduit,
= 0, 05 = P
H
0
_
n(

X 600)
75
>

n(c

600)
75
_
= 0, 05 = P
H
0
_
Z >

n
(c

600)
75
_
o` u Z N(0, 1). On lit dans la table de la loi normale N(0, 1),

n(c

40)
75
= 1, 645, soit
c

= 1, 645
75

n
+ 600 . De plus, on a aussi
1 = 0, 80 = P
H
1
_
n(

X 650)
75
>

n(c

650)
75
_
1 = 0, 80 = P
H
1
_
Z >

n
(c

650)
75
_
.
On lit dans la table de la loi normale N(0, 1) que

n(c

650)
75
= 0, 84. En reportant la
valeur de c

du premier encadre, dans cette derni`ere equation, on trouve


0, 84 =

n
_
1, 645
75

n
+ 600 650
_
75
= 1, 645 +

n(600 650)
75
soit

n = (1, 645 + 0, 84)


75
(600 650)
n = (1, 645 + 0, 84)
2
5625
(600 650)
2
= 13, 89
Il faudrait au moins n = 14 observations pour avoir, au niveau 5% une puissance de 80%.
Remarque (Lien avec les intervalles de conance). On a choisi c

tel que P
H
0
(

X > c

) = 0, 05,
cest-`a-dire tel que P
H
0
(

X c

) = 0, 95, soit encore P


H
0
_

X ] , c

]
_
= 0, 95. Lintervalle
I
5%
=] , c

] est un intervalle de conance non symetrique au risque 5% de lestimateur



X,
6
sous lhypoth`ese H
0
( 600). En eet, on a bien P
H
0
(

X I
5%
) = 95%; autrement dit, sous
H
0
, on prend un risque de 5%, lorsquon parie, avant dobserver une realisation de

X, que cette
realisation va tomber dans lintervalle I
5%
. On a bien s ur P
H
0
(

X / I
5%
) = 5%. Ainsi, on peut
formuler la r`egle de decision suivante :
Si

X / I
5%
, on rejette H
0
,
Si

X I
5%
, on accepte H
0
.
Point de vue du fabricant
On se place cette fois du point de vue du fabricant qui hesite `a opter pour H
1
car il ne
gagnera de largent que si son procede est utilise. On reprend donc le meme exemple, mais en
testant cette fois
H
0
: = 650 contre H
1
: = 600.
A nouveau le test est base sur un bon estimateur de , lestimateur empirique

X. Cette fois,
sous H
0
,

X N(650, 25
2
), et sous H
1
on a

X N(600, 25
2
). Contrairement au test precedent,
Si

X est petit, on choisira H
1
,
Si

X est grand, on choisira H
0
.
On en deduit la r`egle de decision,
Si

X < c

, on rejette H
0
,
Si

X c

, on accepte H
0
,
o` u c

est tel que P


H
0
(rejetter H
0
) = P
H
0
(

X < c

) = xe.
Test au niveau 5%
determination de c

: On cherche c

tel que P
H
0
(

X < c

) = 0, 05. Sous H
0
,

X N(650, 25
2
),
et donc

X650
25
N(0, 1). On en deduit
P
H
0
(

X < c

) = P
H
0
_

X 650
25
<
c

650
25
. .
0
_
= P
H
0
_

X 650
25
>
650 c

25
_
(rappelons quune loi gaussienne est symetrique !) Ainsi on obtient
P
H
0
(

X < c

) = 0, 05 1 P
H
0
_

X 650
25

650 c

25
_
= 0, 05
P
H
0
_

X 650
25

650 c

25
_
= 0, 95
On lit sur la table de la loi N(0, 1),
650 c

25
= 1, 645 et ainsi c

= 608, 875.
mise en oeuvre : x = 631 > 608, 75, donc on accepte H
0
; cette fois, on conserve lhypoth`ese
= 650.
Juste avec cet exemple, on voit que les hypoth`eses H
0
et H
1
ne jouent pas un role symetrique ;
il est donc tr`es important de bien choisir les hypoth`eses H
0
et H
1
.
7
1.3 Cadre general
On sinteresse `a une population P au travers dun caract`ere X (qualitatif ou quantitatif).
Souvent la loi de X depend dun (ou plusieurs) param`etre inconnu(s). La statistique inferentielle
permet de transporter les conclusions concernant les resultats dun echantillon (X
1
, , X
n
)
de meme loi que X `a la population enti`ere dont il est issu, en quantiant les erreurs que lon
risque de commettre. Il existe essentiellement deux classes de methodes :
la theorie de lestimation pour estimer un (ou plusieurs) param`etres par un nombre (esti-
mation ponctuelle) ou par un intervalle (estimation par intervalle) ;
la theorie des tests pour emettre et trancher entre deux hypoth`eses au vu des resultats de
lechantillon.
On dispose de n donnees x
1
, , x
n
realisations de n variables aleatoires X
1
, , X
n
. On
va chercher `a tester des hypoth`eses portant sur la loi de probabilite du n-uplet (X
1
, , X
n
)
modelisant les observations. On se placera essentiellement dans le cadre o` u les X
i
sont indepen-
dantes et identiquement distribuees (iid). On eectue un test de H
0
contre H
1
, H
0
et H
1
etant
deux hypoth`eses portant sur la loi de X
1
, X
n
.
La construction dun test va consister `a etablir une r`egle de decision permettant de faire un
choix entre les deux hypoth`eses H
0
et H
1
au vu dun echantillon de meme loi que X.
1.3.1 Description et nature des hypoth`eses
Denition 1. Lhypoth`ese H
0
est appelee hypoth`ese nulle, et lhypoth`ese H
1
est
hypoth`ese alternative.
Choix des hypoth`eses : H
0
est lhypoth`ese privilegiee
Lhypoth`ese H
0
appelee hypoth`ese nulle est celle que lon garde si le resultat de lexperience
nest pas clair. On conserve H
0
sauf si les donnees conduisent `a la rejeter. Quand on accepte
H
0
, on ne prouve pas quelle est vraie ; on accepte de conserver H
0
car on na pas pu ac-
cumule susamment delements materiels contre elle ; les donnees ne sont pas incompatibles
avec H
0
, et lon na pas de raison susante de lui preferer H
1
compte-tenu des resultats de
lechantillon. Ne pas rejetter H
0
, cest acquitter faute de preuve. On nabandonne pas H
0
sans de solides raisons. Lhypoth`ese H
1
contre laquelle on teste H
0
est appelee contre hypoth`ese
ou hypoth`ese alternative.
Analogie Test/Proc`es : tout suspect est presume innocent et laccusation doit apporter la
preuve de sa culpabilite avant de le condamner. Cette preuve doit sappuyer sur des elements
materiels comme le test qui utilise les donnees pour rejeter H
0
.
Selon les cas, on choisit pour lhypoth`ese nulle :
lhypoth`ese quil est le plus grave de rejeter `a tort. On a vu que la probabilite de rejeter H
0
`a tort est choisie aussi petite que lon veut. On choisit donc H
0
et H
1
de telle sorte que le
8
scenario catastrophique soit daccepter H
1
alors que H
0
est vraie : ce scenario le pire a
ainsi une petite probabilite ( est xee) de se realiser.
lhypoth`ese dont on a admis jusqu`a present la validite, H
1
representant la contre hypoth`ese
suggeree par une nouvelle theorie ou une experience recente.
lhypoth`ese qui permet de faire le test (seule hypoth`ese facile `a formuler et sous laquelle
on peut eectuer le calcul de la loi dune variable aleatoire sur laquelle on peut fonder le
test). Cette derni`ere raison, purement technique, est evidemment la moins bonne.
Exemples
1. On veut faire un test pour savoir si un pont va secrouler ou pas. Le scenario le pire est
daccepter que le pont ne secroulera pas alors quen fait il va secrouler. Ainsi, on testera
H
0
: le pont secroule contre H
1
: le pont ne secroule pas.
2. On veut faire un test pour savoir si un medicament a des eets secondaires dangereux ou
pas. Le scenario le pire est daccepter quil ny a pas deets secondaires dangereux, alors
quil y en a. On testera donc H
0
: le medicament a des eets secondaires dangereux
contre H
1
: le medicament na pas deets secondaires dangereux.
Remarque. Le scenario catastrophique depend souvent du point de vue considere.
Revenons `a lexemple introductif. Si le nouveau procede co ute plus cher que lancien, le scenario
catastrophique pour le consommateur est de decider = 650 (le procede le plus cher est utilise)
alors quen fait = 600 (le plus cher nest pas mieux que lancien). Donc, du point de vue du
consommateur, on teste H
0
: = 600 contre H
1
: = 650. Mais si le fabricant qui a invente le
nouveau procede de conception des tablettes gagne une grosse prime si son procede est utilise
dans le commerce, le scenario catastrophique pour lui est que lon accepte = 600 (son procede
nest pas utilise) alors quen fait = 650 (son procede devrait etre utilise). Donc, du point de
vue du fabricant, on teste H
0
: = 600 contre H
1
: = 650.
Comme en general, le test est realise par lexperimentateur pour prouver que H
1
est vraie,
le test est dit signicatif lorsquil permet, une fois realise, de conclure au rejet de H
0
. On
prouve H
1
par le rejet de H
0
.
Les dierents types dhypoth`ese et de test
Il existe plusieurs types dhypoth`eses. Une hypoth`ese est dite parametrique si elle porte sur
la valeur dun ou plusieurs param`etres, sinon elle est dite non parametrique.
Une hypoth`ese est dite simple si elle specie completement la loi de la variable aleatoire
consideree, ou le param`etre considere. Sinon elle est dite multiple.
1.3.2 Erreurs commises, qualite dun test
Lors de la prise de la decision de rejetter ou non lhypoth`ese H
0
, on peut commettre deux
erreurs. Les situations possibles lors de la prise de decision ont dej`a ete resumees dans le tableau
de la section 1.2 de lexemple introductif.
9
La strategie consiste `a xer le niveau du test et `a imposer que le risque de premi`ere esp`ece
soit inferieur `a . On est donc pret `a rejeter H
0
si le resultat fait partie dune eventualite
improbable. Lhypoth`ese H
0
est privilegiee : on veut avant tout controler le risque de rejeter
H
0
`a tort. Une fois le risque de premi`ere esp`ece controle par , on cherchera alors `a minimiser
le risque de deuxi`eme esp`ece , qui sera du coup une fonction de .
Puissance
La qualite dun test est donnee par sa capacite `a separer les deux hypoth`eses H
0
et H
1
. Elle
est mesuree par la puissance du test qui est la probabilite daccepter H
0
quand H
1
est vraie.
Cette puissance est donc donnee par
= P(rejeter H
0
quand elle est fausse) = 1 () = P
H
1
(rejeter H
0
).
La puissance mesure laptitude du test `a rejeter une hypoth`ese fausse. Cest un mesure de
la qualite du test. Pour un niveau xe, on va chercher `a obtenir une grande puissance .
Rien ne dit que conserver H
0
mette `a labri de se tromper. La probabilite daccepter H
0
`a tort
est , et cette probabilite (qui ne se calcule que si lon connat la loi de T
n
sous H
1
) peut etre
tr`es importante, contrairement `a qui est xe aussi petit quon veut `a lavance. Les hypoth`eses
H
0
et H
1
ne jouent donc pas un role symetrique.
1.4 Construction dun test
A partir dobservations x
1
, . . . , x
n
, qui sont les realisations de n variables aleatoires X
1
, . . . , X
n
,
on va chercher `a tester des hypoth`eses de modelisation portant sur la loi de X
1
, . . . , X
n
. Les
dierentes etapes de la construction dun test sont les suivantes.
Description de lhypoth`ese nulle H
0
et de lhypoth`ese alternative. Souvent, la loi
commune des X
i
depend dun (ou plusieurs) param`etre , et H
0
est une assertion concer-
nant . Dans lexemple introductif, la loi des X
i
est une loi normale dependant de deux
param`etres, esperance et variance
2
. Nous avons fait un test portant sur le param`etre
= .
Construction de la statistique de test. Le test est base sur lutilisation dune statis-
tique de test, T
n
, fonction des variables aleatoires X
1
, , X
n
, en general liee `a un estima-
teur. La statistique de test T
n
est une variable aleatoire dont on connat la loi sous H
0
et
qui a un comportement dierent sous H
1
, que sous H
0
(

X dans lexemple precedent). La
decision va porter sur la valeur prise par cette variable aleatoire .
R`egle de decision et forme de la region de rejet. La statistique de test T
n
permet
de construire la region de rejet de H
0
. Intuitivement, on rejette H
0
quand T
n
est loin de
H
0
, vers H
1
. On determine donc la r`egle de decision :
_
si T ZR

alors on rejette H
0
,
si T / ZR

alors on accepte H
0
,
10
o` u ZR

sappelle la region de rejet de H


0
du test de niveau et doit etre telle que
P
H
0
(T ZR

) = P
H
0
(rejeter H
0
) = P(rejeter H
0
`a tort) ,
o` u est le niveau du test xe `a lavance.
On peut egalement formuler la r`egle de decision en terme de zone dacceptation :
_
si T ZA

alors on accepte H
0
si T / ZA

alors on rejette H
0
ZA

sappelle la region dacceptation de H


0
du test de niveau et doit etre telle que
P
H
0
(T ZA

) = 1 .
Mise en uvre du test : calcul exact de la region de rejet et conclusions. Soit t
la realisation de T,
Si t ZR

alors on rejette H
0
. En eet, si H
0
etait vraie, il aurait ete alors tr`es peu pro-
bable dobtenir les resultats que lon a trouves. Les donnees sont en contradiction avec H
0
.
Si t / ZR

alors on accepte H
0
: les donnes ne sont pas en contradiction avec H
0
.
Remarque. Il est necessaire de connatre la loi de la statistique de test T
n
sous H
0
pour pou-
voir calculer lerreur de premi`ere esp`ece et ainsi construire la region de rejet. Il est egalement
necessaire que T
n
ait un comportement dierent sous H
0
et sous H
1
; mais dans de nombreux
cas, on ne connat pas la loi de T
n
sous H
1
, ce qui nempeche pas de construire le test.
Remarque (Lien entre tests et zones de conance). Construire une region de conance I

, au
risque , sous H
0
, pour les realisations de T
n
, revient `a construire un test de H
0
au niveau .
En eet, si I

est une region de conance de risque pour les realisations de T


n
, on a
P
H
0
(T I

) = 1 .
Cest-`a-dire que lon a
P
H
0
(T / I

) = 1 P
H
0
(T I

) = .
On peut donc construire un test de r`egle de decision
_
si T / I

alors on rejette H
0
,
si T I

alors on accepte H
0
.
Dans notre exemple, on a construit un test de
H
0
: = 600 contre H
1
: = 650.
On a montre que lensemble {

X > 641, 125} est une zone de rejet de H


0
au niveau 5%. Lin-
tervalle I
5%
=] ; 641, 125] est un intervalle de conance non symetrique de

X au risque 5%,
sous lhypoth`ese H
0
. Cest-`a-dire que sous H
0
, on prend un risque de 5% lorsquon parie, avant
dobserver une realisation de

X, que cette realisation va tomber dans I
5%
.
11
1.5 Degre de signication
Lorsque le test nest pas signicatif (cest-`a-dire quon ne rejette pas H
0
, on peut se demander
`a quel niveau H
0
serait rejettee. Ce niveau est appele degre de signication ou probabilite
critique (P-value).
Soit t une realisation de la statistique de test T. Le degre de signication mesure la probabilite
dobtenir t sous lhypoth`ese H
0
. Cest une mesure de laccord entre lhypoth`ese testee et le
resultat obtenu. Plus il est proche de 0, plus forte est la contradiction entre H
0
et le resultat
de lechantillon, et plus on rejettera H
0
avec assurance.
Revenons `a lexemple introductif, o` u lon testait H
0
: = 600 contre H
1
: = 650 au niveau
= 5%. La r`egle de decision etait
Si

X > 641, 125, on rejette H
0
pour accepter H
1
,
Si

X 641, 125, on accepte H
0
.
On a observe que x = 631 < 641, 125, donc on accepte H
0
: = 600. Le test nest donc
pas signicatif `a 5%. On peut se demander sil le serait par exemple `a 10%. On peut aussi se
demander dans quelle mesure la moyenne dechantillon observee x = 631 est compatible avec
lhypoth`ese H
0
: = 600, cest `a dire, determiner P
H
0
(

X > 631) (probabilite que, sous H
0
,
la statistique de test

X soit > `a la valeur reellement observee x). Cest ce que lon appelle le
degre de signication
s
. Calculons, pour cet exemple, le degre de signication

s
= P
H
0
(

X > 631) = P
H
0
_

X 600
25
>
631 600
25
_
= P
H
0
_

X 600
25
> 1, 24
_
= 1 P
H
0
_

X 600
25
1, 24
_
= 1 0, 8925 = 0, 1075 11%
Le degre de signication est assez eleve. Cela signie que si la nouvelle conception de tablettes
de chocolat netait pas meilleure (i.e. sous H
0
), les seules uctuations dechantillonage auraient
11 chances sur 100 de conduire `a une valeur de

X aussi grande (> 631). Ici,
s
> et donc
x / ZR

, on accepte H
0
.
En fait, le degre de signication est le plus petit niveau
s
pour lequel le test correspondant
serait signicatif.
Remarque. Le degre de signication ne peut etre calcule quune fois que les observations
ont ete faites : cest le niveau du test obtenu en choisissant la zone de rejet de H
0
la plus
petite possible qui contienne lobservation. Dans notre exemple, cest le niveau du test de
region de rejet {

X > 631}.
Un test est dautant plus signicatif, cest-`a-dire probant en ce qui concerne lalternative
H
1
, que son degre de signication est plus petit.
s
mesure la conviction avec laquelle on
arme que le test est signicatif. Calculer le degre de signication evite le probl`eme de se
xer un risque `a lavance pour eectuer le test.
Beaucoup de logiciels statistiques eectuent automatiquement les tests en donnant le degre
de signication. En fonction du risque choisi, on decide si on accepte ou non H
0
: il sut
de comparer
s
`a : si
s
< on rejette H
0
.
12
Generalement on admet que :
degre de signication signicativite du test
0, 01 <
s
0, 05 signicatif
0, 001 <
s
0, 01 tr`es signicatif

s
0, 001 hautement signicatif
Remarque. Ne pas confondre signicativite avec dimportante distance entre et H
0
. Si le test
est puissant, il peut etre hautement signicatif avec pourtant un ecart faible entre et H
0
. Il
existe aussi des tests non signicatifs avec pourtant une grande distance entre et H
0
. Ce sont
des tests peu puisants.
13
14
Chapitre 2: Tests sur les moyennes
(On parle aussi de tests sur lesperance. On ne se limitera dans ce chapitre quaux tests sur
les moyennes `a un echantillon)
On va sinteresser ici `a un (ou plusieurs) caract`ere quantitatif X dune population P dont
on veut etudier la moyenne (lesperance) E(X)
def
= . On note
2
def
= Var(X). On consid`erera
dans la suite, que lon dispose dune observation (x
1
, , x
n
) constituee des mesures du ca-
ract`ere X faites sur un echantillon : on consid`ere (x
1
, , x
n
) comme la realisation dun
nuplet (X
1
, , X
n
) de variables aleatoires independantes et de meme loi que X. On dira
que (X
1
, , X
n
) est un n-echantillon de (la loi de) X.
2.1 Comparaison dune moyenne observee `a une moyenne theorique
On consid`ere donc un n-echantillon (X
1
, , X
n
) de X desperance E(X
i
) = E(X) = et de
variance Var(X
i
) = Var(X) =
2
.
Faire un test de comparaison dune moyenne observee avec une moyenne theorique revient `a
repondre `a la question suivante. La variable quantitative X a-t-elle une moyenne egale `a une
valeur
0
donnee `a lavance ? Il sagit donc de juger de la pertinence de lhypoth`ese
H
0
: =
0
o` u
0
est la moyenne theorique. La quantite dont on dispose pour pouvoir juger est la realisation
x de la moyenne empirique du n-echantillon de X

X =
1
n
n

i=1
X
i
.

X est un estimateur de . Il est naturel de rejeter H


0
si lecart

X
0
entre
0
et cet estimateur
est trop grand. La diculte est de quantier lecart acceptable d u `a lalea de lestimateur. Il
va sagir de reconnatre un faible ecart d u `a lalea de lestimateur, dun ecart signicatif non
expliquable par les simples uctuations de lestimateur.
Quelle est lalternative qui nous interesse quand H
0
est inacceptable ?
1. Une alternative unilaterale H

1
: >
0
,
2. H

1
: <
0
(alternative unilaterale) ?
3. ou une alternative bilaterale : H
1
: =
0
?
15
Si H
0
est rejetee au prot de
1. H

1
, on rejetera H
0
pour les valeurs trop grandes de

X
0
2. H

1
, on rejetera H
0
pour les valeurs trop petites de

X
0
, ou encore pour les
valeurs trop grandes de
0


X,
3. H
1
, on rejetera H
0
pour les valeurs trop grandes de lecart absolu |

X
0
|.
Quelle est la loi de

X
0
sous H
0
?
En pratique, on va distinguer plusieurs cas :
la variance
2
de X est-elle connue ou inconnue ?
a-ton un grand echantillon (de loi quelconque) pour utiliser le TCL, ou un petit echantillon
de loi normale ?
On rappelle que
Rappel 4 : (Theor`eme Central Limite) Soit X
1
, X
2
, . . . , X
n
un n-echantillon de loi X, desperan-
ce et de variance
2
. On note la moyenne empirique
X
n
=
X
1
+X
2
+ +X
n
n
.
La loi de X
n
, lorsque n est susamment grand, est approximativement une N
_
, n
1

2
_
. Plus
precisement, si lon note
Z
n
=

n
_
X
n

et F
n
(x) la fonction de repartition de Z
n
, alors lim
n
F
n
(x) = F(x), o` u
F(x) =
1

2
_
x

z
2
2
dz est la fonction de repartition de la loi N (0, 1) .
Cest-`a-dire que lon a
lim
n
P
_

n
_
X
n
m
_

< x
_
= P(Z < x) , o` u Z N (0, 1) .
On dit alors que Z
n
converge en loi vers Z, et on note Z
n
L

n
Z.
2.1.1 Grands echantillons de loi quelconque
On consid`ere un n-echantillon (X
1
, . . . , X
n
) de X avec E(X
i
) = , et Var(X
i
) =
2
. On rappelle
(cf. cours destimation) que lestimateur empirique

X
n
est un estimateur consistant de . De
plus, pour un grand echantillon (cest-`a-dire pour n grand), on peut appliquer le TCL et ainsi

n(

X )

N(0, 1).
Sous lhypoth`ese H
0
: =
0
on a alors
T
n
def
=

n(

X
0
)

N(0, 1). (2.1.1)


16
La statistique T
n
ne depend que des observations et des param`etres connus que si est connue.
Sinon, il faudra utiliser une estimation de cet ecart-type an de ne conserver dans la statistique
que des variables connues ou observees.
Cas o` u la variance
2
est connue
Test de H
0
: =
0
contre H
1
: =
0
On consid`ere comme statistique de test la variable T
n
denie en (2.1.1), de sorte que, sous
H
0
,
T
n
N(0, 1).
Sous H
1
, T
n
prend des valeurs plus petites ou plus grandes que sous H
0
. En eet, sous H
1
,
X
n
se comporte en moyenne comme , et =
0
. Ainsi T aura tendance `a prendre des
grandes valeurs positives ou negatives.
Pour un test de niveau (xe par exemple `a 5%), on en deduit la r`egle de decision suivante.
Si T
n
> c

ou T
n
< c

, cest-`a-dire si |T
n
| > c

, on rejette H
0
.
Si c

T
n
c

, cest-`a-dire si |T
n
| c

, on accepte H
0
.
Le seuil c

est tel que P


H
0
(rejeter H
0
) = P
H
0
(|T
n
| > c

) = . On cherche c

tel que
P
H
0
(T
n
c

) = P
H
0
(T
n
> c

) /2. Comme sous H


0
, T
n
N(0, 1), on choisit le
quantile c

tel que P(N(0, 1) c

) = 1 /2.
Mise en oeuvre : on note t
n
=

n(x
n

0
)/ la realisation de T
n
, on rejetera H
0
si
|t
n
| > c

, on acceptera H
0
si |t
n
| c

.
Test de H
0
: =
0
contre H
1
: >
0
Sous H
0
, T
n
N(0, 1), et sous H
1
, T
n
prend des valeurs plus grandes que sous H
0
.
On en deduit la r`egle de decision suivante.
Si T
n
> c

, on rejette H
0
.
Si T
n
c

, on accepte H
0
.
c

est tel que P


H
0
(rejeter H
0
) = P
H
0
(T > c

) = , pour un niveau de test xe.


Mise en oeuvre : on note t
n
=

n( x
0
)/ la realisation de T
n
, on rejetera H
0
si
t
n
> c

.
Test de H
0
: =
0
contre H
1
: <
0
Sous H
0
, T
n
N(0, 1), et sous H
1
, T
n
prend des valeurs plus petites que sous H
0
.
On en deduit la r`egle de decision suivante.
Si T
n
< c

(< 0), on rejette H


0
.
Si T
n
c

, on accepte H
0
.
c

est tel que P


H
0
(rejeter H
0
) = P
H
0
(T < c

) = . Notons que c

est negatif.
Mise en oeuvre : soit t
n
=

n( x
0
)/ la realisation de T
n
. On rejetera H
0
si t
n
< c

.
Remarque. On peut aussi eectuer les tests
H
0
:
0
contre H
1
: >
0
17
ou encore
H
0
:
0
contre H
1
: <
0
.
Pour le premier test, la construction est basee sur le choix de c

tel que P
H
0
(T
n
> c

) =

;
le risque depend de , et sous H
0
, peut prendre toutes les valeurs reelles telles que
0
.
Mais en fait, correspond au risque maximum que lon accepte de prendre en rejetant H
0
`a tort, cest-`a-dire = sup
H
0

. On construira donc nalement la zone de rejet en


utilisant la valeur
0
seule qui correspond au risque le plus eleve. Le niveau du test est
la valeur la plus elevee du risque atteinte en =
0
. On peut donc confondre le niveau
du test (risque maximum) et le risque

qui depend de , car lorsque lon teste des


hypoth`eses simples du type H
0
: =
0
, le risque maximum est atteint en =
0
.
Exemple : Une petite usine fabrique des portes dont la hauteur est une variable aleatoire
desperance = 2.5 m`etres et de variance
2
= 10
4
. Pour verier si ses machines sont
bien reglees, le nouveau directeur de lusine fait mesurer les hauteurs de cents portes tirees
au hasard et observe x
100
= 2.4 m`etres.
Les machines sont-elles bien reglees ? (on prendra comme niveau de test = 5%)
Soit X la hauteur dune porte desperance E(X) = (taille moyenne dune porte) et de
variance Var(X) =
2
= 10
4
. On note X
i
la hauteur de la i
` eme
porte, pour i = 1, . . . , 100.
On a donc E(X
i
) = et Var(X
i
) = 10
4
.
On souhaite donc tester H
0
: = 2, 5 contre H
1
: = 2, 5.
On consid`ere la statistique de test
T
n
=

100(

X
100
2, 5)

10
4
On a vu que sous H
0
, T
n
N(0, 1) dapr`es le TLC.
R`egle de decision :
si |T
n
| > c

on rejette H
0
,
si |T
n
| c

on accepte H
0
,
o` u c

est tel que P


H
0
(|T
n
| > c

) = 0, 05. Pour lire la valeur de c

dans la table de la loi


gaussienne centree reduite, on peut utiliser la symetrie de cette loi :
P
H
0
(|T
n
| > c

) = P
H
0
(T
n
> c

) +P
H
0
(T
n
< c

)
= P
H
0
(T
n
> c

) +P
H
0
(T
n
> c

)
= 2
_
(1 P
H
0
(T
n
c

)
_
P
H
0
(|T
n
| > c

) = P
H
0
(T
n
c

) = 1

2
Dans la table de la N(0, 1), on lit la valeur de c

telle que P
H
0
(T
n
c

) = 1
0,05
2
= 0, 975.
On trouve c

= 1, 96. Donc si |T
n
| > 1, 96 on rejetera H
0
.
Mise en oeuvre : x
n
= 2, 4 et ainsi t
n
= 10(2, 42, 5)/10
2
= 100. On rejette donc H
0
;
18
la dierence est signicative au niveau 5% (les machines sont signicativement mal reglees).
Degre de signication

s
= P
H
0
(|T
n
| > 100) = 2
_
1 P
H
0
(T
n
100)
_
2(1 1) 0
Donc
s
0%. Lecart entre la moyenne observee et la moyenne theorique 2, 5 est signi-
catif `a 0%. Ce qui signie que, si les machines etaient bien reglees (i.e. sous H
0
), les seules
uctuations dechantillonnage nauraient que 0 chances sur 100 de conduire au resultat
observe, cest-`a-dire une moyenne de 2.4 au lieu de 2.5.
Cas o` u la variance
2
est inconnue
Lorsque la variance
2
= Var(X) est inconnue, il faut, comme pour les intervalles de conance,
remplacer
2
par un estimateur (consistant) de
2
.
Test de H
0
: =
0
contre H
1
: =
0
Lorsque
2
est connue, on utilise comme statistique de test T
n
. On peut prendre comme
estimateur de
2
,
S
2
e
=
1
n
n

i=1
(X
i


X)
2
ou S
2
=
1
n 1
n

i=1
(X
i


X)
2
,
ou tout autre estimateur consistant de
2
. On choisit le plus souvent S
2
qui est un estima-
teur sans biais de
2
.
Resultat (admis) : Sous H
0
, U
n
=

n(

X
0
)

S
2
suit approximativement une N(0, 1).
On proc`ede alors de la meme mani`ere que dans le cas o` u
2
est connue.
R`egle de decision :
si |U
n
| > c

, on rejette H
0
,
si |U
n
| c

, on accepte H
0
,
o` u le seuil c

est tel que P


H
0
(rejeter H
0
) = P
H
0
(|U
n
| > c

) = , pour un niveau de
test xe (par exemple `a 5%). Or sous H
0
, U
n
N(0, 1), on cherche donc c

tel que
P(N(0, 1) c

) = 1 /2.
Mise en oeuvre : si u
n
=

n(x
n

0
)/S est la realisation de U
n
, on rejetera H
0
si
|u
n
| > c

et on acceptera H
0
si |u
n
| c

.
Exemple : Le benece mensuel moyen dune succursale dune chane de magasins est egal
`a 300 000. An daugmenter ses marges, cette chane de magasins a decide dadopter une
nouvelle politique de gestion des stocks pour lensemble de ses succursales. On note X
i
la
19
variable aleatoire representant le benece de la i
` eme
succursale. Une etude menee sur 50
succursales a donne les valeurs observees suivantes :
1
50
50

i=1
x
i
= 314 600

_
1
49
50

i=1
(x
i
x
n
)
2
= 25 000
La nouvelle politique est-elle plus ecace que lancienne ?
La loi de X
i
est inconnue ; E(X
i
) = benece mensuel moyen, Var(X
i
) =
2
inconnue.
On teste H
0
: = 300 000 contre H
1
: > 300 000
Sous H
0
, U
50
=

50(X
n
300 000)

S
2
N(0, 1), et sous H
1
, U
50
prend des valeurs plus
grandes que sous H
0
. La r`egle de decision est si u
50
> c

on rejette H
0
, sinon on accepte
H
0
, o` u c

est tel que P


H
0
(U
n
> c

) = 0, 05. On lit dans la table de la loi gaussienne,


c

= 1, 64.
Mise en oeuvre : u
50
=

50(314 600 300 000)/25 000 = 4, 13 > 1, 64, donc le test


est signicatif au niveau 5% : la nouvelle politique est signicativement plus ecace.
Degre de signication :

s
= P
H
0
(U
n
> 4, 13) = 1 P
H
0
(U
n
4, 13) 0
Remarque. Pour les tests de H
0
contre toutes les autres alternatives ( =
0
, <
0
, >
0
),
on proc`ede aussi comme dans le cas o` u la variance est connue, en remplacant cette variance
par un estimateur consistant.
2.1.2 Petits echantillons gaussiens
Lorsque lon a aaire `a des petits echantillons, on ne peut plus appliquer le TLC. Il faut donc
une hypoth`ese supplementaire sur la loi commune des X
i
, pour connatre la loi de T
n
sous H
0
.
On suppose maintenant que lon a un n-echantillon (X
1
, . . . , X
n
) gaussien, X
i
N(,
2
).
Sous H
0
, on connat alors la loi exacte (et non plus une approximation de la loi ) de X
n
et par
consequent de T
n
aussi.
Sous H
0
, T
n
=

n(X
n

0
)

N(0, 1)
A nouveau, T
n
nest utilisable directement comme statistique de tests (cest-`a-dire comme
fonction des observations) que si
2
est connue.
Cas o` u la variance
2
est connue
On utilise la statistique de test T
n
dont la loi exacte sous H
0
est une N(0, 1). La procedure
pour eectuer chacun des tests est alors la meme que precedemment.
20
Exemple : Le PDG dune chane de magasins `a grande surface voudrait savoir sil doit entre-
prendre une campagne publicitaire `a lechelon national pour augmenter la vente de ses produits.
Pour prendre une decision, il fait une campagne publicitaire dans 5 villes et observe les accrois-
sements X
i
de beneces correspondants. On suppose que X
i
N(, 2) o` u = 0 si la campagne
est inecace, et > 0 si la campagne est ecace. Les accroissements de benece observes dans
les 5 villes sont : 1 ; 1, 5 ; 0 ; 1 ; 0, 5.
La campagne est-elle signicativement ecace ? (on fera le test `a 5%).
On teste donc H
0
: = 0 contre H
1
: > 0.
Sous H
0
, T
n
=

5(

X 0)/2 N(0, 1), et sous H
1
, T
n
a tendance `a prendre des valeurs plus
grandes.
R`egle de decision :
Si T
n
> c

, on rejette H
0
,
si T
n
c

on accepte H
0
,
o` u c

est tel que P


H
0
(T
n
> c

) 0, 05. On lit dans la table de la loi gaussienne c

= 1, 64.
Mise en oeuvre : t
n
=

5(0, 8 0)/2 = 0, 89 < 1, 64, donc on accepte H


0
, la campagne
nest pas signicativement ecace.
Degre de signication :

s
= P
H
0
(T
n
> 0, 89) = 1 P
H
0
(T
n
0, 89) = 1 0, 8133 = 0, 1867.
Donc
s
= 18, 67% > = 5%.
Cas o` u la variance
2
est inconnue
On eectue encore le test de H
0
: =
0
contre H
1
: =
0
.
On ne peut plus utiliser la statistique de test precedente puisque
2
est inconnue. On estime
alors
2
par S
2
. Dans le cas dun echantillon gaussien, on sait alors que
U
n
=

n(

X
0
)

S
2

H
0
St(n 1),
o` u St(d) est une loi de Student `a d degres de liberte.
Rappel 5 : Si Y et Z sont deux variables aleatoires independantes telles que Y N(0, 1) et
Z
2
(n), alors
Y
_
Z
n
St(n) (loi de Student `a n degres de liberte).
Rappel 6 : Si Y
1
, . . . , Y
n
sont n variables aleatoires independantes de meme loi N(0, 1), alors
Y =
n

i=1
Y
2
i

2
(n) (Loi du chi deux `a n degres de liberte).
21
Rappel 7 : Soit (X
1
, . . . , X
n
) un n-echantillon gaussien de loi N(, ). Alors
X
n

_
S
2
n
=

n(X
n
)
S
St(n 1) et
(n 1)S
2

2

2
(n 1).
En eet,

n(X
n
)

S
2
=

n 1

n(X
n
)

_
(n 1)
S
2

N(0, 1)
_

2
(n 1)
n 1
.
Nous avons donc (n 1)
S
2

2

2
(n 1) et sous H
0
,

n(X
n

0
)

N(0, 1). Donc sous H


0
,
U
n
=

n(X
n

0
)

S
2
St(n 1).
R`egle de decision :
si |U
n
| > c

, on rejette H
0
,
si |U
n
| c

, on accepte H
0
.
c

est tel que P


H
0
(|U
n
| > c

) = . La valeur du seuil c

se lit cette fois dans la table de la


St(n 1).
On proc`ede de meme pour les autres hypoth`eses alternatives ( <
0
, >
0
, =
1
, ...).
Remarque. Ces resultats sont valables pour nimporte quel echantillon gaussien, quil soit grand
ou petit.
Exemple : On suppose que le taux de cholesterol dun individu est une variable aleatoire X
de loi normale desperance et de variance
2
. Une etude epidemiologique a mis en evidence
que les individus atteints dune maladie C presentent un fort taux de cholesterol de 4 g / litre.
Des medecins decident de sassurer de lecacite dun nouveau medicament M suppose faire
baisser le taux de cholesterol. Pour cela, ils mesurent le taux de cholesterol sur un echantillon
de n = 10 individus atteints de la maladie C, traites par le nouveau medicament M. On observe
les resultats suivants :
10

i=1
x
i
= 37.2 et
10

i=1
x
2
i
= 139.58,
o` u x
i
designe la realisation de la variable aleatoire X
i
representant le taux de cholesterol obtenu
apr`es traitement par le medicament M, du i
` eme
individu teste. Le nouveau medicament M est-il
signicativement ecace ?
On souhaite donc tester H
0
: = 4 contre H
1
: < 4.
Sous H
0
, U
10
=

10(X
n
4)/

S
2
St(9). On verie aisement que U
10
secrit en fonction
des deux estimateurs 10X
10
et

X
2
i
dont on connat les observations,
U
10
=

10(X
n
4)
_
1
9

n
i=1
X
2
i

1
90
(10X
10
)
2
.
22
R`egle de decision :
si U
10
< c

, on rejette H
0
,
si U
10
c

, on accepte H
0
.
c

est tel que P


H
0
(U
10
< c

) = . La valeur du seuil c

se lit cette fois dans la table de la St(9).


Pour un niveau de 5%, on trouve c

= 1, 833.
Mise en oeuvre : u
n
=

10(3, 72 4)/0.36 = 2, 43 < 1.833, donc on rejette H


0
, le
medicament est signicativement ecace.
Degre de signication :

s
= P
H
0
(U
n
< 2, 43) 1 0, 975 = 0, 025.
Donc
s
= 2, 5% < = 5%.
2.2 Comparaison dune proportion observee `a une proportion theorique
On sinteresse cette fois `a une proportion p inconnue dindividus poss`edant un caract`ere X
dans une population P. Par exemple, la proportion dindividus dintentions de votes favorables
`a un candidat. La variable X est denie par {X = 1} si lindividu poss`ede la propriete en
question (dans lexemple, si il est favorable au candidat) et {X = 0} sinon (defavorable). On
a P(X = 1) = p, P(X = 0) = 1 p, et X B(p). On rappelle que pour une loi de Bernoulli
de param`etre p on a E(X) = p et Var(X) = p(1 p). Ce cadre est donc un cas particulier de
test de moyennes avec cette fois un n-echantillon (X
1
, . . . , X
n
) de X de loi B(p), desperance

def
= E(X
i
) = E(X) = p et de variance
2
def
= Var(X
i
) = Var(X) = p(1 p).
On rappelle que la proportion aleatoire dindividus de lechantillon (poss`edant le caract`ere)
notee P
n
= X
n
=
1
n
n

i=1
X
i
est un bon estimateur de la proportion p inconnue dans la popula-
tion.
Test de H
0
: p = p
0
contre H
1
: p = p
0
Le test va etre construit autour de lestimateur P
n
de p, plus exactement `a partir de la
dierence P
n
p
0
. Si on dispose dun echantillon susamment grand (n > 30), on peut
appliquer le theor`eme central limite pour approcher la loi de P par une loi normale :
P
n
N
_
p,
p(1 p)
n
_
,
soit encore

n(P
n
p)
_
p(1 p)
N (0, 1) .
On pourrait estimer la variance p(1 p) par un estimateur consistant (P
n
(1 P
n
) par
exemple) mais cest inutile puisque sous H
0
, p = p
0
, et donc sous H
0
, p(1p) = p
0
(1p
0
).
On construit donc le test `a partir de la statistique de test
T
n
=

n(P
n
p
0
)
_
p
0
(1 p
0
)
23
Et sous H
0
,
T
n

H
0
N (0, 1)
R`egle de decision :
si |T
n
| > c

, on rejette H
0
,
si |T
n
| c

, on accepte H
0
.
Le seuil c

est tel que P


H
0
(|T
n
| > c

) = . La valeur du seuil c

se lit dans la table de la


N (0, 1).
Si on note p
n
la realisation de P
n
sur lechantillon, et t
n
=

n( p p
0
)/
_
p
0
(1 p
0
) celle
de T
n
, on rejetera H
0
si |t
n
| > c

.
On proc`ede de la meme mani`ere pour les autres formes dhypoth`ese alternative H
1
.
Exemple 1 Une machine doit etre mise `a la casse si elle produit strictement plus de 10%
de pi`eces defectueuses. Pour savoir si lon doit remplacer une certaine machine, on prel`eve
au hasard 70 pi`eces fabriquees par cette machine, et on constate que 8 dentre elles sont
defectueuses. On notera p la proportion de pi`eces defectueuses fabriquees par cette macine.
Doit-on acheter une nouvelle machine ? (test `a 5%)
Soit p la proportion de pi`eces defectueuses produites par une machine. On veut tester
lhypoth`ese H
0
: p = 0, 1 contre H
1
: p > 0, 1 (p
0
= 0, 1).
Soit X
i
la v.a. representant letat de la i`eme pi`ece fabriquee par la machine (X
i
= 1 si la
i`eme pi`ece est defectueuse et 0 sinon), X
i
B(p).
p est estimee par P
n
=
n

i=1
X
i
la proportion aleatoire de pi`eces defectueuses de lechantillon.
La taille n = 70 de lechantillon est susamment grande pour appliquer le TCL, et la
statistique de test est
T
n
=

n(P
n
0.1)
_
0.1(1 0.1)

H
0
N (0, 1) .
R`egle de decision :
si T
n
> c

on rejette H
0
,
si T
n
c

on accepte H
0
.
Le seuil c

est tel que P


H
0
(T
n
> c

) = = 5%. Comme T
n

H
0
N (0, 1), on lit c

dans la
table de la N (0, 1) tel que P(N (0, 1) c

) = 1 = 0.95. On trouve c

= 1.645.
Mise en oeuvre : Sur lechantillon, on trouve p
n
= 8/70 = 0, 11 (0.11 est une estimation
ponctuelle de p), et t
n
= 0.398. t
n
< c

donc on accepte H
0
`a 5%. Le test est non signicatif.
Exemple 2 En 2004, 42% des franciliens travaillaient `a plus de 30 kms de leur domicile.
Pour estimer la proportion de franciliens qui, en 2006, travaillent `a plus de 30 kms de
leur domicile, on a eectue un sondage sur 2000 franciliens ; parmi les 2000 personnes
interrogees, 860 dentre elles ont declare travailler `a plus de 30 kms de leur domicile. La
proportion de franciliens travaillant `a plus de 30 kms de leur domicile a-t-elle evolue de
mani`ere signicative entre 2004 et 2006 ?
24
Soit p la proportion de franciliens travaillant `a plus de 30 kms de leur domicile en 2006.
On veut tester H
0
: p = 0, 42 contre H
1
: p = 0, 42.
Exemple 3 En 1990, 38% des parisiens allaient reguli`erement (au moins une fois par
semaine) au cinema. Une enquete realisee en 1997 indique que sur 1000 personnes inter-
rogees, 350 dentre elles vont reguli`erement au cinema. Y a t-il une baisse signicative de
la frequentation des salles de cinema parisiennes entre 1990 et 1997 ?
Soit p la proportion de parisiens allant reguli`erement au cinema en 1997. On veut tester
H
0
: p = 0, 35 contre H
1
: p < 0, 35.
2.3 Test degalite dune variance `a une valeur xe
On consid`ere donc un n-echantillon (X
1
, . . . , X
n
) de X desperance E(X
i
) = E(X) = et de
variance Var(X
i
) = Var(X) =
2
.
On se propose detudier la question : la variable (quantitative) X a-t-elle une variance
Var(X) =
2
egale `a une valeur
2
0
donnee `a lavance ? Pour repondre `a cette question, nous
allons eectuer le test de lhypoth`ese nulle
H
0
:
2
=
2
0
o` u
2
0
est une valeur xee, contre les alternatives
2
>
2
0
,
2
<
2
0
, ou
2
=
2
0
. Ce test est
base sur lestimation de la variance
2
par lestimateur

2
= n
1

n
i=1
(X
i
)
2
, quand est
connue et par lestimateur S
2
= (n 1)
1

n
i=1
(X
i
X
n
)
2
, quand est inconnue. On suppose
dans la suite que E(X
4
i
) existe et est nie. Comme precedemment, nous allons distinguer le cas
des grands echantillons de lois quelconques des petits echantillons gaussiens.
2.3.1 Cas des grands echantillons de loi quelconque
Cas o` u est connue
La variance
2
peut etre estimee par

2
n
=
1
n

n
i=1
(X
i
)
2
. Notons Z
i
def
= (X
i
)
2
. Ainsi,

2
n
secrit en fonction des variables Z
i
puisque

2
n
= Z
n
. De plus, les variables aleatoires Z
i
sont i.i.d., desperance
2
et de variance
4
+E(X
i
)
4
. On peut donc appliquer le Theor`eme
Central Limite aux variables Z
i
et obtenir que

n(

2
n

2
)
_
1
n1

n
i=1
(Z
i
Z
n
)
2
L

n
N(0, 1).
Tester une egalite sur la variance de X
i
revient `a tester une egalite sur la moyenne de Z
i
. On
construit donc le test de la meme facon, `a partir de la statistique de test

n(

2
n

2
)
_
1
n1

n
i=1
(Z
i
Z
n
)
2
.
25
Cas o` u est inconnue
2.3.2 Cas des petits echantillons gaussiens
Cas o` u est connue
La variance
2
peut etre estimee par

2
n
. Notons `a nouveau Z
i
def
= (X
i
)
2
. Les variables
aleatoires Z
i
sont i.i.d. de loi gaussienne N
_

2
,
4
+E(X
i
)
4
_
. Ainsi, on a

n(

2
n

2
)
_
1
n1

n
i=1
(Z
i
Z
n
)
2
St(n 1).
Cas o` u est inconnue
On utilise la statistique de test (n 1)S
2
/
2
0
. En eet, sous H
0
cette statistique suit une loi

2
(n 1).
26
Chapitre 3: Tests de comparaison
Nous avons vu jusqu`a present des test de moyennes (et proportions) `a partir dun echantillon.
On comparait la moyenne dun caract`ere dune population `a une valeur de reference. Nous allons
maintenant eectuer des tests de comparaison de moyennes dun meme caract`ere `a partir de
deux echantillons extraits de deux populations. La generalisation `a plus de deux populations
sera faite dans le cas gaussien dans le cadre du cours de lanalyse de la variance (mod`ele lineaire).
3.1 Comparaison de deux moyennes observees
On dispose de mesures dune meme grandeur sur deux echantillons extraits, independamment,
de deux populations dierentes :
(X
1
, . . . , X
n
1
), deectif n
1
, extrait dune population de moyenne E(X
i
) =
1
et de variance
Var(X
i
) =
2
1
; on note X
n
la moyenne, et S
2
1
la variance de cet echantillon;
(Y
1
, , Y
n
2
), deectif n
2
, extrait dune population de moyenne E(Y
i
) =
2
, et de variance
Var(Y
i
) =
2
2
; on note Y
n
la moyenne, et S
2
2
la variance de cet echantillon;
Probl`eme pose : On se demande si la moyenne de cette grandeur est la meme dans les deux
populations. On veut donc tester
H
0
:
1
=
2
contre lalternative bilaterale H
1
:
1
=
2
,
ou contre lalternative unilaterale H
1
:
1
<
2
,
ou contre lautre lalternative unilaterale H
1
:
1
>
2
.
Par exemple, on sinteresse `a la taille des hommes et des femmes dun pays ; on note
1
la
taille moyenne des femmes et
2
la taille moyenne des hommes. On peut chercher `a tester si la
taille des hommes est signicativement superieure `a celle des femmes, cest-`a-dire H
0
:
1
=
2
contre H
1
:
1
<
2
.
Il est naturel de fonder les tests de H
0
sur lecart X
n
Y
n
entre les moyennes observees des
deux echantillons. Sous lhypoth`ese H
0
, la dierence observee X
n
Y
n
doit avoir une esperance
nulle puisque E(X
n
) E(Y
n
) =
1

2
= 0. Il faut donc connatre la loi de X
n
Y
n
sous H
0
.
On va une nouvelle fois distinguer deux cas : les grands echantillons de loi quelconque, et les
petits echantillons gaussiens.
3.1.1 Grands echantillons de loi quelconque
Si les tailles dechantillons n
1
et n
2
sont grandes, on sait dapr`es le TLC que, approximati-
vement, on a
X
n
N
_

1
,

2
1
n
1
_
et Y
n
N
_

2
,

2
2
n
2
_
.
27
Comme les deux echantillons sont independants, X
n
et Y
n
sont independants et quapproxima-
tivement sous H
0
, on a
X
n
Y
n
N
_
0,

2
1
n
1
+

2
2
n
2
_
,
soit encore,
X
n
Y
n
_

2
1
n
1
+

2
2
n
2
N (0, 1) .
On ne peut utiliser directement cette variable aleatoire comme statistique de test que lorsque
les variances des deux populations sont connues.
Cas o` u les variances
2
1
et
2
2
sont connues
Test de H
0
:
1
=
2
contre H
1
:
1
=
2
La statistique de test est
T
n
=
X
n
Y
n
_

2
1
n
1
+

2
2
n
2
Sous H
0
, T
n
N (0, 1). Sous H
1
, T
n
a tendance `a prendre des valeurs plus petites ou plus
grandes.
R`egle de decision :
si |T
n
| > c

on rejette H
0
,
si |T
n
| c

, on accepte H
0
.
Le seuil c

est tel que P


H
0
(|T
n
| > c

) = , i.e. tel que P


H
0
(T
n
> c

) = /2. La valeur de
c

est lue dans la table de la N (0, 1).


Test de H
0
:
1
=
2
contre H
1
:
1
>
2
Sous H
0
, T
n
=
X
n
Y
n
r

2
1
n
1
+

2
2
n
2
N (0, 1). Sous H
1
, T
n
a tendance a prendre des valeurs plus
grandes.
R`egle de decision :
si T
n
> c

on rejette H
0
,
si T
n
c

, on accepte H
0
,
o` u c

est tel que P


H
0
(T
n
> c

) = .
Test de H
0
:
1
=
2
contre H
1
:
1
<
2
Sous H
0
, T
n
=
X
n
Y
n
r

2
1
n
1
+

2
2
n
2
N (0, 1). Sous H
1
, T
n
a tendance a prendre des valeurs plus
petites.
R`egle de decision :
si T
n
< c

(c

> 0) on rejette H
0
,
si T
n
c

, on accepte H
0
,
o` u c

est tel que P


H
0
(T
n
< c

) = .
28
Cas o` u les variances
2
1
et
2
2
sont inconnues
On remplace respectivement
2
1
et
2
2
par leurs estimateurs consistants et sans biais
S
2
X
=
1
n
1
1
n
1

i=1
(X
i
X
n
)
2
et S
2
Y
=
1
n
2
1
n
2

i=1
(Y
i
Y
n
)
2
.
On utilise alors la statistique de test
T
n
=
X
n
Y
n
_
S
2
X
n
1
+
S
2
Y
n
2
Sous H
0
, T
n
N (0, 1) approximativement, et on proc`ede de meme que precedemment.
Cas o` u les variances
2
1
et
2
2
sont inconnues mais egales
Si les variances sont inconnues mais egales
2
1
=
2
2
=
2
, on estime la valeur commune
2
par
S
2
=
(n
1
1)S
2
X
+ (n
2
1)S
2
Y
n
1
+n
2
2
=
1
n
1
+n
2
2
_
n
1

i=1
(X
i
X
n
)
2
+
n
2

i=1
(Y
i
Y
n
)
2
_
.
On montre facilement que lestimateur obtenu S
2
est sans biais. En eet, S
2
X
est un estimateur
sans biais de
2
1
donc E(S
2
X
) =
2
1
=
2
, et S
2
Y
est sans biais de
2
2
donc E(S
2
Y
) =
2
2
=
2
. On
en deduit que
E(S
2
) =
(n
1
1)E(S
2
X
) + (n
2
1)E(S
2
Y
)
n
1
+n
2
2
=
(n
1
1)
2
+ (n
2
1)
2
n
1
+n
2
2
=
2
On estime alors

2
1
n
1
+

2
2
n
2
=
2
_
1
n
1
+
1
n
2
_
par S
2
_
1
n
1
+
1
n
2
_
et on utilise la statistique de test
T
n
=
X
n
Y
n
_
S
2
_
1
n
1
+
1
n
2
_
.
Sous H
0
, T
n
N (0, 1) approximativement, et on proc`ede de meme que precedemment.
Exemple
Un fabriquant de cables en acier etudie un nouveau traitement de cables pour ameliorer leur
resistance. Il choisit au hasard 200 cables traites et 100 cables non traites. On suppose que la
charge de rupture est une variable aleatoire. On note X
i
la charge de rupture du i`eme cable
traite et Y
i
la charge de rupture du i`eme cable non traite. On observe x
n
= 30, 82, y
n
= 29, 63,
29
1
199
200

i=1
(x
i
x
n
)
2
= 27, 25 et
1
99
100

i=1
(y
i
y
n
)
2
= 23, 99. Peut-on conclure `a lecacite du
traitement ?
On note
1
la charge de rupture moyenne (dans la population) des cables traites,
2
1
la
variance, et
2
la charge de rupture moyenne (dans la population) des cables non traites,
2
2
la
variance. On suppose que les deux echantillons X
1
, . . . , X
n
1
, n
1
= 200, et Y
1
, . . . , Y
n
2
, n
2
= 100
sont independants. On a E(X
i
) =
1
, Var(X
i
) =
2
1
, E(Y
i
) =
2
, Var(Y
i
) =
2
2
.
1
et
2
sont
estimees par X
n
et Y
n
les charges moyennes aleatoires des cables traites et non traites des
echantillons. Une estimation ponctuelle de
1
(resp.
2
) est la realisation x
n
= 30.82 (resp.
y
n
= 29.63) de lestimateur X
n
(resp. Y
n
) sur lechantillon des cables traites (resp. non traites).
Les variances
2
1
et
2
2
sont inconnues et estimees par les variances aleatoires S
2
X
et S
2
Y
. Une
estimation ponctuelle de
2
1
(resp.
2
2
) est la realisation s
2
X
= 27.25 (resp. s
2
X
= 23.99) de
lestimateur S
2
X
(resp. S
2
Y
) sur lechantillon.
On souhaite tester H
0
:
1
=
2
contre H
1
:
1
>
2
.
Le TCL sapplique (les echantillons sont susamment importants), et la statistique de test est
en labsence dinformation sur les variances
T
n
=
X
n
Y
n
_
S
2
X
n
1
+
S
2
Y
n
2
N (0, 1) sous H
0
Si les variances etaient supposees inconnues mais egales
2
1
=
2
2
=
2
, on estimerait la valeur
commune
2
par la variance empirique aleatoire calculee sur les deux echantillons traites/non
traites reunis (normalisee pour avoir un estimateur sans biais)
S
2
=
(n
1
1)S
2
X
+ (n
2
1)S
2
Y
n
1
+n
2
2
.
La statistique de test serait
T
n
=
X
n
Y
n
_
S
2
_
1
n
1
+
1
n
2
_
N (0, 1) sous H
0
R`egle de decision :
si T
n
> c

on rejette H
0
,
si T
n
c

, on accepte H
0
,
o` u le seuil c

est tel que P


H
0
(T
n
> c

) = = 5%. Dans la table de la loi N (0, 1), on lit


c

= 1, 645. Si on note t
n
la realisation de T
n
sur les deux echantillons, si t
n
> 1.645 on
rejettera H
0
(avec un risque de 5% de se tromper), si t
n
1.645 on acceptera H
0
.
Mise en oeuvre : Sur lechantillon, on trouve t
n
= 1, 94 > 1, 645. On rejette H
0
. Le traite-
ment est donc ecace.
30
3.1.2 Petits echantillons gaussiens
On consid`ere `a nouveau deux echantillons independants, le premier (X
1
, . . . , X
n
1
), de moyenne
E(X
i
) =
1
, Var(X
i
) =
2
1
, et le second (Y
1
, . . . , Y
n
2
), E(Y
i
) =
2
, Var(Y
i
) =
2
2
. Si les eec-
tifs respectifs n
1
et n
2
des deux echantillons ne sont pas assez importants pour appliquer le
TCL, on fait alors `a nouveau lhypoth`ese supplementaire que ces echantillons sont gaussiens :
(X
1
, . . . , X
n
1
), X
i
N (
1
,
2
1
) et (Y
1
, , Y
n
2
), Y
i
N (
2
,
2
2
). Bien s ur les resultats suivants
seront valables pour de grands echantillons gaussiens !
Test de H
0
:
1
=
2
contre
1
=
2
Le test est encore fonde sur la dierence X
n
1
Y
n
2
. Dans le cas gaussien, on connat la loi
exacte de X
n
1
et Y
n
2
. On a
X
n
1
N
_

1
,

2
1
n
1
_
et Y
n
2
N
_

2
,

2
2
n
2
_
.
Par independance des deux echantillons,
X
n
1
Y
n
2
N
_

2
,

2
1
n
1
+

2
2
n
2
_
.
Sous H
0
,
X
n
1
Y
n
2
N
_
0,

2
1
n
1
+

2
2
n
2
_
soit encore
X
n
1
Y
n
2
_

2
1
n
1
+

2
2
n
2
N (0, 1) .
On ne peut utiliser directement cette variable aleatoire comme statistique de test que
lorsque les variances des deux populations sont connues.
Cas o` u les variances
2
1
et
2
2
sont connues
La statistique de test est
T
n
=
X
n
1
Y
n
2
_

2
1
n
1
+

2
2
n
2
.
Sous H
0
, T
n
N (0, 1) et on proc`ede de la meme mani`ere que precedemment.
Cas o` u les variances
2
1
et
2
2
sont inconnues mais egales
Les solutions ne sont pas satisfaisantes pour des petits echantillons lorsque les variances sont
dierentes et inconnues. On supposera donc legalite des variances
2
1
=
2
2
=
2
. Nous verrons
une procedure permettant de tester legalite des variances dans le cas gaussien, le test de Fisher,
que vous utiliserez egalement dans le mod`ele lineaire. On va donc estimer la valeur commune
2
31
par la moyenne ponderee par les eectifs (n
1
1) et (n
2
1) des deux variances dechantillons
S
2
1
et S
2
2
:
S
2
=
(n
1
1)S
2
1
+ (n
2
1)S
2
2
n
1
+n
2
2
de sorte que
2
1
/n
1
+
2
2
/n
2
=
2
(1/n
1
+ 1/n
2
) est estimee par S
2
(1/n
1
+ 1/n
2
). On utilise
alors la statistique de test
T
n
=
X
n
1
Y
n
2
_
S
2
_
1
n
1
+
1
n
2
_
.
On montre que dans le cas gaussien, sous H
0
, T
n
St(n
1
+n
2
2). En eet, on a
T
n
=
X
n
1
Y
n
2
_
S
2
_
1
n
1
+
1
n
2
_
=
X
n
1
Y
n
2

2
_
1
n
1
+
1
n
2
_
_
(n
1
+n
2
2)S
2

n
1
+n
2
2
=
N(0, 1)
_

2
(n
1
+n
2
2)
n
1
+n
2
2
= St(n
1
+n
2
2).
On a besoin de legalite des variances pour avoir un
2
au denominateur (on aurait sinon une
somme de
2
). La statistique de test est donc T
n
, mais cette fois, sous H
0
, T
n
St(n
1
+n
2
2).
Les r`egles de decision se construisent de la meme mani`ere mais on recherche cette fois les valeurs
seuils c

dans la table de la student St(n


1
+n
2
2) et non dans la table de la N(0, 1).
Exemple 1
On cherche `a savoir si le rythme cardiaque dun individu augmente lorsque lindividu est
soumis `a un stress. Pour cela, on mesure le rythme cardiaque de 5 individus avant une seance
de cinema passant un lm dhorreur, et le rythme cardiaque de 5 autres individus apr`es la
seance de cinema. On suppose que le rythme cardiaque dun individu est une variable aleatoire
de loi normale. Les rythmes cardiaques observes sont les suivants :
avant la seance 90 76 80 87 83
apr`es la seance 98 77 88 90 89
1. Le ryhtme cardiaque augmente til de mani`ere signicative avec le stress ?
2. Calculer le degre de signication du test.
Exemple 2
On admet que la production de lait dune vache normande (respectivement hollandaise) est
une variable aleatoire de loi N(
1
,
2
1
) (respectivement N(
2
,
2
2
)). Un producteur de lait sou-
haite comparer le rendement des vaches normandes et hollandaises de son unite de production.
32
Les releves de production de lait (exprimee en litres) de 10 vaches normandes et hollandaises
ont donne les resultats suivants :
vaches normandes 552 464 483 506 497 544 486 531 496 501
vaches hollandaises 487 489 470 482 494 500 504 537 482 526
Les deux races de vaches laiti`eres ont-elles le meme rendement ? (on supposera legalite des
variances)
3.2 Comparaison de deux proportions
On souhaite comparer deux proportions p
1
et p
2
dindividus poss`edant un meme caract`ere
dans deux populations dierentes. Par exemple, p
1
represente la proportion de favorables `a un
candidat dans une ville V1, et p
2
la proportion de favorables `a ce candidat dans une autre ville
V2 : on peut se demander si la proportion de favorables au candidat est la meme dans les deux
villes, auquel cas on testera H
0
: p
1
= p
2
contre H
1
: p
1
= p
2
. On va donc considerer deux
echantillons independants (X
1
, , X
n
1
) de loi B(p
1
), et (Y
1
, , Y
n
2
) de loi B(p
2
). Dans le
cas de lexemple, X
i
represente lopinion du i`eme electeur dans V1, Y
i
dans V2. La proportion
theorique p
1
est estimee par la proportion aleatoire du premier echantillon n
1
1

n
1
i=1
X
i
= X
n
1
et
p
2
par n
1
2

n
2
i=1
Y
i
= Y
n
2
, proportion aleatoire du 2`eme echantillon. On rappelle que E(X
i
) = p
1
,
Var(X
i
) = p
1
(1p
1
), E(Y
i
) = p
2
, Var(Y
i
) = p
2
(1p
2
), E(X
n
1
) = p
1
, Var(X
n
1
) = p
1
(1p
1
)/n
1
,
E(Y
n
2
) = p
2
et Var(Y
n
2
) = p
2
(1 p
2
)/n
2
.
Test de H
0
: p
1
= p
2
contre H
1
: p
1
= p
2
Le test est fonde sur lecart X
n
1
Y
n
2
entre les deux proportions aleatoires observees
dans les echantillons, variables aleatoires dont il faut connatre la loi sous H
0
. Si les tailles
dechantillons n
1
et n
2
sont susamment importantes, le TCL sapplique et on a
X
n
1
N
_
p
1
,
p
1
(1 p
1
)
n
1
_
et Y
n
2
N
_
p
2
,
p
2
(1 p
2
)
n
2
_
Par independance,
X
n
1
Y
n
2
N
_
p
1
p
2
,
p
1
(1 p
1
)
n
1
+
p
2
(1 p
2
)
n
2
_
.
Sous H
0
,
X
n
1
Y
n
2
N
_
0,
p
1
(1 p
1
)
n
1
+
p
2
(1 p
2
)
n
2
_
soit encore,
X
n
1
Y
n
2
_
p
1
(1p
1
)
n
1
+
p
2
(1p
2
)
n
2
N (0, 1)
On connat la loi de cette variable aleatoire sous H
0
, mais on ne peut lutiliser comme
statistique de test car on ne connat pas la valeur de p
1
(1 p
1
)/n
1
+p
2
(1 p
2
)/n
2
. Il faut
33
donc estimer cette quantite sous H
0
. Sous H
0
, p
1
= p
2
= p, et on estime la valeur commune
p par
P
n
=

n
1
i=1
X
i
+

n
2
i=1
Y
i
n
1
+n
2
=
n
1
X
n
1
+n
2
Y
n
2
n
1
+n
2
.
P
n
est la proportion aleatoire observee sur les deux echantillons. On estime alors (sous H
0
)
p
1
(1 p
1
)/n
1
+ p
2
(1 p
2
)/n
2
= p(1 p)(1/n
1
+ 1/n
2
) par P
n
(1 P
n
)(1/n
1
+ 1/n
2
). On
construit le test `a partir de la statistique
T
n
=
X
n
1
Y
n
2
_
P
n
(1 P
n
)
_
1
n
1
+
1
n
2
_
Sous H
0
, T
n
N(0, 1).
R`egle de decision :
si |T
n
| > c

on rejette H
0
,
si |T
n
| c

, on accepte H
0
,
o` u le seuil c

est choisi tel que P


H
0
(|T
n
| > c

) = ; la valeur de c

est lue dans la table de


la N(0, 1).
Exemple
A la sortie de deux salles de cinema donnant le meme lm, on a interroge des spectateurs quant
`a leur opinion sur le lm. Les resultats de ce sondage dopinion sont les suivants :
Opinion Mauvais lm Bon lm Total
Salle 1 30 70 100
Salle 2 48 52 100
Total 78 122 200
Lopinion est-elle signicativement liee `a la salle ?
Soit p
1
, resp. p
2
la proportion de gens de la salle 1, resp. salle 2, ayant une mauvaise opinion
du lm. On veut tester H
0
: p
1
= p
2
contre H
1
: p
1
= p
2
.
Soit X
i
, resp. Y
i
, la variable aleatoire representant lopinion du i`eme spectateur interroge dans
la salle 1, resp. salle 2. X
i
= 1 si le i`eme spectateur interroge dans la salle 1 a une mauvaise
opinion, X
i
= 0 sinon. X
i
B(p
1
). De meme, Y
i
B(p
2
). On note X
n
1
, resp. Y
n
2
, la proportion
aleatoire de spectateurs interroges dans la salle 1, resp. salle 2, ayant une mauvaise opinion. Les
eectifs n = n
1
= n
2
= 100 sont susamment grands pour appliquer le TCL. La statistique de
test est
T
n
=
X
n
Y
n
_
P
n
(1 P
n
)
_
1
n
1
+
1
n
2
_
o` u sous H
0
P
n
= (n
1
X
n
1
+ n
2
Y
n
2
)/(n
1
+ n
2
) est un estimateur de la proportion commune
p de spectateurs interroges ayant une mauvaise opinion salle 1 et 2 confondues. Sous H
0
,
T
n
N(0, 1).
R`egle de decision :
34
si |T
n
| > c

on rejette H
0
,
si |T
n
| c

, on accepte H
0
,
o` u le seuil c

est choisi tel que P


H
0
(|T
n
| > c

) = = 5%; la valeur de c

= 1, 96 est lue dans


la table de la N(0, 1).
Mise en oeuvre : soient x
n
1
, y
n
2
, p
n
les realisations de X
n
1
, Y
n
2
, P
n
(ce sont des estimations
ponctuelles de p
1
, p
2
, p). x
n
1
= 30/100, y
n
2
= 48/100, p
n
= (30 + 48)/200.
Ainsi, t
n
= (x
n
1
y
n
2
)/
_
p
n
(1 p
n
)(1/100 + 1/100) = 2.61. |t
n
| = 2.61 > 1.96 = c

donc
on rejette H
0
`a 5% : il y a une dierence signicative entre les deux salles (il y a une inuence
signicative de la salle sur lopinion).
Degre de signication :

s
= P
H
0
(|T
n
| > 2.61) = 2(1 P
H
0
(T 2.61)) = 2(1 0.995) = 0.01.
3.3 Comparaison de deux variances (cas gaussien)
On souhaite comparer les variances
2
1
et
2
2
dun meme caract`ere dans deux populations
dierentes. Nous ne traiterons que le cas o` u le caract`ere est distribue dans les deux po-
pulations suivant une loi normale. On consid`ere deux echantillons gaussiens (X
1
, . . . , X
n
1
),
X
i
N (
1
,
1
) et (Y
1
, . . . , Y
n
2
), Y
i
N (
2
,
2
). Soient X
n
1
=

n
1
i=1
X
i
/n
1
estimateur de

1
, Y
n
2
=

n
2
i=1
Y
i
/n
2
estimateur de
2
, S
2
1
=

n
1
i=1
(X
i
X
n
1
)
2
/(n
1
1) estimateur de
2
1
, et
S
2
2
=

n
2
i=1
(Y
i
Y
n
2
)
2
/(n
2
1) estimateur de
2
2
.
On veut comparer
2
1
et
2
2
: `a partir des variances observees S
2
1
et S
2
2
, peut-on dire si
2
1
=
2
2
?
On va donc construire le test de H
0
:
2
1
=
2
2
contre H
1
:
2
1
=
2
2
.
Sous H
0
,
2
1
=
2
2
, i.e.
2
1
/
2
2
= 1. Le test va alors etre fonde sur le rapport S
2
1
/S
2
2
que
lon comparera `a la valeur de reference 1. Si ce rapport est signicativement dierent de 1, on
rejettera H
0
, sinon on acceptera H
0
.
Quelle est la loi de la statistique de test T = S
2
1
/S
2
2
sous H
0
? Puisque les echantillons sont
gaussiens, on sait que
(n
1
1)S
2
1

2
1

2
(n
1
1) et
(n
2
1)S
2
2

2
2

2
(n
2
1).
De plus, ces deux variables aleatoires sont independantes.
Rappel 8 : Soient X, Y deux variables aleatoires independantes tq X
2
(d
1
) et Y
2
(d
2
).
Alors la variable aleatoire (X/d
1
)/(Y/d
2
) F(d
1
, d
2
) (loi de Fisher `a d
1
et d
2
degres de liberte).
La loi de Fisher est une loi non symetrique et une variable aleatoire de Fisher ne prend que des
valeurs positives.
Donc on a
(n
1
1)S
2
1

2
1
/(n
1
1)
(n
2
1)S
2
2

2
2
/(n
2
1)
=

2
(n
1
1)/(n
1
1)

2
(n
2
1)/(n
2
1)
= F(n
1
1, n
2
1).
35
Or sous H
0
,
2
1
=
2
2
, donc T = S
2
1
/S
2
2
F(n
1
1, n
2
1).
R`egle de decision :
si T < c

(c

< 1) ou si T > d

(d

> 1) on rejette H
0
,
si c

T d

, on accepte H
0
.
Les seuils c

et d

sont choisis tels que


P
H
0
(rejetter H
0
) = P
H
0
(T < c

ou T > d

) = P
H
0
(T < c

) +P
H
0
(T > d

) =
xe `a lavance. Or sous H
0
, T F(n
1
1, n
2
1), donc les valeurs de c

et d

sont lues
dans la table de la Fisher (n
1
1, n
2
1) tels que P(F(n
1
1, n
2
1) < c

) = /2 et
P(F(n
1
1, n
2
1) > d

) = /2, i.e. P(F(n


1
1, n
2
1) d

) = 1 /2.
Remarque. Il y a donc deux bornes `a lire dans la table de la Fisher. La valeur de d

(> 1)
se lit directement dans la table de F(n
1
1, n
2
1). En revanche, la lecture de c

pose plus
de probl`eme car c

< 1. Mais on rappelle que si F F(d


1
, d
2
), alors
1
F
F(d
2
, d
1
), et donc
pour lire une valeur plus petite que 1, il sut de prendre linverse de la valeur lue dans la
table F(d
2
, d
1
) o` u lon a inverse les degres de liberte. Ainsi, si F F(d
1
, d
2
) et si a < 1,
P(F < a) = P(1/F > 1/a) = /2 et P(1/F 1/a) = 1 /2.
Remarque. Il est bien entendu possible de lire les valeurs des deux seuils c

et d

. Mais on peut
ne lire quune seule valeur, celle situee du meme cote que 1 que le rapport observe t = s
2
1
/s
2
2
.
En eet si t > 1, il sut de lire d

puisque lon sait que c

< 1 : si t > d

on rejettera H
0
, et
si t < d

, on sait aussi que c

< 1 < t < d

, et on acceptera H
0
. De meme si t < 1, il sut de
lire la valeur c

puisque lon sait que d

> 1. Attention, meme si on ne peut lire la valeur que


dune seule borne pour conclure, la r`egle de decision est bien :
si T < c

ou si T > d

on rejette H
0
,
si c

< T < d

, on accepte H
0
.
En pratique, on calculera au depart les realisations s
2
1
et s
2
2
des variances : si s
2
1
> s
2
2
on utilisera
le rapport t = s
2
1
/s
2
2
qui sera plus grand que 1, il sura alors de lire la valeur de d

dans la
table F(n
1
1, n
2
1). Si s
2
1
< s
2
2
on utilisera le rapport t = s
2
2
/s
2
1
qui sera plus grand que 1,
il sura alors de lire la valeur de d

mais cette fois dans la table F(n


2
1, n
1
1). Ainsi pour
ne calculer que la borne superieure d

(plus simple `a lire dans la table), on choisit au prelable


le bon rapport `a calculer, i.e. celui o` u la variance la plus grande est au numerateur (en prenant
garde dutiliser les bons degres de liberte).
Exemple 1
Tester legalite des variances dans lexemple du test de comparaison de moyennes du cas gaussien
sur les vaches hollandaises et normandes.
Exemple 2
Dans deux Unites dEnseignement et de Recherche (UER), U1 et U2, de psychologie, on suppose
36
que les notes de statistiques des etudiants suivent des lois normales. On observe les resultats
suivants sur un echantillon de 25 etudiants de lUER U1 et de 10 etudiants de lUER U2 :
25

i=1
x
i
= 310
25

i=1
x
2
i
= 3916
10

i=1
y
i
= 129 et
10

i=1
y
2
i
= 1709.1
o` u x
i
(respectivement y
i
) designe la note obtenue par le i
` eme
etudiant de lechantillon de U1
(respectivement U2).
Peut-on dire que les variances des notes de statistiques dans les deux UER sont signicativement
dierentes ? (on prendra un risque de 5%).
37