Vous êtes sur la page 1sur 26

Cours de

Probabilits et Statistiques
Tome 2
Mathieu Gentes
Anne /
IUT dOrsay - Dpartement Mesures Physiques
Table des matires
IVEchantillonage 5
1 Notion dchantillonnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Distributions dchantillonnage . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1 Moyenne dchantillon - variance dchantillon . . . . . . . . . . . . . . 6
2.1.1 Dnitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.2 Paramtres descriptifs de la distribution . . . . . . . . . . . . 7
2.2 Proportion dchantillon . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
V Estimation - Intervalles de conance 11
1 Les estimateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1 denitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2 Estimateurs usuels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.1 Cas dun caractre quantitatif . . . . . . . . . . . . . . . . . . 12
1.2.2 Cas dun caractre qualitatif . . . . . . . . . . . . . . . . . . . 12
2 Intervalles de conance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1 Dnitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2 Intervalle de conance pour une moyenne . . . . . . . . . . . . . . . . . 13
2.2.1 Cas connu . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.2 Cas inconnu . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Intervalle de conance pour une variance . . . . . . . . . . . . . . . . . 14
2.3.1 Cas connu (cas peu frquent) . . . . . . . . . . . . . . . . . 14
2.3.2 Cas inconnu . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.4 Intervalle de conance pour une proportion . . . . . . . . . . . . . . . . 15
3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
VI Tests dhypothse 17
1 Introduction aux tests dhypothse . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.2 Dnitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3 Fonctionnement dun test . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.4 Exemples de tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2 Tests de conformit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1 Test de conformit dune moyenne . . . . . . . . . . . . . . . . . . . . . 18
2.1.1 est connu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.2 est inconnu . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2 Test de conformit dune variance . . . . . . . . . . . . . . . . . . . . . 20
2.3 Test de conformit dune proportion . . . . . . . . . . . . . . . . . . . . 20
3
4 TABLE DES MATIRES
3 Tests de comparaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1 Test de comparaison de deux moyennes . . . . . . . . . . . . . . . . . . 21
3.1.1
1
et
2
connus . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1.2
1
et
2
inconnus . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Test de comparaison de deux variances . . . . . . . . . . . . . . . . . . 22
3.3 Test de comparaison de deux proportions . . . . . . . . . . . . . . . . . 23
4 Test du Chi-deux dajustement . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Chapitre IV
Echantillonage
1 Notion dchantillonnage
Dnition 1.1. On considre une population de taille N. On appelle chantillon un sous-
ensemble de cette population. Un chantillon de taille n est donc une liste de n individus
(
1
, . . . ,
n
) extraits de la population mre.
Exemple. On considre une population constitue de 5 tudiants et on sintresse au temps
hebdomadaire consacr par chaque tudiant ltude des statistiques.
Etudiant Temps dtude (h)
A 7
B 3
C 6
D 10
E 4
= {A, B, C, D, E} et N = 5.
Dnition 1.2. On appelle chantillonnage le prlvement dchantillons. Le rapport t de
leectif n de lchantillon sur leectif N de la population dans laquelle il a t prlev, est
appel taux dchantillonnage ou fraction de sondage : t =
n
N
.
Exemple. On prlve des chantillons de taille 2 : t =
2
5
= 0, 4.
Dnition 1.3. On appelle chantillonnage alatoire un prlvement de n individus dans
une population mre tel que toutes les combinaisons possibles de n individus aient la mme
probabilit dtre prlevs.
Il existe dautres formes dchantillonnage, on ne sintressera nanmoins qu des chan-
tillonnages alatoires.
Objectif : on cherche dcrire un caractre C qualitatif ou quantitatif prsent dans une
population travers ltude des rsultats obtenus sur un chantillon de taille n.
Exemples.
Etant donne une population, on peut sintresser aux caractres quantitatifs tels que le poids,
la taille, etc.
5
6 CHAPITRE IV. ECHANTILLONAGE
Etant donne une population, on peut sintresser aux caractres qualitatifs tels que la couleur
des yeux, la couleur des cheveux, etc.
Le caractre tudi dans lexemple initial est le temps hebdomadaire consacr ltude des
statistiques.
Dnition 1.4. Soit C un caractre quantitatif dni sur une population mre . C est la
ralisation dune variable alatoire X dnie sur :
X : R

i
x
i
.
On appelle n-chantillon de valeurs de X la liste des valeurs (x
1
, . . . , x
n
) observes prises
par X sur un chantillon (
1
, . . . ,
n
) de la population . Les coordonnes peuvent tre consid-
res comme les valeurs des ralisations dun vecteur de variables alatoires (X
1
, . . . , X
n
) appel
n-chantillon de X o les X
i
sont de mme loi, indpendantes.
X
1
est alors la variable alatoire valeur du premier lment de lchantillon, X
2
la variable
alatoire valeur du second lment de lchantillon, etc.
Exemple. On considre des 2-chantillons (X
1
, X
2
). Tableau des 2-chantillons de valeurs
associs.
Dnition 1.5. On appelle statistique toute variable alatoire qui scrit laide des variables
alatoires X
1
, . . . , X
n
.
Exemples. X
i
, X =
1
n
n

i=1
X
i
sont des statistiques.
Si on extrait plusieurs chantillons de taille n xe, les rsultats que lon va pouvoir dduire
sont variables car ils dpendent de lchantillon considr. On parle de uctuations dchan-
tillonnage. Comment dans ce cas tirer des conclusions valables sur la population mre ? On
va pour cela tudier les lois de probabilits qui rgissent ces uctuations.
2 Distributions dchantillonnage
2.1 Moyenne dchantillon - variance dchantillon
2.1.1 Dnitions
On considre une population dont les lments possdent un caractre quantitatif C qui
est la ralisation dune variable alatoire X qui suit une loi de probabilit desprance et
dcart-type . On suppose que la famille est de taille innie ou que lchantillonnage se fait
avec remise.
On prlve un n-chantillon (X
1
, . . . , X
n
) de X de valeurs (x
1
, . . . , x
n
). La moyenne x de
lchantillon est donne par
x =
x
1
+ + x
n
n
=
1
n
n

i=1
x
i
.
Il sagit de la valeur prise par la variable alatoire
X
1
+ + X
n
n
=
1
n
n

i=1
X
i
.
CHAPITRE IV. ECHANTILLONAGE 7
Dnition 2.1. On dnit la variable alatoire X, appele moyenne dchantillon, par
X =
1
n
n

i=1
X
i
.
De la mme manire, la variance v de lchantillon (x
1
, . . . , x
n
) est donne par
v =
1
n
n

i=1
(x
i
x)
2
.
Il sagit de la valeur prise par la variable alatoire
V =
1
n
n

i=1
(X
i
X)
2
.
Dnition 2.2. On dnit la variable alatoire S
2
, appele variance dchantillon, par
S
2
=
1
n 1
n

i=1
(X
i
X)
2
=
n
n 1
V.
2.1.2 Paramtres descriptifs de la distribution
Proposition 2.3.
1. Quelle que soit la loi de X, on a
E(X) = V ar(X) =

n
,
E(V ) =
n 1
n

2
et E(S
2
) =
2
.
2. Si X N(, ), on a
(i) si est connu :
X

n
N(0, 1),
(ii) si nest pas connu :
X
_
V
n
T
n1
,
(iii)
nV

2
=
(n 1)S
2

2

2
n1
.
2.2 Proportion dchantillon
Il arrive que le caractre estimer ne soit pas quantitatif mais qualitatif. Dans ce cas, on
recherche la proportion p des individus prsentant ce caractre.
La proportion p sera estime laide des rsultats obtenus sur un n-chantillon.
Dnition 2.4. La proportion f obtenue dans un n-chantillon est la valeur observe dune
variable alatoire F, frquence dapparition de ce caractre dans un chantillon de taille n,
appele proportion dchantillon ou frquence statistique.
8 CHAPITRE IV. ECHANTILLONAGE
On peut crire
F =
K
n
,
o K est la variable alatoire qui compte le nombre dapparitions du caractre considr dans
un chantillon de taille n.
Par dnition, K B(n, p), soit :
E(K) = np et V ar(K) = npq,
do la proposition suivante :
Proposition 2.5.
E(F) = p et V ar(F) =
pq
n
.
Remarque. Pour n 30, np 15 et nq 15 on peut approcher F par une loi normale
N
_
p,
_
pq
n
_
.
CHAPITRE IV. ECHANTILLONAGE 9
3 Exercices
Exercice 1. Un commerant propose sa clientle six articles lectromnagers. Considrons
la population constitue par ces six articles nomms
i
i = 1 . . . 6.
Soit X le caractre quantitatif nombre dunits en stock lors de linventaire. On a :

1

2

3

4

5

6
X 0 1 2 3 0 1
1. Dterminer la loi de probabilit de X. Calculer E(X) et V ar(X).
2. Dans cette population deectif N = 6, on tire avec remise des chantillons de taille
n = 2. X
1
est le nombre dunits en stock pour le premier article tir, X
2
le nombre
dunits en stock pour le second article tir. On pose :
X =
X
1
+ X
2
2
.
Donner la valeur du taux dchantillonnage.
Dterminer les valeurs prises par X sur tous les chantillons possibles, en dduire sa loi.
Calculer E(X) et V ar(X) et vrier les rsultats thoriques.
Exercice 2. On considre une population de 5 factures nommes
i
i = 1 . . . 5. On considre
le caractre qualitatif rglement des factures qui a deux modalits possibles : rgle ou non
rgle.

1

2

3

4

5
X rgle non rgle non rgle rgle non rgle
On tire avec remise des chantillons de taille n = 2. On note F la variable alatoire
proportion des factures rgles dans lchantillon.
1. Donner la valeur du taux dchantillonnage.
2. Dterminer les valeurs prises par F sur tous les chantillons possibles.
3. en dduire la loi de F, E(F), V ar(F) et vrier les rsultats thoriques.
4. Reprendre lexercice avec des tirages dchantillons sans remise.
Exercice 3. Le responsable dune entreprise a accumul depuis des annes les rsultats un
test daptitude eectuer un certain travail. Il semble plausible de supposer que les rsultats
au test daptitude sont distribus suivant une loi normale de moyenne = 250 et dcart-type
= 10. On fait passer le test 25 individus de lentreprise. Quelle est la probabilit pour que
la moyenne de lchantillon soit comprise entre 146 et 154 ?
Exercice 4. Selon une tude sur le comportement du consommateur, 25% dentre eux sont
inuencs par les marques lors de lachat dun produit. Si on interroge 100 consommateurs pris
au hasard, quelle est la probabilit pour quau moins 35 dentre eux se dclarent inuencs par
les marques ?
10 CHAPITRE IV. ECHANTILLONAGE
Chapitre V
Estimation - Intervalles de conance
1 Les estimateurs
Estimer un paramtre cest en rechercher une valeur approche partir des rsultats obtenus
sur un chantillon.
Exemple. Estimer la taille moyenne dune population partir de la moyenne empirique ob-
tenue sur un chantillon de cette population.
1.1 denitions
Dnition 1.1. Un estimateur

du paramtre inconnu est une fonction qui fait correspondre
une suite dobservations une valeur approche

n
de , appele estimation :

: (x
1
, . . . , x
n
)

n
= f(x
1
, . . . , x
n
).
Un estimateur

est donc une variable alatoire, on peut en calculer son esprance E(

) et
sa variance V ar(

). Ces quantits vont permettre de dterminer la qualit dun estimateur du


paramtre estimer.
Un paramtre peut en eet avoir plusieurs estimateurs. Dans le cas de la taille moyenne
dune population, on peut choisir la moyenne arithmtique, la mdiane, etc.
Dnition 1.2. On dit que

est un estimateur sans biais si la moyenne de sa distribution
dchantillonnage est gale la valeur du paramtre estimer :
E(

) = .
Sinon, on parle destimateur biais. Pour comparer les estimateurs biaiss, on introduit
la quantit suivante :
Dnition 1.3. On appelle biais dun estimateur

la quantit
Biais(

) = E(

) .
DESSIN
Labsence de biais nest pas susante pour sassurer de lecacit dun estimateur. Le
paramtre peut dailleurs prsenter plusieurs estimateurs sans biais. Dans ce cas, cest la
variance des estimateurs qui permet de les comparer. Si cette variance est leve, lestimateur
peut prendre des valeurs trs loignes de la valeur eective du paramtre .
11
12 CHAPITRE V. ESTIMATION - INTERVALLES DE CONFIANCE
Dnition 1.4. On dit quun estimateur sans biais est ecace si sa variance est la plus petite
parmi les variances des estimateurs sans biais. Si

1
est un estimateur de , on dit que

1
est
ecace si pour tout estimateur sans biais

2
:
E(

1
) = E(

2
) = et V ar(

1
) < V ar(

2
).
DESSIN
Dnition 1.5. Un estimateur

est convergent si sa distribution tend se concentrer autour
de la valeur estimer, en dautres termes si sa variance tend vers zro lorsque la taille de
lchantillon augmente :
lim
n+
V ar(

) = 0.
1.2 Estimateurs usuels
1.2.1 Cas dun caractre quantitatif
Soit X une variable alatoire de moyenne et dcart-type dnie sur une population
mre . Soit (X
1
, . . . , X
n
) un n-chantillon de X.
Proprits. On a les rsultats suivants :
1. X =
1
n
n

i=1
X
i
est un estimateur sans biais et convergent de .
2. V =
1
n
n

i=1
(X
i
X)
2
est un estimateur biais de la variance
2
.
3. S
2
=
1
n 1
n

i=1
(X
i
X)
2
=
n
n 1
V est un estimateur sans biais et convergent de la
variance
2
.
1.2.2 Cas dun caractre qualitatif
On considre un caractre qualitatif dune population dont on cherche estimer la propor-
tion p.
Proprit. La proportion dchantillon F est un estimateur sans biais et convergent de la
proportion p.
2 Intervalles de conance
Plutt que de dterminer une valeur approche dun paramtre obtenue laide dun
estimateur

, on va rechercher un intervalle dans lequel on sait avec une probabilit satisfaisante
que la valeur de sy trouve.
2.1 Dnitions
Dnition 2.1. Soit X une variable alatoire dont la loi dpend dun paramtre . Les in-
tervalles de conance de risque pour le paramtre , issus des dirents n-chantillons
(x
1
, . . . , x
n
), sont les intervalles [a(x
1
, . . . , x
n
) ; b(x
1
, . . . , x
n
)] tels quune proportion de ces
intervalles contiennent .
CHAPITRE V. ESTIMATION - INTERVALLES DE CONFIANCE 13
Remarques. 1. La quantit 1 est appele niveau de conance de lintervalle [a, b] :
P(a

b) = 1 .
2. Dans la pratique , on ne dispose bien souvent que dun seul chantillon qui fournit un
intervalle de conance [a, b].
3. Le paramtre estimer est souvent lesprance ou la variance dans le cas dun caractre
quantitatif, la proportion dans le cas dun caractre qualitatif.
Dans la suite sattachera rechercher des intervalles de conance [a, b] symtriques, cest
dire tels que :
P(

< a) =

2
et P(

> a) =

2
.
On dtermine ensuite les variables alatoires A
n
et B
n
en fonction de

telles que :
P(A
n
B
n
) = 1 .
Un intervalle de conance [a, b] de risque pour , issu dun n-chantillon (x
1
, . . . , x
n
) de
valeurs de X, sobtient alors en calculant :
a = A
n
(x
1
, . . . , x
n
),
b = B
n
(x
1
, . . . , x
n
).
2.2 Intervalle de conance pour une moyenne
On se place dans le cas o X suit une loi normale de paramtres et ou bien dans le cas
o lon ne connait pas forcment la loi de X mais pour laquelle on dispose dun chantillon de
taille n > 30.
Dans le premier cas X N(, /

n), dans le second cas X suit approximativement cette


mme loi.
On considre un n-chantillon (x
1
, . . . , x
n
) de valeurs de X. On note
m =
x
1
+ + x
n
n
et s =
1
n 1
n

i=1
(x
i
m)
2
.
2.2.1 Cas connu
I =
_
mt
1

n
; m + t
1+

n
_
,
o t
1

2
est le quantile dordre 1

2
de la loi normale centre rduite.
DESSIN
Dmonstration. On sait que X N(, /

n), soit encore


X
/

n
N(0, 1).
Donc
P
_
t
1

2
<
X
/

n
< t
1

2
_
= 1 ,
14 CHAPITRE V. ESTIMATION - INTERVALLES DE CONFIANCE
soit
P
_
X t
1

n
< < X + t
1

n
_
= 1 .
2.2.2 Cas inconnu
I =
_
mt
1

2
,n1
s

n
; m + t
1

2
,n1
s

n
_
,
o t
1

2
,n1
est le quantile dordre 1

2
de la loi de student n 1 degrs de libert.
Remarque. si n > 30, t
1

2
,n1
= t
1

2
.
2.3 Intervalle de conance pour une variance
On se place dans le cas o X suit une loi normale de paramtres et .
2.3.1 Cas connu (cas peu frquent)
I =
_
nv

2
1

2
(n)
;
nv

2
(n)
_
,
o
2
1

2
(n) et
2

2
(n) sont les quantiles dordre 1

2
et

2
de la loi de chi-deux n degrs
de libert et
v =
1
n
n

i=1
(x
i
)
2
DESSIN
2.3.2 Cas inconnu
I =
_
(n 1)s
2

2
1

2
(n 1)
;
(n 1)s
2

2
(n 1)
_
,
o
2
1

2
(n 1) et
2

2
(n 1) sont les quantiles dordre 1

2
et

2
de la loi de chi-deux
n 1 degrs de libert.
Remarque. si n > 30,
2

(n 1)
1
2
_
t

2n 3
_
2
, si bien que lon choisit :
I =
_
2(n 1)s
2
_
t
1

2
+

2n 3
_
2
;
2(n 1)s
2
_
t

2
+

2n 3
_
2
_
.
Dautre part, la symtrie de la loi normale centre rduite assure que t

2
= t
1

2
.
CHAPITRE V. ESTIMATION - INTERVALLES DE CONFIANCE 15
2.4 Intervalle de conance pour une proportion
On a vu dans le chapitre prcdent que la proportion dchantillon F peut tre approche
par une loi normale N(p,
_
pq
n
).
On en dduit :
I =
_
f t
1

2
_
f(f 1)
n
; f + t
1

2
_
f(f 1)
n
_
,
o f est la proportion de lchantillon analys.
16 CHAPITRE V. ESTIMATION - INTERVALLES DE CONFIANCE
3 Exercices
Exercice 1. Un horticulteur voulant sassurer contre les risques de grle se documente sur le
nombre de jours de grle les annes prcdentes.
Les statistiques des dix dernires annes dans la rgion donnent les rsultats suivants, o
x
i
dsigne le nombre de jours de grle par an et n
i
le nombre dannes o on a observ x
i
jours
de grle :
x
i
0 1 2 3 4 5 6 7
n
i
1 1 2 3 2 0 1 0
Donner une estimation ponctuelle non biaise de la moyenne thorique et de la variance
thorique du nombre de jours de grle par an.
Exercice 2. Dans une population dtudiants en sociologie, on a prlev indpendamment deux
chantillons de taille n
1
= 120 et n
2
= 150.
On constate que 48 tudiants de lchantillon 1 et 66 tudiants de lchantillon 2 ont une
formation secondaire scientique.
Soit p la proportion dtudiants de la population ayant une formation secondaire scientique.
Calculer trois estimations ponctuelles de p.
Exercice 3. On mesure la force de compression dun ciment en moulant de petits cylindres et
en mesurant la pression X (exprime en kg cm
2
) partir de laquelle ils se cassent. Pour 10
cylindres utiliss, on relve les pressions suivantes :
19, 6 19, 9 20, 4 19, 8 20, 5 21, 0 18, 5 19, 7 18, 4 19, 4.
On suppose que X suit une loi de Gauss de moyenne et dcart-type .
1. Calculez une estimation ponctuelle non biaise de et de
2
.
2. Donnez, pour = 0, 05, un intervalle de conance I
1
de la moyenne de la population.
3. Donner pour = 0, 05, un intervalle de conance pour la variance de la population.
4. En supposant que lon sache que
2
= 0, 69, donnez pour un intervalle de conance I
2
de risque 0, 05. Comparez I
1
et I
2
.
Exercice 4. Dans une entreprise, le montant de la prime annuelle suit une loi normale de
paramtres et . On considre un chantillon de taille n = 50 et on obtient une moyenne de
130 euros et un cart-type de 28 euros.
Exercice 5. Aprs avoir fait passer un test not sur 100 au personnel dune entreprise, on
choisit un chantillon de taille 20. On suppose que les notes suivent une loi normale de para-
mtres et . La variance de lchantillon tant gale 182, calculer un intervalle de conance
I pour
2
au niveau 95%.
Exercice 6. Aprs une enqute sur un chantillon de 500 mnages dune population, on
constate que 405 mnages possdent une voiture. Estimer par intervalle de conance au ni-
veau 95% la proportion de mnages possdant une voiture.
Chapitre VI
Tests dhypothse
1 Introduction aux tests dhypothse
1.1 Principe
On tudie un caractre quantitatif ou qualitatif X dune certaine population dont une
au moins des valeurs des paramtres dcrivant X est inconnue.
On formule une hypothse sur la valeur de ce paramtre.
On sinterroge sur la pertinence de cette hypothse en la confrontant aux rsultats obtenus
sur un chantillon.
Les distributions dchantillonnage dune moyenne, dune variance et dune proportion vues
dans le chapitre prcdent nous permettrons dlaborer des tests dhypothse.
1.2 Dnitions
Dnition 1.1. Un test dhypothse est une procdure base sur lobservation dun ou plu-
sieurs chantillons permettant de faire un choix entre deux hypothses formules.
Dnition 1.2. Lhypothse mise en avant dans le cadre dun test dhypothse est note (H
0
),
appele hypothse nulle. Toute autre hypothse laquelle on peut la confronter sappelle
hypothse alternative, note (H
1
).
Remarque. Cest lhypothse (H
0
) qui est soumise au test et que lon suppose comme vraie.
La dcision daccepter ou rejeter le test repose sur la confrontation aux valeurs observes sur
un chantillon. Linformation contenue dans cet chantillon tant incomplte, toute dcision
est associe prise de risque.
Dnition 1.3. On appelle erreur de premire espce lerreur commise lorsquon rejette
lhypothse nulle (H
0
) alors que cette dernire est vraie. La probabilit dune telle erreur sap-
pelle risque de premire espce et se note :
= P(rejeter (H
0
)|(H
0
) vraie).
Remarque. On choisit souvent en pratique = 0.05 ou = 0.01.
Dnition 1.4. On appelle erreur de seconde espce lerreur commise lorsquon accepte
lhypothse (H
0
) alors que cette dernire est fausse. La probabilit dune telle erreur sappelle
risque de seconde espce et se note :
= P(accepter (H
0
)|(H
0
) fausse).
17
18 CHAPITRE VI. TESTS DHYPOTHSE
La valeur 1 est appele puissance du test.
La puissance du test correspond la probabilit de rejeter lhypothse (H
0
) sachant que
cette dernire est fausse. Plus est petit et plus le test sera puissant.
Le test est concluant lorsquon quon ne commet aucune erreur, ni de premire ni de seconde
espce.
P (H
0
) accepte (H
0
) refuse
(H
0
) vraie 1
(H
0
) fausse 1
1.3 Fonctionnement dun test
Pour chaque test, on fera appel une variable alatoire de dcision T qui suit une certaine
loi thorique. En supposant que lhypothse (H
0
) est vraie, on cherche la valeur idale pour
T. Le risque de premire espce tant choisi, on dtermine une zone de probabilit 1 ,
gnralement un intervalle, contenant cette valeur idale.
DESSIN
Si la valeur idale constitue lune des borne de cette zone, on parle de test unilatral.
Sinon on parle de test bilatral. Dans la suite, on sintresse surtout aux tests bilatraux.
Si la valeur de T obtenue en se basant sur les rsultats dun chantillon appartient la zone
critique de probabilit , alors lhypothse (H
0
) est rejete, sinon elle est accepte.
1.4 Exemples de tests
On compare la valeur dun paramtre obtenue sur un chantillon une valeur thorique
connue. Lhypothse (H
0
) consiste supposer que ces deux valeurs sont trs proches. On parle
de test de conformit.
On compare les valeurs dun paramtre obtenues sur deux chantillons. lHypothse (H
0
)
consiste supposer que ces chantillons proviennent dune mme population et que les valeurs
trouves seront trs proches. La dirence observe est alors due aux uctuations dchantillon-
nage. On parle de test de comparaison.
2 Tests de conformit
Soit X un caractre dont la loi dpend dun paramtre inconnu. Soit
0
une valeur donne.
On se donne un niveau de risque .
On va alors tester (H
0
) contre (H
1
) o
_
(H
0
) : =
0
(H
1
) : =
0
,
au risque de premire espce .
2.1 Test de conformit dune moyenne
On dispose dun n-chantillon (x
1
, . . . , x
n
) de valeurs de X. On suppose que X suit une loi
normale de paramtres et . Soit
0
une valeur plausible de la moyenne xe a priori. On
CHAPITRE VI. TESTS DHYPOTHSE 19
teste (H
0
) contre (H
1
) o
_
(H
0
) : =
0
(H
1
) : =
0
,
au risque de premire espce .
On dtermine la variable alatoire de dcision : dans le cas de la moyenne X semble appro-
prie.
2.1.1 est connu
Dans ce cas,
U =
X
0
/

n
N(0, 1),
do la zone dacceptation avec un risque de niveau pour X :
I =
_

0
t
1

n
;
0
+ t
1+

n
_
,
o t
1

2
est le quantile dordre 1

2
de la loi normale centre rduite. On sait en eet que :
P(X I) = 1 .
Si la valeur x obtenue sur le n-chantillon considr appartient I, alors on accepte (H
0
),
sinon on rejette (H
0
).
2.1.2 est inconnu
Dans ce cas,
U =
X
0
s/

n
T
n1
,
do la zone dacceptation avec un risque de niveau pour X :
I =
_

0
t
1

2
,n1
s

n
;
0
+ t
1+

2
,n1
s

n
_
,
o t
1

2
,n1
est le quantile dordre 1

2
de la loi de Student n 1 degrs de libert. On sait
en eet que :
P(X I) = 1 .
Si la valeur x obtenue sur le n-chantillon considr appartient I, alors on accepte (H
0
),
sinon on rejette (H
0
).
Remarque. Attention : lintervalle que lon obtient est centre sur la valeur suppose
0
, alors
que pour les intervalles de conance il tait centr sur la valeur de la moyenne de lchantillon
x. Dans le cas des tests, on conclut alors en regardant si cette valeur de x appartient ou non
notre intervalle centre sur la valeur suppose
0
.
20 CHAPITRE VI. TESTS DHYPOTHSE
2.2 Test de conformit dune variance
On dispose dun n-chantillon (x
1
, . . . , x
n
) de valeurs de X. On suppose que X suit une loi
normale de paramtres et . Soit
0
une valeur plausible de la variance xe a priori. On
teste (H
0
) contre (H
1
) o
_
(H
0
) : =
0
(H
1
) : =
0
,
au risque de premire espce .
On dtermine la variable alatoire de dcision : dans le cas de la variance S
2
semble appro-
prie. On ne traite ici que la cas o est inconnu, le cas o est connu tant relativement
peu frquent.
Dans ce cas,
U =
n 1

2
0
S
2

2
n1
,
do la zone dacceptation avec un risque de niveau pour S
2
:
I =
_

2
0
n 1

2
1

2
(n 1) ;

2
0
n 1

2
(n 1)
_
,
o
2
1

2
(n 1) et
2

2
(n 1) sont les quantiles dordre 1

2
et

2
de la loi de chi-deux
n 1 degrs de libert. On sait en eet que :
P(S
2
I) = 1 .
Si la valeur s
2
obtenue sur le n-chantillon considr appartient I, alors on accepte (H
0
),
sinon on rejette (H
0
).
Remarque. Attention : contrairement lintervalle de conance sur la variance quand la
moyenne est inconnue, pour lintervalle dacceptation, les quantiles sont au numrateurs.
2.3 Test de conformit dune proportion
Soit p la proportion dindividus prsentant un certain caractre qualitatif. Soit p
0
une valeur
plausible de p, xe a priori. On teste (H
0
) contre (H
1
) o
_
(H
0
) : p = p
0
(H
1
) : p = p
0
,
au risque de premire espce . On dtermine la variable alatoire de dcision : la frquence F
semble approprie.
On suppose que F suit approximativement une loi N
_
p,
_
pq
n
_
.
La zone dacceptation avec un risque de niveau pour F est :
I =
_
p
0
t
1

2
_
p
0
(1 p
0
)
n
; p
0
+ t
1

2
_
p
0
(1 p
0
)
n
_
,
o t
1

2
est le quantile dordre 1

2
de la loi normale centre rduite. On sait en eet que :
P(F I) = 1 .
Si la valeur de la proportion f obtenue sur le n-chantillon considr appartient I, alors
on accepte (H
0
), sinon on rejette (H
0
).
CHAPITRE VI. TESTS DHYPOTHSE 21
3 Tests de comparaison
Il est frquent de comparer des chantillons issus de deux groupes dindividus. On considre
deux variables alatoires X
1
et X
2
dnies sur chacun de ces groupes et on souhaite tester si
les caractres tudis suivent la mme loi. Les variables alatoires que nous emploierons pour
ces tests sont la dirence des moyennes dchantillon, le quotient des variances dchantillon
ou la dirence des frquences dchantillon. En gnral, on travaille dans le cas particulier o
les tailles dchantillons sont suprieures 30.
3.1 Test de comparaison de deux moyennes
On considre que les variables alatoires X
1
et X
2
suivent respectivement des lois normales
N(
1
,
1
) et N(
2
,
2
).
On teste (H
0
) contre (H
1
) o
_
(H
0
) :
1
=
2
(H
1
) :
1
=
2
,
au risque de premire espce .
On dispose dun chantillon de taille n
1
pour X
1
et de taille n
2
pour X
2
.
3.1.1
1
et
2
connus
On pose
T =
X
1
X
2
_

2
1
n
1
+

2
2
n
2
,
la variable alatoire de dcision du test. Lhypothse (H
0
) tant suppose vraie, T suit une
loi normale centre rduite. La zone dacceptation avec un risque de niveau pour T est :
I =
_
t
1

2
; t
1

,
o t
1

2
est le quantile dordre 1

2
de la loi normale centre rduite. On sait en eet que :
P(T I) = 1 .
Si la valeur
t =
x
1
x
2
_

2
1
n
1
+

2
2
n
2
obtenue sur les chantillons considrs appartient I, alors on accepte (H
0
), sinon on rejette
(H
0
).
3.1.2
1
et
2
inconnus
On remplace alors les variances thoriques par les estimateurs sans biais S
1
et S
2
de ces
variances. La variable de dcision scrit :
T =
X
1
X
2
_
S
2
1
n
1
+
S
2
2
n
2
.
22 CHAPITRE VI. TESTS DHYPOTHSE
Les chantillons tant de tailles suprieures 30, on peut montrer que T peut tre approche
par une loi normale centre rduite.
La zone dacceptation avec un risque de niveau pour T est nouveau :
I =
_
t
1

2
; t
1

,
o t
1

2
est le quantile dordre 1

2
de la loi normale centre rduite. On sait en eet que :
P(T I) = 1 .
Si la valeur
t =
x
1
x
2
_
s
2
1
n
1
+
s
2
2
n
2
obtenue sur les chantillons considrs appartient I, alors on accepte (H
0
), sinon on rejette
(H
0
).
3.2 Test de comparaison de deux variances
On conserve les mme notations que prcdemment et on teste (H
0
) contre (H
1
) o
_
(H
0
) :
1
=
2
(H
1
) :
1
=
2
,
au risque de premire espce .
On pose
T =
S
2
1
S
2
2
,
la variable alatoire de dcision du test. Sous lhypothse (H
0
), T suit une loi de Fischer-
Sndcor (n
1
1, n
2
1) degrs de libert. La zone dacceptation avec un risque de niveau
pour T est :
I =
_
F

2
(n
1
1, n
2
1) ; F
1

2
(n
1
1, n
2
1)

,
o F

2
(n
1
1, n
2
1) est le quantile dordre

2
de la loi de Fischer-Sndcor. On sait en eet
que :
P(T I) = 1 .
Remarque. On a :
F

2
(n
1
1, n
2
1) =
1
F
1

2
(n
2
1, n
1
1)
.
Si la valeur t = s
2
1
/s
2
2
obtenue sur les chantillons considrs appartient I, alors on accepte
(H
0
), sinon on rejette (H
0
).
CHAPITRE VI. TESTS DHYPOTHSE 23
3.3 Test de comparaison de deux proportions
On considre un caractre qualitatif et on note p
1
la proportion dindividus prsentant ce
caractre dans une premire population-mre, p
2
la proportion dans une seconde population-
mre. On souhaite dterminer sil sagit dune mme population en ce qui concerne ce caractre.
on teste (H
0
) contre (H
1
) o
_
(H
0
) : p
1
= p
2
(H
1
) : p
1
= p
2
,
au risque de premire espce .
On suppose que F
1
et F
2
suivent approximativement des lois normales. Soient f
1
et f
2
les
frquences observes sur les deux chantillons. On note
p =
n
1
f
1
+ n
2
f
2
n
1
+ n
2
,
et on pose
T =
F
1
F
2

p(1 p)
_
1
n
1
+
1
n
2
_
,
la variable alatoire de dcision du test. Sous lhypothse (H
0
), T suit approximativement une
loi normale centre rduite.
La zone dacceptation avec un risque de niveau pour T est nouveau :
I =
_
t
1

2
; t
1

,
o t
1

2
est le quantile dordre 1

2
de la loi normale centre rduite. On sait en eet que :
P(T I) = 1 .
Si la valeur
t =
f
1
f
2

p(1 p)
_
1
n
1
+
1
n
2
_
obtenue sur les chantillons considrs appartient I, alors on accepte (H
0
), sinon on rejette
(H
0
).
4 Test du Chi-deux dajustement
Soit X une variable alatoire dnie sur une population-mre . On dispose dun chantillon
de valeurs (x
1
, . . . , x
n
) et on souhaite tester si la distribution exprimentale observe correspond
une distribution thorique donne.
On dnit sur k vnements E
1
, . . . , E
k
formant un systme complet dvnements, cest-
-dire :
(i) =
k
_
i=1
E
i
,
(ii) i = j, E
i
E
j
= .
24 CHAPITRE VI. TESTS DHYPOTHSE
Dans le modle thorique, on note p
1
, . . . , p
k
les probabilits de ces vnements.
Sur lchantillon (x
1
, . . . , x
n
), on note n
1
, . . . , n
k
les eectifs observs de ces vnements. On
va les comparer aux eectifs thoriques obtenus pour un chantillon de taille n : ces eectifs
valent np
1
, . . . , np
k
.
On teste
(H
0
) : la distribution observe est conforme la distribution thorique choisie, contre
(H
1
) : la distribution observe nest pas conforme la distribution thorique choisie,
au risque de premire espce .
Dcision concernant le test :
On considre la variable alatoire de dcision :

2
c
=
k

i=1
(N
i
np
i
)
2
np
i
,
o N
i
est la variable alatoire qui compte leectif observ de lvnement E
i
sur un chantillon
donn : N
i
(x
1
, . . . , x
n
) = n
i
.
Sous lhypothse (H
0
), la variable alatoire
2
c
suit une loi du
2
k 1 r degrs de
libert o r est le nombre de paramtres estimer ventuellement pour connatre la distribution
thorique.
On impose la zone dacceptation dtre un intervalle ayant 0 pour borne infrieure, donc
on pose :
I =
_
0,
2
1
(k 1 r)

,
o
2
1
(k 1 r) est le quantile dordre 1 de la loi du
2
k 1 r degrs de libert.
DESSIN
On note
2
0
la valeur prise par
2
c
sur lchantillon :

2
0
=
k

i=1
(n
i
np
i
)
2
np
i
.
Si
2
0
I, alors lhypothse (H
0
) est accepte, sinon elle est rejete.
Remarque. On exige que les eectifs observs n
i
pour chaque vnement soient 5. Si ce
nest pas le cas, on fusionne deux ou plusieurs vnements.
CHAPITRE VI. TESTS DHYPOTHSE 25
5 Exercices
Exercice 1. Les spcications dun mdicament indiquent que chaque comprim doit contenir
en moyenne 1.5 g de substance active. 100 comprims sont choisis au hasard dans la production,
puis analyss. Les mesures x
i
en g des quantits de substance active tant trop nombreuses on
donne leur somme et la somme de leurs carrs :
100

i=1
x
i
= 155 et
100

i=1
x
2
i
= 248.
Peut-on dire que la production respecte lindication mentionne pour = 0.05 , = 0.08 ?
Exercice 2. Sur 4000 naissances, on relve 2065 garons. Cette observation est-elle conforme
lhypothse selon laquelle la probabilit davoir un garon la naissance est de 0.5 ? Utilisez
successivement = 0.05 puis = 0.01.
Exercice 3. Dans une entreprise, deux machines conditionnent le mme produit. Pour la
premire, le poids du produit aprs conditionnement suit une loi normale de paramtres
1
et

1
. Pour la seconde, il suit une loi normale de paramtres
2
et
2
. Sachant que
1
= 5g et

2
= 7g, on prlve un chantillon de taille n
1
= 10 de produits conditionns par la premire
machine et un chantillon de taille n
2
= 20 de produits conditionns par la seconde machine.
On obtient les valeurs suivantes : m
1
= 1003g et m
2
= 995g.
Tester lhypothse (H
0
) :
1
=
2
contre lhypothse (H
1
) :
1
=
2
, au risque 0.02.
Exercice 4. Dans deux IUT Mesures Physiques, les notes de statistiques des tudiants dal-
ternance 2
de
anne suivent des lois normales dont les cart-types sont
1
et
2
. Un chantillon
n
1
de 10 notes dtudiants de lIUT 1 a donn un cart-type de 5. Un chantillon n
2
de 25
notes dtudiants de lIUT 2 a donn un cart-type de 3.
Tester lhypothse (H
0
) :
1
=
2
contre lhypothse (H
1
) :
1
=
2
, au risque 0.05.
Exercice 5. Dans une population, soit p
1
la proportion de femmes possdant le bac et p
2
la
proportion dhommes possdant le bac. Le tableau suivant correspond la rpartition de 200
individus choisis au hasard dans la population :
Femmes Hommes
possdent le bac 32 26
ne possdent pas le bac 64 78
Tester lhypothse (H
0
) : p
1
= p
2
contre lhypothse (H
1
) : p
1
= p
2
, au risque 0.05.
Exercice 6. En 2003, la rpartition (en pourcentage) des PME dune rgion suivant six sec-
teurs industriels tait la suivante :
secteur A 33% secteur D 14%
secteur B 22% secteur E 10%
secteur C 17% autres 4%
En 2010, on considre un chantillon de 200 PME dans la mme rgion. On obtient la
rpartition suivante :
secteur A 70 secteur D 24
secteur B 52 secteur E 14
secteur C 30 autres 10
Peut-on considrer que dans cette rgion lenvironnement industriel na pas chang entre
2003 et aujourdhui (au risque 0.05) ?
26 CHAPITRE VI. TESTS DHYPOTHSE
Exercice 7. On donne la rpartition de 75 jeunes arbres suivant leur taille en cm :
classes ]85 ; 90] ]90 ; 95] ]95 ; 100] ]100 ; 105] ]105 ; 110] ]110 ; 115] ]115 ; 120]
eectifs 3 15 22 18 12 3 2
Peut-on admettre, au risque de premire espce = 0.05, lhypothse selon laquelle la taille
des arbres tudis suit une loi normale ?